Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Alibaba ha lanzado Qwen3 Next 80B: un modelo de razonamiento híbrido de ponderaciones abiertas que logra inteligencia de nivel DeepSeek V3.1 con solo 3B parámetros activos Conclusiones clave: 💡 Arquitectura novedosa: Primer modelo en introducir los modelos de base 'Qwen3-Next' de @Alibaba_Qwen, con varias decisiones clave de arquitectura, como un mecanismo de atención híbrido de Gated DeltaNet y Gated Attention, y alta dispersión con una participación de parámetros activos del 3,8%, en comparación con el 9,4% de Qwen3 235B 🧠 Inteligencia: Qwen3 Next 80B (Razonamiento) obtiene una puntuación de 54 en el Índice de Inteligencia de Análisis Artificial, colocado junto con DeepSeek V3.1 (Razonamiento). La variante sin razonamiento obtiene una puntuación de 45, en línea con gpt-oss-20B y Llama Nemotron Super 49B v1.5 (Razonamiento) 💲 Modelo de precios: El precio por token en @alibaba_cloud es de 0,5 $/6 USD por 1 millón de tokens de entrada/salida para el razonamiento y de 0,5 $/2 USD para la variante sin razonamiento. Esto se compara con los precios más altos de Qwen3 235B 2507 de $ 0.7 / $ 8.4 con razonamiento y $ 0.7 / $ 2.8 sin razón, una reducción del ≥ 25% dependiendo de las cargas de trabajo ⚙️ Detalles del modelo: el modelo tiene una ventana de contexto nativa de 256k tokens y es de solo texto, sin entradas ni salidas multimodales. Con solo 80B parámetros en FP8, el modelo cabe en una sola GPU H200

Populares

Ranking

Favoritas