Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Análisis independiente de modelos de IA y proveedores de alojamiento: elija el mejor modelo y proveedor de API para su caso de uso
Alibaba ha lanzado Qwen3 Next 80B: un modelo de razonamiento híbrido de ponderaciones abiertas que logra inteligencia de nivel DeepSeek V3.1 con solo 3B parámetros activos
Conclusiones clave:
💡 Arquitectura novedosa: Primer modelo en introducir los modelos de base 'Qwen3-Next' de @Alibaba_Qwen, con varias decisiones clave de arquitectura, como un mecanismo de atención híbrido de Gated DeltaNet y Gated Attention, y alta dispersión con una participación de parámetros activos del 3,8%, en comparación con el 9,4% de Qwen3 235B
🧠 Inteligencia: Qwen3 Next 80B (Razonamiento) obtiene una puntuación de 54 en el Índice de Inteligencia de Análisis Artificial, colocado junto con DeepSeek V3.1 (Razonamiento). La variante sin razonamiento obtiene una puntuación de 45, en línea con gpt-oss-20B y Llama Nemotron Super 49B v1.5 (Razonamiento)
💲 Modelo de precios: El precio por token en @alibaba_cloud es de 0,5 $/6 USD por 1 millón de tokens de entrada/salida para el razonamiento y de 0,5 $/2 USD para la variante sin razonamiento. Esto se compara con los precios más altos de Qwen3 235B 2507 de $ 0.7 / $ 8.4 con razonamiento y $ 0.7 / $ 2.8 sin razón, una reducción del ≥ 25% dependiendo de las cargas de trabajo
⚙️ Detalles del modelo: el modelo tiene una ventana de contexto nativa de 256k tokens y es de solo texto, sin entradas ni salidas multimodales. Con solo 80B parámetros en FP8, el modelo cabe en una sola GPU H200

96
¡Lanzamiento de nuestra encuesta sobre el estado de los medios generativos 2025 con el apoyo de @fal! Participa para recibir el informe completo de la encuesta y gana un par de Meta Ray-Bans 🕶️
Estamos realizando la encuesta para recopilar información sobre el estado de los medios generativos en 2025. Esto incluye perspectivas sobre cómo las organizaciones utilizan, eligen y acceden a los modelos de imagen, vídeo y música.
¿Por qué participar?
✅ Reciba una copia gratuita del informe de la encuesta extendida (solo una versión limitada estará disponible públicamente)
✅ La oportunidad de ganar un par de gafas Ray-Ban Meta AI 🕶️
✅ Contribuir a compartir ideas sobre las tendencias clave que dan forma a los medios generativos
¡Enlace en el hilo a continuación! ⬇️⬇️⬇️⬇️⬇️⬇️⬇️
157
DeepSeek lanza V3.1, unificando V3 y R1 en un modelo de razonamiento híbrido con un aumento incremental de la inteligencia
Aumento de la inteligencia incremental: Los resultados iniciales de la evaluación comparativa de DeepSeek V3.1 muestran un índice de inteligencia de análisis artificial de 60 en modo de razonamiento, frente a la puntuación de 59 de la R1. En el modo sin razonamiento, V3.1 logra una puntuación de 49, un aumento mayor con respecto a la puntuación anterior de V3 0324 de 44. Esto deja a la V3.1 (razonamiento) detrás de la última Qwen3 235B 2507 (razonamiento) de Alibaba: DeepSeek no ha recuperado el liderazgo.
Razonamiento híbrido: @deepseek_ai ha pasado a un modelo de razonamiento híbrido por primera vez, que admite modos de razonamiento y no razonamiento. El cambio de DeepSeek a un modelo de razonamiento híbrido unificado imita el enfoque adoptado por OpenAI, Anthropic y Google. Es interesante notar, sin embargo, que Alibaba abandonó recientemente su enfoque híbrido que favorecían para Qwen3 con sus versiones separadas de Qwen3 2507 razonamiento y modelos de instrucciones.
Llamada a funciones / uso de herramientas: mientras que DeepSeek afirma que se ha mejorado la llamada a funciones para el modelo, DeepSeek V3.1 no admite la llamada a funciones cuando está en modo de razonamiento. Es probable que esto limite sustancialmente su capacidad para admitir flujos de trabajo de agentes con requisitos de inteligencia, incluso en agentes de codificación.
Uso de tokens: DeepSeek V3.1 obtiene una puntuación incrementalmente más alta en el modo de razonamiento que DeepSeek R1 y usa un poco menos de tokens en las evaluaciones que usamos para el Índice de Inteligencia de Análisis Artificial. En el modo sin razonamiento, utiliza un poco más de tokens que V3 0324, pero aún varias veces menos que en su propio modo de razonamiento.
API: La API propia de DeepSeek ahora sirve el nuevo modelo DeepSeek V3.1 tanto en sus puntos finales de chat como de razonamiento, simplemente cambiando si el token de pensamiento final </think> se proporciona al modelo en la plantilla de chat para controlar si el modelo razonará.
Arquitectura: DeepSeek V3.1 es arquitectónicamente idéntico a los modelos V3 y R1 anteriores, con 671 mil millones de parámetros totales y 37 mil millones de parámetros activos.
Implicaciones: Aconsejamos precaución al hacer suposiciones sobre lo que implica este lanzamiento sobre el progreso de DeepSeek hacia un modelo futuro al que se hace referencia en los rumores como V4 o R2. Observamos que DeepSeek lanzó previamente el modelo final construido en su arquitectura V2 el 10 de diciembre de 2024, solo dos semanas antes del lanzamiento de V3.


441
Populares
Ranking
Favoritas