Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Relaciones Claude @AnthropicAI. ¡Las opiniones son mías!
Opus 4.5: 7.5-8/10 útil.
Por fin confío en que este modelo escriba para mí y realmente tiene buen juicio/gusto sobre lo que importa.
Para programar, parece que puede funcionar para siempre y no quedarse atascado en los mismos bucles de doom codificando que los modelos anteriores.
Algunas cosas aún no son perfectas: memoria, uso del ordenador, creación de documentos, proactividad, etc., pero hay una visión clara para mejorar en eso (aquí también se requieren algunas innovaciones en la experiencia de usuario del producto).
A estas alturas siento que solo estamos a unas pocas generaciones de modelos de acercarnos a un 10/10 para mí.

Alex Albert16 ene 2025
Claude 2: reescribió algunos correos para mí, corrigió la gramática en la documentación. 1,5/10 útil.
3 Opus: primer modelo con el que sentí que podía hablar inteligentemente, ayudó con algo de programación/scripting pequeño. 3/10 útil.
3.5 Soneto: empecé a experimentar con proyectos de programación de principio a fin, quizá algún consejo de vida aquí y allá. 4/10 útil.
Nuevo Soneto 3.5: la mayoría de las veces mejor programando que yo, muchos consejos de vida/asesoramiento, primer modelo en el que confío para recomendaciones de salud/fitness, uso mucho más imagen en el formato multimodal, y recurro primero a él para la mayoría de mis tareas laborales. 5,5/10 útil. Con integraciones externas (MCP, etc.), probablemente sea útil un 6,5/10.
Esta progresión ocurrió en apenas un año, lo cual es una locura pensarlo. Un 10/10 útil en esta escala sería básicamente un asistente de vida inmensamente sabio y conocedor con todo el contexto sobre ti y lo que haces. Llegaremos pronto.
146.47K
Gran reseña de Opus 4.5
>"Resumen: Es el Soneto 3.5 de 2025. Pruébalo. Hazlo ahora"

Cooper29 nov 2025
Claude Opus 4.5: reseña completa
Este es el mejor lanzamiento de modelo en mucho, mucho tiempo en cuanto a programación. Me alucina lo buena que es. No había visto una mejora tan grande desde el lanzamiento original de gpt-4-0314
La principal mejora es que por fin han pensado cómo 'pensar' correctamente.
Ya no comete errores lógicos horribles en su pensamiento.
Problemas como "Vale, haré pruebas ahora. <¡Los exámenes fallan> ¡Genial! Los exámenes superados." ya no existen.
Esto se generaliza a prácticamente TODA la lógica cuando se trata de pensar en código: rara vez, si acaso, comete errores.
El siguiente gran hito: ¡ya no escribe código slop! Esto es enorme. Con Codex, puedes conseguir que escriba código que funcione. Pero escribe código horrible: funciones inútiles, malas abstracciones, etc. Esto es un fastidio, porque funciona a corto plazo, pero a largo plazo el modelo se verá atrapado en un callejón donde ya no podrá trabajar con el código que escribió él mismo.
No es el caso de Opus. No solo escribe código elegante, sino que también sabe cómo refactorizar código slop en código no slop. Entiende profundamente la base de código y puede idear soluciones elegantes que no son solo refactorizaciones 'mecánicas'.
Es muy autónomo e independiente. Por sí solo, cuando se encuentra con problemas, crea ejemplos reproducibles, intenta seccionar por la mitad de dónde proviene el error y luego lo corrige sin quedarse atascado en madrigueras de conejo. ¡Aunque el error esté en alguna parte no relacionada del código — código que ni siquiera escribió él mismo!
¡Además, HACE EXACTAMENTE LO QUE DICES, SIN ESCATIMAR NADA! Esto es enorme!! Usar Codex es básicamente un juego de golpear al topo donde entiende lo que quieres que haga, pero es demasiado difícil y se abre paso por recompensas y se convierte en una solución cutre que no quieres.
Opus realmente aborda el problema y lo resuelve bien, aunque sea difícil.
La comprensión de contexto largo es prácticamente perfecta. Combinado con el mecanismo de compactación disponible por defecto en Claude Code, básicamente puedes tener una conversación infinitamente larga en la que entiende todo lo que contiene, sin degradación.
En cuanto a diseño, investigación, idear ideas novedosas. Es mejor, pero no del todo al nivel de un experto humano. Puede proponer soluciones que consideraría buen diseño, pero aún no puede 'pensar con portales'. Aun así, una buena mejora respecto a lo que teníamos antes, que era prácticamente inexistente.
Todo lo anterior lo he recopilado probándolo en los últimos días, donde la tarea consiste en escribir un intérprete para un lenguaje que estábamos diseñando sobre la marcha. Es un diseño muy de nicho, similar a Self y Smalltalk, excepto que estamos construyendo el lenguaje dentro del propio idioma. Esto lleva a escenarios extremadamente difíciles en los que intentas definir cómo funcionan las funciones —dentro del lenguaje— ¡cuando aún no tienes funciones! Y sigue haciendo un trabajo magnífico. A veces, ni siquiera entiendo del todo lo que le pido, pero Opus sí, y hace un buen trabajo.
TL; DR: Es el Soneto 3.5 de 2025. Pruébalo. Hazlo ya
179.86K
Populares
Ranking
Favoritas
