Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Claude Relations @AnthropicAI. Les opinions sont les miennes !
Opus 4.5 : 7.5-8/10 utile.
Je fais enfin confiance à ce modèle pour écrire pour moi et il a en fait un bon jugement/goût quant à ce qui est important.
Pour le codage, on a l'impression qu'il peut simplement fonctionner indéfiniment sans se retrouver coincé dans les mêmes boucles de codage désespérées que les modèles précédents.
Certaines choses ne sont toujours pas parfaites : mémoire, utilisation de l'ordinateur, création de documents, proactivité, etc., mais il y a une ligne claire vers des améliorations sur ces points (certaines innovations en matière d'UX produit sont également nécessaires ici).
À ce stade, on a l'impression que nous ne sommes qu'à quelques générations de modèles d'atteindre un 10/10 pour moi.

Alex Albert16 janv. 2025
Claude 2 : a réécrit quelques e-mails pour moi, a corrigé la grammaire dans des documents. 1,5/10 utile.
3 Opus : premier modèle avec lequel j'ai senti que je pouvais parler intelligemment, a aidé avec quelques petits codages/scripts. 3/10 utile.
3,5 Sonnet : a commencé à expérimenter avec des projets de codage de bout en bout, peut-être quelques conseils de vie ici et là. 4/10 utile.
Nouveau 3,5 Sonnet : la plupart du temps meilleur en codage que moi, beaucoup de conseils/conseil de vie, premier modèle en qui j'ai confiance pour des recommandations santé/fitness, utilise l'image en/multimodal beaucoup plus, je me tourne vers lui en premier pour la plupart de mes tâches professionnelles. 5,5/10 utile. Avec des intégrations externes (MCP, etc.), c'est probablement 6,5/10 utile.
Cette progression s'est produite en à peine un an, ce qui est fou à penser. 10/10 utile sur cette échelle serait essentiellement un assistant de vie immensément sage et connaissant avec tout le contexte sur vous et les choses que vous faites. Nous y arriverons bientôt.
163,61K
Excellente critique d'Opus 4.5
>"TLDR : C'est le Sonnet 3.5 de 2025. Essayez-le. Faites-le maintenant"

Cooper29 nov. 2025
Claude Opus 4.5 : revue complète
C'est la meilleure version de modèle depuis très longtemps en ce qui concerne la programmation. Ça me sidère à quel point c'est bon. Je n'ai pas vu une amélioration aussi grande depuis la sortie originale de gpt-4-0314.
La principale amélioration est qu'ils ont enfin appris à 'penser' correctement.
Il ne fait plus d'erreurs logiques horribles dans sa réflexion.
Des problèmes comme "D'accord, je vais exécuter des tests maintenant. <Les tests échouent> Super ! Les tests passent." ne sont plus d'actualité.
Cela se généralise à pratiquement TOUTE la logique lorsqu'il s'agit de réfléchir au code - il fait extrêmement rarement, voire jamais, d'erreurs.
Le prochain grand jalon : il n'écrit plus de code bâclé ! C'est énorme. Avec Codex, vous pouvez lui faire écrire du code qui fonctionne. Mais il écrit un code horrible - des fonctions inutiles, de mauvaises abstractions, etc. C'est frustrant, car cela fonctionne à court terme, mais à long terme, le modèle se retrouvera dans une impasse où il ne pourra plus travailler avec le code qu'il a lui-même écrit.
Ce n'est pas le cas avec Opus. Non seulement il écrit un code élégant, mais il sait aussi comment refactoriser le code bâclé en code non bâclé. Il comprend profondément la base de code et peut trouver des solutions élégantes qui ne sont pas juste des refactorisations 'mécaniques'.
Il est très autonome et indépendant. Il va, de lui-même, lorsqu'il rencontre des problèmes, créer des exemples minimaux reproductibles, essayer de déterminer d'où vient l'erreur, puis la corriger sans se perdre dans des détails inutiles. Même si l'erreur se trouve dans une partie non liée du code -- un code qu'il n'a même pas écrit lui-même !!
Il FAIT ÉGALEMENT EXACTEMENT CE QUE VOUS DITES, SANS COUPER LES BORDS ! C'est énorme !!! Utiliser Codex est essentiellement un jeu de whack-a-mole où il comprend ce que vous voulez qu'il fasse, mais c'est trop difficile, donc il hacke son chemin vers une solution médiocre que vous ne voulez pas.
Opus s'attaque réellement au problème et le résout correctement même si c'est difficile.
La compréhension du long contexte est pratiquement parfaite. Associée au mécanisme de compression disponible dans Claude Code par défaut, vous pouvez avoir une conversation infiniment longue où il comprend tout ce qui s'y trouve, sans dégradation.
En termes de design, de recherche, de propositions d'idées novatrices. C'est mieux, mais pas encore au niveau d'un expert humain. Il peut proposer des solutions que je considérerais comme un bon design, mais il ne peut pas encore 'penser avec des portails'. Néanmoins, c'est une bonne amélioration par rapport à ce que nous avions auparavant, qui était pratiquement inexistant.
Tout ce qui précède, je l'ai recueilli en le testant au cours des derniers jours où la tâche était d'écrire un interpréteur pour un langage que nous étions en train de concevoir à la volée. C'est un design très niche, similaire à Self et Smalltalk, sauf que nous construisons le langage à l'intérieur du langage lui-même. Cela mène à des scénarios extrêmement difficiles où vous essayez de définir comment fonctionnent les fonctions -- à l'intérieur du langage -- quand vous n'avez pas encore de fonctions ! Et il fait toujours un travail magnifique. Parfois, je ne comprends même pas entièrement ce que je lui demande de faire, mais Opus comprend, et il fait un bon travail.
TL;DR : C'est le Sonnet 3.5 de 2025. Essayez-le. Faites-le maintenant.
179,86K
Meilleurs
Classement
Favoris
