DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Alex Albert

Claude Relations @AnthropicAI. Les opinions sont les miennes !

Excellente critique d'Opus 4.5 >"TLDR : C'est le Sonnet 3.5 de 2025. Essayez-le. Faites-le maintenant"

Claude Opus 4.5 : revue complète C'est la meilleure version de modèle depuis très longtemps en ce qui concerne la programmation. Ça me sidère à quel point c'est bon. Je n'ai pas vu une amélioration aussi grande depuis la sortie originale de gpt-4-0314. La principale amélioration est qu'ils ont enfin appris à 'penser' correctement. Il ne fait plus d'erreurs logiques horribles dans sa réflexion. Des problèmes comme "D'accord, je vais exécuter des tests maintenant. <Les tests échouent> Super ! Les tests passent." ne sont plus d'actualité. Cela se généralise à pratiquement TOUTE la logique lorsqu'il s'agit de réfléchir au code - il fait extrêmement rarement, voire jamais, d'erreurs. Le prochain grand jalon : il n'écrit plus de code bâclé ! C'est énorme. Avec Codex, vous pouvez lui faire écrire du code qui fonctionne. Mais il écrit un code horrible - des fonctions inutiles, de mauvaises abstractions, etc. C'est frustrant, car cela fonctionne à court terme, mais à long terme, le modèle se retrouvera dans une impasse où il ne pourra plus travailler avec le code qu'il a lui-même écrit. Ce n'est pas le cas avec Opus. Non seulement il écrit un code élégant, mais il sait aussi comment refactoriser le code bâclé en code non bâclé. Il comprend profondément la base de code et peut trouver des solutions élégantes qui ne sont pas juste des refactorisations 'mécaniques'. Il est très autonome et indépendant. Il va, de lui-même, lorsqu'il rencontre des problèmes, créer des exemples minimaux reproductibles, essayer de déterminer d'où vient l'erreur, puis la corriger sans se perdre dans des détails inutiles. Même si l'erreur se trouve dans une partie non liée du code -- un code qu'il n'a même pas écrit lui-même !! Il FAIT ÉGALEMENT EXACTEMENT CE QUE VOUS DITES, SANS COUPER LES BORDS ! C'est énorme !!! Utiliser Codex est essentiellement un jeu de whack-a-mole où il comprend ce que vous voulez qu'il fasse, mais c'est trop difficile, donc il hacke son chemin vers une solution médiocre que vous ne voulez pas. Opus s'attaque réellement au problème et le résout correctement même si c'est difficile. La compréhension du long contexte est pratiquement parfaite. Associée au mécanisme de compression disponible dans Claude Code par défaut, vous pouvez avoir une conversation infiniment longue où il comprend tout ce qui s'y trouve, sans dégradation. En termes de design, de recherche, de propositions d'idées novatrices. C'est mieux, mais pas encore au niveau d'un expert humain. Il peut proposer des solutions que je considérerais comme un bon design, mais il ne peut pas encore 'penser avec des portails'. Néanmoins, c'est une bonne amélioration par rapport à ce que nous avions auparavant, qui était pratiquement inexistant. Tout ce qui précède, je l'ai recueilli en le testant au cours des derniers jours où la tâche était d'écrire un interpréteur pour un langage que nous étions en train de concevoir à la volée. C'est un design très niche, similaire à Self et Smalltalk, sauf que nous construisons le langage à l'intérieur du langage lui-même. Cela mène à des scénarios extrêmement difficiles où vous essayez de définir comment fonctionnent les fonctions -- à l'intérieur du langage -- quand vous n'avez pas encore de fonctions ! Et il fait toujours un travail magnifique. Parfois, je ne comprends même pas entièrement ce que je lui demande de faire, mais Opus comprend, et il fait un bon travail. TL;DR : C'est le Sonnet 3.5 de 2025. Essayez-le. Faites-le maintenant.

Meilleurs

Classement

Favoris