DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Alex Albert

Claude Relations @AnthropicAI. Meine Meinungen sind meine eigenen!

Tolle Bewertung von Opus 4.5 >"TLDR: Es ist das Sonnet 3.5 von 2025. Probier es aus. Mach es jetzt"

Claude Opus 4.5: vollständige Rezension Dies ist das beste Modell-Release seit langem, wenn es um Programmierung geht. Es haut mich um, wie gut es ist. Ich habe seit der ursprünglichen Veröffentlichung von gpt-4-0314 nicht so eine große Verbesserung gesehen. Die Hauptverbesserung ist, dass sie ihm endlich beigebracht haben, wie man richtig "denkt". Es macht keine grausamen logischen Fehler mehr in seinem Denken. Probleme wie "Okay, ich werde jetzt Tests durchführen. <Tests schlagen fehl> Großartig! Die Tests bestehen." sind nicht mehr der Fall. Dies verallgemeinert sich auf praktisch ALLE Logik, wenn es darum geht, über Code nachzudenken - es macht extrem selten, wenn überhaupt, Fehler. Der nächste große Meilenstein: Es schreibt keine schlampigen Codes mehr! Das ist riesig. Mit Codex kann man es dazu bringen, funktionierenden Code zu schreiben. Aber es schreibt schrecklichen Code - nutzlose Funktionen, schlechte Abstraktionen usw. Das ist frustrierend, denn es funktioniert kurzfristig, aber langfristig wird das Modell sich in eine Ecke drängen, in der es nicht mehr mit dem Code arbeiten kann, den es selbst geschrieben hat. Das ist bei Opus nicht der Fall. Es schreibt nicht nur eleganten Code, sondern weiß auch, wie man schlampigen Code in nicht-schlampigen Code umwandelt. Es versteht das Code-Base tiefgehend und kann elegante Lösungen finden, die nicht nur "mechanische" Refaktorisierungen sind. Es ist sehr autonom und unabhängig. Es wird von sich aus, wenn es auf Probleme stößt, minimale reproduzierbare Beispiele erstellen, versuchen, herauszufinden, wo der Fehler herkommt, und ihn dann beheben, ohne sich in Kaninchenlöchern zu verlieren. Selbst wenn der Fehler in einem nicht verwandten Teil des Codes liegt -- Code, den es nicht einmal selbst geschrieben hat!! Es macht auch GENAU DAS, WAS DU SAGST, OHNE ABZUCUTTEN! Das ist riesig!!! Die Verwendung von Codex ist im Grunde ein Spiel von Whack-a-Mole, bei dem es versteht, was du willst, aber es ist zu schwierig, also hackt es sich mit Belohnungen in eine beschissene Lösung, die du nicht willst. Opus geht tatsächlich das Problem an und löst es richtig, selbst wenn es schwierig ist. Das Verständnis für lange Kontexte ist nahezu perfekt. In Kombination mit dem Kompaktierungsmechanismus, der standardmäßig in Claude Code verfügbar ist, kannst du im Grunde ein unendlich langes Gespräch führen, in dem es alles versteht, ohne dass es zu einer Verschlechterung kommt. In Bezug auf Design, Forschung, das Entwickeln neuer Ideen. Es ist besser, aber noch nicht ganz auf Expertenniveau. Es kann Lösungen vorschlagen, die ich als gutes Design betrachten würde, aber es kann noch nicht ganz "mit Portalen denken". Dennoch ist es eine gute Verbesserung gegenüber dem, was wir vorher hatten, das war im Grunde nicht existent. All das habe ich aus Tests in den letzten Tagen gesammelt, bei denen die Aufgabe darin bestand, einen Interpreter für eine Sprache zu schreiben, die wir spontan entworfen haben. Es ist ein sehr spezielles Design, ähnlich wie Self und Smalltalk, außer dass wir die Sprache innerhalb der Sprache selbst aufbauen. Das führt zu extrem schwierigen Szenarien, in denen du versuchst zu definieren, wie Funktionen funktionieren -- innerhalb der Sprache -- wenn du noch keine Funktionen hast! Und es macht immer noch einen großartigen Job. Manchmal verstehe ich nicht einmal vollständig, was ich es fragen möchte, aber Opus versteht es und macht einen guten Job. TL;DR: Es ist das Sonnet 3.5 von 2025. Probiere es aus. Mach es jetzt.

Top

Ranking

Favoriten