Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Claude Relations @AnthropicAI. Meine Meinungen sind meine eigenen!
Opus 4.5: 7.5-8/10 hilfreich.
Ich vertraue diesem Modell endlich, um für mich zu schreiben, und es hat tatsächlich ein gutes Urteilsvermögen/Geschmack dafür, was wichtig ist.
Beim Programmieren fühlt es sich an, als könnte es einfach ewig arbeiten und nicht in den gleichen Coding-Doom-Loops stecken bleiben wie frühere Modelle.
Einige Dinge sind immer noch nicht perfekt: Gedächtnis, Computerbenutzung, Dokumentenerstellung, Proaktivität usw., aber es gibt eine klare Sicht auf Verbesserungen in diesen Bereichen (einige Produkt-UX-Innovationen sind hier ebenfalls erforderlich).
An diesem Punkt fühlt es sich an, als wären wir nur noch ein paar Modellgenerationen davon entfernt, für mich nahe an einer 10/10 zu sein.

Alex Albert16. Jan. 2025
Claude 2: hat einige E-Mails für mich umgeschrieben und die Grammatik in Dokumenten verbessert. 1,5/10 hilfreich.
3 Opus: das erste Modell, mit dem ich intelligent sprechen konnte, hat mir bei einigen kleinen Programmier-/Scripting-Aufgaben geholfen. 3/10 hilfreich.
3.5 Sonnet: begann mit End-to-End-Coding-Projekten zu experimentieren, vielleicht hier und da etwas Lebensberatung. 4/10 hilfreich.
Neues 3.5 Sonnet: ist meistens besser im Programmieren als ich, gibt viel Lebensberatung/-beratung, das erste Modell, dem ich bei Gesundheits-/Fitnessempfehlungen vertraue, benutze Bilder in/multimodal viel mehr, ich wende mich zuerst an es für die meisten meiner Arbeitsaufgaben. 5,5/10 hilfreich. Mit externen Integrationen (MCP usw.) ist es wahrscheinlich 6,5/10 hilfreich.
Diese Entwicklung geschah in nur etwa einem Jahr, was verrückt zu denken ist. 10/10 hilfreich auf dieser Skala wäre im Grunde ein immens weiser und wissensreicher Lebensassistent mit all dem Kontext über dich und die Dinge, die du tust. Wir werden bald dort sein.
146,48K
Tolle Bewertung von Opus 4.5
>"TLDR: Es ist das Sonnet 3.5 von 2025. Probier es aus. Mach es jetzt"

Cooper29. Nov. 2025
Claude Opus 4.5: vollständige Rezension
Dies ist das beste Modell-Release seit langem, wenn es um Programmierung geht. Es haut mich um, wie gut es ist. Ich habe seit der ursprünglichen Veröffentlichung von gpt-4-0314 nicht so eine große Verbesserung gesehen.
Die Hauptverbesserung ist, dass sie ihm endlich beigebracht haben, wie man richtig "denkt".
Es macht keine grausamen logischen Fehler mehr in seinem Denken.
Probleme wie "Okay, ich werde jetzt Tests durchführen. <Tests schlagen fehl> Großartig! Die Tests bestehen." sind nicht mehr der Fall.
Dies verallgemeinert sich auf praktisch ALLE Logik, wenn es darum geht, über Code nachzudenken - es macht extrem selten, wenn überhaupt, Fehler.
Der nächste große Meilenstein: Es schreibt keine schlampigen Codes mehr! Das ist riesig. Mit Codex kann man es dazu bringen, funktionierenden Code zu schreiben. Aber es schreibt schrecklichen Code - nutzlose Funktionen, schlechte Abstraktionen usw. Das ist frustrierend, denn es funktioniert kurzfristig, aber langfristig wird das Modell sich in eine Ecke drängen, in der es nicht mehr mit dem Code arbeiten kann, den es selbst geschrieben hat.
Das ist bei Opus nicht der Fall. Es schreibt nicht nur eleganten Code, sondern weiß auch, wie man schlampigen Code in nicht-schlampigen Code umwandelt. Es versteht das Code-Base tiefgehend und kann elegante Lösungen finden, die nicht nur "mechanische" Refaktorisierungen sind.
Es ist sehr autonom und unabhängig. Es wird von sich aus, wenn es auf Probleme stößt, minimale reproduzierbare Beispiele erstellen, versuchen, herauszufinden, wo der Fehler herkommt, und ihn dann beheben, ohne sich in Kaninchenlöchern zu verlieren. Selbst wenn der Fehler in einem nicht verwandten Teil des Codes liegt -- Code, den es nicht einmal selbst geschrieben hat!!
Es macht auch GENAU DAS, WAS DU SAGST, OHNE ABZUCUTTEN! Das ist riesig!!! Die Verwendung von Codex ist im Grunde ein Spiel von Whack-a-Mole, bei dem es versteht, was du willst, aber es ist zu schwierig, also hackt es sich mit Belohnungen in eine beschissene Lösung, die du nicht willst.
Opus geht tatsächlich das Problem an und löst es richtig, selbst wenn es schwierig ist.
Das Verständnis für lange Kontexte ist nahezu perfekt. In Kombination mit dem Kompaktierungsmechanismus, der standardmäßig in Claude Code verfügbar ist, kannst du im Grunde ein unendlich langes Gespräch führen, in dem es alles versteht, ohne dass es zu einer Verschlechterung kommt.
In Bezug auf Design, Forschung, das Entwickeln neuer Ideen. Es ist besser, aber noch nicht ganz auf Expertenniveau. Es kann Lösungen vorschlagen, die ich als gutes Design betrachten würde, aber es kann noch nicht ganz "mit Portalen denken". Dennoch ist es eine gute Verbesserung gegenüber dem, was wir vorher hatten, das war im Grunde nicht existent.
All das habe ich aus Tests in den letzten Tagen gesammelt, bei denen die Aufgabe darin bestand, einen Interpreter für eine Sprache zu schreiben, die wir spontan entworfen haben. Es ist ein sehr spezielles Design, ähnlich wie Self und Smalltalk, außer dass wir die Sprache innerhalb der Sprache selbst aufbauen. Das führt zu extrem schwierigen Szenarien, in denen du versuchst zu definieren, wie Funktionen funktionieren -- innerhalb der Sprache -- wenn du noch keine Funktionen hast! Und es macht immer noch einen großartigen Job. Manchmal verstehe ich nicht einmal vollständig, was ich es fragen möchte, aber Opus versteht es und macht einen guten Job.
TL;DR: Es ist das Sonnet 3.5 von 2025. Probiere es aus. Mach es jetzt.
179,86K
Top
Ranking
Favoriten
