DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Alex Albert

Claude Relationer @AnthropicAI. Åsikterna är mina egna!

Fantastisk recension av Opus 4.5 >"TLDR: Det är Sonett 3.5 från 2025. Prova. Gör det nu"

Claude Opus 4.5: fullständig recension Detta är den bästa modellutgåvan på väldigt länge när det gäller programmering. Det förbluffar mig hur bra den är. Jag har inte sett en så stor förbättring sedan den ursprungliga versionen av gpt-4-0314 Den största förbättringen är att de äntligen har kommit på hur man 'tänker' rätt. Den gör inte längre grymma logiska fel i sitt tänkande. Problem som "Okej, jag kör tester nu. <Tester misslyckas> Toppen! Testerna klaras." är inte längre en grej. Detta generaliserar till i princip ALL logik när det gäller att tänka kring kod – det gör extremt sällan, om någonsin, misstag. Nästa stora milstolpe: Den skriver inte längre slop-kod! Det här är enormt. Med Codex kan du få den att skriva kod som fungerar. Men den skriver fruktansvärd kod – värdelösa funktioner, dåliga abstraktioner, osv. Det är tråkigt, eftersom det fungerar på kort sikt, men på lång sikt kommer modellen att hamna i ett hörn där den inte längre kan fungera med koden den själv skrivit. Så är det inte med Opus. Den skriver inte bara elegant kod, utan vet också hur man refaktorerar slop-kod till icke-slop-kod. Den förstår kodbasen på djupet och kan hitta eleganta lösningar som inte bara är 'mekaniska' refaktoreringar. Det är väldigt autonomt och självständigt. Den kommer själv, när den stöter på problem, att skapa minimala reproducerbara exempel, försöka dela var felet kommer ifrån och sedan åtgärda det utan att fastna i kaninhål. Även om felet finns i någon orelaterad del av koden – kod som den inte ens skrev själv!! Den GÖR OCKSÅ PRECIS SOM DU SÄGER, UTAN ATT SNÅLA PÅ DET! Det här är enormt!! Att använda Codex är i princip ett whack-a-mole-spel där den förstår vad du vill att den ska göra, men det är för svårt så den belönar sig in i en dålig lösning som du inte vill ha. Opus tar faktiskt itu med problemet och löser det på rätt sätt även om det är svårt. Den långa kontexten är i princip perfekt. I kombination med kompaktionsmekanismen som finns i Claude Code som standard kan du i princip ha en oändligt lång konversation där den förstår allt inuti sig, utan någon försämring. När det gäller design, research, att komma på nya idéer. Det är bättre, men inte riktigt på expert-mänsklig nivå. Den kan föreslå lösningar som jag skulle betrakta som bra design, men den kan ännu inte riktigt 'tänka med portaler'. Ändå en bra förbättring jämfört med vad vi hade tidigare, som i princip inte existerade. Allt ovan har jag samlat in från testandet de senaste dagarna där uppgiften är att skriva en tolk för ett språk som vi designade i realtid. Det är en mycket nischad design, liknande Self och Smalltalk, förutom att vi bygger språket inuti språket självt. Detta leder till extremt svåra scenarier där du försöker definiera hur funktioner fungerar – inne i språket – när du ännu inte har funktioner! Och den gör fortfarande ett magnifikt jobb. Ibland förstår jag inte ens helt vad jag ber den göra, men Opus gör det, och den gör ett bra jobb. TL; DR: Det är Sonett 3.5 från 2025. Prova. Gör det nu

Topp

Rankning

Favoriter