Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Claude Opus 4.5: koko arvostelu
Tämä on paras mallijulkaisu pitkään aikaan ohjelmoinnissa. On uskomatonta, kuinka hyvä se on. En ole nähnyt näin suurta parannusta alkuperäisen gpt-4-0314 julkaisun jälkeen
Suurin parannus on, että he ovat vihdoin miettineet, miten 'ajatella' oikein.
Se ei enää tee järkyttäviä logiikkavirheitä ajattelussaan.
Ongelmia kuten "Okei, teen testit nyt. <Testit epäonnistuivat> Mahtavaa! Kokeet läpäisevät." eivät ole enää olemassa.
Tämä yleistyy käytännössä KAIKKIIN logiikkaan koodin ajattelussa – se tekee virheitä erittäin harvoin, jos koskaan.
Seuraava iso virstanpylväs: Se ei enää kirjoita slop-koodia! Tämä on iso juttu. Codexin avulla saat sen kirjoittamaan toimivaa koodia. Mutta se kirjoittaa kamalaa koodia – turhia funktioita, huonoja abstraktioita jne. Tämä on kurjaa, koska se toimii lyhyellä aikavälillä, mutta pitkällä aikavälillä malli ajautuu nurkkaan, jossa se ei enää pysty työskentelemään itse kirjoittamansa koodin kanssa.
Opuksen kohdalla näin ei ole. Se ei ainoastaan kirjoita eleganttia koodia, vaan osaa myös refaktoroida slop-koodia ei-slop-koodiksi. Se ymmärtää koodipohjan syvällisesti ja pystyy keksimään tyylikkäitä ratkaisuja, jotka eivät ole pelkästään 'mekaanisia' refaktoraatioita.
Se on hyvin itsenäinen ja itsenäinen. Se itsessään ilmenee ongelmia, luo mahdollisimman vähän toistettavia esimerkkejä, yrittää jakaa virheen alkuperän ja korjata sen jäämättä jumiin kaninkoloihin. Vaikka virhe olisi jossain koodiin liittymättömässä osassa – koodissa, jota se ei edes itse kirjoittanut!!
Se myös TEKEE TÄSMÄLLEEN MITÄ SANOT, ILMAN ETTÄ OIKAISEE KULMIA! Tämä on iso juttu!! Codexin käyttö on pohjimmiltaan whack-a-mole-peli, jossa se ymmärtää, mitä haluat sen tekevän, mutta se on liian vaikeaa, joten se palkitsee tiensä huonoon ratkaisuun, jota et halua.
Opus oikeasti tarttuu ongelmaan ja ratkaisee sen kunnolla, vaikka se olisi vaikeaa.
Pitkä kontekstin ymmärrys on käytännössä täydellinen. Yhdistettynä Claude Coden oletuksena saatavilla olevaan tiivistysmekanismiin, voit käytännössä käydä äärettömän pitkän keskustelun, jossa se ymmärtää kaiken sisällään ilman heikkenemistä.
Suunnittelun, tutkimuksen ja uusien ideoiden keksimisen osalta. Se on parempi, mutta ei aivan asiantuntija-ihmisen tasolla. Se voi ehdottaa ratkaisuja, joita pidän hyvänä suunnitteluna, mutta se ei vielä osaa 'ajatella portaaleilla'. Silti, hyvä parannus aiempaan verrattuna, joka käytännössä oli olematon.
Kaikki edellä mainitut olen saanut selville testatessani sitä viime päivinä, jolloin tehtävänä on kirjoittaa tulkki kielelle, jota suunnittelimme lennossa. Se on hyvin kapea suunnittelu, samanlainen kuin Self ja Smalltalk, paitsi että rakennamme kieltä itse kielen sisälle. Tämä johtaa erittäin vaikeisiin tilanteisiin, joissa yrität määritellä, miten funktiot toimivat – kielen sisällä – vaikka sinulla ei vielä ole funktioita! Ja se tekee silti upeaa työtä. Joskus en edes täysin ymmärrä, mitä pyydän sitä tekemään, mutta Opus tekee sen, ja se tekee sen hyvin.
TALLIUM; DR: Se on Sonnet 3.5 vuodelta 2025. Kokeile. Tee se nyt
Johtavat
Rankkaus
Suosikit

