Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Claude Relations @AnthropicAI. Mielipiteet ovat omiani!
Opus 4.5: 7.5-8/10 oli hyödyllinen.
Luotan vihdoin tähän malliin kirjoittamaan puolestani, ja sillä on oikeasti hyvä harkinta ja maku siitä, mikä on tärkeää.
Koodauksessa tuntuu, että se voi toimia ikuisesti eikä jää kiinni samaan tunnelmakoodaukseen kuin aiemmat mallit.
Jotkut asiat eivät vieläkään ole täydellisiä: muisti, tietokoneen käyttö, dokumenttien luonti, ennakointi jne., mutta parannuksiin on selkeä näky (tässä tarvitaan myös joitakin tuotekäyttökokemusten innovaatioita).
Tässä vaiheessa tuntuu, että olemme vain muutaman mallisukupolven päässä lähestymästä 10/10-tasoa minulle.

Alex Albert16.1.2025
Claude 2: kirjoitti minulle uudelleen joitakin sähköposteja, siisti kielioppia dokumentaatiossa. 1,5/10 hyödyllistä.
3 Opus: ensimmäinen malli, jonka kanssa tunsin voivani puhua älykkäästi, auttoi pienessä koodauksessa ja skriptauksessa. 3/10 hyödyllistä.
3.5 Sonetti: aloin kokeilla alusta loppuun koodausprojekteja, ehkä elämänohjeita silloin tällöin. 4/10 hyödyllistä.
New 3.5 Sonnet: useimmiten parempi koodaamaan kuin minä, paljon elämänohjeita/neuvontaa, ensimmäinen malli, johon luotan terveys-/kuntoilusuosituksissa, käytän kuvaa ja multimodaalia paljon enemmän, käännyn sen puoleen ensimmäisenä useimmissa työtehtävissäni. 5,5/10 hyödyllistä. Ulkoisilla integraatioilla (MCP jne.) on todennäköisesti 6,5/10 hyödyllinen.
Tämä kehitys tapahtui noin vuodessa, mikä on hullua ajatella. 10/10 tässä mittakaavassa hyödyllinen olisi käytännössä äärimmäisen viisas ja asiantunteva elämänavustaja, jolla on kaikki taustatiedot sinusta ja tekemistäsi. Pääsemme sinne pian.
163,64K
Loistava arvostelu Opus 4.5:stä
>"TLDR: Se on Sonnet 3.5 vuodelta 2025. Kokeile. Tee se nyt"

Cooper29.11.2025
Claude Opus 4.5: koko arvostelu
Tämä on paras mallijulkaisu pitkään aikaan ohjelmoinnissa. On uskomatonta, kuinka hyvä se on. En ole nähnyt näin suurta parannusta alkuperäisen gpt-4-0314 julkaisun jälkeen
Suurin parannus on, että he ovat vihdoin miettineet, miten 'ajatella' oikein.
Se ei enää tee järkyttäviä logiikkavirheitä ajattelussaan.
Ongelmia kuten "Okei, teen testit nyt. <Testit epäonnistuivat> Mahtavaa! Kokeet läpäisevät." eivät ole enää olemassa.
Tämä yleistyy käytännössä KAIKKIIN logiikkaan koodin ajattelussa – se tekee virheitä erittäin harvoin, jos koskaan.
Seuraava iso virstanpylväs: Se ei enää kirjoita slop-koodia! Tämä on iso juttu. Codexin avulla saat sen kirjoittamaan toimivaa koodia. Mutta se kirjoittaa kamalaa koodia – turhia funktioita, huonoja abstraktioita jne. Tämä on kurjaa, koska se toimii lyhyellä aikavälillä, mutta pitkällä aikavälillä malli ajautuu nurkkaan, jossa se ei enää pysty työskentelemään itse kirjoittamansa koodin kanssa.
Opuksen kohdalla näin ei ole. Se ei ainoastaan kirjoita eleganttia koodia, vaan osaa myös refaktoroida slop-koodia ei-slop-koodiksi. Se ymmärtää koodipohjan syvällisesti ja pystyy keksimään tyylikkäitä ratkaisuja, jotka eivät ole pelkästään 'mekaanisia' refaktoraatioita.
Se on hyvin itsenäinen ja itsenäinen. Se itsessään ilmenee ongelmia, luo mahdollisimman vähän toistettavia esimerkkejä, yrittää jakaa virheen alkuperän ja korjata sen jäämättä jumiin kaninkoloihin. Vaikka virhe olisi jossain koodiin liittymättömässä osassa – koodissa, jota se ei edes itse kirjoittanut!!
Se myös TEKEE TÄSMÄLLEEN MITÄ SANOT, ILMAN ETTÄ OIKAISEE KULMIA! Tämä on iso juttu!! Codexin käyttö on pohjimmiltaan whack-a-mole-peli, jossa se ymmärtää, mitä haluat sen tekevän, mutta se on liian vaikeaa, joten se palkitsee tiensä huonoon ratkaisuun, jota et halua.
Opus oikeasti tarttuu ongelmaan ja ratkaisee sen kunnolla, vaikka se olisi vaikeaa.
Pitkä kontekstin ymmärrys on käytännössä täydellinen. Yhdistettynä Claude Coden oletuksena saatavilla olevaan tiivistysmekanismiin, voit käytännössä käydä äärettömän pitkän keskustelun, jossa se ymmärtää kaiken sisällään ilman heikkenemistä.
Suunnittelun, tutkimuksen ja uusien ideoiden keksimisen osalta. Se on parempi, mutta ei aivan asiantuntija-ihmisen tasolla. Se voi ehdottaa ratkaisuja, joita pidän hyvänä suunnitteluna, mutta se ei vielä osaa 'ajatella portaaleilla'. Silti, hyvä parannus aiempaan verrattuna, joka käytännössä oli olematon.
Kaikki edellä mainitut olen saanut selville testatessani sitä viime päivinä, jolloin tehtävänä on kirjoittaa tulkki kielelle, jota suunnittelimme lennossa. Se on hyvin kapea suunnittelu, samanlainen kuin Self ja Smalltalk, paitsi että rakennamme kieltä itse kielen sisälle. Tämä johtaa erittäin vaikeisiin tilanteisiin, joissa yrität määritellä, miten funktiot toimivat – kielen sisällä – vaikka sinulla ei vielä ole funktioita! Ja se tekee silti upeaa työtä. Joskus en edes täysin ymmärrä, mitä pyydän sitä tekemään, mutta Opus tekee sen, ja se tekee sen hyvin.
TALLIUM; DR: Se on Sonnet 3.5 vuodelta 2025. Kokeile. Tee se nyt
180,51K
Johtavat
Rankkaus
Suosikit
