Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Cooper
Claude Opus 4.5: recensione completa
Questo è il miglior rilascio di un modello da molto tempo a questa parte per quanto riguarda la programmazione. Mi sorprende quanto sia buono. Non ho visto un miglioramento così grande dalla versione originale di gpt-4-0314.
Il principale miglioramento è che finalmente hanno insegnato al modello a 'pensare' correttamente.
Non commette più errori logici terribili nel suo ragionamento.
Problemi come "Ok, ora eseguirò i test. Ottimo! I test passano." non sono più un problema.
Questo si generalizza praticamente a TUTTA la logica quando si tratta di pensare al codice - raramente, se non mai, commette errori.
Il prossimo grande traguardo: non scrive più codice scadente! Questo è enorme. Con Codex, puoi fargli scrivere codice che funziona. Ma scrive codice orribile - funzioni inutili, cattive astrazioni, ecc. Questo è frustrante, perché funziona a breve termine, ma a lungo termine il modello si troverà in un angolo dove non potrà più lavorare con il codice che ha scritto da solo.
Non è il caso con Opus. Non solo scrive codice elegante, ma sa anche come rifattorizzare codice scadente in codice non scadente. Comprende profondamente il codice e può trovare soluzioni eleganti che non sono solo rifattorizzazioni 'meccaniche'.
È molto autonomo e indipendente. Quando incontra problemi, crea esempi riproducibili minimi, cerca di bisettare da dove proviene l'errore, quindi lo risolve senza rimanere bloccato in vicoli ciechi. Anche se l'errore si trova in una parte non correlata del codice -- codice che non ha nemmeno scritto da solo!!
Fa anche ESATTAMENTE QUELLO CHE DICI, SENZA TAGLIARE ANGOLI! Questo è enorme!!! Usare Codex è fondamentalmente un gioco di colpire i topi dove capisce cosa vuoi che faccia, ma è troppo difficile, quindi trova soluzioni di ripiego che non vuoi.
Opus affronta effettivamente il problema e lo risolve correttamente anche se è difficile.
La comprensione del contesto lungo è praticamente perfetta. Abbinata al meccanismo di compattazione disponibile in Claude Code per impostazione predefinita, puoi sostanzialmente avere una conversazione infinitamente lunga in cui comprende tutto al suo interno, senza degradazione.
In termini di design, ricerca, ideazione di idee nuove. È migliore, ma non ancora a livello di esperto umano. Può proporre soluzioni che considererei un buon design, ma non riesce ancora a 'pensare con i portali'. Tuttavia, è un buon miglioramento rispetto a ciò che avevamo prima, che era praticamente inesistente.
Tutto quanto sopra l'ho raccolto testandolo negli ultimi giorni dove il compito era scrivere un interprete per un linguaggio che stavamo progettando al volo. È un design molto di nicchia, simile a Self e Smalltalk, tranne che stiamo costruendo il linguaggio all'interno del linguaggio stesso. Questo porta a scenari estremamente difficili in cui stai cercando di definire come funzionano le funzioni -- all'interno del linguaggio -- quando non hai ancora funzioni! E fa comunque un lavoro magnifico. A volte, non capisco nemmeno completamente cosa gli sto chiedendo di fare, ma Opus lo capisce e fa un buon lavoro.
TL;DR: È il Sonnet 3.5 del 2025. Provalo. Fallo ora.
286,95K
Principali
Ranking
Preferiti
