Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Il progetto HVM-by-AI ha colpito un muro.
Le cose stavano andando bene, ma abbiamo un problema: l'interprete C è ricorsivo, il che significa che si verifica un overflow dello stack per programmi di grandi dimensioni. Ho chiesto all'AI di convertirlo in un interprete manuale basato su stack/ciclo, ma ha fallito.
Per fortuna, HVM3 ha già un interprete del genere! Quindi, ho fornito le parti rilevanti di HVM3 e gli ho chiesto di portarlo. Tutto ciò che doveva fare era adattare il vecchio codice al nuovo codice sorgente. Purtroppo, anche con questo enorme suggerimento, l'AI ha fallito di nuovo.
Ho quindi avviato 3 istanze e ho chiesto loro di fare il debug, e di fermarsi solo quando l'output è corretto. Ho persino fornito loro strumenti per confrontare l'esecuzione passo dopo passo. Tutti e 3 hanno fallito.
Immagino che questo sia il limite... So che probabilmente potrei farlo da solo in un'ora o due, ma, e se non potessi? Voglio davvero capire se un computer può risolvere questo problema da solo, per la scienza.
Sono a corto di idee, però: GPT-5 high è il modello più intelligente che abbiamo. Se non riesce a risolvere questo, cos'altro potrebbe farlo? Forse 256 istanze? Forse applicare il fine-tuning al momento del test a qualche altro modello?
Pensieri?


21 ago 2025
A proposito, ho praticamente smesso di usare completamente Opus e ora ho diverse schede Codex con GPT-5-high che lavorano su diversi compiti nei 3 codebase (HVM, Bend, Kolmo). I progressi non sono mai stati così intensi. Il mio lavoro ora consiste fondamentalmente nel passare compiti ben specificati a Codex e rivedere i suoi output.
OpenAI non mi sta pagando e non gli importa nulla di me. Questo modello è semplicemente molto buono e il fatto che le persone non riescano a vederlo mi ha fatto capire che la maggior parte di voi probabilmente sta usando chatbot come fidanzate o qualcosa di diverso dall'assistere in compiti di codifica complessi.
101,46K
Principali
Ranking
Preferiti