Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O projeto HVM-by-AI encontrou um obstáculo.
As coisas estavam a correr bem, mas temos um problema: o interpretador C é recursivo, o que significa que ocorre um estouro de pilha para programas grandes. Pedi à IA para convertê-lo em um interpretador baseado em pilha/loop manual, mas falhou.
Felizmente, o HVM3 já tem um interpretador desse tipo! Então, dei-lhe as partes relevantes do HVM3 e pedi que o portasse. Tudo o que tinha que fazer era adaptar o código antigo à nova base de código. Infelizmente, mesmo com essa dica massiva, a IA falhou novamente.
Então, criei 3 instâncias e pedi que as mesmas fizessem a depuração, e parassem apenas quando a saída estivesse correta. Até lhes dei ferramentas para comparar a execução passo a passo. Todas as 3 falharam.
Acho que este é o limite... Sei que provavelmente conseguiria fazer isso em uma ou duas horas, mas e se não conseguisse? Quero realmente descobrir se um computador pode resolver isso sozinho, pela ciência.
Estou sem ideias, no entanto: o GPT-5 high é o modelo mais inteligente que temos. Se ele não consegue resolver isso, o que mais poderia? Talvez 256 instâncias? Talvez aplicar ajuste fino em tempo de teste a algum outro modelo?
Pensamentos?


21/08/2025
A propósito, basicamente parei de usar o Opus completamente e agora tenho várias abas do Codex com o GPT-5-high a trabalhar em diferentes tarefas em 3 bases de código (HVM, Bend, Kolmo). O progresso nunca foi tão intenso. O meu trabalho agora é basicamente passar tarefas bem especificadas para o Codex e rever os seus resultados.
A OpenAI não me está a pagar e não se importa nada comigo. Este modelo é simplesmente muito bom e o fato de as pessoas não conseguirem ver isso fez-me perceber que a maioria de vocês provavelmente está a usar chatbots como namoradas ou algo diferente de ajudar com tarefas de codificação complexas.
106,28K
Top
Classificação
Favoritos