O projeto HVM-by-AI encontrou um obstáculo. As coisas estavam a correr bem, mas temos um problema: o interpretador C é recursivo, o que significa que ocorre um estouro de pilha para programas grandes. Pedi à IA para convertê-lo em um interpretador baseado em pilha/loop manual, mas falhou. Felizmente, o HVM3 já tem um interpretador desse tipo! Então, dei-lhe as partes relevantes do HVM3 e pedi que o portasse. Tudo o que tinha que fazer era adaptar o código antigo à nova base de código. Infelizmente, mesmo com essa dica massiva, a IA falhou novamente. Então, criei 3 instâncias e pedi que as mesmas fizessem a depuração, e parassem apenas quando a saída estivesse correta. Até lhes dei ferramentas para comparar a execução passo a passo. Todas as 3 falharam. Acho que este é o limite... Sei que provavelmente conseguiria fazer isso em uma ou duas horas, mas e se não conseguisse? Quero realmente descobrir se um computador pode resolver isso sozinho, pela ciência. Estou sem ideias, no entanto: o GPT-5 high é o modelo mais inteligente que temos. Se ele não consegue resolver isso, o que mais poderia? Talvez 256 instâncias? Talvez aplicar ajuste fino em tempo de teste a algum outro modelo? Pensamentos?
Taelin
Taelin21/08/2025
A propósito, basicamente parei de usar o Opus completamente e agora tenho várias abas do Codex com o GPT-5-high a trabalhar em diferentes tarefas em 3 bases de código (HVM, Bend, Kolmo). O progresso nunca foi tão intenso. O meu trabalho agora é basicamente passar tarefas bem especificadas para o Codex e rever os seus resultados. A OpenAI não me está a pagar e não se importa nada comigo. Este modelo é simplesmente muito bom e o fato de as pessoas não conseguirem ver isso fez-me perceber que a maioria de vocês provavelmente está a usar chatbots como namoradas ou algo diferente de ajudar com tarefas de codificação complexas.
106,28K