El proyecto HVM-by-AI ha chocado contra un muro. Las cosas estaban funcionando sin problemas, pero tenemos un problema: el intérprete de C es recursivo, lo que significa que se desborda la pila para programas grandes. Le he pedido a la IA que lo convierta en un intérprete basado en pila/manual y bucle, pero falló. Afortunadamente, ¡HVM3 ya tiene un intérprete así! Así que le he dado las partes relevantes de HVM3 y le he pedido que lo porte. Todo lo que tenía que hacer era adaptar el código antiguo a la nueva base de código. Lamentablemente, incluso con esta enorme pista, la IA falló de nuevo. Luego he creado 3 instancias y les he pedido que depuren, y que solo se detengan cuando la salida sea correcta. Incluso les di herramientas para comparar la ejecución paso a paso. Las 3 fallaron. Supongo que este es el límite... Sé que probablemente podría hacerlo yo mismo en una o dos horas, pero, ¿y si no pudiera? Realmente quiero averiguar si una computadora puede resolver eso por sí sola, por la ciencia. Estoy sin ideas, sin embargo: GPT-5 high es el modelo más inteligente que tenemos. Si no puede resolver esto, ¿qué más podría? ¿Quizás 256 instancias? ¿Quizás aplicar ajuste fino en el tiempo de prueba a algún otro modelo? ¿Pensamientos?
Taelin
Taelin21 ago 2025
Por cierto, básicamente he dejado de usar Opus por completo y ahora tengo varias pestañas de Codex con GPT-5-high trabajando en diferentes tareas a través de las 3 bases de código (HVM, Bend, Kolmo). El progreso nunca ha sido tan intenso. Mi trabajo ahora es básicamente pasar tareas bien especificadas a Codex y revisar sus resultados. OpenAI no me está pagando y no le importa en absoluto. Este modelo es simplemente muy bueno y el hecho de que la gente no pueda verlo me hizo darme cuenta de que la mayoría de ustedes probablemente están usando chatbots como novias o algo diferente a ayudar con tareas de codificación complejas.
105,93K