Проект HVM-by-AI столкнулся с проблемой. Все шло гладко, но у нас возникла проблема: интерпретатор C рекурсивный, что означает, что он переполняет стек для больших программ. Я попросил ИИ преобразовать его в интерпретатор на основе ручного стека/цикла, но он не справился. К счастью, HVM3 уже имеет такой интерпретатор! Поэтому я передал ему соответствующие части HVM3 и попросил портировать его. Все, что ему нужно было сделать, это адаптировать старый код к новой кодовой базе. К сожалению, даже с этой огромной подсказкой ИИ снова не справился. Затем я создал 3 экземпляра и попросил их отладить, и остановиться только тогда, когда вывод будет правильным. Я даже дал им инструменты для сравнения выполнения шаг за шагом. Все 3 провалились. Похоже, это предел... Я знаю, что, вероятно, смогу сделать это сам за час или два, но что, если не смогу? Мне действительно интересно выяснить, сможет ли компьютер решить эту задачу самостоятельно, ради науки. Но у меня больше нет идей: GPT-5 high — самая умная модель, которую мы имеем. Если она не может решить эту задачу, что еще может? Возможно, 256 экземпляров? Возможно, применение тонкой настройки во время тестирования к какой-то другой модели? Мысли?
Taelin
Taelin21 авг. 2025 г.
Кстати, я в основном полностью перестал использовать Opus и теперь у меня несколько вкладок Codex с работающим GPT-5-high, которые занимаются разными задачами в трех кодовых базах (HVM, Bend, Kolmo). Прогресс никогда не был таким интенсивным. Моя работа теперь в основном заключается в том, чтобы передавать хорошо сформулированные задачи Codex и проверять его результаты. OpenAI не платит мне и не заботится обо мне. Эта модель просто очень хороша, и тот факт, что люди этого не видят, заставил меня осознать, что большинство из вас, вероятно, используют чат-ботов как девушек или что-то другое, кроме помощи с сложными задачами программирования.
105,93K