Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Проект HVM-by-AI столкнулся с проблемой.
Все шло гладко, но у нас возникла проблема: интерпретатор C рекурсивный, что означает, что он переполняет стек для больших программ. Я попросил ИИ преобразовать его в интерпретатор на основе ручного стека/цикла, но он не справился.
К счастью, HVM3 уже имеет такой интерпретатор! Поэтому я передал ему соответствующие части HVM3 и попросил портировать его. Все, что ему нужно было сделать, это адаптировать старый код к новой кодовой базе. К сожалению, даже с этой огромной подсказкой ИИ снова не справился.
Затем я создал 3 экземпляра и попросил их отладить, и остановиться только тогда, когда вывод будет правильным. Я даже дал им инструменты для сравнения выполнения шаг за шагом. Все 3 провалились.
Похоже, это предел... Я знаю, что, вероятно, смогу сделать это сам за час или два, но что, если не смогу? Мне действительно интересно выяснить, сможет ли компьютер решить эту задачу самостоятельно, ради науки.
Но у меня больше нет идей: GPT-5 high — самая умная модель, которую мы имеем. Если она не может решить эту задачу, что еще может? Возможно, 256 экземпляров? Возможно, применение тонкой настройки во время тестирования к какой-то другой модели?
Мысли?


21 авг. 2025 г.
Кстати, я в основном полностью перестал использовать Opus и теперь у меня несколько вкладок Codex с работающим GPT-5-high, которые занимаются разными задачами в трех кодовых базах (HVM, Bend, Kolmo). Прогресс никогда не был таким интенсивным. Моя работа теперь в основном заключается в том, чтобы передавать хорошо сформулированные задачи Codex и проверять его результаты.
OpenAI не платит мне и не заботится обо мне. Эта модель просто очень хороша, и тот факт, что люди этого не видят, заставил меня осознать, что большинство из вас, вероятно, используют чат-ботов как девушек или что-то другое, кроме помощи с сложными задачами программирования.
105,93K
Топ
Рейтинг
Избранное