HVM-by-AI プロジェクトは壁にぶつかりました。 物事はスムーズに機能していましたが、問題があります:Cインタプリタは再帰的であり、大規模なプログラムのスタックオーバーフローを意味します。AIに手動スタック/ループベースのインタプリタに変換するように依頼しましたが、失敗しました。 幸いなことに、HVM3にはすでにそのようなインタープリターがあります!そこで、HVM3の関連部分を与え、移植を依頼しました。古いコードを新しいコードベースに適応させるだけでした。悲しいことに、この膨大なヒントがあっても、AI は再び失敗しました。 次に、3つのインスタンスを生成し、デバッグを依頼し、出力が正しい場合にのみ停止します。実行を段階的に比較するためのツールも提供しました。3つすべて失敗しました。 これが限界なのかな...おそらく1時間か2時間で自分でできると思いますが、それができなかったらどうなるでしょうか?私は、科学のために、コンピューターがそれ自体でそれを解決できるかどうかを本当に理解したいと思っています。 しかし、GPT-5 highは私たちが持っている最もスマートなモデルです。これを解決できないなら、他に何が解決できるでしょうか?おそらく256例でしょうか?おそらく、テスト時の微調整を他のモデルに適用しますか? 感想。
Taelin
Taelin2025年8月21日
ところで、私は基本的にOpusの使用を完全にやめ、現在、GPT-5-highを備えたいくつかのCodexタブがあり、3つのコードベース(HVM、Bend、Kolmo)でさまざまなタスクを処理しています。進歩はかつてないほど激しいものでした。私の今の仕事は、基本的に明確に指定されたタスクをCodexに渡し、その出力を確認することです。 OpenAIは私にお金を払ってくれませんし、私のことをあまり気にしていませんでした。このモデルは非常に優れており、人々がそれを見ることができないという事実は、おそらく皆さんのほとんどがチャットボットをガールフレンドとして、または複雑なコーディングタスクを支援する以外の何かを使用していることに気づきました
101.45K