熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
HVM-by-AI專案遇到了瓶頸。
一切運轉順利,但我們遇到了一個問題:C解釋器是遞歸的,這意味著對於大型程式會導致堆疊溢出。我已經要求AI將其轉換為手動堆疊/循環基礎的解釋器,但它失敗了。
幸運的是,HVM3已經有這樣的解釋器!所以,我給了它HVM3的相關部分,並要求它進行移植。它所需要做的就是將舊代碼適配到新代碼庫中。可悲的是,即使有了這個巨大的提示,AI還是再次失敗了。
然後我啟動了3個實例,要求它們進行調試,只有在輸出正確時才停止。我甚至給了它們逐步比較執行的工具。所有3個都失敗了。
我想這就是極限……我知道我自己可能在一兩個小時內就能做到,但,如果我做不到呢?我真的想弄清楚計算機是否能獨立解決這個問題,為了科學。
不過我已經沒有主意了:GPT-5 high是我們擁有的最聰明的模型。如果它不能解決這個問題,還有什麼能解決呢?也許256個實例?也許對其他模型應用測試時微調?
有什麼想法嗎?


2025年8月21日
順便說一下,我基本上已經完全停止使用 Opus,現在我有幾個 Codex 標籤頁在處理 3 個代碼庫(HVM、Bend、Kolmo)中的不同任務,進展從未如此激烈。我的工作基本上就是將明確指定的任務交給 Codex,並審查它的輸出。
OpenAI 並沒有支付我,也不在乎我。這款模型實在是太優秀了,而人們看不到這一點讓我意識到你們中的大多數人可能把聊天機器人當作女朋友或其他什麼,而不是用來協助複雜的編碼任務。
101.45K
熱門
排行
收藏