"我們不會透過大型語言模型達到AGI。" Yann LeCun這麼說已經很多年了。現在他離開Meta來證明這一點。 LeCun發明了卷積神經網絡——這項技術是當今每部智能手機相機和自駕車的背後推手。他在2018年獲得了圖靈獎,這是AI的諾貝爾獎。 65歲的他,Meta FAIR研究實驗室的領導者,正走出價值6000億美元的AI基礎設施,對整個行業下注:Meta、OpenAI、Anthropic、xAI、Google。 @ylecun是誰?他為什麼要離開,他的下一步為什麼重要?這就是故事:
Yann LeCun 是誰? - 在1980年代創建了卷積神經網絡(CNN)——現在是計算機視覺的基礎 - 在貝爾實驗室構建了 LeNet → 深度學習的第一個大規模應用(銀行支票閱讀) - 與 Hinton 和 Bengio 一起獲得圖靈獎(2018) - 2013年加入 Meta,創立 FAIR(基礎 AI 研究) - 建立了開放研究的文化:自由發表,釋放開放模型 他是 "深度學習的教父" 之一。
LeCun的核心技術立場 自2022年以來,LeCun一直持續強調:大型語言模型有根本的局限性。它們預測文本模式,但缺乏: - 對物理世界動態的理解 - 持久記憶 - 因果推理 - 目標導向的規劃 他著名的比喻是:"我們甚至無法重現貓的智慧或老鼠的智慧,更不用說狗的智慧了。" 他主張"世界模型"——通過觀察物理世界而非僅僅閱讀文本來學習的AI系統。這並不是對大型語言模型的拒絕,而是認為它們作為通向通用智慧的途徑是不足夠的。
擴展論點:為什麼Meta不同意 該行業的大量計算投資基於一個觀察:更大的模型表現始終更好。從GPT-3到GPT-4顯示出在規模上出現的能力是較小模型完全缺乏的。 這個賭注:如果僅僅通過擴展就能達到AGI,誰建造最大的基礎設施,誰就贏。 LeCun的反駁:擴展改善文本預測,而不是實際推理或對物理世界的理解。
Meta的組織變革 2013–2024:FAIR在相當大的自主權下運作 - 開放發表,獲得大量計算資源,維持學術文化 2025年4月:Llama 4推出,反響不一 - 基準測試未能匹配GPT-4.5、Gemini 2、DeepSeek-R1 - 有報導指出內部壓力要求加速進程 Meta的領導層得出結論,認為需要重組AI工作。
2025年夏季:Meta啟動激進的人才招聘 - 首席執行官馬克·祖克柏親自與位於帕洛阿爾托和太浩湖的研究人員會面 - 簽約獎金報導高達2億美元(來自Apple的Ruoming Pang) - 從OpenAI、DeepMind、Apple、Anthropic招募 - 焦點轉移:從長期研究轉向更快的商業部署
2025年6月:Alexandr Wang的舉動 Meta投資143億美元以獲得Scale AI(數據基礎設施公司)49%的股份。 將創始人Alexandr Wang(28歲)聘為首席AI官,負責領導新的「Meta超智能實驗室」。 關鍵背景: - Wang將Scale AI從數據標註初創公司發展到290億美元的估值 - 與主要AI實驗室(OpenAI、Google、國防部)有廣泛的關係 - 以運營執行而非學術研究而聞名 這改變了Meta AI組織的報告結構。
組織重組(2025年6月至8月) Meta 創建了「Meta 超智能實驗室」(MSL),設有四個部門: 1. 下一代模型(待定實驗室) 2. FAIR(基礎研究) 3. 產品與應用研究 4. 基礎設施 FAIR 整合進更廣泛的結構中,失去了一些先前的自主權。 一些重視 FAIR 學術文化的研究人員離開了: - Joelle Pineau → Cohere - 2025年10月裁減約600個職位
前所未有的基礎設施投資規模 2025年資本支出:$66–72B 主要項目: - 普羅米修斯(俄亥俄州):1吉瓦集群,2026年 - 海伯利昂(路易斯安那州):多吉瓦設施 長期:Meta計劃在2028年前投入6000億美元於AI基礎設施。 這代表了行業對擴展當前架構的最大押注——這一方法是LeCun公開質疑的。
2025年11月:LeCun計劃離職 根據消息來源: - 計劃在未來幾個月內離開 - 開始為世界模型創業進行早期籌資討論 - 預計研究時間表為10-20年 - 專注於替代架構而非擴展現有架構 這意味著將放棄獲得: - 6000億美元的計劃基礎設施 - 130萬GPU部署 - 世界上最大的AI計算資源之一
接下來會發生什麼 在1980年代到90年代,LeCun在這個領域已經放棄神經網絡的時候,仍然堅持使用神經網絡。他的逆向賭注成為今天AI革命的基礎。 現在他又在進行另一個逆向賭注:擴展會遇到根本的限制,而真正的智慧需要理解物理世界,而不僅僅是預測文本。 Meta、OpenAI和Google正在押注超過6000億美元,認為他是錯的——當前的架構可以僅通過擴展來達到AGI。 LeCun的技術判斷是否會再次證明是先見之明,還是擴展者會贏? 答案將定義未來十年的AI。
421.63K