跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-3.98%
USELESS
-5.69%
IKUN
-6.27%
gib
-4.17%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-1.51%
ALON
-5.8%
LAUNCHCOIN
+3.45%
GOONC
-1.14%
KLED
-7.98%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+0.53%
Boopa
-1.4%
PORK
0.00%
主頁
Luca Soldaini 🎀
Luca Soldaini 🎀
11月24日 02:30
奧爾莫 3 三位一體
16.66K
65
Luca Soldaini 🎀
11月20日 23:37
我和 @natolambert 與 Matt 談論了 Olmo 3!真的很有趣的聊天
Matt Turck
11月20日 23:31
*重大* 開源 AI 今日發布。美國能贏得開放 AI 競賽嗎?我與 @natolambert 和 @soldni 以及 @allen_ai 的對話,討論 Olmo 3 的推出 00:00 – 冷開場 00:39 – 歡迎與今天的重要公告 01:18 – 介紹 Olmo 3 模型系列 02:07 – 什麼是「基礎模型」(以及它們為什麼重要) 05:51 – Dolma 3:Olmo 3 背後的數據 08:06 – 性能 vs Qwen、Gemma、DeepSeek 10:28 – 真正的開源意味著什麼(以及為什麼它很少見) 12:51 – 中間檢查點、透明度,以及為什麼 AI2 發布所有內容 16:37 – 為什麼 Qwen 無處不在(包括美國初創公司) 18:31 – 為什麼中國實驗室選擇開源(以及美國實驗室不這樣做的原因) 20:28 – 內部 ATOM:美國對中國模型激增的回應 22:13 – 「思考模型」的興起和推理時間的擴展 35:58 – 完整的 Olmo 流程,簡單解釋 46:52 – 預訓練:數據、規模,及避免災難性峰值 50:27 – 中期訓練(尾部修補)和避免測試洩漏 52:06 – 為什麼長上下文訓練很重要 55:28 – SFT:建立推理的基礎 1:04:53 – 偏好調整及為什麼 DPO 仍然有效 1:10:51 – 困難的部分:RLVR、長推理鏈和基礎設施的痛苦 1:13:59 – 為什麼 RL 在技術上如此殘酷 1:18:17 – 複雜性稅與 AGI 熱潮 1:21:58 – 每個人如何能為 AI 的未來做出貢獻 1:27:26 – 結語
4.43K
26
Luca Soldaini 🎀
2025年10月9日
有沒有人聽說過這個 Olmo 模型,損失看起來不錯
25.67K
193
熱門
排行
收藏