跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+2.92%
USELESS
+0.98%
IKUN
+3.31%
gib
+11.24%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+2.43%
ALON
+20.65%
LAUNCHCOIN
-6.71%
GOONC
-2.8%
KLED
+23.65%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-3.52%
Boopa
-15.03%
PORK
+6.93%
主頁
Nathan Lambert
研究@allen_ai、推理、開放模型、RL(VR/HF)... 通過電子郵件聯繫。 @interconnectsai寫道, 寫了 RLHF 書, 🏔️🏃♂️
查看原文
Nathan Lambert
21 小時前
發佈一週後,Olmo 3 團隊仍在努力讓這篇論文變得更加出色。這裡的人們真的很關心你擁有良好的閱讀體驗 💙🦖🐄
7.24K
117
Nathan Lambert
11月25日 11:10
很高興看到更多完全開放的後訓練食譜(這是一個多模態推理)。 後訓練數據如此稀少令人驚訝,因為其影響的機會是巨大的。很多人會嘗試,而簡單的數據方法仍然可以在SOTA上有所改善。
Kaichen Zhang
11月24日 23:02
🚀 介紹 OpenMMReasoner — 一個透明、可重複的多模態推理配方。 我們提出了一個使用 874K SFT 樣本的 2 階段管道,並進行逐步驗證,還有 74K 高品質的 RL 樣本。 論文: 更多內容在主題中:
21.41K
194
熱門
排行
收藏