🚀 介紹 OpenMMReasoner — 一個透明、可重複的多模態推理配方。 我們提出了一個使用 874K SFT 樣本的 2 階段管道,並進行逐步驗證,還有 74K 高品質的 RL 樣本。 論文: 更多內容在主題中: