🚀 介绍 OpenMMReasoner — 一种透明、可重复的多模态推理配方。 我们提出了一个使用 874K SFT 样本的 2 阶段管道,配有逐步验证和 74K 高质量 RL 样本。 论文: 更多内容在讨论中: