🚀 OpenMMReasoner — マルチモーダル推論のための透明で再現可能なレシピを紹介します。 私たちは、874K SFTサンプルとステップバイステップ検証、そして74K 高品質な強化学習サンプルを用いた2段階パイプラインを提示します。 紙: スレッドでさらに詳しく: