🚀 Introductie van OpenMMReasoner — een transparant, reproduceerbaar recept voor multimodale redenering. We presenteren een 2-fasen pijplijn die 874K SFT monsters gebruikt met stapsgewijze validatie en 74K hoogwaardige RL monsters. Paper: Meer in de thread: