🚀 Prezentăm OpenMMReasoner — o rețetă transparentă și reproductibilă pentru raționamentul multimodal. Prezentăm o conductă în 2 etape care folosește 874K mostre SFT cu validare pas cu pas și mostre RL de înaltă calitate de 74K. Hârtie: Mai multe în firul de discuție: