🚀 Einführung von OpenMMReasoner — ein transparenter, reproduzierbarer Ansatz für multimodales Denken. Wir präsentieren eine 2-stufige Pipeline, die 874K SFT-Proben mit schrittweiser Validierung und 74K hochwertigen RL-Proben verwendet. Papier: Mehr im Thread: