🚀 Представляємо OpenMMReasoner — прозорий, відтворюваний рецепт мультимодального мислення. Ми представляємо двоступеневий конвеєр, що використовує 874K SFT-зразків з покроковою валідацією та 74K високоякісних RL-зразків. Папір: Більше в темі: