Suntem încântați să împărtășim informații despre munca noastră privind raționamentul eficient @LiquidAI_ : Transformăm un model de chat general de 1,3 miliarde într-un raționament matematic puternic care rămâne concis. SFT pe urmele CoT organizate deblochează raționamentul puternic și RL țintit controlează verbozitatea. Rețeta este simplă și oferă un punct de date interesant pentru modelele non-bazate pe Qwen. Acesta se bazează încă pe prima noastră generație de LFM-uri - entuziasmați de următoarea generație! Vă rugăm să găsiți detalii în postarea noastră pe blog!
@LiquidAI_
4,19K