Innoissamme voidessamme jakaa näkemyksiämme työstämme tehokkaan päättelyn parissa @LiquidAI_: Muutamme 1,3 miljardin yleisen keskustelumallin vahvaksi matemaattiseksi päättelyksi, joka pysyy ytimekkäänä. SFT kuratoiduissa CoT-jäljityksissä avaa vahvan päättelyn ja kohdennettu RL hallitsee monisanaisuutta. Resepti on yksinkertainen ja tarjoaa mielenkiintoisen datapisteen muille kuin Qwen-pohjaisille malleille. Tämä perustuu edelleen ensimmäisen sukupolven LFM-laitteisiimme - innoissani seuraavasta sukupolvesta! Löydät lisätietoja blogikirjoituksestamme!
@LiquidAI_
4,19K