1/ Gensynin uusi tutkimus: Jakaminen on välittämistä Esittelemme SAPO:n (Swarm sAmpling Policy Optimization) - hajautetun RL:n jälkikoulutusmenetelmän, jossa mallit jakavat kokemuksia oppiakseen nopeammin ja yhdessä.