1/ Ny forskning från Gensyn: Sharing is Caring Vi introducerar SAPO (Swarm sAmpling Policy Optimization) - en decentraliserad RL-metod efter träning där modeller delar erfarenheter för att lära sig snabbare, tillsammans.