1/ Nueva investigación de Gensyn: Compartir es cuidar Presentamos SAPO (Swarm sAmpling Policy Optimization), un método descentralizado posterior al entrenamiento de RL en el que los modelos comparten experiencias para aprender más rápido, juntos.