1/ Nueva investigación de Gensyn: Compartir es Cuidar Presentamos SAPO (Optimización de Políticas de Muestreo en Grupo) - un método de RL descentralizado post-entrenamiento donde los modelos comparten experiencias para aprender más rápido, juntos.