1/ Новое исследование от Gensyn: Делитесь, это забота Мы представляем SAPO (Оптимизация Политики Сборки Роя) - децентрализованный метод постобучения RL, где модели обмениваются опытом, чтобы учиться быстрее, вместе.