1/ Нове дослідження від Gensyn: Ділитися – значить піклуватися Ми впроваджуємо SAPO (Swarm sAmpling Policy Optimization) – децентралізований метод постнавчання RL, де моделі обмінюються досвідом, щоб навчатися швидше разом.