1/ بحث جديد من Gensyn: المشاركة هي الرعاية نقدم SAPO (Swarm sampling Policy Optimization) - طريقة لامركزية لما بعد التدريب RL حيث تشارك النماذج الخبرات للتعلم بشكل أسرع معا.