1/ Nový výzkum společnosti Gensyn: Sdílení je péče Představujeme SAPO (Swarm sAmpling Policy Optimization) - decentralizovanou metodu RL post-trénování, kde modely sdílejí zkušenosti, aby se společně rychleji učily.