Aplicați RL agenților LLM în mai mulți pași! Agent Reinforcement Trainer (ART) este un cadru pentru instruirea agenților în mai mulți pași pentru sarcini din lumea reală folosind GRPO. Aveți nevoie doar de câteva linii de cod. Nu este nevoie de recompense manuale! ✨ 100% open-source.