Instruiți agenții AI pentru sarcini complexe din lumea reală într-o singură linie de cod Python. Agent Reinforcement Trainer folosește LLM-as-judge pentru a antrena agenți în mai mulți pași fără recompense manuale. 100% Opensource.