Käytä RL:ää monivaiheisiin LLM-agentteihin! Agent Reinforcement Trainer (ART) on kehys, jolla koulutetaan monivaiheisia agentteja todellisiin tehtäviin GRPO:n avulla. Tarvitset vain muutaman rivin koodia. Manuaalisia palkintoja ei tarvita! ✨ 100 % avoimen lähdekoodin.