Pas RL toe op Multi-Step LLM Agents! Agent Reinforcement Trainer (ART) is een framework om multi-step agents te trainen voor taken in de echte wereld met behulp van GRPO. Je hebt slechts een paar regels code nodig. Geen handmatige beloningen nodig! ✨ 100% open-source.