Wende RL auf Multi-Step LLM-Agenten an! Der Agent Reinforcement Trainer (ART) ist ein Framework, um Multi-Step-Agenten für reale Aufgaben mit GRPO zu trainieren. Du benötigst nur ein paar Zeilen Code. Keine manuellen Belohnungen erforderlich! ✨ 100% Open-Source.