¡Aplica RL a Agentes LLM de Múltiples Pasos! Agent Reinforcement Trainer (ART) es un marco para entrenar agentes de múltiples pasos para tareas del mundo real utilizando GRPO. ¡Solo necesitas unas pocas líneas de código! ¡No se necesitan recompensas manuales! ✨ 100% de código abierto.