¡Aplique RL a agentes LLM de varios pasos! Agent Reinforcement Trainer (ART) es un marco para entrenar a agentes de varios pasos para tareas del mundo real utilizando GRPO. Solo necesitas unas pocas líneas de código. ¡No se necesitan recompensas manuales! ✨ 100% de código abierto.