Aplique RL a agentes LLM de várias etapas! O Agent Reinforcement Trainer (ART) é uma estrutura para treinar agentes de várias etapas para tarefas do mundo real usando o GRPO. Você só precisa de algumas linhas de código. Não são necessárias recompensas manuais! ✨ 100% de código aberto.