Appliquez le RL aux agents LLM multi-étapes ! Agent Reinforcement Trainer (ART) est un cadre pour entraîner des agents multi-étapes pour des tâches du monde réel en utilisant GRPO. Vous avez juste besoin de quelques lignes de code. Pas de récompenses manuelles nécessaires ! ✨ 100 % open-source.