Aplikujte RL na vícekrokové agenty LLM! Agent Reinforcement Trainer (ART) je rámec pro výcvik vícekrokových agentů pro reálné úkoly pomocí GRPO. Potřebujete jen pár řádků kódu. Nejsou potřeba žádné manuální odměny! ✨ 100% open-source.