Застосовуйте RL до багатоступінчастих агентів LLM! Agent Reinforcement Trainer (ART) — це фреймворк для навчання багатоетапних агентів для виконання реальних завдань за допомогою GRPO. Вам потрібно лише кілька рядків коду. Ручні винагороди не потрібні! ✨ 100% відкритий вихідний код.