Примените RL к многошаговым LLM-агентам! Agent Reinforcement Trainer (ART) — это фреймворк для обучения многошаговых агентов для реальных задач с использованием GRPO. Вам нужно всего лишь несколько строк кода. Никаких ручных вознаграждений не требуется! ✨ 100% с открытым исходным кодом.