Zastosuj RL do agentów LLM wieloetapowych! Agent Reinforcement Trainer (ART) to framework do trenowania agentów wieloetapowych do zadań w rzeczywistym świecie z wykorzystaniem GRPO. Potrzebujesz tylko kilku linijek kodu. Nie są potrzebne ręczne nagrody! ✨ 100% open-source.