Applicera RL på LLM-agenter i flera steg! Agent Reinforcement Trainer (ART) är ett ramverk för att träna flerstegsagenter för verkliga uppgifter med hjälp av GRPO. Du behöver bara några rader kod. Inga manuella belöningar behövs! ✨ 100 % öppen källkod.