Applica RL agli Agenti LLM Multi-Step! Agent Reinforcement Trainer (ART) è un framework per addestrare agenti multi-step per compiti del mondo reale utilizzando GRPO. Hai solo bisogno di poche righe di codice. Nessun premio manuale necessario! ✨ 100% open-source.