Bruk RL på flertrinns LLM-agenter! Agent Reinforcement Trainer (ART) er et rammeverk for å trene flertrinnsagenter for virkelige oppgaver ved hjelp av GRPO. Du trenger bare noen få linjer med kode. Ingen manuelle belønninger nødvendig! ✨ 100 % åpen kildekode.