Terapkan RL ke Agen LLM Multi-Langkah! Agent Reinforcement Trainer (ART) adalah kerangka kerja untuk melatih agen multi-langkah untuk tugas dunia nyata menggunakan GRPO. Anda hanya perlu beberapa baris kode. Tidak perlu hadiah manual! ✨ 100% sumber terbuka.