Latih Agen AI untuk tugas dunia nyata yang kompleks hanya dalam satu baris Kode Python. Pelatih Penguatan Agen menggunakan LLM-as-judge untuk melatih agen multi-langkah tanpa hadiah manual. 100% Sumber Terbuka.