僅需一行 Python 代碼即可訓練 AI 代理以完成複雜的現實世界任務。 代理強化訓練器使用 LLM 作為評判者來訓練多步驟代理,無需手動獎勵。 100% 開源。