わずか 1 行の Python コードで、複雑な現実世界のタスクに対して AI エージェントをトレーニングします。 Agent Reinforcement Trainer は、LLM-as-judge を使用して、手動報酬なしでマルチステップのエージェントをトレーニングします。 100%オープンソース。