マルチステップLLMエージェントにRLを適用! エージェント強化トレーナー (ART) は、GRPO を使用して実際のタスクに対してマルチステップのエージェントをトレーニングするためのフレームワークです。 必要なのは数行のコードだけです。手動報酬は必要ありません!✨ 100%オープンソース。