LLMを微調整せずにLLMエージェントを微調整! モデルの重みに触れることなく、経験から AI エージェントのパフォーマンスを向上させることを想像してみてください。 人間が過去のエピソードを思い出し、そこから学ぶのと同じだ。 それこそがメメントの仕事です。 コアコンセプト: Mementoは、LLMの重みを更新する代わりに、メモリを使用して経験から学習します。 継続的な学習を、メモリ拡張MDPを介したメモリベースのオンライン強化学習として再構成します。 エージェントにノートを渡して、何がうまくいき、何がうまくいかなかったかを覚えておくと考えてください。 どのように機能しますか? このシステムは、次の 2 つの主要なコンポーネントに分かれています。 1️⃣ ケースベースの推論 (CBR) の作業: 複雑なタスクをサブタスクに分解し、関連する過去の経験を取得します。 グラデーションは必要なく、スマートなメモリ検索だけです。 2️⃣ エグゼキューター MCP ツールを使用して各サブタスクを実行し、将来の参照のために結果をメモリに記録します。 MCP を通じて、エグゼキューターはほとんどの現実世界のタスクを実行でき、次のツールにアクセスできます。 🔍 Web調査 📄 ドキュメント処理 🐍 安全な Python 実行 📊 データ分析 🎥 メディア処理 これは、人間のようなエージェントを構築するための非常に良い道であることがわかりました。 👉 あなたに、あなたはどう思いますか? 次のツイートで関連リンクを共有しました! _____ これが洞察に満ちている♻️と思われた場合は、これをネットワークと共有してください AI と機械学習に関する詳細な洞察とチュートリアルについては、→ @akshay_pachaar で私を見つけてください。
77.11K