Feinabstimmung von LLM-Agenten ohne Feinabstimmung von LLMs! Stell dir vor, du verbesserst die Leistung deines KI-Agenten aus Erfahrungen, ohne jemals die Modellgewichte zu berühren. Es ist genau wie bei Menschen, die sich an vergangene Episoden erinnern und aus ihnen lernen. Genau das macht Memento. Das Kernkonzept: Anstatt die LLM-Gewichte zu aktualisieren, lernt Memento aus Erfahrungen mithilfe von Gedächtnis. Es reformuliert kontinuierliches Lernen als gedächtnisbasierte Online-Verstärkungslernen über ein gedächtniserweitertes MDP. Denk daran, deinem Agenten ein Notizbuch zu geben, um sich zu merken, was funktioniert hat und was nicht! Wie funktioniert es? Das System gliedert sich in zwei Hauptkomponenten: 1️⃣ Fallbasiertes Denken (CBR) in Aktion: Zerlegt komplexe Aufgaben in Unteraufgaben und ruft relevante vergangene Erfahrungen ab. Keine Gradienten nötig, nur intelligenter Gedächtnisabruf! 2️⃣ Executor Führt jede Unteraufgabe mit MCP-Tools aus und zeichnet Ergebnisse im Gedächtnis für zukünftige Referenz auf. Durch MCP kann der Executor die meisten realen Aufgaben erledigen und hat Zugriff auf die folgenden Tools: 🔍 Webrecherche 📄 Dokumentenverwaltung 🐍 Sicheres Python-Execution 📊 Datenanalyse 🎥 Medienverarbeitung Ich finde, das ist ein wirklich guter Weg, um menschenähnliche Agenten zu entwickeln. 👉 Jetzt bist du dran, was denkst du? Ich habe die relevanten Links im nächsten Tweet geteilt! _____ Teile dies mit deinem Netzwerk, wenn du es aufschlussreich fandest ♻️ Finde mich → @akshay_pachaar für weitere Einblicke und Tutorials zu KI und maschinellem Lernen!
77,1K