Ottimizzazione degli agenti LLM senza ottimizzare i LLM! Immagina di migliorare le prestazioni del tuo agente AI grazie all'esperienza senza mai toccare i pesi del modello. È proprio come gli esseri umani ricordano episodi passati e imparano da essi. Questo è esattamente ciò che fa Memento. Il concetto fondamentale: Invece di aggiornare i pesi degli LLM, Memento impara dalle esperienze utilizzando la memoria. Riformula l'apprendimento continuo come apprendimento per rinforzo online basato sulla memoria su un MDP potenziato dalla memoria. Pensalo come dare al tuo agente un quaderno per ricordare cosa ha funzionato e cosa no! Come funziona? Il sistema si suddivide in due componenti chiave: 1️⃣ Ragionamento basato su casi (CBR) in azione: Decompone compiti complessi in sotto-compiti e recupera esperienze passate rilevanti. Nessun gradiente necessario, solo un recupero intelligente della memoria! 2️⃣ Esecutore Esegue ogni sotto-compito utilizzando strumenti MCP e registra i risultati nella memoria per riferimento futuro. Attraverso MCP, l'esecutore può portare a termine la maggior parte dei compiti del mondo reale e ha accesso ai seguenti strumenti: 🔍 Ricerca web 📄 Gestione documenti 🐍 Esecuzione sicura di Python 📊 Analisi dei dati 🎥 Elaborazione dei media Ho trovato che questo sia un ottimo percorso per costruire agenti simili agli esseri umani. 👉 A te la parola, quali sono i tuoi pensieri? Ho condiviso i link pertinenti nel tweet successivo! _____ Condividi questo con la tua rete se lo hai trovato interessante ♻️ Trova me → @akshay_pachaar per ulteriori approfondimenti e tutorial su AI e Machine Learning!
77,09K