Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ottimizzazione degli agenti LLM senza ottimizzare i LLM!
Immagina di migliorare le prestazioni del tuo agente AI grazie all'esperienza senza mai toccare i pesi del modello.
È proprio come gli esseri umani ricordano episodi passati e imparano da essi.
Questo è esattamente ciò che fa Memento.
Il concetto fondamentale:
Invece di aggiornare i pesi degli LLM, Memento impara dalle esperienze utilizzando la memoria.
Riformula l'apprendimento continuo come apprendimento per rinforzo online basato sulla memoria su un MDP potenziato dalla memoria.
Pensalo come dare al tuo agente un quaderno per ricordare cosa ha funzionato e cosa no!
Come funziona?
Il sistema si suddivide in due componenti chiave:
1️⃣ Ragionamento basato su casi (CBR) in azione:
Decompone compiti complessi in sotto-compiti e recupera esperienze passate rilevanti.
Nessun gradiente necessario, solo un recupero intelligente della memoria!
2️⃣ Esecutore
Esegue ogni sotto-compito utilizzando strumenti MCP e registra i risultati nella memoria per riferimento futuro.
Attraverso MCP, l'esecutore può portare a termine la maggior parte dei compiti del mondo reale e ha accesso ai seguenti strumenti:
🔍 Ricerca web
📄 Gestione documenti
🐍 Esecuzione sicura di Python
📊 Analisi dei dati
🎥 Elaborazione dei media
Ho trovato che questo sia un ottimo percorso per costruire agenti simili agli esseri umani.
👉 A te la parola, quali sono i tuoi pensieri?
Ho condiviso i link pertinenti nel tweet successivo!
_____
Condividi questo con la tua rete se lo hai trovato interessante ♻️
Trova me → @akshay_pachaar per ulteriori approfondimenti e tutorial su AI e Machine Learning!

77,09K
Principali
Ranking
Preferiti