Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ajustement des agents LLM sans ajustement des LLM !
Imaginez améliorer les performances de votre agent IA grâce à l'expérience sans jamais toucher aux poids du modèle.
C'est exactement comme les humains se souviennent des épisodes passés et apprennent d'eux.
C'est précisément ce que fait Memento.
Le concept de base :
Au lieu de mettre à jour les poids des LLM, Memento apprend des expériences en utilisant la mémoire.
Il reformule l'apprentissage continu comme un apprentissage par renforcement en ligne basé sur la mémoire sur un MDP augmenté par la mémoire.
Pensez-y comme donner à votre agent un carnet pour se souvenir de ce qui a fonctionné et de ce qui n'a pas fonctionné !
Comment cela fonctionne-t-il ?
Le système se décompose en deux composants clés :
1️⃣ Raisonnement basé sur des cas (RBC) en action :
Décompose des tâches complexes en sous-tâches et récupère des expériences passées pertinentes.
Pas de gradients nécessaires, juste une récupération de mémoire intelligente !
2️⃣ Exécuteur
Exécute chaque sous-tâche en utilisant des outils MCP et enregistre les résultats en mémoire pour référence future.
Grâce à MCP, l'exécuteur peut accomplir la plupart des tâches du monde réel et a accès aux outils suivants :
🔍 Recherche sur le web
📄 Gestion de documents
🐍 Exécution sécurisée de Python
📊 Analyse de données
🎥 Traitement multimédia
J'ai trouvé que c'était un très bon chemin vers la construction d'agents semblables à des humains.
👉 À vous, quelles sont vos réflexions ?
J'ai partagé les liens pertinents dans le tweet suivant !
_____
Partagez cela avec votre réseau si vous avez trouvé cela instructif ♻️
Trouvez-moi → @akshay_pachaar pour plus d'informations et de tutoriels sur l'IA et l'apprentissage automatique !

77,12K
Meilleurs
Classement
Favoris