Je pense qu'il est temps de commencer à parler d'AgentOps.
DevOps → MLOps → AgentOps
Si vous voulez des agents autonomes qui fonctionnent et évoluent, nous devons commencer à formaliser la discipline qui les soutient.
Certaines des choses dont *tout le monde* doit se soucier :
• Évaluations des agents (en utilisant LLM comme juge ou toute autre technique)
• Versions basées sur des métriques (expédier de nouvelles versions lorsqu'elles dépassent le seuil)
• Tests A/B des agents, versions canari, déploiements en ombre
• Activer l'observabilité et le traçage
• Mettre en œuvre et intégrer des boucles de rétroaction humaine
Vous ne pouvez pas construire un agent fiable sans vous soucier de tout ce qui précède.
Pour moi, l'open source a toujours été une question d'"ouvrir le code source."
C'est littéralement ma compréhension depuis toujours.
Eh bien, il s'avère que quelqu'un a décidé que "l'open source" ne signifie pas cela, et à la place, ils ont un test de pureté pour définir si vous pouvez appeler quelque chose "ouvert" ou non.
Si vous adhérez à cette redéfinition du terme, je suis heureux pour vous.
Mais vous n'êtes absolument personne pour me dire ce qu'est l'open source et comment et quand je peux utiliser ce terme.