Myślę, że nadszedł czas, aby zacząć rozmawiać o AgentOps.
DevOps → MLOps → AgentOps
Jeśli chcesz autonomicznych agentów, którzy działają i skalują, musimy zacząć formalizować dyscyplinę, która je wspiera.
Niektóre z rzeczy, o które *wszyscy* muszą się martwić:
• Oceny agentów (używając LLM jako sędziego lub jakiejkolwiek innej techniki)
• Wydania oparte na metrykach (wypuszczaj nowe wersje, gdy przekroczą próg)
• Testowanie A/B agentów, wydania kanarkowe, wdrożenia w trybie shadow
• Umożliwienie obserwowalności i śledzenia
• Wdrażanie i integrowanie pętli sprzężenia zwrotnego od ludzi
Nie możesz zbudować niezawodnego agenta, nie martwiąc się o wszystko powyżej.
Dla mnie open source zawsze oznaczało "otwieranie kodu źródłowego."
To dosłownie moje zrozumienie od zawsze.
Cóż, okazuje się, że ktoś postanowił, że "open source" nie oznacza tego, a zamiast tego mają test czystości, aby określić, czy można coś nazwać "otwartym" czy nie.
Jeśli zgadzasz się z tą redefinicją terminu, cieszę się z tobą.
Ale absolutnie nie jesteś nikim, kto mógłby mi mówić, czym jest open source i jak oraz kiedy mogę używać tego terminu.