Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

elvis

Construindo com agentes de IA @dair_ai • Anterior: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Compartilho insights sobre como construir com LLMs & AI Agents ⬇️

O Google acaba de publicar um guia incrível sobre engenharia de contexto eficaz para sistemas multi-agente. Prestem atenção a este, desenvolvedores de IA! (adicionem aos favoritos) Aqui estão os meus principais pontos: As janelas de contexto não são o gargalo. A engenharia de contexto é. Para problemas mais complexos e de longo prazo, a gestão de contexto não pode ser tratada como um simples problema de "manipulação de strings". A abordagem padrão para lidar com contexto em sistemas de agentes hoje continua a ser enfiar tudo no prompt. Mais história, mais tokens, mais confusão. A maioria das equipas trata o contexto como um problema de concatenação de strings. Mas os despejos de contexto bruto criam três falhas críticas: > explosão de custos devido a informações repetitivas > degradação de desempenho devido a efeitos de "perdido no meio" > aumento nas taxas de alucinação quando os agentes atribuem erroneamente ações em um sistema A gestão de contexto torna-se uma preocupação arquitetônica ao lado do armazenamento e computação. Isso significa que transformações explícitas substituem a concatenação de strings ad-hoc. Os agentes recebem o contexto mínimo necessário por padrão e solicitam explicitamente informações adicionais através de ferramentas. Parece que o Kit de Desenvolvimento de Agentes do Google está realmente pensando profundamente sobre a gestão de contexto. Ele introduz uma arquitetura em camadas que trata o contexto como "uma visão compilada sobre um sistema com estado" em vez de uma atividade de enchimento de prompt. Como isso se parece? 1) Estrutura: O Modelo em Camadas A estrutura separa o armazenamento da apresentação em quatro camadas distintas: 1) O Contexto de Trabalho lida com visões efémeras por invocação. 2) A Sessão mantém o log de eventos durável, capturando cada mensagem, chamada de ferramenta e sinal de controle. 3) A Memória fornece conhecimento pesquisável e de longa duração que sobrevive a sessões únicas. 4) Os Artefatos gerenciam grandes dados binários através de referências versionadas em vez de incorporação inline. Como a compilação de contexto realmente funciona? Funciona através de Fluxos LLM ordenados com processadores explícitos. Um processador de conteúdos realiza três operações: seleção filtra eventos irrelevantes, transformação achata eventos em objetos de Conteúdo devidamente classificados, e injeção escreve a história formatada na solicitação LLM. O processador de conteúdos é essencialmente a ponte entre uma sessão e o contexto de trabalho. A arquitetura implementa cache de prefixo dividindo o contexto em prefixos estáveis (instruções, identidade, resumos) e sufixos variáveis (últimas interações, saídas de ferramentas). Além disso, um primitivo static_instruction garante imutabilidade para prompts do sistema, preservando a validade do cache entre invocações. 2) Gestão Agente do Que Importa Agora Uma vez que você descobre a estrutura, o desafio central torna-se a relevância. Você precisa descobrir o que pertence à janela ativa agora. O ADK responde a isso através da colaboração entre a arquitetura definida por humanos e a tomada de decisão agente. Os engenheiros definem onde os dados residem e como são resumidos. Os agentes decidem dinamicamente quando "alcançar" blocos de memória ou artefatos específicos. Para grandes cargas, o ADK aplica um padrão de manuseio. Um CSV de 5MB ou uma resposta JSON massiva reside no armazenamento de artefatos, não no prompt. Os agentes veem apenas referências leves por padrão. Quando dados brutos são necessários, eles chamam LoadArtifactsTool para expansão temporária. Uma vez que a tarefa é concluída, o artefato é descarregado. Isso transforma o imposto de contexto permanente em acesso preciso e sob demanda. Para conhecimento de longo prazo, o MemoryService fornece dois padrões de recuperação: 1) Recordação reativa: os agentes reconhecem lacunas de conhecimento e buscam explicitamente no corpus. 2) Recordação proativa: pré-processadores executam busca de similaridade na entrada do usuário, injetando trechos relevantes antes da invocação do modelo. Os agentes recordam exatamente os trechos necessários para o passo atual em vez de carregar toda a conversa que já tiveram. Tudo isso me lembra a abordagem em camadas das Claude Skills, que melhora o uso eficiente do contexto no Claude Code. 3) Contexto Multi-agente Sistemas de agente único sofrem de inchaço de contexto. Ao construir multi-agentes, esse problema se amplifica ainda mais, o que facilmente leva à "explosão de contexto" à medida que você incorpora mais sub-agentes. Para que a coordenação multi-agente funcione de forma eficaz, o ADK fornece dois padrões. Agentes-como-ferramentas tratam agentes especializados como chamáveis que recebem prompts focados sem uma história ancestral. Transferência de Agente, que permite transferências de controle total onde sub-agentes herdam visões de sessão. O parâmetro include_contents controla o fluxo de contexto, padrão para todo o contexto de trabalho ou fornecendo apenas o novo prompt. O que previne alucinações durante as transferências de agentes? A solução é a tradução de conversas. Mensagens anteriores do Assistente se convertem em contexto narrativo com tags de atribuição. Chamadas de ferramentas de outros agentes são explicitamente marcadas. Cada agente assume o papel de Assistente sem atribuir erroneamente a história mais ampla do sistema a si mesmo. Por fim, você não precisa usar o Google ADK para aplicar esses insights. Acredito que isso pode ser aplicado em toda a linha ao construir sistemas multi-agente. (imagem cortesia de nano banana pro)

Top

Classificação

Favoritos