Para mitigar este risco, a Google adotou uma abordagem de defesa em várias camadas.

Esta estratégia combina mecanismos deterministas com controlos baseados em IA, utilizando técnicas como o 'spotlighting', que ensina o modelo a priorizar as instruções do utilizador sobre o conteúdo da página.

Adicionalmente, foi introduzido um segundo modelo de IA, denominado 'User Alignment Criti', que atua como um supervisor de confiança.

A sua função é rever e vetar as ações propostas pelo agente principal antes da sua execução, garantindo que estão alinhadas com o objetivo inicial do utilizador.

Este componente de verificação tem acesso limitado ao conteúdo web para minimizar a sua própria superfície de ataque. A Google estendeu também os princípios de segurança do navegador, como o isolamento entre sites, ao contexto dos agentes e implementou um classificador específico que analisa as páginas em tempo real para detetar tentativas de injeção, reforçando a proteção do utilizador.