Para mitigar este risco, a Google implementou uma defesa em várias camadas.

A primeira utiliza técnicas como o "spotlighting", que treina o modelo principal a dar prioridade às instruções do utilizador em detrimento do conteúdo da página.

A camada mais inovadora, no entanto, é a introdução de um segundo modelo de IA, denominado "User Alignment Critic". Este componente de alta confiança atua como um revisor, analisando as ações propostas pelo agente principal antes de serem executadas.

Se uma ação for considerada desalinhada com o objetivo inicial do utilizador, é vetada.

Este sistema foi desenhado para ter acesso limitado ao conteúdo da página, reduzindo a sua própria superfície de ataque.

Esta arquitetura de segurança estende os princípios clássicos de isolamento do navegador ao novo paradigma da IA, garantindo que o poder dos agentes autónomos não compromete a segurança do utilizador.