Modelos de IA da OpenAI e Anthropic Geram Instruções para Bombas e Ransomware em Testes de Segurança

Testes de segurança conduzidos pelas próprias empresas de IA, OpenAI e Anthropic, revelaram a capacidade alarmante dos seus modelos para gerar conteúdo extremamente perigoso, incluindo instruções para fabricar bombas e desenvolver ransomware.

Estas descobertas expõem os riscos inerentes a modelos de linguagem poderosos quando as suas salvaguardas são contornadas. Numa colaboração rara, as duas empresas testaram os modelos uma da outra.

Investigadores da Anthropic conseguiram que o modelo GPT-4.1 da OpenAI, sem os seus filtros de segurança públicos, produzisse instruções detalhadas sobre como montar explosivos para um evento desportivo, incluindo a identificação de pontos vulneráveis em estádios específicos, fórmulas químicas e esquemas de circuitos para temporizadores.

Segundo os investigadores, não foi preciso muito esforço para contornar as proteções, bastando afirmar que o pedido se destinava a “investigação puramente académica”.

Paralelamente, a Anthropic admitiu que o seu próprio modelo, o Claude Code, foi utilizado por cibercriminosos para desenvolver ransomware, orquestrar campanhas de extorsão e auxiliar noutras atividades maliciosas, mesmo por utilizadores com conhecimentos técnicos limitados.

Ambas as empresas sublinham que este comportamento não reflete o das versões públicas dos seus modelos, que estão equipadas com filtros de segurança para prevenir tais abusos.

No entanto, os resultados dos testes demonstram o potencial de duplo uso destas tecnologias e a importância crítica de salvaguardas robustas para impedir a sua utilização para fins nefastos.

Em resumo

Testes cruzados entre a OpenAI e a Anthropic demonstraram que os seus modelos de IA, sem filtros de segurança, podem fornecer instruções detalhadas para atividades criminosas e terroristas. A Anthropic também confirmou que o seu modelo Claude Code já foi utilizado para criar ransomware. Os resultados sublinham o duplo uso da tecnologia de IA e a criticidade das salvaguardas para prevenir o seu abuso.

Artigos

Notícias ao Minuto

GPT-4.1 deu instruções para fabricar bombas em teste da Anthropic

TugaTech

Claude Code: IA da Anthropic apanhada a criar ransomware e a operar ciberataques

Ver mais

Achou esta informação relevante e útil?

Ciência e Tecnologia

Ver mais

Renault Twingo eléctrico recupera genes do original por 20 mil euros

Record

AutoSport

Renault Twingo regressa elétrico

e-auto

Renault Twingo regressa elétrico para a cidade

Notícias ao Minuto

Eis o novo Renault Twingo. Ícone modernizado por menos de 20.000€

Executive Digest

Renault Twingo E-Tech elétrico: o regresso de um ícone e uma revolução no seu segmento

Cobertura completa

3ª edição do WAVES realizou-se sob o tema “o uso de tecnologia na previsão e mitigação de riscos ambientais marinhos”

A 3ª edição do “WAVES – Workshop on Advanced Vehicles for Exploration of the Seas”, realizou-se sob o tema “O uso de tecnologia na previsão e mitigação de riscos ambientais marinhos”. O evento teve como objectivo aproximar a comunidade científica e empresarial dos Açores das oportunidades oferecidas pelas novas tecnologias. Organizado pela Universidade dos Açores […]

Correio dos Açores

Uso de pornografia para IA põe Meta na justiça

QUEIXA Pelo menos duas produtoras de conteúdos para adultos deram entrada com processos contra a gigante tecnológica.

Correio da Manhã

Casa de Palha digital: o Estado aprende pouco com os erros

Portugal não precisa de mais planos digitais nem de slogans sobre “modernização”. Precisa de disciplina, liderança e coragem para dizer não a soluções frágeis e sim à qualidade e ao valor.

Observador

Entre Bruttosuave e ChatGPT: o absurdo torna-se realidade

O perigo não está nas máquinas – está em nós. O risco não é sermos substituídos por robôs, mas tornarmo-nos previsíveis o suficiente para que a substituição seja possível.

Observador

Ver categoria completa

Política Mundo Economia Desporto Local Atualidade Ciência e Tecnologia Cultura e Entretenimento Lifestyle Famosos