Tecnologia

OpenAI admite vulnerabilidade contra cibertaques ao seu navegador de IA Atlas

Empresa reconhece que falha estrutural em agentes autônomos “pode nunca ser resolvida” e aposta em testes automatizados para reduzir riscos no ChatGPT Atlas

Avatar de Exame.com
Exame.com
23/12/2025, 15:14 • Atualizado em 23/12/2025, 15:14
compartilhar
ChatGPT Atlas | Reprodução/Exame.com

ChatGPT Atlas | Reprodução/Exame.com

Mesmo ao reforçar as defesas do ChatGPT Atlas, a OpenAI admite que ataques conhecidos como prompt injection, técnica que manipula agentes de IA a seguir instruções maliciosas ocultas em textos, continuam sendo um risco estrutural para navegadores baseados em inteligência artificial.

SBT News Logo

Acompanhe o SBT News nas TVs por assinatura Claro (586), Vivo (576), Sky (580) e Oi (175), via streaming pelo +SBT, Site e YouTube, além dos canais nas Smart TVs Samsung e LG.

Siga no Google Discover

Em post publicado na segunda-feira, 22, a empresa afirmou que esse tipo de ataque, semelhante a golpes e engenharia social na web, “é improvável que seja totalmente resolvido”. Segundo a OpenAI, o chamado agent mode, modo em que a IA executa tarefas de forma mais autônoma, “amplia a superfície de ameaças de segurança”.

O ChatGPT Atlas foi lançado em outubro e rapidamente passou a ser testado por pesquisadores de segurança. No mesmo dia do lançamento, especialistas demonstraram que poucos comandos inseridos em documentos do Google eram suficientes para alterar o comportamento do navegador. A empresa Brave, concorrente no setor, publicou análise semelhante, apontando que a injeção indireta de comandos é um problema sistêmico também em produtos como o Comet, da Perplexity.

O alerta não é exclusivo do setor privado. O National Cyber Security Centre, órgão do governo do Reino Unido, afirmou neste mês que ataques por prompt injection contra aplicações de IA generativa “podem nunca ser totalmente mitigados”, recomendando que empresas foquem em reduzir impacto e exposição, e não em eliminar o risco.

Para a OpenAI, a resposta passa por um ciclo contínuo de testes e correções rápidas. A empresa diz tratar o problema como um desafio de longo prazo e afirma já observar resultados iniciais com essa estratégia.

IA treinada para atacar a própria IA

A principal novidade apresentada pela OpenAI é o uso de um atacante automatizado baseado em LLM, sigla para large language model, modelo de linguagem de grande escala. Trata-se de uma IA treinada com reinforcement learning, técnica de aprendizado por reforço, para simular o comportamento de um invasor e encontrar novas formas de explorar agentes autônomos.

Esse sistema testa ataques em ambiente simulado, analisa como o agente-alvo “pensaria” e ajusta as estratégias repetidamente. Segundo a OpenAI, o método permitiu identificar ataques sofisticados, com dezenas de etapas, que não haviam surgido em testes humanos ou relatórios externos.

Em uma demonstração, a empresa mostrou um e-mail malicioso inserido na caixa de entrada do usuário. Ao analisá-lo, o agente foi induzido a enviar uma mensagem de demissão em vez de redigir uma resposta automática. Após atualizações de segurança, o sistema passou a detectar e sinalizar esse tipo de tentativa ao usuário.

Apesar disso, a OpenAI não divulgou dados que comprovem uma redução mensurável no sucesso desses ataques. Um porta-voz afirmou apenas que a empresa trabalha com terceiros para reforçar a segurança do Atlas desde antes do lançamento.

A OpenAI recomenda limitar permissões, exigir confirmações antes de ações críticas e fornecer instruções específicas aos agentes. Dar “carta branca”, segundo a empresa, facilita a influência de conteúdos ocultos ou maliciosos, mesmo com salvaguardas.

Leia mais

Ver tudo
Imagem da notícia: Lula cutuca Ciro Gomes e pede a Elmano jogo limpo na eleição

Lula cutuca Ciro Gomes e pede a Elmano jogo limpo na eleição

Imagem da notícia: Mega-Sena 3.026: prêmio acumula para R$ 33 milhões

Mega-Sena 3.026: prêmio acumula para R$ 33 milhões

Imagem da notícia: Bolsonaro: defesa rejeita 'falta grave' e pede domiciliar

Bolsonaro: defesa rejeita 'falta grave' e pede domiciliar

Imagem da notícia: Caso Gisele: Justiça adia interrogatório de tenente-coronel

Caso Gisele: Justiça adia interrogatório de tenente-coronel

Imagem da notícia: Lula cutuca Ciro Gomes e pede a Elmano jogo limpo na eleição

Lula cutuca Ciro Gomes e pede a Elmano jogo limpo na eleição

Imagem da notícia: Mega-Sena 3.026: prêmio acumula para R$ 33 milhões

Mega-Sena 3.026: prêmio acumula para R$ 33 milhões

Imagem da notícia: Bolsonaro: defesa rejeita 'falta grave' e pede domiciliar

Bolsonaro: defesa rejeita 'falta grave' e pede domiciliar

Imagem da notícia: Caso Gisele: Justiça adia interrogatório de tenente-coronel

Caso Gisele: Justiça adia interrogatório de tenente-coronel

Últimas notícias

Casal que escalou o Empire State é indiciado por oito crimes

Angelina Nikolau e Ivan Kuznetsov estenderam uma bandeira com uma mensagem de amor antes de protagonizar um pedido de casamento no topo do edifício

OMS declara fim de surto de hantavírus relacionado a navio

Organização afirma que não há mais risco de transmissão após monitoramento de passageiros e contatos por 42 dias

Mendonça pede esclarecimentos sobre doações em ano eleitoral

Governo e Congresso terão cinco dias para explicar dispositivo da LDO que libera determinadas doações públicas durante o período

Brasil apresenta plano aos EUA, mas tarifaço ainda preocupa

Documento enviado hoje ao USTR amplia garantias sobre políticas investigadas; PIX e temas políticos ficaram fora das negociações

Funeral de Ali Khamenei começa 4 meses após a morte

Clérigos no poder no Irã vêm preparando dias de cerimônias fúnebres em massa para aiatolá morto por ataques dos EUA e de Israel

Uso da internet sobe para 90,5% e se aproxima de meta

A meta do governo federal é que 95% da população brasileira acesse a internet até 2030