OpenAI declara guerra ao Google com navegador de IA, mas já tem 1ª derrota

Após semanas de especulação, a OpenAI finalmente lançou o Atlas, um browser com a promessa de transportar a navegação da internet para a era da inteligência artificial. Cumprir esse objetivo exigirá que a dona do ChatGPT passe por cima do Chrome, o navegador do Google usado por mais de 70% de quem se conecta, seja por computador ou smartphone.

Antes de subir ao ringue para ter sua chance —Safari (Apple), Edge (Microsoft), Firefox (Mozilla) e Opera estão nessa fila há anos—, o Atlas já lida com sua primeira derrota, um problema existencial que nenhum outro rival de peso tem: comandos ocultos em sites podem fazer informações compartilhadas apenas com o chat irem parar na mão de gente mal intencionada.

O que rolou?

Imagem

O Atlas coloca o ChatGPT no centro da experiência de um navegador, porque:

  • Logo de cara, quem abre o novo navegador vê um chat para conversar com a IA. Nada de barra de pesquisa na internet. Não é só para afastar qualquer memória do Google, mas para deixar claro de imediato a mudança de dinâmica, pois...
  • ... Os comandos básicos passam a ser os prompts, ou seja, as instruções em forma de texto dadas à IA. Por meio deles, você pode mandar o Atlas...
  • ... Abrir abas para exibir os sites que escolher -e também fechá-las; analisar informações exibidas em uma página ("mostre quais são as cinco notícias mais lidas do UOL e explique qual a relação entre elas"); acessar o histórico de navegação por meio de uma conversa contextual ("hey, chat, onde foi mesmo que eu vi aquele tênis de corrida preto e com amortecimento reforçado?") e agir sobre atividades executadas dentro do navegador (sugerir novas formas de escrever um email ou inspecionar documentos). Só que...
  • ... Tudo isso funciona melhor ao ativar o ChatGPT em uma barra lateral e pedir para ele atuar sobre o site aberto no navegador, como um assistente de navegação. Por outro lado...
  • ... Ainda que a OpenAI queira convencer usuários de internet que o prompt é o novo modo de interagir com a internet e com as funções básicas de um navegador, testes feitos por Radar Big Tech mostram que...
  • ... O Atlas escorrega para compreender instruções básicas ("abra em novas abas os sites sugeridos") e...
  • ... Oferece um número limitado de interações no chat para planos gratuitos. A cada 5 horas, o modelo mais avançado, o GPT-5, responde a dez mensagens. Depois, entra em cena o GPT-4, que dá conta de 40 mensagens a cada 3 horas. A cada downgrade, surge um aviso de que a complexidade das ações que você pode fazer diminui...
  • ... Seria ok, caso o objetivo final fosse mandar o ChatGPT gerar seja lá qual conteúdo, o que exigiria construir um prompt detalhado para evitar duplas interpretações. Mas não é. No Atlas, o prompt é só o meio do caminho para ditar interações do chat com outros serviços. Só que...
  • ... Como essa fricção é sentida com menos intensidade por assinantes do ChatGPT, cuja mensalidade custa a partir de US$ 20 (algo como R$ 110), cria-se a insólita situação de ter que pagar para usar um navegador de forma plena e fluida. Isso quando a regra no segmento é a gratuidade.

Por que é importante?

Imagem
Imagem: Dado Ruvic/Reuters

Nenhum produto nasce pronto. E os entraves descritos acima são consequências naturais de criar um serviço que tenta apontar para algo diferente do que se tem feito —browsers convencionais funcionam da mesma forma há décadas.

Os navegadores com IA generativa, no entanto, possuem sua própria ladeira para subir: são as chamadas "injeções de prompt". Modelos de inteligência artificial generativa penam para diferenciar o prompt escrito por um usuário de regras criadas por desenvolvedores e inseridas em sites analisados. Sabendo disso, pessoas mal intencionadas podem incluir numa página instruções —a tal da "injeção de prompt"— para a IA se comportar de maneira inesperada. Na mão de cibercriminosos, a brecha é um prato cheio.

Continua após a publicidade

No mesmo dia em que o Atlas foi lançado, a equipe de cibersegurança do Brave, um concorrente da nova leva de browsers com IA, soltou um relatório com nova descoberta: capturas de tela ou a simples navegação do site podem conter "injeções de prompt" caso sejam inseridas nos chatbots de IA. A análise vale para Comet, da Perplexity, e o Fellou, mas os pesquisadores afirmam ter feito descobertas parecidas para um novo navegador.

A injeção indireta de prompts não é um problema isolado, mas um desafio sistêmico enfrentado por toda a categoria de navegadores com IA
Artem Chaikin, engenheiro sênior de Segurança Móvel da Brave, e Shivan Kaul Sahib, vice-presidente de Privacidade e Segurança da Brave

Não é dor de cotovelo de um concorrente distante. Outros especialistas demonstraram que o Atlas não está livre de cair nessa e até a própria OpenAI classifica esses ataques como "risco emergente".

Um risco emergente que estamos pesquisando e mitigando cuidadosamente são as 'injeções de prompt', em que invasores ocultam instruções maliciosas em sites, e-mails ou outras fontes, para tentar induzir o agente a se comportar de maneira indesejada. O objetivo dos invasores pode ser tão simples quanto tentar influenciar a opinião do agente durante uma compra ou tão significativa quanto tentar fazer o agente vazar dados privados, como informações confidenciais do seu e-mail ou credenciais (...) A 'injeção de prompt' continua sendo um problema de segurança incipiente e não resolvido, e nossos adversários investirão tempo e recursos significativos para encontrar maneiras de fazer o agente ChatGPT cair nesses ataques
Dane Stuckey, diretor de segurança da informação da OpenAI

Não é bem assim, mas tá quase lá

Imagem
Continua após a publicidade

Para contornar não só "injeções de prompts", mas outros problemas que possam atingir os agentes de IA do Atlas, Stuckey diz que a OpenAI está tomando diversas ações como identificar e derrubar campanhas de ataques e investir na infraestrutura para prevenir golpes assim. A empresa, acrescenta ele, também oferecer controles para impedir o Atlas de acessar credenciais do usuário durante situações em que age em nome da pessoa ("modo desconectado") ou para o agente de IA requerer atenção humana quando a navegação é feita por um site sensível ("modo de observação").

A mensagem de Stuckey evidencia ainda dois detalhes dos planos da OpenAI:

  • Foco é transformar todo navegador em um agente de IA, um modelo de uso em que a máquina toma decisões em nome do usuário ("No Atlas, o agente do ChatGPT pode fazer tudo por você"). Ainda assim, o diretor admite que falhas em ocasiões bem desagradáveis podem ocorrer ("O agente ChatGPT é poderoso e útil, e projetado para ser seguro, mas ainda pode cometer erros (às vezes surpreendentes!), como tentar comprar o produto errado ou esquecer de entrar em contato com você antes de realizar uma ação importante"). Bom lembrar: no Atlas, os agentes de IA são ativados só para usuários pagantes.
  • Aposta no Atlas é de longo prazo ("Nosso objetivo a longo prazo é que você possa confiar no agente ChatGPT para usar seu navegador, da mesma forma que confiaria em seu colega ou amigo mais competente, confiável e atento à segurança."). Para bom entendedor, a mensagem não poderia ser mais clara: talvez seja bom esperar esse dia chegar.

Okay, "injeções de prompts" são um risco existencial para IAs generativas. Mas até agora os danos aos usuários configuram apenas uma possibilidade, já que não foram identificadas campanhas massivas que explorem a brecha.

Os incentivos para cibercriminosos eram baixos, já que chatbots de IA, ainda que expostos à falha, não saiam por aí inspecionando páginas da web. E os browsers Comet, da Perplexity, e o Fellou possuem bases pequenas de membros.

No entanto, a entrada da OpenAI no mundo dos navegadores muda as coisas. Com 800 milhões de usuários do ChatGPT, todos potenciais adeptos do Atlas, a empresa acaba de dar a criminosos cibernéticos centenas de milhões de motivos para pensar.

Continua após a publicidade

DEU TILT

Toda semana, Diogo Cortiz e Helton Simões Gomes conversam sobre as tecnologias que movimentam os humanos por trás das máquinas. O programa é publicado às terças-feiras no YouTube do UOL e nas plataformas de áudio. Assista ao episódio da semana completo.

TEVE TAMBÉM EM RADAR BIG TECH

Deu Tilt #1
IA supera carteira de ações de banco e vira chamariz de corretora picareta Leia mais

Deu Tilt #2
Como o ChatGPT quer desbancar Android e iOS e ser 'cérebro' do seu celular Leia mais

Continua após a publicidade

Deu Tilt #3
Como Zuckerberg quer fazer IA do Facebook escolher seu próximo crush Leia mais

Carlos Affonso de Souza
'Nuvem é chão de fábrica': como pane na Amazon realça internet invisível Leia mais

Diogo Cortiz
Carta pede pausa no avanço da IA por risco à espécie humana. É para temer? Leia mais

Apagão da Amazon #1
O que é o AWS e por que uma falha derrubou mais de 500 apps pelo mundo Leia mais

Apagão da Amazon #2
Só 3 empresas controlam 63% da nuvem: qual o perigo disso? Leia mais

Apagão da Amazon #3
Como um bug 'apagou' o banco de dados da nuvem da Amazon e parou tudo Leia mais

Continua após a publicidade

Rivalidade #1
Sam Sung: Apple tirou crachá de funcionário depois que nome dele viralizou Leia mais

Rivalidade #2
Fortnite está de volta, mas Apple abre novo capítulo na briga com a Epic Leia mais

Era da IA #1
Agentes de IA não funcionam como o prometido, diz fundador da OpenAI Leia mais

Era da IA #2
Meta demite 600 pessoas em time de IA: 'Menos burocracia, mais eficiência' Leia mais

Lei
UE acusa Meta e TikTok de violar Lei de Transparência; multa pode ser de 6% Leia mais

Deixe seu comentário

O autor da mensagem, e não o UOL, é o responsável pelo comentário. Leia as Regras de Uso do UOL.