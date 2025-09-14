Por que a IA precisa aprender a dizer 'não sei'
Dizer 'não sei' é um gesto raro. Nós, humanos, detestamos admitir a nossa própria ignorância. Pode ser em uma conversa de bar ou em um debate acadêmico, diante de uma pergunta difícil, não é raro alguém arriscar uma resposta do que simplesmente assumir que não sabe.
A psicologia tem até um nome para isso. O chamado efeito Dunning-Kruger, popular nas redes sociais, mostra a tendência de superestimamos nossa capacidade, acreditando saber mais do que realmente sabemos. O mais interessante é que essa dificuldade em lidar com a incerteza não é apenas nossa, mas se tornou um dos maiores desafios para a Inteligência Artificial.
Quantas vezes você perguntou algo para o ChatGPT e ele respondeu que não sabia? Isso é bem raro. O mais comum é o modelo gerar alguma resposta, ainda que possa estar errada. Quando isso acontece, dizemos que o modelo "alucinou". O termo é mesmo curioso, e muitas pessoas já me perguntaram a origem: "Diogo, por que não dizemos simplesmente que a IA errou? Por que a comunidade técnica usa o termo alucinação?".
A resposta está no próprio mecanismo de funcionamento desse tipo de IA. Chatbots conversacionais como o ChatGPT, Gemini e outros são chamados de modelos de linguagem. Esse tipo de IA trabalha com a distribuição de probabilidades de uma sequência de palavras. Isso significa que, ao pedirmos para a IA escrever um poema, uma carta de recomendação ou responder a uma pergunta complexa, o modelo encaixa uma palavra após a outra, seguindo as melhores probabilidades, até construir a resposta.
Então, quando a IA afirma que Senna morreu em Interlagos, como relatou o colunista do UOL Flávio Gomes, podemos entender que, naquele contexto, fazia sentido, pelo menos do ponto de vista estatístico, escrever dessa forma. Afinal, quantos textos usados no treinamento do modelo não traziam as palavras Senna e Interlagos lado a lado?
Do ponto de vista técnico, a IA operou como deveria: encaixou as palavras com mais probabilidades. Não houve um erro de funcionamento, e é por isso que a comunidade científica passou a usar o termo "alucinação". E, no nosso caso, só sabemos que a informação está incorreta porque conhecemos o mundo de outra forma e temos conhecimento sobre o assunto.
Este é um dos pontos mais críticos do uso indiscriminado da IA. Em todas as minhas aulas e palestras, costumo alertar: "o problema da IA não é apenas estar errada. É estar errada e ainda nos convencer de que está certa". A IA não diz "acho que é isso", ou "não tenho certeza". Ela afirma. E pode errar com convicção.
É fácil perceber o erro quando a IA diz que Senna morreu em Interlagos. Mas e quando estamos fazendo uma pergunta justamente por que não temos conhecimento sobre o assunto? Como saber se IA está dando uma resposta correta ou estamos diante de uma alucinação?
E quando somamos a pressa à preguiça humana, o estrago está feito. Pessoas que não questionam a máquina acabam repassando conteúdos errados. A situação é tão séria que já invadiu até a ciência: hoje existem inúmeros artigos científicos retratados por terem usado referências alucinadas pela IA.
Ainda bem que alguns passos já estão sendo dados para mitigar esse problema. Pesquisas começam a lançar luz sobre as causas das alucinações, e a OpenAI, criadora do ChatGPT, acaba de publicar um artigo destacando alguns dos motivos que levam os modelos a alucinar.
A causa raiz está na forma como treinamos e avaliamos esses sistemas de IA. Atualmente, a maioria dos testes recompensa a precisão - quantas respostas estão certas - sem considerar se o modelo estava confiante ou simplesmente chutou.
É algo parecido como acontece conosco, humanos. Quando não sabemos a resposta de uma questão em um teste, muitas vezes preferimos chutar, na esperança de ganhar alguns pontos. Deixar em branco ou dizer 'não sei' geralmente vale zero - pelo menos nas formas mais comuns de avaliação. Seguindo essa mesma estratégia, os modelos de IA aprendem a arriscar respostas mesmo sem ter certeza
A OpenAI propõe mudar essa lógica. Em vez de premiar apenas respostas corretas, os testes deveriam também valorizar a honestidade: dar pontos para respostas como "não sei" e penalizar os erros confiantes. Na avaliação de humanos já existem estratégias semelhantes, como em provas de concursos públicos que descontam pontos de respostas erradas, na perspectiva de que isso diminua a probabilidade de chutes.
Ao contrário do que muitos imaginavam, o caminho para reduzir as alucinações não passa apenas por tornar as IAs mais inteligentes, mas também mais humildes. Em muitos casos, é melhor - e mais seguro - que uma IA diga "não sei" do que arrisque uma resposta.
Vamos precisar ensinar a IA a saber quando não se sabe. Talvez seja a oportunidade da humanidade também aprender a valorizar o poder do "não sei".
