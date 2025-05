"Quando dou aula, costumo brincar que 'guard rail' em LLM é igual você estar no pé de uma serra, enquanto desce um trem sem freio e carregado de minério. Você está no trilho apenas com um graveto apontado para o trem falando assim: 'Ele vai parar, ele tá me vendo, ele não é doido'. É muito poder computacional para conseguir segurar com uma regra, ainda mais porque você tem que prever todas as regras"

Tiago Torrent

Os pesquisadores não querem só esfregar na cara das empresas que elas estão falhando em impedir as IAs de replicar preconceito —ainda que indiretamente tenham feito isso. O objetivo deles é fazer do dataset do que "há de pior na humanidade" um dos vários benchmarks com que as IAs são avaliadas. Assim, as empresas poderiam usá-lo para testar se suas IAs são civilizadas, da mesma forma que usam outras ferramentas similares para averiguar o nível de especialização em tradução ou cálculo de seus modelos.

No entanto, o uso do dataset é vedado para treinamento, por motivos óbvios. O artigo foi apresentado Conferência Anual da Associação de Linguísticas Computacionais dos EUA no começo de maio.

Há, no entanto, uma esperança. Torrent usou o dataset para testar o Sabiá, modelo de IA da brasileira Maritaca. E a ferramenta se saiu bem. Não embarcou nos estereótipos e ainda apontou qual era o problema deles. E, ainda assim, cumpriu as tarefas propostas pelos interlocutores, como elaborar projetos de pesquisa.

Após conversar com executivos do Maritaca, Torrent concluiu que o bom desempenho ocorreu porque o Sabiá foi treinado com material acadêmico, jornalístico e educacional. Ou seja, passou longe das mídias sociais.