Topo

Tradutor de línguas antigas: algoritmo consegue decifrar idiomas esquecidos

Cientistas conseguiram identificar detalhes de línguas antigas com inteligência artificial - sompong_tom/Getty Images/iStockphoto
Cientistas conseguiram identificar detalhes de línguas antigas com inteligência artificial Imagem: sompong_tom/Getty Images/iStockphoto

Camila Corsini

Colaboração para Tilt

16/11/2020 04h00

Pesquisas recentes indicam que a maioria das línguas que já existiram não é mais falada. Agora, imagine conseguir decifrar algumas delas? Foi isso o que pesquisadores do MIT (Instituto de Tecnologia de Massachusetts), nos Estados Unidos, fizeram usando inteligência artificial.

Os pesquisadores da universidade começaram o desafio tentando traduzir registros específicos encontrados há muito tempo por historiadores, mas que ninguém havia conseguido entender pela dificuldade linguística, já que muitas línguas são consideradas indecifráveis por não terem gramática, vocabulário ou sintaxe compreensíveis.

Os resultados dessas observações envolveram a descoberta de palavras pertencentes a um idioma totalmente desconhecido vinculadas a termos equivalentes em línguas atuais. O mecanismo usado não funcionou exatamente como um "Google Tradutor" avançado, que traduz facilmente textos, mas conseguiu identifica a raiz desses idiomas antigas.

A equipe descobriu padrões de linguagem usando um algoritmo capaz de decifrar mudanças previsíveis na evolução das línguas. Um exemplo: uma palavra escrita com "p" no idioma de origem pode até mudar para "b" em uma possível evolução, mas é muito difícil que a letra seja substituída por um "k" por conta da diferença na pronúncia.

A inteligência artificial conseguiu então descobrir com precisão uma família linguística do Ibérico. O idioma era falado por povos indígenas da Europa Ocidental desde, mais ou menos, do século XII até o I a.C. De acordo com o estudo, o Ibérico talvez não esteja relacionado com o basco, que é o que apontam estudos recentes.

A equipe usou o algoritmo considerando o basco como uma possível "língua familiar" e outras prováveis— de famílias românicas, alemãs, turcas e urálicas. Ainda que o resultado tenha apontado o basco e o latim como próximos, ainda eram muito diferentes para ser considerados familiares.

Os pesquisadores agora esperam usar o mecanismo para decifrar outros idiomas perdidos há muito tempo. No futuro, a ideia é expandir o trabalho para identificar o significado semântico das palavras mesmo que não seja possível lê-las.