Em alguns anos, a companhia desenvolveu diversos produtos a partir disso. O primeiro uso reconhecido no entretenimento veio em 2020, quando foi lançado o episódio de "The Mandalorian" com a participação de Luke Skywalker, o protagonista do universo de "Star Wars" na tela grande. Como o ator Mark Hamill já contava com 68 anos enquanto o personagem ainda deveria estar na casa dos 20 e poucos, foi necessário usar computação gráfica para rejuvenescer o seu rosto —enquanto a companhia ucraniana ficou responsável por sintetizar o timbre original do guerreiro Jedi. Tudo, na época, devidamente creditado.

Nos anos seguintes, a tecnologia foi adotada em filmes, séries e muitos comerciais de TV. Hoje, a IA pode ser aplicada em escala industrial, estando acessível para qualquer um. Em sua página, a Respeecher vende assinaturas e pacotes de serviços a partir de US$ 1 (R$ 5,7) por minuto gerado. Entre as aplicações indicadas estão a recriação da identidade vocal de quem já faleceu, a dublagem, o ajuste para jovens atores em fase de mudança vocal e até o auxílio para que não-atores, como atletas em propagandas, soem mais naturais.

A IA "brutalista"

No caso de "O Brutalista", o editor do filme, Dávid Jancsó, fez a revelação do uso da IA em uma entrevista ao site RedSharkNews. De acordo com ele, que também está indicado ao Oscar pelo longa-metragem, foi uma necessidade imposta pelo sotaque dos atores norte-americanos nas cenas com diálogos na língua nativa dos personagens protagonistas —a história é baseada na vida de László Tóth, um arquiteto judeu da Hungria que sobreviveu ao Holocausto durante a Segunda Guerra Mundial e emigrou para os Estados Unidos.

"Sou falante nativo de húngaro e sei que é uma das línguas mais difíceis de aprender a pronunciar. Mesmo com a origem húngara de Adrien [a mãe de Brody, intérprete do personagem principal, é uma refugiada que emigrou daquele país para os EUA em 1956], não é tão simples", contou Jancsó. "Nós treinamos [também a atriz coadjuvante, Felicity Jones] e eles fizeram um trabalho fabuloso, mas também queríamos aperfeiçoá-lo para que nem mesmo os locais notassem qualquer diferença."

É habitual a realização de ajustes nas vozes na pós-produção. A dublagem é aplicada por cima de áudios que não foram bem captados durante a filmagem, ou para trocar o texto das falas. Na indústria, isso é chamado de Automated Dialogue Replacement (ADR), ou substituição automatizada de diálogo, em português. Mesmo assim, isso não foi o suficiente para alcançar o nível de qualidade pretendido pelos cineastas. "Primeiro tentamos fazer ADR desses elementos mais difíceis com os atores. Depois tentamos fazer o ADR deles com outros intérpretes, mas isso não funcionou. Então, procuramos outras opções", revelou um sincero Jancsó.