Topo

Carlos Affonso Souza

OPINIÃO

Texto em que o autor apresenta e defende suas ideias e opiniões, a partir da interpretação de fatos e dados.

Como Japão liberou conteúdo protegido por direito autoral para treinar IA

Goku em cena de "Dragon Ball Super": criadores e empresas envolvidas na indústria de anime e mangá criticaram a medida - Reprodução
Goku em cena de "Dragon Ball Super": criadores e empresas envolvidas na indústria de anime e mangá criticaram a medida Imagem: Reprodução

13/06/2023 04h00

Receba os novos posts desta coluna no seu e-mail

Email inválido

Direitos autorais servem para estimular a criação de obras culturais, como livros, fotos, músicas e filmes. Eles fazem isso dando uma exclusividade para que o autor (ou o titular desses direitos) possa por um certo tempo decidir como a obra pode ser utilizada.

Existem exceções a essa regra, que variam de país a país. Recentemente, com a popularização das ferramentas de inteligência artificial (IA), surgiu a questão:

  • Podem essas aplicações usar obras alheias (como imagens e textos protegidos por direitos autorais) para aprendizado de máquina?

No coração de toda aplicação de IA generativa está a base de dados que é analisada para criar conteúdos. Quanto mais textos lê o ChatGPT ou mais imagens processam ferramentas como Midjourney ou Stable Diffusion, mais sofisticados são os resultados.

  • Mas o que acontece quando os dados que suportam essas inovações são protegidos por direitos autorais?

Certamente os milhões de textos, fotos, áudios e vídeos que são processados pelas aplicações de IA não tiveram o seu uso autorizado para essa finalidade.

Visto por esse ângulo, a proteção dos direitos autorais poderia se transformar em uma pedra no sapato para o desenvolvimento de novas tecnologias.

É aqui que entra em cena o Japão.

Legislação japonesa sobre aprendizado de máquina

Desde 2009 a legislação japonesa foi atualizada para permitir que obras protegidas por direitos autorais fossem usadas para a mineração de textos e de dados, impulsionando o aprendizado de máquinas.

Dez anos depois, o Parlamento Europeu aprovou a diretiva sobre direitos autorais no mercado único digital, direcionando os países à criação de exceções para a prospecção de textos e dados no contexto digital.

O pioneirismo do Japão ao tratar do tema fez com que o país pudesse sair na frente nos debates sobre o desenvolvimento responsável de aplicações de inteligência artificial. Acontece que a competição no mercado digital é feroz.

Conhecido pela fabricação de robôs, o Japão vem perdendo espaço nos últimos anos em importantes campos ligados ao desenvolvimento tecnológico. Taiwan conseguiu afirmar sua liderança na produção de chips semicondutores, enquanto a China, com um plano ambicioso de aperfeiçoamento de tecnologias de IA, afirmou em documento oficial que planeja ser a líder global no setor até 2030.

Para fazer frente a esses desafios o Japão conta com uma política nacional sobre robótica e outra sobre inteligência artificial.

A política sobre robótica afirma que o seu objetivo é criar uma sociedade "livre de barreiras para robôs", estimulando que as pessoas cada vez mais normalizem a interação com as máquinas.

Com uma população envelhecendo a ritmo acelerado, a implementação de robôs cuidadores também ganhou destaque na estratégia japonesa.

Com a expansão das aplicações de IA generativa e a explosão de conteúdos, como imagens e textos, criados automaticamente, o país agora se vê diante de um novo desafio:

  • Será que a permissão para mineração de dados viabiliza que toda obra autoral seja analisada pelas ferramentas de IA para criar algo novo?

As duas fases da IA generativa

A Agência de Assuntos Culturais, do governo japonês, divulgou um documento que divide a operação das ferramentas de IA generativa em duas fases:

  • A primeira é dedicada ao "desenvolvimento/aprendizado de IA";
  • A segunda é focada na "geração/uso" de um novo conteúdo.

Na primeira fase, obras protegidas por direitos autorais podem ser usadas sem precisar passar pela autorização do autor ou do titular dos direitos autorais.

O Japão confirma assim a sua posição no sentido de estimular o desenvolvimento de novas ferramentas de IA, embora o documento faça a ressalva de que esse uso deve ser feito dentro "da extensão necessária" e sem "prejudicar injustamente os interesses" do titular dos direitos autorais.

Na segunda fase, quando o conteúdo é efetivamente criado pela ferramenta de IA, o documento esclarece que as normas sobre infrações aos direitos autorais valem normalmente. Ou seja, se o texto criado pela aplicação de IA reproduzir trechos do autor original ele pode ser considerado plágio.

E com as imagens? Nada impediria que o autor cujas obras "inspiraram" a IA reconheça os seus trabalhos na imagem nova e busque uma indenização.

Essas preocupações com a segunda fase aparecem também em recente documento do Ministério da Justiça de Israel sobre o uso de obras protegidas por direitos autorais no treinamento de aplicações de IA.

O documento reflete o mesmo entendimento defendido pelo governo japonês sobre a possibilidade de se usar obras autorais na construção de bases de dados que alimentam aplicações de IA generativa sem passar por qualquer autorização prévia.

Um ponto diferente na proposta israelense é que essa exceção não se aplicaria

A conjuntos de dados de aprendizado de máquina que consistem exclusivamente em trabalhos criados por um único autor para competir com esse autor em seus mercados existentes.

Ao final, o documento israelense também reitera que a exceção para mineração de dados "não se aplica à saída do processo de aprendizado de máquina".

Ou seja, podem existir casos em que o processo de aprendizagem de máquina é lícito ao incorporar obras autorais, mas o seu resultado, a depender de qual for, pode infringir direitos autorais alheios.

Recepção nas redes sociais

As notícias sobre como o governo japonês estava lidando com o tema dos direitos autorais e as novas IA generativas ganharam repercussão nas redes sociais.

O cientista-chefe sobre inteligência artificial na Meta afirmou que o Japão havia se tornado "um paraíso para o aprendizado de máquina".

Em sessão da Câmara dos Deputados japonesa, a ministra da Educação, Cultura, Esportes, Ciência e Tecnologia, Keiko Nagaoka, confirmou que a legislação nacional sobre direitos autorais não impede a inserção de obras nas bases de dados que fomentam aplicações de IA generativa.

O argumento, conforme relatado pelo deputado Takashi Kii, se baseou na inexistência de proibição de que uma informação seja analisada e que essa atividade poderia ser realizada independentemente do método ou do conteúdo processado.

Isso não significa que o governo japonês revogou a proteção dos direitos autorais para a criação de IA no país, como visto.

A fala da ministra apenas confirmou que a exceção criada em 2009 para a mineração de textos e dados vale para as modernas aplicações de IA generativa.

O posicionamento do governo japonês já encontra resistência, especialmente por parte dos criadores e das empresas envolvidas na indústria de anime e mangá.

Eles sinalizam que o movimento pode retirar incentivos para a criação autoral, afetando um setor produtivo que garante importante retorno comercial para o país.

Uma questão de estratégia

Existem também outros motivos por trás do posicionamento adotado pelo governo.

Uma parte expressiva das aplicações de IA, especialmente as que processam texto, é treinada em inglês. Com isso, vai se abrindo cada vez mais um abismo não apenas entre as pessoas que dominam ou não o idioma, mas também na forma pela qual funcionam as ferramentas de inteligência artificial.

Você já deve ter reparado como algumas das mais populares aplicações geram resultados mais sofisticados em inglês do que em português.

Por isso o Japão, ao confirmar que o uso de obras autorais no aprendizado de máquina não precisa ser autorizado, pode estar buscando também incentivar a formação de bancos de dados e o treinamento de máquinas com base em conteúdos em japonês.

Diversidade linguística é um tema de atenção global sobre o futuro da inteligência artificial e vários países, em suas estratégias sobre IA, procuram estimular a criação de soluções que falem a língua nacional.

A Espanha, por exemplo, abre a sua estratégia com a missão de:

Liderar a inclusão e uso do idioma espanhol na IA através do desenvolvimento de ferramentas, a correta aplicação e incorporação em diversas tecnologias ou serviços, bem como o desenvolvimento de boas práticas para o uso do idioma espanhol aplicado a soluções de IA.

O futuro da criatividade vai ser judicializado

Não resta dúvida que as aplicações de IA generativa vieram para transformar a criação artística, que usa diversos elementos (inclusive obras alheias) para criar conteúdos em uma fração de segundos.

A bem da verdade, a criação intelectual sempre se inspirou nas obras do passado para produzir algo novo.

Acontece que agora essa inspiração é automatizada e ninguém sabe ao certo qual característica de uma obra do passado gerou a criação nova que se vê na tela.

  • A Getty Images está processando a Stability AI, responsável pelo gerador de imagens Stable Diffusion, pelo uso não autorizado de 12 milhões de fotos para o treinamento de sua aplicação.
  • O fundador da Midjourney, outro popular gerador de imagens, admitiu que a sua empresa não recebeu qualquer autorização para usar milhões de imagens inseridas nos processos de aprendizado de máquina.

Questionamentos como esse vão ser cada vez mais frequentes, levando países a atualizar as suas leis sobre direitos autorais, com um olho na proteção de suas indústrias culturais, e outro no impulsionamento de novas soluções de inteligência artificial.

Os inevitáveis processos judiciais também ajudaram a trilhar esse debate.

Enquanto isso, fica a reflexão sobre como essas aplicações transformam todo usuário em autores instantâneos. Se é que podemos dizer que quem escreve um prompt e dá um enter é realmente o autor do resultado.

As aplicações de IA generativa parecem ser mais do que meros instrumentos para a criação humana.

Nunca fomos confrontados com a situação de um pincel que tem ideias próprias ou com uma máquina de escrever que decide o final da história.

Para além de todas as confusões sobre a possibilidade de se usar obras autorais para treinar as máquinas, vamos precisar discutir cada vez mais se o que a máquina cria é protegido por direito autoral. E se for, é direito autoral de quem?