Essa é uma abordagem chamada 'Red Team', que vem da área de cibersegurança e começa a ser utilizada em projetos de IA. Um time de profissionais especializados é escalado para adotar um papel de 'adversário' do sistema e explora tudo o que pode dar errado com ele, como falhas, brechas e possíveis usos indevidos.

O relatório publicado nesta semana pelos organizadores do 'Red Team' que rolou durante a DefCon no ano passado mostra a importância da estratégia para trazer testes em larga escala para sistemas sensíveis como os de IA. Mais de 2.000 pessoas participaram do desafio e encontraram problemas em diferentes categorias que certamente não seriam identificados apenas pelos engenheiros e cientistas das empresas desenvolvedoras.

É por isso que as principais empresas de tecnologia estão investindo na formação de equipes de 'Red Team' para testar e validar os novos modelos de IA antes de serem disponibilizados ao público. A OpenAI, por exemplo, criou o "Red Teaming Network", que envolve especialistas de diferentes áreas e países para encontrar erros, falhas e desvios de comportamentos da IA antes que os novos modelos sejam liberados.

A prática está ganhando tanta importância como um requisito de segurança que a "Ordem Executiva" de IA do presidente Biden pede que os resultados dos testes feitos pelos 'Red Teams' das empresas sejam compartilhados com o governo federal.

"as empresas que desenvolvem qualquer modelo fundacional que represente um risco sério à segurança nacional, à segurança econômica nacional ou à saúde pública nacional e segurança devem notificar o governo federal ao treinar o modelo e devem compartilhar os resultados de todos os testes de segurança do 'Red Team'. Essas medidas garantirão que os sistemas de IA sejam seguros, protegidos e confiáveis antes que as empresas os tornem públicos."

Esse é um ponto que estamos deixando passar quando discutimos sobre regulação de IA no Brasil - e em muitos outros países. A prática de 'Red Team' não precisa estar restrita às empresas e pode ser um instrumento adequado quando estamos falando de políticas públicas para tecnologias emergentes.