Topo

Pela 1ª vez, Brasil criará banco com mapeamento do genoma da população

Não há um banco que reúna genoma de brasileiros e possa ser usado por cientistas em pesquisas - Divulgação/iStock
Não há um banco que reúna genoma de brasileiros e possa ser usado por cientistas em pesquisas Imagem: Divulgação/iStock

Helton Simões Gomes

De Tilt, em São Paulo

10/12/2019 12h00

Sem tempo, irmão

  • Não ter um banco com genomas de brasileiros dificulta a ciência no Brasil
  • Pesquisadores têm de usar bases genômicas de europeus ou asiáticos
  • Isso atrapalha, já que o brasileiro é miscigenado e tem marcadores genéticos próprios
  • Para resolver problema, pesquisadores criarão o 1º banco de genoma da população
  • Com ele, será possível descobrir mutações genéticas características do Brasil...
  • ...e traçar a ancestralidade de negros, indígenas e brancos que vivem no país

Como as particularidades no genoma do brasileiro impactam o efeito de uma medicação? Há marcadores genéticos que indiquem nossa origem? Hoje os geneticistas brasileiros não possuem qualquer base com dados nacionais para responder essas perguntas, mas um grupo liderado pelas cientistas Lygia Pereira e Tábita Hünemeier, do Instituto de Biociência da Universidade de São Paulo, pretende acabar com isso.

Elas anunciaram nesta terça-feira (10) o "DNA do Brasil", o primeiro banco genômico do país, algo que pode mudar a forma como as pesquisas são feitas por aqui e tende a fechar uma lacuna em relação a outras nações que já possuem suas próprias bases —nosso acervo tem grande valor, porque "o brasileiro é um encontro", como explica Hünemeier.

Temos a maior mistura em termos populacionais do mundo. Africanos, europeus e nativos brasileiros estão separados por uma escala temporal --o hominídeo surge na África, vai para a Europa e, de lá, para a América, uma migração de cerca de 60 mil anos. As mutações são geográficas e específicas, então elas, às vezes, até são as mesmas, mas variam em frequência de um lugar para outro
Tábita Hünemeier, pesquisadora do Instituto de Biociência da USP

O plano é abrir os dados para a comunidade científica brasileira e, no futuro, para a internacional. As pesquisadoras vão atuar em duas frentes:

  • descobrir as mutações genéticas específicas do brasileiro, de modo a identificar em que grau ele se diferencia de habitantes de outras localidades;
  • indicar a ancestralidade genética de algumas especificidades no genoma da população.

No primeiro caso, as aplicações ligadas à saúde são mais óbvias, porque será possível analisar como a genética atua no surgimento de uma doença. "Quando a gente estuda genética, geralmente vê as mesmas regiões porque faz a partir de uma referência europeia. Por isso, não consegue ver a variabilidade que está escondida", explica Hünemeier.

Já no segundo caso, a pergunta a ser respondida é: quem é o brasileiro? De onde viemos? Quando passamos a nos misturar? "Um indivíduo que mora em São Paulo e é 60% africano provavelmente é uma mescla. Comparando com um banco genômico africano, dá para saber se ele tem um pedaço de iorubá, de banto e assim por diante", diz.

É possível resgatar a história das populações. Podemos pegar as mutações e resgatar de que tribos da África os escravos vieram. Hoje, essas pessoas não têm passado, os documentos foram queimados. Podemos também tentar resgatar os indígenas que foram extintos, se alguma parte desse genoma existe na população atual

Isso só será possível porque consórcios científicos já mapearam o genoma de algumas etnias africanas e a própria Hünemeier conduz, em paralelo, o trabalho de fazer o sequenciamento de indígenas e da população amazônica.

Por que o Brasil não possui um banco genômico?

De modo mais amplo, porém, esse trabalho nunca ocorreu no Brasil, porque é "caríssimo". A pesquisadora explica que já houve algumas iniciativas de mapeamento genético de brasileiros no passado, mas foram restritas geograficamente (selecionou apenas indivíduos da Bahia e de Porto Alegre) e focavam em algumas mutações específicas.

Agora, o foco é sequenciar o genoma de 15 mil brasileiros, que já tiveram amostras coletadas pelo Estudo Longitudinal de Saúde do Adulto (Elsa Brasil), feito entre servidores públicos e conduzido por pesquisadores das universidades federais de Minas Gerais (UFMG), Rio Grande do Sul (UFRGS), Bahia (UFBA), Espírito Santo (UFES) e da Fundação Oswaldo Cruz (Fiocruz). O projeto também conta com o apoio de empresas privadas, que cederão infraestrutura para que o sequenciamento genético seja feito.

Isso ocorre em três etapas:

  1. Nos laboratórios da Dasa, o material biológico dos participantes do Elsa Brasil é analisado para se extrair as 3,2 bilhões de bases nitrogenadas, representadas pelas letras adenina (A), timina (T), citosina (C) e guanina (G), que o compõe o genoma humano; são elas que estabelecem os parâmetros das características de uma pessoa; essa fase já foi realizada;
  2. Como o resultado da primeira fase é uma sopa de letrinhas desordenada, é preciso alinhar as bases para que se possa organizar a informação. Isso é feito pelo serviço de computação em nuvem do Google;
  3. Depois dessa estruturação, é preciso fazer uma interpretação desses dados. Conforme as pesquisadoras, 99,99% do sequenciamento é idêntico para quaisquer populações. É naquele 0,01% que reside a diferenciação do material genético.

Esse genoma é cruzado com dados clínicos, também reunidos na Elsa Brasil, como ocorrências fenotípicas (altura, cor do cabelo, pele, olhos, etc) e dados clínicos (colesterol, pressão alta, incidência de doenças, etc).

Para realizar o "DNA do Brasil", as pesquisadoras pedirão aos mais de 15 mil participantes do Elsa Brasil autorização para que suas amostras de sangue e saliva sejam processadas novamente. A princípio, serão usados os dados de 3.000 pessoas, devido aos altos custos envolvidos.

Na nuvem

A etapa de processamento na nuvem é crucial para o projeto, porque estamos falando de uma quantidade imensa de dados. O sequenciamento de um único genoma produz até 500 Gigabytes de informações —certamente não cabe na versão gratuita do Google Drive, que oferece apenas 15 GB. Só a parte do código que apresenta diferenciação pode chegar a 25 GB —os pacotes incluem mais do que o 0,01% de código variante.

Como o processamento é muito caro, as cientistas procuraram o Google há cerca de um ano e meio com a proposta de parceria. O Google Cloud é usado em outros projetos de sequenciamento de DNA, como o do Broad Institute, um centro de pesquisa biomédica e genômica criado por Harvard e pelo Instituto de Tecnologia de Massachusetts (MIT). A empresa não revela quanto custaria processar os genomas de brasileiros, mas o Broad Institute diz que o benefício fez com que o gasto caísse de US$ 45 para US$ 5 por genoma sequenciado.

No caso dos norte-americanos, o tempo para essa etapa é de 10 minutos, enquanto a fase biológica demora até uma semana. As pesquisadoras esperam trabalhar com essa base durante 10 anos —o acordo com o Google é de dois anos, depois disso o projeto terá de procurar outras fontes de financiamento. Para isso, as pesquisadoras correm atrás de editais públicos e de apoio privado.

Quem poderá usar os dados?

"O Google só nos cedeu um espaço na nuvem, mas os dados são encriptados e privados. Eles não só não têm acesso nenhum a eles, como também não sabem onde estão os dados", diz Hünemeier.

Segundo o Google, serão seguidos os mesmos protocolos de segurança para outras informações armazenadas em sua plataforma de nuvem — a Dasa, aliás, já é um de seus clientes. Caso as cientistas tenham que armazenar e fazer o processamento em território nacional, é possível alocar um servidor no Brasil. Essa é uma exigência da Lei Geral de Proteção de Dados Pessoais, que entra em vigor em agosto de 2020.

Os dados poderão, no futuro, ser consultados por cientistas que queiram fazer pesquisas genéticas. Como são criptografados e anonimizados, é impossível, diz a pesquisadora, chegar à identidade do dono daquele genoma.

SIGA TILT NAS REDES SOCIAIS