Já no segundo caso, a pergunta a ser respondida é: quem é o brasileiro? De onde viemos? Quando passamos a nos misturar? "Um indivíduo que mora em São Paulo e é 60% africano provavelmente é uma mescla. Comparando com um banco genômico africano, dá para saber se ele tem um pedaço de iorubá, de banto e assim por diante", diz.
"É possível resgatar a história das populações. Podemos pegar as mutações e resgatar de que tribos da África os escravos vieram. Hoje, essas pessoas não têm passado, os documentos foram queimados. Podemos também tentar resgatar os indígenas que foram extintos, se alguma parte desse genoma existe na população atual"
Isso só será possível porque consórcios científicos já mapearam o genoma de algumas etnias africanas e a própria Hünemeier conduz, em paralelo, o trabalho de fazer o sequenciamento de indígenas e da população amazônica.
Por que o Brasil não possui um banco genômico?
De modo mais amplo, porém, esse trabalho nunca ocorreu no Brasil, porque é "caríssimo". A pesquisadora explica que já houve algumas iniciativas de mapeamento genético de brasileiros no passado, mas foram restritas geograficamente (selecionou apenas indivíduos da Bahia e de Porto Alegre) e focavam em algumas mutações específicas.
Agora, o foco é sequenciar o genoma de 15 mil brasileiros, que já tiveram amostras coletadas pelo Estudo Longitudinal de Saúde do Adulto (Elsa Brasil), feito entre servidores públicos e conduzido por pesquisadores das universidades federais de Minas Gerais (UFMG), Rio Grande do Sul (UFRGS), Bahia (UFBA), Espírito Santo (UFES) e da Fundação Oswaldo Cruz (Fiocruz). O projeto também conta com o apoio de empresas privadas, que cederão infraestrutura para que o sequenciamento genético seja feito.
Isso ocorre em três etapas:
Nos laboratórios da Dasa, o material biológico dos participantes do Elsa Brasil é analisado para se extrair as 3,2 bilhões de bases nitrogenadas, representadas pelas letras adenina (A), timina (T), citosina (C) e guanina (G), que o compõe o genoma humano; são elas que estabelecem os parâmetros das características de uma pessoa; essa fase já foi realizada;
Como o resultado da primeira fase é uma sopa de letrinhas desordenada, é preciso alinhar as bases para que se possa organizar a informação. Isso é feito pelo serviço de computação em nuvem do Google;
Depois dessa estruturação, é preciso fazer uma interpretação desses dados. Conforme as pesquisadoras, 99,99% do sequenciamento é idêntico para quaisquer populações. É naquele 0,01% que reside a diferenciação do material genético.
Esse genoma é cruzado com dados clínicos, também reunidos na Elsa Brasil, como ocorrências fenotípicas (altura, cor do cabelo, pele, olhos, etc) e dados clínicos (colesterol, pressão alta, incidência de doenças, etc).
Para realizar o "DNA do Brasil", as pesquisadoras pedirão aos mais de 15 mil participantes do Elsa Brasil autorização para que suas amostras de sangue e saliva sejam processadas novamente. A princípio, serão usados os dados de 3.000 pessoas, devido aos altos custos envolvidos.
Na nuvem
A etapa de processamento na nuvem é crucial para o projeto, porque estamos falando de uma quantidade imensa de dados. O sequenciamento de um único genoma produz até 500 Gigabytes de informações —certamente não cabe na versão gratuita do Google Drive, que oferece apenas 15 GB. Só a parte do código que apresenta diferenciação pode chegar a 25 GB —os pacotes incluem mais do que o 0,01% de código variante.
Como o processamento é muito caro, as cientistas procuraram o Google há cerca de um ano e meio com a proposta de parceria. O Google Cloud é usado em outros projetos de sequenciamento de DNA, como o do Broad Institute, um centro de pesquisa biomédica e genômica criado por Harvard e pelo Instituto de Tecnologia de Massachusetts (MIT). A empresa não revela quanto custaria processar os genomas de brasileiros, mas o Broad Institute diz que o benefício fez com que o gasto caísse de US$ 45 para US$ 5 por genoma sequenciado.
No caso dos norte-americanos, o tempo para essa etapa é de 10 minutos, enquanto a fase biológica demora até uma semana. As pesquisadoras esperam trabalhar com essa base durante 10 anos —o acordo com o Google é de dois anos, depois disso o projeto terá de procurar outras fontes de financiamento. Para isso, as pesquisadoras correm atrás de editais públicos e de apoio privado.
Quem poderá usar os dados?
"O Google só nos cedeu um espaço na nuvem, mas os dados são encriptados e privados. Eles não só não têm acesso nenhum a eles, como também não sabem onde estão os dados", diz Hünemeier.
Segundo o Google, serão seguidos os mesmos protocolos de segurança para outras informações armazenadas em sua plataforma de nuvem — a Dasa, aliás, já é um de seus clientes. Caso as cientistas tenham que armazenar e fazer o processamento em território nacional, é possível alocar um servidor no Brasil. Essa é uma exigência da Lei Geral de Proteção de Dados Pessoais, que entra em vigor em agosto de 2020.
Os dados poderão, no futuro, ser consultados por cientistas que queiram fazer pesquisas genéticas. Como são criptografados e anonimizados, é impossível, diz a pesquisadora, chegar à identidade do dono daquele genoma.
Comentários