Data:
O problema da sub-representatividade em bancos de dados genômicos
Autores | César H. Yokomizo e Kelly Duarte
A variabilidade genética é o resultado de diversos fatores, entre eles a pressão evolutiva e é essa variabilidade que permite diferentes respostas frente à mudanças no ambiente.
Mapear a variabilidade genética com a maior cobertura possível é essencial para estratégias de saúde que levem em conta características genômicas. A ancestralidade genética também é altamente informativa nos apresentando dados referentes à história e aos antepassados de um organismo.
Todos esses dados, de variabilidade e ancestralidade, ficam armazenados em bancos de dados genômicos. No entanto, os bancos de dados que utilizamos atualmente sofrem de uma sub-representatividade da variabilidade genética, já que baseiam-se majoritariamente em indivíduos caucasianos com ancestralidade europeia.
Como são usados no desenvolvimento de estratégias de medicina de precisão, essa sub-representação presente nos bancos de dados pode gerar diversos vieses equivocados quando fazemos a correlacão genoma-saúde.
Um exemplo é o genoma de referência que utilizamos, resultante do Projeto Genoma Humano, e obtido a partir do DNA de mais de 60 pessoas. 70% do genoma provêm de apenas um indivíduo afro-americano, onde o genoma compunha-se de 50% de ancestralidade europeia e 50% da África subsaariana.
Embora 99.9% do DNA em todos os seres humanos seja idêntico, é nesse 0.1% restante que está abrigada toda a variabilidade observada. Estudos GWAS permitem enfatizar a relevância desse 0.1% e como a sub-representação genômica é um gargalo a ser superado.
Um levantamento de estudos GWAS na revista Nature em 2009, apontou que 96% dos participantes tinham ancestralidade européia. Alguns anos depois, em 2016 a porcentagem com ancestrais europeus ainda era de 81% dos participantes.
Se dermos um “zoom”, no levantamento GWAS mais recente (2018), para identificar as populações e etnias representadas, a é com maior evidência como alguns grupos são sub-representados.
Para tentar mitigar esse problema, principalmente em um país altamente miscigenado como o Brasil, em 2019 a pesquisadora da USP Lygia da Veiga Pereira iniciou o projeto “DNA do Brasil”, que têm como objetivo sequenciar o genoma de 15 mil brasileiros para compreender a influência da etnia na saúde da população. A estratégia é integrar os dados obtidos aos bancos de dados genômicos internacionais, adicionando dessa forma a miscigenação da população brasileira, que possui traços ancestrais diversos como africanos, europeus e ameríndios.
iniciativas como o "DNA do Brasil" são muito bem-vindas e devem ocorrer em outras países de maneira mais frequente, para conseguirmos construir bancos de dados genômicos que sejam mais fidedignos à diversidade e variabilidade genética apresentada pela população mundial.
Saiba mais:
Evaluating the promise of inclusion of African ancestry populations in genomics
The Missing Diversity in Human Genetic Studies
DNA databases are too white, so genetics doesn’t help everyone. How do we fix that?
#ciencia #bioinformatica #divulgaçãocientífica #edutaugc #representatividade #variabilidade
Última atualização: Dec. 10, 2021, 4:13 p.m.