O nosso conhecimento sobre a genética humana aumentou vertiginosamente nas últimas décadas. Grande parte dessa transformação deve-se à possibilidade de gerar dados para genomas inteiros, algo cada vez mais barato e feito em amostras progressivamente maiores, muitas vezes envolvendo milhares de indivíduos.
O que aprendemos de novo? Os estudos genômicos permitiram identificar variantes genéticas que estão associadas a traços de interesse, como por exemplo uma maior predisposição a doenças. Para alcançar tal conhecimento, a estratégia mais usada é a da “análise de associação genômica ampla” (do inglês genome-wide association analysis, abreviado por GWAS). Essa análise consiste em comparar genomas de dois grupos, um com a doença (os “casos”) e outro sem (os “controles”). Se houver uma variante genética que é muito mais comum nos casos do que nos controles, dizemos que ela está “associada” com a doença. Essa associação é um achado estatístico, mas não necessariamente implica que a variante encontrada é “causal”, no sentido de afetar uma função de um modo que explica a doença. Para se inferir se uma mutação tem um efeito causal sobre uma doença são necessários estudos adicionais, comparando o funcionamento da variante genética nos indivíduos com e sem a doença.
Os achados dos estudos de associação ajudam a entender quais mudanças genéticas predispõem indivíduos a doenças, o que é uma informação potencialmente valiosa para desenvolver tratamentos. Conhecer variantes genéticas associadas a doenças também ajuda a desenvolver diagnósticos mais precisos, aliando dados clínicos coletados por médicos com a informação genética. Finalmente, os estudos de associação também mostram os limites das investigações genéticas: por exemplo, há doenças em que pacientes e controles são geneticamente muito semelhantes, sugerindo que diferenças genéticas contribuem pouco.
Um dos desafios de estudos de associação é distinguir as diferenças entre casos e controles que são relacionadas ao traço sob estudo (por exemplo, a presença da doença) de outras fontes de variação. Por exemplo, suponha que os casos tenham em média mais ancestralidade africana do que os controles, simplesmente como consequência da forma como as amostras foram obtidas. Nesse caso, diferenças genéticas entre casos e controles não necessariamente remetem às variantes de predisposição à doença, podendo simplesmente refletir diferenças genéticas entre africanos e europeus (que, apesar de modestas, existem). Os geneticistas referem-se à situação em que casos e controles têm ancestralidades diferentes, podendo levar a confusões em estudos genéticos, como “estratificação populacional”. Para fugir dessa complicação, estudos de associação têm preferido focar em populações consideradas “homogêneas”, nas quais as complicações causadas pela estratificação populacional são muito menores. Não por acaso, estudos genéticos com grupos tais como “brancos do Reino Unido” são recorrentes.

Entretanto, há sérios problemas no foco da genômica em alguns poucos grupos homogêneos. Em primeiro lugar, essa estratégia tem priorizado a investigação de populações de ancestralidade europeia. Porém, europeus representam apenas um quinto dos humanos que vivem na terra. Ao deixar de fora africanos, asiáticos, ameríndios, assim como indivíduos de ancestralidade mista, abdicamos de descobrir se variantes genéticas que levam à predisposição a doenças são diferentes em cada região do mundo. Em alguns casos em que populações não-europeias foram investigadas, descobriu-se que a base genética de muitas doenças de fato difere entre populações. Um caso recentemente investigado é o da asma: as mutações presentes em europeus que levam a uma predisposição a essa doença não são as mesmas presentes em afro-americanos.
Aumentar a diversidade de populações utilizadas em estudos genéticos pode também corrigir estudos prévios. Por exemplo, uma série de estudos em europeus havia identificado uma mutação associada à miocardiopatia hipertrófica, uma doença na qual o músculo cardíaco torna-se mais grosso. Surpreendentemente, essa mesma mutação é bastante comum em negros norte-americanos, que não possuem a doença. Isso levou pesquisadores a concluir que a mutação não tem um efeito causal em europeus, devendo haver outra base genética, ainda desconhecida.
Como podemos injetar maior diversidade em estudos genéticos? Há dois caminhos. O primeiro envolve valorizar a diversidade já existente nas bases de dados disponíveis. Por exemplo, num esforço colaborativo, pesquisadores do Reino Unido reuniram dados genéticos para mais de 500.000 indivíduos numa base de dados chamado UK Biobank. Dessa amostra, 88% são “etnicamente britânicos brancos” e apenas 6% pertencem a ancestralidades “não brancas” (predominantemente vindos da Índia e do Paquistão). A maioria dos estudos feitos com o UK Biobank optou por realizar análises genéticas focando nas amostras “britânicas brancas”, deixando de fora da análise os 6% de “não brancas”. Por que? A resposta é simples: por serem mais homogêneas, as amostras britânicas são mais fáceis de analisar, pois evitam o problema da estratificação populacional, mencionado acima. Por essa razão, os 6% de “não brancos” são quase sempre ignorados nas análises genéticas do UK Biobank. Mas esse desperdício não é justificado: as amostras não-britânicas iluminam o estudo, trazendo novas informações, como por exemplo identificando outras mutações, características de não-europeus, que podem estar associadas às doenças sob estudo. Além disso, a estratificação populacional não é um problema incontornável, pois foram desenvolvidas ferramentas estatísticas para contemplá-la nos estudos genéticos.
Em segundo lugar, o modo mais direto de aumentar a diversidade em estudos genéticos é levar a amostragem a regiões do mundo pouco estudadas. Para isso, é preciso que haja investimento em ciência e tecnologia em países não-europeus, ou que países para onde convergiram muitas correntes migratórias, como é o caso dos Estados Unidos e do Brasil, se debrucem sobre a diversidade de sua população. Há movimentos nesse sentido, com grandes colaborações investigando diversidade em populações miscigenadas, mas ainda há imensas lacunas de amostragem, em particular na América do Sul e na Africa.
O Brasil ocupa uma posição singular nesse cenário. Por sermos um país miscigenado, com pessoas vindas da Africa, Europa, Ásia, Oriente Médio, além dos descendentes dos Nativos Americanos, representamos uma oportunidade valiosa para estudos genéticos. É possível que mutações associadas a doenças não o sejam em indivíduos cujos genomas são em sua maior parte africanos, ou que a ancestralidade europeia em nosso país (predominantemente portuguesa) seja diferente daquela associada à mesma doença em outras regiões da Europa. Ainda, é possível que a mistura genética resultante da miscigenação faça com que cada indivíduo represente uma combinação inédita de variantes genéticas, mesclando variantes comuns em africanos com outras comuns em europeus. Essa mistura pode fazer com que a base genética de doenças ganhe novos capítulos quando estudada em brasileiros.
Estudar as bases genéticas de doenças com foco exclusivo em europeus não é mais socialmente aceitável, ou cientificamente produtivo. Cabe agora à comunidade científica expor seus argumentos e catalisar uma mudança na forma como a genômica humana é feita.
Diogo Meyer (IB-USP)
Para saber mais:
Teri Manolio. Using the Data We Have: Improving Diversity in Genomic Research. American Journal of Human Genetics, 2019 Aug 1;105(2):233-236.
Hindorff, L.A., Bonham, V.L., Brody, L.C., Ginoza, M.E.C., Hutter, C.M., Manolio, T.A., and Green, E.D. (2018). Prioritizing diversity in human genomics research. Nat. Rev. Genet. 19, 175–185.