O oncologista André Marcio Murad (foto) explica as principais características do genoma humano, em mais um artigo da série 'Drops de Genômica'. Confira.
Por André Marcio Murad*
O genoma humano contém 3,1 bilhões de nucleotídeos, mas as sequências codificadoras de proteínas constituem apenas cerca de 2% do genoma. A sequência do genoma é 99,9% semelhante em indivíduos de todas as nacionalidades.
SNPs (polimorfismos de nucleotídeo único) e variações do número de cópias (CNVs) são responsáveis pela diversidade do genoma de pessoa para pessoa.
O genoma é dinâmico. Pelo menos 50% do genoma é derivado de elementos transponíveis, como sequências LINE e Alu e outras sequências de DNA repetitivas. Ele contém aproximadamente 20 mil genes codificadores de proteínas, muito menos do que o número originalmente previsto de 80.000–100.000 genes.
O tamanho médio de um gene humano é de 25 kb, incluindo regiões reguladoras de genes, íntrons e exons. Em média, os mRNAs produzidos por genes humanos têm 3000 nt de comprimento.
Muitos genes humanos produzem mais de uma proteína por meio de splicing alternativo, permitindo que as células humanas produzam um número muito maior de proteínas (talvez até 200.000) a partir de apenas 20.000 genes.
Mais de 50% dos genes humanos mostram um alto grau de similaridade de sequência com genes em outros organismos; no entanto, mais de 40% dos genes identificados não têm função molecular conhecida.
Os genes não são distribuídos uniformemente nos 23 pares de cromossomos humanos. Aglomerados ricos em genes são separados por "desertos" pobres em genes que respondem por 20% do genoma. Esses desertos se correlacionam com as bandas G vistas em cromossomos corados. O cromossomo 19 tem a densidade gênica mais alta, e o cromossomo 13 e o cromossomo Y têm as densidades gênicas mais baixas. O cromossomo 1 contém o maior número de genes e o cromossomo Y contém o menor número.
Os genes humanos são maiores e contém íntrons cada vez maiores do que os genes de invertebrados, como a Drosophila. O maior gene humano conhecido codifica a distrofina, uma proteína muscular. Esse gene, associado de forma mutante à distrofia muscular, tem 2,5 Mb de comprimento, maior do que muitos cromossomos bacterianos. A maior parte desse gene é composta de íntrons, e o número de íntrons nos genes humanos varia de 0 (nos genes das histonas) a 234 (no gene da titina, que codifica uma proteína muscular).
*André Murad é diretor científico do Grupo Brasileiro de Oncologia de Precisão (GBOP), diretor clínico da Personal - Oncologia de Precisão e Personalizada, professor adjunto coordenador da Disciplina de Oncologia da Faculdade de Medicina da UFMG, e oncologista e oncogeneticista da CETTRO Oncologia (DF)