Genômica
• A genômica é o campo da genética que tenta
compreender o conteúdo, a organização, a
função e a evolução da informação genética
contida em genomas inteiros
Genômica estrutural
• A
genômica
é uma área da genética que estuda a
estrutura e a função de
genomas
inteiros.
• Na década de 80, pesquisadores começaram a se
unir em grandes equipes, fazendo um esforço
conjunto para o sequenciamento de genomas
inteiros.
• Surgiram então os
Projetos Genoma
, que tinham
como objetivo conhecer a sequência de
nucleotídeos de uma determinada espécie.
Genômica Estrutural
• Essa abordagem é conhecida como
Genômica
Estrutural
e tais projetos geram uma
quantidade muito grande de dados de
sequências das mais diversas espécies, sendo
que essa informação é armazenada em bancos
de dados de acesso público, como o
GenBank
.
Genômica Estrutural
• A genômica estrutural está relacionada ao sequenciamento e à compreensão do conteúdo dos genomas.
• Uma das abordagens é primeiro caracterizar o genoma através de mapas genéticos e físicos de seus cromossomos.
• Estes mapas fornecem informações sobre as
localizações relativas dos genes, marcadores moleculares e segmentos cromossômicos, que em geral são essenciais para o alinhamento de trechos de sequenciamentos de DNA em uma sequência total do genoma.
Mapas Genéticos
• Os
mapas genéticos
tem como objetivo
determinar a posição de um certo número de
marcadores genéticos em relação ao outro.
• Para esse tipo de análise é necessário que tenha
polimorfismo e que tenham grandes famílias
disponíveis para a análise de segregação,
fornecendo uma localização aproximada dos
genes com relação à outros genes ou
marcadores, cuja localização é conhecida.
Mapas Genéticos
• As distâncias nos mapas genéticos são
medidas em porcentagem de recombinação
(centimorgans, cM) ou unidades de mapa.
• Os dados de vários cruzamentos de dois
pontos ou três pontos podem ser integrados
em mapas de ligação para cromossomos
inteiros.
Mapas Genéticos
• Limitações: a primeira é a resolução. O genoma humano inclui 3,4 bilhões de pares de bases de DNA e tem uma distância genética total de cerca de 4.000 cM, uma média de 850.000 pb/cM.
• Mesmo se ocorresse um marcador a cada centimorgan, a resolução em relação à estrutura física do DNA ainda seria bem baixa.
• Um segundo problema com os mapas genéticos é que eles nem sempre correspondem precisamente a distâncias físicas entre os genes.
• Os mapas genéticos são baseados nas taxas de recombinação, que variam um pouco de uma parte do cromossomo para outra.
• Apesar disso, os mapas genéticos foram críticos para o desenvolvimento de mapas físicos e o sequenciamento de genomas inteiros.
Mapas Físicos
• Os mapas físicos referem-se a molécula de
DNA.
• Trata-se de determinar a posição dos genes no
cromossomo, assim como a distância em
nucleotídeos entre os genes.
• O mapa físico final é constituído pela
sequência completa do DNA.
Mapas Físicos
• Os mapas físicos em geral têm
maior resolução
e
são mais precisos que os mapas genéticos.
• Existem várias técnicas
: o mapeamento de
restrição, que determina as posições dos sítios de
restrição no DNA e a hibridização in situ com
fluorescência (FISH), na qual os marcadores
podem ser visualmente mapeados a locais nos
cromossomos; e o sequenciamento do DNA
Correlação dos mapas genéticos,
citológicos e físicos, dos cromossomos
A localização cromossômica dos genes e outros marcadores moleculares podem ser mapeados
com base nas frequências de recombinação,
posição relativa de marcas citológicas ou distâncias físicas.
Correlação de mapas Genético, Citológico e
Físico
Mapas
• Genético: é baseado na frequência de recombinação.
• Citológico: é baseado no padrão de bandeamento
dos cromossomos.
• Físico: é baseado em distâncias moleculares.
• Marcadores âncora: são mapeados geneticamente e
fisicamente e podem ser usados para correlacionar os mapas.
Projetos Genoma
• Início da década de 80
: os métodos para
mapeamento
e
sequenciamento
de
fragmentos de DNA estavam em um estágio
de desenvolvimento que permitiu aos
pesquisadores pensar em projetos de
sequenciar todo o genoma humano.
• Foi feita uma colaboração internacional para
realizar o
Projeto do Genoma Humano
.
Projetos Genoma
• Os primeiros genomas sequenciados: pequenos vírus. • 1982: O genoma do bacteriófago λ, composto por
49.000 pb
• 1995: Haemophilus influenzae. Esta bactéria tem um pequeno genoma de 1,8 milhão de pares de base
• 1996: primeiro organismo eucariótico (levedura) • 1997: Escherichia coli
• 1998: Caenorhabditis elegans
• 2000: Drosophila melanogaster e Arabidopsis thaliana • 2000: O primeiro esboço do genoma humano foi
Haemophilus influenzae
Projeto do Genoma Humano
• O Projeto do Genoma Humano foi iniciado em outubro de 1990, com prazo de conclusão de 15 anos e foi dirigido por James Watson.
• O projeto contava com a participação de cerca de 5000 cientistas em 250 diferentes laboratórios.
• Em 1993, mapas físicos em grande escala foram completados para todos os 23 pares de cromossomos humanos.
• Ao mesmo tempo, as técnicas de sequenciamento automatizado haviam sido desenvolvidas, tomando factível o sequenciamento em larga escala.
Projeto do Genoma Humano
• O esforço inicial para sequenciamento do
genoma foi um
projeto público
consistindo na
colaboração internacional que formou o
Intemational Human Genome Sequencing
Consortium
.
Projeto do Genoma Humano
• Em
1998
, Craig Venter anunciou que lideraria
a empresa chamada
Celera Genomics
em um
esforço privado
de sequenciar o genoma
humano.
• Os esforços públicos e privados avançaram
simultaneamente, mas
usaram enfoques
diferentes
.
• O
Human Genome Consortium
usou um
enfoque baseado em
mapas
;
Projeto do Genoma Humano
• A
Celera Genomics
usou um enfoque
shotgun
de genoma inteiro para determinar a
sequência do genoma humano, embora os
mapas genético e físico produzidos pelo
esforço público tenham ajudado a Celera a
montara sequência final.
Projeto do Genoma Humano
• Em
1999
foi anunciado o primeiro rascunho do
genoma humano e o esboço inicial foi publicado
na revista científica Nature em fevereiro de
2001
com cobertura de cerca de 90 por cento do
genoma.
• Em
2003
, um comunicado de imprensa anunciou
que o projeto fora concluído com sucesso, com o
sequenciamento de 99% do genoma humano
Genomas no Brasil
• No Brasil também foram realizados projetos
genoma. O projeto
Genoma da FAPESP
começou
em 1997 e sequenciou o genoma da bactéria
Xylella fastidiosa
, que causa a praga do
amarelinho nos laranjais. Para realizar esse
projeto, formou-se uma rede com 192
pesquisadores.
• No Paraná também foi realizado um projeto
genoma (
GENOPAR
), que sequenciou o genoma
da
bactéria
fixadora
de
nitrogênio,
o
Metagenômica
• Hoje é possível sequenciar não apenas os
genomas de espécie individual, mas os
genomas de comunidades inteiras de
organismos.
• A metagenômica é um campo emergente de
tecnologia de sequenciamento no qual as
sequências de genoma de um grupo de
organismos que habitam um ambiente
comum são separadas e determinadas.
Metagenômica
• Analisa as comunidades microbianas ao extrair o
DNA do ambiente reconstrói a composição e
função da comunidade com base nas sequências
do genoma.
• Permite a identificação e análise genética de
espécies que não podem crescer no laboratório.
• Os genomas inteiros de algumas espécies
dominantes foram reconstruídos a partir de
amostras do ambiente, fornecendo muitas
informações sobre sua biologia.
Metagenômica
• Um estudo, chamado de Global Ocean Sampling
Expedition, seguiu a rota da viagem de Darwin no
H.M.S. Beagle nos anos de 1800. Os cientistas
coletaram amostras de oceano e usaram os
métodos metagenômicos para determinar suas
comunidades microbianas.
• As análises de genomas bacterianos encontrados
nas amostras do oceano levaram à descoberta de
proteínas proteorrodopsinas, que são bombas de
próton acionadas pela luz.
• Estas proteínas são encontradas em diversos
grupos microbianos e são uma fonte principal de
fluxo de energia nos oceanos do mundo.
Metagenômica
• Outros estudos metagenômicos examinaram os
genes das bactérias que habitam o trato intestinal
humano.
• Estas bactérias, junto com as que habitam a pele
e outras partes do corpo, são chamadas de
microbioma humano.
• O microbioma de uma pessoa inclui mais de 100
trilhões de células, mais de 10 vezes as células
humanas, e têm 100 vezes mais genes que o
genoma humano.
Metagenômica
• O microbioma humano é importante para a saúde. Um estudo examinou a flora do intestino de pessoas obesas e
magras.
• Dois grupos de bactérias são comuns no intestino:
Bacteroidetes e Firmicutes.
• As pessoas obesas tem mais Firmicutes do que as pessoas magras e que a proporção de Firmicutes reduz nas pessoas obesas que perdem peso com dieta de baixas calorias.
• Os mesmos resultados foram observados nos camundongos obesos e magros.
• Em um experimento, foram transferidas as bactérias dos camundongos obesos para os camundongos magros.
• Os camundongos que receberam as bactérias dos camundongos obesos extraíam mais calorias do seu alimento e armazenavam mais gordura.
Banco de dados
• O portal do NCBI permite acessar diferentes
bancos de dados
(http://www.ncbi.nlm.nih.gov/).
• Entre eles podemos destacar alguns como o
PubMed
, que permite busca na literatura
biomédica, o
OMIM
(online Mendelian
Inheritance in Man) e o banco de sequências
Bancos de dados
• Tem mais 200 milhões de sequências e mais de 300 bilhões de bases armazenadas (fev 2019).
• Temos o genoma completo de diversas espécies, como o homem, o chimpanzé e o cão, apenas para citar alguns, mas é possível sequenciar o DNA não apenas de espécies vivas, mas também a partir de material de espécies já extintas.
• Em 2010 foi publicado o rascunho do genoma do homem de Neandertal, que é evolutivamente muito próximo dos humanos atuais, e viveu na Ásia e Europa, tendo desaparecido a cerca de 30.000 anos atrás. O DNA foi extraído a partir de 3 fragmentos de ossos.
• Fragmentos de ossos de
Neandertal usados para a extração
de DNA.
• Fonte: Max Planck Institute for
Evolutionary Anthropology
• As sequências de DNA do
Neandertal podem ser acessadas
no banco de dados do Ensembl:
http://neandertal.ensemblgenomes.org/in dex.html
Genômica funcional
• Caracteriza o que as sequências fazem, sua
função.
• Os objetivos incluem a identificação de todas as
moléculas de RNA transcritas a partir de um
genoma - transcriptoma - e todas as proteínas
codificadas pelo genoma - proteoma.
• A genômica funcional usa a bioinformática e as
abordagens experimentais laboratoriais na sua
pesquisa para definir a função das sequências de
DNA.
(PIERCE)Genômica funcional
• A sequência de nucleotídios de um gene pode ser usada para prever a sequência de aminoácidos da proteína que ela codifica.
• A proteína pode então ser sintetizada ou isolada e suas propriedades estudadas para determinar sua função. • O objetivo principal da genômica funcional tem sido
desenvolver métodos computacionais que permitam que a função gênica seja identificada a partir da sequência de DNA sozinha, superando o processo trabalhoso de isolar e caracterizar as proteínas individuais. (PIERCE)
Pesquisas de homologia
• Um método computacional para determinar a
função gênica é fazer uma pesquisa de
homologia, que depende de comparações das
sequências de DNA e das proteínas do mesmo
organismo e de diferentes organismos.
• Os genes com uma evolução próxima são
chamados de homólogos.
• Os genes homólogos encontrados em diferentes
espécies que evoluíram a partir do mesmo gene
em um ancestral comum são chamados de
Pesquisas de homologia
• Os genes homólogos têm
a mesma linha de
evolução. Os ortólogos
são os genes homólogos
encontrados em
diferentes espécies,
enquanto os parálogos
são genes homólogos
encontrados na mesma
espécie
(PIERCE)Domínios da proteína
• As proteínas complexas têm, com frequência, regiões com formatos ou funções específicas chamadas de
domínios da proteína.
• Por ex., determinadas proteínas ligadoras de DNA se conectam ao DNA da mesma forma; essas proteínas têm um domínio em comum que desempenha a função de ligação ao DNA.
• Cada proteína tem uma disposição de aminoácidos comum a esse domínio. É provável que exista um número limitado, embora grande, de domínios de proteínas, que se misturaram e combinaram durante a evolução para gerar a diversidade de proteínas observadas nos organismos atualmente.
Domínios da proteína
• Já foram caracterizados muitos domínios de proteínas e suas funções moleculares foram determinadas.
• A sequência de um gene recém-identificado pode ser rastreada em comparação com um banco de dados de domínios conhecidos.
• Se a sequência de gene codifica um ou mais domínios cujas funções foram previamente determinadas, a função do domínio pode fornecer informações importantes sobre uma possível função do novo gene.
Expressão gênica
• Muitos indícios importantes sobre a função do
gene provêm do conhecimento de quando e
onde os genes são expressos.
• O desenvolvimento de microarranjos permitiu
que a expressão de milhares de genes seja
monitorada simultaneamente.
• O
RNA-Seq
o
sequenciamento
do
transcriptoma.
Genômica comparativa
• O sequenciamento de genomas fornece informações sobre o conteúdo e a organização dos genes em diferentes espécies e até em diferentes membros da mesma espécie, permitindo inferências sobre como os
genes funcionam e como os genomas evoluem.
• Fornece informações importantes sobre as relações evolutivas entre os organismos e sobre fatores que influenciam a velocidade e a direção da evolução.
• A genômica comparativa é o campo da genômica que compara as semelhanças e diferenças no conteúdo, função do gene e a organização entre os genomas de diferentes organismos. (PIERCE)
Função dos genes
• O número de genes que codificam funções biológicas como transcrição e tradução tende a ser semelhante entre as espécies, mesmo quando seus genomas têm tamanhos muito diferentes.
• Esta semelhança sugere que estas funções são codificadas por um conjunto básico de genes que não varia entre as espécies.
• Por outro lado, o número de genes que participam de
biossíntese, metabolismo de energia, transporte e funções reguladoras varia muito entre as espécies e
tende a ser maior nas espécies com genomas maiores.
Duplicações segmentares
• Parte dos genomas eucarióticos são preenchidos com
duplicações segmentares, regiões com mais de 1.000 pb
quase idênticas na sequência.
• Por ex., cerca de 4% do genoma humano têm duplicações segmentares.
• As duplicações segmentares surgem a partir de processos que geram duplicações cromossômicas, como um crossing
over desigual .
• Esta duplicação é importante na evolução ao dar origem a novos genes.
• Após surgir uma duplicação segmentar, a cópia original do gene pode continuar sua função enquanto a nova cópia sofre mutação.
• Estas mudanças podem consequentemente levar a uma nova função.
Duplicações segmentares
• A importância da duplicação do gene na evolução do genoma é demonstrada pelo grande número de famílias de multigenes que existem em muitos genomas eucarióticos. • Uma família de multigenes é um grupo de genes
evolutivamente próximos que surgem por meio de evolução repetida de um gene ancestral.
• Por ex., a família do gene da globina nos humanos é composta por 13 genes que codificam moléculas semelhantes à globina, a maioria dos quais produz proteínas que transportam oxigênio.
• Outro ex.: a família de multigenes olfatórios humanos, composta por cerca de 1.000 genes que codificam as moléculas receptoras olfatórias.
DNA não codificador
• Em 2002, o projeto Encyclopedia of DNA Elements (ENCODE) foi criado para determinar se o DNA não codificado tinha alguma função.
• Este projeto de 10 anos foi feito por uma equipe de mais de 400 cientistas ao redor do mundo. Em uma série de artigos publicados em 2012, ENCODE concluiu que pelo menos
80% do genoma humano está envolvido em algum tipo de função gênica.
• Muitas das sequências funcionais eram compostas por sítios onde as proteínas se ligavam e influenciavam a
expressão dos genes. Antes deste estudo, parte do genoma
era considerada “DNA lixo” sem função, mas o estudo ENCODE modificou significativamente esta visão e sugere que existe pouco DNA não funcional no genoma humano.
Colinearidade
• Uma das características da evolução do genoma revelada pela comparação das sequências de genes de diferentes organismos é que muitos genes estão presentes na mesma ordem nos genomas relacionados, um fenômeno chamado colinearidade. • O motivo para a colinearidade entre os genomas é que
eles descendem de um genoma ancestral comum e as forças evolutivas mantiveram a mesma ordem de genes nos genomas dos descendentes.
• Os estudos genômicos das gramíneas, as plantas da família Poaceae, ilustram o princípio da colinearidade.
Proteômica
• É a ciência que estuda o
conjunto
de
proteínas
Proteômica
• Algumas aplicações:
• Desenvolvimento de drogas a partir de
proteínas
• Estudos básicos de biologia celular e molecular
• Modificações pós-traducionais
• Identificação de marcadores moleculares:
– Desenvolvimento; – Doenças;
Proteômica
Separação das proteínas
Eletroforese bidimensional:
• Primeira dimensão
: focalização isoelétrica, que
separa as proteínas em função da sua carga.
• Segunda dimensão
: as proteínas são separadas por
peso molecular.
• O gel é corado com azul de Coomassie ou com prata.
• Pontos no gel são proteínas que migraram para locais
Proteômica
• Um ponto no gel pode ser recortado e analisado em um espectrômetro de massa.
• O mapeamento de massa identifica uma proteína partindo-a em peptídeos curtos e deduz depois a identidade da proteína através da comparação entre as massas observadas dos peptídeos e uma base de dados de sequências.
• A espectrometria de massa sequencial, por outro
lado, pode obter a informação sequencial de peptídeos individuais isolando-os, fazendo-os colidir com um gás não reativo e catalogando em seguida os íons dos fragmentos assim produzidos.
Focalização isoelétrica
• As moléculas anfotéras migram sob a ação de um campo elétrico em um gel contendo um gradiente de pH. A migração se interrompe quando as proteínas atingirem seu ponto isoelétrico.
Focalização isoelétrica
• Gradientes imobilizados de pH - IPGFocalização isoelétrica
• Reidratação das tiras e aplicação das amostrasEletroforese em gel de poliacrilamida
(SDS-PAGE)
• As proteínas reduzidas migram sob a ação de um campo elétrico e a separação ocorre de acordo com o peso
molecular da proteína em relação ao tamanho dos poros do gel.
Banco de dados
• A partir das massas detectadas para os
peptídeos é possível comparar o espectro
obtido com os espectros teóricos de proteínas
depositadas em bancos de dados.
Exemplo de aplicação: Câncer
•Comparative proteomics analysis of human
gastric cancer
•Wei Li, Jian-Fang Li, Ying Qu, Xue-Hua Chen, Jian-Min Qin, Qin-Long Gu, Min Yan, Zheng-Gang Zhu, Bing-Ya Liu