Genômica
Definições
• Genoma: informações do complemento genético de um indivíduo ou de sua espécie
– freqüentemente entendido como a seqüência de nucleotídeos do genoma
• Genômica: o estudo dos genomas (ou de suas
• Genômica: o estudo dos genomas (ou de suas seqüências)
• Transcriptoma: o conjunto de mRNAs presentes em um indivíduo, orgão ou célula
• Proteoma: o conjunto de proteínas presentes em um organismo, órgão ou célula
Total de Projetos Genoma
(15/05/07) • 2516 Projetos – 556 genomas completos • em andamento – 1108 Eubacterias – 1108 Eubacterias – 59 Archaea-bacterias – 720 eucariotos– 73 metagenomas (DNA extraído do meio: solo, água, etc)
Primeiro genoma bacteriano
– Fleishmann et al. (1995)
• Haemophilus influenzae - Rd
• Publicação: Science v. 269: 496-512 (1995) • tamanho do genoma: 1,83 Mb
Segundo genoma bacteriano
– Fleishmann et al. (1995)
• Mycoplasma genitalium – G37 • Mycoplasma genitalium – G37
Causadora da tuberculose
• Mycobacterium tuberculosis
– Whole-Genome Comparison of
Mycobacterium tuberculosis Clinical and Laboratory Strains.
J. Bacteriol. v. 184:5479-5490 2002. J. Bacteriol. v. 184:5479-5490 2002.
Causadora de úlceras gástricas
• Helicobacter pylori
– The complete genome sequence of the gastric pathogen Helicobacter pylori. Nature 7;388(6642):539-47, 1997
Eucariotos
• Saccharomyces cerevisae (1996) – 13 Mb • Plasmodium falciparum (2002) – 22.9 Mb • Caenorhabditis elegans (2002) – 100 Mb • Caenorhabditis elegans (2002) – 100 Mb • Anopheles gambiae (2003) – 278 Mb • Homo sapiens (2003) – 2900 Mb • etcUtilização das informações dos genomas
• informações úteis para compreensão deproblemas causados envolvendo: – saúde pública
– elaboração de estratégias para controle ou – elaboração de estratégias para controle ou
erradicação dos agentes etiológicos
– descoberta de terapias – etc
Projeto Genoma Humano
1991 • conseguir as seqüências completas dos 46cromossomos (todos os genes)
• duração da proposta: cerca de 15 anos • custo: alguns bilhões de dólares
Começar com o quê?
• O DNA é o material genético
• A informação genética é codificada na ordem dos nucleotídeos (A, T, C e G)
• O genoma teria ao redor de 109 pb
• O genoma teria ao redor de 109 pb
• Estudos de genética molecular indicavam: – um nível básico de organização do genoma
– a natureza dos genes, existência de elementos de regulação e outros componentes do genoma
Objetivos a serem atingidos
• a seqüência bruta do genoma humano – bilhões de As, Ts, Cs e Gs
• a partir daí deduzir:
– a seqüência de todos nossos genes – a seqüência de todos nossos genes
– a seqüência de todas proteínas expressas
• estudos de doenças e/ou malformações genéticas
– estabelecer relações evolutivas – mecanismos de regulação gênica
– determinar as bases das doenças genéticas e suas suscetibilidades
Abordagem:
seqüenciamento por shotgunVetores podem ser de diferentes tipos: • plasmidios
• cosmidios • BACs
Abordagem:
seqüenciamento por shotgun • gerar enorme quantidade de seqüências defragmentos de DNA humano utilizando procedimentos automatizados
• montagem destas seqüências com auxilio de • montagem destas seqüências com auxilio de
computadores gerar seqüências
completas
• anotar as seqüências (identificação dos genes, etc) por computação
Abordagem: seqüenciamento por shotgun
• na media são obtidas seqüências de cerca de 500 pb com boa qualidadeEstatísticas do genoma humano:
• total de seqüências: 3,09 x 109 pb – lote haplóide
– incluindo ambos os cromossomos X e Y
• existem cerca de 400 “gaps” em lugares • existem cerca de 400 “gaps” em lugares
conhecidos (isto de refere a 1% do total de DNA) • porcentagem de acerto: 99,99%
• custo: US$ 2,7 x 109 • site para download:
Banco de genes do NCBI
Crescimento do banco de genes entre 08/2000 - 2005
Composição do genoma humano
• montagens de pedaços de seqüências com boa qualidade obtidos de vários indivíduos • não se trata do genoma de nenhuma pessoa • não se trata do genoma de nenhuma pessoa
em particular
• presumivelmente poderá gerar um individuo humano funcional
A busca por genes!!!!
• proteínas que estão relacionadas à maioria dos processos que ocorrem nas células vivas
– proteínas normais – processos adequados
– proteínas anormais – quadros de doenças!!!! – proteínas anormais – quadros de doenças!!!!
• metabolismo
• desenvolvimento
• susceptibilidade de acometimento
• as proteínas são codificadas por genes
– assim a identificação dos genes passa a ser o
A busca por genes!!!!
• identificação automatizada de ORFs (“open reading frames”) ou fase de leitura aberta
– seqüências de nucleotídeos do DNA que podem ser usadas para predizer a seqüência de
aminoácidos de proteínas em geral aminoácidos de proteínas em geral
• utilização do código genético
– sinais genéticos típicos da linguagem genética dos sistemas celulares
• TATA boxes; genes promotores; genes reguladores; códons de inicio e de término, etc
Funções dos genes
• cerca de 30.000 genes foram identificados no genoma humano
– duas vezes mais do que na Drosophila – cinco vezes mais do nas leveduras
– cinco vezes mais do nas leveduras
• cerca de 50 % dos genes do genoma humano são idênticos ou muito semelhantes a outros já descritos (rato, verme, etc)
Contabilidade ...
• a quantidade total de genes corresponde a 1,5% do total de DNA do genoma
– introns contam uma parcela muito grande deste valor
valor
– outra parte grande corresponde aos transposons (que são elementos genéticos móveis) sem função conhecida
• muitos de nossos genes foram recebidos de bactérias e/ou outros invertebrados
Introgressões ao genoma...
• velocidade: + ou – 600 Megabases/ano
(depois da divergência entre Procariotos e Eucariotos)
• tais genes codificam para: •
– proteínas comuns à espécies filogeneticamente mais próximas
• enzimas
• proteínas estruturais • proteínas de defesa
Contribuições dos pesquisadores da UNESP/Campus de Jaboticabal
Laboratórios envolvidos:
• Lab de Biologia Molecular
• Lab de Bioquímica de Microrganismos • Lab de Genética de Bactérias
Dpto de Tecnologia Dpto de Biologia
Características de alguns genomas
bacterianos
Comparações de tamanho
Xylella fastidiosa
Xanthomonas citri Xylella fastidiosa
Causadora do Amarelinho
• Xylella fastidiosa
– The genome sequence of the plant pathogen Xylella fastidiosa. Nature 406, 151 - 157 (2000).
Causadora do Mal de Pierce
• Comparative Analyses of the Complete Genome Sequence of Pierce’s disease and Citrus
variegated Chlorosis strains of Xylella fastidiosa. J. Bacteriol. Xylella fastidiosa. J. Bacteriol. v.185:1018-1026, 2003.
Comparações entre as duas Xylellas
(MUMmer)
Delcher et al 1999Uso de informações do genoma para
definição de rotas metabólicas
Criação de meios definidos
• inclusão de aminoácidos específicos e necessáriosCurvas de
Curvas de
Crescimento
Crescimento
Formação de biofilme
• fechas indicam o local de crescimento do
Detecção do Transposon TN1721
em X. fastidiosa
Avaliação de diversidade genética
• detecção da presença de elementos transponíveis ou de suas “pegadas” deixadas no genoma de bactérias hospedeiras
hospedeiras
• isolados de citrus, café, videira e etc.
Padrões de RFLP dos produtos de
PCR do TN1721
Alinhamento de seqüências do
TN1721
Causadoras do cancro cítrico
• Xanthomonas axonopodis pv. citri • Xanthomonas campestris pv. campestris pv. campestris.• Comparison of the genomes of two Xanthomonas pathogens with differing host specificities. Nature 417, 459 - 463 (2002).
Comparações entre as duas
Comparações entre as duas
Xanthomonas
• Genes específicos
– 800 genes para X. axonopodis pv. criti
Ilhas Genômicas e evolução das
bactérias
• ilhas genômicas
– Hacker & Kaper
Ann. Rev. Microbiol. v. 54:641-679 (2000)
• definição
– variação no conteúdo de pares – variação no conteúdo de pares
C+G
• surgimento
– transferência lateral de genes
• composição
– genes de virulência; patogenicidade,etc