Organização gênica de
procariotos e eucariotos:
genes, cromossomos e genomas
Biomedicina – CMRV Biologia Molecular Profa. Renata Canalle
Árvore filogenética universal, apresentando os três domínios da vida (rRNA 16S)
http://www.unb.br/ib/cel/microbiologia/archaea/archaea.html
PROCARIOTOS: - unicelulares
- ausência de núcleo
- DNA organizado em um único cromossomo; sem histonas
A evolução do conceito de gene
• Classicamente, definido como a porção do cromossomo que determina ou afeta uma característica ou fenótipo
• Palavra criada para denominar os “fatores” propostos por Mendel
Beadle e Tatum (1940)
1 gene = 1 enzima
1 gene = 1 proteína
Mas nem todas as proteínas têm função enzimática; então :
Como muitas proteínas são formadas por várias cadeias polipeptídicas : 1 gene = 1 cadeia polipeptídica
Vários genes não se expressam como proteínas : RNAt, RNAr, snRNA...
Conceito:
uma unidade hereditária.
Conceito em termos moleculares:
uma seqüência de DNA
necessária e suficiente para a síntese de algum produto
funcional (RNA ou proteína), com função estrutural ou
catalítica.
Expressão de um gene
-Transcrição (mRNA)
Promotor
A
B
C
Genes transcritos em uma
unidade transcricional
Seqüências regulatórias
Repressor
Sítio de ligação
do ativador
DNA
mRNA
Transcrito policistrônico
A
B
C
Proteínas
A
B
C
Estrutura dos genes procarióticos
Os genes procarióticos não são interrompidos por
seqüências não-codantes
Um operon é uma unidade funcional do genoma
5’
3’
Sinal de término da transcrição
Estrutura dos genes eucarióticos
Intron
Exon
Exon
Início da
informação
biológica
Término da
informação biológica
5´
3´
A informação gênica é interrompida por sequências não-codantes
Éxon : expressed sequence Íntron : intragenic sequence
Estrutura geral de um gene humano típico
A informação gênica é interrompida por sequências não-codificantes
5’UTR 3’UTR upstream dowstream (TAA) (AATAAA) (ATG)
Estrutura geral de um gene humano típico
A informação gênica é interrompida por sequências não-codificantes
Podem diferir quanto ao número de éxons, pb e elementos seqüências do promotor genes histoespecíficos upstream dowstream
Estrutura geral de um gene humano típico
A informação gênica é interrompida por sequências não-codificantes
5’ 3’
GU GU
PROMOTOR: uma seqüência de DNA situada na extremidade 5’ de um gene, à qual
uma RNA-polimerase se liga de maneira a iniciar a transcrição do DNA em RNA
ÉXON: segmento do DNA ou de um gene que codifica aminoácidos e é mantida no
RNA mensageiro (mRNA), após o processamento do RNA primário (hnRNA)
ÍNTRON: segmento de DNA ou de um gene que se intercala aos éxons e não codifica
aminoácidos, nem é mantido no RNA mensageiro (mRNA), após o processamento do RNA primário (hnRNA)
REGIÃO NÃO-TRADUZIDA (UTR): qualquer região do mRNA que não codifica
proteína
GENE DE MANUTENÇÃO (“housekeeping gene”): gene que se expressa na maioria
das células ou em todas elas, porque seu produto desempenha funções básicas para a manutenção ou metabolismo celular
Cromossomos
As moléculas de DNA :
• São constituídas por genes e por seqüências não-codantes
• São as maiores macromoléculas das células
• São altamente empacotadas em estruturas chamadas
cromossomos
capsídio
DNA
(descompactado)
Bacteriófago T lambda Bactérias e vírus : geralmente contêm 1
cromossomo (maioria circular)
Eucariotos : vários cromossomos (lineares – proteção das extremidades/telômeros)
Conjunto de todos os genes
e DNA intergênico de um
organismo : GENOMA
Genoma viral
Carregam pouca informação genética
Genoma de Procariotos
E. Coli : 1 molécula de DNA dupla fita circular com genes essenciais
Elementos extra-cromossômicos : plasmídeos
4.639.221 pb
Altamente empacotado
4.300 genes
(incluindoORF – fase aberta de leitura)
ORF = matriz de leitura aberta (o intervalo entre os códons iniciador e de
Genoma de Procariotos
E. Coli : 1 molécula de DNA dupla fita circular com genes essenciais
Elementos extra-cromossômicos : plasmídeos
oriC
terC
- Replicação bidirecional- 87,8% = genes que codificam proteínas (ou ORFs)
- 0,8% = genes que codificam RNAs
- 11,4% = seq. regulação, seq. repetidas
Genoma de Procariotos
•
Tamanho pequeno e compacto: quase exclusivamente para codificação de proteínas•
0,6 x 106 pb (Mycoplasma genitalium, parasita intracelular de mamífero) a 9,5 x 106 pb (Myxococus xanthus)•
Sobreposição de genes: mesma seqüência codifica duas proteínas diferentes•
Maioria dos genes: cópia única•
Pouca redundância: genes duplicados que são selecionados positivamente e fixados no genoma – rRNA (7 cópias)•
Seqüências nucleotídicas curtas (10 a 103 pb) e repetidas: 2% do genoma•
Elementos genéticos móveis: bacteriófagos, plasmídeos, elementos transponíveis – transferência genética horizontal → plasticidade aos genomas (processo evolutivo)Densidades Gênicas dos genomas de diferentes organismos
Existe uma correlação inversa entre a complexidade do organismo e sua densidade
gênica: organismos mais
complexos apresentam densidade gênica menor O tamanho do genoma está relacionado com a
complexidade do organismo
(complexidade de um genoma: é a sua extensão total, medida em pb, que é constituída por sequências diferentes)
Aumento no tamanho do gene Aumento no DNA entre os genes
Densidades Gênicas dos genomas de diferentes organismos
Existe uma correlação inversa entre a complexidade do organismo e sua densidade
gênica: organismos mais
complexos apresentam densidade gênica menor
Aumento no tamanho do gene Aumento no DNA entre os genes
(seqüências intergênicas)
Os genes individuais são mais longos:
1. Organismos mais complexos, significativo aumento nas regiões de DNA
necessárias para direcionar e regular a transcrição – sequências regulatórias 2. Regiões codificantes descontínuas - íntrons
Frações de DNA repetitivo apresentam baixa complexidade, pois são constituídos por um número relativamente pequeno de seq. diferentes Fração de DNA não-repetitivo: complexidade elevada
Plasmídeo DNA bacterial Gene de resistência a antibióticos Gene de transferência de DNA
Plasmídeos
pequenas moléculas de DNA circular: poucas centenas até 105 bases
Capacidade de auto-duplicação independente
Geralmente não carregam genes essenciais
Podem carregar genes de resistência a antibióticos
alguns promovem a reprodução entre bactérias (conjugação); outros possuem genes que matam outras bactérias
engenharia genética: vetores de clonagem
Elementos Transponíveis ou de Transposição
São segmentos de DNA que possuem a notável propriedade de mudar de posição dentro do genoma, podendo mover-se de um ponto a outro do mesmo cromossomo, mudar de cromossomo ou, eventualmente, transpor-se do genoma de uma espécie para outra
- Mutação e rearranjo genômico, troca de material genético → fonte de variabilidade genética
- Inserção errada (modifica a estrutura e a expressão do gene - mutação): câncer, doenças hereditárias
- Rearranjos estruturais: deleções, duplicações, inversões e fusões cromossômicas
Relevância: conseqüências sobre o material genético, evolução (parasitas “egoístas” do genoma x fonte de variabilidade), ferramenta
Elementos Transponíveis ou de Transposição
Características comuns:
- Possuem seqüências nucleotídicas muito similares em ambas as extremidades (repetições terminais)
- Carregam um ou mais genes que codificam enzimas capazes de transportá-los - Criam pequenas duplicações do sítio-alvo da inserção
- Existem em cópias múltiplas no genoma
genes para trasposição
3’ 5’
Elementos Transponíveis ou de Transposição
conservativa
replicativa
Classificação geral:
Classe I – se movem via RNA (retrotransposons)
Classe II – se movem como seqüências de DNA (transposons)
Classe III – mecanismo de transposição desconhecido
Elementos Transponíveis em procariotos (classe II)
Seqüências de DNA que codificam enzimas (transposases) capazes de catalisar a sua própria replicação e transferência para outros sítios do genoma → transposição
IS
Elementos Transponíveis
Seqüências de DNA que codificam enzimas (transposases) capazes de catalisar a sua própria replicação e transferência para outros sítios do genoma → transposição
Estruturas terciárias do DNA:
formas de DNA, supertorção,
compactação
Superespiralamento : espiral de uma espiral
Função fundamental na organização do DNA em nucleossomos ou nucleóides: importante em processos como replicação, transcrição e expressão gênica
DNA plasmidial
Formas de superenrolamento
a) Plectonêmico
• Espirais formam estruturas alongadas e estreitas, com pontos
de ramificação; enrolamento sobre si mesma
b) Solenoidal
A espiral esta organizada em voltas apertadas (como mangueira de
jardim enrolada numa carretilha, espiral do fio de telefone)
Pode ser mantida por
proteínas: forma do DNA
enrolado em proteínas,
como as histonas, nos
nucleossomos
Topoisomerases
DNA girase
Topoisomerases
DNA girase
Permitem alterações no grau de
superenrolamento; quebra
transitória de ligações fosfodiéster
importantes na replicação, transcrição, recombinação, remodelagem da cromatina, evitam tensão no DNA (relaxamento)
Compactação do DNA
compactação
Esquema representativo da compactação do DNA num nucleóide bacteriano
40-50 kb de DNA
- 1 cromossomo humano médio : 2 m de DNA/célula
- Cromossomo de E. coli : 1,7 mm (850 vezes o tamanho da célula)
Os cromossomos eucarióticos
Moléculas de ácido nucléico que contém a informação genética;
corpos densamentes corados vistos no núcleo
Característico de células em divisão
Compactação do DNA
Intérfase: cromatina (eucromatina e heterocromatina)
Divisão celular: cromossomos (cromatina muito condensada)
Cromatina
Material cromossômico amorfo e casualmente disperso no núcleo
(cromossomo descondensado)
Consiste em fibras de DNA e proteínas, junto com uma pequena
quantidade de RNA
Cada “conta” : octâmero de histonas – 2 H2A, 2 H2B, 2 H3 e 2 H4
Histonas
• Ricas em lisina e arginina (aa básicos)
• 5 classes de histonas : H1, H2A, H2B, H3 e H4
O nucleossomo está organizado em fibras de 30 nm
O nucleossomo está organizado em fibras de 30 nm
Cristalografia de raio X
Compacta 10.000 vezes
A cromatina ativa
Acetilação de histonas – atividade transcricional (cromatina descompactada) Desacetilação de histonas – ausência de transcrição (cromatina compactada) HATs: acetiltransferases de histonas (coativadores transcricionais)
HDACs: desacetilases de histonas (repressores) Terapia do câncer
Cinética de Renaturação de DNA: detecção de sequências repetidas
Primeiro detalhamento da frequência e da complexidade das sequências repetidas de DNA em eucariotos resultou de estudos das velocidades de
renaturação do DNA – a 100oC desnaturação de DNA
Velocidade de renaturação dependerá:
(1) concentração de DNA na solução: quanto mais alta a concentração de filamentos únicos na solução, maior a chance de uma colisão entre quaisquer dois deles (complementares)
(2) da complexidade do DNA: é o tamanho total de sequências de pares de nucleotídeos não repetidos no genoma. À medida que a complexidade do DNA aumenta, a proporção de colisões aleatórias entre filamentos únicos de DNA que estão entre filamentos únicos complementares diminuirá → taxa de
renaturação ↓
Grandes genomas (eucariotos) → aumenta número de genes → renaturação lenta
C
0t
C
0Cinética de Renaturação de DNA: detecção de sequências repetidas
Surpreendentemente, algumas sequências de DNA nos genomas complexos de eucariotos renaturam-se muito rapidamente
Sequências repetidas muitas vezes no genoma (1 milhão de vezes ou
mais): presente em concentração maior que uma sequência de cópia única durante renaturação → ↑ velocidade de renaturação / ↓ C0t
Velocidade de renaturação do DNA é diretamente proporcional ao número de cópias
Hibridação in situ → também usado para localizar sequências diferentes de DNA (principalmente tipos diferentes de sequências de DNA repetitivo em genomas eucarióticos)
Sequências de DNA de Cópia única e repetitivas em Genomas Eucarióticos
As sequências de DNA presentes em eucariotos são comumente agrupadas
em três classes:
1. Sequências únicas, ou de uma só cópia, de DNA – 1 a 10 cópias por
genoma haplóide (maioria dos genes que codificam proteínas) - ↑ C0t (reassociam-se mais lentamente; componente lento)
2. Sequências de DNA moderadamente repetitivas – 10 a 105 cópias por genoma haplóide (proteína ribossômica/rRNA, proteínas musculares actina e miosina; que são necessárias em grandes quantidades, e cada uma delas é codificada por vários genes) –
componente intermediário
3. Sequências de DNA altamente repetitivas – mais de 105 cópias por genoma haplóide (não codificam proteínas/nunca foram transcritas: centrômeros, transposons, VNTRs, STRs) - ↓ C0t (reassociam-se mais rápido; componente rápido)
Genes funcionais,
cópia única DNA repetitivo DNA espaçador
Seqüências sem função conhecida Seqüências funcionais Famílias de genes codificantes (e pseudogenes correlatos) Seqüências funcionais não-codificantes Repetições em heterocromatina centromérica Número variável de repetições em tandem Seqüências transpostas
Transposons transposons Retro-Famílias de genes dispersos Famílias de genes em tandem
DNA
30.000-40.000 genes Moderadamenterepetitivo Altamente repetitivo
Genoma Humano
5%
5’ 3’
GU GU
Genes funcionais
Seqüências individuais presentes em apenas uma cópia por genoma haplóide Genes estruturais
Distribuição variada entre os diferentes cromossomos Regiões subteloméricas
Codificam polipeptídios que integram enzimas, hormônios, receptores, proteínas estruturais e reguladoras
Organização interna é diferente : quanto maior o gene, menor o conteúdo de éxons, maior o tamanho dos íntrons
Diversidade de tamanho dos genes
Funções dos genes
Genes codificando para proteínas
Expressão, duplicação e manutenção do genoma Transdução de sinais Funções bioquímicas gerais Várias outras atividades celulares
Genes codificando para RNAs
RNAr
RNAr 28S, 5.8S, 5S
RNAr 5 S
Sub-unidade maior do ribossomo
Sub-unidade menor do ribossomo
RNAt
>40 tipos
Reconhecem os códons no RNAm
snRNA
(small nuclear RNA)
U1, U2, U4, U5,
U6
Spliceossomo
snoRNA
(small nucleolar RNA)
U3, U8
Processamento do RNAr
Outras classes
RNA 7SL
Transporte de proteínas
RNA da telomerase
Os genes não estão distribuídos uniformemente pelo genoma
0,9 Mb - 70 genes
2,4 Mb
Gene da distrofina
Densidade gênica
Agrupamento de ilhas CpG no genoma humano vermelho: ilhas CpG (ricos em genes)
verde: região de replicação tardia (pobres em genes)
Ex.: genes mitocondriais e alguns genes nucleares (ex.: HLA)
Os genes podem estar sobrepostos
Subunidade 8 da ATPase, do nucleotídeo 8366 ao 8569; Subunidade 6 da ATPase , do 8527 ao 9204
Seqüências repetidas funcionais
Famílias de genes dispersos (famílias multigênicas)
De apenas alguns a centenas de genes (Ex. globina, imunoglobulinas, sistema HLA) Muitos genes de funções similares – duplicação seguida de divergência evolutiva Genes que se tornam não-funcionais – pseudogenes (Ψ)
Seqüências repetidas funcionais
Famílias de genes em tandem (famílias multigênicas)
Produtos gênicos necessários em grandes quantidades (Ex. histonas, genes para rRNA, tRNA)
Originados por duplicação
Genes de histona de ouriço-do-mar
Genes de histona da mosca das frutas
Famílias de genes em tandem (famílias multigênicas) Ex.: rRNA 3 17 21 (D e G) Braço Curto (p) Braço Longo (q) p q p q Telômero (TTAGGG) satélite (possui as múltiplas cópias repetidas dos genes para RNA
ribossômico)
Constrição primária
Constrição secundária
Seqüências repetidas funcionais
Não-codificantes
Seqüências teloméricas (TTGGGG em Tetrahymena e TTAGGG em humanos)
Fim do cromossomo
Replicação
e
e
Primer de RNA removido e
ligação dos fragmentos de DNA
Primer de RNA
Seqüências repetidas funcionais
Não-codificantes
Seqüências teloméricas (TTGGGG em Tetrahymena e TTAGGG em humanos)
e
Primer de RNA removido e
ligação dos fragmentos de DNA
Primer de RNA
DNA recém sintetizado
Telomerase
Nucleotídeo Molde de
RNA
DNA altamente repetitivo
• In tandem : DNA satélite, minissatélites e microssatélites – Ex.: ttagttagttag
• Dispersos : elementos transponíveis : LINE, SINE
Localização
Telômero (minissatélite TTAG)
Centrômero (DNA alfóide, β satélite)
Microssatélites (amplamente dispersos pelo genoma) LINE-1
(bandas escuras)
Seqüências sem função conhecida
DNA altamente repetitivo flanqueando o centrômero Banda “satélite” em gradiente de cloreto de césio
Repetições de seqüências curtas com centenas de kb Localizados em regiões heterocromáticas
DNA altamente repetitivo em
Seqüências sem função conhecida
Número variável de repetições em tandem (VNTRs) Seqüências de 1 a 5 kb de 15 a 100 pb repetidos Base do fingerprints de DNA
DNA minissatélite
Sangue corado
suspeitos DNA altamente repetitivo em tandem
DNA – Nuclear – VNTRs
Gene da mioglobina
Éxon 1 Éxon 2 Éxon 3
4 repetições em tandem
Repetições de 33 pb
Cromossomos homólogos
Seqüências sem função conhecida
DNA microssatélite – STRs (repetições curtas em tandem) Repetições em tandem de 2-4 pb
Raramente em seqüências codificadoras
Próximos aos genes associadas a doenças hereditárias: retardo mental ligado ao X frágil
ATACATCACACGTCTGCTGGATGCTTCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGC TGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTG CTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCT GCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGC TGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTG CTGTTCTGCACCGTTAGTGCTGTCCTGGTA (CTG)101 DNA altamente repetitivo em tandem Homem: 100.000 microssatélites
Mecanismos de aumento ou diminuição de repetições
Replicação do DNA
Aumento do número de repetições
Diminuição do número de repetições
primer fita nova
fita molde
Fita nova desliza Nova replicação
primer fita nova
fita molde
Fita molde desliza
Mecanismos de aumento ou diminuição de repetições
Replicação do DNA:
deslizamento das fitas
Mecanismo de variação no número de repetições em tandem
Crossing-over
desigual
Aumenta no repetições
Diminui no repetições
Seqüências sem função conhecida
Seqüências transpostas
Elementos repetitivos que se fazem cópias de si mesmos Transposons que se movem como DNA
Retrotransposons que se propaga pela ação da transcriptase reversa
LINEs (longos elementos intercalares): de 1 a 5 kb, de 100.000 a 500.000 cópias, L1 SINEs (curtos elementos intercalares): 300 pb, 10% do genoma, repetições Alu
Geram mutações – doenças hereditárias; inativação insercional de genes importantes
50% do genoma
Heterocromatina
centromérica Organizador nucleolar
DNA altamente repetitivo disperso
Transposição através de um DNA intermediário Transposons Não produzem transcriptase reversa Elementos transponíveis Transposição através de um RNA intermediário Produzem transcriptase reversa Família não-viral Pseudogenes processados Ex.: família Alu
(SINE) Família viral Têm LTRs e outros elementos de Retrovírus Ex. HERV Sem LTRs ou outros elementos Retrovírus Ex.: LINE-1
Elementos transponíveis humanos
DNA espaçador
Pouco se sabe sobre
Possivelmente sua única função é espaçar Nenhum estudo realizado
Pequena parte do genoma contém seqüências codantes
DNA – Mitocondrial
DNA Mitocondrial
Circular de cadeia dupla
Não apresenta crossing-over, íntrons e arcabouço de histonas, nem reparo Compacto (16,6 kb)
37 Genes: para rRNA, tRNA e para polipeptídeos necessários para produção de ATP Herança materna; acúmulo de mutações DNAmt – relógio evolutivo
Heteroplasmia: replicação independente do núcleo e distribuição para as células filhas também; variação no número de mitocôndria nas células somáticas e de mutações
GENOMA MITOCONDRIAL
Conteúdo : 44% G/C
Fitas com composição diferente
Fita pesada
(heavy)
Fita leve
(light)
Rica em G
Rica em C
Genes mitocondriais
37 genes
28
Fita H
9
Fita L
24 RNA : 22 tRNA, 2 rRNA
13 proteínas da cadeia
Estrutura do genoma mitocondrial
Origem e direção da síntese das fitas pesada (OH) e leve (OL) Origem e direção da transcrição das fitas pesada (PH) e leve (PL)
Genes RNAr Genes RNAt
Genes codificando proteínas
Genoma Nuclear x Genoma mitocondrial
Nuclear Mitocondrial Tamanho No mol. DNA diferentes 23 (XX) ou 24(XY), lineares 1, circular No total de moléculasDNA/cél. 23 (haplóide), 46 (diplóide) milhares Proteínas associadas Histonas e não-histonas Sem proteínas
No genes ~ 30 000 37
Densidade gênica ~ 1/40 kb ~ 1/0,45 kb
DNA repetitivo Grande parte Muito pouco
Transcrição Genes transcritos
individualmente
Transcrição contínua de muitos genes
Íntrons Freqüentes Ausentes
% DNA codante ~3% ~93%