! Uma forma gráfica de retratar os processos históricos que geraram a diversidade
! Mostra graficamente as relações evolutivas
• A diferença entre genealogia e filogenia é tênue.
filogenia
genealogia
genealogia filogenia
Fluxo gênico interrompido
Interrupção+do+ fluxo+gênico+
! A forma tradicional de representar as relações evolutivas é através de árvores
A" B" C" D" nó+ raiz+ ramo+interno+ ramo+externo+ táxon+terminal+ou+OTU+ grupo"externo"
A" B" C" D" A+ B+ C+ D+ A+ B+ C+ D+
Diferentes árvores com a mesma topologia
! Descrição das relações entre os táxons terminais
(+(++(++A+++,++++B+++)++,+++C+++)++,+D++)+
2+dimensões+
! Embora teoricamente simples, não é sempre fácil observar os padrões da diversidade
?"
! Para quatro organismos, existem 15 filogenias enraizadas possíveis:
1" 2" 3" 4" 1" 4" 3" 2" 1" 4" 2" 3" 1" 3" 4" 2" 4" 1" 2" 3" 1" 3" 2" 4" 2" 1" 4" 3" 2" 3" 4" 1" 2" 4" 3" 1" 2" 4" 1" 3" 3" 4" 1" 2" 3" 1" 2" 4" 3" 2" 1" 4" 3" 4" 2" 1" 1" 4" 2" 3"
2,2+x+1020+ 3 x 1022 Número de estrelas no
Táxons termina is Topologi as sem raiz 2 1 3 1 4 3 . . . . . . . .
?
Qual é a filogenia desses! Se a filogenia é uma representação gráfica de processos históricos
! Mas, se eu não posso observar diretamente
esses processos
! Eu preciso inferir a minha filogenia a partir
dos padrões que eu posso observar
◦ Caracteres compartilhados entre as linhagens:
! Morfológicos
Cebus_albifrons ctt ata ctt tta acc cta att acc ttt att acc ctg aac aac ctt ctc gga att aca ccc tac gca
Gorilla_gorilla ctt atg tta ata tga tta att att ttt att gcc aca acc aac ctc ctc gga ctc ttg ccc cac tca
! Quanto mais próximo evolutivamente, maior é a quantidade de caracteres compartilhados
! Caráter
• Se você quer estudar as relações evolutivas, você deverá comparar regiões homólogas
! Inicialmente, o conceito de homologia foi estabelecido por Richard Owen
! Duas estruturas são ditas homólogas se elas
são originárias de uma mesma estrutura ancestral
! Semelhanças estruturais
! Relações entre as partes
! Para estudar a evolução dos primatas, a
característica “coluna vertebral” é inútil, pois todos os primatas a possuem. Ela é uma
! Homologias compartilhadas entre crocodilo e lagarto, estão presentes no ancestral comum entre as três espécies
! A reconstrução filogenética objetiva recuperar as relações de ancestralidade entre as
linhagens
! Isso é possível, pois linhagens irmãs
compartilham características, chamadas de
sinapomorfias A" B" C" D" sinapomorfia+de+{A,+B}+ sinapomorfia+de+{A,+B,+C}+ sinapomorfia+de+{A,+B,+C,+D}+
! Algumas linhagens acumulam mudanças exclusivas, elas são chamadas de
autapomorfias A" B" C" D" autapomorfia+de+{A}+ autapomorfias+de+{B}+ autapomorfia+de+{D}+
! Às vezes, algumas características aparecem em linhagens independentes como resultado de evolução convergente. Elas são chamadas de homoplasias A" B" C" D" homoplasia+
! Eventualmente algumas características são perdidas ao longo do processo evolutivo
A" B" C" D"
! O processo evolutivo gera um mosaico de sinapomorfias, autapomorfias e homplasias.
A"
B"
C"
{A
! A natureza do processo de geração dos
caracteres torna a diversidade hierárquica
A" B" C" D" {A,+B,+C,+D}+ {A,+B,+C}+ {A,+B}+
! A hierarquia que observamos (padrão) nos oferece informação sobre o processo que a gerou {A A" B" C" D" {A,+B,+C,+D}+ {A,+B,+C}+ {A,+B}+ processo"
{A A" B" C" D" {A,+B,+C,+D}+ {A,+B,+C}+ {A,+B}+ Processo"(inferido)" Padrão"(observado)"
! Evolução ocorre por meio do menor número de passos possível
! Redução do número de conflitos:
◦ Convergências (homoplasias confundidas com
homologias)
◦ Polarização errada dos caracteres (plesiomorfias
confundidas com sinapomorfias)
! Hipótese aceita é a corroborada pelo maior
Definindo o problema
?
Qual é a filogenia desses organismos?Cebus_albifrons ctt ata ctt tta acc cta att acc ttt att acc ctg aac aac ctt ctc gga att aca ccc tac gca
Gorilla_gorilla ctt atg tta ata tga tta att att ttt att gcc aca acc aac ctc ctc gga ctc ttg ccc cac tca
! Proteínas
! RNA
! DNA
• Por exemplo, vamos acompanhar um gene X ao longo do tempo.
mutação
tempo
!
Mutações pontuais:
◦ Substituições
◦ Inserções/deleções
!
Para reconstrução
filogenética
homologia deve ser
inferida a cada sítio
! Mutação ! erros instantâneos cometidos pela enzima
! Substituição ! erros que passaram pelo crivo
Cebus_albifrons atg aac caa aat cta ttt gcc tct taa aat ata cca ata M N Q N L F A S stop N M P M
Gorilla_gorilla atg aac gaa aat tta ttc gct tca ttc att gcc ccc aca M N E N L F A S F I A P T
não-sinônimas Sinônimas Sem sentido
Cebus_albifrons atg aac aat cta ttt gcc tct ttc cca M N N L F A S F P
Gorilla_gorilla atg aac aat tta ttc gct tca ttc ccc M N N L F A S F P
Cebus_albifrons atg aac caa aat cta ttt gcc tct ttc aat ata cca ata M N Q N L F A S F N M P M
Gorilla_gorilla atg aac gaa aat tta ttc gct tca ttc att gcc ccc aca M N E N L F A S F I A P T
fenótipos diferentes não-sinônimas
?
Qual é a filogenia desses organismos ?Sequencie um gene homólogo
>bush ATGTTCGCCGACCGTTGACTATTCTCTACAAACCACAAAGACATTGGAACACTATACCTATTATTCGGCG CATGAGCTGGAGTCCTAGGCACAGCTCTAAGCCTCCTTATTCGAGCCGAGCTGGGCCAGCCAGGCAACCT TCTAGGTAACGACCACATCTACAACGTTATCGTCACAGCCCATGCATTTGTAATAATCTTCTTCATAGTA ATACCCATCATAATCGGAGGCTTTGGCAACTGACTAGTTCCCCTAATAATCGGTGCCCCCGATATGGCGT TTCCCCGCATAAACAACATAAGCTTCTGACTCTTACCTCCCTCTCTCCTACTCCTGCTCGCATCTGCTAT AGTGGAGGCCGGAGCAGGAACAGGTTGAACAGTCTACCCTCCCTTAGCAGGGAACTACTCCCACCCTGGA GCCTCCGTAGACCTAACCATCTTCTCCTTACACCTAGCAGGTGTCTCCTCTATCTTAGGGGCCATCAATT TCATCACAACAATTATCAATATAAAACCCCCTGCCATAACCCAATACCAAACGCCCCTCTTCGTCTGATC CGTCCTAATCACAGCAGTCCTACTTCTCCTATCTCTCCCAGTCCTAGCTGCTGGCATCACTATACTACTA ACAGACCGCAACCTCAACACCACCTTCTTCGACCCCGCCGGAGGAGGAGACCCCATTCTATACCAACACC TATTCTGATTTTTCGGTCACCCTGAAGTTTATATTCTTATCCTACCAGGCTTCGGAATAATCTCCCATAT TGTAACTTACTACTCCGGAAAAAAAGAACCATTTGGATACATAGGTATGGTCTGAGCTATGATATCAATT GGCTTCCTAGGGTTTATCGTGTGAGCACACCATATATTTACAGTAGGAATAGACGTAGACACACGAGCAT ATTTCACCTCCGCTACCATAATCATCGCTATCCCCACCGGCGTCAAAGTATTTAGCTGACTCGCCACACT CCACGGAAGCAATATGAAATGATCTGCTGCAGTGCTCTGAGCCCTAGGATTCATCTTTCTTTTCACCGTA GGTGGCCTGACTGGCATTGTATTAGCAAACTCATCACTAGACATCGTACTACACGACACGTACTACGTTG TAGCTCACTTCCACTATGTCCTATCAATAGGAGCTGTATTTGCCATCATAGGAGGCTTCATTCACTGATT TCCCCTATTCTCAGGCTACACCCTAGACCAAACCTACGCCAAAATCCATTTCACTATCATATTCATCGGC GTAAATCTAACTTTCTTCCCACAACACTTTCTCGGCCTATCCGGAATGCCCCGACGTTACTCGGACTACC CCGATGCATACACCACATGAAACATCCTATCATCTGTAGGCTCATTCATTTCTCTAACAGCAGTAATATT AATAATTTTCATGATTTGAGAAGCCTTCGCTTCGAAGCGAAAAGTCCTAATAGTAGAAGAACCCTCCATA AACCTGGAGTGACTATATGGATGCCCCCCACCCTACCACACATTCGAAGAACCCGTATACATAAAATCTA >ferret ATGTTCATTAACCGATGACTGTTCTCCACTAATCACAAGGATATTGGTACTTTATACTTACTATTTGGAG CATGAGCCGGTATAGTAGGCACTGCTTTGAGCCTCCTCATCCGAGCCGAACTAGGTCAGCCCGGTACTTT ACTAGGTGACGATCAAATTTATAATGTCATCGTAACCGCCCATGCTTTCGTAATAATCTTCTTCATAGTC ATGCCCATCATAATTGGGGGCTTTGGAAACTGACTAGTGCCGTTAATAATTGGTGCTCCGGACATGGCAT TCCCCCGAATAAATAACATGAGCTTCTGACTCCTTCCTCCATCCTTTCTTCTACTATTAGCATCTTCTAT GGTAGAAGCAGGTGCAGGAACGGGATGAACCGTATACCCCCCACTGGCTGGCAATCTGGCCCATGCAGGA GCATCCGTTGACCTTACAATTTTCTCCTTACACTTAGCCGGAGTCTCTTCTATTTTAGGGGCAATTAATT TCATCACTACTATTATCAACATAAAACCCCCTGCAATATCCCAGTATCAAACTCCCCTGTTTGTATGATC AGTACTAATTACAGCAGTTCTACTCTTACTATCCCTGCCTGTACTGGCTGCTGGAATTACAATACTTTTA ACAGACCGGAATCTTAATACAACATTTTTTGATCCCGCTGGAGGAGGAGACCCTATCCTATATCAACACC TATTCTGATTCTTCGGACATCCTGAAGTTTACATTCTTATCCTGCCCGGATTCGGAATAATTTCTCACAT TGTCACTTACTACTCAGGGAAAAAAGAGCCTTTCGGTTATATAGGAATAGTATGAGCAATAATATCTATT GGGTTTTTAGGCTTTATCGTATGAGCTCACCATATGTTTACCGTAGGAATAGATGTAGACACACGAGCGT ACTTTACGTCCGCCACTATAATTATCGCTATTCCAACGGGAGTAAAAGTATTTAGTTGACTGGCAACACT TCATGGAGGCAATATTAAATGATCTCCAGCTATGCTATGAGCTTTAGGGTTTATTTTCTTATTTACAGTA GGCGGGTTAACAGGTATTGTCCTAGCTAATTCGTCCTTAGACATCGTTCTTCATGATACATATTATGTTG TGGCTCATTTTCACTATGTGCTTTCAATAGGAGCAGTTTTTGCCATTATGGGAGGATTTGCCCACTGATT CCCTTTATTCTCAGGTTATACTCTTAACGATACTTGAGCAAAGATTCACTTTACAATTATGTTTGTGGGA GTAAATATAACTTTCTTCCCTCAACATTTCCTAGGTTTATCTGGAATACCTCGTCGATACTCTGACTACC CAGATGCATATACTACCTGAAATACCGTCTCCTCTATAGGATCGTTTATCTCGCTTACAGCGGTGATGCT TATAATTTTTATGATCTGGGAAGCCTTTGCATCCAAACGAGAAGTTGCTATAGTAGAACTTACTACAACT AACATTGAGTGACTACATGGATGTCCCCCTCCATACCACACGTTCGAAGAACCTACATATGTGATCCAAA AATAA
COI
Virou isso:
>ferret ATGTTCATTAAC CGA... + >saíra ATGTTCATTAAC CGA... + >protozoa ATGTTCATTAAC CGA... + >peixe ATGTTCATTAAC CGA... + >perereca ATGTTCATTAAC CGA... + >leão ATGTTCATTAAC CGA... + >bush ATGTTCATTAAC CGA... + >molusco ATGTTCATTAAC CGA... + >besouro ATGTTCATTAAC CGA... +COI
>ferret ATGTTCATTAAC CGA... + >saíra ATGTTCATTAAC CGA... + >protozoa ATGTTCATTAAC CGA... + >peixe ATGTTCATTAAC CGA... + >perereca ATGTTCATTAAC CGA... + >leão ATGTTCATTAAC CGA... + >bush ATGTTCATTAAC CGA... + >molusco ATGTTCATTAAC CGA... + >besouro ATGTTCATTAAC CGA... +
! Dadas as regiões homólogas do genoma, como construir a árvore filogenética?
Sítios 1 2 3 4 5 6 7 8 9 10 OTU 1 A C G C G G C A A T OTU 2 A C G C G G T A A T OTU 3 A T G C G G A A A T OTU 4 A G T C G G G A A T OTU 5 A G T C G G G A A C
◦ Existem vários algoritmos de reconstrução filogenética:
◦ Métodos de distância
. UPGMA (Unweighted Pair Group Method with Arithmetic Mean) . Neighbor joining
◦ Métodos de parcimônia
! Para construir árvores filogenéticas por
métodos de distância devemos primeiro obter a matriz de distância das seqüências
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5
OTU 1
OTU 2
OTU 3
OTU 4
OTU 5
d
12d
13d
23d
14d
24d
34d
15d
25d
35d
45!
Diversas distâncias
genéticas foram
propostas
◦ Distância p ◦ Jukes-Cantor ◦ Kimura 2 parâmetros ◦ Tajima-Nei ◦ Tamura-Nei Entre outrasSítios 1 2 3 4 5 6 7 8 9 10 OTU 1 A C G C G G C A A T OTU 2 A C G C G G T A A T OTU 3 A T G C G G A A A T OTU 4 A G T C G G G A A T OTU 5 A G T C G G G A A C d12= 1 10= 0,1 dp= n N
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5
OTU 1
OTU 2
0,1
OTU 3
0,2
0,2
OTU 4
0,3
0,3
0,3
OTU 5
0,4
0,4
0,4
0,1
! Intuitivamente, seqüências com menor
distância são geneticamente mais próximas...
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 1
OTU 2 0,1
OTU 3 0,2 0,2
OTU 4 0,3 0,3 0,3
! A idéia do UPGMA é agrupar OTUs
progressivamente de acordo com a distância genética
! OTUs agrupadas passam a compor um cluster
! A distância entre uma OTU e o cluster é a
OTU 1 + OTU 2
OTU 3
?
OTU 1 + OTU 2
d
13OTU 3
d
23cluster (1,2)
cluster (1,2)
d(1,2),3€
d
(1,2)3=
d
13+ d
232
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 1 OTU 2 0,1 OTU 3 0,2 0,2 OTU 4 0,3 0,3 0,3 OTU 5 0,4 0,4 0,4 0,1 OTU 3 OTU 3 0,2 0,35 0,35 cluster(1,2) cluster(4,5) cluster(1,2) cluster(4,5) € d(1,2)3 = d13 + d23 2 € d(1,2)(4,5) = d14 + d15 + d24 + d25 4 € d(4,5)3 = d43 + d53 2
OTU 3 OTU 3 0,2 0,35 0,35 cluster(1,2) cluster(4,5) cluster(1,2) cluster(4,5) 0,35 cluster(1,2,3) cluster(4,5) cluster(1,2,3) cluster(4,5) € d(1,2,3)(4,5) = d14 + d15 + d24 + d25 + d34 + d35 6
! A ordem de agrupamento foi Passo Grupos 1 (1,2) & (4,5) 2 (1,2,3) & (4,5) 3 (1,2,3,4,5) 1 2 3 4 5
Pontos de quebra
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 0.00 0.05 0.10 0.15 € d12 2 € d(1,2)3 2 € d45 2 € d(1,2,3)(4,5) 2€ d(1,2) 2 d(1,2) = 0,1∴ d(1,2) 2 = 0,05 € d(1,2)3 2 d(1,2)3 = 0,2∴d(1,2)3 2 = 0,1 € d(4,5) 2 d(4,5) = 0,1∴ d(4,5) 2 = 0,05 € d(1,2,3)(4,5) 2 d(1,2,3)(4,5) = 0,35∴ d(1,2,3)(4,5) 2 = 0,175 OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 0.00 0.05 0.10 0.15
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 0.0500 0.0500 0.1000 0.0500 0.0500 0.1250 0.0500 0.0750 0.00 0.05 0.10 0.15
OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 0.0500 0.0500 0.1000 0.0500 0.0500 0.1250 0.0500 0.0750 0.00 0.05 0.10 0.15
?
OTU 1 OTU 2
b
2= 0,05
b
1= 0,05
ancestralT
€
µ
⋅ T
€ d12 = 2 ⋅ µ ⋅ T€
d
12= b
1+ b
2! O método do UPGA assume que a taxa de substituição mi é constante ao longo das linhagens
! Constância de taxas evolutivas = relógio
molecular
D. affinidisjuncta D. heteroneura D. adiastola D. mimica D. nigra S. albovittata D. crassifemur D. mulleri S. lebanonensis D. melanogaster D. pseudoobscura 0.083 0.070 0.121 0.044 0.054 0.081 0.021 0.017 0.023 0.032 0.043 0.035 0.043 0.070 0.003 0.037 0.042 0.011 0.004 0.015 0.02
OTU 1
OTU 2
b
1 ancestralT
b
2€
µ
1⋅ T
€
µ
2⋅ T
€
µ
1≠
µ
2€
d
12= b
1+ b
2! Quando o relógio molecular não funciona, o UPGMA não recupera a topologia correta
A B C D A B C D
árvore verdadeira árvore recuperada pelo UPGMA
€
! Em 1987, Saitou e Nei propuseram um algoritmo que não assume o relógio molecular.
! O algoritmo de NJ tem o objetivo de
encontrar a árvore que minimiza o somatório dos tamanhos de ramo
! Para fazer isso, ele vai decompondo uma
árvore em estrela formando “clusters” até encontrar o par que minimiza o somatório dos ramos
número de pares possíveis na conformação X-Y árvore estrela € N(N −1) 2
A
B
C D
C
árvore verdadeira árvore recuperada pelo NJ
A
B
! Não assume a constância de taxas evolutivas
! A probabilidade de se observar os dados
(seqüências ) dada um filogenia.
! A filogenia mais provável é aquela com a maior
probabilidade de ter produzidos as seqüências observadas.
! Vantagens (é o método mais usado atualmente)
◦ Permite variações nas taxas de evolução entre as
linhagens, genes ou através do tempo.