• Nenhum resultado encontrado

Introduzindo filogenias

N/A
N/A
Protected

Academic year: 2021

Share "Introduzindo filogenias"

Copied!
67
0
0

Texto

(1)

Introduzindo filogenias

(2)

Um olhar íntimo nos sistemas vivos

Os sistemas vivos apresentam as seguintes características básicas

Se reproduzem (com o sem sexo);

Mantém a informação que carregam ao longo das gerações (hereditariedade);

(3)

Conseqüentemente..

Tempo Número de indivíduos

Teoricamente, o número de indivíduos tenderia ao infinito

(4)

Isso não aconteceu. Porque?

Existe um número máximo de indivíduos ocupantes da mesma região S do espaço, dividindo os recursos R.

{S, R}

(5)

Portanto...

{S, R}

(6)

Além disso...

Modificação da informação (mutação)‏

Modificação da informação (mutação)‏

Variação

Propriedade de um grupo de indivíduos

(7)

Então...

{S, R}

Mais apto a viver em {S, R}

Sucesso reprodutivo diferencial

(8)

Concluindo

Grupos de sistemas informacionais que se reproduzem, apresentam variação e que

dividem o hiperespaço { S, R } estão sujeitos ao sucesso reprodutivo diferencial, ou seja, seleção natural.

(9)

Podemos também admitir o seguinte

{S, R}

O sucesso reprodutivo é equivalente em ambos os tipos

(10)

Nesse caso...

A modificação das frequências dos tipos será randômica e dependente do número de

indivíduos existentes em {S, R}

Esse fenômeno recebe o nome de deriva genética.

(11)

Tornando a conversa mais concreta

O esquema anterior pode ser usado para

representar, por exemplo, as relações ancestral- descendente de uma população clonal de

bactéria.

Tecnicamente, mostramos a genealogia dessas bactérias

Essa é uma representação das relações de parentesco. Poderíamos chamar isso de filogenia?

(12)

Genealogia e Filogenia

A diferença entre genealogia e filogenia é tênue.

filogenia

genealogia

espécies

(13)

Por que?

O fluxo de informação é contínuo no tempo.

(14)

Portanto...

Qualquer “corte” é necessariamente arbitrário

?

?

?

(15)

Entreteanto...

Se pensarmos em sistemas que trocam informação (ex, indivíduos de uma espécie com reprodução sexuada), o “corte” fica melhor definido.

filogenia

genealogia

espécies

(16)

Um zoom nas relações de parentesco

genealogia filogenia

Fluxo gênico interrompido

(17)

Interrupção do fluxo gênico

(18)

Afastando mais o zoom

(19)

Entretanto, mesmo em espécies sexuadas, o fluxo vertical não é

quebrado

(20)

Uma forma unificada de acompanhar o fluxo de informação nos sistemas

vivos

Já que a molécula que carrega a informação nos sistemas vivos é o DNA, porque não

acompanhar as relações ancestral- descendente através dela?

Entretanto, “uma molécula de DNA” é algo abstrato.. a unidade fundamental da

informação é o gene.

(21)

Ao invés de “indivíduos” vamos considerar genes

Por exemplo, vamos acompanhar um gene X ao longo do tempo.

(22)

Eventualmente...

mutação

(23)

Alelos

mutação

tempo

alelos do gene X

(24)

Definindo o problema

?

Qual é a filogenia desses organismos

?

(25)

Passo 0: Homologia

Se você quer estudar as relações evolutivas do

vertebrados, você deverá comparar regiões homólogas do corpo

(26)

Definindo homologia

Inicialmente, o conceito de homologia foi estabelecido por Richard Owen

Duas estruturas são ditas homólogas se elas são originárias de uma mesma estrutura

ancestral

(27)

Portanto...

crânio dos primatas

(28)

Molecularmente

(29)

Alelos são homólogos

(30)

Gene X

Gene X Gene X

(31)

Gene X

Gene X

Gene X

Gene X Gene X

Gene X Gene X Gene X Gene W Gene X Gene X Gene X Gene Y

(32)

Voltando ao problema...

?

Qual é a filogenia desses organismos

?

(33)

Uma solução..

Sequence a homologous gene

(34)

Por exemplo, o COI

(35)

Após sequenciamento

>bush

ATGTTCGCCGACCGTTGACTATTCTCTACAAACCACAAAGACATTGGAACACTATACCTATTATTCGGCG CATGAGCTGGAGTCCTAGGCACAGCTCTAAGCCTCCTTATTCGAGCCGAGCTGGGCCAGCCAGGCAACCT TCTAGGTAACGACCACATCTACAACGTTATCGTCACAGCCCATGCATTTGTAATAATCTTCTTCATAGTA ATACCCATCATAATCGGAGGCTTTGGCAACTGACTAGTTCCCCTAATAATCGGTGCCCCCGATATGGCGT TTCCCCGCATAAACAACATAAGCTTCTGACTCTTACCTCCCTCTCTCCTACTCCTGCTCGCATCTGCTAT AGTGGAGGCCGGAGCAGGAACAGGTTGAACAGTCTACCCTCCCTTAGCAGGGAACTACTCCCACCCTGGA GCCTCCGTAGACCTAACCATCTTCTCCTTACACCTAGCAGGTGTCTCCTCTATCTTAGGGGCCATCAATT TCATCACAACAATTATCAATATAAAACCCCCTGCCATAACCCAATACCAAACGCCCCTCTTCGTCTGATC CGTCCTAATCACAGCAGTCCTACTTCTCCTATCTCTCCCAGTCCTAGCTGCTGGCATCACTATACTACTA ACAGACCGCAACCTCAACACCACCTTCTTCGACCCCGCCGGAGGAGGAGACCCCATTCTATACCAACACC TATTCTGATTTTTCGGTCACCCTGAAGTTTATATTCTTATCCTACCAGGCTTCGGAATAATCTCCCATAT TGTAACTTACTACTCCGGAAAAAAAGAACCATTTGGATACATAGGTATGGTCTGAGCTATGATATCAATT GGCTTCCTAGGGTTTATCGTGTGAGCACACCATATATTTACAGTAGGAATAGACGTAGACACACGAGCAT ATTTCACCTCCGCTACCATAATCATCGCTATCCCCACCGGCGTCAAAGTATTTAGCTGACTCGCCACACT CCACGGAAGCAATATGAAATGATCTGCTGCAGTGCTCTGAGCCCTAGGATTCATCTTTCTTTTCACCGTA GGTGGCCTGACTGGCATTGTATTAGCAAACTCATCACTAGACATCGTACTACACGACACGTACTACGTTG TAGCTCACTTCCACTATGTCCTATCAATAGGAGCTGTATTTGCCATCATAGGAGGCTTCATTCACTGATT TCCCCTATTCTCAGGCTACACCCTAGACCAAACCTACGCCAAAATCCATTTCACTATCATATTCATCGGC GTAAATCTAACTTTCTTCCCACAACACTTTCTCGGCCTATCCGGAATGCCCCGACGTTACTCGGACTACC CCGATGCATACACCACATGAAACATCCTATCATCTGTAGGCTCATTCATTTCTCTAACAGCAGTAATATT AATAATTTTCATGATTTGAGAAGCCTTCGCTTCGAAGCGAAAAGTCCTAATAGTAGAAGAACCCTCCATA AACCTGGAGTGACTATATGGATGCCCCCCACCCTACCACACATTCGAAGAACCCGTATACATAAAATCTA

>ferret

ATGTTCATTAACCGATGACTGTTCTCCACTAATCACAAGGATATTGGTACTTTATACTTACTATTTGGAG CATGAGCCGGTATAGTAGGCACTGCTTTGAGCCTCCTCATCCGAGCCGAACTAGGTCAGCCCGGTACTTT ACTAGGTGACGATCAAATTTATAATGTCATCGTAACCGCCCATGCTTTCGTAATAATCTTCTTCATAGTC ATGCCCATCATAATTGGGGGCTTTGGAAACTGACTAGTGCCGTTAATAATTGGTGCTCCGGACATGGCAT TCCCCCGAATAAATAACATGAGCTTCTGACTCCTTCCTCCATCCTTTCTTCTACTATTAGCATCTTCTAT GGTAGAAGCAGGTGCAGGAACGGGATGAACCGTATACCCCCCACTGGCTGGCAATCTGGCCCATGCAGGA GCATCCGTTGACCTTACAATTTTCTCCTTACACTTAGCCGGAGTCTCTTCTATTTTAGGGGCAATTAATT TCATCACTACTATTATCAACATAAAACCCCCTGCAATATCCCAGTATCAAACTCCCCTGTTTGTATGATC AGTACTAATTACAGCAGTTCTACTCTTACTATCCCTGCCTGTACTGGCTGCTGGAATTACAATACTTTTA ACAGACCGGAATCTTAATACAACATTTTTTGATCCCGCTGGAGGAGGAGACCCTATCCTATATCAACACC TATTCTGATTCTTCGGACATCCTGAAGTTTACATTCTTATCCTGCCCGGATTCGGAATAATTTCTCACAT TGTCACTTACTACTCAGGGAAAAAAGAGCCTTTCGGTTATATAGGAATAGTATGAGCAATAATATCTATT GGGTTTTTAGGCTTTATCGTATGAGCTCACCATATGTTTACCGTAGGAATAGATGTAGACACACGAGCGT ACTTTACGTCCGCCACTATAATTATCGCTATTCCAACGGGAGTAAAAGTATTTAGTTGACTGGCAACACT TCATGGAGGCAATATTAAATGATCTCCAGCTATGCTATGAGCTTTAGGGTTTATTTTCTTATTTACAGTA GGCGGGTTAACAGGTATTGTCCTAGCTAATTCGTCCTTAGACATCGTTCTTCATGATACATATTATGTTG TGGCTCATTTTCACTATGTGCTTTCAATAGGAGCAGTTTTTGCCATTATGGGAGGATTTGCCCACTGATT CCCTTTATTCTCAGGTTATACTCTTAACGATACTTGAGCAAAGATTCACTTTACAATTATGTTTGTGGGA GTAAATATAACTTTCTTCCCTCAACATTTCCTAGGTTTATCTGGAATACCTCGTCGATACTCTGACTACC CAGATGCATATACTACCTGAAATACCGTCTCCTCTATAGGATCGTTTATCTCGCTTACAGCGGTGATGCT TATAATTTTTATGATCTGGGAAGCCTTTGCATCCAAACGAGAAGTTGCTATAGTAGAACTTACTACAACT AACATTGAGTGACTACATGGATGTCCCCCTCCATACCACACGTTCGAAGAACCTACATATGTGATCCAAA AATAA

COI

(36)

O problema foi reformulado

Isso:

(37)

Virou isso:

>ferret ATGTTCATTAAC CGA...

>saíra

ATGTTCATTAAC CGA...

>protozoa ATGTTCATTAAC CGA...

>peixe

ATGTTCATTAAC CGA...

>perereca ATGTTCATTAAC CGA...

>leão

ATGTTCATTAAC CGA...

>bush

ATGTTCATTAAC CGA...

>molusco ATGTTCATTAAC CGA...

>besouro ATGTTCATTAAC CGA...

COI

(38)

Como usar a informação das

sequencias para fazer uma árvore evolutiva?

>ferret ATGTTCATTAAC CGA...

>saíra

ATGTTCATTAAC CGA...

>protozoa ATGTTCATTAAC CGA...

>peixe

ATGTTCATTAAC CGA...

>perereca ATGTTCATTAAC CGA...

>leão

ATGTTCATTAAC CGA...

>bush

ATGTTCATTAAC CGA...

>molusco ATGTTCATTAAC CGA...

>besouro ATGTTCATTAAC CGA...

(39)

O problema filogenético

A reconstrução filogenética objetiva recuperar as relações de ancestralidade entre as linhagens

Isso é possível, pois linhagens irmãs compartilham características, chamadas de sinapomorfias

A B C D

sinapomorfia de {A, B}

sinapomorfia de {A, B, C}

sinapomorfia de {A, B, C, D}

(40)

O Problema filogenético

Algumas linhagens acumulam mudanças exclusivas, elas são chamadas de

autapomorfias

A B C D

autapomorfia de {A}

autapomorfias de {C}

autapomorfia de {D}

(41)

O Problema filogenético

Às vezes, algumas características aparecem em linhagens independentes como resultado de evolução convergente. Elas são chamadas de homoplasias

A B C D

homoplasia

(42)

O Problema filogenético

Eventualmente algumas características são perdidas ao longo do processo evolutivo

A B C D

(43)

Organismos são mosaicos de características

O processo evolutivo gera um mosaico de

sinapomorfias, autapomorfias e homplasias.

A

B

C

D

(44)

{A

A diversidade é hierárquica

A natureza do processo de geração dos

caracteres torna a diversidade hierárquica

A B

C

D

{A, B, C, D}

{A, B, C}

{A, B}

(45)

A informação da diversidade

A hierarquia que observamos (padrão) nos

oferece informação sobre o processo que a gerou

{A

A B

C

D

{A, B, C, D}

{A, B, C}

{A, B}

processo

(46)

O Processo é inferido, o padrão observado

{A

A B

C

D

{A, B, C, D}

{A, B, C}

{A, B}

Processo (inferido)

Padrão (observado)

(47)

Mas as coisas não são tão simples...

Embora teoricamente simples, não é sempre fácil observar os padrões da diversidade

?

?

(48)

O Número de grupos possíveis é enorme

Para quatro organismos, existem 15 grupos possíveis:

A B D C A D B C

A B D C

A B D C

A B D C

etc

(49)

A representação

A forma tradicional de representar as relações evolutivas é através de árvores

(50)

A representação em árvores é antiga

Anotações de Charles Darwin Figura de A Origem das Espécies

(51)

As árvores filogenéticas

A B C D

raiz

ramo interno

ramo externo

táxon terminal ou OTU

grupo externo

(52)

As formas não importam

A B C D

A B C D

A B

C D

Diferentes árvores com a mesma topologia

(53)

O Número de topologias possíveis é muito

grande

(54)

O problema

Dado regiões homólogas do genoma, como construir a árvore filogenética?

Sítios

1 2 3 4 5 6 7 8 9 10

OTU 1 A C G C G G C A A T

OTU 2 A C G C G G T A A T

OTU 3 A T G C G G A A A T

OTU 4 A G T C G G G A A T

OTU 5 A G T C G G G A A C

(55)

Esse problema pode ser resolvido de diversas formas

Existem vários algoritmos de reconstrução filogenética:

Métodos de distância

. UPGMA (Unweighted Pair Group Method with Arithmetic Mean)‏

. Neighbor joining

Métodos de parcimônia

Métodos de máxima verossimilhança

(56)

Os métodos de distância

Para construir árvores filogenéticas por

métodos de distância devemos primeiro obter a matriz de distância das seqüências

analisadas

(57)

Uma matriz de distância

OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 1

OTU 2 OTU 3 OTU 4 OTU 5

d12

d13 d

23

d14 d

24 d

34

d15 d

25 d

35 d

45

(58)

Portanto...

Voltando aos dados.

Sítios

1 2 3 4 5 6 7 8 9 10

OTU 1 A C G C G G C A A T

OTU 2 A C G C G G T A A T

OTU 3 A T G C G G A A A T

OTU 4 A G T C G G G A A T

OTU 5 A G T C G G G A A C

d12= 1

10= 0,1 dp= n

N

(59)

A matriz de distância p dos dados

OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 1

OTU 2 0,1

OTU 3 0,2 0,2

OTU 4 0,3 0,3 0,3

OTU 5 0,4 0,4 0,4 0,1

(60)

E agora?

Intuitivamente, seqüências com menor

distância são geneticamente mais próximas...

OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 1

OTU 2 0,1

OTU 3 0,2 0,2

OTU 4 0,3 0,3 0,3

OTU 5 0,4 0,4 0,4 0,1

(61)

O algoritmo UPGMA

A idéia do UPGMA é agrupar OTUs

progressivamente de acordo com a distância genética

OTUs agrupadas passam a compor um cluster

A distância entre uma OTU e o cluster é a média entre as distâncias individuais

(62)

OTU 1 + OTU 2

OTU 3

?

OTU 1 + OTU 2

d 13

OTU 3

d 23

cluster (1,2) cluster (1,2)

d(1,2),3



d(1,2)3d13d23 2

(63)

UPGMA em ação

OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 1

OTU 2 0,1

OTU 3 0,2 0,2

OTU 4 0,3 0,3 0,3

OTU 5 0,4 0,4 0,4 0,1

OTU 3

OTU 3 0,2

0,35 0,35

cluster(1,2) cluster(4,5) cluster(1,2)

cluster(4,5)



d(1,2)3 d13 d23 2



d(1,2)( 4,5) d14 d15 d24 d25 4



d(4,5)3 d43 d53 2

(64)

UPGMA ainda em ação...

OTU 3

OTU 3 0,2

0,35 0,35

cluster(1,2) cluster(4,5) cluster(1,2)

cluster(4,5)

0,35

cluster(1,2,3) cluster(4,5) cluster(1,2,3)

cluster(4,5)



d(1,2,3)( 4,5) d14 d15 d24 d25 d34 d35 6

(65)

A árvore de UPGMA

A ordem de agrupamento foi

Passo Grupos

1 (1,2) & (4,5) 2 (1,2,3) & (4,5) 3 (1,2,3,4,5)

1 2 3 4 5

(66)

Pontos de quebra

OTU 1 OTU 2 OTU 3 OTU 4 OTU 5

0.00 0.05

0.10 0.15



d12 2



d(1,2)3 2



d45 2



d(1,2,3)( 4,5)

2

(67)

Finalmente

OTU 1 OTU 2 OTU 3 OTU 4 OTU 5

0.0500 0.0500 0.1000

0.0500 0.0500 0.1250

0.0500 0.0750

0.00 0.05

0.10 0.15

Referências

Documentos relacionados

Por outro lado, quando se fala em pequenas e médias empresas, onde o número de funcionários é maior, é mais bem dividida e o uso da Intranet se torna

Entendemos que o equipamento que pretendemos ofertar estaria atendendo aos requisitos do projeto como um todo, já que não está explícito que haverá utilização para as 16 portas

Entre os bairros avaliados o Santa Rita apresentou as condições mais precárias de saneamento básico no ano de 2007 em função da ausência de fornecimento de

As principais características deste agente são: avaliação do diálogo sobre as emoções, representação do modelo de personalidade Big-Five e impacto dos valores

Visando a este cenário, o Ministério da Saúde criou o Programa de Educação pelo Trabalho para a Saúde (PET-Saúde), regulamentado pela Portaria Interministerial

A raiva é uma doença viral que acomete os animais domésticos, silvestres e destes para o homem, causando uma doença com sintomatologia?. nervosa, aguda e fatal, levando ao óbito

´e aquele pelo qual a filosofia alem˜a traduziu, depois de Kant, o latim existentia, mas Heidegger deu-lhe um sentido muito particu- lar, j´a que designa na sua filosofia

Evidentemente, a língua portuguesa representa o Brasil. A valorização da mesma significa, por transferência de significado, uma valorização da nação brasileira. A comparação do