• Nenhum resultado encontrado

2.4 Aplica¸c˜ao biol´ogica da enumera¸c˜ao de traces

2.4.2 Compara¸c˜ao de genomas de grupos de esp´ecies

A enumera¸c˜ao de traces tamb´em pode ser utilizada para a compara¸c˜ao de genomas de um grupo de esp´ecies com o objetivo de se determinar padr˜oes nos eventos de rearranjo que ocorreram durante a evolu¸c˜ao deste grupo em rela¸c˜ao a um ancestral comum. Para ilustrar este caso, realizamos um trabalho com um grupo de bact´erias do gˆenero Rickettsia.

O gˆenero Rickettsia ´e um grupo de α-proteobact´erias que vivem obrigatoriamente no interior de outras c´elulas e possuem genomas extremamente reduzidos, quando comparadas com genomas de bact´erias similares que vivem no ambiente extra-celular. Elas costumam parasitar artr´opodes e muitos membros deste gˆenero podem causar doen¸cas em humanos.

Atrav´es da an´alise do genoma de sete membros deste gˆenero (Rickettsia bellii ,

Rickettsia prowazekii , Rickettsia typhi , Rickettsia felis, Rickettsia massiliae, Ric- kettsia africae e Rickettsia conorii ), Blanc et al. produziram resultados interessantes

sobre a evolu¸c˜ao redutiva que as esp´ecies deste grupo sofreram [24].

Blanc et al. apresentaram evidˆencias sobre a ocorrˆencia de revers˜oes durante a evolu¸c˜ao dos membros deste grupo. Al´em disso, eles constru´ıram a ´arvore filogen´etica das bact´erias estudadas e indicaram o n´umero de revers˜oes que teriam acontecido dentro de cada ramo da ´arvore (a partir do ancestral R1). A ´arvore filogen´etica constru´ıda e o n´umero de revers˜oes em cada ramo podem ser vistos na Figura 2.1.

A ´arvore filogen´etica mostra que a esp´ecie Rickettsia bellii foi a primeira a diver- gir durante a evolu¸c˜ao. O ancestral R1 ´e comum aos seis membros remanescentes:

Rickettsia prowazekii – rpr, Rickettsia typhi – rty, Rickettsia felis – rfe, Rickettsia massiliae – rma, Rickettsia africae – raf e Rickettsia conorii – rco.

0

R. typhi (rty)

R. felis (rfe)

R. prowazekii (rpr)

R1

R. conorii (rco)

R. africae (raf)

R. massiliae (rma)

R. bellii (rbe)

R0

0

1

2

9

1

1

1

0

0

Figura 2.1: ´Arvore filogen´etica do gˆenero Rickettsia com o n´umero de revers˜oes que ocorreram em cada ramo, de acordo com o trabalho de Blanc et al. [24].

A organiza¸c˜ao do genoma (ordem dos genes) do ancestral R1 foi reconstru´ıda por Blanc et al. atrav´es da observa¸c˜ao dos genes ort´ologos presentes nas bact´erias estudadas. Estes dados, que podem ser obtidos na p´agina RicBase – Rickettsia Genome Database [136], listam os genes ou pseudo-genes presentes nos genomas dos seis descendentes que s˜ao correspondentes aos genes do genoma de R1. Neste conjunto de dados, os genomas das seis esp´ecies e do ancestral R1 est˜ao linearizados da mesma forma.

O ancestral R1 possui um total de 1.248 genes. Deste total, os n´umeros de genes de R1 que possuem correspondˆencias com genes ou pseudo-genes de rco, raf, rma, rfe, rty e rpr s˜ao, respectivamente, 1.034, 1.041, 1.088, 1.129, 816 e 826.

Para nossa an´alise, consideramos apenas os genes de R1 que tinham correspon- dentes em todos os seis descendentes. Um total de 796 genes respeitam este crit´erio. Para definir a dire¸c˜ao de um gene em R1, adotamos a dire¸c˜ao mais representada entre os seis genes ort´ologos.

Ap´os a defini¸c˜ao dos genes e de suas dire¸c˜oes em R1, identificamos todos os blo- cos de genes consecutivos que fossem comum aos seis membros do gˆenero Rickettsia. Um total de 20 blocos foram identificados e utilizados para a constru¸c˜ao das per- muta¸c˜oes entre R1 e seus descendentes. A Tabela 2.2 lista as permuta¸c˜oes que foram constru´ıdas.

Calculamos as distˆancias de revers˜ao para transformar cada uma das permuta- ¸c˜oes na permuta¸c˜ao identidade (R1). Os valores obtidos para as α-proteobact´erias rco, raf, rma, rfe, rty e rpr foram, respectivamente, 2, 1, 1, 9, 3 e 2. Este valores s˜ao idˆenticos aos obtidos por Blanc et al.

Se um algoritmo tradicional que resolve o problema de ordena¸c˜ao de permuta¸c˜oes orientadas por revers˜oes fosse utilizado para transformar as permuta¸c˜oes da Ta- bela 2.2 na permuta¸c˜ao identidade, obter´ıamos apenas uma solu¸c˜ao para cada per- muta¸c˜ao. A Tabela 2.3 exibe um cen´ario que um destes algoritmos poderia produzir.

Tabela 2.2: Permuta¸c˜oes entre R1 (permuta¸c˜ao identidade) e seus seis descendentes: rco, raf, rma, rfe, rty e rpr.

rco – Distˆancia de revers˜ao: 2

+1,+2,+3,+4,+5,+6,+7,+8,+9,+10,+11,+13,−12,+14,+15,+16,+17,+18,+19,+20 raf – Distˆancia de revers˜ao: 1

+1,+2,+3,+4,+5,+6,+7,+8,+9,+10,+11,+12,−13,+14,+15,+16,+17,+18,+19,+20 rma – Distˆancia de revers˜ao: 1

+1,+2,+3,+4,+5,+6,+7,+8,+9,+10,+11,+12,+13,+14,+15,+16,+17,+18,−19,+20 rfe – Distˆancia de revers˜ao: 9

+1,+2,+4,−3,−17,+7,−15,−16,+10,+11,+12,+13,+14,+8,−9,−6,−5,+18,+19,+20 rty – Distˆancia de revers˜ao: 3

+1,−5,−4,−3,−2,+6,+7,+8,+9,+10,+13,−11,−12,+14,+15,+16,+17,+18,+19,+20 rpr – Distˆancia de revers˜ao: 2

+1,+2,+3,+4,+5,+6,+7,+8,+9,+10,+13,−11,−12,+14,+15,+16,+17,+18,+19,+20

Neste caso, temos permuta¸c˜oes simples e podemos verificar algumas rela¸c˜oes entre suas sequˆencias ´otimas de revers˜oes. Contudo, n˜ao podemos dizer que, por exemplo, o cen´ario apresentado pela permuta¸c˜ao rfe corresponde ao que realmente ocorreu durante a evolu¸c˜ao da esp´ecie.

Al´em disso, quando observamos as sequˆencias de revers˜oes de rty e rpr, podemos ver que elas possuem alguma rela¸c˜ao. Neste caso temos a revers˜ao {2,−,5} que aparece na segunda posi¸c˜ao da sequˆencia de revers˜oes de rty e que, na realidade, aconteceu ap´os a revers˜ao {12,13}, como veremos adiante.

Para obter o conjunto de todos traces de solu¸c˜oes do problema de ordena¸c˜ao de permuta¸c˜oes orientadas por revers˜oes, utilizamos o programa analyzeTraces [28] que implementa o algoritmo proposto por Braga et al. [31].

Para cada permuta¸c˜ao, produzimos o conjunto de todos traces de solu¸c˜oes entre ela e a permuta¸c˜ao identidade. A Tabela 2.4 lista o conjunto de traces produzido e exibe para cada permuta¸c˜ao, o n´umero de solu¸c˜oes representadas pelos seus traces.

Quando observamos a ´arvore filogen´etica exibida na Figura 2.1, podemos ver que R1 evoluiu em dois ramos. Um ramo agrupa rty e rpr e mostra evidˆencias que

Tabela 2.3: Exemplo de cen´ario evolucion´ario que poderia ser obtido por um algo- ritmo tradicional que resolva o problema de ordena¸c˜ao de permuta¸c˜oes orientadas por revers˜oes.

rco – Distˆancia de revers˜ao: 2 {12,13}{13}

raf – Distˆancia de revers˜ao: 1 {13}

rma – Distˆancia de revers˜ao: 1 {19}

rfe – Distˆancia de revers˜ao: 9

{5,−,17}{7,−,16}{8,−,14,16}{8,−,15}{8,10,−,14}{9,−,14}{3,4}{8}{4} rty – Distˆancia de revers˜ao: 3

{11,13}{2,−,5}{12,13} rpr – Distˆancia de revers˜ao: 2 {11,13}{12,13}

estas esp´ecies s˜ao pr´oximas entre si. O outro ramo mostra que, entre os 4 membros remanescentes, durante a evolu¸c˜ao rfe foi a primeira a divergir, seguida ent˜ao por rma. Finalmente, podemos ver que rco e raf s˜ao pr´oximas entre si.

A Tabela 2.4 mostra que, exceto no caso da bact´eria rfe, as outras 5 esp´ecies foram afetadas por poucas revers˜oes. Este fato pode indicar que rfe sofreu alguma press˜ao ambiental distinta que fez com que ela aceitasse mais revers˜oes durante a sua evolu¸c˜ao.

Os traces de rfe mostram a primeira vantagem de se enumerar o conjunto de todos os traces que ordenam uma permuta¸c˜ao. Enquanto os algoritmos tradicionais produziriam um ´unico cen´ario, a enumera¸c˜ao de traces permitiu a obten¸c˜ao de 13 classes distintas de cen´arios que representam um total de 546.840 solu¸c˜oes ´otimas di- ferentes. Podemos ver tamb´em que as revers˜oes{3,4}, {4} e {5,−,17} est˜ao presentes independentemente do cen´ario observado. Apenas analisando as revers˜oes restantes, n˜ao podemos dizer qual cen´ario aconteceu. Contudo, estes traces podem fornecer informa¸c˜oes ao pesquisadores sobre quais blocos devem ser considerados no estudo.

A forma normal de um trace imp˜oe uma ordena¸c˜ao `as revers˜oes que est˜ao na solu¸c˜ao. Se temos mais que uma sub-palavra no trace, sabemos que as revers˜oes que aparecem em qualquer sub-palavra ui(i > 1) sobrep˜oem pelo menos uma revers˜ao da sub-palavra ui−1 e, por causa disso, elas s´o podem ser aplicadas na permuta¸c˜ao ap´os

Tabela 2.4: Traces de solu¸c˜oes obtidos para as alpha-proteobact´erias rco, raf, rma, rfe, rty and, rpr com rela¸c˜ao ao ancestral R1.

rco– Distˆancia de revers˜ao: 2 – # traces: 1 – # solu¸c˜oes representadas: 2 {12,13}{13}

raf– Distˆancia de revers˜ao: 1 – # traces: 1 – # solu¸c˜oes representadas: 1 {13}

rma– Distˆancia de revers˜ao: 1 – # traces: 1 – # solu¸c˜oes representadas: 1 {19}

rfe– Distˆancia de revers˜ao: 9 – # traces: 13 – # solu¸c˜oes representadas: 546.840 {3,4}{4}{5,−,17}{7}{7,10,−,16}{9}{10,−,14,16}|{7,−,9}{10,−,15} {3,4}{4}{5,−,17}{7}{8,10,−,16}|{7,8,10,−,14,16}|{7,9,15}|{8,9,15}|{10,−,15} {3,4}{4}{5,−,17}{7,−,16}{8}{8,−,14,16}{8,10,−,14}|{8,−,15}{9,−,14} {3,4}{4}{5,−,17}{7,−,16}{8}{8,10,−,16}{10,−,14,16}|{9,−,16}{10,−,15} {3,4}{4}{5,−,17}{7,−,16}{8,−,14,16}{9}{15}|{8,9,15}|{10,−,15} {3,4}{4}{5,−,17}{7,−,16}{8,10,−,14}{15}{16}|{8,15,16}|{9,−,16} {3,4}{4}{5,−,17}{7,−,16}{9}{10,−,14,16}{16}|{8,9,16}|{8,−,15} {3,4}{4}{5,−,17}{7,10,−,16}{7,15,16}{9}|{7,−,9,15,16}|{8,−,14,16}|{8,−,15} {3,4}{4}{5,−,17}{7,10,−,16}{8}{10,−,14,16}|{7,8,10,−,15}|{7,9,−,15}|{8,−,15} {3,4}{4}{5,−,17}{7,15,16}{8,10,−,14}{16}|{7,8,15}|{7,9,−,15}|{8,−,15} {3,4}{4}{5,−,17}{7,15,16}{9}{15}{16}|{7,10,−,14}|{7,−,9} {3,4}{4}{5,−,17}{8}{8,10,−,16}|{7,8,10,−,14,16}|{7,8,10,−,15}|{7,−,14}{9,−,14} {3,4}{4}{5,−,17}{8,10,−,14}|{8,15,16}{9,−,14}|{7,8,16}|{7,8,15}|{7,−,14} rty– Distˆancia de revers˜ao: 3 – # traces: 1 – # solu¸c˜oes representadas: 3 {2,−,5}{11,13}|{12,13}

rpr– Distˆancia de revers˜ao: 2 – # traces: 1 – # solu¸c˜oes representadas: 1 {11,13}|{12,13}

todas as revers˜oes conflitantes serem aplicadas. De fato, qualquer revers˜ao ρj, que aparece em um trace, pode ser aplicada ap´os uma revers˜ao conflitante ρi e antes de uma revers˜ao conflitante ρk, onde i (k) ´e o ´ındice m´aximo (m´ınimo) de uma revers˜ao conflitante que aparece antes (depois) de ρj.

Os traces das permuta¸c˜oes rty e rpr mostram que estas duas esp´ecies s˜ao pr´oxi- mas. De todos o membros analisados, apenas estas duas compartilham o mesmo 2-trace {11,13}|{12,13}. Este 2-trace indica que a revers˜ao {11,13} deve acontecer antes da revers˜ao {12,13}.

A ´unica diferen¸ca entre os traces das bact´erias rty e rpr ´e a presen¸ca da revers˜ao {2,−,5} no trace de rty. Como esta revers˜ao n˜ao sobrep˜oe as revers˜oes {11,13} e {12,13}, ela pode ser aplicada em qualquer momento da evolu¸c˜ao de rty. Contudo, quando analisamos os dois traces juntos, podemos inferir que a revers˜ao {2,−,5} ocorreu ap´os rty e rpr terem divergido de seu ancestral comum.

A mesma observa¸c˜ao pode ser feita para as bact´erias rco e raf que compartilham o 1-trace {13}, que n˜ao aparece em outras esp´ecies. A ´unica diferen¸ca entre os seus

traces ´e a presen¸ca da revers˜ao {12,13} no trace de rco. Assim, como nas esp´ecies rty e rpr, esta revers˜ao ocorreu ap´os rco e raf terem divergido do seu ancestral comum.

A bact´eria rma foi afetada apenas pela revers˜ao{19}, que n˜ao aparece nos traces das outras esp´ecies. Assim, podemos inferir que ela aconteceu ap´os rma ter divergido do ancestral comum a ela, a rco e a raf.

A Figura 2.2 exibe a ordem cronol´ogica das revers˜oes que foi inferida a partir da observa¸c˜ao dos traces das permuta¸c˜oes.

Atrav´es da an´alise dos traces e da ´arvore filogen´etica, conseguimos reconstruir o cen´ario observado por Blanc et al. Apesar de ser um exemplo simples, este estudo mostra que traces podem ser utilizados para o estudo da evolu¸c˜ao das esp´ecies.

A enumera¸c˜ao de traces permite a verifica¸c˜ao de correspondˆencias entre diferentes esp´ecies e oferece um ponto inicial para que bi´ologos possam realizar an´alises mais detalhadas.

O desenvolvimento de um algoritmo para a an´alise de traces de esp´ecies para a detec¸c˜ao de cen´arios de evolu¸c˜ao parcimoniosos seria uma interessante extens˜ao deste estudo.

R0

R. typhi (rty)

R. felis (rfe)

R. prowazekii (rpr)

R1

R. conorii (rco)

R. africae (raf)

R. massiliae (rma)

R. bellii (rbe)

{19}