Publicações do PESC Rearranjos de Genomas: Teoria e Aplicações

(1)

Rodrigo

de Aleecar Hausen

TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS

PROGRAMAS

DE

PÕS-GRADUAÇÃO DE ENGENHARIA DA

UNIVERSIDADE

FEDERAL

DO RIO DE JANEIRO COMO

PARTE

DOS

REQUISITOS

NECESSARIOS

PARA. A OBTENCÃO

DO

GRAU

DE

DOUTOR

EM

CI&NCIAS EM ENGENHARIA DE SISTEMAS E

COMPUTAGÃO.

Aprovada

por:

'~LLU

L

r

,

*

Profa.

Helena

Cristina

da

&ma

Leitk,

D.Sc.

(2)

Rearranjos de Genomas: Teoria e Apli a-ções[Rio de Janeiro℄2007

< .mine XII, 141 p. 29,7 m

(COPPE/UFRJ, D.S ., Engenharia de Siste-mas e Computação,2007)======= > .r96

XII, 141 p. 29,7 m (COPPE/UFRJ, D.S .,EngenhariadeSistemaseComputação, 2007)

Tese Universidade FederaldoRiode Ja-neiro, COPPE

1 -Rearranjos de genomas 2 -Ordenação por transposições 3 -Grafo tóri o

(3)

(4)

Aosmeus pais,JuvenaleIolanda,quemederamaoportunidadede estar neste mundo e me apóiam desde os primeiros momentos, in ansáveis. À minha irmã Moema e aomeu sobrinho Júlioque mealegrama vida.

Aosamigos quepalmilhamaomeu ladoe que,espero, medes ulpempor não poder itá-los todos aqui. A Janaína e Ri ardo, uja amizade já dura tantos anos que eu não me atrevo mais a ontar; àqueles que me a ompa-nharam desde o iní io do doutorado, e que me ouvem as piadas sem-graça desde então

1

: Adriana, André, Bernardo, Cristiane, Danilo, Elias, Fabiano, Pris ila, Rafael, Raphael, Raquel, Rosiane, Thatiana, Viní ius, ...Àqueles que, mesmoquandoestive longe,semantiveramporperto através do pensa-mento,transmitindoforçaamime àminhafamília: AndréaCanella,Celina Maria, Deise Puga, Fábio Canella, João da Silva, Mni a, Snia Regina, Vera Coutinho, Walteno, Wanderley,...Eaos quemeajudaramno retorno: Vânia Butru i,Fernando Ramose o pessoal doComunidança daUFRJ.

Àqueles que olaboraram ativamente no desenvolvimento deste trabalho e que se dispuseram a ajudar desde o iní io: ao Rafael Barbastefano pelo in entivo; a Luiz Carlos, om o qual tenho trabalhado desde a graduação e quetemapoiadoaminhaformaçãoa adêmi a;aoLuerbioeaoLuiz Antonio Kowada, que doarammais do que tempo e atenção, mas tambémsugestões

(5)

aabordagemporteoriade grafos, eKowada teveobrilhantismode observar a estrutura do grafo tóri o quando

n + 1

é primo. Aos professores om os quais tive ontato etroquei informaçõesno desenvolvimento deste trabalho, Zanoni Dias eJoão Meidanis,daUNICAMP, e MariaEmília, daUNB.

Aos membros daban a que ainda não foram itados, Claudio Bornstein e Helena Cristina, que estiveram em meu exame de quali ação, além de SulamitaKlein que prontamentea eitou o onvite de parti ipar da defesa.

Para aqueles que estiveram omigo durante o período em que estive no Canadá, espe ialmente ao professor David Sanko, por me re eber em seu grupo de pesquisa, porme orientar no período de 09/2005 a 09/2006 e por sugerir o estudo das transposições en ontradas entre os genomas humano e do himpanzé. Aos olegasdogrupodepesquisadaUniversidadede Ottawa, sempre gentis. Ao Steve Rothman,pelas instalações, e à Linda Ham eKorr Onguglo pela ompanhia. À Ariane, Daniel Panario e Lu ia Moura, pelas inúmerasdi asde omosobreviveralhures,epelasfestase onversas,quando o lho deste solopodiamatar saudades daPátria-mãegentil.

Por último, mas não menos importante, à Celina, minha orientadora, que mea eitou omo aluno no mestrado e agora,novamente, nodoutorado. Durante o período em que estive sob a sua tutela, tive a oportunidade de re eber inúmeras diretrizes, não só no que tange ao onteúdo desta tese, mas tambémsobre omo tornar-me um pesquisador. Por ter a reditado em mim (muitas vezes mais do que eu mesmo), ompreendido e ajudado-me a ontornar muitas de minhas imperfeições e pelo exemplo de prossional e pessoa dedi ada queé, mere eaqui um lugar de destaque.

A todos esses, meus mais sin eros agrade imentos. Thank you. Muito obrigado.

(6)

ne essários para a obtenção do graude Doutor emCiên ias (D.S .)

REARRANJOSDE GENOMAS: TEORIAE APLICAÇÕES

Rodrigo de Alen ar Hausen Dezembro/2007

Orientador: Celina Miraglia Herrera de Figueiredo Programa: Engenharia de Sistemase Computação

Este trabalho apresenta aspe tos teóri os e práti os do problema de re-arranjo de genomas, em parti ular para rearranjos por transposições. Na parte teóri a, são demonstrados alguns resultados onhe idos baseados no diagrama de realidade e desejo (também denominado grafo de pontos de quebra), porém om provasmais rigorosasdoqueas en ontradasem traba-lhos anteriores de outros autores; também é abordado o problema de orde-nação portransposições omoum problema de teoriados grafos, abordagem muito pou o utilizadana literatura, e para a qual são demonstrados alguns resultados novos sobre a estrutura do grafo tóri o para o onjunto das per-mutaçõesde

n

elementos, onde

n+1

éprimo. Napartepráti a,édes ritoum método para omparação entre os genomas humano e do himpanzé, onde pela primeira vez são onsideradas transposições. Com esse método, foram

(7)

requirements for the degreeof Do tor of S ien e (D.S .)

GENOME REARRANGEMENTS: THEORY AND APPLICATIONS

Rodrigo de Alen ar Hausen De ember/2007

Advisor: Celina MiragliaHerrera de Figueiredo

Department: Systems Engineering and Computer S ien e

This work presents theoreti al and pra ti al aspe ts of the genome re-arrangement problem, in parti ular for rearrangements by transpositions. Regarding the theory, some known results based on the reality and desire diagram(alsodenominatedasbreakpointgraph)areshown,but withmore s rupulous proofs than those found in previous papers by other authors; an oft-overlookedgraph-theoreti alapproa htotheproblemofsortingby trans-positionsisalsoused, forwhi hsome new resultsare found onthe stru ture of the tori graph for the set of permutations of

n

elements, where

n + 1

is prime. On the pra ti al side, a method to ompare the human and him-panzee genomes is des ribed, where for the rst time transpositions have been taken into onsideration. By using this method,

542

reversals and

255

transpositionshave been found.

(8)

1 Introdução 1 1.1 Denições . . . 5 1.2 Problemas de rearranjo . . . 11

2 O diagrama de realidade e desejo 16

2.1 Um limiteinferior porpontos de quebra . . . 18 2.2 Determinação da distân ia de transposição vista omo

pro-blema de de isão . . . 21 2.3 Odiagrama de realidade e desejo: um limite inferior mais justo 28

3 O grafo de rearranjos por transposições 49

3.1 Propriedades de

T RG(n)

. . . 53 3.1.1 Número de aminhos mínimosentre dois vérti es . . . 67 3.2 Agrupando vérti es nografode rearranjosportransposições . 72 4 Uma apli ação: en ontrando reversões e transposições entre

os genomas humano e do himpanzé 87

4.1 Formalização doproblema . . . 88 4.2 Ométodo . . . 94

(9)

A Alguns parâmetros onhe idos 111 B Lista de reversões e transposições en ontradas entre o ser

humano e o himpanzé 113

(10)

1.1 Cál ulo da pontuação de um alinhamento entre duas adeias de DNA. . . 2 1.2 Evoluçãoentre o loroplastodotaba oe daL. fervens

(adap-tado de [2℄). . . 3 2.1 Remoção de pontos de quebra poruma transposição. . . 21 2.2 Seqüên ia de transposiçõesque ordena

ρ

[n]

, para

n

par. . . 30 2.3 Seqüên ia de transposiçõesque ordena

ρ

[n]

, para

n

ímpar. . . . 31 2.4 Diagramasderealidadeedesejo: a)

RD(ρ

[5]

, ι

[5]

)

;b)

RD(ι

[5]

, ι

[5]

)

RD((54321), (52143))

. . . 33 2.5 Análise do sub aso 1.1. As linhas tra ejadas representam um

aminho(podendoser uma aresta). . . 40 2.6 Análise do sub aso 1.2. As linhas tra ejadas representam um

aminho(podendoser uma aresta). . . 40 2.7 Caso 2. As linhas tra ejadas representam um aminho

(po-dendo ser uma aresta). . . 41 2.8 Caso 3. As linhas tra ejadas representam um aminho

(po-dendo ser uma aresta). . . 41 2.9 Caso 4(a) e aso 5 (b). As linhas tra ejadasrepresentam um

(11)

2.10 diagramade realidade edesejo

RD(ρ

[7]

, ι

[7]

)

. . . 44

2.11 Análise do aso 1do teorema2.26. . . 46

2.12 Análise do aso 2do teorema2.26. . . 47

3.1 Ografo

T RG(n)

, para

n

entre

1

e

4

. . . 51

3.2 Ografo

T RG(4)

omo

4

ópias de

T RG(3)

. . . 59

3.3 Ordenaçõesmínimas diferentes para

ρ

[4]

. . . 67

3.4 Caminhos mínimosentre

ρ

[4]

e

ι

[4]

.. . . 68

3.5 Alterando a seqüên ia de transposições que transforma

σ

em

ρ

[n]

para transformar

ι

[n−1]

em

ρ

[n−1]

para o lema 3.18. . . 70

3.6 Efeito de uma transposição emuma permutação ir ular . . . 75

3.7 Caso 1 doteorema3.29. . . 79

3.8 Caso 2 doteorema3.29. . . 80

3.9 Osgrafos tóri os

T (3)

,

T (4)

e

T (5)

. . . 83

4.1 Exemplo de grá o de pontos para um alinhamento om es-paços (gaps). . . 92

4.2 Exemplo de grá o de pontos onde houve uma reversão na ordem dos elementosem uma das adeias. . . 92

4.3 Exemplo de grá o de pontos onde houve uma transposição naordem dos elementos emuma das adeias.. . . 93

4.4 Diagramaesquemáti odométodoadotadoparaidenti ar re-versões e transposições entre os genomas humano e do him-panzé. . . 95

(12)

ini ie om o segmento mais à esquerda; (b) adi ionando seg-mentosaoblo o; ( ) próximoalinhamentoestáforadaregião; (d) um novo blo o é riado; (e) blo os en ontrados após a exe ução do algoritmo; (f) identi ação de reversões e trans-posições. . . 102 4.6 Distribuiçãodostamanhosdossegmentosquesofreramreversão.105 4.7 Distribuiçãodos tamanhosdos segmentosquesofreram

trans-posição. . . 105 5.1 Umaseqüên iadetransposiçõesquetro aoprimeiroelemento

(13)

Introdução

Avanços te nológi osre entes permitirama aptação de umaquantidade res ente de informaçãosobre a biologia mole ular dos organismos. Muitos genomas,desdeba tériasatéoserhumano,forammapeadosextensivamente. Tal quantidade de dados fomentou o interesse no problema de omparação de genomas, ouseja, determinaroquãorela ionadasestãoduasespé ies dis-tintaspormeiodaobservaçãodosseus onjuntosde genes. Adistân iaentre duasespé iesé omumenteusada omoentradaemalgoritmosde onstrução de árvores logenéti as, úteis para oestudo da evolução das espé ies.

Háduasabordagens prin ipaisparadeterminaçãodedistân iaentre dois diferentes organismos pela omparação dos seus dados genéti os: alinha-mento de adeiase rearranjo de genomas.

A abordagemde alinhamento de adeias onsiste emdeterminar as dife-rençasesimilaridadesentreduas oumais adeias,atribuindoumapontuação (s ore)para adaalinhamentoounão-alinhamentoqueo orre(gura1.1). A distân iaentre asduas adeiasédeterminadaaoseen ontrar oalinhamento que possui pontuação total máxima, al ulado sobre as adeias de bases de DNA no alfabeto {a, t, , g} ou adeias de aminoá idos no alfabeto

(14)

aga ta tta ga---ga gt

Matriz de similaridade

S

epenalidadede espaço

d

:

a g t a 10 -1 -3 -4

S =

g -1 7 -5 -3 -3 -5 9 0 t -4 -3 0 8

d = −5

Pontuação:

S

(a, )

+ S

(g,g)

+ S

(a,a)

+ 3 · d + S

(g,g)

+ S

(t,a)

+ S

(t, )

+ S

(a,g)

+ S

( ,t)

=

-3

+

7

+

10

+ 3 · (−5) +

7

+

(-4)

+

0

+

(-1)

+

0

=

= 1

Figura1.1: Cál uloda pontuaçãode umalinhamento entre duas adeiasde DNA.

{A, V,L, I, P, M,F, W, G,S,T, C, N, Q,Y,D, E, K,R,H}. Essa aborda-gem é extremamente sensível a mutações pontuais entre as adeias, e pode falhar na identi ação de mutações grandes. Para maiores detalhes sobre esta abordagem, sugerimos a onsultaao apítulo3do livrode introduçãoà biologia mole ular omputa ionalde Setubale Meidanis [21℄.

Na abordagem por rearranjo de genomas estamos interessados em de-terminar a distân ia entre dois genomas diferentes através da apli ação de mutaçõesaoprimeirogenomade modoque,aonal, osegundo genomaseja en ontrado. Esta abordagem difere da anterior no sentido em que não es-tamos mais omparando letras individuais, mas um onjunto de genes. A distân ia entre dois genomas é, então, o número mínimo de mutações que transforma um genomaemoutro [2, 21℄ (g. 1.2).

(15)

de [2℄).

blo os [27℄, alguns eventos evolu ionários ainda são difí eis de se lidar, no que tange à omplexidade dos algoritmos atuais. Um desses eventos é a transposição.

Uma transposição é um deslo amento de um blo o ontíguo em um ge-noma. Pode-se en ontrar a distân ia de transposição, ou seja, a menor seqüên ia de transposições que transforma um genoma A em um genoma B, de maneira e iente (em tempo polinomial)? Esta é uma questão ainda em aberto, aqual abordaremos neste texto.

Este do umento está organizado da seguinteforma: deniremos aseguir os eventos de reversão, transposição e inter âmbiode blo os e os problemas de rearranjo, omo ál ulo dadistân ia por reversões e por transposições; o apítulo 2 introduz algumas estruturas auxiliares para a resolução dos pro-blemas, omo o diagrama de realidade e desejo, e revisa alguns resultados onhe idos sobre limites para as distân ias; no apítulo 3 propomos o grafo

(16)

usando essa estrutura; no apítulo 4, a parte mais apli ada de nosso traba-lho, apresentamos os resultados obtidos durante o período em que o aluno esteve trabalhando sob a orientação do prof. David Sanko, da Universi-dadede Ottawa,sobreaanálisede rearranjosentreosgenomashumanoedo himpanzé. Porm, no apítulo5,en erraremos omumsumáriodos desen-volvimentos desta tese e apresentaremos prováveis desdobramentos futuros deste trabalho.

Esta tese ontribui para o estudo de rearranjos de genomas tanto no aspe to teóri o quantono aspe to práti o.

No aspe to teóri o, o apítulo2 revisa a teoria lássi a de rearranjos de genomas portransposições, forne endo provasmais detalhadas para os limi-tes do diâmetrode transposiçãosem re orrer a demonstraçõessimplesmente atravésdediagramas. A ríti aaopou oformalismodasprovasapresentadas na teoria lássi a [1, 2, 3, 4℄ foi feita empelomenos dois trabalhos [15, 17℄ ondeumateoriaalgébri afoiproposta omoalternativaparaobterummaior rigor. Já o apítulo 3propõe oestudo de rearranjos por transposições omo um problema de teoria de grafos. En ontramos apenas uma referên ia [10℄ que também usa teoria de grafos, através de um grafoauxiliar, denominado grafo tóri o, que reduz o número de permutações. Des revemos neste a-pítulo várias propriedades do problema de ordenação por transposições, já onhe idas ou novas, omo propriedadesde teoria de grafos. Em relação ao grafo tóri o,também apresentamos novaspropriedades.

Noaspe topráti o,o apítulo4propõeum método omputa ionalusado para omparação dos genomas humano e do himpanzé. Pela primeira vez, são onsideradas transposições na omparação de genomas em larga es ala.

(17)

Umapermutação linear,ousimplesmenteuma permutação,de

n

elemen-tos éuma função bijetiva

π

tal que

π : {1, 2, . . . , n} → {1, 2, . . . , n}

i 7→ π(i) = π

i

,

denotada usualmente por

π =





1

2 . . .

n

π

1 π

2 . . . π

n





,

ou de formamais su inta,

π = (π

1 π

2 . . . π

i

. . . π

j

. . . π

n

).

Cada elemento

π

i

éum inteiro nointervalo

1 ≤ π

i

≤ n

, etodos oselementos são distintos:

π

i

6= π

j

se

i 6= j

.

Duaspermutações, em parti ular,são importantes noestudode rearran-jos, umaporpossuirtodos osseuselementosemordem res enteeoutrapor possuir todos emordem de res ente.

Denição 1.1 (permutação identidade). A permutação identidade é uma permutação queleva todos os elementos neles próprios, sendo denotada por

(18)

tação que leva o elemento

i

no elemento

n − i + 1

, sendo denotada por

ρ

[n]

= (n n−1 . . . 2 1).

Porbrevidade,ondeovalorde

n

estiver laramentedenido,utilizaremos

ι

e

ρ

para denotar, respe tivamente,

ι

[n]

e

ρ

[n]

.

Denição 1.3 (inversa de uma permutação). A inversa da permutação

π

, denotada por

π

−1

, é uma permutação que mapeia ada elemento

π

i

de

π

em sua posição

π

−

1 _(π

i

) = i

, ou seja:

π

−1

= ( π

−1

₁

π

₂

−1

. . . π

_n

−1

),

onde

π

−

1 i

é a posição do elemento

i

em

π

.

Exemplo 1.4. Seja

π = (35214)

. A sua inversa

π

−

1

deve ser tal que

π

−

1 _{(3) = 1}

,

π

−

1 _{(5) = 2}

,

π

−

1 _{(2) = 3}

,

π

−

1 _{(1) = 4}

e

π

−

1 _{(4) = 5}

. Portanto,

π

−

1 _{= (43152)}

.

Oproduto(ou omposição)entreduaspermutações

π

e

σ

éuma permuta-ção

γ = σπ

onde

γ(i) = σ(π(i))

. Noteque,emgeral,

σπ

diferede

πσ

. O pro-duto de uma permutação pelasua inversa é a identidade:

π

−

1 _{π = ππ}

−

1 _{= ι}

(neste aso espe í o, a operação produto é omutativa). Claramente, o produto de permutaçõesé asso iativo:

γ(σπ) = (γσ)π

.

As denições e propriedades men ionadas a ima permitem-nos on luir que aspermutaçõeslineares de

n

elementosformam um grupo

S

n

, hamado de grupo simétri o, om ordem

n!

.

(19)

elementos de uma permutação de uma maneira bemdenida. Entre as ope-rações de rearranjo mais estudadas, estão asreversões e astransposições. Denição 1.5 (reversão). [1, 13, 26℄ Uma reversão, denotada por

r(i, j)

,

1 ≤ i ≤ j ≤ n

, é uma operação que inverte a ordem dos elementos de uma permutação entre as posições

i

e

j

, da forma ilustrada a seguir. Seja

π = (π

1 π

2 . . . π

i

. . . π

j

. . . π

n

)

; a apli ação da reversão

r(i, j)

à permutação

π

produz a seguinte permutação:

π · r(i, j) = (π

1 π

2 . . . π

i−1

π

j

π

j−1

. . . π

i+1

π

i

π

j+1

. . . π

n

).

O aso parti ular

r(1, n)ι

[n]

= ρ

[n]

justi a o nome da permutação reversa. Notamos que uma operação de reversão também pode ser vista omo a seguintepermutação em

S

n

:

r(i, j) = (1 2 . . . i−1 j j −1 . . . i+1 i j +1 . . . n).

Observe que apli ando-se

r(i, j)

à permutação

π · r(i, j)

, obtemos nova-mente

π

, ou seja, a inversa de uma dada reversão é ela própria:

π · r(i, j) ·

r(i, j) = π

para qualquer

π

, portanto

r(i, j) · r(i, j) = ι

, logo

r(i, j) =

(r(i, j))

−

1

. Também é fá il ver que, dada uma permutação

π ∈ S

n

, sem-pre existe uma seqüên iade reversões

r

1 , . . . , r

m

talque

π · r

1 · r

2 · . . . r

m

= ι

. Diremos que uma talseqüên ia ordena

π

.

Exemplo 1.6. Seja

π = (3 2 5 4 1)

e onsidere a reversão

r(3, 5)

, apli ada à permutação

π

:

(20)

Neste aso,

r(3, 5)

pode servista omo apermutação

(1 2 5 4 3)

,e aapli ação de

r(3, 5)

a

π

equivaleao produto:

π · (1 2 5 4 3) = (3 2 1 4 5).

Vemosqueareversão

r(1, 3)

,quandoapli adaa

(3 2 1 4 5)

,produz

( 1 2 3 4 5)

, a permutação identidade.

Denição1.7(transposição). [4℄Uma transposição 1

,denotadapor

t(i, j, k)

, onde

1 ≤ i < j < k ≤ n + 1

, orta os elementos entre as posições

j

e

k − 1

(ambas in lusas) e ola-os imediatamente antes da posição

i

. Seja

π = (π

1 π

2 . . . π

i−1

π

i

. . . π

j−1

π

j

. . . π

k−1

π

k

. . . π

n

),

então:

π · t(i, j, k) = (π

1 π

2 . . . π

i−1

π

j

. . . π

k−1

π

i

. . . π

j−1

π

k

. . . π

n

).

A transposição

t(i, j, k)

pode ser vista omo a permutação

t(i, j, k) = (1 2 . . . i−1 j j +1 . . . k−1 i i+1 . . . j −1 k k+1 . . . n).

Exemplo 1.8.

(8 7 6

?

5 1 4 3 2) · t(1, 3, 5) = ( 6 5 8 7 1 4 3 2)

A inversa de uma transposição é também uma transposição, omo vere-mos na expli açãoquese segue. Seja

π

′

= π · t(i, j, k)

,e queremos en ontrar a permutação

(t(i, j, k))

−

1

tal que

π

′

· (t(i, j, k))

−

1 _{= π}

. Des revamos ada 1

(21)

elemento

π

′

ℓ

de

π

′

, emfunção de

i

,

j

,

k

e

ℓ

:

π

′

ℓ

=











π

ℓ

se

ℓ < i

ou

ℓ ≥ k

π

ℓ−i+j

se

i ≤ ℓ < i + k − j

π

ℓ−k+j

se

i + k − j ≤ ℓ < k,

(1.1)

e onsidere aapli açãodatransposição

t(i, i + k − j, k)

a

π

′

, dandoorigema

π

′′

= π

′

· t(i, i + k − j, k)

, ouseja,

π

′′

= (π

′

1 π

′

2 . . . π

′

i−1

π

′

i+k−j

. . . π

′

k−1

π

′

i

. . . π

′

i+k−j−1

π

′

k

. . . π

′

n

),

onde ada elemento

π

′′

ℓ

′

étal que

π

′′

ℓ

′

=











π

′

ℓ

′

se

ℓ

′

_{< i}

ou

ℓ

′

_{≥ k}

π

′

ℓ

′

_+k−j

se

i ≤ ℓ

′

< j

π

′

ℓ

′

_+i−j

se

j ≤ ℓ

′

_{< k.}

(1.2) Para

ℓ

′

< i

ou

ℓ

′

≥ k

, temos

π

′′

ℓ

′

= π

′

ℓ

′

= π

ℓ

′

; no aso

i ≤ ℓ

′

< j

, obtemosque

π

′′

ℓ

′

= π

′

ℓ

′

_+k−j

e, omo neste aso

ℓ

′

+ k − j

varia entre

i + k − j

(in luso) e

k

(ex luso), então

π

′′

ℓ

′

= π

′

ℓ

′

_+k−j

= π

(ℓ

′

_{+k−j)−k+j}

= π

_ℓ

′

. Em última instân ia,

j ≤ ℓ

′

< k

, logo

π

′′

ℓ

′

= π

′

ℓ

′

_+i−j

= π

(ℓ

′

_{+i−j)−i+j}

= π

_ℓ

′

, pois neste aso

i ≤

ℓ

′

+i−j < i+k−j

. Emtodosos asos,temosque

π

′′

ℓ

′

= π

ℓ

′

,logo

t(i, i+k−j, k)

é a inversa de

t(i, j, k)

.

Exemplo 1.9. Considere a transposição

t(2, 5, 7)

apli ada a

ι

[8]

:

(22)

A transposição

t(2, 2 + 7 − 5, 7) = t(2, 4, 7)

é a inversa de

t(2, 5, 7)

, pois

(1 2 3 4 5

?

6 7 8)·t(2, 5, 7)·t(2, 4, 7) = (1 5 6 2 3

?

4 7 8)·t(2, 4, 7) = (1 2 3 4 5 6 7 8).

Asdeniçõesdas operaçõesde reversãoetransposiçãosão motivadaspor eventosde mutaçãoobservados na omparaçãoentre os genomasde organis-mos distintos[11,23℄. Christie[6℄deneuma operaçãode rearranjoquenão é motivada por razões biológi as,mas que é uma generalização de transpo-sições, e ujo tratamentoteóri o émais simples:

Denição 1.10 (inter âmbio de blo os). [6℄ Um inter âmbio de blo os (ou blo k-inter hange, também denominado blo k-swapping) om parâme-tros

(i, j, k, ℓ)

, onde

1 ≤ i < j ≤ k < ℓ ≤ n + 1

, tro aa posiçãodos blo os de elementos

π

i

. . . π

j−1

e

π

k

. . . π

ℓ−1

em uma permutação:

π · b(i, j, k, ℓ) = (π

1 π

2 . . . π

i−1

π

k

. . . π

ℓ−1

π

j

. . . π

k−1

π

i

. . . π

j−1

π

ℓ

. . . π

n

).

A operação

b(i, j, k, ℓ)

pode ser des rita omo a seguinte permutação:

(1 2 . . . i−1 k k+1 . . . ℓ−1 j j+1 . . . k−1 i i+1 . . . j − 1 ℓ ℓ+1 . . . n).

Exemplo 1.11.

(8 7 6 5 1 4 3 2 ) · b(3, 5, 6, 9) = (8 7 4 3 2 1 6 5 )

.

Umatransposição

t(i, j, k)

equivaleauminter âmbiodeblo os

b(i, j, j, k)

, ondedoisblo osadja entestro amdeposição. Assim omono asodas rever-sões etransposições, essas operaçõesestão nogrupo simétri o

S

n

, a inversa de um inter âmbio de blo os é um inter âmbio de blo os, e sempre existe uma seqüên ia de inter âmbios de blo os que ordenauma dada permutação

(23)

guinteinter âmbiodeblo os:

( 8 7 6 5 1 4 3 2) b(1, 3, 3, 5) = ( 6 5 8 7 1 4 3 2).

1.2 Problemas de rearranjo

Dadasduas permutações

π, σ ∈ S

n

, vê-se quesempre épossível transfor-mar aprimeiranasegunda usando-se, nomáximo,

n − 1

transposições, omo des rito a seguir: para ada elemento

σ

x

= σ

1 , . . . , σ

n

que está na posição

σ

−

1 _(σ

x

) = x

napermutação

σ

,de talformaqueasuaposiçãonapermutação

π

seja diferente de sua posição em

σ

ou seja,

π

−

1 _(σ

x

) 6= x

é possível, se

x < π

−

1 _(σ

x

)

apli ar a

π

a transposição

t(x, π

−

1 _(σ

x

), π

−

1 (σ

x

) + 1)

a

π

, de tal formaque

σ = ( σ

1 . . .

σ

x

. . .

. . . σ

n

)

π = ( π

1 . . .

π

x

. . .

?

σ

x

. . . π

n

)

π · t(x, π

−1

_(σ

x

), π

−1

(σ

x

) + 1) = ( π

1 . . .

σ

x

π

x

. . .

. . . π

n

),

ou se

x > π

−

1 _(σ

x

)

apli ar a

π

a transposição

t(π

−

1 _(σ

x

), π

−

1 (σ

x

) + 1, x + 1)

, obtendo-se

σ = ( σ

1 . . . σ

x

. . . σ

n

)

π = ( π

1 . . . σ

x

. . .

?

π

x

. . . π

n

)

π · t(π

−1

(σ

x

), π

−1

(σ

x

) + 1, x + 1) = ( π

1 . . . .

π

x

σ

x

. . . π

n

).

Emambos os asos a apli açãodatransposiçãoa

π

resultaemuma per-mutação que tem oelemento

σ

x

na

x

-ésima posição, queé asua posição em

σ

. Vê-se fa ilmenteque aso essa operaçãoseja efetuadauma vez para ada elemento de

σ

que está em uma posição diferente em

π

, seguindo a ordem

(24)

trans-formado

π

em

σ

. Esta seqüên ia de transposições apresentada, em muitos asos, não é ótima.

Denição 1.13 (distân ia de transposição). [4℄ A distân ia de transposi-ção,

d

t

(π, σ)

entre duas permutações

π

,

σ ∈ S

n

é o número mínimo

q

de transposições

t

1 , . . . , t

q

tal que

π · t

1 · t

2 · . . . · t

q

= σ

.

Comovistonadis ussãoquepre edeàdenição,se

π

e

σ

sãopermutações dos mesmos

n

elementos, sempre é possível en ontrar uma seqüên ia om, no máximo,

n − 1

transposiçõesque transforma

π

em

σ

, logoadistân ia de transposiçãoé limitadasuperiormente eestá bem-denida.

Exemplo 1.14. Seja

π = (54321)

e

σ = (12345)

. Existe uma seqüên ia de

3

transposições que transforma

π

em

σ

:

π = (5 4 3 2

?

1 )

?

t(2, 4, 6)

(5 2 1

?

4 3)

?

t(1, 3, 5)

(1 4 5 2

?

3 )

?

t(2, 4, 6)

σ =

(1 2 3 4 5)

Isto impli a que

d

t

(π, σ) ≤ 3

.

A distân ia de transposição

d

t

(π, σ)

é nula se, e somente se,

π = σ

; é óbvio que, se não pre isamos de nenhuma transposição para transformar uma permutação em outra, elas são idênti as. Por outro lado, se temos

(25)

uma transposição, transforma

σ

em

π

, e não é possível en ontrar uma ou-tra seqüên ia om menor número de transposições om essa ara terísti a ( aso ontrário, poderíamos invertê-la e transformar

π

em

σ

om menos transposições do que o mínimo, uma ontradição). O leitor atento deve ter ante ipado que provaremos que a distân ia de transposição obede e à desigualdade triangularem seguida; laramente, se temos

π, γ, σ ∈ S

n

, e to-marmos uma seqüên iamínima de transposições

t

1 , . . . , t

q

quetransforma

π

em

γ

eoutra seqüên iamínima

t

′

1 , . . . , t

′

s

queleva

γ

em

σ

,então aseqüên ia

t

1 , . . . , t

q

, t

′

₁

, . . . , t

′

s

, om

q+s

transposiçõestransforma

π

em

σ

(não ne essari-amente omum númeromínimode operações). Ora io íniodeste parágrafo nos induz a on luir que a distân iade transposição é uma métri a no on-juntodas permutações de

n

elementos.

Denição 1.15 (ordenação mínima por transposições). Dada uma permu-tação

π ∈ S

n

, o problema de ordenação mínima por transposições on-sisteemen ontrarumaseqüên ia om omprimentomínimodetransposições

t

1 , . . . , t

q

tal que

π · t

1 · t

2 · . . . · t

q

= ι

. O omprimento da menor seqüên ia de transposições que ordena

π

é denotado por

d

t

(π)

.

Comogeralmentesomenteestamosinteressadosemen ontraruma seqüên- iamínimadetransposiçõesquetransformaumadadapermutaçãona permu-taçãoidentidade,aexpressãoordenaçãopor transposições seráutilizadapara designar o problema de ordenação mínima por transposições, salvo quando indi armos expli itamenteque aseqüên iaque ordenauma permutação não é mínima.

Osproblemasdetransformarumapermutaçãoemoutraportransposições ede ordenarumapermutaçãoportransposiçõessãoequivalentes, omovisto no orolário1.17.

(26)

Lema 1.16. Sejam

γ, π, σ ∈ S

n

. Então

d

t

(π, σ) = d

t

(γπ, γσ)

.

Prova. Seja

t

1 , . . . , t

q

uma seqüên iade transposições que transforma

π

em

σ

, ou seja,

π · t

1 · . . . · t

q

= σ

. Considere o produto

γ · π · t

1 · . . . · t

q

; pela asso iatividadedoproduto,temosqueeleéequivalentea

γ · (π · t

1 · . . . · t

q

) =

γ · σ

. Logo, a seqüên ia

t

1 , . . . , t

q

também transforma

γπ

em

γσ

, portanto

d

t

(γπ, γσ) ≤ d

t

(π, σ)

. Oargumento também é válido no sentido inverso, ou seja, que

d

t

(π, σ) ≤ d

t

(γπ, γσ)

. As duasdesigualdadesobtidas impli amque

d

t

(π, σ) = d

t

(γπ, γσ)

.

Corolário 1.17. Sejam

π, σ ∈ S

n

. Então

d

t

(π, σ) = d

t

(σ

−1

_{π, σ}

−1

_{σ) =}

d

t

(σ

−

1 π, ι) = d

t

(σ

−

1 π)

.

Outroproblemarela ionadoàdeterminaçãodadistân iade transposição éen ontrar amaiordistân iaentre doiselementosquaisquerdo onjunto

S

n

.

Denição 1.18 (diâmetro de transposição). [4℄ O diâmetro de transposi-ção

D

t

(n)

do grupo simétri o

S

n

é a maior distân ia de transposição entre quaisquer doiselementos do grupo, ou seja:

D

t

(n) := max{d

t

(π, σ); π, σ ∈ S

n

}.

Como

d

t

(π, σ) = d

t

(σ

−1

_π)

(27)

também a outros eventos de rearranjo, omo para as reversões e para os inter âmbios de blo os, alterando-se as denições de maneira onveniente. Como exemplo, veremos omo denir a distân ia entre duas permutações pormeio de reversões.

Denição 1.19 (distân ia de reversão). [1, 13, 26℄ A distân iade reversão,

d

r

(π, σ)

entre duaspermutações

π

,

σ ∈ S

n

é o número mínimo

q

de reversões

r

1 , . . . , r

q

tal que

π · r

1 · . . . · r

q

= σ

.

Exemplo 1.20. Sejam

π = (7 1 2 3 5 4 6 8)

e

σ = (1 2 3 4 5 6 7 8)

. Existe uma seqüên ia de

3

reversões que transforma

π

em

σ

:

π = (7 1 2 3 5 4 6 8)

?

r(5, 6)

(7 1 2 3 4 5 6 8)

?

r(2, 7)

( 7 6 5 4 3 2 1 8)

?

r(1, 7)

σ = (1 2 3 4 5 6 7 8)

Isto impli a que

d

r

(π, σ) ≤ 3

.

Como esperado,

d

r

(π, σ)

é sempre bem-denida para quaisquer permu-tações

π, σ

om o mesmo número

n

de elementos e

d

r

é uma métri a no espaço

S

n

. Os argumentos são semelhantes aos utilizadospara as transposi-ções: sempre é possível transformar

π

em

σ

fazendo-se uma reversão que, a ada passo, levaum elementopara a sua orretaposição em

σ

; para provar-mos que

d

r

é uma métri a podemos prati amenterepetir o argumento visto anteriormenteipsis litteris, substituindo transposição por reversão.

Apartir desteponto, on entraremos onosso fo osobre osproblemas de ordenaçãoportransposiçõesededeterminaçãododiâmetrodetransposição.

(28)

O diagrama de realidade e desejo

Apresentaremos,neste apítulo,estruturas auxiliarese resultados onhe- idos, omo limites para a distân iae o diâmetrode transposição, ini iando om uma dis ussão doque já se onhe e para osproblemas de rearranjo.

Apesar de problemas de rearranjo espe í osjá serem estudados desdeo iní iodosé uloXX[23℄,somenteemtemposre entesprin ipiou-seaprati ar uma abordagemmais formalpara solu ioná-los[18,26℄.

As estruturas utilizadas atualmente foram primeiramente introduzidas porNadeaueTaylor[18℄eBafnaePevzner [1,3℄,sendoqueoprimeiro algo-ritmo aproximativo polinomial a usá-las para ordenaruma permutação por reversões foi proposto por Ke e ioglu e Sanko em 1992 [13℄. Hannenhalli, BafnaePevznerpropuseram,emseguida,umalgoritmoexato om omplexi-dade temporalpolinomialpara um problema rela ionado, de ordenação por reversões de permutações emque ada elemento possui um sinal que indi a asua orientação,e ada reversão inverte osinal de todosos elementos afeta-dos [12, 3℄. O problema originalde ordenação por reversões permane eu em aberto até que Caprara [5℄ provou que determinar a distân ia de reversão é

(29)

que para ordenação por reversões. Desde os primeiros trabalhos formais [3℄ até osresultados mais re entes [9℄, bus a-se sem su esso uma formade esti-mar de maneiraexata adistân iade transposição. Mesmo aestratégiade se adi ionarinformaçãosobreorientaçãoaoselementosdeumapermutação[25℄, omo feitono problemade ordenaçãoporreversões, não deu origem aindaa nenhum algoritmoexato. Além disso, ainda há uma grande diferença entre os limites superior e inferior demonstrados para a distân iade transposição [14, 7℄.

Para este apítulo, seguiremos o seguinte roteiro: na seção 2.1, apre-sentaremos o on eito de pontos de quebra entre duas permutações e um limite inferior que pode ser obtido diretamente por meio dessa denição. Na seção 2.2, faremos uma mudança de ponto de vista, estudando o pro-blema de de isão

d

t

(π) ≤ d

para um inteiro xo não-negativo

d

, o que nos dá um algoritmopara determinação exata para a distân iade transposição, uja omplexidadeépolinomialquando onsideramos

d

omouma onstante. Con luiremoso apítulonaseção2.3apresentandoademonstração deum li-miteinferiormaisjustoparaadistân iadetransposiçãoapartirdodiagrama de realidade e desejo, denido nessa seção. Nossa demonstração é a mesma apresentada em [4℄, porém usamos um rigor maior no desenvolvimento da prova, sem usar argumentos puramente baseados em guras. Desta forma, a reditamoster ontribuídoparaa ompreensãodasprovasesanadoalgumas das ríti as[15,17℄ aopou o formalismoda teoria lássi a.

(30)

Dadasduas permutações

π

e

σ

eumaoperaçãode rearranjoque permite-nos transformar

π

em

σ

om uma seqüên ia de operações, podemosestimar de maneira simples um limite inferior para o número mínimo de operações que devem ser apli adassu essivamentea

π

para transformá-laem

σ

.

Para o ál ulo do número de operações ne essárias, adi ionaremos mais dois elementosàspermutaçõesquedesejarmos al ularadistân ia, de forma a xaros seus extremos.

Denição 2.1(permutaçãoestendida). Dada

π = (π

1 π

2 . . . π

n

)

uma permu-tação de

S

n

, a sua permutação estendida é a permutação a res ida de dois elementos xos,

π

0 = 0

e

π

n+1

= n + 1

, denida por

(0 π

1 π

2 . . . π

n

n+1)

. Denição 2.2 (elementos subseqüentes). Dada uma permutação

π

, os ele-mentos

π

i

, π

j

de sua permutação estendida

(0 π

1 π

2 . . . π

n

n+1)

são ditos subseqüentes se

j = i + 1

.

Observa-seimediatamenteque,sedoiselementos

π

i

e

π

i+1

são subseqüen-tes em

π

,masnão em

σ

, entãoesses dois elementosne essariamentedeverão tornar-senão-subseqüentesporalgumaoperaçãodeumaseqüên iaque trans-forma

π

em

σ

.

Denição 2.3 (pontos de quebra, elementos adja entes). Dadas duas per-mutações

π

e

σ

, om suas orrespondentes permutações estendidas, um par de elementos subseqüentes

π

i

, π

i+1

na permutação estendida de

π

, mas não-subseqüentesnapermutaçãoestendida de

σ

éum pontodequebra(do inglês, breakpoints) de

π

emrelação a

σ

. Caso

π

i

, π

i+1

sejam subseqüentes em

π

e

(31)

Denição 2.4. Dadas duaspermutações

π

e

σ

, o número

b(π, σ)

de pontos de quebra de

π

em relação a

σ

é a quantidadede pares subseqüentes na per-mutação estendida de

π

que não são subseqüentes na permutação estendida de

σ

.

Exemplo2.5. Sejam

π = (156234)

eapermutaçãoidentidade

ι = (123456)

. A permutação estendida de

π

e da identidade são, respe tivamente

(0 1 5 6 2 3 4 7)

e

(0 1 2 3 4 5 6 7).

Os pares

1 5

,

6 2

e

4 7

são os pontos de quebra de

π

em relação a

ι

, logo

b(π, ι) = 3

.

Veremosqueonúmerodepontosdequebra

b(π, σ)

énulose,esomentese,

π = σ

. Comefeito, se

π = σ

,entãotodopardeelementossubseqüentes em

π

éadja ente omrelaçãoa

σ

,logonãohápontos dequebra. Poroutrolado,se

b(π, σ) = 0

, ospares

0π

1

,

π

1 π

2

,...

π

n−1

π

n

,

π

n

n+1

são todos adja ên ias om relação a

σ

; mas, para isso, é ne essário que

π

1 = σ

1

,

π

2 = σ

2

, ...,

π

n

= σ

n

, ou seja,

π = σ

.

Como temos

n + 1

pares de elementos

0π

1

,

π

1 π

2

, ...,

π

n−1

π

n

,

π

n+1

, então

0 ≤ b(π, σ) ≤ n + 1

. Observequeolimitesuperioréatingidopela per-mutaçãoreversa, om relaçãoàpermutaçãoidentidade:

b(ρ

[n]

, ι

[n]

) = n + 1

. Portanto, para todapermutação

π ∈ S

n

,

b(π, ι

[n]

) ≤ b(ρ

[n]

, ι

[n]

).

Podemos ver também que o número de pontos de quebra

b(π, σ)

é igual a

b(σ

−

1 _{π, ι)}

, onforme oresultado a seguir.

(32)

Prova. Primeiramente, demonstraremos que, todo ponto de quebra de

π

, om relação a

σ

, orresponde a um ponto de quebra de

γπ

, om relação a

γσ

, oque iráimpli ar adesigualdade

b(π, σ) ≤ b(γπ, γσ)

.

Seja

π

ℓ−1

π

ℓ

umpontodequebrade

π

, omrelaçãoa

σ

,onde

ℓ

satisfaz

1 ≤

ℓ < n+1

. Como

π

e

σ

sãopermutaçõessobreomesmo onjuntodeelementos, existe um elemento

σ

m−1

talque

π

ℓ−1

= σ

m−1

; Porém,

σ

m

6= π

ℓ

, pois

π

ℓ−1

π

ℓ

éum pontodequebra. Consideremosagoraoparde elementos

γ(π

ℓ−1

)γ(π

ℓ

)

, subseqüentes em

γπ

. Como

π

ℓ−1

= σ

m−1

, então o elemento

γ(π

ℓ−1

)

de

γπ

é igual ao elemento

γ(σ

m−1

)

de

γσ

, mas

γ(π

ℓ

) 6= γ(σ

m

)

, pois

γ

é bijetora e

π

ℓ

6= σ

m

. O par de elementos

γ(σ

m−1

)γ(σ

m

)

não é subseqüente em

γσ

, logo

γ(π

ℓ−1

)γ(π

ℓ

)

é um ponto de quebra em

γπ

om relação a

γσ

. Novamente usamos a ara terísti ade que

γ

ébijetora para on luir que ada ponto de quebra

π

ℓ−1

π

ℓ

é levado em um ponto de quebra distinto

γ(π

ℓ−1

)γ(π

ℓ

)

, logo

b(π, σ) ≤ b(γπ, γσ)

.

Adesigualdade

b(π, σ) ≥ b(γπ, γσ)

éobtidafazendo-se

π

′

= γπ

,

σ

′

= γσ

e omparando-se

b(π

′

, σ

′

)

e

b(γ

−

1 _π

′

, γ

−

1 _σ

′

)

, omozemosnoparágrafoanterior.

Corolário 2.7. Sejam

π, σ ∈ S

n

. Então

b(π, σ) = b(σ

−

1 _{π, σ}

−

1 _{σ) =}

b(σ

−

1 _{π, ι)}

.

Com as denições apresentadas anteriormente, estamos prontospara es-timar um primeiro limiteinferior para a distân iade transposição.

Teorema 2.8. [4℄ Sejam

π

e

σ

duas permutações de

n

elementos. Então,

d

t

(π, σ) ≥ ⌈b(π, σ)/3⌉

.

(33)

pontos de quebra

π = (π

1 . . .

z

π

i−1

}|

π

{

i

π

i+1

. . .

z

π

j−1

}|

π

{

j

. . .

z

}|

{

π

k−1

π

k

. . . π

n

)

t(i, j, k)

π · t(i, j, k) = (π

1 . . . π

i−1

π

j

|

{z

}

. . . π

k−1

π

i

|

{z

}

π

i+1

. . . π

|

j−1

{z

π

k

}

. . . π

n

)

adjacˆencias

Figura2.1: Remoção de pontosde quebra por umatransposição.

em,nomáximo,

3

unidades(gura2.1). Umaseqüên iadetransposiçõesque transforma

π

em

σ

poderá,então,subtrair

3

unidadesdonúmerodepontosde quebra,namelhordashipóteses,a adatransposiçãoapli ada,até hegarmos a

0

pontos de quebra, donde obtemos a ota inferior

d

t

(π, σ) ≥ ⌈b(π, σ)/3⌉

.

Para a permutação reversa

ρ

[n]

, obtemos

d

t

(ρ

[n]

, ι

[n]

) ≥

_n+1

3

, e on-seqüentemente um limite inferior para o diâmetro de transposição

D

t

(n) =

max{d

t

(σ), σ ∈ S

n

} ≥

_n+1

3

.

Aprova doteorema2.8usa que se

d

t

(π, σ) ≤ 1

,então

b(π, σ) ∈ {0, 3}

. A re ípro atambémé verdadeira, omo veremos naseção 2.2, a seguir.

2.2 Determinação da distân ia de transposição

vista omo problema de de isão

Oproblema de en ontrar a menor seqüên ia de transposiçõesque trans-forma uma transposição

π

em

σ

pode ser transformado no problema de de- isão equivalente, de determinar se

d

t

(π, σ) ≤ d

, para algum inteiro

d

xo, onde

0 ≤ d ≤ n − 1

. Para

d = 0

, oproblemareduz-se adeterminarse

π = σ

,

(34)

Se

d = n − 1

,arespostaaoproblema ésemprepositiva,poispodemostomar ada elemento de

π

individualmente e olo á-lo om uma transposição em sua posição orrespondente em

σ

.

Também é fá il determinar se

d

t

(π, σ) ≤ 1

. Neste aso, pre isamos determinar se

π = σ

ou, equivalentemente, que

b(π, σ) = 0

ou se

σ = π · t(i, j, k)

, o que pode ser feito também em tempo linear, bastando-se per orrer as duas permutações e veri ar se existem apenas

3

pontos de quebra em

π

om relação a

σ

, de a ordo om o que nos diz o lema 2.9. O algoritmo1des reve opro edimentoemmaioresdetalhes. Para deixar mais laro para o leitor qual a transposição que transforma

σ

em

π

, os parâme-tros

i

,

j

e

k

datransposição são al ulados, apesarde não seremne essários, pois apenas estamos interessados em determinar se a distân ia entre duas permutaçõesé igual ouinferior a

1

.

Lema 2.9. Sejam

π

e

σ

duaspermutações. Existe umatransposição

t(i, j, k)

tal que

π · t(i, j, k) = σ

se, e somente se,

b(π, σ) = 3

.

Prova. Se

σ = π · t(i, j, k)

, então é trivial veri ar que

b(π, σ) = 3

(veja o diagrama dagura 2.1). A armação re ípro a é veri ada mais fa ilmente omparando-se

σ

−

1 _π

e

ι

. Pelo orolário2.7,

b(π, σ) = b(σ

−

1 _{π, ι) = 3}

. Seja

π

′

denidapor

π

′

:= σ

−

1 _π

. Existemtrêsparesdeelementos,osquais denominaremos

π

′

i−1

π

′

i

,

π

′

j−1

π

′

j

e

π

′

k−1

π

′

k

, tais que

π

ℓ−1

π

ℓ

são onse utivos em

π

, para

ℓ ∈ {i, j, k}

, mas

π

′

i

6= π

′

i−1

+ 1

. Suponhamos, sem perda de generalidade, que

1 ≤ i < j < k ≤ n + 1

.

Comohá apenas

3

pontosde quebra entre

π

′

e

ι

, então devemos ter que:

• π

′

(35)

Algoritmo 1 Determinase

d

t

(π, σ) ≤ 1

Sejam:

π, σ ∈ S

n

.

Retorna: verdadeiro, aso

d

t

(π, σ) ≤ 1

, falso aso ontrário. 1:

b ← 0

{ número de pontos de quebra }

2:

i

′

← 1

3: enquanto

i

′

≤ n

faça 4: se

π

i

′

= σ

i

′

então 5:

i

′

← i

′

+ 1

6: senão 7:

b ← b + 1

8:

i ← i

′

9:

j

′

← i

′

+ 1

10: enquanto

σ

j

′

6= π

i

′

faça 11:

j

′

_{← j}

′

_{+ 1}

12:

j ← j

′

13: enquanto

σ

j

′

= π

i

′

faça 14:

j

′

← j

′

+ 1

15:

i

′

← i

′

+ 1

16:

b ← b + 1

17:

j

′

← i + 1

18: enquanto

σ

j

′

= π

i

′

faça 19:

j

′

← j

′

+ 1

20:

i

′

← i

′

+ 1

21:

k ← i

′

{ neste ponto,se

d

t

(π, σ) = 1

então

π = σ · t(i, j, k)

}

22:

b ← b + 1

23: se

b = 0

ou

b = 3

então

24: retorna verdadeiro

25: senão

(36)

• π

′

i

6= ι

i

, mas existe

i

′

6= i

tal que

π

′

i

= i

′

e, portanto,

π

′

i+1

= i

′

+ 1

,

π

′

i+2

= i

′

+ 2

,...,

π

′

i+(j−1−i)

= π

′

j−1

= i

′

+ (j − 1 − i)

;

• π

′

j

6= i

′

+ j − i

, mas existe

j

′

tal que

π

′

j

= j

′

e,portanto,

π

′

j+1

= j

′

+ 1

,

π

′

j+2

= j

′

+ 2

,...,

π

′

j+(k−1−j)

= π

k−1

= j

′

+ (k − 1 − j)

;

• π

′

k−1

6= k − 1

.

Logo, apermutação estendida de

π

′

possui a forma

(0 1 . . . i−1 i

′

i

′

+1 . . . i

′

+(j−1−i) j

′

j

′

+1 . . . j

′

+(k−1−j) k k+1 . . . n n+1).

Comonas duasseqüên ias

i

′

, i

′

+1, . . . , i

′

+(j−1−i)

e

j

′

, j

′

+1, . . . , j

′

+(k−1−j)

temos

k − i

elementos, ada elemento é

1

unidade maior do que o anterior, e todos os números

i, i + 1, . . . , k − 1

devem estar presentes nessas duas seqüên ias, então

i

′

> j

′

pois, aso

i

′

< j

′

, para que todos osnúmeros entre

i

e

k − 1

estivessem em ambas as seqüên ias pre isaríamos que

i

′

fosse igual a

i

, uma ontradição. Alémdisso,

j

′

_{= i}

e

i

′

_{= j}

′

_{+(k −1−j)+1}

, novamente pelo fato de as duas seqüên ias serem res entes e terem que onter todos os números entre

i

e

k − 1

. Con luímos então que a transposição

t(i, j, k)

transforma

σ

−

1 _{π = (1 . . . i−1 i}

′

i

′

+1 . . . i

′

+(j−1−i) j

′

j

′

+1 . . . j

′

+(k−1−j) k k+1 . . . n).

em

(1 . . . i−1 j

′

j

′

+1 . . . j

′

+(k−1−j) i

′

i

′

+1 . . . i

′

+(j −1−i) k k+1 . . . n).

(37)

ι = (1 . . . i−1 i i+1 . . . j − 1 j j +1 . . . k−1 k k+1 . . . n).

Ou seja,

d

t

(σ

−1

_{π, ι) = 1}

. Mas,pelo orolário1.17,

d

t

(π, σ) = d

t

(σ

−1

_{π, ι) = 1}

.

Para de idir seduas permutações

π

e

σ

estão auma distân iaxa

d

, em geral, tomamos valores

i, j, k

tais que

1 ≤ i < j < k ≤ n + 1

, apli amos a transposição

t(i, j, k)

a

π

e veri amos se a permutação

π

′

_{= π · t(i, j, k)}

possui

d

t

(π

′

, σ) ≤ d − 1

; se a resposta for positiva, então

d

t

(π, σ) ≤ d

, aso ontrário,es olhemosoutrosvalores para

i

,

j

e

k

até en ontrarmos

π

′

talque

d

t

(π

′

, σ) ≤ d − 1

ou atéesgotarmos todas as possibilidades. Opro edimento é des ritode maneiraestruturada noalgoritmo2.

Determinar

d

t

(π, σ) = 0

ou

d

t

(π, σ) ≤ 1

pode ser exe utado om uma quantidade de operações linear em

n

. A veri ação de

d

t

(π, σ) ≤ 2

requer que apliquemos todas as possíveis transposições a

π

, o que é feito no laço ompreendido entre as linhas 12 e 17. Cal ulemos quantas es olhas admis-síveis existem para

i

,

j

e

k

, de talformaque

t(i, j, k)

seja uma transposição válida esem repetirmos transposições:

n−1

X

i=1

n+1

X

k=i+2

k−1

X

j=i+1

1 =

n−1

X

i=1

n+1

X

k=i+2

k − (i + 1)

=

n−1

X

i=1

−(i + 1)(n − i) + (i + 2 + n + 1)

n − 1

2 =

n−1

X

i=1

n − i

2 (−2i − 2 + i + 2 + n + 1)

=

n−1

X

i=1

n − i

2 (n − i + 1)

( ontinuana página27)

(38)

Algoritmo 2 Determinase

d

t

(π, σ) ≤ d

Sejam:

π, σ ∈ S

n

,

d

inteiro não-negativo.

Retorna: verdadeiro, aso

d

t

(π, σ) ≤ d

, falso aso ontrário. Função distân ia

(π, σ, d)

1: se

d = 0

então 2: se

π = σ

então 3: retorna verdadeiro 4: senão 5: retorna falso 6: se

d = 1

então

7: se

σ = π · t(i, j, k)

ou

π = σ

então{veri ávelem tempo linear}

8: retorna verdadeiro 9: senão 10: retorna falso 11: se

d > 1

então 12: para

i = 1 . . . n − 1

faça 13: para

j = i + 1 . . . n

faça 14: para

k = j + 1 . . . n + 1

faça 15:

π

′

← π · t(i, j, k)

16: se distân ia

(π

′

_{, σ, d − 1) =}

verdadeiroentão 17: retorna verdadeiro 18: retorna falso

(39)

=

1

2 n−1

X

i=1

n

2 + n − 2ni + i

2 − i

=

1

2 (n − 1)(n

2 _{+ n) − 2n}

n−1

X

i=1

i +

n−1

X

i=1

i

2 −

n−1

X

i=1

i

!

=

1

2 n

3 _{− n}

2 _{+ n}

2 _{− n −2n}

n

2 − n

2 |

{z

}

−

n

3 +n

2 −

n

2 _{− n}

2 |

{z

}

n

2

2 −

n

2 +

+

2(n − 1)

3 _{+ 3(n − 1)}

2 _{+ n − 1}

6 !

=

n

2 _{− n}

4 +

2n

3 _{− 6n}

2 _{+ 6n − 2 + 3n}

2 _{− 6n + 1 + n − 1}

12 =

3n

2 _{− 3n}

12 +

2n

3 _{− 3n}

2 _{+ n}

12 =

n

3 _{− n}

6 .

Tal valoré usado para a análise doalgoritmo de força bruta que, exaus-tivamente, pro ura transformar

π

em

σ

por transposições. Logo daremos maior ênfase a esse resultado no parágrafoa seguir.

Proposição2.10. Dadaumapermutação

π ∈ S

n

, existem

n

3 −

n

6

permutações

π

′

tais que

π

′

= π · t(i, j, k)

.

Voltandoàanáliseda omplexidadedoalgoritmo2, on luímosque,para

d = 2

, são efetuadas

n

3 −n

6

iterações, onde a ada iteração exe utamos o pro edimento distân ia para

d = 1

, o que é feito em tempo

O(n)

. Logo, a exe ução doalgoritmo onsome, neste aso, tempo

O(n

4 ₎

(40)

e arbitrários de

d

, onsumiremosum tempo

T (d)

, onde

T (d) = O(

n

3 _{− n}

6 T (d − 1))

= O(

n

3 _{− n}

6 n

3 _{− n}

6 T (d − 2))

= . . .

= O((

n

3 _{− n}

6 )

d−1

_{T (1))}

= O(n

3(d−1)

n)

= O(n

3d−2

).

Vemosassimquea omplexidadedoproblemadedeterminaçãoda distân- iadetransposiçãoépolinomialem

n

quando onsideramos

d

uma onstante. Porém, se não impusermos limites a

d

, omo

d

t

(π, σ) ≥ ⌈b(π, σ)/3⌉

e o nú-mero depontos de quebrapodeal ançarvalores de até

n + 1

,poderemos, no pior aso,despenderum tempoexponen ialnaexe uçãode nossoalgoritmo.

2.3 O diagrama de realidade e desejo: um

li-mite inferior mais justo

Analisemoso omportamentodolimiteinferiorparaadistân iade trans-posição

d

t

(π, σ) ≥ ⌈b(π, σ)/3⌉

e veriquemos oquãopróximoeleseen ontra da distân iareal, usando apermutação reversa para essa análise.

JásesabiadesdeoartigodeBafnaePevzner[4℄queapermutaçãoreversa

ρ

[n]

pode ser ordenada om, nomáximo,

⌊n/2⌋ + 1

transposições. Meidanis, Walter e Dias [16℄ formalizaram o resultado de Bafna e Pevzner, exibindo umaseqüên ia om

⌊n/2⌋ + 1

transposiçõesqueordenaapermutaçãoreversa

(41)

igualdade

d

t

(ρ

[n]

) = ⌊n/2⌋+1

,estabele endoolimiteinferior

D

t

(n) ≥

_n

2 +1

. Apresentaremos, nesta seção, os resultados que permitem-nos al ular a distân iade transposiçãoexata entre apermutação reversa eaidentidade,e on luiremos que o limite inferior

⌈b(π, σ)/3⌉

para a distân ia pode não ser muito próximo dadistân iareal.

Proposição 2.11. [4, 16℄ A permutação reversa

ρ

[n]

,

n ≥ 3

pode ser orde-nada om

⌊n/2⌋ + 1

transposições.

Prova. Se

n = 2ℓ

é par, a seqüên ia om

ℓ + 1

transposições da gura 2.2 ordena

ρ

[n]

.

Para

n = 2ℓ + 1

ímpar,apresentamos uma seqüên ia om

ℓ + 1

transpo-sições nagura 2.3.

A proposição 2.11 nos dá um limite superior

d

t

(ρ

[n]

) ≤ ⌊n/2⌋ + 1

para a distân iaentre

ρ

[n]

e

ι

[n]

. Olimiteinferior obtidonoteorema2.8pelaanálise dos pontos de quebra dá-nos

d

t

(ρ

[n]

) ≥

b(ρ

[n]

, ι

[n]

)/3

= ⌈(n + 1)/3⌉

. Há uma grande diferença entre o limite inferior e o superior, logo este limite inferior não é de muita valiapara estimar a distân ia neste aso. Podemos obter limites melhores se utilizarmos uma estrutura que aptura melhor a omplexidade doproblema.

Denição 2.12 (diagrama de realidade e desejo). [4, 21℄ Dadas duas per-mutações

π, σ ∈ S

n

, o diagramaderealidade edesejo

RD(π, σ) = (V, R ∪ D)

é um multigrafo tal que:

V

= {0, −1, +1, −2, +2, . . . , −n, +n, −(n + 1)}

R = {(+π

i

, −π

i+1

) ; π

i

π

i+1

são elementos subseqüentesem

π}

(42)

n n−1 n−2 n−3 . . . ℓ ℓ−1

?

. . . 2 1

?

t(3, ℓ + 2, n + 1)

n n−1 ℓ−1 . . . 2 1

?

n−2 n−3 . . . ℓ

?

t(1, ℓ + 1, ℓ + 3)

1 n−2 n n−1 ℓ−1 . . .

?

2 n−3

. . . ℓ

?

t(2, ℓ + 2, ℓ + 4)

. . .

?

t(ℓ − 1, n − 1, n + 1)

1 2 . . . ℓ−1 ℓ . . . n−3 n−2 n n

?

−1

?

t(n − 1, n, n + 1)

( 1 2 . . . ℓ−1 ℓ . . . n−3 n−2 n−1 n )

Figura2.2: Seqüên iade transposiçõesqueordena

ρ

(43)

n n−1 n−2 . . . ℓ+1 ℓ

?

. . . 2 1

?

t(2, ℓ + 1, n + 1)

n ℓ . . . 2 1

?

n−1 n−2 . . . ℓ+1

?

t(1, ℓ, ℓ + 2)

1 n−1 n ℓ . . . 2

?

n−2

. . . ℓ+1

?

t(2, ℓ + 1, ℓ + 3)

. . .

?

t(ℓ − 1, n − 2, n)

1 2 . . . ℓ−1 ℓ+1 . . . n−2 n−1 n ℓ

?

ℓ+1

?

t(ℓ, n − 1, n + 1)

( 1 2 . . . ℓ−1 ℓ ℓ+1 ℓ+1 . . . n−2 n−1 n )

Figura2.3: Seqüên iade transposiçõesqueordena

ρ

(44)

RD(π, σ)

, para diversas permutações

π

e

σ

. Representamos as arestas do onjunto

R

om linhas mais fortes. Os vérti es estão dispostos segundo a ordem dos elementos em

π

.

Na literatura, o diagramade realidade edesejo ostumaser apresentado tambémsob onome de grafo de pontos de quebra (breakpoint graph),sendo esta últimaa denominaçãoadotada originalmente

1

porBafna e Pevzner [4℄. Optamos por nos referir a esse multigrafo ex lusivamente pelo nome de di-agrama de realidade e desejo, omo o fazem

2

Setubal e Meidanis em seu livro[21℄por rer queeledes revemelhoraestruturadografoearazãopela qual o denimos.

Cadaarestade

RD(π, σ)

perten e aumdos onjuntos

R

ou

D

,aosquais nos referiremospelos nomesrealidade edesejo, respe tivamente. As ares-tas de realidade des revem a estrutura dapermutação

π

, a permutaçãoque deverá ser transformada por su essivas transposições até hegarmos à per-mutação desejada

σ

, uja estrutura éreetida pelas arestas de desejo. Se os onjuntos

R

e

D

ontêm as mesmasarestas, então

π = σ

.

Pela denição de

RD(π, σ)

, ele é

2

-regular, pois há exatamente

1

aresta de realidade e

1

aresta de desejo in identes a ada vérti e. Logo, podemos parti ioná-lode maneiraúni aem i losalternantes, ouseja,ondeasarestas de

R

e

D

sealternam,edisjuntos emvérti esentre si. Chamamos aatenção aoleitorparaofatodeque,apesar dasemelhançanonome,nãosedeve on-fundir adenição de i lo nodiagramade realidade edesejo om adenição de i lo (ou órbita)de uma permutação,en ontrada naTeoria de Grupos.

1

RessaltamosqueadeniçãoadotadaporBafnaePevznerem[4℄faz omque adapar devérti es

+i

e

−i

seja ontraídoemumsó,alémdeseremutilizadasarestasdire ionadas.

(45)

0 −5

+5

−4

+4

−3

+3

−2

+2

−1

+1

−6

(a)

0 −1

+1

−2

+2

−3

+3

−4

+4

−5

+5

−6

(b)

0 −5

+5

−4

+4

−3

+3

−2

+2

−1

+1

−6

( )

Figura 2.4: Diagramas de realidade e desejo: a)

RD(ρ

[5]

, ι

[5]

)

; b)

RD(ι

[5]

, ι

[5]

)

RD((54321), (52143))