Rodrigo
de Aleecar Hausen
TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS
PROGRAMAS
DE
PÕS-GRADUAÇÃO DE ENGENHARIA DA
UNIVERSIDADE
FEDERAL
DO RIO DE JANEIRO COMO
PARTE
DOS
REQUISITOS
NECESSARIOS
PARA. A OBTENCÃO
DO
GRAU
DE
DOUTOR
EM
CI&NCIAS EM ENGENHARIA DE SISTEMAS E
COMPUTAGÃO.
Aprovada
por:
'~LLU
L
r
,
*
Profa.
Helena
Cristina
da
&ma
Leitk,
D.Sc.
Rearranjos de Genomas: Teoria e Apli a-ções[Rio de Janeiro℄2007
< .mine XII, 141 p. 29,7 m
(COPPE/UFRJ, D.S ., Engenharia de Siste-mas e Computação,2007)======= > .r96
XII, 141 p. 29,7 m (COPPE/UFRJ, D.S .,EngenhariadeSistemaseComputação, 2007)
Tese Universidade FederaldoRiode Ja-neiro, COPPE
1 -Rearranjos de genomas 2 -Ordenação por transposições 3 -Grafo tóri o
Aosmeus pais,JuvenaleIolanda,quemederamaoportunidadede estar neste mundo e me apóiam desde os primeiros momentos, in ansáveis. À minha irmã Moema e aomeu sobrinho Júlioque mealegrama vida.
Aosamigos quepalmilhamaomeu ladoe que,espero, medes ulpempor não poder itá-los todos aqui. A Janaína e Ri ardo, uja amizade já dura tantos anos que eu não me atrevo mais a ontar; àqueles que me a ompa-nharam desde o iní io do doutorado, e que me ouvem as piadas sem-graça desde então
1
: Adriana, André, Bernardo, Cristiane, Danilo, Elias, Fabiano, Pris ila, Rafael, Raphael, Raquel, Rosiane, Thatiana, Viní ius, ...Àqueles que, mesmoquandoestive longe,semantiveramporperto através do pensa-mento,transmitindoforçaamime àminhafamília: AndréaCanella,Celina Maria, Deise Puga, Fábio Canella, João da Silva, Mni a, Snia Regina, Vera Coutinho, Walteno, Wanderley,...Eaos quemeajudaramno retorno: Vânia Butru i,Fernando Ramose o pessoal doComunidança daUFRJ.
Àqueles que olaboraram ativamente no desenvolvimento deste trabalho e que se dispuseram a ajudar desde o iní io: ao Rafael Barbastefano pelo in entivo; a Luiz Carlos, om o qual tenho trabalhado desde a graduação e quetemapoiadoaminhaformaçãoa adêmi a;aoLuerbioeaoLuiz Antonio Kowada, que doarammais do que tempo e atenção, mas tambémsugestões
aabordagemporteoriade grafos, eKowada teveobrilhantismode observar a estrutura do grafo tóri o quando
n + 1
é primo. Aos professores om os quais tive ontato etroquei informaçõesno desenvolvimento deste trabalho, Zanoni Dias eJoão Meidanis,daUNICAMP, e MariaEmília, daUNB.Aos membros daban a que ainda não foram itados, Claudio Bornstein e Helena Cristina, que estiveram em meu exame de quali ação, além de SulamitaKlein que prontamentea eitou o onvite de parti ipar da defesa.
Para aqueles que estiveram omigo durante o período em que estive no Canadá, espe ialmente ao professor David Sanko, por me re eber em seu grupo de pesquisa, porme orientar no período de 09/2005 a 09/2006 e por sugerir o estudo das transposições en ontradas entre os genomas humano e do himpanzé. Aos olegasdogrupodepesquisadaUniversidadede Ottawa, sempre gentis. Ao Steve Rothman,pelas instalações, e à Linda Ham eKorr Onguglo pela ompanhia. À Ariane, Daniel Panario e Lu ia Moura, pelas inúmerasdi asde omosobreviveralhures,epelasfestase onversas,quando o lho deste solopodiamatar saudades daPátria-mãegentil.
Por último, mas não menos importante, à Celina, minha orientadora, que mea eitou omo aluno no mestrado e agora,novamente, nodoutorado. Durante o período em que estive sob a sua tutela, tive a oportunidade de re eber inúmeras diretrizes, não só no que tange ao onteúdo desta tese, mas tambémsobre omo tornar-me um pesquisador. Por ter a reditado em mim (muitas vezes mais do que eu mesmo), ompreendido e ajudado-me a ontornar muitas de minhas imperfeições e pelo exemplo de prossional e pessoa dedi ada queé, mere eaqui um lugar de destaque.
A todos esses, meus mais sin eros agrade imentos. Thank you. Muito obrigado.
ne essários para a obtenção do graude Doutor emCiên ias (D.S .)
REARRANJOSDE GENOMAS: TEORIAE APLICAÇÕES
Rodrigo de Alen ar Hausen Dezembro/2007
Orientador: Celina Miraglia Herrera de Figueiredo Programa: Engenharia de Sistemase Computação
Este trabalho apresenta aspe tos teóri os e práti os do problema de re-arranjo de genomas, em parti ular para rearranjos por transposições. Na parte teóri a, são demonstrados alguns resultados onhe idos baseados no diagrama de realidade e desejo (também denominado grafo de pontos de quebra), porém om provasmais rigorosasdoqueas en ontradasem traba-lhos anteriores de outros autores; também é abordado o problema de orde-nação portransposições omoum problema de teoriados grafos, abordagem muito pou o utilizadana literatura, e para a qual são demonstrados alguns resultados novos sobre a estrutura do grafo tóri o para o onjunto das per-mutaçõesde
n
elementos, onden+1
éprimo. Napartepráti a,édes ritoum método para omparação entre os genomas humano e do himpanzé, onde pela primeira vez são onsideradas transposições. Com esse método, foramrequirements for the degreeof Do tor of S ien e (D.S .)
GENOME REARRANGEMENTS: THEORY AND APPLICATIONS
Rodrigo de Alen ar Hausen De ember/2007
Advisor: Celina MiragliaHerrera de Figueiredo
Department: Systems Engineering and Computer S ien e
This work presents theoreti al and pra ti al aspe ts of the genome re-arrangement problem, in parti ular for rearrangements by transpositions. Regarding the theory, some known results based on the reality and desire diagram(alsodenominatedasbreakpointgraph)areshown,but withmore s rupulous proofs than those found in previous papers by other authors; an oft-overlookedgraph-theoreti alapproa htotheproblemofsortingby trans-positionsisalsoused, forwhi hsome new resultsare found onthe stru ture of the tori graph for the set of permutations of
n
elements, wheren + 1
is prime. On the pra ti al side, a method to ompare the human and him-panzee genomes is des ribed, where for the rst time transpositions have been taken into onsideration. By using this method,542
reversals and255
transpositionshave been found.1 Introdução 1 1.1 Denições . . . 5 1.2 Problemas de rearranjo . . . 11
2 O diagrama de realidade e desejo 16
2.1 Um limiteinferior porpontos de quebra . . . 18 2.2 Determinação da distân ia de transposição vista omo
pro-blema de de isão . . . 21 2.3 Odiagrama de realidade e desejo: um limite inferior mais justo 28
3 O grafo de rearranjos por transposições 49
3.1 Propriedades de
T RG(n)
. . . 53 3.1.1 Número de aminhos mínimosentre dois vérti es . . . 67 3.2 Agrupando vérti es nografode rearranjosportransposições . 72 4 Uma apli ação: en ontrando reversões e transposições entreos genomas humano e do himpanzé 87
4.1 Formalização doproblema . . . 88 4.2 Ométodo . . . 94
A Alguns parâmetros onhe idos 111 B Lista de reversões e transposições en ontradas entre o ser
humano e o himpanzé 113
1.1 Cál ulo da pontuação de um alinhamento entre duas adeias de DNA. . . 2 1.2 Evoluçãoentre o loroplastodotaba oe daL. fervens
(adap-tado de [2℄). . . 3 2.1 Remoção de pontos de quebra poruma transposição. . . 21 2.2 Seqüên ia de transposiçõesque ordena
ρ
[n]
, paran
par. . . 30 2.3 Seqüên ia de transposiçõesque ordenaρ
[n]
, paran
ímpar. . . . 31 2.4 Diagramasderealidadeedesejo: a)RD(ρ
[5]
, ι
[5]
)
;b)RD(ι
[5]
, ι
[5]
)
)
RD((54321), (52143))
. . . 33 2.5 Análise do sub aso 1.1. As linhas tra ejadas representam umaminho(podendoser uma aresta). . . 40 2.6 Análise do sub aso 1.2. As linhas tra ejadas representam um
aminho(podendoser uma aresta). . . 40 2.7 Caso 2. As linhas tra ejadas representam um aminho
(po-dendo ser uma aresta). . . 41 2.8 Caso 3. As linhas tra ejadas representam um aminho
(po-dendo ser uma aresta). . . 41 2.9 Caso 4(a) e aso 5 (b). As linhas tra ejadasrepresentam um
2.10 diagramade realidade edesejo
RD(ρ
[7]
, ι
[7]
)
. . . 442.11 Análise do aso 1do teorema2.26. . . 46
2.12 Análise do aso 2do teorema2.26. . . 47
3.1 Ografo
T RG(n)
, paran
entre1
e4
. . . 513.2 Ografo
T RG(4)
omo4
ópias deT RG(3)
. . . 593.3 Ordenaçõesmínimas diferentes para
ρ
[4]
. . . 673.4 Caminhos mínimosentre
ρ
[4]
eι
[4]
.. . . 683.5 Alterando a seqüên ia de transposições que transforma
σ
emρ
[n]
para transformarι
[n−1]
emρ
[n−1]
para o lema 3.18. . . 703.6 Efeito de uma transposição emuma permutação ir ular . . . 75
3.7 Caso 1 doteorema3.29. . . 79
3.8 Caso 2 doteorema3.29. . . 80
3.9 Osgrafos tóri os
T (3)
,T (4)
eT (5)
. . . 834.1 Exemplo de grá o de pontos para um alinhamento om es-paços (gaps). . . 92
4.2 Exemplo de grá o de pontos onde houve uma reversão na ordem dos elementosem uma das adeias. . . 92
4.3 Exemplo de grá o de pontos onde houve uma transposição naordem dos elementos emuma das adeias.. . . 93
4.4 Diagramaesquemáti odométodoadotadoparaidenti ar re-versões e transposições entre os genomas humano e do him-panzé. . . 95
ini ie om o segmento mais à esquerda; (b) adi ionando seg-mentosaoblo o; ( ) próximoalinhamentoestáforadaregião; (d) um novo blo o é riado; (e) blo os en ontrados após a exe ução do algoritmo; (f) identi ação de reversões e trans-posições. . . 102 4.6 Distribuiçãodostamanhosdossegmentosquesofreramreversão.105 4.7 Distribuiçãodos tamanhosdos segmentosquesofreram
trans-posição. . . 105 5.1 Umaseqüên iadetransposiçõesquetro aoprimeiroelemento
Introdução
Avanços te nológi osre entes permitirama aptação de umaquantidade res ente de informaçãosobre a biologia mole ular dos organismos. Muitos genomas,desdeba tériasatéoserhumano,forammapeadosextensivamente. Tal quantidade de dados fomentou o interesse no problema de omparação de genomas, ouseja, determinaroquãorela ionadasestãoduasespé ies dis-tintaspormeiodaobservaçãodosseus onjuntosde genes. Adistân iaentre duasespé iesé omumenteusada omoentradaemalgoritmosde onstrução de árvores logenéti as, úteis para oestudo da evolução das espé ies.
Háduasabordagens prin ipaisparadeterminaçãodedistân iaentre dois diferentes organismos pela omparação dos seus dados genéti os: alinha-mento de adeiase rearranjo de genomas.
A abordagemde alinhamento de adeias onsiste emdeterminar as dife-rençasesimilaridadesentreduas oumais adeias,atribuindoumapontuação (s ore)para adaalinhamentoounão-alinhamentoqueo orre(gura1.1). A distân iaentre asduas adeiasédeterminadaaoseen ontrar oalinhamento que possui pontuação total máxima, al ulado sobre as adeias de bases de DNA no alfabeto {a, t, , g} ou adeias de aminoá idos no alfabeto
aga ta tta ga---ga gt
Matriz de similaridade
S
epenalidadede espaçod
:a g t a 10 -1 -3 -4
S =
g -1 7 -5 -3 -3 -5 9 0 t -4 -3 0 8d = −5
Pontuação:S
(a, )+ S
(g,g)+ S
(a,a)+ 3 · d + S
(g,g)+ S
(t,a)+ S
(t, )+ S
(a,g)+ S
( ,t)=
-3
+
7+
10+ 3 · (−5) +
7+
(-4)+
0+
(-1)+
0=
= 1
Figura1.1: Cál uloda pontuaçãode umalinhamento entre duas adeiasde DNA.
{A, V,L, I, P, M,F, W, G,S,T, C, N, Q,Y,D, E, K,R,H}. Essa aborda-gem é extremamente sensível a mutações pontuais entre as adeias, e pode falhar na identi ação de mutações grandes. Para maiores detalhes sobre esta abordagem, sugerimos a onsultaao apítulo3do livrode introduçãoà biologia mole ular omputa ionalde Setubale Meidanis [21℄.
Na abordagem por rearranjo de genomas estamos interessados em de-terminar a distân ia entre dois genomas diferentes através da apli ação de mutaçõesaoprimeirogenomade modoque,aonal, osegundo genomaseja en ontrado. Esta abordagem difere da anterior no sentido em que não es-tamos mais omparando letras individuais, mas um onjunto de genes. A distân ia entre dois genomas é, então, o número mínimo de mutações que transforma um genomaemoutro [2, 21℄ (g. 1.2).
de [2℄).
blo os [27℄, alguns eventos evolu ionários ainda são difí eis de se lidar, no que tange à omplexidade dos algoritmos atuais. Um desses eventos é a transposição.
Uma transposição é um deslo amento de um blo o ontíguo em um ge-noma. Pode-se en ontrar a distân ia de transposição, ou seja, a menor seqüên ia de transposições que transforma um genoma A em um genoma B, de maneira e iente (em tempo polinomial)? Esta é uma questão ainda em aberto, aqual abordaremos neste texto.
Este do umento está organizado da seguinteforma: deniremos aseguir os eventos de reversão, transposição e inter âmbiode blo os e os problemas de rearranjo, omo ál ulo dadistân ia por reversões e por transposições; o apítulo 2 introduz algumas estruturas auxiliares para a resolução dos pro-blemas, omo o diagrama de realidade e desejo, e revisa alguns resultados onhe idos sobre limites para as distân ias; no apítulo 3 propomos o grafo
usando essa estrutura; no apítulo 4, a parte mais apli ada de nosso traba-lho, apresentamos os resultados obtidos durante o período em que o aluno esteve trabalhando sob a orientação do prof. David Sanko, da Universi-dadede Ottawa,sobreaanálisede rearranjosentreosgenomashumanoedo himpanzé. Porm, no apítulo5,en erraremos omumsumáriodos desen-volvimentos desta tese e apresentaremos prováveis desdobramentos futuros deste trabalho.
Esta tese ontribui para o estudo de rearranjos de genomas tanto no aspe to teóri o quantono aspe to práti o.
No aspe to teóri o, o apítulo2 revisa a teoria lássi a de rearranjos de genomas portransposições, forne endo provasmais detalhadas para os limi-tes do diâmetrode transposiçãosem re orrer a demonstraçõessimplesmente atravésdediagramas. A ríti aaopou oformalismodasprovasapresentadas na teoria lássi a [1, 2, 3, 4℄ foi feita empelomenos dois trabalhos [15, 17℄ ondeumateoriaalgébri afoiproposta omoalternativaparaobterummaior rigor. Já o apítulo 3propõe oestudo de rearranjos por transposições omo um problema de teoria de grafos. En ontramos apenas uma referên ia [10℄ que também usa teoria de grafos, através de um grafoauxiliar, denominado grafo tóri o, que reduz o número de permutações. Des revemos neste a-pítulo várias propriedades do problema de ordenação por transposições, já onhe idas ou novas, omo propriedadesde teoria de grafos. Em relação ao grafo tóri o,também apresentamos novaspropriedades.
Noaspe topráti o,o apítulo4propõeum método omputa ionalusado para omparação dos genomas humano e do himpanzé. Pela primeira vez, são onsideradas transposições na omparação de genomas em larga es ala.
Umapermutação linear,ousimplesmenteuma permutação,de
n
elemen-tos éuma função bijetivaπ
tal queπ : {1, 2, . . . , n} → {1, 2, . . . , n}
i 7→ π(i) = π
i
,
denotada usualmente por
π =
1
2
. . .
n
π
1
π
2
. . . π
n
,
ou de formamais su inta,
π = (π
1
π
2
. . . π
i
. . . π
j
. . . π
n
).
Cada elemento
π
i
éum inteiro nointervalo1 ≤ π
i
≤ n
, etodos oselementos são distintos:π
i
6= π
j
sei 6= j
.Duaspermutações, em parti ular,são importantes noestudode rearran-jos, umaporpossuirtodos osseuselementosemordem res enteeoutrapor possuir todos emordem de res ente.
Denição 1.1 (permutação identidade). A permutação identidade é uma permutação queleva todos os elementos neles próprios, sendo denotada por
tação que leva o elemento
i
no elementon − i + 1
, sendo denotada porρ
[n]
= (n n−1 . . . 2 1).
Porbrevidade,ondeovalorde
n
estiver laramentedenido,utilizaremosι
eρ
para denotar, respe tivamente,ι
[n]
eρ
[n]
.Denição 1.3 (inversa de uma permutação). A inversa da permutação
π
, denotada porπ
−1
, é uma permutação que mapeia ada elemento
π
i
deπ
em sua posiçãoπ
−
1
(π
i
) = i
, ou seja:π
−1
= ( π
−1
1
π
2
−1
. . . π
n
−1
),
ondeπ
−
1
i
é a posição do elementoi
emπ
.Exemplo 1.4. Seja
π = (35214)
. A sua inversaπ
−
1
deve ser tal que
π
−
1
(3) = 1
,π
−
1
(5) = 2
,π
−
1
(2) = 3
,π
−
1
(1) = 4
eπ
−
1
(4) = 5
. Portanto,π
−
1
= (43152)
.Oproduto(ou omposição)entreduaspermutações
π
eσ
éuma permuta-çãoγ = σπ
ondeγ(i) = σ(π(i))
. Noteque,emgeral,σπ
diferedeπσ
. O pro-duto de uma permutação pelasua inversa é a identidade:π
−
1
π = ππ
−
1
= ι
(neste aso espe í o, a operação produto é omutativa). Claramente, o produto de permutaçõesé asso iativo:
γ(σπ) = (γσ)π
.As denições e propriedades men ionadas a ima permitem-nos on luir que aspermutaçõeslineares de
n
elementosformam um grupoS
n
, hamado de grupo simétri o, om ordemn!
.elementos de uma permutação de uma maneira bemdenida. Entre as ope-rações de rearranjo mais estudadas, estão asreversões e astransposições. Denição 1.5 (reversão). [1, 13, 26℄ Uma reversão, denotada por
r(i, j)
,1 ≤ i ≤ j ≤ n
, é uma operação que inverte a ordem dos elementos de uma permutação entre as posiçõesi
ej
, da forma ilustrada a seguir. Sejaπ = (π
1
π
2
. . . π
i
. . . π
j
. . . π
n
)
; a apli ação da reversãor(i, j)
à permutaçãoπ
produz a seguinte permutação:π · r(i, j) = (π
1
π
2
. . . π
i−1
π
j
π
j−1
. . . π
i+1
π
i
π
j+1
. . . π
n
).
O aso parti ular
r(1, n)ι
[n]
= ρ
[n]
justi a o nome da permutação reversa. Notamos que uma operação de reversão também pode ser vista omo a seguintepermutação emS
n
:r(i, j) = (1 2 . . . i−1 j j −1 . . . i+1 i j +1 . . . n).
Observe que apli ando-se
r(i, j)
à permutaçãoπ · r(i, j)
, obtemos nova-menteπ
, ou seja, a inversa de uma dada reversão é ela própria:π · r(i, j) ·
r(i, j) = π
para qualquerπ
, portantor(i, j) · r(i, j) = ι
, logor(i, j) =
(r(i, j))
−
1
. Também é fá il ver que, dada uma permutação
π ∈ S
n
, sem-pre existe uma seqüên iade reversõesr
1
, . . . , r
m
talqueπ · r
1
· r
2
· . . . r
m
= ι
. Diremos que uma talseqüên ia ordenaπ
.Exemplo 1.6. Seja
π = (3 2 5 4 1)
e onsidere a reversãor(3, 5)
, apli ada à permutaçãoπ
:Neste aso,
r(3, 5)
pode servista omo apermutação(1 2 5 4 3)
,e aapli ação der(3, 5)
aπ
equivaleao produto:π · (1 2 5 4 3) = (3 2 1 4 5).
Vemosqueareversão
r(1, 3)
,quandoapli adaa(3 2 1 4 5)
,produz( 1 2 3 4 5)
, a permutação identidade.Denição1.7(transposição). [4℄Uma transposição 1
,denotadapor
t(i, j, k)
, onde1 ≤ i < j < k ≤ n + 1
, orta os elementos entre as posiçõesj
ek − 1
(ambas in lusas) e ola-os imediatamente antes da posiçãoi
. Sejaπ = (π
1
π
2
. . . π
i−1
π
i
. . . π
j−1
π
j
. . . π
k−1
π
k
. . . π
n
),
então:
π · t(i, j, k) = (π
1
π
2
. . . π
i−1
π
j
. . . π
k−1
π
i
. . . π
j−1
π
k
. . . π
n
).
A transposição
t(i, j, k)
pode ser vista omo a permutaçãot(i, j, k) = (1 2 . . . i−1 j j +1 . . . k−1 i i+1 . . . j −1 k k+1 . . . n).
Exemplo 1.8.
(8 7 6
?
5 1 4 3 2) · t(1, 3, 5) = ( 6 5 8 7 1 4 3 2)
A inversa de uma transposição é também uma transposição, omo vere-mos na expli açãoquese segue. Seja
π
′
= π · t(i, j, k)
,e queremos en ontrar a permutação(t(i, j, k))
−
1
tal queπ
′
· (t(i, j, k))
−
1
= π
. Des revamos ada 1elemento
π
′
ℓ
deπ
′
, emfunção dei
,j
,k
eℓ
:π
′
ℓ
=
π
ℓ
seℓ < i
ouℓ ≥ k
π
ℓ−i+j
sei ≤ ℓ < i + k − j
π
ℓ−k+j
sei + k − j ≤ ℓ < k,
(1.1)e onsidere aapli açãodatransposição
t(i, i + k − j, k)
aπ
′
, dandoorigemaπ
′′
= π
′
· t(i, i + k − j, k)
, ouseja,π
′′
= (π
′
1
π
′
2
. . . π
′
i−1
π
′
i+k−j
. . . π
′
k−1
π
′
i
. . . π
′
i+k−j−1
π
′
k
. . . π
′
n
),
onde ada elemento
π
′′
ℓ
′
étal queπ
′′
ℓ
′
=
π
′
ℓ
′
seℓ
′
< i
ouℓ
′
≥ k
π
′
ℓ
′
+k−j
sei ≤ ℓ
′
< j
π
′
ℓ
′
+i−j
sej ≤ ℓ
′
< k.
(1.2) Paraℓ
′
< i
ouℓ
′
≥ k
, temosπ
′′
ℓ
′
= π
′
ℓ
′
= π
ℓ
′
; no asoi ≤ ℓ
′
< j
, obtemosqueπ
′′
ℓ
′
= π
′
ℓ
′
+k−j
e, omo neste asoℓ
′
+ k − j
varia entrei + k − j
(in luso) ek
(ex luso), entãoπ
′′
ℓ
′
= π
′
ℓ
′
+k−j
= π
(ℓ
′
+k−j)−k+j
= π
ℓ
′
. Em última instân ia,j ≤ ℓ
′
< k
, logoπ
′′
ℓ
′
= π
′
ℓ
′
+i−j
= π
(ℓ
′
+i−j)−i+j
= π
ℓ
′
, pois neste asoi ≤
ℓ
′
+i−j < i+k−j
. Emtodosos asos,temosqueπ
′′
ℓ
′
= π
ℓ
′
,logot(i, i+k−j, k)
é a inversa det(i, j, k)
.Exemplo 1.9. Considere a transposição
t(2, 5, 7)
apli ada aι
[8]
:A transposição
t(2, 2 + 7 − 5, 7) = t(2, 4, 7)
é a inversa det(2, 5, 7)
, pois(1 2 3 4 5
?
6 7 8)·t(2, 5, 7)·t(2, 4, 7) = (1 5 6 2 3
?
4 7 8)·t(2, 4, 7) = (1 2 3 4 5 6 7 8).
Asdeniçõesdas operaçõesde reversãoetransposiçãosão motivadaspor eventosde mutaçãoobservados na omparaçãoentre os genomasde organis-mos distintos[11,23℄. Christie[6℄deneuma operaçãode rearranjoquenão é motivada por razões biológi as,mas que é uma generalização de transpo-sições, e ujo tratamentoteóri o émais simples:
Denição 1.10 (inter âmbio de blo os). [6℄ Um inter âmbio de blo os (ou blo k-inter hange, também denominado blo k-swapping) om parâme-tros
(i, j, k, ℓ)
, onde1 ≤ i < j ≤ k < ℓ ≤ n + 1
, tro aa posiçãodos blo os de elementosπ
i
. . . π
j−1
eπ
k
. . . π
ℓ−1
em uma permutação:π · b(i, j, k, ℓ) = (π
1
π
2
. . . π
i−1
π
k
. . . π
ℓ−1
π
j
. . . π
k−1
π
i
. . . π
j−1
π
ℓ
. . . π
n
).
A operação
b(i, j, k, ℓ)
pode ser des rita omo a seguinte permutação:(1 2 . . . i−1 k k+1 . . . ℓ−1 j j+1 . . . k−1 i i+1 . . . j − 1 ℓ ℓ+1 . . . n).
Exemplo 1.11.
(8 7 6 5 1 4 3 2 ) · b(3, 5, 6, 9) = (8 7 4 3 2 1 6 5 )
.Umatransposição
t(i, j, k)
equivaleauminter âmbiodeblo osb(i, j, j, k)
, ondedoisblo osadja entestro amdeposição. Assim omono asodas rever-sões etransposições, essas operaçõesestão nogrupo simétri oS
n
, a inversa de um inter âmbio de blo os é um inter âmbio de blo os, e sempre existe uma seqüên ia de inter âmbios de blo os que ordenauma dada permutaçãoguinteinter âmbiodeblo os:
( 8 7 6 5 1 4 3 2) b(1, 3, 3, 5) = ( 6 5 8 7 1 4 3 2).
1.2 Problemas de rearranjo
Dadasduas permutações
π, σ ∈ S
n
, vê-se quesempre épossível transfor-mar aprimeiranasegunda usando-se, nomáximo,n − 1
transposições, omo des rito a seguir: para ada elementoσ
x
= σ
1
, . . . , σ
n
que está na posiçãoσ
−
1
(σ
x
) = x
napermutaçãoσ
,de talformaqueasuaposiçãonapermutaçãoπ
seja diferente de sua posição emσ
ou seja,π
−
1
(σ
x
) 6= x
é possível, sex < π
−
1
(σ
x
)
apli ar aπ
a transposiçãot(x, π
−
1
(σ
x
), π
−
1
(σ
x
) + 1)
aπ
, de tal formaqueσ = ( σ
1
. . .
σ
x
. . .
. . .
. . . σ
n
)
π = ( π
1
. . .
π
x
. . .
?
σ
x
. . . π
n
)
π · t(x, π
−1
(σ
x
), π
−1
(σ
x
) + 1) = ( π
1
. . .
σ
x
π
x
. . .
. . . π
n
),
ou sex > π
−
1
(σ
x
)
apli ar aπ
a transposiçãot(π
−
1
(σ
x
), π
−
1
(σ
x
) + 1, x + 1)
, obtendo-seσ = ( σ
1
. . . σ
x
. . . σ
n
)
π = ( π
1
. . . σ
x
. . .
?
π
x
. . . π
n
)
π · t(π
−1
(σ
x
), π
−1
(σ
x
) + 1, x + 1) = ( π
1
. . . .
π
x
σ
x
. . . π
n
).
Emambos os asos a apli açãodatransposiçãoa
π
resultaemuma per-mutação que tem oelementoσ
x
nax
-ésima posição, queé asua posição emσ
. Vê-se fa ilmenteque aso essa operaçãoseja efetuadauma vez para ada elemento deσ
que está em uma posição diferente emπ
, seguindo a ordemtrans-formado
π
emσ
. Esta seqüên ia de transposições apresentada, em muitos asos, não é ótima.Denição 1.13 (distân ia de transposição). [4℄ A distân ia de transposi-ção,
d
t
(π, σ)
entre duas permutaçõesπ
,σ ∈ S
n
é o número mínimoq
de transposiçõest
1
, . . . , t
q
tal queπ · t
1
· t
2
· . . . · t
q
= σ
.Comovistonadis ussãoquepre edeàdenição,se
π
eσ
sãopermutações dos mesmosn
elementos, sempre é possível en ontrar uma seqüên ia om, no máximo,n − 1
transposiçõesque transformaπ
emσ
, logoadistân ia de transposiçãoé limitadasuperiormente eestá bem-denida.Exemplo 1.14. Seja
π = (54321)
eσ = (12345)
. Existe uma seqüên ia de3
transposições que transformaπ
emσ
:π = (5 4 3 2
?
1 )
?
t(2, 4, 6)
(5 2 1
?
4 3)
?
t(1, 3, 5)
(1 4 5 2
?
3 )
?
t(2, 4, 6)
σ =
(1 2 3 4 5)
Isto impli a que
d
t
(π, σ) ≤ 3
.A distân ia de transposição
d
t
(π, σ)
é nula se, e somente se,π = σ
; é óbvio que, se não pre isamos de nenhuma transposição para transformar uma permutação em outra, elas são idênti as. Por outro lado, se temosuma transposição, transforma
σ
emπ
, e não é possível en ontrar uma ou-tra seqüên ia om menor número de transposições om essa ara terísti a ( aso ontrário, poderíamos invertê-la e transformarπ
emσ
om menos transposições do que o mínimo, uma ontradição). O leitor atento deve ter ante ipado que provaremos que a distân ia de transposição obede e à desigualdade triangularem seguida; laramente, se temosπ, γ, σ ∈ S
n
, e to-marmos uma seqüên iamínima de transposiçõest
1
, . . . , t
q
quetransformaπ
emγ
eoutra seqüên iamínimat
′
1
, . . . , t
′
s
quelevaγ
emσ
,então aseqüên iat
1
, . . . , t
q
, t
′
1
, . . . , t
′
s
, omq+s
transposiçõestransformaπ
emσ
(não ne essari-amente omum númeromínimode operações). Ora io íniodeste parágrafo nos induz a on luir que a distân iade transposição é uma métri a no on-juntodas permutações den
elementos.Denição 1.15 (ordenação mínima por transposições). Dada uma permu-tação
π ∈ S
n
, o problema de ordenação mínima por transposições on-sisteemen ontrarumaseqüên ia om omprimentomínimodetransposiçõest
1
, . . . , t
q
tal queπ · t
1
· t
2
· . . . · t
q
= ι
. O omprimento da menor seqüên ia de transposições que ordenaπ
é denotado pord
t
(π)
.Comogeralmentesomenteestamosinteressadosemen ontraruma seqüên- iamínimadetransposiçõesquetransformaumadadapermutaçãona permu-taçãoidentidade,aexpressãoordenaçãopor transposições seráutilizadapara designar o problema de ordenação mínima por transposições, salvo quando indi armos expli itamenteque aseqüên iaque ordenauma permutação não é mínima.
Osproblemasdetransformarumapermutaçãoemoutraportransposições ede ordenarumapermutaçãoportransposiçõessãoequivalentes, omovisto no orolário1.17.
Lema 1.16. Sejam
γ, π, σ ∈ S
n
. Entãod
t
(π, σ) = d
t
(γπ, γσ)
.Prova. Seja
t
1
, . . . , t
q
uma seqüên iade transposições que transformaπ
emσ
, ou seja,π · t
1
· . . . · t
q
= σ
. Considere o produtoγ · π · t
1
· . . . · t
q
; pela asso iatividadedoproduto,temosqueeleéequivalenteaγ · (π · t
1
· . . . · t
q
) =
γ · σ
. Logo, a seqüên iat
1
, . . . , t
q
também transformaγπ
emγσ
, portantod
t
(γπ, γσ) ≤ d
t
(π, σ)
. Oargumento também é válido no sentido inverso, ou seja, qued
t
(π, σ) ≤ d
t
(γπ, γσ)
. As duasdesigualdadesobtidas impli amqued
t
(π, σ) = d
t
(γπ, γσ)
.Corolário 1.17. Sejam
π, σ ∈ S
n
. Entãod
t
(π, σ) = d
t
(σ
−1
π, σ
−1
σ) =
d
t
(σ
−
1
π, ι) = d
t
(σ
−
1
π)
.Outroproblemarela ionadoàdeterminaçãodadistân iade transposição éen ontrar amaiordistân iaentre doiselementosquaisquerdo onjunto
S
n
.Denição 1.18 (diâmetro de transposição). [4℄ O diâmetro de transposi-ção
D
t
(n)
do grupo simétri oS
n
é a maior distân ia de transposição entre quaisquer doiselementos do grupo, ou seja:D
t
(n) := max{d
t
(π, σ); π, σ ∈ S
n
}.
Como
d
t
(π, σ) = d
t
(σ
−1
π)
também a outros eventos de rearranjo, omo para as reversões e para os inter âmbios de blo os, alterando-se as denições de maneira onveniente. Como exemplo, veremos omo denir a distân ia entre duas permutações pormeio de reversões.
Denição 1.19 (distân ia de reversão). [1, 13, 26℄ A distân iade reversão,
d
r
(π, σ)
entre duaspermutaçõesπ
,σ ∈ S
n
é o número mínimoq
de reversõesr
1
, . . . , r
q
tal queπ · r
1
· . . . · r
q
= σ
.Exemplo 1.20. Sejam
π = (7 1 2 3 5 4 6 8)
eσ = (1 2 3 4 5 6 7 8)
. Existe uma seqüên ia de3
reversões que transformaπ
emσ
:π = (7 1 2 3 5 4 6 8)
?
r(5, 6)
(7 1 2 3 4 5 6 8)
?
r(2, 7)
( 7 6 5 4 3 2 1 8)
?
r(1, 7)
σ = (1 2 3 4 5 6 7 8)
Isto impli a que
d
r
(π, σ) ≤ 3
.Como esperado,
d
r
(π, σ)
é sempre bem-denida para quaisquer permu-taçõesπ, σ
om o mesmo númeron
de elementos ed
r
é uma métri a no espaçoS
n
. Os argumentos são semelhantes aos utilizadospara as transposi-ções: sempre é possível transformarπ
emσ
fazendo-se uma reversão que, a ada passo, levaum elementopara a sua orretaposição emσ
; para provar-mos qued
r
é uma métri a podemos prati amenterepetir o argumento visto anteriormenteipsis litteris, substituindo transposição por reversão.Apartir desteponto, on entraremos onosso fo osobre osproblemas de ordenaçãoportransposiçõesededeterminaçãododiâmetrodetransposição.
O diagrama de realidade e desejo
Apresentaremos,neste apítulo,estruturas auxiliarese resultados onhe- idos, omo limites para a distân iae o diâmetrode transposição, ini iando om uma dis ussão doque já se onhe e para osproblemas de rearranjo.
Apesar de problemas de rearranjo espe í osjá serem estudados desdeo iní iodosé uloXX[23℄,somenteemtemposre entesprin ipiou-seaprati ar uma abordagemmais formalpara solu ioná-los[18,26℄.
As estruturas utilizadas atualmente foram primeiramente introduzidas porNadeaueTaylor[18℄eBafnaePevzner [1,3℄,sendoqueoprimeiro algo-ritmo aproximativo polinomial a usá-las para ordenaruma permutação por reversões foi proposto por Ke e ioglu e Sanko em 1992 [13℄. Hannenhalli, BafnaePevznerpropuseram,emseguida,umalgoritmoexato om omplexi-dade temporalpolinomialpara um problema rela ionado, de ordenação por reversões de permutações emque ada elemento possui um sinal que indi a asua orientação,e ada reversão inverte osinal de todosos elementos afeta-dos [12, 3℄. O problema originalde ordenação por reversões permane eu em aberto até que Caprara [5℄ provou que determinar a distân ia de reversão é
que para ordenação por reversões. Desde os primeiros trabalhos formais [3℄ até osresultados mais re entes [9℄, bus a-se sem su esso uma formade esti-mar de maneiraexata adistân iade transposição. Mesmo aestratégiade se adi ionarinformaçãosobreorientaçãoaoselementosdeumapermutação[25℄, omo feitono problemade ordenaçãoporreversões, não deu origem aindaa nenhum algoritmoexato. Além disso, ainda há uma grande diferença entre os limites superior e inferior demonstrados para a distân iade transposição [14, 7℄.
Para este apítulo, seguiremos o seguinte roteiro: na seção 2.1, apre-sentaremos o on eito de pontos de quebra entre duas permutações e um limite inferior que pode ser obtido diretamente por meio dessa denição. Na seção 2.2, faremos uma mudança de ponto de vista, estudando o pro-blema de de isão
d
t
(π) ≤ d
para um inteiro xo não-negativod
, o que nos dá um algoritmopara determinação exata para a distân iade transposição, uja omplexidadeépolinomialquando onsideramosd
omouma onstante. Con luiremoso apítulonaseção2.3apresentandoademonstração deum li-miteinferiormaisjustoparaadistân iadetransposiçãoapartirdodiagrama de realidade e desejo, denido nessa seção. Nossa demonstração é a mesma apresentada em [4℄, porém usamos um rigor maior no desenvolvimento da prova, sem usar argumentos puramente baseados em guras. Desta forma, a reditamoster ontribuídoparaa ompreensãodasprovasesanadoalgumas das ríti as[15,17℄ aopou o formalismoda teoria lássi a.Dadasduas permutações
π
eσ
eumaoperaçãode rearranjoque permite-nos transformarπ
emσ
om uma seqüên ia de operações, podemosestimar de maneira simples um limite inferior para o número mínimo de operações que devem ser apli adassu essivamenteaπ
para transformá-laemσ
.Para o ál ulo do número de operações ne essárias, adi ionaremos mais dois elementosàspermutaçõesquedesejarmos al ularadistân ia, de forma a xaros seus extremos.
Denição 2.1(permutaçãoestendida). Dada
π = (π
1
π
2
. . . π
n
)
uma permu-tação deS
n
, a sua permutação estendida é a permutação a res ida de dois elementos xos,π
0
= 0
eπ
n+1
= n + 1
, denida por(0 π
1
π
2
. . . π
n
n+1)
. Denição 2.2 (elementos subseqüentes). Dada uma permutaçãoπ
, os ele-mentosπ
i
, π
j
de sua permutação estendida(0 π
1
π
2
. . . π
n
n+1)
são ditos subseqüentes sej = i + 1
.Observa-seimediatamenteque,sedoiselementos
π
i
eπ
i+1
são subseqüen-tes emπ
,masnão emσ
, entãoesses dois elementosne essariamentedeverão tornar-senão-subseqüentesporalgumaoperaçãodeumaseqüên iaque trans-formaπ
emσ
.Denição 2.3 (pontos de quebra, elementos adja entes). Dadas duas per-mutações
π
eσ
, om suas orrespondentes permutações estendidas, um par de elementos subseqüentesπ
i
, π
i+1
na permutação estendida deπ
, mas não-subseqüentesnapermutaçãoestendida deσ
éum pontodequebra(do inglês, breakpoints) deπ
emrelação aσ
. Casoπ
i
, π
i+1
sejam subseqüentes emπ
eDenição 2.4. Dadas duaspermutações
π
eσ
, o númerob(π, σ)
de pontos de quebra deπ
em relação aσ
é a quantidadede pares subseqüentes na per-mutação estendida deπ
que não são subseqüentes na permutação estendida deσ
.Exemplo2.5. Sejam
π = (156234)
eapermutaçãoidentidadeι = (123456)
. A permutação estendida deπ
e da identidade são, respe tivamente(0 1 5 6 2 3 4 7)
e
(0 1 2 3 4 5 6 7).
Os pares
1 5
,6 2
e4 7
são os pontos de quebra deπ
em relação aι
, logob(π, ι) = 3
.Veremosqueonúmerodepontosdequebra
b(π, σ)
énulose,esomentese,π = σ
. Comefeito, seπ = σ
,entãotodopardeelementossubseqüentes emπ
éadja ente omrelaçãoaσ
,logonãohápontos dequebra. Poroutrolado,seb(π, σ) = 0
, ospares0π
1
,π
1
π
2
,...π
n−1
π
n
,π
n
n+1
são todos adja ên ias om relação aσ
; mas, para isso, é ne essário queπ
1
= σ
1
,π
2
= σ
2
, ...,π
n
= σ
n
, ou seja,π = σ
.Como temos
n + 1
pares de elementos0π
1
,π
1
π
2
, ...,π
n−1
π
n
,π
n+1
n+1
, então0 ≤ b(π, σ) ≤ n + 1
. Observequeolimitesuperioréatingidopela per-mutaçãoreversa, om relaçãoàpermutaçãoidentidade:b(ρ
[n]
, ι
[n]
) = n + 1
. Portanto, para todapermutaçãoπ ∈ S
n
,b(π, ι
[n]
) ≤ b(ρ
[n]
, ι
[n]
).
Podemos ver também que o número de pontos de quebra
b(π, σ)
é igual ab(σ
−
1
π, ι)
, onforme oresultado a seguir.
Prova. Primeiramente, demonstraremos que, todo ponto de quebra de
π
, om relação aσ
, orresponde a um ponto de quebra deγπ
, om relação aγσ
, oque iráimpli ar adesigualdadeb(π, σ) ≤ b(γπ, γσ)
.Seja
π
ℓ−1
π
ℓ
umpontodequebradeπ
, omrelaçãoaσ
,ondeℓ
satisfaz1 ≤
ℓ < n+1
. Comoπ
eσ
sãopermutaçõessobreomesmo onjuntodeelementos, existe um elementoσ
m−1
talqueπ
ℓ−1
= σ
m−1
; Porém,σ
m
6= π
ℓ
, poisπ
ℓ−1
π
ℓ
éum pontodequebra. Consideremosagoraoparde elementosγ(π
ℓ−1
)γ(π
ℓ
)
, subseqüentes emγπ
. Comoπ
ℓ−1
= σ
m−1
, então o elementoγ(π
ℓ−1
)
deγπ
é igual ao elementoγ(σ
m−1
)
deγσ
, masγ(π
ℓ
) 6= γ(σ
m
)
, poisγ
é bijetora eπ
ℓ
6= σ
m
. O par de elementosγ(σ
m−1
)γ(σ
m
)
não é subseqüente emγσ
, logoγ(π
ℓ−1
)γ(π
ℓ
)
é um ponto de quebra emγπ
om relação aγσ
. Novamente usamos a ara terísti ade queγ
ébijetora para on luir que ada ponto de quebraπ
ℓ−1
π
ℓ
é levado em um ponto de quebra distintoγ(π
ℓ−1
)γ(π
ℓ
)
, logob(π, σ) ≤ b(γπ, γσ)
.Adesigualdade
b(π, σ) ≥ b(γπ, γσ)
éobtidafazendo-seπ
′
= γπ
,σ
′
= γσ
e omparando-seb(π
′
, σ
′
)
eb(γ
−
1
π
′
, γ
−
1
σ
′
)
, omozemosnoparágrafoanterior.Corolário 2.7. Sejam
π, σ ∈ S
n
. Entãob(π, σ) = b(σ
−
1
π, σ
−
1
σ) =
b(σ
−
1
π, ι)
.Com as denições apresentadas anteriormente, estamos prontospara es-timar um primeiro limiteinferior para a distân iade transposição.
Teorema 2.8. [4℄ Sejam
π
eσ
duas permutações den
elementos. Então,d
t
(π, σ) ≥ ⌈b(π, σ)/3⌉
.pontos de quebra
π = (π
1
. . .
z
π
i−1
}|
π
{
i
π
i+1
. . .
z
π
j−1
}|
π
{
j
. . .
z
}|
{
π
k−1
π
k
. . . π
n
)
t(i, j, k)
π · t(i, j, k) = (π
1
. . . π
i−1
π
j
|
{z
}
. . . π
k−1
π
i
|
{z
}
π
i+1
. . . π
|
j−1
{z
π
k
}
. . . π
n
)
adjacˆencias
Figura2.1: Remoção de pontosde quebra por umatransposição.
em,nomáximo,
3
unidades(gura2.1). Umaseqüên iadetransposiçõesque transformaπ
emσ
poderá,então,subtrair3
unidadesdonúmerodepontosde quebra,namelhordashipóteses,a adatransposiçãoapli ada,até hegarmos a0
pontos de quebra, donde obtemos a ota inferiord
t
(π, σ) ≥ ⌈b(π, σ)/3⌉
.Para a permutação reversa
ρ
[n]
, obtemosd
t
(ρ
[n]
, ι
[n]
) ≥
n+1
3
, e on-seqüentemente um limite inferior para o diâmetro de transposição
D
t
(n) =
max{d
t
(σ), σ ∈ S
n
} ≥
n+1
3
.
Aprova doteorema2.8usa que se
d
t
(π, σ) ≤ 1
,entãob(π, σ) ∈ {0, 3}
. A re ípro atambémé verdadeira, omo veremos naseção 2.2, a seguir.2.2 Determinação da distân ia de transposição
vista omo problema de de isão
Oproblema de en ontrar a menor seqüên ia de transposiçõesque trans-forma uma transposição
π
emσ
pode ser transformado no problema de de- isão equivalente, de determinar sed
t
(π, σ) ≤ d
, para algum inteirod
xo, onde0 ≤ d ≤ n − 1
. Parad = 0
, oproblemareduz-se adeterminarseπ = σ
,Se
d = n − 1
,arespostaaoproblema ésemprepositiva,poispodemostomar ada elemento deπ
individualmente e olo á-lo om uma transposição em sua posição orrespondente emσ
.Também é fá il determinar se
d
t
(π, σ) ≤ 1
. Neste aso, pre isamos determinar seπ = σ
ou, equivalentemente, queb(π, σ) = 0
ou seσ = π · t(i, j, k)
, o que pode ser feito também em tempo linear, bastando-se per orrer as duas permutações e veri ar se existem apenas3
pontos de quebra emπ
om relação aσ
, de a ordo om o que nos diz o lema 2.9. O algoritmo1des reve opro edimentoemmaioresdetalhes. Para deixar mais laro para o leitor qual a transposição que transformaσ
emπ
, os parâme-trosi
,j
ek
datransposição são al ulados, apesarde não seremne essários, pois apenas estamos interessados em determinar se a distân ia entre duas permutaçõesé igual ouinferior a1
.Lema 2.9. Sejam
π
eσ
duaspermutações. Existe umatransposiçãot(i, j, k)
tal queπ · t(i, j, k) = σ
se, e somente se,b(π, σ) = 3
.Prova. Se
σ = π · t(i, j, k)
, então é trivial veri ar queb(π, σ) = 3
(veja o diagrama dagura 2.1). A armação re ípro a é veri ada mais fa ilmente omparando-seσ
−
1
π
eι
. Pelo orolário2.7,b(π, σ) = b(σ
−
1
π, ι) = 3
. Sejaπ
′
denidaporπ
′
:= σ
−
1
π
. Existemtrêsparesdeelementos,osquais denominaremos
π
′
i−1
π
′
i
,π
′
j−1
π
′
j
eπ
′
k−1
π
′
k
, tais queπ
ℓ−1
π
ℓ
são onse utivos emπ
, paraℓ ∈ {i, j, k}
, masπ
′
i
6= π
′
i−1
+ 1
. Suponhamos, sem perda de generalidade, que1 ≤ i < j < k ≤ n + 1
.Comohá apenas
3
pontosde quebra entreπ
′
e
ι
, então devemos ter que:• π
′
Algoritmo 1 Determinase
d
t
(π, σ) ≤ 1
Sejam:π, σ ∈ S
n
.Retorna: verdadeiro, aso
d
t
(π, σ) ≤ 1
, falso aso ontrário. 1:b ← 0
{ número de pontos de quebra }2:
i
′
← 1
3: enquantoi
′
≤ n
faça 4: seπ
i
′
= σ
i
′
então 5:i
′
← i
′
+ 1
6: senão 7:b ← b + 1
8:i ← i
′
9:j
′
← i
′
+ 1
10: enquantoσ
j
′
6= π
i
′
faça 11:j
′
← j
′
+ 1
12:j ← j
′
13: enquantoσ
j
′
= π
i
′
faça 14:j
′
← j
′
+ 1
15:i
′
← i
′
+ 1
16:b ← b + 1
17:j
′
← i + 1
18: enquantoσ
j
′
= π
i
′
faça 19:j
′
← j
′
+ 1
20:i
′
← i
′
+ 1
21:k ← i
′
{ neste ponto,se
d
t
(π, σ) = 1
entãoπ = σ · t(i, j, k)
}22:
b ← b + 1
23: se
b = 0
oub = 3
então24: retorna verdadeiro
25: senão
• π
′
i
6= ι
i
, mas existei
′
6= i
tal queπ
′
i
= i
′
e, portanto,π
′
i+1
= i
′
+ 1
,π
′
i+2
= i
′
+ 2
,...,π
′
i+(j−1−i)
= π
′
j−1
= i
′
+ (j − 1 − i)
;• π
′
j
6= i
′
+ j − i
, mas existej
′
tal queπ
′
j
= j
′
e,portanto,π
′
j+1
= j
′
+ 1
,π
′
j+2
= j
′
+ 2
,...,π
′
j+(k−1−j)
= π
k−1
= j
′
+ (k − 1 − j)
;• π
′
k−1
6= k − 1
.Logo, apermutação estendida de
π
′
possui a forma(0 1 . . . i−1 i
′
i
′
+1 . . . i
′
+(j−1−i) j
′
j
′
+1 . . . j
′
+(k−1−j) k k+1 . . . n n+1).
Comonas duasseqüên ias
i
′
, i
′
+1, . . . , i
′
+(j−1−i)
ej
′
, j
′
+1, . . . , j
′
+(k−1−j)
temos
k − i
elementos, ada elemento é1
unidade maior do que o anterior, e todos os númerosi, i + 1, . . . , k − 1
devem estar presentes nessas duas seqüên ias, entãoi
′
> j
′
pois, asoi
′
< j
′
, para que todos osnúmeros entre
i
ek − 1
estivessem em ambas as seqüên ias pre isaríamos quei
′
fosse igual a
i
, uma ontradição. Alémdisso,j
′
= i
ei
′
= j
′
+(k −1−j)+1
, novamente pelo fato de as duas seqüên ias serem res entes e terem que onter todos os números entre
i
ek − 1
. Con luímos então que a transposiçãot(i, j, k)
transformaσ
−
1
π = (1 . . . i−1 i
′
i
′
+1 . . . i
′
+(j−1−i) j
′
j
′
+1 . . . j
′
+(k−1−j) k k+1 . . . n).
em(1 . . . i−1 j
′
j
′
+1 . . . j
′
+(k−1−j) i
′
i
′
+1 . . . i
′
+(j −1−i) k k+1 . . . n).
ι = (1 . . . i−1 i i+1 . . . j − 1 j j +1 . . . k−1 k k+1 . . . n).
Ou seja,
d
t
(σ
−1
π, ι) = 1
. Mas,pelo orolário1.17,
d
t
(π, σ) = d
t
(σ
−1
π, ι) = 1
.Para de idir seduas permutações
π
eσ
estão auma distân iaxad
, em geral, tomamos valoresi, j, k
tais que1 ≤ i < j < k ≤ n + 1
, apli amos a transposiçãot(i, j, k)
aπ
e veri amos se a permutaçãoπ
′
= π · t(i, j, k)
possui
d
t
(π
′
, σ) ≤ d − 1
; se a resposta for positiva, entãod
t
(π, σ) ≤ d
, aso ontrário,es olhemosoutrosvalores parai
,j
ek
até en ontrarmosπ
′
talque
d
t
(π
′
, σ) ≤ d − 1
ou atéesgotarmos todas as possibilidades. Opro edimento é des ritode maneiraestruturada noalgoritmo2.Determinar
d
t
(π, σ) = 0
oud
t
(π, σ) ≤ 1
pode ser exe utado om uma quantidade de operações linear emn
. A veri ação ded
t
(π, σ) ≤ 2
requer que apliquemos todas as possíveis transposições aπ
, o que é feito no laço ompreendido entre as linhas 12 e 17. Cal ulemos quantas es olhas admis-síveis existem parai
,j
ek
, de talformaquet(i, j, k)
seja uma transposição válida esem repetirmos transposições:n−1
X
i=1
n+1
X
k=i+2
k−1
X
j=i+1
1 =
n−1
X
i=1
n+1
X
k=i+2
k − (i + 1)
=
n−1
X
i=1
−(i + 1)(n − i) + (i + 2 + n + 1)
n − 1
2
=
n−1
X
i=1
n − i
2
(−2i − 2 + i + 2 + n + 1)
=
n−1
X
i=1
n − i
2
(n − i + 1)
( ontinuana página27)Algoritmo 2 Determinase
d
t
(π, σ) ≤ d
Sejam:π, σ ∈ S
n
,d
inteiro não-negativo.Retorna: verdadeiro, aso
d
t
(π, σ) ≤ d
, falso aso ontrário. Função distân ia(π, σ, d)
1: sed = 0
então 2: seπ = σ
então 3: retorna verdadeiro 4: senão 5: retorna falso 6: sed = 1
então7: se
σ = π · t(i, j, k)
ouπ = σ
então{veri ávelem tempo linear}8: retorna verdadeiro 9: senão 10: retorna falso 11: se
d > 1
então 12: parai = 1 . . . n − 1
faça 13: paraj = i + 1 . . . n
faça 14: parak = j + 1 . . . n + 1
faça 15:π
′
← π · t(i, j, k)
16: se distân ia(π
′
, σ, d − 1) =
verdadeiroentão 17: retorna verdadeiro 18: retorna falso=
1
2
n−1
X
i=1
n
2
+ n − 2ni + i
2
− i
=
1
2
(n − 1)(n
2
+ n) − 2n
n−1
X
i=1
i +
n−1
X
i=1
i
2
−
n−1
X
i=1
i
!
=
1
2
n
3
− n
2
+ n
2
− n −2n
n
2
− n
2
|
{z
}
−
n
3
+n
2
−
n
2
− n
2
|
{z
}
n
2
2
−
n
2
+
+
2(n − 1)
3
+ 3(n − 1)
2
+ n − 1
6
!
=
n
2
− n
4
+
2n
3
− 6n
2
+ 6n − 2 + 3n
2
− 6n + 1 + n − 1
12
=
3n
2
− 3n
12
+
2n
3
− 3n
2
+ n
12
=
n
3
− n
6
.
Tal valoré usado para a análise doalgoritmo de força bruta que, exaus-tivamente, pro ura transformar
π
emσ
por transposições. Logo daremos maior ênfase a esse resultado no parágrafoa seguir.Proposição2.10. Dadaumapermutação
π ∈ S
n
, existemn
3
−
n
6
permutaçõesπ
′
tais queπ
′
= π · t(i, j, k)
.Voltandoàanáliseda omplexidadedoalgoritmo2, on luímosque,para
d = 2
, são efetuadasn
3
−n
6
iterações, onde a ada iteração exe utamos o pro edimento distân ia parad = 1
, o que é feito em tempoO(n)
. Logo, a exe ução doalgoritmo onsome, neste aso, tempoO(n
4
)
e arbitrários de
d
, onsumiremosum tempoT (d)
, ondeT (d) = O(
n
3
− n
6
T (d − 1))
= O(
n
3
− n
6
n
3
− n
6
T (d − 2))
= . . .
= O((
n
3
− n
6
)
d−1
T (1))
= O(n
3(d−1)
n)
= O(n
3d−2
).
Vemosassimquea omplexidadedoproblemadedeterminaçãoda distân- iadetransposiçãoépolinomialem
n
quando onsideramosd
uma onstante. Porém, se não impusermos limites ad
, omod
t
(π, σ) ≥ ⌈b(π, σ)/3⌉
e o nú-mero depontos de quebrapodeal ançarvalores de atén + 1
,poderemos, no pior aso,despenderum tempoexponen ialnaexe uçãode nossoalgoritmo.2.3 O diagrama de realidade e desejo: um
li-mite inferior mais justo
Analisemoso omportamentodolimiteinferiorparaadistân iade trans-posição
d
t
(π, σ) ≥ ⌈b(π, σ)/3⌉
e veriquemos oquãopróximoeleseen ontra da distân iareal, usando apermutação reversa para essa análise.JásesabiadesdeoartigodeBafnaePevzner[4℄queapermutaçãoreversa
ρ
[n]
pode ser ordenada om, nomáximo,⌊n/2⌋ + 1
transposições. Meidanis, Walter e Dias [16℄ formalizaram o resultado de Bafna e Pevzner, exibindo umaseqüên ia om⌊n/2⌋ + 1
transposiçõesqueordenaapermutaçãoreversaigualdade
d
t
(ρ
[n]
) = ⌊n/2⌋+1
,estabele endoolimiteinferiorD
t
(n) ≥
n
2
+1
. Apresentaremos, nesta seção, os resultados que permitem-nos al ular a distân iade transposiçãoexata entre apermutação reversa eaidentidade,e on luiremos que o limite inferior⌈b(π, σ)/3⌉
para a distân ia pode não ser muito próximo dadistân iareal.Proposição 2.11. [4, 16℄ A permutação reversa
ρ
[n]
,n ≥ 3
pode ser orde-nada om⌊n/2⌋ + 1
transposições.Prova. Se
n = 2ℓ
é par, a seqüên ia omℓ + 1
transposições da gura 2.2 ordenaρ
[n]
.Para
n = 2ℓ + 1
ímpar,apresentamos uma seqüên ia omℓ + 1
transpo-sições nagura 2.3.A proposição 2.11 nos dá um limite superior
d
t
(ρ
[n]
) ≤ ⌊n/2⌋ + 1
para a distân iaentreρ
[n]
eι
[n]
. Olimiteinferior obtidonoteorema2.8pelaanálise dos pontos de quebra dá-nosd
t
(ρ
[n]
) ≥
b(ρ
[n]
, ι
[n]
)/3
= ⌈(n + 1)/3⌉
. Há uma grande diferença entre o limite inferior e o superior, logo este limite inferior não é de muita valiapara estimar a distân ia neste aso. Podemos obter limites melhores se utilizarmos uma estrutura que aptura melhor a omplexidade doproblema.Denição 2.12 (diagrama de realidade e desejo). [4, 21℄ Dadas duas per-mutações
π, σ ∈ S
n
, o diagramaderealidade edesejoRD(π, σ) = (V, R ∪ D)
é um multigrafo tal que:V
= {0, −1, +1, −2, +2, . . . , −n, +n, −(n + 1)}
R = {(+π
i
, −π
i+1
) ; π
i
π
i+1
são elementos subseqüentesemπ}
n n−1 n−2 n−3 . . . ℓ ℓ−1
?
. . . 2 1
?
t(3, ℓ + 2, n + 1)
n n−1 ℓ−1 . . . 2 1
?
n−2 n−3 . . . ℓ
?
t(1, ℓ + 1, ℓ + 3)
1 n−2 n n−1 ℓ−1 . . .
?
2
n−3
. . . ℓ
?
t(2, ℓ + 2, ℓ + 4)
. . .?
t(ℓ − 1, n − 1, n + 1)
1 2 . . . ℓ−1 ℓ . . . n−3 n−2 n n
?
−1
?
t(n − 1, n, n + 1)
( 1 2 . . . ℓ−1 ℓ . . . n−3 n−2 n−1 n )
Figura2.2: Seqüên iade transposiçõesqueordena
ρ
n n−1 n−2 . . . ℓ+1 ℓ
?
. . . 2 1
?
t(2, ℓ + 1, n + 1)
n ℓ . . . 2 1
?
n−1 n−2 . . . ℓ+1
?
t(1, ℓ, ℓ + 2)
1 n−1 n ℓ . . . 2
?
n−2
. . . ℓ+1
?
t(2, ℓ + 1, ℓ + 3)
. . .?
t(ℓ − 1, n − 2, n)
1 2 . . . ℓ−1 ℓ+1 . . . n−2 n−1 n ℓ
?
ℓ+1
?
t(ℓ, n − 1, n + 1)
( 1 2 . . . ℓ−1 ℓ ℓ+1 ℓ+1 . . . n−2 n−1 n )
Figura2.3: Seqüên iade transposiçõesqueordena
ρ
RD(π, σ)
, para diversas permutaçõesπ
eσ
. Representamos as arestas do onjuntoR
om linhas mais fortes. Os vérti es estão dispostos segundo a ordem dos elementos emπ
.Na literatura, o diagramade realidade edesejo ostumaser apresentado tambémsob onome de grafo de pontos de quebra (breakpoint graph),sendo esta últimaa denominaçãoadotada originalmente
1
porBafna e Pevzner [4℄. Optamos por nos referir a esse multigrafo ex lusivamente pelo nome de di-agrama de realidade e desejo, omo o fazem
2
Setubal e Meidanis em seu livro[21℄por rer queeledes revemelhoraestruturadografoearazãopela qual o denimos.
Cadaarestade
RD(π, σ)
perten e aumdos onjuntosR
ouD
,aosquais nos referiremospelos nomesrealidade edesejo, respe tivamente. As ares-tas de realidade des revem a estrutura dapermutaçãoπ
, a permutaçãoque deverá ser transformada por su essivas transposições até hegarmos à per-mutação desejadaσ
, uja estrutura éreetida pelas arestas de desejo. Se os onjuntosR
eD
ontêm as mesmasarestas, entãoπ = σ
.Pela denição de
RD(π, σ)
, ele é2
-regular, pois há exatamente1
aresta de realidade e1
aresta de desejo in identes a ada vérti e. Logo, podemos parti ioná-lode maneiraúni aem i losalternantes, ouseja,ondeasarestas deR
eD
sealternam,edisjuntos emvérti esentre si. Chamamos aatenção aoleitorparaofatodeque,apesar dasemelhançanonome,nãosedeve on-fundir adenição de i lo nodiagramade realidade edesejo om adenição de i lo (ou órbita)de uma permutação,en ontrada naTeoria de Grupos.1
RessaltamosqueadeniçãoadotadaporBafnaePevznerem[4℄faz omque adapar devérti es
+i
e−i
seja ontraídoemumsó,alémdeseremutilizadasarestasdire ionadas.0
−5
+5
−4
+4
−3
+3
−2
+2
−1
+1
−6
(a)0
−1
+1
−2
+2
−3
+3
−4
+4
−5
+5
−6
(b)0
−5
+5
−4
+4
−3
+3
−2
+2
−1
+1
−6
( )Figura 2.4: Diagramas de realidade e desejo: a)