• Nenhum resultado encontrado

Complexidade da Distância de Translocação para Genomas Sem Sinal

N/A
N/A
Protected

Academic year: 2021

Share "Complexidade da Distância de Translocação para Genomas Sem Sinal"

Copied!
32
0
0

Texto

(1)

Complexidade da Distˆ

ancia de Transloca¸

ao para Genomas

Sem Sinal

Lucas Angelo da Silveira & Mauricio Ayala-Rinc´

on

Grupo de Teoria da Computa¸c˜ao Programa de P´os-Gradua¸c˜ao em Inform´atica

(2)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(3)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(4)

Introdu¸

ao

Um genoma ´

e constitu´ıdo de toda informa¸

ao heredit´

aria de um ser, formado por

um conjunto de diferentes genes que se encontra em cada n´

ucleo de uma

determinada esp´

ecie.

(5)

Definindo um Genoma

Genomas, cromossomos e genes

Um cromossomo n˜

ao apresenta orienta¸

ao, baseado nesta defini¸

ao podemos

visualizar um cromossomo X=(x

1

, x

2

, ..., x

k

) como (x

k

, x

k−1

, . . . , x

1

).

(6)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(7)

Transloca¸c˜

ao e Suas Opera¸

oes

Primeiros estudos

O problema de transloca¸

ao para genomas foi primeiramente estudado por

Kececioglu e Ravi em 1995, no artigo “Algorithms for Evolutionary Distances

Between Genomes With Translocation”.

(8)

Igualdade entre Genomas

Dado um cromossomo X = (x

1

, x

2

, . . . , x

k

), os genes x

1

e −x

k

ao chamados de

caudas. Assim temos que dois genomas s˜

ao co-caudais, se seus conjuntos de

caudas s˜

ao iguais. Exemplo, seja A e B dois genomas.

A = {(+1, −2, +4, +3, −5, +6), (7, −9, −8, +10)},

B = {(+1, +2, +3, +4, +5, +6), (+7, +8, +9, +10)},

com C

1

= {1, −6, 7, −10} e C

2

={1, −6, 7, −10} .

(9)

Definindo o Problema Formalmente

Ordenar Genomas por Transloca¸c˜

ao

Entrada: Dois genomas A e B, onde B ´

e a identidade.

Quest˜

ao:Existe uma sequˆ

encia de transloca¸

oes ρ

1

, ρ

2

, . . . , ρ

t

que transforma A

em B, e t ´

e m´ınimo.

Complexidade para Genomas Via Transloca¸

ao

Autor

Complexidade

Hannenhalli

O(n

3

)

Bergeron

O(n

3

)

Lusheng Wang

O(n

2

)

Tabela :

Problema na vers˜

ao com genomas com sinais.

Autor

Complexidade

Raio

Yun Cui

O(n

2

)

1.75

Yun Cui

O(n

2

+ (

4 

)

1.5

r

log(

4

)2

4 

)

1.5 + 

Haitao Jiang

O(n

2

+ n log

2

n log log n)

1.408 + 

(10)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(11)

Definindo uma Permuta¸

ao π e o Grafo G(π)

Permuta¸

ao π

Uma permuta¸

ao π ´

e uma fun¸

ao bijetiva sobre o conjunto {1, . . . , n}.

O grafo de pontos-de-quebra para π = (2, 4, 1, 3)

Figura :

Grafo de pontos-de-quebra G(π) para uma permuta¸

ao estendida

π = (0, 2, 4, 1, 3, 5) e ι = (0, 1, 2, 3, 4, 5).

(12)

Rela¸c˜

oes de um G(π)

G(π) satisfaz:

cada subgrafo a partir de G(R) e G(B) ´

e um caminho simples.

cada nodo i ∈ V tem o mesmo grau (0, 1 ou 2) em G(R) e G(B).

Uma aresta em G(R) n˜

ao est´

a contida em G(B), e vice-versa.

Figura :

Subgrafos a partir de π = (0, 2, 4, 1, 3, 5) e ι = (0, 1, 2, 3, 4, 5). (a) Subgrafo

G(R), (b) Subgrafo G(B)

(13)

Ciclos alternados de G(π)

´

E uma sequˆ

encia de arestas r

1

, b

1

, r

2

, b

2

, . . . , r

m

, b

m

, onde r

i

∈ R e b

i

∈ B.

Exemplo:{(0, 2), (2, 1), (1, 4), (4, 3), (3, 1), (1, 0)}

Figura :

(a) Grafo de pontos-de-quebra G(π), (b) m´

axima decomposi¸

ao em ciclos

alternados de G(π).

Maximizar ciclos em G(π)

Conhecido como o problema MAX-ACD, que consiste a partir de G(π) encontrar

uma m´

axima decomposi¸

ao de ciclos alternados.

(14)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(15)
(16)

Rela¸c˜

ao entre MAX-ACD e Grafos Eulerianos

MAX-ECD

Consiste em particionar o conjunto de arestas E de um grafo euleriano H no

aximo n´

umero de ciclos.

MAX-ECD ´

e NP-Hard

Holyer provou em [Holyer, 1981] que decompor o conjunto de arestas de um grafo

H em cliques de tamanho k para k ≥ 3 ´

e NP-Completo. Para k=3, consiste em

particionar H em triˆ

angulos, assim podemos assumir que H ´

e euleriano.

(17)

Reduzir de MAX-ECD para MAX-ACD

Fase 1

Figura :

G(d, m), pra d=8 e m=2, s=

d

2

, r=

d

4

(18)

Afirma¸

ao 1: m ≥ l + r

Figura :

G(d, m), pra d=8 e m=2, s=

d

2

, r=

d

4

encontrar um caminho de q

1 1

para q

1 5

(19)

Afirma¸c˜

ao 2: m ≥ r(s − 1) + 1

Figura :

G(d, m), para d=8, s=

d

2

, r=

d

(20)

Correspondˆ

encia um-para-um

Complexidade

m = r(s − 1) + 1

(21)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(22)

Grafo de Pontos-de-Quebra para Genomas sem Sinais

Figura :

Genomas A={(1, 3, 7), (5, 2, 6, 4)} e B={(1, 2, 3, 4), (5, 6, 7)}

No¸c˜

ao de SP e MinSP

Segmento de pelos menos 3 elementos em um cromossomo. Exemplo:

A = {(1, 3, 2, 4, 5, 8, 6), (7, 9)} e B = {(1, 2, 3, 4, 5, 6), (7, 8, 9)}

(23)

Processo de Redu¸

ao de G

XY

para B

AB

dado dois cromossomo X e Y sem sinal. Constru´ımos dois genomas A e B. Onde

A = {X

1

, X

2

} e B = {Y

1

, Y

2

}. Exemplo: X=(1, 3, 4, 2, 5), Y=(1, 2, 3, 4, 5).

X

1

t

1,k

= 3n − 2 + k para 1 ≤ k ≤ n − 1.

X

1

= (1, 14, 3, 15, 4, 16, 2, 17, 5).

X

2

X

2

cont´

em dois novos tipos de genes.

T

2,l

= n + l, para 1 ≤ l ≤ 2(n − 1) e s

i

= 4n − 3 + i, para 1 ≤ i ≤ (n − 2)d.

(24)

Processo de Redu¸c˜

ao de G

XY

para B

AB

(Cont.)

Y

1

= Y .

Y

2

(25)

Grafo de Pontos-de-Quebra B

AB

Figura :

(a)Grafo de pontos-de-quebra G

XY

de X e Y, (b) O grafo de ponto de quebra

B

A

B dos genomas A e B.

(26)

Rela¸c˜

ao de decomposi¸

ao de G

XY

com B

AB

Afirmativa 1: Assumindo que d ≥ n − 1.Existe J ciclos em G

XY

e B

AB

pode ser

(27)

Considerando Arestas Restantes

(28)

Condi¸c˜

ao para Redu¸c˜

ao em Tempo Polinomial de G

XY

para B

AB

Temos V = 4n − 3 + (n − 2).d genes em ambos os genomas A e B.

Fazendo d = n − 1. Temos que a redu¸

ao ´

e polinomial.

(29)

Distˆ

ancia de Transloca¸c˜

ao em fun¸

ao da Decomposi¸

ao de B

AB

Afirmativa 2: d(A, B) = 3n − 3 − J .

Teorema 1 em [Zhu, 2006] mostra que a distˆ

ancia de transloca¸

ao entre genomas

A e B ´

e dada por:d(A, B) = n − N − C

AB

.

d(A, B)

d(A

0

, B

0

) = n − N − C

AB

= 4n − 3 + (n − 2)d − 2 − ((n − 2)(d + 1) + J )

= 4n − 3 + dn − 2d − 2 − (dn + n − 2d − 2 + J )

= 4n − 3 + dn − 2d − 2 − dn − n + 2d + 2 − J

= 4n − n − 3 + 2 − 2 − 2d + 2d − J

= 3n − 3 − J.

Teorema 12 em [Hannenhalli, 1996] mostra que se n˜

ao h´

a minSPs em A e B,

d(A

0

, B

0

) = n − N − C

AB

.

(30)

Conclus˜

ao

Transloca¸

ao ´

e usada para estimar a distˆ

ancia evolutiva entre duas esp´

ecies.

Essencialmente foi mostrado que o problema de distˆ

ancia de transloca¸

ao para

genomas sem sinais ´

e NP-Hard. Para o qual, utilizou-se o fato que MAX-ECD ´

e

NP-hard, mostrando sequˆ

encias de redu¸

oes polinomiais a partir deste problema.

(31)

Trabalhos Futuros

1.

Implementar o algoritmo de raio de aproxima¸

ao 1.408 + .

2.

Implementar t´

ecnicas de algoritmos gen´

eticos, afim de superar raio de

aproxima¸

ao mencionado acima.

(32)

A. Bergeron et. al. ( J. of Computational Biology 13(2) : 567–578, 2006). On

Sorting by Translocations.

A. Caprara et. al. (Conf. on Computational Molecular Biology,

1997, pp.75–83). Sorting by reversal is difficult.

D. Zhu et. al. ( J. of Theor. Comput. Sci, 352(1 − 3) : 322–328, 2006). On the

complexity of unsigned translocation distance.

S. Hannenhalli et. al. ( J. Disc. Appl. Math., 71(1–3), 137–151, 1996).

Polynomial-time algorithm for computing translocation distance between

genomes.

Ian-Holyer (SIAM J. on Computing, 713–717, 1981). The NP-Completeness of

Some Edge-Partition Problems

Referências

Documentos relacionados

O diferencial é que, ao invés de parar em 1991, quando houve a desintegração da União Soviética (URSS), o autor prossegue até os dias atuais enfrentando o que

Analisando o excerto anterior é possível verificar que, ao contrário do que acontece com os restantes tipos de dados, neste não colocamos o “e” comercial no início do nome

O SILVA Centro de Inspeções MasterTest Amoreira A qualidade ao melhor preço. Todos os dias TALHO O SILVA O SILVA TALHO Flyer O

O exame radiológico das vias lacrimais, descrito por Ewing 2, e com o uso de contrastes oleosos nos dá informações anatômicas da VLE, com detalhes do local da obstrução, presença

Além das tão desejadas características de conferir cor aos alimentos, muitas das substâncias utilizadas como corantes naturais possuem importantes benefícios,

6.4.1 CARGA SUPLEMENTAR: QUANTIDADE ATUAL MENSAL: Indicar a nova quantidade de horas que o docente passou a ministrar a partir da data informada; 6.4.2 G.T.C.N.:

A maior letalidade da TB entre pessoas com HIV está relacionada a múltiplos fatores, entre eles: a progressão mais rápida do MTB pela imunossupressão; o atraso no diagnóstico e no

Luís Manuel Guerra Neri *, Paul Nino Faria de Afonseca **. Serviço Regional de Protecção Civil e Bombeiros