• Nenhum resultado encontrado

Complexidade da Distância de Translocação para Genomas Sem Sinal

N/A
N/A
Protected

Academic year: 2021

Share "Complexidade da Distância de Translocação para Genomas Sem Sinal"

Copied!
32
0
0

Texto

(1)

Complexidade da Distˆ

ancia de Transloca¸

ao para Genomas

Sem Sinal

Lucas Angelo da Silveira & Mauricio Ayala-Rinc´

on

Grupo de Teoria da Computa¸c˜ao Programa de P´os-Gradua¸c˜ao em Inform´atica

(2)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(3)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(4)

Introdu¸

ao

Um genoma ´

e constitu´ıdo de toda informa¸

ao heredit´

aria de um ser, formado por

um conjunto de diferentes genes que se encontra em cada n´

ucleo de uma

determinada esp´

ecie.

(5)

Definindo um Genoma

Genomas, cromossomos e genes

Um cromossomo n˜

ao apresenta orienta¸

ao, baseado nesta defini¸

ao podemos

visualizar um cromossomo X=(x

1

, x

2

, ..., x

k

) como (x

k

, x

k−1

, . . . , x

1

).

(6)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(7)

Transloca¸c˜

ao e Suas Opera¸

oes

Primeiros estudos

O problema de transloca¸

ao para genomas foi primeiramente estudado por

Kececioglu e Ravi em 1995, no artigo “Algorithms for Evolutionary Distances

Between Genomes With Translocation”.

(8)

Igualdade entre Genomas

Dado um cromossomo X = (x

1

, x

2

, . . . , x

k

), os genes x

1

e −x

k

ao chamados de

caudas. Assim temos que dois genomas s˜

ao co-caudais, se seus conjuntos de

caudas s˜

ao iguais. Exemplo, seja A e B dois genomas.

A = {(+1, −2, +4, +3, −5, +6), (7, −9, −8, +10)},

B = {(+1, +2, +3, +4, +5, +6), (+7, +8, +9, +10)},

com C

1

= {1, −6, 7, −10} e C

2

={1, −6, 7, −10} .

(9)

Definindo o Problema Formalmente

Ordenar Genomas por Transloca¸c˜

ao

Entrada: Dois genomas A e B, onde B ´

e a identidade.

Quest˜

ao:Existe uma sequˆ

encia de transloca¸

oes ρ

1

, ρ

2

, . . . , ρ

t

que transforma A

em B, e t ´

e m´ınimo.

Complexidade para Genomas Via Transloca¸

ao

Autor

Complexidade

Hannenhalli

O(n

3

)

Bergeron

O(n

3

)

Lusheng Wang

O(n

2

)

Tabela :

Problema na vers˜

ao com genomas com sinais.

Autor

Complexidade

Raio

Yun Cui

O(n

2

)

1.75

Yun Cui

O(n

2

+ (

4 

)

1.5

r

log(

4

)2

4 

)

1.5 + 

Haitao Jiang

O(n

2

+ n log

2

n log log n)

1.408 + 

(10)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(11)

Definindo uma Permuta¸

ao π e o Grafo G(π)

Permuta¸

ao π

Uma permuta¸

ao π ´

e uma fun¸

ao bijetiva sobre o conjunto {1, . . . , n}.

O grafo de pontos-de-quebra para π = (2, 4, 1, 3)

Figura :

Grafo de pontos-de-quebra G(π) para uma permuta¸

ao estendida

π = (0, 2, 4, 1, 3, 5) e ι = (0, 1, 2, 3, 4, 5).

(12)

Rela¸c˜

oes de um G(π)

G(π) satisfaz:

cada subgrafo a partir de G(R) e G(B) ´

e um caminho simples.

cada nodo i ∈ V tem o mesmo grau (0, 1 ou 2) em G(R) e G(B).

Uma aresta em G(R) n˜

ao est´

a contida em G(B), e vice-versa.

Figura :

Subgrafos a partir de π = (0, 2, 4, 1, 3, 5) e ι = (0, 1, 2, 3, 4, 5). (a) Subgrafo

G(R), (b) Subgrafo G(B)

(13)

Ciclos alternados de G(π)

´

E uma sequˆ

encia de arestas r

1

, b

1

, r

2

, b

2

, . . . , r

m

, b

m

, onde r

i

∈ R e b

i

∈ B.

Exemplo:{(0, 2), (2, 1), (1, 4), (4, 3), (3, 1), (1, 0)}

Figura :

(a) Grafo de pontos-de-quebra G(π), (b) m´

axima decomposi¸

ao em ciclos

alternados de G(π).

Maximizar ciclos em G(π)

Conhecido como o problema MAX-ACD, que consiste a partir de G(π) encontrar

uma m´

axima decomposi¸

ao de ciclos alternados.

(14)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(15)
(16)

Rela¸c˜

ao entre MAX-ACD e Grafos Eulerianos

MAX-ECD

Consiste em particionar o conjunto de arestas E de um grafo euleriano H no

aximo n´

umero de ciclos.

MAX-ECD ´

e NP-Hard

Holyer provou em [Holyer, 1981] que decompor o conjunto de arestas de um grafo

H em cliques de tamanho k para k ≥ 3 ´

e NP-Completo. Para k=3, consiste em

particionar H em triˆ

angulos, assim podemos assumir que H ´

e euleriano.

(17)

Reduzir de MAX-ECD para MAX-ACD

Fase 1

Figura :

G(d, m), pra d=8 e m=2, s=

d

2

, r=

d

4

(18)

Afirma¸

ao 1: m ≥ l + r

Figura :

G(d, m), pra d=8 e m=2, s=

d

2

, r=

d

4

encontrar um caminho de q

1 1

para q

1 5

(19)

Afirma¸c˜

ao 2: m ≥ r(s − 1) + 1

Figura :

G(d, m), para d=8, s=

d

2

, r=

d

(20)

Correspondˆ

encia um-para-um

Complexidade

m = r(s − 1) + 1

(21)

Sum´

ario

Introdu¸

ao

Genomas e Opera¸

oes Suportadas

Grafo de Pontos-de-quebra para uma permuta¸

ao

MAX-ACD ´

e NP-Hard

(22)

Grafo de Pontos-de-Quebra para Genomas sem Sinais

Figura :

Genomas A={(1, 3, 7), (5, 2, 6, 4)} e B={(1, 2, 3, 4), (5, 6, 7)}

No¸c˜

ao de SP e MinSP

Segmento de pelos menos 3 elementos em um cromossomo. Exemplo:

A = {(1, 3, 2, 4, 5, 8, 6), (7, 9)} e B = {(1, 2, 3, 4, 5, 6), (7, 8, 9)}

(23)

Processo de Redu¸

ao de G

XY

para B

AB

dado dois cromossomo X e Y sem sinal. Constru´ımos dois genomas A e B. Onde

A = {X

1

, X

2

} e B = {Y

1

, Y

2

}. Exemplo: X=(1, 3, 4, 2, 5), Y=(1, 2, 3, 4, 5).

X

1

t

1,k

= 3n − 2 + k para 1 ≤ k ≤ n − 1.

X

1

= (1, 14, 3, 15, 4, 16, 2, 17, 5).

X

2

X

2

cont´

em dois novos tipos de genes.

T

2,l

= n + l, para 1 ≤ l ≤ 2(n − 1) e s

i

= 4n − 3 + i, para 1 ≤ i ≤ (n − 2)d.

(24)

Processo de Redu¸c˜

ao de G

XY

para B

AB

(Cont.)

Y

1

= Y .

Y

2

(25)

Grafo de Pontos-de-Quebra B

AB

Figura :

(a)Grafo de pontos-de-quebra G

XY

de X e Y, (b) O grafo de ponto de quebra

B

A

B dos genomas A e B.

(26)

Rela¸c˜

ao de decomposi¸

ao de G

XY

com B

AB

Afirmativa 1: Assumindo que d ≥ n − 1.Existe J ciclos em G

XY

e B

AB

pode ser

(27)

Considerando Arestas Restantes

(28)

Condi¸c˜

ao para Redu¸c˜

ao em Tempo Polinomial de G

XY

para B

AB

Temos V = 4n − 3 + (n − 2).d genes em ambos os genomas A e B.

Fazendo d = n − 1. Temos que a redu¸

ao ´

e polinomial.

(29)

Distˆ

ancia de Transloca¸c˜

ao em fun¸

ao da Decomposi¸

ao de B

AB

Afirmativa 2: d(A, B) = 3n − 3 − J .

Teorema 1 em [Zhu, 2006] mostra que a distˆ

ancia de transloca¸

ao entre genomas

A e B ´

e dada por:d(A, B) = n − N − C

AB

.

d(A, B)

d(A

0

, B

0

) = n − N − C

AB

= 4n − 3 + (n − 2)d − 2 − ((n − 2)(d + 1) + J )

= 4n − 3 + dn − 2d − 2 − (dn + n − 2d − 2 + J )

= 4n − 3 + dn − 2d − 2 − dn − n + 2d + 2 − J

= 4n − n − 3 + 2 − 2 − 2d + 2d − J

= 3n − 3 − J.

Teorema 12 em [Hannenhalli, 1996] mostra que se n˜

ao h´

a minSPs em A e B,

d(A

0

, B

0

) = n − N − C

AB

.

(30)

Conclus˜

ao

Transloca¸

ao ´

e usada para estimar a distˆ

ancia evolutiva entre duas esp´

ecies.

Essencialmente foi mostrado que o problema de distˆ

ancia de transloca¸

ao para

genomas sem sinais ´

e NP-Hard. Para o qual, utilizou-se o fato que MAX-ECD ´

e

NP-hard, mostrando sequˆ

encias de redu¸

oes polinomiais a partir deste problema.

(31)

Trabalhos Futuros

1.

Implementar o algoritmo de raio de aproxima¸

ao 1.408 + .

2.

Implementar t´

ecnicas de algoritmos gen´

eticos, afim de superar raio de

aproxima¸

ao mencionado acima.

(32)

A. Bergeron et. al. ( J. of Computational Biology 13(2) : 567–578, 2006). On

Sorting by Translocations.

A. Caprara et. al. (Conf. on Computational Molecular Biology,

1997, pp.75–83). Sorting by reversal is difficult.

D. Zhu et. al. ( J. of Theor. Comput. Sci, 352(1 − 3) : 322–328, 2006). On the

complexity of unsigned translocation distance.

S. Hannenhalli et. al. ( J. Disc. Appl. Math., 71(1–3), 137–151, 1996).

Polynomial-time algorithm for computing translocation distance between

genomes.

Ian-Holyer (SIAM J. on Computing, 713–717, 1981). The NP-Completeness of

Some Edge-Partition Problems

Referências

Documentos relacionados

O SILVA Centro de Inspeções MasterTest Amoreira A qualidade ao melhor preço. Todos os dias TALHO O SILVA O SILVA TALHO Flyer O

O diferencial é que, ao invés de parar em 1991, quando houve a desintegração da União Soviética (URSS), o autor prossegue até os dias atuais enfrentando o que

Além das tão desejadas características de conferir cor aos alimentos, muitas das substâncias utilizadas como corantes naturais possuem importantes benefícios,

6.4.1 CARGA SUPLEMENTAR: QUANTIDADE ATUAL MENSAL: Indicar a nova quantidade de horas que o docente passou a ministrar a partir da data informada; 6.4.2 G.T.C.N.:

Analisando o excerto anterior é possível verificar que, ao contrário do que acontece com os restantes tipos de dados, neste não colocamos o “e” comercial no início do nome

O exame radiológico das vias lacrimais, descrito por Ewing 2, e com o uso de contrastes oleosos nos dá informações anatômicas da VLE, com detalhes do local da obstrução, presença

A maior letalidade da TB entre pessoas com HIV está relacionada a múltiplos fatores, entre eles: a progressão mais rápida do MTB pela imunossupressão; o atraso no diagnóstico e no

Luís Manuel Guerra Neri *, Paul Nino Faria de Afonseca **. Serviço Regional de Protecção Civil e Bombeiros