Photorhabdus asymbiotica - Representação de sequências de DNA através do Jogo do Caos (CGR)

60 FCUP

Representação do Jogo do Caos (CGR) de sequências de ADN

Photorhabdus asymbiotica é uma bactéria conhecida por ser patogênica para uma ampla gama de insetos e ser usada como biopesticida na agricultura.

5.6.1 Probabilidades dos nucleótidos

A sequência de ADN desta bactéria é portadora de5064808bp. Onde1459060são nucleótidos A’s, 1070603 C’s, 1064347 G’s e 1470798 T’s. Daqui, as probabilidades de ocorrência de cada nucleótido são, aproximada e respetivamente,0.288,0.211,0.210e0.291.

5.6.2 Análise do fractal

Esta CGR (5.17) não tem nenhum padrão próprio que seja marcante. Nas representações anteriores fomos deslumbrados com "duplo furos", triângulos vazios e cruzes; nesta CGR, os pontos aparentam estar distribuídos aleatoriamente. Com uma maior concentração destes no fundo do quadrado unitário e numa paralela a esta linha que é apresentada no meio do fractal.

5.6.3 Ajuste de probabilidades

Se na criação de um IFS para um quadrado substituirmos as probabilidades para as calculadas a cima, obtemos o IFS apresentado no lado direito da figura 5.18.

Fig. 5.18. CGR da sequência de ADN de uma Photorhabdus asymbiotica (lado esquerdo); IFS com probabilidades 0.288, 0.211, 0.210e 0.291para os nucleótidos A, C, G e T, respetivamente (lado direito)

Temos em ambas as imagens da figura 5.18 uma maior concentração de pontos no fundo do quadrado unitário. E, também somos capazes de vislumbrar nos dois fractais linhas horizontais formadas por pontos.

Conclusões

As relações conhecidas entre a representação do jogo do caos (CGR) e uma sequência de ADN são as retratadas em seguida.

Ok-ésimo ponto representado na CGR de uma sequência corresponde à primeira subsequência inicial de comprimento k, e nenhuma outra subsequência. Assim, há uma correspondência um- para-um entre as subsequências de um gene e pontos do CGR.

Assim qualquer padrão visível na CGR corresponde a algum padrão na sequência de bases. Conforme observado, a resolução da tela do computador limita os detalhes que podem ser mostrados em qualquer um dos CGRs. No entanto, como com todos os fractais, incluindo aqueles gerados por códigos IFS, qualquer parte da imagem pode ser ampliada, revelando uma melhor estrutura. Esta ampliação é sem limite (desde que haja mais bases na sequência).

Quanto maior okmaior, maior a precisão da CGR.

Bases adjacentes na sequência não são desenhadas adjacentes umas às outras (exceto quando o primeiro ponto está próximo a um vértice e a próxima base é a mesma que a anterior). Estar pró- ximo no CGR não significa estar próximo na sequência. A distância euclidiana no CGR implica, portanto, uma nova métrica em subsequências ou bases.

Se dois pontos estão dentro do mesmo quadrante, correspondem a sequências com a mesma última base; se estão no mesmo sub-quadrante, as sequências têm as mesmas últimas duas bases; e por aí em diante.

Num CGR cujo lado tem comprimento1, duas sequências com sufixo de comprimentokestão contidas no quadrado com lado de comprimento 2−k. Além disso, o centro do quadrado é dado pela seguinte definição recursiva:

• O centro do sufixo de comprimento0é(1/2, 1/2).

• Se o centro do quadrado que contem sequências com o sufixo W for em(x, y), então

– O centro do quadrado contendo sequências com o sufixo WA é(x / 2, y / 2); – O centro do quadrado contendo sequências com sufixo WC é(x / 2, (y + 1) / 2); – O centro do quadrado contendo sequências com o sufixo WG está em((x + 1) / 2, (y +

1)/ 2);

– O centro do quadrado contendo sequências com sufixo WT está em((x + 1) / 2, y / 2).

Por outro lado, todos os pontos dentro deste quadrado correspondem a sequências com este sufixo.

FCUP Representação do Jogo do Caos (CGR) de sequências de ADN 63

Uma densidade (ou escassez) de pontos em uma região corresponde a um grande (ou pequeno) número de sequências com sufixos correspondentes à região. Para além disso, como cada região quadrada (sub, sub-sub, etc. quadrante) corresponde a um sufixo específico, qualquer região densa (ou esparsa) corresponde à união deS1, S2, . . ., em queSié o conjunto de sequências com sufixo

Devido à correspondência entre os pontos no CGR e a sequência, qualquer caracterização matemática do CGR é uma caracterização da sequência subjacente.

Por exemplo, pode ser possível encontrar uma técnica para produzir uma descrição matemática do CGR de uma sequência, usando conceitos da teoria IFS. Se tal técnica puder ser encontrada, será uma técnica para produzir uma descrição da sequência de ADN.

Como resultado destas observações, podemos dizer que, num sentido intuitivo, o CGR representa tanto propriedades estatísticas de frequências de bases como também propriedades de sequencialidade - isto é, quais bases seguem outras, imediatamente ou mais tarde no gene.

Geralmente, cerca de 4.000 pares de bases são necessários para uma imagem nitidamente definida, embora em muitos casos 2000 forneçam uma aproximação razoavelmente boa.

Muitas características da sequência genética são exibidas por uma subsequência inicial e, portanto, a análise de toda a sequência pode não acrescentar novas informações.

Como trabalhos futuros era importante analisar mais afincadamente a frequência destas 3-mers - e talvez mesmok-mers (para umk > 3) - para tentarmos responder a perguntas como: determina- das espécies são mais abundantes de um determinado 3-mer que outras? O que um determinado 3-mer de uma sequência de ADN nos pode informar sobre o seu portador?

Era também importante criar um código que calculasse as repetições em tandem, apresentadas no capítulo 2, e proceder à sua investigação.

Outro código que poderia ser proveitoso era, na criação do IFS de um quadrado, proibir deter- minados endereços. E, posteriormente, comparar esta representação do IFS com uma CGR de uma determinada sequência de ADN. Isto é, tentarmos recriar a CGR de uma sequência de ADN através de um IFS. Foi dada uma introdução a isto em 4.1.

Igualmente benéfico seria considerar a ordem das sequências de ADN, analisar se esta nos presenteia com implicações em caraterísticas do ser em questão.

Glossário

codon - é uma sequência de três bases nitrogenadas de RNA mensageiro que codificam um determinado aminoácido ou que indicam o ponto de início ou fim de tradução da cadeia de mRNA

Cromatina - molécula responsável pela compactação do ADN.

Exon - é um segmento de ADN de um gene eucariótico cujo transcrito sobrevive ao processo de processamento

Hemoglobina - molécula proteica complexa contida dentro das células sanguíneas vermelhas, que lhes dá a sua cor e pela qual o oxigênio é transportado.

Intron - secções de ADN de um gene que não codificam qualquer parte da proteína produzida pelo gene e que separa da sequência constituída pelos exons

Organismo hipertermófilo - são organismos que resistem a temperaturas acima dos75◦C

Ser eucarionte - ser unicelular ou pluricelular que possui membrana nuclear, ou seja, o seu núcleo celular é separado do citoplasma por uma membrana

Ser procarionte - ser unicelular que não possui núcleo

Bibliografia

[1] P.J. Deschavanne, A. Giron, J. Vilain, G. Fagot, and B. Fertil. (1999). Genomic Signature: Cha- racterization and Classification of Species Assessed by Chaos Game Representation of Se- quences. Mol. Biol. Evol. 16(10):1391-1399

[2] Richard Bedient, Michael Frame, Keith Gross, Jennifer Lanski, Brendan Sullivan. (2009). Higher block IFS 1: memory reduction and dimension computations. World Scientific Publishing Com- pany. Fractals. 18(2):145-155

[3] Bert Vogelstein, Nickolas Papadopoulos, Victor E. Velculescu, Shibin Zhou, Luis A. Diaz Jr., Kenneth W. Kinzler. (2013). Cancer Genome Landscapes. Science. 339. 1546-1558

[4] Richard Bedient, Michael Frame, Keith Gross, Jennifer Lanski, Brendan Sullivan. (2010). Higher block IFS 2: relations between IFS with different levels of memory. World Scientific Publishing Company. Fractals. 18(4):399-408

[5] Michael Frame, Jennifer Lanski.(1999). When is a recurrent IFS attractor a standard IFS attractor?. World Scientific Publishing Company. Fractals. 7(3):257-266

[6] Benoit B. Mandelbrot. (2004). Fractals and Chaos: The Mandelbrot Set and Beyond. Springer- Verlag New York

[7] Benoit B. Mandelbrot. (1977). The Fractal Geometry Of Nature. W. H. FREEMAN AND COM- PANY New York

[8] H. Joel Jeffrey. (1990). Chaos game representation of gene structure. Oxford University Press. 18(8):2163-2170

[9] Peitgen, Jurgens, Saupe. (2004). Chaos and Fractals: New Frontiers of Science. Springer [10] Marc Frantz, Annalisa Crannell. (2011). Mathematical Perspective and Fractal Geometry in Art.

Princeton University Press

[11] Feldman, David P.(2012).Chaos and Fractals: An Elementary Introdution. Oxford University Press

[12] Michael Frame, Amelia Urry. (2016). Fractal Worlds: Grown, Built, and Imagined. Yale Univer- sity Press

[13] Supratim Choudhuri. Bioinformatics For Beginners: Genes, Genomes, Molecular Evolution, Databases and Analytical Tools. Elsevier

68 FCUP

Representação do Jogo do Caos (CGR) de sequências de ADN

[14] Nello Cristianini, Matthew W. Hahn. (2006). Introdution to Computational Genomics: A Case Studies Approach. Cambridge University Press

[15] Kenneth Falconer. (1990). Fractal Geometry: Mathematical Foundations and Applications. John Wiley and sons

[16] Jonas S. Almeida, João A. Carriço, António Maretzek, Peter A. Noble e Madilyn Fletcher. (2001). Analysis of genomic sequences by Chaos Game Representation. Oxford University Press. 17(5):429-437

[17] Jijoy Joseph and Roschen Sasikumar. (2006). Chaos game representation for comparison of whole genomes. BMC Bioinformatics. 7:243

[18] Bunz, Fred. (2016). Principles of Cancer Genetics. Springer

[19] Pedro A Moreno1, Patricia E Vélez, Ember Martínez, Luis E Garreta1, Néstor Díaz, Siler Ama- dor, Irene Tischer, José M Gutiérrez, Ashwinikumar K Naik, Fabián Tobar and Felipe García. (2011). The human genome: a multifractal analysis. BMC Genomics. 12. 506

[20] R. Daniel Mauldin and S. C. Williams, (1988). Hausdorff Dimension in Graph Directed Cons- tructions. JSTOR. Transactions of the American Mathematical Society. 309(2)

[21] Chaos Game Representation of gene structure in Python: https://bostjan-cigan.com/chaos- game-representation-of-gene-structure-in-python/

[22] Construir um fractal: http://prorum.com/index.php/3104/construir-fractal-conhecido-sierpinski- utilizando-recursoes

Apêndice A

Código Matlab

Nas seguintes secções são apresentadas as funções utilizadas e a computação da figura respetiva às representações de sequências de ADN através do Jogo do Caos. Este código foi adaptado de códigos disponíveis em (1), (21) e (22).

A.1 readFastaFile

1 f u n c t i o n sequence = r e a d F a s t a F i l e ( ’ a f u l g i d u s . f a s t a ’ )

2% Funcao que p e r m i t e l e r uma sequencia de DNA dado em f o r m a t o FASTA 3 4 f a s t a A r r a y = t e x t r e a d ( f a s t a F i l e , ’%s ’ ) ; 5 6 % desconsideramos os c o m e n t a r i o s " > " 7 i = 1 ; while ( s t r m a t c h ( ’ > ’ , f a s t a A r r a y ( i ) ) ) i = i + 1 ; end ; 8

9 % f a s t a A r r a y e um v e c t o r onde cada elemento corresponde a uma 10 % l i n h a do f i c h e i r o f a s t a . Para e l i m i n a r as quebras de l i n h a 11 % f o i c r i a d a uma funcao que p e r m i t a c o n s t r u i r uma s t r a n d 12 % da sequencia de DNA

13 sequence = buildDNAStrand ( f a s t a A r r a y ( i : end ) ) ; 14 end

A.2 makeMatrixOfWords

1 f u n c t i o n a c t u a l M a t r i x = makeMatrixOfWords ( l e n )

2% Funcao que p e r m i t e c r i a r uma m a t r i z de padroes de p a l a v r a s .

4% l e n : r e p r e s e n t a o tamanho da p a l a v r a a s e r c o n s i d e r a d a na m a t r i z 5% de p a l a v r a s

7 matrixBase = { ’C ’ ’G ’ ; ’ A ’ ’ T ’ } ; % c o n f i g u r a c a o das bases 8 a c t u a l M a t r i x = matrixBase ;

70 FCUP

Representação do Jogo do Caos (CGR) de sequências de ADN

9 10 f o r k = 2 : l e n 11 M = { } ; 12 f o r i =1:2 13 row = { } ; 14 f o r j =1:2

15 % p r e f i x o para cada quadrante 16 p r e f i x = char ( matrixBase { i , j } ) ; 17

18 % copiamos a m a t r i z a c t u a l para poder i n c r e m e n t a r o p r e f i x o

19 % em cada quadrante

20 t e m p o r a l M a t r i x = a c t u a l M a t r i x ; 21 n = s i z e ( t e m p o r a l M a t r i x , 1 ) ; 22

23 % criamos uma m a t r i z com o padrao de p r e f i x∗[ a c t u a l M a t r i x ]

24 f o r a = 1 : n 25 f o r b = 1 : n 26 t e m p o r a l M a t r i x ( a , b ) = { [ p r e f i x char ( t e m p o r a l M a t r i x ( a , b ) ) ] } ; 27 end ; 28 end ; 29 30 % concatenamos h o r i z o n t a l m e n t e a m a t r i z t e m p o r a l 31 row = [ row t e m p o r a l M a t r i x ] ; 32 end ; 33 34 % concatenamos v e r t i c a l m e n t e a l i n h a ’ row ’ 35 M = [M; row ] ; 36 end ; 37 38 a c t u a l M a t r i x = M; 39 end ;

A.3 buildDNAStrand

1 f u n c t i o n sequence = buildDNAStrand ( DNAMatrix )

2% C o n s t r o i uma sequencia dada sua r e p r e s e n t a c a o como v e c t o r

4 DNAMatrix = char ( DNAMatrix ) ;

5 [ nRows , nBases ] = s i z e ( DNAMatrix ) ; 6

7 f o r j = 0 : nRows∗nBases−1

FCUP Representação do Jogo do Caos (CGR) de sequências de ADN 71

9 sequence ( j +1) = DNAMatrix ( f l o o r ( j / nBases ) +1 , mod ( j , nBases )

+1) ; 10 else 11 break ; 12 end ; 13 end ; 14 end

A.4 buildComplementarDNA

1 f u n c t i o n sequenceB = buildComplementarDNA ( sequenceA ) 2 n = length ( sequenceA ) ; 3 4 sequenceB ( n ) = ’ ’ ; 5 6 f o r i = 1 : n 7 s w i t c h ( sequenceA ( i ) ) 8 case ’ A ’ 9 complementar = ’ T ’ ; 10 case ’ T ’ 11 complementar = ’A ’ ; 12 case ’C ’ 13 complementar = ’G ’ ; 14 case ’G ’ 15 complementar = ’C ’ ; 16 o t h e r w i s e 17 i 18 disp ( sequenceA ( i ) ) ; 19 end ;

20 sequenceB ( n−i +1) = char ( complementar ) ; 21 end ;

22 23 end

A.5 calculateFrecuencies

1 f u n c t i o n f r e q = c a l c u l a t e F r e c u e n c i e s ( sequence , word )

2% Funcao que c a l c u l a a f r e c u e n c i a de ’ word ’ em ’ sequence ’ 3% ( f r e q u e n c i a que c o n s i d e r a c l u s t e r s s o b r e p o s t o s )

5 n = length ( sequence ) ; 6 k = length ( word ) ; 7 p o s s i b i l i t i e s = n−k + 1 ;

72 FCUP

Representação do Jogo do Caos (CGR) de sequências de ADN

8 f r e q = 0 ; 9

10 f o r i = 1 : p o s s i b i l i t i e s 11 c o n t = 0 ;

13 % contamos as i g u a l d a d e s para cada l e t r a de ’ word ’ 14 f o r j = 1 : k

15 i f sequence ( i + j−1)==word ( j ) 16 c o n t = c o n t + 1 ;

17 else

18 break ; % se uma l e t r a e d i f e r e n t e , nao e n e c e s s a r i a a

comparacao com o u t r a s l e t r a s da mesma p a l a v r a .

19 end ;

20 end ;

22 % Se ’ word ’ c o i n c i d i r com a c l u s t e r entao somamos 1 23 i f ( c o n t ==k ) 24 f r e q = f r e q + 1 ; 25 end ; 26 end ; 27 28 f r e q = f r e q / p o s s i b i l i t i e s ; 29 30 end

A.6 fcgr2

1 f u n c t i o n M = f c g r 2 ( ’ a f u l g i d u s . f a s t a ’ ; wordLen )

2% Genomic s i g n a t u r e u s i n g Chaos game r e p r e s e n t a t i o n o f f r e q u e n c i e s (

pseudo o p t i m i z e d v e r s i o n )

3 4

5 MatrixOfWords = makeMatrixOfWords ( wordLen ) ; 6

7 % Lemos a sequencia . Cada a r q u i v o FASTA mostra apenas uma s t r a n d 8 % das 2 c a d e i a s de DNA. FCGR e dependente da s t r a n d , dessa forma 9 % nos c a l c u l o s consideraremos ambas s t r a n d s .

10 sequenceA = r e a d F a s t a F i l e ( ’ a g u l g i d u s . f a s t a ’ ) ; 11

12 % As f r e q u e n c i a s que devem s e r c o n s i d e r a d a s nos c a l c u l o s devem de

13 % c o r r e s p o n d e r a ambas c a d e i a s de DNA, por i s s o calculamos a

sequencia

FCUP Representação do Jogo do Caos (CGR) de sequências de ADN 73

16 % se sequence = ATCGCTTA, a sua sequencia complementar sera TAAGCGAT 17 % Recordemos que : 18 %− A e complementar de T , e v i c e v er sa 19 %− C e complementar de G, e v i c e ve rs a 20 % 21 % No nosso exemplo : 22 % ATCGCTTA ( s e n t i d o −>) r i g h t s t r a n d o 5 ’ 23 % TAGCGAAT ( s e n t i d o <−) l e f t s t r a n d o 3 ’ 24

25 sequenceB = buildComplementarDNA ( sequenceA ) ; 26

27 % concatemos as 2 c a d e i a s numa so 28 % sequence = [ sequenceA sequenceB ] ; 29 sequence = [ sequenceA ] ; 30 31 % i n i c i a l i z a m o s m a t r i z para o c a l c u l o das f r e q u e n c i a s 32 M a t r i x O f F r e c u e n c i e s = zeros ( s i z e ( MatrixOfWords ) ) ; 33 34 % i n i c i a l i z a c a o da pseudo−a r v o r e 35 f o r i = 1 : s i z e ( MatrixOfWords , 1 ) 36 f o r j = 1 : s i z e ( MatrixOfWords , 1 ) 37 38 pathOfTree = ’ r o o t ’ ;

39 word = char ( MatrixOfWords ( i , j ) ) ; 40

41 f o r a = 1 : wordLen

42 pathOfTree = [ pathOfTree ’ . ’ word ( a ) ] ;

43 end ; 44 45 eval ( [ pathOfTree ’ = 1 ; ’ ] ) ; 46 end ; 47 end ; 48

49 % c a l c u l o das f r e q u e n c i a s para cada p a l a v r a na sequencia dada 50 n = length ( sequence ) ; 51 p o s s i b i l i t i e s = n−wordLen + 1 ; 52 53 f o r i = 1 : p o s s i b i l i t i e s 54 55 pathOfTree = ’ r o o t ’ ; 56

74 FCUP

Representação do Jogo do Caos (CGR) de sequências de ADN

57 f o r j = i : i +wordLen−1

58 pathOfTree = [ pathOfTree ’ . ’ sequence ( j ) ] ;

59 end ;

61 eval ( [ pathOfTree ’ = ’ pathOfTree ’ + 1 ; ’ ] ) ; 62 end ;

64 % copiamos as f r e q u e n c i a s da a r v o r e para a m a t r i z de Frequencias 65 f o r i = 1 : s i z e ( MatrixOfWords , 1 )

66 f o r j = 1 : s i z e ( MatrixOfWords , 1 ) 67

68 pathOfTree = ’ r o o t ’ ;

69 word = char ( MatrixOfWords ( i , j ) ) ; 70

71 f o r a = 1 : wordLen

72 pathOfTree = [ pathOfTree ’ . ’ word ( a ) ] ;

73 end ; 74 75 M a t r i x O f F r e c u e n c i e s ( i , j ) = eval ( pathOfTree ) / p o s s i b i l i t i e s ; 76 end ; 77 end ; 78 79 M = M a t r i x O f F r e c u e n c i e s ; 80 81 % Mostramos a f i g u r a . . . para p o s t e r i o r a n a l i s e . . . 82 %f i g u r e ; 83 %imagesc (M) 84 %a x i s square ; 85 %a x i s o f f ; 86 % t i t l e ( wordLen ) ; 87 %c o l o r b a r ; 88 89 end

A.7 test

1% Genomic s i g n a t u r e u s i n g Chaos game r e p r e s e n t a t i o n o f f r e q u e n c i e s

2% 3% TEST 4

6% Subsequence o f t h e Archeoglobus f u l g i d u s genome (104160 bp ) 7 f i g u r e ;

FCUP Representação do Jogo do Caos (CGR) de sequências de ADN 75

8 f o r i = 2 : 2 : 8 9 subplot ( 1 , 4 , i / 2 ) 10 m a t r i x = f c g r 2 ( ’ a f u l g i d u s _ p a r t . f a s t a ’ , i ) ; 11 imagesc ( m a t r i x ) ; 12 axis square ; 13 axis o f f ; 14 t i t l e ( i ) ; 15 % c o l o r b a r ; 16 end ; 17 18%% Archeoglobus f u l g i d u s genome ( 2 . 2Mb) 19% f i g u r e ; 20% f o r i = 2 : 2 : 8 21% s u b p l o t ( 1 , 4 , i / 2 ) 22% m a t r i x = f c g r 2 ( ’ a f u l g i d u s . f a s t a ’ , i ) ; 23% imagesc ( m a t r i x ) ; 24% a x i s square ; 25% a x i s o f f ; 26% t i t l e ( i ) ; 27% % c o l o r b a r ; 28% end ;

Apêndice B

Tabelas das frequências

Estas tabelas são referentes às sequências de ADN analisadas em 5.

Onde S representa uma determinada 3-mer,NS o número de vezes que essa 3-mer surge na

sequência de ADN efS corresponde à frequência dada pela fórmula 2.7.

FCUP Representação do Jogo do Caos (CGR) de sequências de ADN 77

B.1 Cromossoma 21 de um Homo sapiens

Tabela B.1: 3-mers da sequência de ADN do cromossoma 21 de um Homo sapiens representada na figura 5.1 e sua respetiva abundância e frequência (2.7)

S

N

f

’AAA’

25907

0.047 ’AAC’

8970

0.016 ’AAG’

11730

0.021 ’AAT’

16551

0.030 ’ACA’

12621

0.023 ’ACC’

6032

0.011 ’ACG’

1178

0.002 ’ACT’

9102

0.016 ’AGA’

12831

0.023 ’AGC’

6792

0.012 ’AGG’

8162

0.015 ’AGT’

9100

0.016 ’ATA’

13867

0.025 ’ATC’

7927

0.014 ’ATG’

10841

0.019 ’ATT’

15675

0.028 ’CAA’

12239

0.022 ’CAC’

8344

0.015 ’CAG’

9849

0.018 ’CAT’

10598

0.019 ’CCA’

9411

0.017 ’CCC’

5348

0.010 ’CCG’

1052

0.002 ’CCT’

8378

0.015 ’CGA’

1002

0.002 ’CGC’

919

0.002 ’CGG’

951

0.002 ’CGT’

1089

0.002 ’CTA’

7778

0.014 ’CTC’

8476

0.015 ’CTG’

10059

0.018 ’CTT’

10532

0.019 ’GAA’

11843

0.021 ’GAC’

4718

0.008 ’GAG’

8118

0.015 ’GAT’

7429

0.013 S

N

f

’GCA’

7508

0.013 ’GCC’

5151

0.009 ’GCG’

830

0.001 ’GCT’

6636

0.012 ’GGA’

7272

0.013 ’GGC’

4872

0.009 ’GGG’

5211

0.009 ’GGT’

5554

0.010 ’GTA’

6621

0.012 ’GTC’

4569

0.008 ’GTG’

7601

0.014 ’GTT’

8495

0.015 ’TAA’

13169

0.024 ’TAC’

6901

0.012 ’TAG’

7188

0.013 ’TAT’

13732

0.025 ’TCA’

11490

0.021 ’TCC’

7658

0.014 ’TCG’

901

0.002 ’TCT’

12730

0.023 ’TGA’

11003

0.020 ’TGC’

7542

0.014 ’TGG’

8585

0.015 ’TGT’

11543

0.021 ’TTA’

12724

0.023 ’TTC’

11807

0.021 ’TTG’

10171

0.018 ’TTT

23292

0.042

78 FCUP

Representação do Jogo do Caos (CGR) de sequências de ADN

No documento Representação de sequências de DNA através do Jogo do Caos (CGR) (páginas 77-96)