• Nenhum resultado encontrado

Arquitetura biol´ogica do genoma do plasm´ıdeo Lactococcus lactis pcl 21

3.3 Similaridades entre o Sistema Biol´ogico e Redes Locais de Computadores

3.3.2 Arquitetura biol´ogica do genoma do plasm´ıdeo Lactococcus lactis pcl 21

Os plasm´ıdeos (DNA extra-cromossomais), Figura 3.41 parte (b), s˜ao mol´eculas circulares duplas de DNA capazes de se reproduzir independentemente do DNA cromossˆomico parte (a). Ocorrem geralmente em bact´erias e por vezes tamb´em em organismos eucari´oticos unicelulares (ex: o anel de 2-micra em Saccharomyces cerevisiae) e c´elulas de eucariotas superiores.

Bactéria: Lactococcus lactis

Lactococcus lactis plasmid pcl 2.1 Genomic

(a) (b)

Figura 3.41: Ilustra¸c˜ao de uma bact´eria com plasm´ıdeos no seu interior. (a) DNA cro- mossˆomico (b) Plam´ıdeos.

Os plasm´ıdeos podem ser pequenos com baixo peso molecular, ou grandes, com alto peso molecular; quanto maior o peso molecular do plasm´ıdeo, menor ser´a o n´umero de c´opias poss´ıveis de serem realizadas (cerca de trˆes c´opias por c´elulas); j´a os plasm´ıdeos de baixo peso molecular podem realizar at´e cem c´opias por c´elula. Eles replicam-se de forma independente do DNA cromossˆomico. Sua replica¸c˜ao acontece a cada divis˜ao celular de forma a conservar pelo menos uma c´opia em cada c´elula-filha, [26] e [27].

A presen¸ca dos plasm´ıdeos e sua transferˆencia entre as bact´erias proporcionam a estes microorganismos uma transferˆencia de caracteres essenciais `a sua sobrevida. Citam-se como exemplos os plam´ıdeos, respons´aveis pela resistˆencia antimicrobiana, os plasm´ıdeos res- pons´aveis pela degrada¸c˜ao de metais pesados, ou mesmo aqueles que codificam as toxinas bacterianas. Nos dias atuais, a transferˆencia de resistˆencia aos antibi´oticos entre as bact´erias tem causado s´erios problemas no meio hospitalar, gerando microorganismos multirresistentes; a cada dia, surgem novos antibi´oticos para combater estes microorganismos, o que gera novas expectativas quanto a atividade e poss´ıvel desenvolvimento de resistˆencia. Esta resistˆencia ´e transferida entre as bact´erias pelos plam´ıdeos, levando informa¸c˜oes gen´eticas e novas carac- ter´ısticas `as bact´erias receptoras, [63].

A seguir, mostramos o quadro biol´ogico do genoma do plasm´ıdeo Lactococcus lactis a partir da sequˆencia em nucleot´ıdos postada no NCBI, como mostrado na Figura 3.42.

Primeiramente, identificamos todas as partes desse genoma que est˜ao ilustradas por cores diferentes. Em seguida, relacionamos cada uma dessas partes a um setor do CD, e, ent˜ao, montamos o quadro biol´ogico, denominado arquitetura biol´ogica do genoma do plasm´ıdeo

cctacatttttttattgctctgctatgattgtttatcgatagttttttatacagataagcgtgcgacg cttgctctttccgaggaggaagtcatgctgacaagcacggcagagcctccgcatgaaatgctctcaat gaaattgccggcggagcttttttgagcttgtgccacttgcgaaaaaaacaagaacaaaagagacagga aactgtctttttttgcttgcttggggattggggcaacgccccaaaaataaaaagaatcgtctgaaacg aggaacaaactaaaatgtaaattttagttgttaccgagtggaagatgaatactttttaacctatgtgt atacacacatagtaagctcgctataatactttataacgtttttatttacatgagcaaagcgagttttt ccaacacgtttaatctaaaatattggcaatttataccatgattttcatggtatgtaagtgcgccctta ggaaaataatttgaatatatttcagattttcaatctgactgctcctgtcatcgagcagaccgatgagg aaaacaaaaagaggactaaacaaaaaagtttagtcctctttttgttttgaatagttctagaacgtcat attttgcgttttaagcaattttgactaactaggcggggatttttacttagaaattattcaaaacgtct gtaaagtgcttaaaatcgtttctaagagcttttagcgtttatttcgtttagttatcggcataatcgtt aaaacaggcgttatcgtagcggaaaagcccttgagcgtagcgtggctttgcagtgaagatgttgtctg ttagattatgaaagccgataactgaatgaaataataagcgtagcgccccttatttcggtcggaggagg ctcaagggagtttgagggaatgaaattccctcatggttttaaaattgcttgcaattttgccgagcggt agcgctggaaaatttttgaaaaaaatttggaatttggaaaaatgggggggtactacgaccccccccta tgtggtaatttggtaacttggtcaaaattgatactaatatatattaaaacagcacaaaacagaatctt atgatataataagatatactgaaatttgaaggagtaaaaaatggcagaagagaaaaaaagagttttgc taactttgtcgttggacaaagcagaagaattagaaactatatcaaaagaaatgggaattagtaaatct gctcttgttagtttatggattgcggaaaattctagaaaataaaaaaagagccacggcgaatggctcta gtatatttacggttaggaatattatagcatatgacagaaaaaaaactagaaaaaaatgacccagttag aaactggagttgggttgtttatccagagtctgctcctgaaaattggagaacattgttagacgaaactg gagaaaaatggattgagagtccgttgcatgataaagatattaacgaaacaacaaacgaaccgaaaaag gcacattggcatataataatttctttttcaaataaaaaaagttataagcaagtattaaaaatttctga aatgttaaatgcaccagagcctgtaaaaacaaaaaatttacaagggtcagttcaatatttgtggcaca gaaacaatcctgaaaaatatcagtataataaaagcgatgttgttgctcataatgggtttaaatataga caatatttaacagatattggagttgatactgattctattttacaagaagttatagaatggataaaaga aactggatgttctgaatatagagatttagtcgattatgcagtatcagaacgtttcgatgattggtttc ctacagtcagaagtcaaaccatatttttaaattcttatttacgctcaaatcgtcatagtcagaaaaaa tataatccagaaacaggagaggtgttatgaaagttgaaattatagctagtgtttttagtgaaaaatca gttcagaaaaaagtaaataattttattgattatttaaatgacaataattttgaagtattggaagttca atatagg

Lactococcus lactis - Plasmid DNA – pCL2. 1, complete sequence - GI number: 118213250

Figura 3.42: Sequˆencia genˆomica em nucleot´ıdeos.

Lactococcus lactis, como mostra a Figura 3.43.

As partes dos nucleot´ıdos que est˜ao em preto na sequˆencia genˆomica (Figura 3.42) e em branco no quadro biol´ogico (Figura 3.43) s˜ao sequˆencias cuja funcionalidade biol´ogica ainda ´e desconhecida. Por´em, j´a s˜ao conhecidos o in´ıcio e o fim dessas sequˆencias - que s˜ao as regi˜oes: L1 com 715 nucleot´ıdeos, L3 com 104 nucleot´ıdeos, L5 com 12 nucleot´ıdeos e L9 com 113

nucleot´ıdeos. A regi˜ao L2 com 168 nucleot´ıdeos ´e identificada pela origem da replica¸c˜ao de

uma fita do DNA, a regi˜ao L4 com 129 nucleot´ıdeos ´e identificada pela origem da replica¸c˜ao

da fita dupla do DNA, a regi˜ao L6 com 138 nucleot´ıdeos ´e identificada pelo gene “Cob G”, a

regi˜ao L7 com 76 nucleot´ıdeos ´e identificada pelo RNA e, a regi˜ao L8 com 612 nucleot´ıdeos

´e identificada gene “Rep B”.

Note que a leitura das sequˆencias nas regi˜oes identificadas, exceto a regi˜ao L8, ´e realizada

no sentido positivo 5’ para 3’ e, a leitura da sequˆencia identificada na regi˜ao L8 ´e realizada

no sentido negativo 3’ para 5’.

Outra importante observa¸c˜ao ´e com rela¸c˜ao `as partes identificadas na cor cinza. Em ambas as figuras, observe que essas partes fazem parte de duas regi˜oes ao mesmo tempo. Por exem- plo, o nucleot´ıdeo a pertence tanto a sequˆencia de nucleot´ıdeo da regi˜ao L6 quanto a sequˆencia

de nucleot´ıdeo da regi˜ao L7. O mesmo aconte com a sequˆencia atgacagaaaaaaaacta, que ´e

Lactococcus lactis plasmid pcl 2.1 Genomic 2047nt L1 = (715nt) L 2 = (168nt) L 3 = (104nt) L 4 = (129nt) L 5 = (12nt) L 6 = (138nt) L 7 = (76nt) L 8 = (612nt) L 9= (113nt) Origem eplicação fita únicar Origem eplicação fita duplar Gene “Cop G’’ Gene “Rep B’’ L1 L2 L3 L4 L5 L6 L7 L8 L9 RNA Orig. ep. fita únicaR Orig. ep.

fita duplaR “Cop G”Gene “Rep B”Gene

2047nt

RNA

Figura 3.43: Genoma Plasm´ıdeo com 2047 nucleot´ıdeos de comprimento.

Devido a relevˆancia dos plam´ıdeos, anteriormente citada, julgamos de suma importˆancia a sua an´alise via CCEs, que mostraremos no Cap´ıtulo 5, bem como, a constata¸c˜ao da arqui- tetura biol´ogica do genoma do plasm´ıdeo Lactococcus lactis.

Algoritmo para a Identifica¸c˜ao de

Sequˆencias de DNA

Como o objetivo deste trabalho ´e mostrar a existˆencia de CCEs em sequˆencias de DNA com diferentes comprimentos (21, 51, 63, 93, 255, 511, 1023 e 2047 nucleot´ıdeos) e com ca- racter´ısticas biol´ogicas distintas (sequˆencias de direcionamento, sequˆencia de direcionamento amb´ıgua, enzima, sinal interno, hormˆonio, ´ıntron, DNA repetitivo, prote´ınas e mi RNA), ser´a necess´ario descrever a constru¸c˜ao de c´odigos G-linearidade, tais como: os c´odigos BCH sobre o corpo GF (4r) e, os c´odigos BCH sobre o anel Z

4 atrav´es das suas extens˜oes de

Galois, respectivamente.

Os c´odigos BCH sobre GF (4r) possuem parˆametros (n, k, d

H), e s˜ao capazes de reproduzir

sequˆencias de DNA com comprimentos iguais ou subm´ultiplos de n = (4r− 1). J´a os c´odigos

BCH sobre Z4 possuem os mesmos parˆametros, mas s˜ao capazes de reproduzir sequˆencias de

DNA com comprimentos iguais ou subm´ultiplos de n = (2r− 1). Os parˆametros do c´odigo

BCH, tanto para o corpo GF (4r) quanto para o anel Z

4, s˜ao denotados da seguinte maneira:

n = comprimento das palavras-c´odigo (comprimento das sequˆencias de DNA); k = dimens˜ao do c´odigo (comprimento da sequˆencia de informa¸c˜ao respons´avel pela gera¸c˜ao da sequˆencia de DNA) e dH = distˆancia m´ınima do c´odigo (o menor n´umero de posi¸c˜oes em que quaisquer

duas palavras-c´odigo diferem).

Durante a constru¸c˜ao desses c´odigos, mostramos o procedimento para a reprodu¸c˜ao de sequˆencias de DNA com 1 e com 2 nucleot´ıdeos diferindo da sequˆencia original (NCBI ). Todas as sequˆencias de DNA utilizadas neste trabalho est˜ao postadas no NCBI atrav´es do n´umero do GI, independentemente da distˆancia m´ınima dH dos c´odigos. Assim, as sequˆencias de di-

recionamento que foram identificadas e reproduzidas atrav´es de c´odigos G-linearidade (BCH primitivos sobre an´eis diferindo da sequˆencia original em 1 nucleot´ıdeo) em [20], ser˜ao anali- sadas atrav´es dos c´odigos G-linearidade (BCH primitivos sobre an´eis diferindo da sequˆencia

original em 2 nucleot´ıdeos) e, atrav´es dos c´odigos G-linearidade (BCH primitivos sobre cor- pos). Os conceitos e propriedades essenciais utilizados na constru¸c˜ao destes c´odigos foram descritos no Cap´ıtulo 2.

Antes de iniciarmos a constru¸c˜ao dos c´odigos anteriormente mencionados, estabelecemos algumas defini¸c˜oes com o intuito de facilitar a leitura deste trabalho, da seguinte maneira:

• Denotamos por palavra-c´odigo a sequˆencia de d´ıgitos a = (a1, a2, · · · , an), onde ai

s ∈ GF (4) ou Z4;

• Denotamos por Seq a sequˆencia de DNA do NCBI b = (b1, b2, · · · , bn), onde ai

s ∈ GF (4) ou Z4;

• Denotamos por padr˜oes de erros a diferen¸ca entre a palavra-c´odigo e a sequˆencia de DNA do NCBI D(a, b), ou seja,

a) Quando D(a, b) = 0, onde a = b (todos os componentes s˜ao iguais); b) Quando D(a, b) = 1, onde a 6= b (difere em uma ´unica componente); c) Quando D(a, b) = 2, onde a 6= b (diferem em duas componentes).

Este cap´ıtulo est´a organizado da seguinte forma. Na Se¸c˜ao 4.1, apresentamos o algoritmo de identifica¸c˜ao de sequˆencias de DNA sobre corpos e suas extens˜oes de Galois. Um exemplo da constru¸c˜ao de c´odigo G-linearidade (BCH sobre corpo) pode ser visto na Subse¸c˜ao 4.1.1. J´a na Se¸c˜ao 4.2, apresentamos o algoritmo de identifica¸c˜ao de sequˆencias de DNA sobre o anel Z4 atrav´es de extens˜oes de Galois de graus 6, 8 e 10. As sequˆencias com comprimen-

tos iguais a 2r − 1 ser˜ao analisadas atrav´es dos c´odigos G-linearidade (BCH primiti-

vos): (63, k, dH) sobre GR(4, 6), (255, k, dH) sobre GR(4, 8) e (1023, k, dH) sobre GR(4, 10)

(Subse¸c˜ao 4.2.1), e as sequˆencias cujos comprimentos s˜ao subm´ultiplos de 2r− 1 e divis´ıveis

pela ordem dos elementos de GR∗(4, r) ser˜ao analisadas atrav´es dos c´odigos G-linearidade

(BCH n˜ao primitivos): (21, k, dH) sobre GR(4, 6), (51, k, dH) sobre GR(4, 8) e (93, k, dH)

sobre GR(4, 10) (Subse¸c˜ao 4.2.2). Com isso, verificaremos se as sequˆencias de DNA mencio- nadas na Tabela 1.1, do Cap´ıtulo 3, apresentam uma estrutura matem´atica de corpo e ou de anel, e, portanto, podem ser identificadas e reproduzidas atrav´es dos c´odigos G-linearidade. Os exemplos da reprodu¸c˜ao de algumas sequˆencias de DNA atrav´es dos c´odigos G-linearidade ser˜ao mostrados no decorrer deste cap´ıtulo. Os demais exemplos ser˜ao mostrados no Cap´ıtulo 5 e no Apˆendice B.

4.1

Algoritmo de Gera¸c˜ao de C´odigos BCH sobre GF (4

r

)

O algoritmo para a identifica¸c˜ao de sequˆencias de DNA tendo como base a constru¸c˜ao de c´odigos G-linearidade (BCH sobre GF (4r)), passo-a-passo, ´e descrito da seguinte maneira:

Passo 1 - Especificar a estrutura matem´atica e o alfabeto do c´odigo; Passo 2 - Determinar a extens˜ao de Galois;

Passo 3 - Determinar todos os polinˆomios primitivos p(x), relacionados `a extens˜ao de Galois;

Passo 4 - Determinar a extens˜ao do corpo GF (4);

Passo 5 - Determinar o grupo das unidades para o c´odigo BCH primitivo, quando o comprimento da sequˆencia de DNA for igual a n = (4r− 1),

ou, determinar o subgrupo das unidades para o c´odigo BCH n˜ao primitivo, quando o comprimento da sequˆencia de DNA for um subm´ultiplo de n = (4r− 1);

Passo 6 - Determinar o polinˆomio gerador da matriz G, g(x): 1o) C´alculo das ra´ızes dos polinˆomios minimais;

2o) C´alculo dos polinˆomios minimais M

i(x), para todo i = 1, 2, · · · , n − 1;

3o) C´alculo dos polinˆomios geradores para todos os valores de t

relacionados `a distˆancia de Hamming dH ≥ 2t + 1;

Passo 7 - Determinar o polinˆomio gerador da matriz H, h(x); Passo 8 - Determinar a matriz G e a sua transposta GT;

Passo 9 - Determinar a matriz H e a sua transposta HT;

Passo 10 - Rotular a sequˆencia de DNA utilizando o Passo 1;

Passo 11 - Verificar se a sequˆencia de DNA ´e palavra-c´odigo de acordo com os padr˜oes de erros estabelecidos: D(a, b) = 0, D(a, b) = 1 e D(a, b) = 2; Passo 12 - Comparar todas as palavras-c´odigo armazenadas no Passo 11 com a

sequˆencia de DNA do NCBI e mostrar onde os erros ocorreram; Passo 13 - Voltar para o Passo 6 e determinar outro g(x);

Passo 14 - Repetir os Passos 7 ao Passo 11 para o g(x) obtido no Passo 13, at´e que se esgotem todas as possibilidades de g(x);

Passo 15 - Voltar para o Passo 3 e escolher outro p(x), e, ent˜ao, repetir os Passos 4 ao 14 at´e esgotar todos os p(x) do Passo 3;

Passo 16 - Fim.

A seguir, apresentamos a constru¸c˜ao de c´odigos BCH sobre GF (4r) de ordem n = (4r−1),

onde r ´e o grau da extens˜ao de Galois. Em [66], mostramos que algumas sequˆencias de DNA foram identificadas e reproduzidas atrav´es dos c´odigos G-linearidade (BCH sobre GF (4r))

diferindo em 1 nucleot´ıdeo das sequˆencias do NCBI. No caso das sequˆencias da fita simples de DNA, as bases do alfabeto do c´odigo gen´etico (adenina (A), citosina (C), guanina (G) e timina (T) ou uracila(U)) s˜ao usadas para construir o c´odigo BCH sobre GF (4r), relacionando-as

ao alfabeto 4-´ario, conforme detalhado no Passo 1 do algoritmo.

No caso da dupla h´elice de DNA, as bases complementares do alfabeto do c´odigo genˆomico ´e que s˜ao usadas para construir o c´odigo (AT, CG, GC, TA). Sendo assim, consideramos q = pk, logo GF (q) = GF (4). Note, no Passo 5 do algoritmo, que as sequˆencias de DNA

com comprimentos iguais a n dever˜ao ser analisadas atrav´es dos c´odigos BCH primitivos e as sequˆencias de DNA cujos comprimentos s˜ao subm´ultiplos de n dever˜ao ser analisadas atrav´es dos c´odigos BCH n˜ao primitivos. A seguir, descrevemos a constru¸c˜ao do c´odigo BCH primitivo sobre GF (4r) apenas para o comprimento n = 63. O procedimento adotado

para a constru¸c˜ao dos demais comprimentos (255, 511, 1023 e 2047) ´e an´alogo ao desenvolvido no exemplo (63, k, dH) sobre GF (4r). Vale lembrar que o procedimento usado para a iden-

tifica¸c˜ao da dupla h´elice do DNA nos comprimentos citados tamb´em ´e an´alogo ao exemplo desenvolvido a seguir.