• Nenhum resultado encontrado

4.3 Propriedades e Teoremas na Identificação de Sequências

4.3.1 Subgrupos simétricos de rótulos em Z 4

Ao estudar a Tabela 8, observa-se que os subgrupos de rótulos, identificados por

𝐴0, 𝐵0 e 𝐶0 (linhas da tabela), são obtidos pela multiplicação do rotulamento líder com

cada uma das unidades do anel Z4.

Assim, denote a sequência de nucleotídeos a ser analisada como 𝑛𝑢𝑐 e a sequência sobre Z4, obtida através do rótulo 𝑒𝑠, como 𝑛𝑢𝑐𝑒𝑠. Esta notação pode ser estendida para

qualquer rótulo. Por exemplo, 𝑛𝑢𝑐(2+𝑒𝑠)3 é a sequência sobre Z4, obtida a partir de 𝑛𝑢𝑐,

pelo uso do rótulo (2 + 𝑒𝑠)3, como se ilustra na Tabela 8. Veja que 𝑠, somente pode tomar

valores entre 1, 2 e 3, o qual representa os rótulos 𝐴, 𝐵 e 𝐶, respectivamente.

Afirmação 4.1. Usando a notação acima, se 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 ∈ 𝒞, então 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑘 ∈ 𝒞, onde

𝑘 = 𝑎 · 𝑖, 𝑎 ∈ (Z4)* e 𝒞 é um código linear.

Demonstração. Considere a sequência 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 na forma polinomial:

𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 = 𝑏0 + 𝑏1𝑥 + · · · + 𝑏𝑛−1𝑥

𝑛−1 ∈ 𝒞.

Sabe-se que a relação entre os rótulos 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 e 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑘 é uma multiplicação por 𝑎.

Assim, 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑘 pode ser escrito como:

𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑘=𝑎𝑏0+ 𝑎𝑏1𝑥 + · · · + 𝑎𝑏𝑛−1𝑥

𝑛−1

𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑘=𝑎(𝑏0+ 𝑏1𝑥 + · · · + 𝑏𝑛−1𝑥

𝑛−1).

Como o código 𝒞 é linear, segue que 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑘 ∈ 𝒞.

Afirmação 4.2. Usando a notação acima, se 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 ∈ 𝒞, onde 𝒞 é um código cíclico

gerado por um polinômio 𝑓 (𝑥) (𝒞 = ⟨𝑓 (𝑥)⟩) tal que 𝑓 (𝑥) ̸= 𝑥 − 1, então 𝑛𝑢𝑐(𝑘+𝑒𝑠)𝑗 ∈ 𝒞,

Demonstração. Considere a sequência 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 na forma polinomial:

𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 = 𝑏0 + 𝑏1𝑥 + · · · + 𝑏𝑛−1𝑥

𝑛−1 ∈ 𝒞.

Sabe-se que a relação entre os rótulos 𝑛𝑢𝑐(𝑖+𝑒𝑠)𝑗 e 𝑛𝑢𝑐(𝑘+𝑒𝑠)𝑗 é uma soma (𝑘 = 𝑎 + 𝑖).

Assim 𝑛𝑢𝑐(𝑘+𝑒𝑠)𝑖 pode ser escrito como:

𝑛𝑢𝑐(𝑘+𝑒𝑠)𝑗 =(𝑎 + 𝑏0) + (𝑎 + 𝑏1)𝑥 + · · · + (𝑎 + 𝑏𝑛−1)𝑥

𝑛−1

𝑛𝑢𝑐(𝑘+𝑒𝑠)𝑗 =(1 + 𝑥 + · · · + 𝑥

𝑛−1) + (𝑏

0+ 𝑏1𝑥 + · · · + 𝑏𝑛−1𝑥𝑛−1).

Como o código 𝒞 é cíclico, segue que 𝑓 (𝑥)|(𝑥𝑛 − 1) e que o polinômio 𝑥𝑛− 1 pode ser

sempre fatorado da seguinte maneira:

𝑥𝑛− 1 = (1 + 𝑥 + 𝑥2+ · · · + 𝑥𝑛−1)(𝑥 − 1).

Portanto, se 𝑓 (𝑥) for diferente de 𝑥 − 1, então:

𝑓 (𝑥)|(1 + 𝑥 + · · · + 𝑥𝑛−1) e (1 + 𝑥 + · · · + 𝑥𝑛−1) ∈ 𝒞 = ⟨𝑓 (𝑥)⟩.

Assim, 𝑛𝑢𝑐(𝑘+𝑒𝑠)𝑗 ∈ 𝒞.

Utilizando as Afirmações 4.1 e 4.2, prova-se a existência única dos rótulos 𝐴, 𝐵 e

𝐶 quando o polinômio gerador do código cíclico não é composto pelo polinômio 𝑥−1. Este

é o caso dos resultados apresentadas em (FARIA, 2011) e (ROCHA, 2010) e de traba- lhos recentes derivados destas resultados. Nestes trabalhos, somente foram considerados códigos nsBCH, nos quais o polinômio 𝑥 − 1 não é considerado.

A seguir, estuda-se a influência do polinômio 𝑥 − 1 na identificação de sequências de nucleotídeos e na subdivisão dos rótulos 𝐴, 𝐵 e 𝐶.

Ao realizar a divisão polinomial de 𝑛𝑢𝑐(𝑥) = 𝑏0+ 𝑏1𝑥 + · · · + 𝑏𝑛−1𝑥𝑛−1 com 𝑥 − 1

sobre o anel Z4, obtém-se: 𝑛𝑢𝑐(𝑥) = 𝑞(𝑥)(𝑥 − 1) + 𝑟(𝑥), onde o grau de 𝑟(𝑥) é menor que

1, isto é, 𝑟(𝑥) ∈ Z4. Ao aplicar o algoritmo da divisão, demonstra-se que:

𝑟(𝑥) =

𝑛−1

∑︁

𝑖=0

𝑏𝑖, onde as somas são feitas no anel Z4.

Portanto, o polinômio 𝑥 − 1 divide o polinômio 𝑛𝑢𝑐(𝑥) se, e somente se, 𝑟(𝑥) = 0, isto é, o polinômio 𝑥 − 1 faz parte do código cíclico 𝒞 que identifica a sequência de nucleotídeos 𝑛𝑢𝑐(𝑥) sobre algum determinado rotulamento se, e somente se, a soma de todos os coeficientes sobre Z4 é zero.

Analisando o polinômio 𝑥 − 1, obtêm-se as quatro subdivisões para cada um dos rótulos 𝐴, 𝐵 e 𝐶.

Afirmação 4.3. Considere uma sequência de nucleotídeos, a qual é representada através

dos seguintes quatro rótulos: 𝑒𝑠, (𝑒𝑠+ 1), (𝑒𝑠+ 2) e (𝑒𝑠+ 3). Assim, obtêm-se quatro po-

linômios sobre Z4: 𝑛𝑢𝑐(𝑥)𝑒𝑠, 𝑛𝑢𝑐(𝑥)(𝑒𝑠+1), 𝑛𝑢𝑐(𝑥)(𝑒𝑠+2) e 𝑛𝑢𝑐(𝑥)(𝑒𝑠+3). Somente um único

polinômio dentre os polinômios 𝑛𝑢𝑐(𝑥)𝑒𝑠, 𝑛𝑢𝑐(𝑥)(𝑒𝑠+1), 𝑛𝑢𝑐(𝑥)(𝑒𝑠+2) e 𝑛𝑢𝑐(𝑥)(𝑒𝑠+3) é divi-

sível pelo polinômio 𝑥 − 1.

Demonstração. Considerando 𝑛𝑢𝑐(𝑥)𝑒𝑠 = 𝑏0+ 𝑏1𝑥 + · · · + 𝑏𝑛−1𝑥 𝑛−1; obtêm-se: ∙ 𝑛𝑢𝑐(𝑥)(𝑒𝑠+1) = (𝑏0+ 1) + (𝑏1+ 1)𝑥 + · · · + (𝑏𝑛−1+ 1)𝑥 𝑛−1 ∙ 𝑛𝑢𝑐(𝑥)(𝑒𝑠+2) = (𝑏0+ 2) + (𝑏1+ 2)𝑥 + · · · + (𝑏𝑛−1+ 2)𝑥 𝑛−1 ∙ 𝑛𝑢𝑐(𝑥)(𝑒𝑠+3) = (𝑏0+ 3) + (𝑏1+ 3)𝑥 + · · · + (𝑏𝑛−1+ 3)𝑥 𝑛−1.

Ao computar o resto da divisão com cada um dos polinômios por 𝑥 − 1, denotados por

𝑟(𝑥)𝑒𝑠, 𝑟(𝑥)(𝑒𝑠+1), 𝑟(𝑥)(𝑒𝑠+2) e 𝑟(𝑥)(𝑒𝑠+3), obtêm-se: ∙ 𝑟(𝑥)(𝑒𝑠+0) = 𝑏0+ 𝑏1+ · · · + 𝑏𝑛−1 = ∑︀𝑛−1 𝑙=0 𝑏𝑙 = (𝜎)4 ∙ 𝑟(𝑥)(𝑒𝑠+1) = (𝑏0+ 1) + (𝑏1+ 1) + · · · + (𝑏𝑛−1+ 1) = ∑︀𝑛−1 𝑙=0 (𝑏𝑙+ 1) = (𝜎 + 1 · 𝑛)4 ∙ 𝑟(𝑥)(𝑒𝑠+2) = (𝑏0+ 2) + (𝑏1+ 2) + · · · + (𝑏𝑛−1+ 2) = ∑︀𝑛−1 𝑙=0 (𝑏𝑙+ 2) = (𝜎 + 2 · 𝑛)4 ∙ 𝑟(𝑥)(𝑒𝑠+3) = (𝑏0+ 3) + (𝑏1+ 3) + · · · + (𝑏𝑛−1+ 3) = ∑︀𝑛−1 𝑙=0 (𝑏𝑙+ 3) = (𝜎 + 3 · 𝑛)4. Para que Z4[𝑥]

⟨𝑥𝑛−1⟩ seja um anel de ideais principais e para que 𝑥𝑛−1 seja fatorado unicamente

por polinômios minimais é necessário que 𝑛 seja ímpar, que são características importantes para o projeto de códigos cíclicos, em especial para a decodificação. Assim, 𝑛 pode ser expressado como 𝑛 = 2𝑞 + 1, para algum 𝑞 inteiro positivo. Logo: (𝑛)4 = 1 ou (𝑛)4 = 3.

Assim,

∙ 𝑟(𝑥)(𝑒𝑠+0) = (𝜎)4

∙ 𝑟(𝑥)(𝑒𝑠+1) = (𝜎)4+ 1 ou 𝑟(𝑥)(𝑒𝑠+1) = (𝜎)4+ 3

∙ 𝑟(𝑥)(𝑒𝑠+2) = (𝜎)4+ 2 ou 𝑟(𝑥)(𝑒𝑠+2) = (𝜎)4+ 2

∙ 𝑟(𝑥)(𝑒𝑠+3) = (𝜎)4+ 3 ou 𝑟(𝑥)(𝑒𝑠+3) = (𝜎)4+ 1.

Observe que: (𝜎)4 = 0 ou (𝜎)4 = 1 ou (𝜎)4 = 2 ou (𝜎)4 = 3, mas é um valor único (as

conjunções são exclusivas). Portanto, se (𝜎)4 = 0 então somente 𝑟(𝑥)(𝑒𝑠+0) = 0, se (𝜎)4 = 1

então somente 𝑟(𝑥)(𝑒𝑠+3) = 0, se (𝜎)4 = 2 então somente 𝑟(𝑥)(𝑒𝑠+2) = 0 e se (𝜎)4 = 3 então

De acordo com as Afirmações 4.1, 4.2 e 4.3, demonstra-se que quando usados códigos cíclicos para representar sequências de nucleotídeos, como por exemplo: DNA, mRNA, microRNA, etc, existem 12 possíveis subclasses de Rótulos; os quais são: 𝐴1, 𝐴2,

𝐴3, 𝐴4, 𝐵1, 𝐵2, 𝐵3, 𝐵4, 𝐶1, 𝐶2, 𝐶3 e 𝐶4.

As subclasses denotadas por 𝐴, 𝐵 e 𝐶, representam os rotulamentos Z4-linear,

Z2× Z2-linear e Klein-linear, respectivamente; os quais não parecem estar relacionados

entre si. Para cada uma das subclasses 𝐴, 𝐵 e 𝐶, existe uma subdivisão em 4 subclasses: 1, 2, 3 e 4; a qual indica para qual dos 4 possíveis rotulamentos o polinômio obtido, após o mapeamento para Z4, é divisível pelo polinômio 𝑥 − 1, i.e., para qual dos 4 possíveis

rotulamentos a paridade é zero. Assim, observa-se que existe uma relação entre os rótulos

𝐴1, 𝐴2, 𝐴3 e 𝐴4 e o algoritmo que será mostrado na Seção 4.4. A relação é que os

polinômios sobre Z4 obtidos após o mapeamento através dos Rótulos 𝐴1, 𝐴2, 𝐴3 e 𝐴4 são

divididos pelos mesmos polinômios minimais e o polinômio 𝑥−1 sempre divide unicamente um desses polinômios, i.e., somente um desses polinômios tem paridade zero. Este fato também ocorre para os Rótulos 𝐵1, 𝐵2, 𝐵3, 𝐵4, 𝐶1, 𝐶2, 𝐶3 e 𝐶4.

Como mencionado anteriormente, quando os códigos cíclicos “narrow sense” BCH são usados, o polinômio 𝑥 − 1 não é considerado pois as subclasses 𝐴1, 𝐴2, 𝐴3 e 𝐴4

levam aos mesmos resultados e podem ser agrupados num único rótulo: Rótulo 𝐴. Isto foi observado nos trabalhos (FARIA, 2011) e (ROCHA, 2010) mas não foi dado nenhuma explicação. Lembre que o mesmo fenômeno ocorre para os Rótulos 𝐵1, 𝐵2, 𝐵3 e 𝐵4, e

para os Rótulos 𝐶1, 𝐶2, 𝐶3 e 𝐶4.

Por último, nos trabalhos (FARIA, 2011) e (ROCHA, 2010) descobriu-se que os re- sultados obtidos ao estudar uma sequência de nucleotídeos na direção 5’-3’ são os mesmos obtidos ao estudar a sequência complementar, denotada por 3’-5’, na direção 5’-3’ (anti- paralela). Este fato é relevante quando são estudadas as sequências DNA, onde o processo de replicação é importante. A seguir explica-se brevemente a maneira em que a informa- ção é armazenada no DNA e colocam-se algumas definições que permitirão entender a afirmação que formaliza a descoberta:

∙ Uma sequência DNA é formada por duas sequências complementares de nucleo- tídeos, denotadas por: 𝑛𝑢𝑐(𝑥) (5’-3’) e 𝑐𝑛𝑢𝑐(𝑥) (3’-5’). As sequências são comple-

mentares porque 𝑐𝑛𝑢𝑐(𝑥) é obtida quando sobre 𝑛𝑢𝑐(𝑥) se aplicam as seguintes substituições biológicas: 𝐴 ↦→ 𝑈 , 𝑈 ↦→ 𝐴, 𝐺 ↦→ 𝐶 e 𝐶 ↦→ 𝐺

∙ Considera-se que as sequências 𝑛𝑢𝑐(𝑥) e 𝑐𝑛𝑢𝑐(𝑥) armazenam informação pois as sequências 𝑛𝑢𝑐(𝑥) e 𝑥𝑛−1𝑐𝑛𝑢𝑐(𝑥−1) (sequência 𝑐𝑛𝑢𝑐(𝑥) lida na direção oposta ou

direção 5’-3’) são usadas indiferentemente nos processos de replicação e transcrição.

Afirmação 4.4. No alfabeto Z4, se uma dada sequência de nucleotídeos lida na direção 5’-

do Rótulo 𝐴𝑖 (ou 𝐵𝑖 ou 𝐶𝑖), então a sequência antiparalela de nucleotídeos, denotada

por 𝑥𝑛−1𝑐𝑛𝑢𝑐(𝑥−1) = rev(𝑐𝑛𝑢𝑐(𝑥))1, pertence ao código 𝒞

2 = ⟨rev(𝑔(𝑥))⟩ com parâmetros

(𝑛, 𝑘, 𝑑) através do Rótulo 𝐴(𝑖+2) (ou 𝐵(𝑖+2) ou 𝐶(𝑖+2)).

Demonstração. Considere a sequência de nucleotídeos 𝑛𝑢𝑐(𝑥) e utilize o rotulamento 𝑒𝑖,

que pertence ao Rótulo 𝐴0 ou 𝐵0 ou 𝐶0, para mapeá-la numa sequência sobre Z4, deno-

tada como 𝑛𝑢𝑐𝑒𝑖(𝑥) ∈ Z

𝑛

4. Observe, nas Tabelas 7 e 8, que 𝑐𝑛𝑢𝑐𝑒𝑖+2(𝑥) = 𝑛𝑢𝑐(𝑒𝑖+2). Assim,

estudar a sequência 5’-3’ pelo rotulamento 𝑒𝑖 é equivalente a ter estudado a sequên-

cia 𝑐𝑛𝑢𝑐(𝑒𝑖+2) ∈ Z

𝑛

4. Portanto os mesmos códigos BCH são obtidos, i.e., mesmo polinô-

mio gerador 𝑔(𝑥). Sejam {𝛼𝑖, . . . , 𝛼𝑑−2} as raízes de 𝑔(𝑥), as quais são também raízes

de 𝑐𝑛𝑢𝑐(𝑒𝑖+2)(𝑥). Assim, as raízes de rev(𝑔(𝑥)) são {𝛼

−𝑖, . . . , 𝛼−(𝑑−2)}, as quais são tam-

bém raízes de rev(𝑐𝑛𝑢𝑐(𝑒𝑖+2)(𝑥)). Portanto, rev(𝑐𝑛𝑢𝑐(𝑒𝑖+2)(𝑥)) ∈ 𝒞2 e 𝒞2 tem parâmetros

(𝑛, 𝑘, 𝑑).