• Nenhum resultado encontrado

5.4 κ-entropia de bloco para sequˆ encias nucleot´ıdicas contidas no cromossomo Y

5.4.3 κ-Entropia de bloco para s = 4

Durante uma varredura da sequˆencia polinucleot´ıdica do cromossomo Y utilizando blocos de tamanho s = 4, realizamos os seguintes procedimentos: das 256 possibilidades de blocos que podem ser encontrados durante uma varredura com quatro nucleot´ıdeos to- mados 4 a 4, consideramos em nossa contagem apenas os blocos AAAA, AAAT , AAAG, AAAC, AAT T , AAT G, AAT C, AAGG, AAGC, AACC, AT T T , AT T G, AT T C, AT GG, AT GC, AT CC, AGGG, AGGC, AGCC, ACCC, T T T T , T T T G, T T T C, T T GG, T T GC, T T CC, T GGG, T GGC, T GCC, T CCC, GGGG, GGGC, GGCC, GCCC e CCCC. As- sim, quaiquer outros blocos (de tamanho s = 4) que vierem a ser encontrados durante uma varredura da sequˆencia de interesse, este ser´a enquadrado em uma dessas possibi- lidades. Por exemplo, se durante uma varredura nos depararmos com o bloco T CGT , este ser´a contado como T T GC, o mesmo racioc´ınio se extendendo a blocos como T AAA, AT AA, T AT T , T T AT , etc§.

´

E importante salientar que essa escolha ´e totalmente arbitr´aria e n˜ao possui nenhum tipo de rela¸c˜ao com as energias apresentadas na tabela 4.1. Nosso foco aqui reside apenas na aplica¸c˜ao da equa¸c˜ao (5.2) e posterior an´alise do resultado apresentado no ˆambito da teoria de informa¸c˜ao.

Feitas essas considera¸c˜oes, obtemos as v´arias componentes da fun¸c˜ao de probabilidade ρijkl, com i, j, k, l = A, T, G, C para cada uma das 35 possibilidades atrav´es da contagem

direta dos blocos relevantes e, em seguida, utilizamos a equa¸c˜ao (5.2) para determinar a entropia de informa¸c˜ao condizente com o parˆametro s em quest˜ao. A s´ıntese da aplica¸c˜ao desse procedimento ´e exibida da figura 5.14. Interessante notar que quando s = 4, a entropia de informa¸c˜ao possui um comportamento um tanto diferente aos aqueles apre- sentados quando s = 1, 2. Embora ainda exista uma regi˜ao de oscila¸c˜ao, seguida por um crescimento linear em intervaloes distintos de L (figuras 5.15 e 5.16), a regi˜ao de sa- tura¸c˜ao ´e menos presente nesse caso, sumindo `a medida que κ aumenta, adquirindo um comportamento mais pr´oximo do linear.

5.4 κ-entropia de bloco para sequˆencias nucleot´ıdicas contidas no cromossomo Y 83 space 0 , 0 0 , 4 0 , 8 1 , 2 1 , 6 2 , 0 2 , 4 2 , 8 0 , 0 0 0 , 2 5 0 , 5 0 0 , 7 5 1 , 0 0 κ = 4,9 κ = 4,8 κ = 4,7 κ = 4,6 κ = 4,5 κ = 4,4 κ = 4,3 κ = 4,2 κ = 4,1

S

{κ }

(

s

=

4

,

L

) [

10

9

]

L ( n B ) [ 1 0

7

]

Figura 5.14: Para s = 4, o comportamento da entropia com o tamanho L da sequˆencia

nucleot´ıdica para valores de κ compreendidos entre 4, 1 e 4, 9. ´E interessante notar que, dife-

rentemente de uma an´alise utilizando blocos s = 1, 2, a entropia perde o car´ater de satura¸c˜ao `a medida que κ aumenta.

5.4 κ-entropia de bloco para sequˆencias nucleot´ıdicas contidas no cromossomo Y 84 0 , 0 0 , 4 0 , 8 1 , 2 1 , 6 2 , 0 2 , 4 2 , 8 0 , 1 3 0 , 2 6 0 , 3 9 0 , 5 2 0 , 6 5

S

{κ }

(s

=

4

,

L

)

[1

0

9

]

L ( n B ) [ 1 0

7

]

C r o m o s s o m o Y ( H o m o s a p i e n s ) C r e s c i m e n t o m o n o t ô n i c o

Figura 5.15: Entropia de informa¸c˜ao contra L, tamanho da sequˆencia, para s = 4 e κ = 4, 6.

0 , 0 0 , 2 0 , 4 0 , 6 0 , 8 1 , 0 0 , 0 0 , 5 1 , 0 1 , 5 2 , 0 2 , 5 3 , 0 3 , 5 0 , 0 0 0 , 0 5 0 , 1 0 0 , 1 5 0 , 2 0 0 , 0 0 , 5 1 , 0 1 , 5 2 , 0 2 , 5 3 , 0 3 , 5 S{κ } (s = 4 , L ) [1 0 9 ] L ( n B ) [ 1 0 6] L ( n B ) [ 1 0 6]

Figura 5.16: Entropia de informa¸c˜ao contra L, com s = 4 e κ = 4, 6 numa regi˜ao compreendida

entre 1 < L < 1, 0× 106 nB. A regi˜ao mostrada nessas figuras correspondem `aquela antes da entropia crescer suavemente com L (figura 5.15).

5.5 Conclus˜oes 85

5.5

Conclus˜oes

Independentemente do tamanho do bloco utilizado na varredura de uma sequˆencia polinucleot´ıdica e apesar de conhecermos o comportamento qualitativo das diversas com- ponentes da fun¸c˜ao de probabilidade, ainda ´e um desafio tentar descrever essas com- ponentes de forma quantitativa como fizemos no caso das sequˆencias generalizadas de Cantor (cap´ıtulo 3): especificamente, para o caso da sequˆencia nucleot´ıdica estudada (cromossomo Y), n˜ao temos equa¸c˜oes anal´ıticas an´alogas a (3.3) e (3.4). Isso ´e reflexo da extrema complexidade da maneira como os diversos nucleot´ıdeos encontram-se dispostos na sequˆencia, ou seja, n˜ao temos acesso `as regras de itera¸c˜ao que permitem obter uma sequˆencia demasiadamente grande de DNA atrav´es de uma sequˆencia inicial.

Apesar dessa desvantagem aparente, observamos alguns fatos pertinentes e que ser˜ao descritos a seguir. Primeiramente, ´e fato marcante que a entropia de informa¸c˜ao S{κ} admite um perfil geral que independe dos valores de κ. Para blocos de tamanho s = 1, 2, 4, observamos que S{κ} possui trˆes comportamentos distintos em rela¸c˜ao ao tamanho L da sequˆencia nucleot´ıdica cerrada no cromossomo Y: (i) fortes oscila¸c˜oes numa regi˜ao onde L < 2, 5× 106, (ii) crescimento monotˆonico para 2, 5 × 106 < L < 5, 5 × 106 e (iii) satura¸c˜ao quando L > 5, 5× 106. Vemos, no entanto, que essa ´ultima caracter´ıstica desaparece quando s = 4 `a medida que κ aumenta (figura 5.14).

A respeito do papel fundamental que o parˆametro deformador κ desempenha dentro desta an´alise, ou qualquer outra que venha a ser feito posteriormente, nos perguntamos se ´e poss´ıvel, frente a uma gama de representa¸c˜oes da entropia em rela¸c˜ao ao tamanho do sistema (um para cada κ), escolhermos uma, e somente uma dessas representa¸c˜oes, que nos permita caracterizar por completo uma sequˆencia polinucleot´ıdica em diferentes contextos de an´alise (diferentes s). Responder essa quest˜ao ´e um tanto excitante e ao mesmo tempo muito pretenciosa da nossa parte, pelo menos, frente a uma das maiores realiza¸c˜oes da ciˆencia (iniciado com Gregor Mendel, Ernst Haeckel e Friedrich Miescher [27]): o “DNA”, ou mais ainda, o conhecimento de que todas as coisas vivas, com seus v´arios graus de complexidade, s˜ao ordenadas, reguladas e codificadas dentro dessa mol´ecula. Esta e outras quest˜oes, assim como os principais resultados apresentados nesse cap´ıtulo, s˜ao t˜ao relevantes que culminaram na publica¸c˜ao do artigo A κ-statistical analysis of the

5.5 Conclus˜oes 86

Y-chromosome [82].

Direcionando agora nossa aten¸c˜ao `a regi˜ao onde a entropia apresenta, para todos os valores de s considerados, comportamento linear. Como foi mostrado, essa regi˜ao est´a compreendida no intervalo onde 2, 5×106 < L < 5, 5×106. Assim, para cada valor de κ, a entropia possui nessa regi˜ao uma dependˆencia geral em L tal que S{κ}(L) = α + βL, onde α e β s˜ao constantes reais. Para s = 1, 2, 4, temos S{κ}(L = s) = 0 e, assim, α = −βs. Portanto, a entropia no intervalo anterior pode ser escrita como S{κ}(L) = β(L− s). Na regi˜ao de interesse, L s: consequentemente, S{κ}(L)≈ βL.

Neste momento, estabelecemos que das in´umeras retas da forma βL que possam re- presentar S{κ} naquela regi˜ao, adotaremos a reta onde β = 1 como sendo a que descreve de maneira ´unica o comportamento da entropia na regi˜ao tratada¶. A simplicidade dessa escolha, nos permite estabelecer uma fronteira entre duas classes de valores de κ: se κS=L

for o valor de κ no qual a igualdade entre a entropia e o tamanho da sequˆencia na regi˜ao mencionada ´e observada, ent˜ao κS=Ldivide as fam´ılias de curvas de S{κ}×L em duas clas-

ses: uma em que a entropia da regi˜ao linear cresce muito lentamente com L (κ < κS=L)

e outra onde a entropia nessa mesma regi˜ao cresce rapidamente com L (κ > κS=L).

Usando dessas considera¸c˜oes, na regi˜ao onde 2, 5×106 < L < 5, 5×106 nB e, portanto, no intervalo onde a entropia apresenta comportamento linear com L, verificamos que para s = 1, κS=L = 9, 35± 0, 03; com s = 2 esse valor ´e de κS=L = 6, 80± 0, 06 (blocos AT e

T A tomados como iguais). No entanto, quando s = 2, mas AT e T A (assim como outros) s˜ao tomados como diferentes, κS=L = 5, 01 ± 0, 03, mas tomados dentro do intervalo

2, 5× 106 < L < 5, 0× 106 nB.

Prosseguindo, para s = 4 e dentro do que foi mencionado na subse¸c˜ao 5.4.3, κS=L =

3, 88± 0, 01, mas dentro do intervalo 2, 5 × 106 < L < 5, 5× 106 nB. Ent˜ao, ´e fato que quando s aumenta, o valor de κS=L diminui dentro das situa¸c˜oes expostas nas subse¸c˜oes

antecedentes. Interessante observar tamb´em que quando abordamos s = 2 sob os dois aspectos analisados anteriormente (considerando AT e T A como iguais ou diferentes, por exemplo), h´a uma diminui¸c˜ao do valor de κS=L. Finalmente, talvez o aspecto mais

marcante e sutil da an´alise do comportamento da regi˜ao linear, ´e que o crit´erio de escolha de κ atrav´es da condi¸c˜ao S = L implica que a entropia na regi˜ao linear ´e independente

5.5 Conclus˜oes 87

CAP´ITULO

6

Conclus˜oes e Pesperctivas

De maneira an´aloga ao realizado nos cap´ıtulos 3 e 5, os m´etodos e medidas apresen- tados podem ser estendidos sem muitas dificuldades ao estudo de quaisquer sequˆencias provenientes de regras de intera¸c˜ao associadas a fractais, assim como quaisquer sequˆencias polinucleot´ıdicas referentes aos 22 pares de cromossomos da esp´ecie em quest˜ao.

Tamb´em, seria interessante realizar (mais tarde) um estudo comparativo entre os re- sultados apresentados nas subse¸c˜oes 5.4.1, 5.4.2, 5.4.3 com as energias que estabilizam as estrutura do DNA (se¸c˜ao 4.3). Para dar uma ideia de como isso pode ser feito, considere por exemplo as intera¸c˜oes do tipo ponte de hidrogˆenio que foram discutidas no cap´ıtulo 4. Se estabelecermos nosso pensamento no ˆambito energ´etico e complementar, ou seja, do ponto de vista das regras de Chargaff [34]), vemos numa primeira an´alise que para uma varredura em blocos de tamanho s = 1, a estabilidade na sequˆencia diminui `a medida que L aumenta (figura 5.2): como visto no cap´ıtulo 4, subse¸c˜ao 4.3.1, pares de bases A− T s˜ao menos est´aveis (dupla ponte de hidrogˆenio) do que pares G − C (tripla ponte de hidrogˆenio) onde a energia decorrente desse tipo de intera¸c˜ao nessa configura¸c˜ao de pares ´e cerca de 2, 5 vezes maior que a primeira. Obviamente, estamos afirmando isso do ponto de vista de um modelo em que toda a sequˆencia fosse preenchida com bases G− C ou, no m´ınimo, o contr´ario do que foi observado acima. De maneira an´alogo, podemos

estender essas ideais e investigar poss´ıveis conex˜oes entre as intera¸c˜oes de pilha (subse¸c˜ao 4.3.2 ) e as an´alises realizadas quando de uma varredura em blocos de tamanho s = 2. Esse tipo de an´alise ´e bastante empolgante, pois nos permitiria obter subs´ıdios reais para uma abordagem mais complexa sustentada numa Teoria de Ensembles e, consequente- mente, termodinˆamica, fomentada no formalismo generalizado de Kaniadakis: a pr´opria abordagem atrav´es de ensembles constitui um problema em aberto nesse formalismo.

Aprofundando mais ainda nossos estudos de uma sequˆencia cromossˆomica, podemos explorar uma dimens˜ao mais pr´atica e de amplo interesse relacionado a essas sequˆencias, a saber, como a disposi¸c˜ao dos nucleot´ıdeos est˜ao organizados de modo a armazenar dados [83]. Em alguma medida, acreditamos que esse objetivo pode ser alcan¸cado atrav´es da compreens˜ao dos processos que descrevem, por exemplo, a distribui¸c˜ao dos tamanhos dos genes contidos numa sequˆencia cromossˆomica, j´a que ´e sobre esses que recai grande parte das funcionalidades gen´eticas de uma esp´ecie.

APˆENDICE

A

Fundamentos da κ-´algebra

A.1

Fun¸c˜ao Geradora

Apresentaremos a seguir a estrutura completa da denominada κ-´algebra que funda- menta a se¸c˜ao 2.5, apresentada originalmente em [1] e [4]. Come¸caremos essa tarefa, intro- duzindo as propriedades relacionadas a fun¸c˜ao gκ(x): a fun¸c˜ao geradora da κ-deforma¸c˜ao.

gκ(x) ser´a qualquer fun¸c˜ao real que observa as seguintes propriedades:

(i) gκ(x)∈ R; (ii) gκ(−x) = −gκ(x); (iii) dxd [gκ(x)] > 0; (iv) gκ(±∞) = ±∞; (v) g(x)≈ x quando x → 0. 90

A.1 Fun¸c˜ao Geradora 91

Atrav´es da fun¸c˜ao geradora, podemos construir uma outra fun¸c˜ao real x{κ} que de- pende tanto da vari´avel x quanto de um parˆametro κ, denominado de parˆametro defor- mador. Arbitrariamente, define-se a fun¸c˜ao x{κ} como

x{κ} 1 κsinh

−1[g

κ(κx)] (A.1)

A fun¸c˜ao x{κ} herda todas as propriedades da fun¸c˜ao gκ(x) e possui outras adicionais,

ou seja, (i) x{κ} ∈ R; (ii) (−x){κ}=−x{κ}; (iii) dxd x{κ} > 0; (iv) (±∞){κ} =±∞ (v) x{κ}≈ x, para x → 0 e, portanto, 0{κ} = 0; (vi) x{κ} ≈ x, para κ → 0 e, portanto, x{0} = x; (vii) x{κ} = x{−κ}

Se expressarmos a fun¸c˜ao inversa de x{κ} por x{κ}, podemos usar o fato de que (x{κ}){κ} = (x{κ}){κ} = x, e representar essa fun¸c˜ao inversa como

x{κ} = 1 κg

−1(sinh[κx]). (A.2)

O prop´osito principal por tr´as das propriedades e defini¸c˜oes anteriormente apresenta- das, reside, num primeiro momento, em estabelecer regras de grupo condizentes com a estrutura alg´ebrica associado a um grupo Abeliano∗. Feito isso, podemos redefinir certas fun¸c˜oes e opera¸c˜oes ordin´arias como, por exemplo, a soma e o produto entre elementos de um grupo. Por ´ultimo, e mais importante, usar essas redefini¸c˜oes para representar ana- liticamente certas quantidades f´ısicas usadas para parametrizar as propriedades de um

Num contexto de fun¸c˜oes, qualquer conjunto que satisfa¸ca as propriedades associativa, fechamento,

A.1 Fun¸c˜ao Geradora 92

sistema particular. Isso, claro, ter´a como consequˆencia a generaliza¸c˜ao de quantidades tais como a entropia. Continuando, discriminamos algumas propriedades de grupo asso- ciados a defini¸c˜ao em (A.2). Com ela, define-se uma regra de composi¸c˜ao como se segue

Proposi¸c˜ao 1: A κ-soma ´e definida atrav´es de

(x⊕ y)κ = x. {κ}+ y{κ}. (A.3) Quando κ→ 0, A soma em (A.3) reduz-se a uma soma ordin´aria. Pode ser mostrado ainda que a regra de composi¸c˜ao expressa na equa¸c˜ao (A.3) ´e associativa, possui elemento neutro 0, admite−x como elemento sim´etrico. Sendo assim, a κ-soma forma um conjunto Abeliano.

Proposi¸c˜ao 2: O κ-produto ´e definido atrav´es de

(x⊗ y)κ = x. {κ}.y{κ}. (A.4) An´alogo `a κ-soma, o κ-produto reduz-se ao produto ordin´ario x.y quando κ → 0 e, tamb´em, forma um grupo Abelino, sendo, portanto, associativo, comutativo, admitindo 1{κ} como elemento neutro e hx1

{κ}

i{κ}

como elemento inverso.

Proposi¸c˜ao 3: A propriedade distributiva ´e, em rela¸c˜ao `a κ-soma, verificada, ou seja,,

z⊗(xκ ⊕ y) = (zκ ⊗ x)κ ⊕(zκ ⊗ y).κ (A.5) Preposi¸c˜ao 4: A fun¸c˜ao x{κ} possui as seguintes propriedades:

i) x{κ}⊕ yκ {κ} = (x + y){κ}

A.1 Fun¸c˜ao Geradora 93

Proposi¸c˜ao 5: A fun¸c˜ao x{κ} e sua inversa x{κ} obedecem as seguintes regras de escalas: i) x0 {κ0} = zx{κ} ii) x0{κ 0 } = zx{κ}, (A.7) onde x0 = zx e κ0 = κz. Proposi¸c˜ao 6: A propriedade z.(x⊕ y) = (z.x)κ ⊕(z.y),κ (A.8) ´ e observada.

Utilizando essas proposi¸c˜oes, construiremos duas fun¸c˜oes que ser˜ao de grande utilidade nos desenvolvimentos subsequentes. Estas fun¸c˜oes s˜ao o que denominamos de exponen- cial e logar´ıtmica κ-deformadas, representadas respectivamente por exp{κ} e ln{κ}. Como veremos, s˜ao fun¸c˜oes que retomam as formas ordin´arias quando κ → 0. Para fazer isso, definimos a κ-diferencial como

dx{κ} = d{κ}x= lim.

z→xx κ

z. (A.9)

Assim, a κ-diferencial de uma fun¸c˜ao f = f (x) ´e expressa por

df (x)

dx{κ} = limz→x[f (x)− f(z)]

h

x zκ i−1, (A.10)

A.1 Fun¸c˜ao Geradora 94

Com isso em m˜aos, definimos a exp{κ} como

d dx{κ}



exp{κ}(x)= exp{κ}(x). (A.11) Usando (A.11), ´e poss´ıvel mostrar que a forma alg´ebrica da κ-exponencial fica

exp{κ}(x) =n1 + [g(κx)]21/2+ g(κx)o1/κ. (A.12) A fun¸c˜ao κ-exponencial possui v´arias propriedades interessantes. Pode ser visto de (A.12), por exemplo, que exp{κ}(x).exp{κ}(−x) = 1, ou seja, a κ-exponencial ´e uma fun¸c˜ao sim´etrica de seu argumento. Al´em dessa, temos tamb´em que

[exp{κ}(x)]r = exp{κ/r}(rx) (A.13)

exp{κ}(x).exp{κ}(y) = exp{κ}(x⊕ y)κ (A.14) Atrav´es da equa¸c˜ao (A.12), podemos ainda expressar a fun¸c˜ao inversa da κ-exponencial como ln{κ}(x) = 1 κg −1  xκ− x−κ 2  , (A.15)

onde ln{κ}(x) e g−1 s˜ao as fun¸c˜oes inversas de exp{κ}(x) e g, respectivamente. As equa¸c˜oes (A.12) e (A.15) definem uma classe de fun¸c˜oes exponenciais e logar´ıtmicas deformadas que dependem da fun¸c˜ao geradora. Al´em de depender do parˆametro deformador κ, elas podem depender de outros parˆametros via fun¸c˜ao geradora g. Fun¸c˜oes que s˜ao deforma¸c˜oes das exponenciais e logar´ıtmica ordin´arias s˜ao bastante comuns na literatura f´ısica. Exemplos disso podem ser encontradas em [84, 85] que possuem um parˆametro de deforma¸c˜ao cada e em [86], que possui dois parˆametros de deforma¸c˜ao. Tamb´em, usando os postulados aqui apresentados, podemos encontrar express˜oes trigonom´etricas deformadas, construir outros grupos com regras de adi¸c˜ao, multiplica¸c˜ao e propriedades particulares.

Documentos relacionados