• Nenhum resultado encontrado

Estudo via estatística de Kaniadakis da distribuição dos tamanhos dos cromossomos humanos

N/A
N/A
Protected

Academic year: 2021

Share "Estudo via estatística de Kaniadakis da distribuição dos tamanhos dos cromossomos humanos"

Copied!
90
0
0

Texto

(1)

CENTRO DE CIˆ

ENCIAS EXATAS E DA TERRA

DEPARTAMENTO DE F´ISICA TE ´

ORICA E EXPERIMENTAL

PROGRAMA DE P ´

OS-GRADUA ¸

C ˜

AO EM F´ISICA

Estudo Via Estat´ıstica de Kaniadakis da Distribui¸

ao dos

Tamanhos dos Cromossomos Humanos

Polyanna do Vale Guedes

Natal - RN

Maio de 2018

(2)

Estudo via Estat´ıstica de Kaniadakis da Distribui¸

ao

dos Tamanhos dos Cromossomos Humanos

Disserta¸c˜ao de Mestrado apresentada ao Programa de P´ os-Gradua¸c˜ao em F´ısica do Departamento de F´ısica Te´orica e Expe-rimental da Universidade Federal do Rio Grande do Norte como requisito para a obten¸c˜ao do grau de Mestra em F´ısica.

Orientador: Prof. Dr. Dory H´elio Aires de Lima Anselmo Coorientador: Prof. Dr. Raimundo Silva Junior

Natal - RN

Maio de 2018

(3)

Cataloga¸c˜ao de Publica¸c˜ao na Fonte. UFRN - Biblioteca Central Zila Mamede

Guedes, Polyanna do Vale.

Estudo via estat´ıstica de Kaniadakis da distribui¸c˜ao dos tamanhos dos cromossomos humanos / Polyanna do Vale Guedes. -2018.

90 f. : il.

Disserta¸c˜ao (mestrado) - Universidade Federal do Rio Grande do Norte, Centro de Ciˆencias Exatas e da Terra, Programa de P´os -Gradua¸c˜ao em F´ısica. Natal, RN, 2018.

Orientador: Prof. Dr. Dory H´elio Aires de Lima Anselmo Coorientador: Prof. Dr. Raimundo Silva Junior

1. Mecˆanica estat´ıstica - Disserta¸c˜ao. 2. Entropias generalizadas - Disserta¸c˜ao. 3. DNA - Disserta¸c˜ao. I. Anselmo, Dory H´elio Aires de Lima. II. Silva Junior, Raimundo. III. T´ıtulo.

(4)
(5)

Agradecimentos

O meu mais genu´ıno agradecimento a todos que fizeram parte desse crescimento pessoal e acadˆemico, em especial:

`

A Deus, pela f´e, for¸ca e desejo de superar os obst´aculos.

Ao Prof. Dory H´elio Aires de Lima Anselmo pela orienta¸c˜ao nesta pesquisa. Agrade¸co por todos os ensinamentos e toda paciˆencia durante esses anos de trabalho, e tamb´em pelas palavras de motiva¸c˜ao.

Ao Prof. Raimundo Silva Junior por todas as ideias, colabora¸c˜ao e apoio na realiza¸c˜ao desta disserta¸c˜ao.

`

A minha fam´ılia pelo sentimento de amor, afeto, pela compreens˜ao e pelos ensina-mento, em especial `a minha m˜ae Francisca do Vale Silva e minha tia Ana Duarte Silva, pela educa¸c˜ao, amparo, dedica¸c˜ao, e pelo exemplo de perseveran¸ca que tomo como exem-plo di´ario de vida. Agrade¸co a Deus por tˆe-las em minha vida. Obrigada por tudo!

Ao colega Marcone Oliveira da Costa pela paciˆencia, por todas as discuss˜oes que abriram possibilidades para seguir nesse trabalho, pelos feitos no meio computacional que foram de extrema importˆancia.

Aos professores do DFTE que contribu´ıram imensamente na minha forma¸c˜ao acadˆ e-mica.

Aos colegas de p´os-gradua¸c˜ao pelas conversas, incentivos e horas de estudos. Aos funcion´arios do DFTE pelo trabalho bem realizado.

Ao CNPQ pelo apoio financeiro concedido, pois a pesquisa necessita de investimento para ser efetivamente realizada.

(6)

Resumo

Nesta disserta¸c˜ao, investigamos o DNA n˜ao codificante dos 24 cromossomos humanos, atrav´es das estat´ısticas generalizadas. Esse estudo, realizado com essas recentes gene-raliza¸c˜oes da Teoria Padr˜ao da Mecˆanica Estat´ıstica, tem como importante ferramenta analisar as propriedades estat´ısticas das sequˆencias genˆomicas e com isso, obter a informa-¸c˜ao sobre as distribui¸c˜oes de tamanhos. Em trabalhos j´a realizados sobre o DNA humano n˜ao codificante ´e relatado a utiliza¸c˜ao de distribui¸c˜oes q-exponenciais do formalismo ge-neralizado de Tsallis atrav´es da maximiza¸c˜ao da entropia n˜ao-extensiva, para estudar a distribui¸c˜ao de tamanho dessas sequˆencias. Nesta disserta¸c˜ao, ampliamos esses estudos, atrav´es da utiliza¸c˜ao da κ-estat´ıstica oriunda do formalismo generalizado de Kaniadakis. A saber, ´e interessante uma sucinta compara¸c˜ao entre as duas an´alises. Apresentamos o valor do parˆametro de deforma¸c˜ao κ, no formalismo de Kaniadakis, e do ´ındice entr´opico q no formalismo de Tsallis, que descrevem as distribui¸c˜oes de tamanho para todos os cromossomos do DNA humano n˜ao codificante.

(7)

Abstract

In this dissertation, we investigated the non-coding DNA of the 24 human chromosomes, through the generalized statistics.This study, carried out with the recent generalizations of the Standard Theory of Statistical Mechanics, has been more important and analyzed as the statistical properties of the genetic sequences, in order to obtain information about the size distributions. In works already carried out on non-coding human DNA the use of q-exponential distributions of Tsallis generalized formalism through the maximization of non-extensive entropy is reported to study the size distribution of these sequences. In this dissertation, we broaden these studies through the use of κ-statistics originating from Kaniadakis generalized formalism. Namely, a brief comparison between the two analyzes is interesting. We present the values of the deformation parameters κ, in Kaniadakis formalism, and the entropic index q in the Tsallis formalism, which describe the size distributions for all the chromosomes of the non-coding human DNA.

(8)

Lista de Figuras

FIGURA 2.1 – O nucleot´ıdeo ´e formado por uma base, um grupo fosfato e um a¸c´ u-car. A estrutura formada por uma base e um a¸c´ucar ´e chamado nucleos´ıdeo, onde o a¸c´ucar componente do DNA ´e uma desoxirri-bose e do RNA ´e a ribose (Extra´ıdo e modificado de (PRAY, 2008) ). . . 20 FIGURA 2.2 – Estrutura de uma forquilha de replica¸c˜ao de DNA. (Extra´ıdo de

(SANTOS, 2010 - Blog)) . . . 21 FIGURA 2.3 – O dogma central da biologia molecular : DNA, RNA e prote´ına

(Extra´ıdo e modificado de (WIKIBOOKS, 2015)). . . 23 FIGURA 2.4 – O Splicing e a remo¸c˜ao das sequˆencias n˜ao codificadoras, os ´ıntrons.

(Extra´ıdo e modificado de (GUTTMACHER; COLLINS, 2002)). . . 24 FIGURA 2.5 – Todos os c´odons e seus respectivos amino´acidos. O tripleto AUG ´e

um c´odon de in´ıcio que codifica a Metionina (Extra´ıdo de ( EDUCA-¸

C ˜AO, 2011)). . . 25 FIGURA 2.6 – Estrutura qu´ımica dos marcadores de nucleot´ıdeos. O

dioxinucleo-t´ıdeo e o dideoxinucleodioxinucleo-t´ıdeo s˜ao praticamente iguais. A modifica¸c˜ao ocorre no grupo hidroxila no carbono 3’, ausente no dideoxinucleo-t´ıdeo (ddNTP) (Extra´ıdo e modificado de (RYE et al., 2017)). . . 27 FIGURA 3.1 – Gr´afico que mostra o comportamento da exp{κ}(x) para diversos

valores de κ. . . 33 FIGURA 3.2 – Gr´afico que mostra o comportamento da exp{κ}(−x) para diversos

valores de κ. . . 33 FIGURA 3.3 – Gr´afico que mostra o comportamento do κ-logaritmo para diversos

valores de κ. Extra´ıdo de (KANIADAKIS, 2013) . . . 34 FIGURA 3.4 – A q-exponencial para alguns valores de q. Extra´ıdo de: (SOUZA, 2016) 41

(9)

FIGURA 4.1 – Distribui¸c˜ao de tamanho para as prote´ınas do Cromossomo 1. (COSTA, 2016) . . . 47 FIGURA 4.2 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 1. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 51 FIGURA 4.3 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 2. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 52 FIGURA 4.4 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 3. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 53 FIGURA 4.5 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 4. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 54 FIGURA 4.6 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 5. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 55 FIGURA 4.7 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 6. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 56 FIGURA 4.8 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 7. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 57 FIGURA 4.9 – Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 8. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 58 FIGURA 4.10 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 9. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 59 FIGURA 4.11 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 10. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 60 FIGURA 4.12 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 11. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 61

(10)

FIGURA 4.13 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do Cromos-somo 12. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 62 FIGURA 4.14 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 13. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 63 FIGURA 4.15 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 14. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 64 FIGURA 4.16 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 15. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 65 FIGURA 4.17 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 16. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 66 FIGURA 4.18 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 17. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 67 FIGURA 4.19 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 18. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 68 FIGURA 4.20 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 19. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 69 FIGURA 4.21 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 20. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 70 FIGURA 4.22 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 21. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 71 FIGURA 4.23 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo 22. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 72

(11)

FIGURA 4.24 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do Cromos-somo X. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 73 FIGURA 4.25 –Distribui¸c˜ao de tamanho para o DNA n˜ao codificante do

Cromos-somo Y. Os ajustes para a κ-exponencial (vermelho) e para a q-exponencial (azul). . . 74

(12)

Lista de Tabelas

TABELA 3.1 – Entropia SBG e Sq com S1 = SBG (Extra´ıdo e modificado de (

TSAL-LIS, 2009)) . . . 40

TABELA 3.2 – Restri¸c˜oes sobre as igualdades. (Extra´ıdo e modificado de (BORGES, 2004)) . . . 44

(13)

Lista de Abreviaturas e Siglas

ADN Acido Desoxirribonucleico´ DNA Deoxyribonucleic Acid RNA Ribonucleic Acid RNAm RNA mensageiro

KIP Kinetical Interaction Principle ECC C´odigo Corretor de Erro MEP Mecˆanica Estat´ıstica Padr˜ao BG Boltzmann-Gibbs

(14)

Lista de S´ımbolos

κ Parˆametro deformador de kaniadakis q ´Indice entr´opico de Tsallis

φ Fun¸c˜ao Distribui¸c˜ao de Probabilidade Acumulada kB Constante de Boltzmann SBG Entropia de Boltzmann-Gibbs SS Entropia de Shannon Sq Entropia de Tsallis Sκ Entropia de Kaniadakis e{κ} κ-exponencial ln{κ} κ-logaritmo Γ Fun¸c˜ao Gamma

(15)

Sum´

ario

1

Introdu¸

ao

. . . 14

2

Uma breve Introdu¸

ao ao DNA

. . . 17

2.1 DNA : De Friedrich Miescher a Watson e Crick . . . 17

2.2 Principais Mecanismos Gen´eticos . . . 19

2.3 O C´odigo Gen´etico . . . 24

2.4 Projeto Genoma Humano . . . 25

3

Mecˆ

anica Estat´ıstica Generalizada

. . . 29

3.1 Mecˆanica Estat´ıstica Padr˜ao . . . 29

3.2 Estat´ıstica de Kaniadakis . . . 31

3.2.1 Fun¸c˜oes κ-exponencial e κ-logaritmo . . . 32

3.2.2 A κ-entropia . . . 35

3.2.3 A κ-´algebra . . . 37

3.3 Estat´ıstica de Tsallis . . . 39

4

Modelo Generalizado e Resultados

. . . 45

4.1 Fun¸c˜oes distribui¸c˜oes de probabilidades . . . 45

4.1.1 Fun¸c˜ao κ-distribui¸c˜ao de probabilidade . . . 45

4.1.2 Fun¸c˜ao q-distribui¸c˜ao de probabilidade . . . 48

4.1.3 Ajuste estat´ıstico e Resultados . . . 50

5

Conclus˜

oes

. . . 76

(16)

Apˆ

endice A – Solu¸

ao Anal´ıtica da Integral de

(17)

1 Introdu¸

ao

Nas ´ultimas d´ecadas do s´eculo XX e at´e hoje, parte da comunidade dos F´ısicos passou a se interessar por uma classe de sistemas, conhecidos como sistema complexos, cujas partes interagem de forma n˜ao-linear. Uma das propriedades marcantes de tais sistemas ´e a presen¸ca de leis de escala ou leis de potˆencia. Estas s˜ao observadas em diversos contextos, da biologia at´e o comportamento de bolsas de valores (GLERIA et al., 2004).

Uma maneira de estudar e compreender as leis que regem esses fenˆomenos, v´arios pes-quisadores utilizam um conjunto de informa¸c˜oes arquivadas em bancos de dados de acesso p´ublico dispon´ıveis na internet. Para constru¸c˜ao do estudo dessa disserta¸c˜ao, utilizamos a plataforma de dados Ensembl (ENSEMBL, 1999–2017) para ter acesso `a sequˆencia do DNA humano.

O estudo acerca da mol´ecula de DNA desenvolveu-se largamente desde sua primeira detec¸c˜ao por Friedrich Miescher em 1869, um jovem m´edico su´ı¸co, que teve contribui¸c˜oes memor´aveis ao estudo do DNA. Em 1871, publicou possivelmente um dos primeiros artigos que descrevem o DNA (“nucleina”), juntamente com artigos de Felix Hoppe-Seyler e P. Pl´osz (DAHM, 2005).

Ap´os suas contribui¸c˜oes, v´arias pesquisas em diferentes ´areas do conhecimento foram desenvolvidas afim de compreender o funcionamento, a estrutura espacial, a composi¸c˜ao qu´ımica e entender mais sobre esta mol´ecula. Podemos citar1 as contribui¸c˜oes de Walther

Flemming, um bi´ologo alem˜ao que foi pioneiro no estudo da mitose2 (PAWELETZ, 2001); o

f´ısico Erwin Schr¨odinger que publicou o livro intitulado “O que ´e a vida? O aspecto f´ısico da c´elula viva”3 (SCHR ¨ODINGER, 1997) que aborda a teoria da hereditariedade do ponto de vista de um f´ısico; a qu´ımica f´ısica Rosalind Franklin que contribuiu expressivamente para o descobrimento da estrutura da dupla h´elice (ELKIN, 2003); o biof´ısico Francis Crick pela descoberta da estrutura do DNA (LAWRENCE, 2016) e o zoologista James Watson

descobridor tamb´em da estrutura molecular do DNA e autor do livro “DNA: o segredo da vida” (WATSON; BERRY, 2005).

1As pesquisas envolveram muito mais cientistas, que n˜ao ser˜ao mencionados aqui, mas que

contribu´ı-ram excepcionalmente.

2Divis˜ao celular em eucariotos.

(18)

Todas as pesquisas envolvidas e ainda em curso, afim de elucidar o segredo acerca do DNA, revelam o esfor¸co e a contribui¸c˜ao de renomados cientistas na mais diversas ´areas indicando assim o car´ater interdisciplinar no estudo do DNA. H´a recentes trabalhos que podemos destacar: o m´etodo de sequenciamento do DNA usando grafeno (SCHNEIDER et al., 2010), o armazenamento de infoma¸c˜ao digital no DNA (ERLICH; ZIELINSKI, 2017) e a distribui¸c˜ao de tamanho para prote´ınas (COSTA, 2016).

A motiva¸c˜ao para esta disserta¸c˜ao teve como base um artigo intitulado “Nonextensive statistical approach to non-coding human DNA” de autoria do Oikonomou (OIKONOMOU et al., 2008) onde este analisa o DNA n˜ao codificante de todos os cromossomos humanos usando a distribui¸c˜ao escort derivada da maximiza¸c˜ao da entropia generalizada de Tsallis. ´

E demonstrado que a distribui¸c˜ao de tamanho n˜ao codificante apresenta caracter´ısticas de lei de potˆencia que s˜ao caracterizadas pelo mesmo valor do parˆametro n˜ao extensivo q ∼ 2.2 (µ ∼ 0.8). Conscientes da importˆancia, fizemos um estudo embasado neste artigo, propondo a utiliza¸c˜ao de outra estat´ıstica generalizada, a de G. Kaniadakis, afim de encontrar a distribui¸c˜ao de tamanho para o DNA n˜ao codificante e com isso os valores do parˆametro deformador, conhecido pela letra grega κ, no formalismo de Kaniadakis, para todos os cromossomos humanos.

Em 2001 G. Kaniadakis (KANIADAKIS, 2001b; KANIADAKIS, 2001a) desenvolveu um formalismo que ´e uma generaliza¸c˜ao da Mecˆanica Estat´ıstica de Boltzmann-Gibbs. A teoria ´e direcionada pelo Princ´ıpio de Intera¸c˜ao Cin´etica ou KIP4, subjacente a uma dinˆ a-mica n˜ao-linear em sistemas de part´ıculas e usada para descrever sua evolu¸c˜ao temporal. Em seus mais diversos artigos, Kaniadakis descreve o arcabou¸co e toda a matem´atica, estrutura alg´ebrica e estat´ıstica do formalismo generalizado. Podemos citar, como apli-ca¸c˜oes, (KANIADAKIS, 2002;KANIADAKIS, 2005) que mostram a κ-estat´ıstica no contexto da relatividade especial, a teoria matem´atica gerada pela κ-exponencial deformada ( KA-NIADAKIS, 2013), uma aplica¸c˜ao da κ-distribui¸c˜ao generalizada para uma distribui¸c˜ao de tamanho de renda e riqueza (CLEMENTI et al., 2016) e a solu¸c˜ao da lei de composi¸c˜ao da κ-entropia (KANIADAKIS et al., 2017).

Em 1988 Tsallis formulou a ent˜ao conhecida q-estat´ıstica, no seu artigo “Possible gene-ralization of Boltzmann-Gibbs statistics” (TSALLIS, 1988), utilizando os fundamentos dos conceitos dos multifractais e sua estrutura. Postulou uma nova forma para a entropia, a q-entropia, que ´e caracterizada por um parˆametro conhecido como ´ındice entr´opico q, sendo portanto uma generaliza¸c˜ao da Mecˆanica Estat´ıstica de Boltzmann-Gibbs e retor-nando a esta, quando q → 1. Nos mais variados campos, pesquisadores dedicaram (e dedicam) o olhar ao estudo dessa nova formula¸c˜ao e uma lista consider´avel de trabalhos foram obtidos. Para exemplificar, citamos alguns trabalhos usando a q-estat´ıstica como, por exemplo, o estudo num´erico 2-dimensional, preservando ´area, do mapa da web (RUIZ

(19)

et al., 2017), uma nova representa¸c˜ao da fun¸c˜ao delta de Dirac em d dimens˜oes (SICURO; TSALLIS, 2017), aplicada a turbulˆencia MHD5 (GONZ ´ALEZ-CASANOVA et al., 2018).

Nesse trabalho, os cap´ıtulos estar˜ao dispostos da seguinte forma:

No cap´ıtulo 2, apresentaremos uma breve introdu¸c˜ao ao DNA, destacando os principais cientistas por tr´as da descoberta da dupla h´elice e do c´odigo gen´etico, assim como o grande projeto genoma humano.

No cap´ıtulo 3, apresentaremos as duas estat´ısticas generalizadas, Tsallis e Kaniadakis, enfatizaremos suas principais fun¸c˜oes modificadas e um esbo¸co sutil da q-´algebra e da κ-´algebra.

No cap´ıtulo 4, apresentaremos os resultados da an´alise estat´ıstica e os c´alculos da distribui¸c˜ao de probabilidade acumulada nos formalismos de Tsallis e Kaniadakis.

No cap´ıtulo 5, apresentaremos as conclus˜oes e as poss´ıveis extens˜oes.

(20)

2 Uma breve Introdu¸

ao ao DNA

2.1

DNA : De Friedrich Miescher a Watson e Crick

Ao longo deste cap´ıtulo, introduzimos um pouco da hist´oria cronol´ogica do DNA, como tamb´em descrevemos sua composi¸c˜ao, estrutura e fun¸c˜ao. Al´em disto, abordamos o grande projeto de sequenciamento do c´odigo gen´etico, o projeto Genoma Humano.

O ´Acido Desoxirribonucleico, ADN (em portuguˆes) ou deoxyribonucleic acid, DNA (em inglˆes), ´e descrito como sendo o segredo da vida, como se refere o tamb´em ganhador do prˆemio Nobel em 1962 (PRIZE, 1962) pela descoberta da dupla h´elice, James Watson, em seu livro “DNA: o segredo da vida” (WATSON; BERRY, 2005). Uma defini¸c˜ao a res-peito do DNA o configura como uma mol´ecula de fita dupla composta por quatro bases nitrogenadas chamadas de: Adenina(A), Timina(T), Citosina(C) e Guanina(G), e que cont´em o c´odigo gen´etico de um organismo, ou seja, possui toda a informa¸c˜ao essencial para constru´ı-lo.

Seguindo uma ordem cronol´ogica (OLIVEIRA et al., 2004), o primeiro ind´ıcio, apro-ximadamente, de DNA foi obtido em 1869, quando Friedrich Miescher, um bioqu´ımico su´ı¸co, isolara, a partir de bandagens que continham pus, uma substˆancia que chamara de “nucle´ına”, porque ele a isolou do n´ucleo das c´elulas. Por volta de 1885 o alem˜ao Walter Flemming e o botˆanico Eduard Strasburger que estudavam c´elulas animais, descobriram um objeto em forma de bast˜ao no n´ucleo das c´elulas, as quais denominaram cromossomo (STURTEVANT; LEWIS, 1965–2001). Avan¸cando um pouco mais no tempo, por volta de 1910, Thomas Hunt Morgan e seus colegas da Universidade de Harvard, estudaram o cruzamento das moscas-das-frutas (Drosophila melanogaster), tamb´em conhecida como a menina-dos-olhos dos geneticistas, e ap´os analisarem v´arios cruzamentos, viram que elas se distinguiam umas das outras pela cor dos olhos, tamanho e forma das asas, por uma esp´ecie de recombina¸c˜ao1 dos genes a cada nova gera¸c˜ao. Por exemplo, descobriram que

a cor dos olhos se referia a uma caracter´ıstica vinculada ao sexo pois as moscas fˆemeas que possuem um par de cromossomos X tinham os olhos vermelhos, j´a os machos que possuem um cromossomo X e outro Y, tinham olhos brancos, correlacionando assim, um

(21)

gene respons´avel pela cor dos olhos e um cromossomo, o X. Os trabalhos de Morgan e seus alunos foram altamente importantes pois contribu´ıram para o estabelecimento da base da gen´etica moderna o que lhe valeu o Prˆemio Nobel de Medicina de 1993 (PRIZE, 1933). Somente na d´ecada de 1930 foi descoberto que o DNA era composto pelas quatro bases nitrogenadas: A, T, G e C, quando um cientista russo, Phoebus Aaron Theodor Levene, graduado em medicina, descobre em 1931, estudando a estrutura qu´ımica dos ´

acidos nucleicos, que estes s˜ao formados por bases nitrogenadas, a¸c´ucar e fosfato, e que s˜ao pol´ımeros, ou seja, macromol´eculas2 formadas por unidades menores e repetidas.

Se-guindo adiante no tempo, um experimento elucidador e de grande importˆancia foi feito em 1944 por Oswald Avery, no Instituto Rockefeller, baseado no trabalho de Fred Griffith, onde trabalharam com um agente bacteriano, o Pneumococcus. Nesse experimento, foram usadas duas cepas bacterianas, designadas “S” (smooth = lisa e virulenta) e “R” (rough = rugosa e inofensiva) (WATSON; BERRY, 2005). A partir da inje¸c˜ao dessas cepas em ratos, chegaram a 3 conclus˜oes bem intrigantes: a primeira cepa injetada R, podemos dizer, in´ocua, o rato permaneceu vivo; a segunda cepa S, patogˆenica, ap´os a inje¸c˜ao o rato veio a ´obito. O caso peculiar veio quando injetaram ambas as cepas, com o detalhe da cepa S que ´e virulenta e foi morta por calor (inofensiva), e o rato tamb´em veio a ´obito. Algo transformou a bact´eria R (inofensiva) numa cepa mortal. A conclus˜ao desse experimento marcou profundamente as pesquisas acerca do DNA, uma mudan¸ca gˆenica havia ocorrido e que o DNA era o princ´ıpio transformador.

Apesar de muito estudo e trabalho ainda pouco se sabia sobre a estrutura espacial do DNA, sobre genes, hereditariedade e muitos outros mist´erios acerca da unidade fun-damental da vida. Um outro jovem c´elebre que teve destaque no ˆambito cient´ıfico, foi o austr´ıaco Erwin Chargaff, do College of Physicians and Surgeons da Universidade de Columbia que em 1949 usando a t´ecnica de cromatografia3 (PORTUGUESA, 2008–2013)

verificou que existe uma rela¸c˜ao de proporcionalidade entre as bases, por exemplo, a quan-tidade da base adenina (A) era proporcional `a base timina (T) e da mesma forma para guanina (G) e citosina (C). Os trabalhos seguintes, feitos por diversos cientistas, entre eles, Maurice Wilkins, que apresentou em um congresso imagens de difra¸c˜ao de raios X de uma amostra de DNA, ocasi˜ao vista por Watson e que impulsionaria sua curiosidade acerca da estrutura espacial da mol´ecula de DNA; como tamb´em as contribui¸c˜oes do re-nomado qu´ımico Linus Pauling, do instituto de tecnologia da Calif´ornia, com seu modelo da alfa-h´elice; uma jovem cientista que teve uma contribui¸c˜ao expressiva, a f´ısico-qu´ımica, Rosalind Franklin, que obteve imagens do DNA atrav´es de difra¸c˜ao de raios X, dando uma indica¸c˜ao das dimens˜oes da mol´ecula e apresentou seus resultados numa conferˆencia em 1951, como tamb´em apresentou num relat´orio informa¸c˜oes importantes como o diˆametro

2Mol´eculas de grandes dimens˜oes.

3 ecnica que visa a identifica¸ao de substˆancias ou a separa¸ao de mol´eculas ou componentes em

(22)

da espiral, as distˆancias entre as bases dispostas paralelamente ao eixo helicoidal e muitas outras medidas (OLIVEIRA et al., 2004). Ent˜ao, em fevereiro de 1953, Watson e Crick obtiveram ˆexito na constru¸c˜ao da estrutura da dupla h´elice do DNA, obtendo assim a estrutura qu´ımica da mol´ecula; tamb´em provaram as regras de emparelhamento dos pares de bases, A com T, e C com G, previsto por Chargaff, segundo as quais, as fitas da dupla h´elice avan¸cariam em dire¸c˜oes opostas. Outro aspecto importante foi a complementari-dade das duas cadeias de nucleot´ıdeos, conhecendo a sequˆencia (ordem) das bases de uma cadeia, sabemos automaticamente a sequencia da outra, como, ATGC da fita 1 e TACG da fita 2.

Todos contribu´ıram excepcionalmente para a descoberta do DNA e o modelo de Wat-son e Crick nos mostrou a ideia de como ocorria uma das principais fun¸c˜oes do DNA, a replica¸c˜ao. As duas fitas se abrem mais ou menos como um z´ıper e cada fita ´e copiada. Esse ´e o processo em que as mensagens gen´eticas s˜ao copiadas com extrema exatid˜ao quando h´a duplica¸c˜ao dos cromossomos antes da divis˜ao celular.

2.2

Principais Mecanismos Gen´

eticos

Ap´os a descoberta da estrutura do DNA por Watson e Crick em 1953, os estudos acerca da mol´ecula de DNA evidenciaram sua capacidade de armazenamento da informa¸c˜ao gen´etica e como ocorre o processo de replica¸c˜ao que abriu um novo mundo de descobertas. O ´acido desoxirribonucleico consiste de duas cadeias longas e antiparalelas composta pelo agrupamento de nucleot´ıdeos Fig. (2.1).

Essas cadeias tamb´em podem ser chamadas de fita de DNA ou cadeia de DNA. Esses nucleot´ıdeos agrupados ao longo da fita s˜ao formados por um ou mais grupos fosfato, a¸cucares com cinco carbonos e uma base (A, T, G ou C) e a liga¸c˜ao que une as duas fitas de DNA s˜ao formadas por liga¸c˜oes de hidrogˆenio entre os pares de base. Os nucleot´ıdeos tamb´em formam dois grupos distintos chamados de pirimidinas, formadas pelas bases timina, uracila e citosina, e purinas, formado por guanina e adenina.

Com rela¸c˜ao `a estrutura tridimensional do DNA, as bases qu´ımicas das duas fitas de DNA se localizam no interior e s˜ao unidas por liga¸c˜oes de hidrogˆenio. A estrutura principal, formada por a¸c´ucar-fosfato, encontra-se na regi˜ao externa. A forma qu´ımica tem uma grande contribui¸c˜ao, assim como a estrutura das duas cadeias de DNA no formato de dupla h´elice. O pareamento das bases acontece de forma n˜ao aleat´oria, ou seja, A sempre vai parear com T, e G com C. Um estudo muito importante feito por pesquisadores brasileiros (BRANDAO et al., 2015) mostra que certas sequˆencias de DNA seguem um padr˜ao. Esse estudo mostrou a rela¸c˜ao matem´atica entre um c´odigo num´erico e a sequˆencia de DNA e as conhecidas bases qu´ımicas, adenina (A), citosina (C), guanina (G) e timina

(23)

FIGURA 2.1 – O nucleot´ıdeo ´e formado por uma base, um grupo fosfato e um a¸c´ucar. A estrutura formada por uma base e um a¸c´ucar ´e chamado nucleos´ıdeo, onde o a¸c´ucar componente do DNA ´e uma desoxirribose e do RNA ´e a ribose (Extra´ıdo e modificado de (PRAY, 2008) ).

(T) seguem uma l´ogica num´erica. O grupo brasileiro usou um c´odigo j´a desenvolvido, chamado c´odigo corretor de erro (sigla ECC) que ´e uma ferramenta computacional e foi utilizada para investigar o c´odigo gen´etico. Segundo o estudo, existem semelhan¸cas entre a comunica¸c˜ao digital e a biol´ogica e esses modelos matem´aticos que tentam descrever sistemas biol´ogicos fornecem abordagens essenciais para o estudo de muta¸c˜oes.

Uma das fun¸c˜oes mais importantes do DNA est´a relacionada aos genes, a informa¸c˜ao que especifica as prote´ınas dos organismos. O DNA dos eucariotos, ou seja, c´elulas que possuem um n´ucleo envolvido pela carioteca4, diferentemente das c´elulas procariotas que tem uma estrutura mais simples e n˜ao possuem n´ucleo, ´e dividido em cromossomos, que s˜ao estruturas compostas por DNA e prote´ınas. A esp´ecie humana possui 46 cromossomos em 23 pares, 22 pares comuns, cromossomos n˜ao sexuais, mais dois cromossomos sexuais, X ou Y, sendo, portanto, do sexo feminino dois cromossomos X e masculino para um cromossomo X e outro Y. Cada cromossomo na c´elula eucari´otica consiste de uma ´unica mol´ecula de DNA altamente enovelado, possuindo assim uma estrutura muito compacta. Os organismos vivos tem uma capacidade incrivelmente precisa de duplicar o seu DNA antes da divis˜ao celular, processo pelo qual a c´elula-m˜ae se divide atrav´es da meiose ou mitose transferindo a informa¸c˜ao gen´etica `a esp´ecie. Esse mecanismo, chamado de repli-ca¸c˜ao, ocorre atrav´es de um DNA-molde pelo qual a sequˆencia de nucleot´ıdeos das duas fitas separadas s˜ao copiados em sequˆencias complementares de DNA. Como o nucleot´ıdeo

(24)

A forma um par apenas com T e C com G, nesse processo cada fita da dupla h´elice serve como molde para a produ¸c˜ao de sua fita complementar atrav´es do pareamento das bases. Para iniciar a replica¸c˜ao, a dupla h´elice tem que ser aberta. Para que isso ocorra as a¸c˜oes de prote´ınas iniciadoras especiais s˜ao realizadas, fazendo com que as liga¸c˜oes que unem as duas fitam se rompam.

Os mecanismos b´asicos da replica¸c˜ao s˜ao fundamentalmente semelhantes entre os or-ganismos procariotos (MARIANS, 1992) e eucariotos (BELL; DUTTA, 2002). Esse processo ´e altamente complexo pois envolve um n´umero alto de replica¸c˜oes sucessivas e ao mesmo tempo, visto a enorme quantidade de c´elulas em um ser humano, por exemplo, envolvem diversas enzimas e “sentido” de replica¸c˜ao. O z´ıper de replica¸c˜ao, ou forquilha, ´e a forma como ´e feita a replica¸c˜ao nos organismos. Ele apresenta uma estrutura em forma de Y onde a DNA-polimerase sintetiza o DNA das duas fitas novas Fig. (2.2).

FIGURA 2.2 – Estrutura de uma forquilha de replica¸c˜ao de DNA. (Extra´ıdo de (SANTOS, 2010 - Blog))

A natureza antiparalela do DNA ´e um empecilho para a replica¸c˜ao simultˆanea das cadeias, ao passo que, por um car´ater universal a extremidade 3’ inicia a replica¸c˜ao de uma das fitas, a chamada fita-l´ıder. A outra fita passa por um processo retardat´ario, a DNA-polimerase se desloca em dire¸c˜ao oposta `a forquilha de replica¸c˜ao. Com isso `a medida que a fita molde tardia ´e exposta, a s´ıntese de DNA ´e feita em segmentos, iniciada e continuada at´e alcan¸car a extremidade 5’. Esses fragmentos de DNA rec´em sintetizados s˜ao chamados fragmentos de Okasaki.

Um outro grande mecanismo diz respeito ao reparo do DNA, que serve para corrigir as falhas que eventualmente ocorrem continuamente no DNA. Alguns erros podem ocorrer ao longo da cadeia, por exemplo, durante a replica¸c˜ao, como um pareamento errado. H´a pos-sibilidade de reparo atrav´es de enzimas restauradoras e at´e mesmo da DNA-polimerase

(25)

que corrige um erro de pareamento ainda durante a replica¸c˜ao. Notadamente, pesqui-sas sobre muta¸c˜oes (modifica¸c˜oes permanentes) e erros buscam respostas de como isso acontece e de que maneira ´e desfeito. As c´elulas do nosso corpo dependem do bom funci-onamento dos nossos genes, cada gene est´a exposto a essas muta¸c˜oes ao longo das cadeias e s´ıtios do DNA que modificam as prote´ınas. A t´ecnica de reparo do DNA pode estar relacionada com o surgimento de cˆanceres (GAO et al., 2013), v´arios estudos est˜ao cada vez mais realistas e promissores para uma poss´ıvel cura.

O envelhecimento, um processo natural de todo ser vivo, que permanece sem respos-tas e retardamento, possui in´umeras teorias (FRIES; PEREIRA, 2011) sobre qual processo (errˆoneo) desencadeia-o. Muitas delas mencionam os erros no processo de replica¸c˜ao, o quais s˜ao repassados adiante sem sua devida corre¸c˜ao. Por´em, vale ressaltar que uma mutabilidade em n´ıveis m´ınimos possuem um papel importante ao longo das gera¸c˜oes, que ´e atrav´es de modifica¸c˜oes que evolu´ımos e a informa¸c˜ao gen´etica ´e perpetuada.

O mecanismo seguinte, cont´em o RNA (do inglˆes ribonucleic acid ), uma mol´ecula importante para a s´ıntese de prote´ınas nas c´elulas. O RNA possui uma estrutura helicoidal de fita ´unica, constitu´ıdo de uma pentose, fosfato e difere do DNA nas bases nitrogenadas, onde a base timina (T) do DNA ´e substitu´ıda por outra base, a uracila (U). A produ¸c˜ao de prote´ınas em quase todos os organismos ocorre atrav´es do processo de transcri¸c˜ao e tradu¸c˜ao. Em 1977, dois grandes cientistas mudaram a vis˜ao que se tinha sobre como o gene era disposto no DNA. At´e ent˜ao, descrevia-se os genes como cont´ınuos. As pesquisas de Richard J. Roberts e Phillip A. Sharp, de forma independente em diversos artigos (CHOW et al., 1977; BERGET et al., 1997; SHARP, 1981; SCHONDORF et al., 2003), em bact´erias e v´ırus bacterianos mostraram que os genes eram descont´ınuos, ou seja, um gene est´a disposto no DNA em segmentos espa¸cados, com isso, descobriram um mecanismo importante para a express˜ao gˆenica, o splicing5, levando-os ent˜ao ao Nobel (PRIZE, 1993)

de fisiologia em 1993 por suas descobertas. Esse aparato natural ´e, muitas vezes, descrito como dogma central da biologia molecular: DNA, RNA, prote´ına Fig. (2.3).

O conceito antes estabelecido, que possui um mecanismo que abrange mais o escopo bacteriano, ´e um pouco semelhante ao que ocorre na replica¸c˜ao do DNA, a c´opia de uma das fitas do DNA, o RNA mensageiro, catalizadas por enzimas que ligam os nucleot´ıdeos e formam a fita molde, que ´e o respons´avel pela produ¸c˜ao de prote´ınas. As enzimas que participam da transcri¸c˜ao s˜ao denominadas RNA-polimerase. Os n´ucleos eucari´oticos tem trˆes: RNA-polimerase I, RNA-polimerase II e RNA-polimerase III. Diferentemente das bact´erias, os organismos eucari´oticos, possuem esse mesmo mecanismo de transcri¸c˜ao e tradu¸c˜ao, que remete a ideia central como sendo a produ¸c˜ao de prote´ınas, mas com uma particularidade que ocorre durante o processamento do RNA mensageiro. O splicing retira os fragmentos muito longos de sequˆencias n˜ao codificadoras, ou ´ıntrons, ou seja, s˜ao

(26)

separados da parte do gene que tem a fun¸c˜ao de gerar prote´ınas, os chamados ´exons, que s˜ao peda¸cos com um tamanho relativamente pequeno.

FIGURA 2.3 – O dogma central da biologia molecular : DNA, RNA e prote´ına (Extra´ıdo e modificado de (WIKIBOOKS, 2015)).

Somente ap´os ter ocorrido o splicing ´e que temos ent˜ao a fita de RNA mensageiro (RNAm) que posteriormente ser´a efetuada a tradu¸c˜ao, que por meio de um c´odigo trans-forma a fita de RNAm em amino´acidos que se ligam uns aos outros, formando a mat´eria prima para a forma¸c˜ao de prote´ınas. Esse c´odigo ´e chamado de c´odigo gen´etico (ALBERTS et al., 2017).

O splicing do RNA remove as sequˆencias de ´ıntrons de pr´e-RNAs recentemente trans-critos e atrav´es do mecanismo de tradu¸c˜ao, h´a ent˜ao, a jun¸c˜ao dos ´exons para a forma¸c˜ao de prote´ına. Descoberta em 1977 essa caracter´ıstica est´a presente nos genes dos eucari´ oti-cos diferentemente do que acontece com genes bacterianos que consistem em uma por¸c˜ao cont´ınua de DNA codificador diretamente transcrita em mRNA. Como ´e visto na Fig. (2.4), um trecho do DNA, o gene, ´e disposto em diversos fragmentos denominados ´exons, intercalados por trechos de DNA n˜ao codificante, os ´ıntrons.

Durante o processo de transcri¸c˜ao que transforma DNA em RNA, tanto os ´exons quanto os ´ıntrons s˜ao transcritos em RNA, ou seja, novamente temos uma fita de frag-mentos composta por ´exons intercalados por ´ıntrons. Ap´os a forma¸c˜ao da fita de RNA ocorre ent˜ao o splicing e cada sequˆencia de ´ıntron ´e removida formando a fita de mRNA que ´e formada pela jun¸c˜ao dos ´exons que formaram o produto final que s˜ao as prote´ınas.

(27)

FIGURA 2.4 – O Splicing e a remo¸c˜ao das sequˆencias n˜ao codificadoras, os ´ıntrons. (Extra´ıdo e modificado de (GUTTMACHER; COLLINS, 2002)).

2.3

O C´

odigo Gen´

etico

Esse complexo elaborado por sequˆencias compostas de quatro “letras”, A, T, G, C no DNA e A, U, G, C no RNA, obedece a uma regra (l´ogica) universal, com poucas exce¸c˜oes, entre os organismos, que ´e relativamente simples, visto tal complexidade do ser humano, por exemplo. O estudo acerca do c´odigo gen´etico remete a grande cientistas como Georg Gamow (GAMOW, 1954), que tentaram estabelecer regras que explicassem tal fenˆomeno. A regra por tr´as da constru¸c˜ao da sequˆencia correta das bases ´e a permuta¸c˜ao das bases em forma de tripletos, pois tinha que estar de acordo com o n´umero de amino´acidos conhecidos. Segundo a regra, a combina¸c˜ao das quatro bases organizadas de trˆes em trˆes, nos daria um valor para 64 combina¸c˜oes, um n´umero mais do que suficiente para abranger os 20 amino´acidos:

43 = 64

Para uma combina¸c˜ao com repeti¸c˜ao para as bases A, C, G e U temos 64 combina¸c˜oes diferentes:

AAA-AAC-AAG-AAU-ACA-ACC-ACG-ACU-AGA-AGC-AGG-AGU-AUA-AUC-AUG-AUU

CAA-CAC-CAG-CAG-CCA-CCC-CCG-CCU-CGA-CGC-CGG-CGU-CUA-CUC-CUG-CUU

GAA-GAC-GAG-GAU-GCA-GCC-GCG-GCU-GGA-GGC-GGG-GGU-GUA-GUC-GUG-GUU

(28)

A partir da descoberta dos tripletos, que s˜ao conhecido por c´odons, o problema a ser resolvido era como a sequˆencia de trˆes bases era definida, ou seja, qual c´odon iniciava e terminava a sequˆencia de amino´acidos e quais c´odons descreviam o mesmo amino´acido (propriedade de degenerescˆencia). Para obter uma leitura confi´avel e a organiza¸c˜ao das bases em tripletos, existe c´odons espec´ıficos que realizam o processo de in´ıcio e t´ermino da tradu¸c˜ao no RNAm Fig. (2.5). Foi descoberto que o c´odon AUG inicia a tradu¸c˜ao e ele representa a metionina, j´a os c´odons de parada s˜ao: UAA, UAG e UGA (WATSON et al., 2015).

FIGURA 2.5 – Todos os c´odons e seus respectivos amino´acidos. O tripleto AUG ´e um c´odon de in´ıcio que codifica a Metionina (Extra´ıdo de (EDUCA ¸C ˜AO, 2011)).

2.4

Projeto Genoma Humano

A descoberta da sequˆencia completa de DNA do genoma humano em 2004, nos mos-trou em detalhes como os genes est˜ao dispostos nos cromossomos. O cromossomo, por exemplo, se for analisado detalhadamente, retirando-se uma pequena parte da sua estru-tura f´ısica, temos uma vis˜ao de uma certa quantidade de genes distribu´ıdo nessa pequena fra¸c˜ao. Se formos mais adiante nessa pequena parte retirada do cromossomo, vemos al-guns poucos genes presentes, bem menos do que o anterior. E seguindo adiante, cada vez mais adentrando a estrutura, chegamos a parte do gene que cont´em ´exons e ´ıntrons. Ao longo do gene tem-se regi˜oes codificadoras de prote´ınas, os ´exons, e regi˜oes ligadas aos ´exons que n˜ao possui, at´e o momento, uma fun¸c˜ao espec´ıfica, os ´ıntrons. Atrav´es da

(29)

express˜ao gˆenica, temos a conclus˜ao da fita de RNA que ser´a transformada em prote´ına. O genoma humano possui caracter´ısticas interessantes relacionadas ao tamanho m´edio dos genes. Uma sequˆencia codificadora de prote´ınas tem aproximadamente 1000 pares de nucleot´ıdeos, j´a as maiores sequˆencias que existem no DNA s˜ao segmentos n˜ao codificantes. Vemos ent˜ao, que o gene ´e uma sequˆencia que varia em ´exons e ´ıntrons ao longo da sua cadeia de DNA. Outro aspecto importante ´e com rela¸c˜ao `as partes que codificam prote´ınas que s˜ao muito pequenas.

Al´em dos segmentos chamados ´exon e ´ıntron, tamb´em temos localizados no gene as sequˆencias de DNA reguladoras. Essas partes se localizam no in´ıcio e no final das sequˆ en-cias codificadoras. Sua fun¸c˜ao ´e essencialmente importante para que ocorra o mecanismo de tradu¸c˜ao, fundamental para gerar um prote´ına.

Um dos primeiros relat´orios acerca do projeto genoma humano foi em 1998. Ao longo de muitos anos e de grandes colabora¸c˜oes intelectuais e financeiras, o primeiro esbo¸co do genoma foi publicado em 2001 (VENTER et al., 2001). A conclus˜ao do projeto aconteceu em 2003 junto com o anivers´ario de cinquenta anos da descoberta da estrutura em h´elice do DNA por Watson e Crick. O grande estudo destacava dois grandes mapas que seriam usados para a descoberta do genoma (CHAUTARD-FREIRE-MAIA, 1995). Os mapas s˜ao processos pelos quais se sabiam a posi¸c˜ao dos genes no cromossomo com a melhor precis˜ao poss´ıvel e o sequenciamento do DNA de cada cromossomo. O mapa gen´etico indica a distˆancia entre os genes atrav´es dos marcos gˆenicos no cromossomos, uma certa distˆancia relativa dos genes e o mapa f´ısico nos d´a a informa¸c˜ao da posi¸c˜ao absoluta do gene no cromossomo.

Um projeto cient´ıfico dessa magnitude possui muitas empresas e universidades traba-lhando em conjunto, assim como diferentes pa´ıses envolvidos para um s´o prop´osito. O desenvolvimento do projeto genoma humano tamb´em trouxe uma forte discuss˜ao acerta da ´etica e quest˜oes relacionadas, preocupadas com toda a informa¸c˜ao dispon´ıvel comerci-almente e tamb´em dispon´ıvel ao grande p´ublico. Um fato curioso, relata a descoberta do junk DNA. Muitos cientistas se recusaram a sequenciar pois n˜ao viam prop´osito algum. A t´ecnica empregada e de f´acil obten¸c˜ao dos genes, sem a necessidade do sequenciamento do junk DNA, utiliza a tecnologia da transcriptase reversa.

A ideia de sequenciamento resulta na descoberta das sequˆencias das letras A, T, G e C. ´E muito importante notar a evolu¸c˜ao e o empenho para o desenvolvimento de t´ecnicas capazes de fornecer o sequenciamento correto. Dentre as mais diversas t´ecnicas utilizadas, mencionaremos a mais importante, o seu desenvolvimento e os cientistas por tr´as desse m´etodo. O primeiro m´etodo utilizado no projeto genoma humano foi desenvolvido por Frederick Sanger que recebeu o Nobel de 1958 por seus trabalhos com prote´ınas que culminou na descoberta da composi¸c˜ao da insulina, importante hormˆonio que regula o

(30)

n´ıvel de a¸c´ucar no sangue (PRIZE, 1958). Aproximadamente vinte e dois anos depois ele recebeu novamente o Nobel de Qu´ımica juntamente com Walter Gilbert e Paul Berg por desenvolver um m´etodo de sequenciar o genoma humano, conhecido na literatura como sequenciamento Sanger. O m´etodo consiste, basicamente, na produ¸c˜ao de v´arias c´opias de uma parte espec´ıfica do DNA. Uma das caracter´ısticas desse m´etodo ´e o uso da enzima que faz o processo de c´opia naturalmente no corpo humano, a DNA polimerase. Alem da DNA polimerase os componentes necess´arios para que o procedimento ocorra s˜ao a utiliza¸c˜ao de um primer, que ´e um peda¸co do DNA de fita simples, e pares de bases “modificados” (ddATP, ddTTP, ddCTP e ddGTP) s˜ao algumas bases chamadas “didesoxi”

ou terminadores de cadeia Fig. (2.6).

FIGURA 2.6 – Estrutura qu´ımica dos marcadores de nucleot´ıdeos. O dioxinucleot´ıdeo e o dideoxinucleot´ıdeo s˜ao praticamente iguais. A modifica¸c˜ao ocorre no grupo hidroxila no carbono 3’, ausente no dideoxinucleot´ıdeo (ddNTP) (Extra´ıdo e modificado de (RYE et al., 2017)).

O sequenciamento da fita de DNA ocorre com a mistura de DNA polimerase, nucleot´ı-deos normais e os dideoxinucleot´ınucleot´ı-deos. A fita que est´a sendo produzida como complemento da fita-molde tem ent˜ao duas formas de ser produzida, com a ades˜ao de uma base normal T. A DNA polimerase ir´a adicionar esse nucleot´ıdeo e outros nucleot´ıdeos normais `a ca-deia at´e que seja adicionado um dide´oxinucleot´ıdeo. A parte interessante vem da ausˆencia do grupo hidroxila que ap´os um ddTTp adicionado (dideoxinucleot´ıdeo T), por exemplo, nenhum outro nucleot´ıdeo ser´a adicionado `a cadeia e h´a ent˜ao a conclus˜ao para uma das fitas novas. Esse m´etodo, descrito acima, ´e ent˜ao repetido muitas e muitas vezes at´e obter-mos a nova sequˆencia, que ´e garantido sempre que um dide´oxinucleot´ıdeo for adicionado. A medida em que as novas fitas s˜ao fabricadas, temos um arranjo de cadeias de tamanhos vari´aveis com at´e um didesoxi de comprimento. Essa fita ´e lida pelas diferentes cores das

(31)

bases no detector.

O Projeto Genoma Humano foi uma extraordin´aria experiˆencia cient´ıfica que ap´os quase vinte anos de pesquisa conseguiu seu objetivo inicial que era sequenciar, aproxi-madamente, os 3 bilh˜oes de pares de bases do genoma humano. Al´em de chegar ao objetivo desejado abriu-se um mundo para novas pesquisas gen´eticas, para o advento da biotecnologia e a curiosa descoberta de que cada ser humano possui seu DNA pr´oprio, completamente individual embora com uma diferen¸ca m´ınima entre os demais. Al´em de feitos memor´aveis do campo da tecnologia no sequenciamento, foi poss´ıvel sequenciar o ge-noma de plantas e animais com maior agilidade, encontrando vest´ıgios da evolu¸c˜ao atrav´es de semelhan¸cas e diferen¸cas entre diversos genomas de seres vivos, encontrar causadores de doen¸cas gen´eticas, ou seja, as muta¸c˜oes, e ainda mais complexo e especial, a cura para tais doen¸cas.

(32)

3 Mecˆ

anica Estat´ıstica Generalizada

A Mecˆanica Estat´ıstica de Equil´ıbrio, formulada em termos da Estat´ıstica de Boltzmann-Gibbs (BG), ´e uma teoria bem estabelecida e que possui uma vasta funcionalidade quando aplicada a problemas de F´ısica, al´em de outras ´areas da Ciˆencia. No cerne da formula¸c˜ao da Termodinˆamica, em meados do s´eculo XIX, e da Mecˆanica Estat´ıstica Padr˜ao (MEP), est´a o conceito fundamental de entropia (WEHRL, 1978).

Podemos considerar a formula¸c˜ao do conceito de entropia como uma das grandes rea-liza¸c˜oes da Ciˆencia. Permitiu formar o corpo te´orico da Termodinˆamica de Equil´ıbrio e de processos irrevers´ıveis. Constitui a pedra fundamental da Mecˆanica Estat´ıstica e tamb´em exerce papel fundamental na Teoria de Informa¸c˜ao. Infelizmente, para sistemas fora do equil´ıbrio, que apresentam intera¸c˜ao de longo alcance ou correla¸c˜oes temporais de longa dura¸c˜ao, por exemplo, o formalismo de BG ´e inadequado para tratar tais sistemas. Por esta raz˜ao, algumas propostas de generaliza¸c˜ao (NAUDTS, 2011) do conceito de entropia tem surgido nas ´ultimas d´ecadas (FILHO, 2011).

3.1

Mecˆ

anica Estat´ıstica Padr˜

ao

A Termodinˆamica ´e uma teoria fenomenol´ogica que sistematiza as leis emp´ıricas sobre o comportamento t´ermico dos corpos macrosc´opicos. J´a a vis˜ao da Mecˆanica Estat´ıstica, tem como objetivo tentar explicar as leis e os resultados da termodinˆamica atrav´es da in-forma¸c˜ao microsc´opica, ou seja, levando em considera¸c˜ao o comportamento de um n´umero imenso de part´ıculas que constituem os corpos macrosc´opicos (SALINAS, 2008).

A Segunda Lei da Termodinˆamica que enuncia o conceito de entropia, foi introduzida em meados de 1865 por Rudolf Clausius (BASSALO et al., 1999; FILHO, 2011):

4S ≥ 0 (3.1)

onde o sinal de igualdade indica processos revers´ıveis e a desigualdade processos irrever-s´ıveis.

(33)

processos f´ısicos. Tomemos como exemplo, um sistema que vai de um estado inicial I a um estado final F, enquanto troca mat´eria e energia com a vizinhan¸ca. Para processos revers´ıveis o modo inverso (F → I) pode ocorrer, mas o mesmo n˜ao ocorre para processos irrevers´ıveis e, caso ocorra, as quantidades de mat´eria, calor e trabalho n˜ao se compensar˜ao (BORGES, 1999).

Em 1870, aproximadamente, o f´ısico austr´ıaco Ludwig Boltzmann (BOLTZMANN, 1872;

BOLTZMANN, 1970) introduziu formalmente o racioc´ınio probabil´ıstico, j´a ent˜ao esbo¸cado pelo matem´atico e f´ısico James Clerk Maxwell1, para a Segunda Lei da Termodinˆamica.

Nesse modelo, Boltzmann relaciona uma propriedade macrosc´opica com uma informa¸c˜ao microsc´opica para um sistema com energia, volume e n´umero de part´ıculas constantes. Se o espa¸co de fase deste sistema macrosc´opico for constitu´ıdo por W poss´ıveis estados microsc´opicos, sua entropia ´e definida por

S = k ln(W ) (3.2)

onde k ´e uma constante positiva. Esta rela¸c˜ao ´e muitas vezes interpretada como sendo uma medida da desordem do sistema.

Em 1902, o f´ısico norte americano Josiah Williard Gibbs (GIBBS, 1948) apresentou uma nova abordagem que ficou conhecida como teoria dos ensembles, na qual Gibbs lan¸cou a base da mecˆanica estat´ıstica usual e a forma mais geral da entropia de Boltzmann-Gibbs ´e: SBG = −k W X i=1 piln pi (3.3)

onde pi ´e a probabilidade do sistema estar no microestado i. Na teoria estat´ıstica de

Boltzmann-Gibbs o importante ´e que as propriedades macrosc´opicas s˜ao m´edias das pro-priedades microsc´opicas ponderadas pelas probabilidades pi. Em particular, sua

otimiza-¸c˜ao sob restri¸c˜oes apropriadas para um sistema em equil´ıbrio t´ermico e temperatura T, o c´elebre fator de BG, ´e dado por

pi = e−βEi ZBG (3.4) com β ≡ 1/kT (3.5)

(34)

e a fun¸c˜ao de parti¸c˜ao, ZBG≡ W X j e−βEj. (3.6)

Podemos explanar tamb´em, no contexto da Teoria de Informa¸c˜ao, a entropia de Shan-non, aqui descrita por SS, tamb´em conhecida como uma medida da informa¸c˜ao, proposta

em meados de 1949. Em uma mensagem, a m´edia da falta de informa¸c˜ao ´e (WEHRL, 1991)

SS = −

X

piln pi (3.7)

com pi ≥ 0 e P pi = 1.

Ao longo deste cap´ıtulo vamos abordar duas estat´ısticas generalizadas, em particu-lar, Tsallis e Kaniadakis, explicitando as express˜oes modificadas nos dois formalismos, que variam atrav´es de parˆametros, comumente chamados de parˆametros deformadores, que podem variar dentro de um determinado intervalo, enfatizando mais a estat´ıstica de Kaniadakis. Essas estat´ısticas generalizadas potencialmente descrevem problemas envol-vendo intera¸c˜oes de longo alcance, fractalidade e efeitos relativ´ısticos.

3.2

Estat´ıstica de Kaniadakis

Em 2001, Giorgio Kaniadakis apresentou uma nova proposta `a Mecˆanica Estat´ıstica de Maxwell-Boltzmann-Gibbs (KANIADAKIS, 2001b), em que uma generaliza¸c˜ao ´e expressa atrav´es da varia¸c˜ao de um parˆametro deformador, κ. A estat´ıstica generalizada de ka-niadakis obedece ao Princ´ıpio de Intera¸c˜ao Cin´etica ou Kinetical Interaction Principle (KIP ), subjacente `a cin´etica n˜ao-linear em sistemas de part´ıculas, independentemente da abordagem utilizada para descrever sua evolu¸c˜ao temporal. Este princ´ıpio imp˜oe tam-b´em a forma da entropia generalizada associada ao sistema e permite obter a distribui¸c˜ao estat´ıstica dessas part´ıculas2 (KANIADAKIS, 2001a). Em seu artigo de 2002, “Statistical mechanics in the context of special relativity” (KANIADAKIS, 2002), Kaniadakis apresentou

de forma breve e consistente os fundamentos da κ-´algebra. A estat´ıstica κ-deformada pode ser usada para explicar uma classe grande de fenˆomenos observados que sejam descritos por fun¸c˜oes distribui¸c˜oes que apresentem caudas de leis de potˆencia.

2ao abordaremos este princ´ıpio nesta disserta¸ao. Para maiores detalhes, consultar referˆencias (

(35)

3.2.1

Fun¸

oes κ-exponencial e κ-logaritmo

Para introduzir as bases da estat´ıstica de Kaniadakis, consideremos a exponencial deformada, indicada por exp{κ}(x) e que obedece a seguinte rela¸c˜ao de simetria:

exp{κ}(x)exp{κ}(−x) = 1 (3.8)

em que a fun¸c˜ao exponencial deformada pode ser escrita, dependendo do parˆametro de-formador κ, como segue:

exp{κ}(x) = [

p

1 + gκ(x)2+ gκ(x)]1/κ (3.9)

Na Eq. (3.9), o gerador gκ(x) da exponencial deformada ´e uma fun¸c˜ao arbitr´aria

dependente do parˆametro κ e que obedece as seguintes condi¸c˜oes:

1. gκ(x) ∈ R; 2. gκ(−x) = −gκ(x); 3. dgκ(x) dx > 0; 4. gκ(±∞) = ±∞; 5. gκ(x) ≈ x, quando x → 0.

Podemos, agora, definir a exponencial deformada simplesmente como κ-exponencial e de (3.9), se definirmos o gerador gκ = κx, vemos que

exp{κ}(x) =

√

1 + κ2x2+ κx1/κ (3.10)

ou, equivalentemente, por

exp{κ}(x) = exp

 1

κarcsinh(κx) 

(3.11)

Nas Figs. (3.1) e (3.2), temos o gr´afico da exp{κ}(x) para os valores de κ = 1, κ = 0.70

e κ = 0 e exp{κ}(−x) para v´arios valores de κ, respectivamente. ´E visto que, quando

κ → 0 retomamos a exponencial no formalismo padr˜ao, ou seja, lim

κ→0 exp{κ}(x) = exp(x)

e que ∀x ∈ R isto resulta exp{κ}(x) ∈ R+. Podemos mostrar ainda que, exp{κ}(0) = 1 e

se verifica uma simetria em rela¸c˜ao ao parˆametro de deforma¸c˜ao exp{−κ}(x) = exp{κ}(x),

considerando simplesmente que κ ∈ R+, temos tamb´em que a κ-exponencial ´e uma fun¸c˜ao crescente d[exp{κ}(x)]/dx > 0, ∀κ ∈ R.

(36)

FIGURA 3.1 – Gr´afico que mostra o comportamento da exp{κ}(x) para diversos valores

de κ.

FIGURA 3.2 – Gr´afico que mostra o comportamento da exp{κ}(−x) para diversos valores

(37)

Uma propriedade relevante da exp{κ}(x) ´e que, ∀a ∈ R,

exp{κ}(ax) = [exp{aκ}(x)]a (3.12)

Outra propriedade de interesse da κ-exponencial, ´e o comportamento assint´otico tipo lei de potˆencia, como ´e visto

exp{κ}(x) ∼

x→±∞(2|κx|) ±1/|κ|

. (3.13)

Vamos definir agora uma fun¸c˜ao tamb´em muito importante nesse formalismo, que ´e a inversa da κ-exponencial, o logaritmo deformado, ou melhor, o κ-logaritmo. Podemos defini-lo em fun¸c˜ao do gerador gκ como:

ln{κ}(x) = gκ−1

 xκ− x−κ

2 

(3.14) onde gκ−1 ´e a inversa de gκ. Assim, o κ-logaritmo pode ser melhor definido por

ln{κ}(x) =

 xκ− x−κ

2κ 

. (3.15)

A Fig. (3.3) mostra o ln{κ}(x) para κ = 1, κ = 0.65 e κ = 0.

FIGURA 3.3 – Gr´afico que mostra o comportamento do κ-logaritmo para diversos valores de κ. Extra´ıdo de (KANIADAKIS, 2013)

(38)

Podemos admitir ent˜ao, a partir de (3.15) a seguinte propriedade:

ln{κ}(xy) = ln{κ}(x) κ

⊕ ln{κ}(y) (3.16)

Al´em disso, quando κ → 0, lim

κ→0 ln{κ}(x) = ln(x), recuperando o logaritmo natural.

Outras propriedade relevantes, como:

1. ln{κ}(xm) = m ln{mx}(x);

2. ln{−κ}(x) = ln{κ}(x) ;

3. ln{κ}(1) = 0.

O κ-logaritmo possui um comportamento assint´otico como segue abaixo:

ln{κ}(x) ∼ x→+∞|2κ| −1 x|κ| → +∞ (3.17) e ln{κ}(x) ∼ x→0+ −|κ| −1 x−|κ| → −∞. (3.18)

3.2.2

A κ-entropia

Nesta se¸c˜ao, vamos abordar uma nova distribui¸c˜ao estat´ıstica, vinda da formula¸c˜ao de Kaniadakis, reformulada atrav´es do KIP. Vamos considerar a densidade de entropia:

σ{κ}(f ) =

Z

df ln{κ}(αf ) (3.19)

onde α ´e uma constante real positiva, f ´e a fun¸c˜ao de distribui¸c˜ao e o ln{κ}´e o κ-logaritimo

definido na Eq. (3.15). Na Eq. (3.19), para κ → 0, retomamos a densidade de entropia padr˜ao de Boltzmann-Gibbs-Shannon com α = 1. A conex˜ao com o KIP ´e realizada atrav´es de ln κ(f ) = ln{κ}(αf ) (SOUZA, 2016). Pela defini¸c˜ao de um funcional entr´opico3,

a entropia da κ-estat´ıstica deformada ´e definida como:

Sκ =

Z

dnvσ{κ}(f ) (3.20)

e assume a forma(KANIADAKIS, 2001b),

Sκ = −1 2κ Z dnv  ακ 1 + κp 1+κ α −κ 1 − κp 1−κ  (3.21)

3O funcional aqui mencionado, est´a definido em (

(39)

e reduz-se a entropia padr˜ao de Boltzmann-Gibbs-Shannon se o parˆametro de deforma¸c˜ao se aproximar de zero. Vamos analisar o valor da constante α.

Primeira escolha de α: Vamos discutir o caso para α = 1. A distribui¸c˜ao estat´ıstica estacion´aria correspondente a entropia Sκ ´e obtida maximizando o funcional H4:

H = S − β(E − µN ) (3.22) em que E ´e a energia total do sistema, assim,

δ  Sκ+ Z dnv(βµf − βU f )  = 0 (3.23) Portanto, f = 1 αexp{κ}(−);  = β(U − µ) (3.24) que para κ → 0, temos a distribui¸c˜ao estat´ıstica cl´assica.

Segunda escolha de α: Podemos tomar α = Z e ent˜ao a distribui¸c˜ao estat´ıstica ´e dada por

f = 1

Zexp{κ}(−βU ) (3.25) com Z =R dnvexp{κ}(−βU ).

Na express˜ao de f, a Eq. (3.25), depende do potencial U e, para o caso em que U = mv2/2, temos a distribui¸c˜ao estat´ıstica para part´ıculas Brownianas,

f = βm|κ| π n/2 1 + 1 2n|κ|  Γ(1/2|κ| + n/4) Γ(1/2|κ| − n/4)exp{κ}  −β 2mv 2  , (3.26) onde n = 1, 2, 3 ´e a dimens˜ao do espa¸co de velocidades e |κ| < 2/n. A distribui¸c˜ao (3.26) se reduz `a Maxwell-Boltzmann padr˜ao

f = (βm/2π)n/2exp(−βmv2/2) (3.27) se o parˆametro deformador κ se aproximar de zero.

(40)

3.2.3

A κ-´

algebra

Vamos introduzir uma classe de estruturas deformadas pelo parˆametro κ e algumas propriedades matem´aticas (KANIADAKIS, 2002).

Para uma fun¸c˜ao real x{κ} de uma vari´avel real x que depende de um parˆametro real κ

definida em termos do gerador gκ(x), indicado na se¸c˜ao (3.2.1), temos a seguinte defini¸c˜ao:

x{κ}=

1

κarcsinh[gκ(x)] (3.28) A fun¸c˜ao definida acima, possui propriedades que descendem diretamente do gerador gκ, 1. x{κ} ∈ R; 2. (−x){κ} = −x{κ}; 3. dx{κ}/dx > 0; 4. (±∞){κ} = ±∞; 5. x{κ} ≈ x, para x → 0 e 0{κ}= 0; 6. x{κ} ≈ x, para κ → 0 e x0 = x; 7. x{−κ} = x{κ}.

Podemos definir tamb´em a inversa de (3.28),

x{κ} = 1 κg

−1

(sinh κx). (3.29)

1. ´Algebra deformada

Proposi¸c˜ao 1. A lei de composi¸c˜ao ⊕ definido atrav´es deκ

(x⊕ y) = xκ {κ}+ y{κ} (3.30)

que reduz-se `a soma ordin´aria quando κ → 0, x⊕ y = x + y.0 Proposi¸c˜ao 2. A lei de composi¸c˜ao ⊗ definido atrav´es deκ

(x⊗ y) = xκ {κ}· y{κ} (3.31)

(41)

Proposi¸c˜ao 3. A soma deformada ⊕ e o produtoκ ⊗ obedecem uma lei distributivaκ

z⊗ (xκ ⊕ y) = (zκ ⊗ x)κ ⊕ (zκ ⊗ y)κ (3.32) e a estrutura alg´ebrica (R,⊕,κ ⊗) formam um grupo Abelianoκ 5.

Proposi¸c˜ao 4. A fun¸c˜ao x{κ} tem as duas propriedade a seguir:

x{κ}⊕ yκ {κ} = (x + y){κ} (3.33)

x{κ}⊗ yκ {κ}= (xy){κ} (3.34) Proposi¸c˜ao 5. A lei de pseudo-distribui¸c˜ao

z · (x⊕ y) = (z · x)κ κ z⊕ (z · y) (3.35) 2. Soma e produto de fun¸c˜oes

Vamos considerar um conjunto de fun¸c˜oes reais n˜ao-negativas D = {f, h, w...}. Proposi¸c˜ao 6. A lei de composi¸c˜ao ⊗

κ definida atrav´es de

f ⊗

κ

h = exp{κ}(ln{κ}f + ln{κ}h), (3.36)

que reduz-se ao produto ordin´ario quando κ → 0, f ⊗

0

h = f · h. Proposi¸c˜ao 7. A estrutura alg´ebrica (D, ⊗

κ) formam um mon´oide Abeliano.

Prova. De fato, o elemento 0 n˜ao admite um elemento inverso.

Al´em disso, assim como no caso do produto ordin´ario, ele resulta em f ⊗

κ 0 = 0 ⊗κf = 0.

Proposi¸c˜ao 8. A lei de composi¸c˜ao ⊗

κ definida atrav´es de

f ⊗

κ

h = exp{κ}{ln[exp(ln{κ}f ) + exp(ln{κ}h)]}, (3.37)

que reduz-se `a soma ordin´aria quando κ → 0, f ⊕

0

h = f + h.

Afim de exemplificar a utiliza¸c˜ao da κ-estat´ıstica no ˆambito da pesquisa, destacamos diversos trabalhos relacionados a esta estat´ıstica generalizada. Podemos citar: Distri-bui¸c˜oes de Renda (CLEMENTI et al., 2008), Entropias Generalizadas (KANIADAKIS et al., 2004), Distribui¸c˜oes de Redes (MACEDO-FLIHO et al., 2013) e DNA (SOUZA et al., 2014).

5Tamb´em chamado de grupo Comutativo. Para mais detalhes ver (

(42)

3.3

Estat´ıstica de Tsallis

Outra generaliza¸c˜ao da Mecˆanica Estat´ıstica de Boltzmann-Gibbs foi desenvolvida por Constantino Tsallis, em 1988, inspirada na descri¸c˜ao probabil´ıstica de geometrias multifractais (TSALLIS, 1988), em que propˆos uma nova f´ormula para a entropia na qual tem-se a entropia de BG como um caso particular.

Em seu livro (TSALLIS, 2009), Tsallis deduziu de uma forma alternativa6 (Met´afora) a generaliza¸c˜ao da exponencial e do logaritmo descritos no formalismo padr˜ao de BG, atrav´es da solu¸c˜ao da equa¸c˜ao diferencial n˜ao-linear com a adi¸c˜ao de um expoente q, ou seja,

dy dx = y

q (3.38)

para q ∈ R e a condi¸c˜ao de contorno y(0) = 1.

Com isso, a solu¸c˜ao da Eq. (3.38) nos d´a uma express˜ao muito importante, a expo-nencial generalizada no formalismo de Tsallis,

y = (1 + (1 − q)x)1−q1 ≡ ex

q (3.39)

desde que tenhamos [1 + (1 − q)x] > 0 e para qualquer outro valor expq(x) = 0. Podemos

definir, ent˜ao, a sua inversa como:

y0 = x

1−q− 1

1 − q ≡ lnqx (3.40) definida como o logaritmo generalizado e para q → 1 temos ln1(x) = ln(x), ou seja, o

logaritmo natural padr˜ao, assim como exp1(x) = exp(x), a exponencial padr˜ao.

A “entropia de Tsallis”, como ´e conhecida, ´e usada em casos onde h´a fortes correla¸c˜oes entre os diferentes microestados em um sistema ou ainda em sistemas fora do equil´ıbrio. A express˜ao da entropia, que ´e obtida atrav´es da Eq. (3.40), tem a forma:

Sq = kB q − 1 " 1 − W X i pqi # (3.41) onde kB´e a constante de Boltzmann, W ´e o n´umero de microestados, pi as probabilidades

associadas, al´em dessa express˜ao ser normalizada, PW

i pi = 1. A express˜ao para Sq est´a

caracterizada por um parˆametro q, onde q ´e uma medida de qu˜ao forte s˜ao as correla¸c˜oes (CARTWRIGHT, 2014). Para obtermos a entropia padr˜ao de (BG), tomamos o limite q → 1 de Sq.

(43)

Uma outra maneira de escrever a Eq. (3.41), ´e em termos do q-logaritmo, assim como outras formas poss´ıveis podem ser vistas na tabela (3.1).

Sq = −kB W

X

i

pqilnq(pi) (3.42)

Entropia Probabilidades iguais Probabilidades gen´ericas

SBG k ln W −k PW i piln2−q(pi) = k PW i piln(1/pi) Sq k lnqW q−1k h 1 −PW i p q i i = kPW i pilnq(1/pi) = −k PW i p q i lnq(pi) −kPW i piln2−qpi

TABELA 3.1 – Entropia SBG e Sq com S1 = SBG (Extra´ıdo e modificado de (TSALLIS,

2009))

A teoria proposta por Tsallis viola o princ´ıpio da aditividade estabelecida no Terceiro postulado da Termodinˆamica, onde a entropia ´e uma fun¸c˜ao cont´ınua, diferenci´avel e monotonicamente crescente da energia e ´e aditiva sobre os sub-sistemas de um dado sistema composto (SALINAS, 2008). Por exemplo (TSALLIS et al., 2002), se considerarmos um sistema composto com dois sub-sistemas A e B probabilisticamente independentes, ou seja, PijA+B = PiAPjB, a entropia no formalismo de Tsallis, Sq, ´e expressa como:

Sq(A + B) = Sq(A) + Sq(B) + (1 − q)Sq(A)Sq(B) (3.43)

a n˜ao-aditividade ´e evidenciada no termo cruzado, (1 − q)Sq(A)Sq(B). Para os casos em

que q > 1, q < 1 e q = 1 temos que a entropia torna-se, respectivamente, subextensiva, superextensiva e extensiva para o formalismo de BG. A n˜ao-aditividade da entropia de Tsallis expressa uma dificuldade em separar completamente (isolar) sistemas interagentes (BORGES, 1999).

A partir da propriedade da n˜ao-aditividade, temos o rompimento de um conceito fundamental, o conceito de sistema isolado. Em Termodinˆamica, um sistema isolado ´e aquele que n˜ao troca energia, mat´eria e informa¸c˜ao com a vizinhan¸ca. ´E visto que, na Eq. (3.43), cada sub-sistema do sistema composto, contribui para a aditividade com um termo, ou seja, Sq(A)[1 +12(1 − q)Sq(B)] e Sq(B)[1 +12(1 − q)Sq(A)]. Esse comportamento

indica que antes da jun¸c˜ao um sistema j´a sentia a presen¸ca do outro, indicando assim, que o sistema n˜ao era isolado. A Fig. (3.4) mostra o comportamento da ex

q, Eq. (3.39),

para diversos valores e q.

Para um melhor entendimento sobre o formalismo generalizado de Tsallis, menci-onamos a seguir, algumas rela¸c˜oes matem´aticas advindas deste formalismo, conhecido como q-´algebra (BORGES, 2004), como por exemplo, as propriedades fundamentais, como

(44)

FIGURA 3.4 – A q-exponencial para alguns valores de q. Extra´ıdo de: (SOUZA, 2016) adi¸c˜ao e multiplica¸c˜ao, como tamb´em algumas rela¸c˜oes entre a fun¸c˜ao q-logaritmo e a q-exponencial.

Temos que o q-logaritmo de x e y, ´e dado por:

lnq(xy) = lnqx + lnqy + (1 − q) lnqx lnqy (3.44)

assim como, a q-exponencial,

eq(x)eq(y) = eq(x + y + (1 − q)xy) (3.45)

que ´e v´alido se eq(x) e eq(y) forem diferentes de zero e +∞.

Atrav´es dessas propriedades mencionadas acima, temos a generaliza¸c˜ao da opera¸c˜ao soma entre dois n´umeros x e y:

x ⊕qy ≡ x + y + (1 − q)xy. (3.46)

A q-soma tem as seguintes propriedades:

1. Comutativa

x ⊕qy = y ⊕qx (3.47)

2. Associativa

(45)

3. N˜ao distributiva (em rela¸c˜ao `a multiplica¸c˜ao usual)

(a(x ⊕qy) 6= (ax ⊕qay)) (3.49)

4. Elemento Neutro

x ⊕q0 = x (3.50)

5. Oposto de x (aditiva inversa) qx ≡

−x

1 + (1 − q)x (x 6= 1/(q − 1)). (3.51) Podemos definir agora a q-diferen¸ca:

x qy ≡ x ⊕q( qy) =

x − y

1 + (1 − q)y (y 6= 1/(q − 1)) (3.52) que possui tamb´em as seguintes propriedades:

1. Comutativa

x qy = qy ⊕qx (3.53)

2. Associativa

(x q(y qz)) = ((x qy) ⊕qz) (3.54)

3. N˜ao distributiva (em rela¸c˜ao `a multiplica¸c˜ao usual)

(a(x qy) 6= (ax qay)) (3.55)

O q-produto entre dois n´umeros:

x ⊗qy ≡ [x1−q+ y1−q− 1] 1/(1−q)

+ (x, y > 0) (3.56)

que podemos estender para o q-logaritmo e a q-exponencial:

lnq(x ⊗qy) = lnqx + lnqy (3.57)

eq(x) ⊗qeq(y) = eq(x + y) (3.58)

e que possui tamb´em as seguintes propriedades: 1. Comutativo

(46)

2. Associativo

(x ⊗q(y ⊗qz)) = ((x ⊗qy) ⊗qz) (3.60)

3. Elemento Neutro

x ⊗q0 = x (3.61)

e temos tamb´em, a q-divis˜ao definida como:

x qy ≡ [x1−q+ y1−q + 1] 1/(1−q)

+ (x, y > 0). (3.62)

e possui as seguintes propriedades:

1. Comutativa

x qy = 1 q(y qx) , x1−q ≤ 1 + y1−q (3.63)

2. Associativa

(x q(y qz) = (x qy) ⊗qz) = (x ⊗qz) qy, (3.64)

z1−q− 1 ≤ y1−q ≤ x1−q+ 1.

Algumas propriedades importantes, envolvendo o q-logaritmo e a q-exponencial, po-dem ser extra´ıdas de forma mais compacta:

lnq(xy) = lnqx ⊕qlnqy , eq(x)eq(y) = eq(x ⊕qy), (3.65)

lnq(x ⊗qy) = lnqx + lnqy , eq(x) ⊗qeq(y) = eq(x + y), (3.66)

lnq(x/y) = lnqx ql ln qy , eq(x)/eq(y) = eq(x qy), (3.67)

lnq(x qy) = lnqx − lnqy , eq(x) qeq(y) = eq(x − y). (3.68)

Estas igualdades obedecem a certas restri¸c˜oes que s˜ao importantes mencionar. Todas as restri¸c˜oes est˜ao na tabela (3.2). A nota¸c˜ao x ≥q 0 significa 1 + (1 − q)x ≥ 0.

A Estat´ıstica n˜ao-aditiva de Tsallis ´e amplamente usada pelas mais diversas ´areas de pesquisa e vem se consolidando cada vez mais no ˆambito acadˆemico como poss´ıvel generaliza¸c˜ao da Estat´ıstica Padr˜ao de BG. Como exemplo de estudos feitos atrav´es da estat´ıstica de Tsallis, destacamos algumas pequisas: DNA (BOGACHEV et al., 2014),

(47)

Equa¸c˜oes Restri¸c˜oes (3.65) x > 0, y > 0 ; x ≥q 0 ou y ≥q 0 (3.66) x1−q+ y1−q ≥ 1 ; x ≥ q 0 e y ≥q0 (3.67) x > 0, y > 0 ; y >q 0 (3.68) x1−q+ 1 ≥ y1−q ; x ≥q 0 ou y ≥q 0

TABELA 3.2 – Restri¸c˜oes sobre as igualdades. (Extra´ıdo e modificado de (BORGES, 2004)) Interestelar (ESQUIVEL; LAZARIAN, 2010), Sistemas Hadrˆonicos (MARQUES et al., 2013), Mapa Padr˜ao (TIMAKLI; BORGES, 2016).

(48)

4 Modelo Generalizado e Resultados

Nesta disserta¸c˜ao, usamos a κ-exponencial e a q-exponencial juntamente com o m´etodo de maximiza¸c˜ao das entropias dos formalismos generalizados, Sκ e Sq, para todos os

cromossomos humanos, afim de estudar as distribui¸c˜oes de tamanho para a parte n˜ao codificante do DNA, mais especificamente, os ´ıntrons. Podemos destacar tamb´em, que a utiliza¸c˜ao da entropia nesse trabalho est´a intimamente ligada `a Teoria de Informa¸c˜ao e n˜ao est´a vinculada ao conceito termodinˆamico.

Tomamos como referˆencia um artigo muito interessante (OIKONOMOU et al., 2008) que mostra a q-distribui¸c˜ao de tamanho para todos os cromossomos humanos da parte n˜ao codificante (´ıntrons e regi˜ao intergˆenica) com valores de q variando entre 2 ≤ q ≤ 2.3 com exce¸c˜ao dos cromossomos X e Y. Um dos aspectos interessantes que levaram e ainda h´a pesquisas como esta, ´e a descoberta de correla¸c˜oes de longo alcance em sequˆencias genˆomicas (PROVATA; OIKONOMOU, 2007), caracter´ıstico do DNA n˜ao codificante.

O m´etodo inicial foi separar as sequˆencias de DNA codificante e n˜ao codificante em cada cromossomo, em que usamos uma ferramenta da bioestat´ıstica, do projeto Biocon-ductor (BIOCONDUCTOR, 2003–2018), juntamente com o programa de an´alise estat´ıstica R (R Core Team, 2016), consideramos ent˜ao, a distribui¸c˜ao de tamanho para a parte n˜ao codificante como uma fun¸c˜ao do tamanho da sequˆencia, que ´e dado por l, que ´e referente ao n´umero de pares de bases (bps) na sequˆencia. Os dados para an´alise foram retirados do banco de dados Ensembl6 (ENSEMBL, 1999–2017).

4.1

Fun¸

oes distribui¸

oes de probabilidades

4.1.1

Fun¸

ao κ-distribui¸

ao de probabilidade

O m´etodo que utilizamos para obtermos as duas distribui¸c˜oes de probabilidade ge-neralizadas, partiram do princ´ıpio de maximiza¸c˜ao da entropia. O princ´ıpio de m´axima entropia ´e um m´etodo para conseguirmos a fun¸c˜ao de distribui¸c˜ao mais prov´avel a partir de sistemas estat´ısticos, maximizando a entropia sob restri¸c˜oes (HANEL et al., 2014).

Referências

Documentos relacionados

Vale ressaltar que, para direcionar os trabalhos da Coordenação Estadual do Projeto, é imprescindível que a mesma elabore seu Planejamento Estratégico, pois para Mintzberg (2006,

Diante do cenário apresentado, e da necessidade do uso da avaliação externa como instrumento da gestão educacional, este trabalho tem como objetivo avaliar como

Ao longo deste trabalho, analisamos como os profissionais da Escola Estadual Normandia, localizada na cidade de Cruzeiro do Sul, no Acre, promovem seus processos

A opinião dos alunos que frequentam o PA sobre a implementação do Programa de Correção de Fluxo Escolar é de extrema importância, visto serem eles os protagonistas

Assim, almeja-se que as ações propostas para a reformulação do sistema sejam implementadas na SEDUC/AM e que esse processo seja algo construtivo não apenas para os

Na experiência em análise, os professores não tiveram formação para tal mudança e foram experimentando e construindo, a seu modo, uma escola de tempo

Veículos do casal Rogério Onofre e Dayse foram registrados em nome Cláudio Freitas; Houve várias trocas de mensagens suspeitas, tendo elas sido codificadas com nomes

O novo acervo, denominado “Arquivo Particular Julio de Castilhos”, agrega documentação de origem desconhecida, mas que, por suas características de caráter muito íntimo