• Nenhum resultado encontrado

4. No interior das c´elulas, o DNA est´a constantemente passando por processos de des- natura¸c˜ao e renatura¸c˜ao. Num processo de desnatura¸c˜ao, a dupla h´elice ´e dividida longitudinalmente, rompendo suas pontes de hidrogˆenio relativas aos pares de bases complementares. A evidˆencia desse rompimento nos leva a questionar a respeito do papel do meio, onde o DNA est´a contido, na sua estabilidade. A condu¸c˜ao de experimentos realizados com DNA em meio n˜ao aquoso [48, 49] mostram evidˆencias de que a estabilidade estrutural do DNA est´a ligada ao meio onde este se encon- tra imerso (obviamente, dependem da temperatura do meio). Essas intera¸c˜oes s˜ao denominadas na literatura de for¸cas hidrof´obicas.

De acordo com c´alculos baseados em mecˆanica quˆantica [50], as energias de intera¸c˜ao entre as bases empilhadas depende da sequˆencia prim´aria. Na tabela 4.1 exibimos os valores calculados para todas as combina¸c˜oes entre dois pares de bases. Dessa mesma tabela, percebemos que empilhamentos com alta concentra¸c˜ao de pares G− C s˜ao mais est´aveis do que aqueles contendo pares do tipo A− T [51]. Al´em disso, percebe-se que a energia associada ao empilhamento ´e da mesma ordem de grandeza das pontes de hidrogˆenio entre pares complementares e, novamente, bem mais fracas do que a liga¸c˜ao covalente.

4.4

Projeto Genoma Humano

Quando no ser humano, uma ´unica mol´ecula de DNA pode conter entre 46 (cromos- somo 21) a 250 (cromossomo 1) milh˜oes de bases nitrogenadas. Como a distˆancia entre dois pares de bases ´e de 3, 4 ˚A, se multiplicarmos esse n´umero por 2, 50×108, ter´ıamos uma dupla h´elice com comprimento da ordem de 10 cm (e largura exata de 20 ˚A). Atrav´es de um processo engenhoso, as c´elulas conseguem empacotar todas essas bases numa estrutura microsc´opica conhecida como cromossomo.

O cromossomo ´e uma fibra formada basicamente por DNA e prote´ınas: as prote´ınas da histona. A fun¸c˜ao dessas prote´ınas ´e neutralizar a carga negativa (´ıons fosfato) da mol´ecula de DNA, possibilitando que partes dela sejam suficientemente aproximadas, cul- minando numa estrutura mais compacta. Assim, antes de ser compactada na forma de um cromossomo, segmentos da dupla h´elice s˜ao enrolados num complexo proteico composto

4.4 Projeto Genoma Humano 57

EC−G

G−C =−14, 59 Kcal/mol ETA−A−T =−6, 57 Kcal/mol

EC−G A−T = ET−A G−C =−10, 51 Kcal/mol EC−G T−A = EA−T C−G =−6, 57 Kcal/mol EA−T

G−C = ECT−G−C =−9, 81 Kcal/mol EGA−C−T = ECT−A−G=−6, 78 Kcal/mol

EG−C

C−G =−9, 69 Kcal/mol EAA−T−T = ETT−A−A =−5, 37 Kcal/mol

EG−C

G−C = ECC−G−G =−8, 26 Kcal/mol EAT−A−T =−3, 82 Kcal/mol

Tabela 4.1: Energias de intera¸c˜ao devidas ao empilhamento dos planos formados por pares de

bases complementares.

por oito prote´ınas da histona, formando o nucleossomo. Seguindo, os nucleossomos se aglomeram formando uma fibra, a fibra da cromatina, resultando no objeto microsc´opico ao qual d´a-se o nome de cromossomo (figura 4.8). Quanto ao tamanho, um cromossomo humano pode se apresentar de 23 tipos distintos e aos pares (exceto nas c´elulas reprodu- tivas). A quantidade de DNA contida em cada um desses tipos, pode variar entre 50 a 250 milh˜oes de bases nitrogenadas (figura 4.9).

Todavia, existe algo de maior ˆenfase em se estudar os cromossomos do que simples- mente o seu tamanho e que est´a intimamente ligado ao DNA ali contido. Afora sua grande dimens˜ao molecular (comparado com outras mol´eculas celulares), apenas alguns segmen- tos (de tamanhos variados) do DNA desempenham aqueles papeis cruciais de transmitir e conservar a informa¸c˜ao gen´etica. Os Genes†† (figura 4.10), segmentos do DNA que co- ordenam a s´ıntese de certas prote´ınas, constituem as unidades f´ısicas da hereditariedade e s˜ao a partir deles que as informa¸c˜oes gen´eticas s˜ao transmitidas de um indiv´ıduo para outro no processo de reprodu¸c˜ao.

††Embora Gregor Mendel [27] utilizasse a palavra M erkmal para referir-se a unidades de hereditarie-

4.4 Projeto Genoma Humano 58

Figura 4.8: Devido `a presen¸ca dos ´ıons fosfato, o DNA apresenta car´ater negativo. Para neu-

tralizar essa carga, o DNA encontra-se enrolado em ´ıons positivos conhecidos como as prote´ınas da h´ıstona (figura retirada e adaptada de [53]).

Figura 4.9: Normalmente, um ser humano possui exatamente 23 pares de cromossomos: 23

herdados do pai e 23 herdados da m˜ae (figura retirada de [54]).

Conhecer todos os genes relativos a uma esp´ecie, ou pelo menos conhecer grande parte deles, implica em conhecer o Genoma dessa esp´ecie. Embora os primeiros mapas gen´eticos

4.4 Projeto Genoma Humano 59

Figura 4.10: Segmento de DNA com fun¸c˜ao heredit´aria ´e denominado de Gene. Um gene

cont´em a instru¸c˜ao para criar (codificar) um outro tipo de mol´ecula essencial ao funcionamento de um organismo vivo: as prote´ınas. Podemos dividir ainda um gene em duas partes: introns

e exons. Os introns s˜ao segmentos de um Gene (e portanto, ´e composto de DNA), que n˜ao se

atribui nenhuma fun¸c˜ao (DNA n˜ao codificante). J´a os exons, contˆem as instru¸c˜oes para codificar (criar) prote´ınas (figura retirada e adaptada de [55]).

(Genomas) datem da primeira d´ecada do s´eculo XX ‡‡, o conhecimento final do genoma humano ´e mais recente, sendo apresentado de forma definitiva em 2003. Entretanto, os investimentos e esfor¸cos empregados em realizar tal tarefa foram gerenciados ao longo de 15 anos, contando inicialmente com o lan¸camento de um plano de cincos anos elabo- rado pelos U.S. Department of Energy (DOE), Nacional Institutes of Health (N IH) e grupos internacionais e que come¸cou a ser executado a partir de 1990: oito anos mais tarde, o cromossomo 22 seria totalmente mapeado. Embora em 2001 talvez j´a tivesse sido conclu´ıdo [56], somente em abril 2003 os pesquisadores envolvidos no projeto anun- ciariam oficialmente, e cerca de dois anos antes do prazo agendado, o t´ermino do projeto (proposital e exatamente 50 anos ap´os a descri¸c˜ao da estrutura da h´elice por Watson e Crick) [57].

Atrav´es do Projeto Genoma Humano foi poss´ıvel descobrir mais de 1800 doen¸cas ligadas aos genes; cerca de 350 produtos est˜ao atualmente sendo desenvolvidos direta-

‡‡Por exemplo, em 1913, Alfred Sturtevant tinha mapeado os genes da mosca da fruta (Drosophila

4.4 Projeto Genoma Humano 60

mente a partir do conhecimento decorrente desse projeto; o Projeto Genoma proporcio- nou tamb´em a cria¸c˜ao de ferramentas que est˜ao sendo utilizadas para mapear genomas de outras esp´ecies importantes; permitiu a cria¸c˜ao do campo da farmacogen´etica, ramo que estuda como a variabilidade gen´etica afeta a resposta de um indiv´ıduo a uma droga.

CAP´ITULO

5

Blocos e probabilidades associadas a uma sequˆencia

polinucleot´ıdica do cromossomo Y

Sequˆencias polinucleot´ıdicas como o DNA s˜ao estruturas biol´ogicas que exibem v´arios graus de complexidade. Um desses graus diz respeito ao balan¸co energ´etico que pro- move a estabila¸c˜ao da sequˆencia num meio aquoso (cap´ıtulo 4). Num ˆambito estat´ıstico, essa complexidade se apresenta, por exemplo, nas correla¸c˜oes de longo alcance entre os nucleot´ıdeos compondo uma dada sequˆencia de DNA [59]. Desde a implementa¸c˜ao do projeto genoma, investiga¸c˜oes desse tipo vem sendo realizadas sob diferentes ´oticas: ca- minhadas de Levy [60], wavelets [61], informa¸c˜ao multifractal e entropia de R´enyi [62], redes [63], entre outras abordagens [64–68]. Abordagens investigativas da maneira de como a disposi¸c˜ao nos nucleot´ıdeos se estabelecem no DNA vem sendo realizadas tamb´em nos ˆ

ambitos das denominadas estat´ısticas n˜ao-convencionais. Uma dessas vertentes ´e a conhe- cida estat´ıstica de Tsallis [69]. Utilizando essa abordagem, uma sequˆencia de DNA pode ser estudada do ponto de vista da distribui¸c˜ao dos tamanhos correspondente `a sequˆencia codificante atrav´es da fun¸c˜ao q-exponencial que emerge desse formalismo [70, 71]. Ainda dentro do formalismo de Tsallis, pesquisas tem se concentrado na investiga¸c˜ao do com- portamento do calor espec´ıfico em modelos quasi-peri´odicos e a baixas temperaturas [72] e, mais recentemente, na an´alise da informa¸c˜ao contida no DNA usando os conceitos de

5.1 Sobre o cromossomo Y 62

entropia e planos de fase [73].

Outra abordagem generalista da estat´ıstica, consiste naquela introduzida por Kaniada- kis [1, 9,74], tratada no cap´ıtulo 2. Como foi mencionado l´a, essa abordagem generalizada incorpora conceitos consagrados, como comportamento de lei de potˆencia, a extensividade e aditividade (ambos no contexto do κ-c´alculo) dos sistemas que venham a ser tratados por ela (apˆendice A). ´E imerso nesse formalismo (cap´ıtulo 2), nos conceitos da teoria de informa¸c˜ao e conceito de bloco (apresentados no ca´ıtulo 3) que investigaremos, a partir de agora, sequˆencias nucleot´ıdicas contidas no cromossomo Y da esp´ecie Homo sapiens.

5.1

Sobre o cromossomo Y

O cromossomo Y constitui-se numa sequˆencia∗ composta de cerca de 57 milh˜oes de pares de bases nitrogenadas (5, 7× 107 nB)†. Como j´a foi mencionado, desse montante apenas poucas subsequˆencias possuem aquelas tarefas primordiais de codificar prote´ınas e transmitir a informa¸c˜ao gen´etica: os genes.

Dentre os principais genes contidos nesse cromossomo, podemos citar o gene SRY que ´e respons´avel por codificar a “prote´ına do sexo”, cuja fun¸c˜ao como o nome sugere est´a conectada aos processos de determina¸c˜ao do sexo de um indiv´ıduo [75]. De acordo com os estudos provenientes do mapeamento do genoma humano [76] , esse gene ´e composto por

O termo “sequˆencia”, que utilizaremos em demasia neste cap´ıtulo, ´e definido como uma cole¸c˜ao de

nucleot´ıdeos tal como se eles pertencessem a uma ´unica “fita”de DNA. No entanto, utilizaremos muitas vezes, principalmente quando nos referimos ao tamanho dessas sequˆencias, a express˜ao “sequˆencia de pares de bases”(ou at´e mesmo varia¸c˜oes dessa express˜ao). Em todo caso, quando isso ocorrer significar´a que estamos nos referindo ao car´ater complementar da referida fita de DNA, regido pelas regras de Chargaff (se¸c˜ao 4.1). Todavia, para fins de medidas do tamanho de uma sequˆencia, a utiliza¸c˜ao dessa ´

ultima express˜ao n˜ao interfere em nada nas interpreta¸c˜oes e resultados que s˜ao realizados mais adiante.

Um par de base nitrogenada (1 nB) corresponde ao conjunto de dois nucleot´ıdeos, sendo um comple-

mentar ao outro. Essa unidade se refere ao tamanho de uma sequˆencia qualquer de DNA. Por exemplo, a sequˆencia ATTGC est´a associada a 10 bases nitrogenadas, pois a sequˆencia complementar `aquela seria TAACG. Conquanto, essa sequˆencia ser´a referida apenas por 5 nB. Na literatura, principalmente naquela que se refere a biof´ısica e bioqu´ımica, ´e comum encontrarmos os s´ımbolos bp (inglˆes) ou pb (portuguˆes) como se referido a unidade de base nitrogenada; todavia, elas s˜ao totalmente equivalentes `a nB adotada durante toda essa tese.

Documentos relacionados