• Nenhum resultado encontrado

1.1 Breve Hist´orico

1.1.3 Modelos propostos na literatura

Historicamente, a aplica¸c˜ao da teoria da informa¸c˜ao para an´alises de dados gen´eticos iniciou-se na d´ecada de 1970, por´em esses esfor¸cos n˜ao tiveram sucesso. Ap´os dez anos, o aumento de dados gen´eticos despertou novamente o interesse na aplica¸c˜ao da teoria da informa¸c˜ao para o estudo do genoma. Esse segundo per´ıodo de pesquisas continua at´e o presente momento, por´em com um n´umero muito reduzido de pesquisadores. Os trabalhos atualmente buscam analogias entre o fluxo de informa¸c˜ao biol´ogica e o sistema de comu- nica¸c˜ao, dividindo-se basicamente em trˆes linhas de pesquisas: teoria da informa¸c˜ao gen´etica, teoria da comunica¸c˜ao gen´etica e a teoria da codifica¸c˜ao gen´etica.

A aplica¸c˜ao das teorias da informa¸c˜ao, comunica¸c˜ao e codifica¸c˜ao em sistemas biol´ogicos contribuem para uma melhor compreens˜ao dos paradigmas biol´ogicos, fazendo com que a biologia, que hoje ´e uma ciˆencia descritiva, se transforme em uma ciˆencia fundamentada teo- ricamente. Por outro lado, os avan¸cos das teorias da informa¸c˜ao, comunica¸c˜ao e codifica¸c˜ao podem ser alcan¸cados atrav´es da compreens˜ao do sistema de informa¸c˜ao biol´ogico. Esta nova abordagem ´e muito promissora, podendo proporcionar v´arios avan¸cos, tais como:

• Identificar sistemas biol´ogicos que podem ser investigados experimentalmente usando as teorias da informa¸c˜ao, comunica¸c˜ao e codifica¸c˜ao;

• Usar a quantidade de dados e experiˆencias dispon´ıveis para testar a aplica¸c˜ao das teorias da informa¸c˜ao, comunica¸c˜ao e codifica¸c˜ao;

• Compreender como as interferˆencias afetam os sistemas biol´ogicos;

• Descobrir como as hip´oteses da teoria da informa¸c˜ao e codifica¸c˜ao podem ser modi- ficadas ou flexibilizadas para aplic´a-las em sistemas moleculares;

• Compreender como a codifica¸c˜ao multidimensional ´e gerada e usada em prote´ınas e outras estruturas biol´ogicas;

• Aprender como a codifica¸c˜ao tridimensional, como, por exemplo, a codifica¸c˜ao encon- trada entre as superf´ıcies de intera¸c˜ao de prote´ınas e como elas operam;

• Como as teorias da informa¸c˜ao, comunica¸c˜ao e codifica¸c˜ao podem explicar os parˆametros de intera¸c˜ao biol´ogica entre mol´eculas, sendo que tais parˆametros podem ser usados na constru¸c˜ao do mais alto n´ıvel de um sistema biol´ogico;

• A cria¸c˜ao de novas t´ecnicas de codifica¸c˜ao que aproximam a capacidade do canal para uma aplica¸c˜ao molecular tanto em n´ıvel nanotecnol´ogico quanto em n´ıvel macrosc´opico. Motivados pelo fato de que o c´odigo gen´etico ´e degenerado, isto ´e, apresenta uma estrutura redundante, v´arios pesquisadores em teoria da informa¸c˜ao e da codifica¸c˜ao realizam pesquisas em duas frentes, a saber:

1o) Sob o ponto de vista da teoria da informa¸c˜ao, aplicar os conceitos inerentes desta com

o objetivo de apresentar um m´etodo sistem´atico de determina¸c˜ao das regi˜oes codantes e n˜ao-codantes na estrutura do DNA (source coding problem);

2o) Sob o ponto de vista da teoria da codifica¸c˜ao, fornecer a fundamenta¸c˜ao necess´aria para

a caracteriza¸c˜ao de CCEs (channel coding problem).

Todavia, sob o ponto de vista da teoria de comunica¸c˜ao, as pesquisas concentram-se mais no aspecto de adapta¸c˜ao do modelo tradicional de um sistema de comunica¸c˜ao digital, em termos de diagrama de blocos, `aquele do sistema biol´ogico por considerar que a informa¸c˜ao contida no genoma (estrutura do DNA) se realiza atrav´es de pacotes de informa¸c˜ao contendo regi˜oes com sequˆencias relacionadas a sincronismo, identifica¸c˜ao de pacotes, codificantes, n˜ao codificantes, etc.

Na literatura, existem alguns trabalhos que relacionam as semelhan¸cas entre um sis- tema de comunica¸c˜ao e a biologia molecular com o objetivo de modelar os diversos sistemas

biol´ogicos. Schneider em [5], [6] e [7], apresenta um procedimento sistem´atico para identifi- car as regi˜oes codantes e n˜ao codantes nas sequˆencias de DNA utilizando conceitos da teoria da informa¸c˜ao. Yockey, [8], apresentou um modelo de sistema de comunica¸c˜ao digital com aquele associado ao da express˜ao gˆenica, ou equivalentemente, ao do fluxo de informa¸c˜ao biol´ogica. Forsdyke, [9] e [10], considerou a possibilidade de que os ´ıntrons poderiam ser os d´ıgitos de verifica¸c˜ao de paridade associados aos ´exons. Por outro lado, Rzeszowska- Wolny, [11], propˆos que um arranjo apropriado do DNA em nucleosomos pode ser relevante para a operacionalidade deste sistema. Liebovitch, [12], propˆos um procedimento que torna poss´ıvel determinar se um tipo de c´odigo corretor de erro est´a presente ou n˜ao na sequˆencia do DNA. Rosen, [13], apresentou um m´etodo para a detec¸c˜ao de c´odigos de bloco lineares que explica a possibilidade de inser¸c˜oes e dele¸c˜oes nas sequˆencias de DNA. Battail, [14], argumenta sobre a existˆencia de c´odigos entrela¸cados no DNA, uma vez que o tamanho do genoma humano ´e muito maior que o necess´ario para especificar as caracter´ısticas de cada indiv´ıduo. May et. al., [15], propˆos o uso de c´odigos de bloco e convolucional no processo de inicializa¸c˜ao da tradu¸c˜ao em organismos procariontes. Mac Donnaill, [16], propˆos um c´odigo de verifica¸c˜ao de paridade relacionado `a composi¸c˜ao dos nucleot´ıdeos. S´anchez et. al., [17], propˆos a constru¸c˜ao de um espa¸co vetorial associado ao c´odigo gen´etico tendo como estrutura matem´atica o corpo de Galois com 64 elementos, identificando cada amino´acido com uma sequˆencia bin´aria, possibilitando dessa forma uma caracteriza¸c˜ao geom´etrica associada ao c´odigo gen´etico. A abordagem destes dois ´ultimos artigos est´a relacionada exclusivamente com o c´odigo gen´etico.

Uma quest˜ao sempre presente na maioria dos trabalhos relacionados com a codifica¸c˜ao gen´etica e a codifica¸c˜ao genˆomica ´e a seguinte:

- Existe algum tipo de c´odigo corretor de erros na estrutura do DNA?

Embora importantes, os trabalhos citados anteriormente n˜ao foram capazes de forne- cer subs´ıdios sobre a existˆencia do mais simples dos CCEs nas sequˆencias de DNA, como mencionam [18] e [19].

O modelo proposto em [20] e o presente trabalho indicam, de maneira positiva, uma resposta a essa pergunta com base nas linhas de pesquisa da teoria da comunica¸c˜ao gen´etica e a teoria da codifica¸c˜ao gen´etica, e deram origem ao pedido de patente [21], em que o modelo de um sistema de comunica¸c˜ao da informa¸c˜ao gen´etica ´e comum na proposta de pesquisa pertinente aos trˆes trabalhos. ´E importante ressaltarmos que o presente trabalho d´a continuidade ao trabalho descrito em [20], bem como amplia os resultados apresentados em [20] e [21]. At´e onde ´e de nosso conhecimento, pela primeira vez sequˆencias prim´arias de uma

fita simples do DNA, com caracter´ısticas biol´ogicas distintas e comprimentos variados, s˜ao identificadas como palavras-c´odigo de um CCE e reproduzidas em termos dos nucleot´ıdeos e dos amino´acidos correspondentes. Outro avan¸co ´e com rela¸c˜ao `a identifica¸c˜ao da sequˆencia da dupla h´elice do DNA como palavra-c´odigo de um CCE e sua reprodu¸c˜ao em termos das bases complementares.

A seguir, de maneira resumida, comentaremos a proposta de pesquisa e apresentaremos a proposta do presente trabalho, na qual evidenciaremos os avan¸cos alcan¸cados.