• Nenhum resultado encontrado

Recentemente, outro projeto vem tendo grande impacto sobre a nossa compreensão a respeito dos genes e do genoma. Trata-se do ENCODE (ENCyclopedia

Of DNA Elements), um consórcio internacional de cientistas que busca identificar

elementos funcionais na sequência do genoma humano. O ENCODE é um consórcio

5

Fogle (1990) examina as possibilidades de tratar genes que codificam proteínas como unidades estruturais com base em quatro modelos distintos. O modelo A é o mais inclusivo de todos, incluindo a região transcrita e todas as seqüências vizinhas que influenciam a transcrição; o modelo B se limita a região transcrita; o modelo C inclui o conjunto de éxons derivados de um pré-mRNA; e o modelo D é restrito aos éxons codificantes de um transcrito primário, excluindo as seqüências leader e trailler. Para uma análise crítica desses modelos, recomendamos Fogle (1990), El-Hani (2007) e El-Hani et al. (2009).

aberto6 e inclui pesquisadores7 de diversos campos de investigação. O ENCODE foi lançado inicialmente como um projeto piloto, em 2003, pelo Instituto Nacional de Pesquisa do Genoma Humano (NHGRI – National Human Genome Researche

Institute). Devido ao sucesso da fase inicial do projeto, o NHGRI incentivou a sua

expansão em 2007 para uma fase de produção, em que a análise foi estendida para todo o genoma humano.

Com base nos seus resultados, os cientistas do ENCODE argumentam que, para que uma sequência seja um gene, ela deve satisfazer três condições: 1. O gene é uma sequência genômica (de DNA ou RNA) que codifica diretamente produtos moleculares funcionais, seja RNA ou proteína; 2. No caso em que há muitos produtos funcionais compartilhando regiões sobrepostas, entende-se como gene a união de todas as sequências genômicas sobrepostas que os codificam; 3. Essa união deve ser coerente, mas não requer que todos os produtos necessariamente compartilhem uma subsequência comum (Gerstein et al., 2007). A partir dessas condições, eles definiram gene como a união de sequências genômicas que codificam um conjunto de produtos funcionais potencialmente sobrepostos.

Em decorrência dessa definição, diferentes produtos funcionais da mesma classe (proteínas ou RNAs) que se sobrepõem em seus usos de seqüências primárias de DNA são combinados no mesmo gene (Smith e Adkison, 2010). Desta forma, uma característica importante dessa definição é que o foco está nos produtos e, em conseqüência disso, não existe uma relação de 1:1 entre uma sequência codificadora no nível do DNA e um produto funcional (Scherrer e Jost, 2007b). Por exemplo, os produtos do splicing alternativo, como compartilham sequências em comum, são considerados produtos de um único gene. Entretanto, diferentes produtos protéicos que se originam de um único e grande transcrito de mRNA policistrônico não são considerados como derivados de um único gene, se os produtos finais não compartilharem qualquer bloco de sequência (Smith e Adkison, 2010). Este é um aspecto interessante dessa definição, na medida em que não se atribui ao gene uma unidade de estrutura.

A respeito das conseqüências do modelo de gene proposto pelo ENCODE, Smith e Adkison (2010) tecem ainda outras considerações: regiões regulatórias não transcritas (UTRs) e seqüências regulatórias distantes associadas ao gene, traduzidas ou

6

Base de dados do ENCODE: http://www.genome.gov/10005107#4

7

não, não são incluídas no gene; a definição não restringe os loci de éxons que se combinam para formar um determinado produto, de modo que os éxons podem estar em diferentes fitas de um cromossomo, ou até mesmo em cromossomos separados; as regiões transcricionalmente ativas (TARs) são consideradas como “sequências supostas”, considerando-se necessário realizar mais pesquisas sobre elas; os pseudogenes, mesmo que sejam transcritos, ainda carecem de uma função e, por isso, não são reconhecidos como genes.

Algumas dessas conseqüências, contudo, contradizem critérios estabelecidos pelos próprios Gerstein et al. (2007) para definir genes. Eles citam cinco critérios que uma definição de gene deve satisfazer: (1) ela deve ser compatível com o passado, de forma que algo que costumava ser chamado de gene deve continuar a ser um gene8; (2) deve ser independente do organismo, i.e., deve ser válida para toda a diversidade biológica; (3) deve ser o enunciado de uma idéia simples, em vez de listar vários mecanismos e exceções; (4) deve ser prática o suficiente para permitir que se enumere prontamente quantos genes há em determinado genoma; (5) deve ser compatível com o resto do vocabulário biológico que faz uso da idéia de um gene digital. Por exemplo, deve mostrar compatibilidade com o vocabulário associado ao reguloma, que representa o conjunto completo de interações regulatórias num organismo. As conseqüências da definição, conforme listadas por Smith e Adkison (2010), revelam que a definição proposta por Gerstein et al. não cumpre o terceiro critério, na medida em que ela dá vez a exceções. Além disso, a definição também não cumpre o quinto critério, na medida em que, entre as exceções listadas, estão as UTRs e as sequências regulatórias distantes, traduzidas ou não. Ou seja, a definição não leva em consideração o reguloma. Como veremos mais abaixo, Scherrer e Jost (2007b) criticam justamente este aspecto da definição.

Estas considerações refletem as dificuldades na busca de um conceito universal de gene. A definição de gene fornecida por Gerstein et al. (2007), no âmbito do ENCODE, não cumpre os critérios estabelecidos pelos próprios autores para se definir gene.

Scherrer e Jost (2007b) tecem críticas ao modelo de gene proposto pelo ENCODE. Eles argumentam que, na medida em que o objetivo do ENCODE foi

8

Consideramos este um critério conservador, tendo em vista que ele restringe a possibilidade de mudanças na nossa compreensão sobre genes, como resultado de pesquisas que ampliem e modifiquem o nosso conhecimento sobre a complexidade e dinâmica dos genomas.

descrever sistematicamente e classificar os transcritos, o modelo proposto pelo projeto é um híbrido de aspectos de codificação e função, tendo sido omitidos os efeitos da regulação que mediam esses dois processos. Para esses autores, existem dois aspectos claramente distintos na produção de um polipeptídio: a tradução dos códons em aminoácidos e a sua regulação. Portanto, dois conceitos distintos são requeridos – em sua visão – para dar conta desses dois aspectos. Como discutiremos abaixo, Scherrer e Jost (2007a, 2007b) oferecem em sua proposta essa distinção.

Documentos relacionados