• Nenhum resultado encontrado

Genes como conjuntos de domínios de DNA

Thomas Fogle, por exemplo, argumentava, já em 1990, contra a manutenção do conceito do gene como unidade – não importando se como unidade de herança, estrutura, função e/ou informação. A tentativa de manter esse conceito diante de anomalias que, àquela época, já haviam se acumulado substancialmente, levara a dois aspectos que são hoje reconhecidos como parte da crise do conceito de gene: a proliferação de significados atribuídos ao termo “gene” e a ausência de um apro- priado reconhecimento da diversidade das arquiteturas gênicas, particularmente em eucariotos. Para Fogle, não é o conceito de gene em si, mas o conceito de gene como unidade que não pode ser reconciliado com nosso conhecimento crescente sobre a estrutura e função dos genomas. Assim, seria possível salvar o conceito de gene por meio de uma redefinição que deixasse de lado o conceito de unidade. Essa não é, contudo, uma mudança menor: a principal bagagem histórica do con- ceito de gene reside precisamente em sua compreensão como unidade básica da vida. (KELLER, 2002)

Fogle (2000) propõe uma mudança no estatuto ontológico do conceito de gene, de uma unidade para um conjunto de domínios de DNA. De acordo com esta visão, um gene é construído a partir de uma reunião de domínios de DNA, como “[...] uma coleção de entidades componentes que juntas definem sua estrutura e influenciam o fenótipo”. (FOGLE, 1990, p. 367) Os domínios são, por sua vez, se- quências de nucleotídeos que podem ser distinguidas umas das outras com base em propriedades estruturais e/ou atividades: éxons, íntrons, promotores, amplifi- cadores (enhancers), operadores etc. Uma vez compreendidos dessa maneira, uma

consequência importante é que os genes não são mais localizados no DNA. Apenas domínios se encontram no DNA. Um domínio único pode ser parte de mais de um gene, de modo que nenhuma unidade que corresponda ao gene pode ser identifi- cada no DNA. Um aspecto positivo dessa proposta é que ela acomoda várias ano- malias, como, por exemplo, genes superpostos e emenda alternativa, ao romper com a ideia do gene como unidade estrutural. Há, contudo, aspectos que não são claros na reformulação trazida por Fogle: ele está propondo que o gene, como con- junto de domínios, deve ser entendido de forma realista – situado na célula em si mesma, digamos, ao nível do RNA – ou que devemos compreender o gene de modo menos realista, por exemplo, como um objeto epistêmico (RHEINBERGER, 2000) construído pela comunidade científica? Não é possível responder essa pergunta com clareza a partir dos argumentos de Fogle, o que tem implicações importantes para sua interpretação: no primeiro caso, os genes continuam sendo compreen- didos em termos ontológicos, embora situados numa entidade celular distinta do DNA; no segundo, a compreensão do que sejam genes se desloca na direção da epistemologia.

Conceito sistêmico de gene

Maria Inês Pardini e Romeu Guimarães (1992) também argumentam con- tra a ideia de genes como unidades, propondo um conceito sistêmico de gene que comporta uma alteração no seu estatuto ontológico na mesma direção da propos- ta de Fogle, mas de modo mais claro. Eles sustentam que um gene é uma combi- nação de sequências de ácidos nucleicos (DNA ou RNA) que corresponde a um produto determinado e é definida pelo sistema celular. Essa é uma posição mais claramente realista, sugerindo que tal combinação de sequências nucleotídicas poderia ser encontra em moléculas de RNA maduras, após o processamento de transcritos primários. Contudo, tal ideia não vai além de uma sugestão no trabalho desses autores.

Revisitando o gene a partir dos projetos genoma

Os projetos genoma resultaram na chamada “era pós-genômica”. (MORANGE, 2006) Após os primeiros genomas completos terem sido sequenciados, a genô- mica e a proteômica emergiram como campos de pesquisa. Isso eventualmente conduziu a uma nova era da investigação genética tornada possível pelo acesso

aos genomas completos, disponibilizados em bancos de dados de consulta pública, como aquele do National Center for Biotechnology Information,6 mantido pelo go-

verno norte-americano. Nesses novos campos, entre as tarefas que têm engajado pesquisadores, temos a tentativa de atribuir significado – por exemplo, funcional – à enorme quantidade de dados produzida pelo sequenciamento de genomas, pelo mapeamento em larga escala de redes celulares complexas (por exemplo, de inte- ração entre proteínas) e pela investigação em larga escala de padrões de expressão gênica. Ao longo desse esforço, emergiram não somente dificuldades adicionais para o modelo molecular-informacional, mas também propostas com a intenção de ressignificar o que entendemos por “genes”.

Nesse sentido, temos uma hesitação em derivar dos achados sobre geno- mas e proteomas uma reformulação de nosso entendimento dos genomas. Num glossário associado ao Projeto Genoma Humano (PGH), por exemplo, o gene é definido como “a unidade física e funcional fundamental da hereditariedade. Um gene é uma sequência ordenada de nucleotídeos localizada numa posição parti- cular em um cromossomo particular que codifica um produto funcional específi- co – uma proteína ou molécula de RNA)”. (GENE, [entre 1990-2003]) Essa é uma definição conservadora, nada mais que uma expressão do conceito molecular clássico.

Contudo, essa atitude mais conservadora não caracteriza todos os atores e recursos associados ao PGH. Por exemplo, num dos artigos que apresentaram, há mais de dez anos, o primeiro esboço (draft) da sequência genômica humana, en- contramos uma interpretação do gene como “um lócus de éxons co-transcritos”. (VENTER et al., 2001) Essa interpretação decorre de observações de que “[...] um gene único pode dar origem a múltiplos transcritos e, assim, a múltiplas proteínas distintas com funções múltiplas, por meio de emenda alternativa e de sítios alter- nativos de iniciação e terminação da transcrição”. (VENTER et al., 2001, p. 1317) Temos aqui um avanço em relação a definições mais conservadoras, como aquela citada do glossário acima. Afinal, essa interpretação se distancia do conceito mole- cular clássico e busca acomodar fenômenos como a emenda alternativa. Contudo, ela não comporta mudanças ontológicas mais importantes, como aquelas suge- ridas por Fogle (1990) e Pardini e Guimarães (1992) e, por isso mesmo, ainda se defronta com dificuldades, de diferentes magnitudes. A emenda alternativa, por

exemplo, não respeita as fronteiras dos éxons, podendo afetar o tamanho dos éxons codificantes. Assim, sequências que estão presentes em alguns RNAs como éxons, em outros, são eliminadas, como se fossem íntrons, ainda que, no DNA, es- tejam situadas dentro da fronteira do que consideramos éxons. Logo, a ideia de tomar éxons como unidades estruturais no genoma, que está subjacente a propos- tas como a de Venter e colaboradores (2001), também é desafiada pela emenda alternativa. Além disso, mudanças podem ocorrer durante o processamento de RNA de modo a produzir sequências codificadoras que não são encontradas ao nível do DNA, como no caso da edição de mRNA. Por fim, focar nos éxons codi- ficantes pode deixar de fora um dos achados mais impressionantes da pesquisa genômica dos últimos dez anos, a saber, que não somente uma porção diminuta do genoma humano codifica proteínas (algo que já se sabia antes), mas que as re- giões anteriormente denominadas “DNA lixo” são na verdade transcritas em pe- quenas moléculas de RNA de diferentes classes, que não codificam proteínas, mas cumprem papéis centrais na dinâmica genômica, por exemplo, em sua regulação. (CARTHEW, 2006; HENDRICKSON et al., 2009; NIWA; SLACK, 2007) Li e colabo- radores (2011) verificaram, por exemplo, mais de 10,000 sítios nos quais as sequ- ências de RNA não correspondem a sequências de DNA, numa comparação entre sequências de RNA e DNA de linfócitos B de 27 indivíduos de nossa espécie.

Em outros projetos da era pós-genômica, sugestões explícitas de redefini- ção do gene são encontradas. A mais notável resultou do projeto ENCyclopedia of DNA Elements (Encode), um consórcio internacional de cientistas que estão bus- cando identificar os elementos funcionais na sequência genômica humana.7 De

acordo com esta definição, uma sequência de nucleotídeos deve satisfazer três condições para ser um gene: 1) Um gene é uma sequência genômica (de DNA ou RNA) que codifica diretamente produtos funcionais, sejam RNAs ou proteínas; 2) No caso de haver vários produtos funcionais que compartilham regiões super- postas [no DNA], toma-se a união de todas as sequências genômicas superpostas que os codificam; 3) Essa união deve ser coerente – feita separadamente para os produtos de RNA e proteicos finais – mas não requer que todos os produtos com- partilhem necessariamente uma subsequência comum. (GERSTEIN et al., 2007)

7 A base de dados do Encode se encontra em <http://www.genome.gov/10005107#4>.Os participantes e os projetos incluídos no Encode são listados em <http://www.genome.gov/26525220>. Ver também The Encode Project Consortium (2004).

Com base nessas condições, eles definem o gene de modo conciso como “uma união de sequências genômicas que codificam um conjunto coerente de pro- dutos funcionais potencialmente superpostos”. (GERSTEIN et al., 2007, p. 677)

Temos aqui um esforço para manter o gene no DNA, não obstante a difi- culdade de segmentar essa molécula em genes, como seus constituintes.8 É desse

esforço que decorre a formulação do gene como união de sequências genômicas, e não como segmento de DNA. Nesse sentido, a definição de Gerstein e colabo- radores segue na mesma direção daquelas de Fogle e Pardini e Guimarães, mas se mostra mais conservadora do que estas, que, como discutimos acima, podem implicar que os genes sejam situados no RNA, e não no DNA, ou que os genes se- jam mais bem entendidos como objetos epistêmicos construídos pela comunidade científica, o que pode resultar (embora não o faça necessariamente) que hipóte- ses de correspondência a entidades reais no DNA ou no RNA não sejam necessá- rias. Em suma, por essa via, pode-se retornar a uma atitude instrumental em rela- ção aos genes, como aquela que caracterizou as primeiras décadas da Genética. Sintomaticamente, há vários anos, a interpretação de um filósofo da Biologia (FALK, 1986) era que as dificuldades de lidar com o conceito de gene já haviam inclinado a comunidade científica a um retorno a tal atitude instrumental. Talvez esta atitude esteja subjacente à própria ideia de Gerstein e colaboradores (2007) de definir genes como uniões de sequências genômicas que codificam conjuntos coerentes de produtos funcionais, uma vez que estas uniões podem situar-se mais em nossos modelos sobre os sistemas genéticos do que nas moléculas propria- mente ditas.

Seja como for, uma consequência importante dessa definição decorre da superposição de produtos funcionais em seu uso das mesmas sequências primá- rias de DNA: o foco se desloca das sequências de DNA propriamente ditas para os produtos gênicos e disso decorre a eliminação de uma relação de um-para-um entre sequências codificantes de DNA e produtos funcionais. Ou seja, o conceito do gene como unidade estrutural e funcional no DNA foi posto de lado, sem dúvida em resposta às anomalias discutidas acima, explicitamente levadas em conta por Gerstein e colaboradores (2007).

No entanto, a definição de gene do Encode não está livre de problemas. Smith e Adkison (2010) apresentam uma série de exemplos que constituem exceções à

definição do Encode e, assim, violam um dos critérios para uma definição satisfató- ria de gene que os próprios Gerstein e colaboradores assumem, a saber, de que tal definição deve ser um enunciado de uma ideia simples, não uma lista de vários me- canismos e exceções. (GERSTEIN et al., 2007, p. 676) Scherrer e Jost (2007b), por sua vez, oferecem uma crítica de maior alcance, argumentando que o conceito de gene proposto pelo Encode é um híbrido de dois aspectos dos sistemas genéticos, a codificação e a função, mas deixa de um lado um terceiro aspecto, a regulação, que eles consideram crucial, por mediar entre os dois primeiros aspectos.

Uma mudança mais radical na ontologia do gene: de entidade a processo

Uma mudança ontológica mais radical se encontra no conceito do gene mo- lecular processual (process molecular gene concept) de Eva Neumann-Held (1999, 2001).9 Nesse caso, genes não são tratados como entidades compostas por sequên-

cias de ácidos nucleicos, sejam de DNA ou de RNA, mas como todo o processo mo- lecular subjacente à capacidade de expressar um produto particular (polipeptídeo ou RNA): “[...] ‘gene’ denota o processo recorrente que leva à expressão temporal e espacialmente regulada de um produto polipeptídico particular”. (GRIFFITHS; NEUMANN-HELD 1999, p. 659) O estatuto ontológico dos genes muda radical- mente com essa proposta, na medida em que eles passam de entidades a proces- sos. O foco se desloca para o modo como sequências de DNA são usadas no pro- cesso de síntese de polipeptídeos e RNAs, envolvendo não somente o DNA, mas uma série de entidades que participam de tal processo, incluindo grandes com- plexos macromoleculares incluindo RNAs e proteínas, como aqueles envolvidos na transcrição de sequências de DNA em moléculas de RNA. Uma das vantagens dessa maneira de compreender os genes é que ela se contrapõe às visões hiper- bólicas sobre o papel do DNA nos sistemas vivos que comentamos acima. A tese de que o DNA poderia ser um programa desenvolvimental ou um controlador do metabolismo celular não é compatível com tal visão, que deixa particularmente claro que o DNA é um recurso usado pela célula, lado a lado com outros recursos, para realizar processos metabólicos fundamentais. (OYAMA, 2000)

No conceito do gene molecular processual, diferentes condições epige- néticas que podem afetar a expressão gênica são incorporadas no gene. Uma

interpretação que trata os genes como processos permite superar alguns proble- mas enfrentados pelo conceito de gene. Ela torna possível acomodar anomalias enfrentadas pelo conceito molecular clássico, como, por exemplo, a emenda alter- nativa ou a edição de mRNA, uma vez que esses fenômenos são parte dos pro- cessos que constituem, nessa interpretação, o gene. Essa proposta também en- frenta, no entanto, dificuldades importantes: 1) ela aumenta substancialmente o número de genes em eucariotos, em virtude do grande número de polipeptídeos gerados por emenda alternativa; 2) faz com que o gene seja transposto para um nível superior na hierarquia biológica, ao incluir no gene os sistemas multimolecu- lares associados com transcrição e processamento de RNA, ou com a tradução de mRNA em sequências de aminoácidos; 3) torna difícil individuar genes, em virtude da dependência dos processos de expressão gênica em relação ao contexto celular e supracelular. (MOSS, 2001)

Esses são problemas sérios, mas não necessariamente fatais. (EL-HANI; QUEIROZ; EMMECHE, 2009; MEYER; BOMFIM; EL-HANI, 2013) O primeiro problema é o menos sério: se uma compreensão acerca dos genes for considerada mais apropriada, não será motivo para recusá-la o fato de que aumenta o núme- ro de genes. Ao contrário, isso pode ser até mesmo uma vantagem do tratamento dos genes como processos, na medida em que pode ajudar a resolver o chamado paradoxo do valor N (CLAVERIE, 2001; XIA et al., 2008), ou seja, de que o conjun- to total de genes (genoma) dos metazoários é muito menor do que seu conjunto total de proteínas (proteoma). Essa observação constitui um paradoxo também pela similaridade da quantidade de genes encontrada em organismos que situa- mos, ainda que intuitivamente, em diferentes graus de complexidade, como seres humanos, moscas-das-frutas (Drosophila melanogaster), Caenorhabditis elegans (um nematódeo) e a planta Arabidopsis thaliana. Humanos, por exemplo, possuem em torno de 30 a 40 mil genes (INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM, 2001; VENTER et al., 2001) e um proteoma composto por cerca de 90 mil proteínas (MAGEN; AST, 2005), cinco vezes maior do que o proteoma da drosófila. O conceito do gene molecular processual acomoda essa diferença, ao in- cluir mecanismos que levam à expansão do proteoma, como a emenda alternativa, nos próprios genes, tornando o número de genes e proteínas equiparáveis.

Decerto, isso não resolve todos os dilemas resultantes do conhecimen- to que temos obtido sobre os tamanhos do genoma e do proteoma de organis- mos. De modo geral, as dimensões do genoma e do proteoma não se mostram

correlacionados com nossas intuições sobre a complexidade dos organismos. Nesse ponto, a atenção tem sido cada vez mais dirigida para redes complexas de interações entre genes, produtos gênicos e outros componentes celulares, na me- dida em que a complexidade das redes de interações entre proteínas e das redes regulatórias parece capaz de explicar as diferenças de complexidade entre os or- ganismos. (SUKI, 2012; XIA et al., 2008)

Quanto ao segundo problema, de que o gene é transposto para um nível su- perior na hierarquia biológica pelo conceito molecular processual, é possível ar- gumentar que conceitos biológicos são usualmente definidos de uma perspectiva organísmica, o que torna natural relacionar conceitos em um dado nível hierárqui- co a conceitos em níveis superiores, celulares e supracelulares. Assim, pareceria natural que genes sejam dependentes de níveis superiores na hierarquia biológica, como uma consequência da complexidade dos sistemas vivos. Contudo, “ser de- pendente de” não é o mesmo que “ser definido como”, de modo que esse argumen- to não fornece senão um ligeiro paliativo para este problema. É necessário admitir, pois, que a transposição do gene molecular processual para um nível superior na hierarquia biológica é de fato um aspecto contraintuitivo dessa maneira de com- preender genes. Não podemos esquecer, contudo, que muitos avanços científicos são contraintuitivos e, tampouco, que a situação não deve ser interpretada (ao menos não necessariamente) como um reposicionamento ontológico dos genes, mas, em termos epistemológicos, como a construção de um modelo que decompõe sistemas vivos de maneira diversa da usual, situando os genes em níveis diferentes de um modelo explicativo.

Finalmente, no que concerne ao terceiro problema, a dificuldade de indivi- duar genes pode ser considerada uma característica e não um problema de uma abordagem orientada para processos. Por sua dependência do contexto e falta de contornos tão bem definidos quanto aqueles das entidades, processos são de fato mais difíceis de individuar do que entidades. Contudo, a situação é similar àquela do primeiro problema: se concluirmos que tratar genes como processos é uma maneira mais apropriada de compreendê-los, lidar com genes mais difíceis de serem individuados constituirá uma razão fraca para rejeitar tal mudança con- ceitual. Além disso, é possível argumentar que a dificuldade de individuar genes pode se converter numa vantagem dessa abordagem, na medida em que mina a plausibilidade de visões atomistas da arquitetura e dinâmica do genoma, compro- metidas com a ideia de que este seria constituído por algum bloco de construção

facilmente identificável. Ou seja, a dificuldade de individuação de genes pode não ser mais do que a dificuldade de identificar genes como unidades, mas longe de ser uma desvantagem isso pode significar apenas um rompimento com uma ideia reconhecida como problemática na própria literatura sobre o conceito de gene. (FOGLE, 1990; KELLER, 2002; KITCHER, 1982)

Alguns trabalhos posteriores propuseram modificações radicais da ontolo- gia do gene que vão na mesma direção do conceito do gene molecular processu- al de Neumann-Held, sugerindo que genes são processos construídos pela célula usando sequências nucleotídeos, e não entidades físicas no DNA ou em alguma outra molécula, como o RNA. Keller (2005), ao apresentar uma visão mais otimista sobre o futuro do gene do que vemos em O século do gene (KELLER, 2002), toma essa direção, ainda que não a desenvolva plenamente. Em seu artigo de 2005, ela argumenta que os sistemas genéticos assumiram, no século XXI, o papel conferi- do ao gene no século anterior, mas este último conceito poderia sobreviver, mas somente se fosse radicalmente ressignificado. Sua proposta é que desloquemos nosso foco das entidades ou dos componentes dos sistemas vivos vistos isolada- mente, para uma compreensão de processos de interações em redes complexas. Contudo, para que esse deslocamento seja bem sucedido e, indo além de jargões e modismos, possamos de fato construir uma “biologia de sistemas” (systems biology), é necessário superar hábitos de pensamento arraigados, que dão priori- dade às partes dos sistemas, e não aos sistemas em sua totalidade. Ou seja, modos reducionistas de pensar devem ser superados por uma visão que seja realmente sistêmica, e não somente um reducionismo em larga escala, como parece ser boa parte dos projetos do que se tem chamado “biologia de sistemas”. (BRUNI, 2003;