Com o advento da era genômica, a identificação de genes tornou-se um processo mais dinâmico, capaz de gerar um vasto volume de informação em um curto período de tempo (Grivet e Arruda, 2001). Vários projetos cujo objetivo é estudar o transcriptoma, ou seja, a população de RNAs transcrita de um determinado organismo, vêm sendo conduzidos em diferentes espécies vegetais (Ewing et al., 1999; White et al., 2000; Dong et al., 2003; Ma et al., 2003), denominados projetos EST (Expressed Sequence Tag ou Etiqueta de Seqüências Expressas). Esses projetos são uma poderosa ferramenta para identificar genes expressos em determinados tecidos e/ou tipos celulares de interesse. Nos projetos EST, bancos de dados contendo pequenas seqüências de DNA são gerados a partir do seqüenciamento de moléculas de cDNA, sintetizadas das populações de mRNA (RNA mensageiro), empregando iniciadores específicos do vetor (plasmídio), o qual foi utilizado no processo de clonagem gênica. Essas seqüências são usadas no procedimento de montagem dos contigs ou clusters que, na maioria das vezes, possuem ORFs (open reading frames) representando a região codificadora de diversos genes (Telles et al., 2001). Desta forma, a tradução destas ORFs fornece os primeiros indícios da função da proteína codificada por um determinado clone de cDNA. ESTs produzem informações biológicas de centenas de genes de um organismo, além de permitirem a identificação de diferentes isoformas de transcritos (Andrews et al., 2000) e o mapeamento gênico (Schuler, 1997; Wu et al., 2002). Outro aspecto importante dos ESTs é o acesso a informações sobre os genes expressos em organismos que contêm um genoma complexo (Vettore et al., 2001), tais como a cana-de-açúcar. No Brasil, concluiu-se em outubro de 2000 o projeto EST da cana-de-açúcar (“SUCEST - Sugarcane EST Project”), cujo objetivo foi gerar um banco de dados contendo cerca de 250.000 ESTs, obtidos de diferentes tecidos/orgãos vegetais (Vettore et al., 2003).
A grande quantidade de ESTs seqüenciados a partir de diferentes bibliotecas de cDNA pode fornecer uma estimativa da abundância relativa de transcritos de genes de interesse em diferentes tecidos/órgãos vegetais e também em diversas condições biológicas (Audic e Claverie, 1997). Esse “northern digital”, aliado a metodologias experimentais, possibilita a
identificação e análise de novos genes, os quais podem ser utilizados em programas de melhoramento genético via biotecnologia.
Outra metodologia utilizada para avaliar a expressão gênica via seqüenciamento é a SAGE (serial analysis of gene expression). O método baseia-se no isolamento de pequenas seqüências de cDNA (denominadas tags), obtidas a partir de moléculas individuais de mRNAs, e sua posterior concatenação em longas moléculas de DNA. Essas longas moléculas de DNA são clonadas e seqüenciadas, permitindo assim a análise qualitativa e quantitativa dos transcritos celulares (Velculescu et al., 1995). Recentemente, Lee e Lee (2003) utilizaram essa metodologia para avaliar a expressão gênica em grãos de pólen de Arabidopsis thaliana submetidos ao estresse por frio.
Juntamente com os projetos EST, surgiram novas técnicas capazes de avaliar a expressão de milhares de genes simultaneamente. Dois exemplos dessas técnicas são o DNA micro e macroarray (micro e macroarranjos de DNA). Esses arranjos de DNA podem ser gerados utilizando-se cDNAs inteiros, ESTs, produtos de PCR ou mesmo oligonucleotídeos; os microarranjos são fixados a superfícies de lâminas de vidro ou chips de silício, enquanto os macroarranjos são fixados a membranas de náilon (Schena et al., 1995; Schena et al., 1998; Desprez et al., 1998; Schummer et al., 1999; Freeman et al., 2000).
Os microarranjos de DNA são largamente utilizados por grupos de pesquisa no mundo inteiro. Nessa metodologia, as seqüências de DNA são hibridadas simultaneamente a sondas de cDNA marcadas com dois fluoróforos (Cy-3 e Cy-5), permitindo a análise comparativa direta da expressão gênica (Seki et al., 2002). Como a resposta aos estresses ambientais envolve a regulação de um grande número de genes (Seki et al., 2002), vários grupos têm utilizado a metodologia de microarranjos de DNA para avaliar o perfil de expressão gênica em espécies vegetais (Reymond et al., 1999; Kawasaki et al., 2001; Fowler e Thomashow, 2002; Seki et al., 2002; Provart et al., 2003; Rabbani et al., 2003).
Os macroarranjos de DNA são uma alternativa para os microarrays. Sua principal vantagem é que essa técnica não necessita de equipamentos especiais para hibridação e podem ser construídos tanto automatica como manualmente. Uma desvantagem é não permitir uma alta densidade de genes, quando comparados aos microarranjos de DNA (Freeman et al., 2000). Vários relatos na literatura demonstraram o uso dessa tecnologia com sucesso (Zhao et al., 1995; Desprez et al., 1998; Schummer et al., 1999; Carson et al., 2002).
Desta forma, no presente trabalho de doutoramento, empregaram-se a técnica de macroarranjos de DNA e a mineração do banco de dados de ESTs com o objetivo de avaliar a expressão e identificar novos genes em tecidos de cana-de-açúcar, os quais são
diferencialmente regulados em condições de baixas temperaturas. Quatro artigos científicos, dois publicados, um em fase de submissão e outro em fase final de preparação, descrevem os estudos e as análises desenvolvidas durante o projeto. O primeiro artigo (capítulo I) trata de uma revisão sobre a técnica de macroarrays e alguns exemplos de sua aplicação. O segundo (capítulo II) discorre sobre a análise do perfil de expressão gênica em tecido foliar de cana-de- açúcar sob estresse por baixas temperaturas. O terceiro artigo (capítulo III) trata da identificação e análise do perfil de expressão gênica, em diferentes tecidos e sob estresse por frio, de proteínas da família PUMP e da família AOx, em cana-de-açúcar e em A. thaliana. Finalmente, o quarto artigo (capítulo IV) descreve a caracterização de um fator de transcrição identificado em nossos macroarrays, o qual pode ser um componente importante para a via de sinalização molecular em resposta a estresses.