• Nenhum resultado encontrado

As seqüências das proteínas podem ser obtidas a partir do processo de translação do DNA complementar, o cDNA, o qual é obtido a partir do processo de transcrição reversa do RNAm. Infelizmente, este tipo de seqüência está pouco presente nos bancos de dados.

Assim, a obtenção da maioria das seqüências de proteínas é alcançada considerando dois casos: os organismos com poucos introns, regiões do genoma que não sofrem a transcrição, com a obtenção das estruturas primárias das proteínas sendo feita a partir da transcrição de DNA genômico; e organismos com muitos introns, onde métodos para a identificação dos genes e, conseqüentemente, dos trechos que produzem proteínas, precisam ser aplicados. Entretanto, esses mecanismos são rápidos e acessíveis, dado que a maioria deles já existe desde a década de 70, gerando um grande número de seqüências de proteínas.

Com o armazenamento de grande quantidade de dados, outros estudos do conjunto de proteínas dos organismos foram considerados pela Biologia Computacional. Um dos principais focos é a compreensão do relacionamento existente entre as seqüências de aminoácidos e as estruturas tridimensionais das proteínas, pois é a partir das conformações obtidas que:

• Planejam-se experimentos;

• Associam-se funcionalidades a uma proteína; • Formulam-se novas drogas;

• Descobrem-se estruturas de outras proteínas.

Há mais de 30 anos, busca-se uma solução rápida e precisa para o problema de predição das conformações tridimensionais das proteínas a partir das estruturas primárias. Para se ter uma idéia da dificuldade envolvida nesse problema, a cada seis seqüências do banco de dados de proteínas Swiss-Prot (170.140 seqüências submetidas até 15.02.05) apenas uma tem sua estrutura tridimensional conhecida no PDB (29.636 estruturas submetidas até 15.02.05). E os empecilhos variam desde a lentidão e a baixa qualidade das respostas à existência de ferramentas criadas para resolver apenas algumas situações específicas.

As várias técnicas de predição são classificadas de acordo com a informação predominante usada nos cálculos [SB93]:

• Métodos experimentais: incluem cristalografia de raios-X e técnicas de RMN - ressonância magnética nuclear.

• Aplicações teóricas: dividem-se em métodos físicos, os quais se baseiam na interação entre átomos, incluindo dinâmica molecular e minimização da energia; e em métodos empíricos ou baseados em conhecimento prévio, que dependem de estruturas de proteínas já determinadas.

A cristalografia de raios-X consiste em formar um cristal da proteína e submetê- lo a exposição de raios-X para estudar seu padrão de difração. A dificuldade desta técnica é a própria formação dos cristais, que pode durar dias. Uma das soluções para acelerar esse processo de formação é a construção deles num ambiente de gravidade nula, ou seja, no espaço. O modelo originário deste processo é estático, por apresentar a

A ressonância magnética nuclear funciona submetendo a proteína a um campo magnético, fazendo com que os spins dos núcleos dos átomos interajam com o campo, havendo uma separação (desdobramento) dos seus níveis energéticos proporcional ao campo. Em seguida, ondas de rádio são emitidas por um transmissor posicionado perto da proteína. Cada vez que os núcleos são atingidos, eles ganham energia. Entretanto, há a tendência deles retornarem ao seu estado de energia mínima, emitindo a energia excedente por radiação eletromagnética. Esta energia liberada é detectada e decodificada, originando informações que, após tratamento detalhado, fornece relações espaciais entre os núcleos, a partir dos quais pode-se obter a estrutura da proteína. A ressonância é classificada como um processo dinâmico por permitir a determinação das conformações ao longo de um intervalo de tempo.

As técnicas experimentais, apesar de apresentarem uma precisão superior aos demais métodos, são lentas e caras, pois necessitam de equipamentos, laboratórios e pessoas especializados. Por outro lado, as aplicações teóricas são mais acessíveis, sendo realizadas em qualquer computador. Dentre elas, o método físico mais conhecido é o ab

initio [BS00, Pil02], enquanto no campo empírico encontra-se a modelagem por

homologia [MSF+00] e o threading [HT00].

• Ab initio: com base na teoria termodinâmica de Anfinsens [Anf72], que sugere que a estrutura nativa de uma proteína é aquela com a menor energia global, esse método busca a estrutura de menor energia, a partir da otimização ou minimização global de uma função de energia potencial, que representa o quanto a proteína precisa se esforçar para assumir a conformação. O procedimento de obtenção do modelo é dividido em três etapas:

o Busca do mínimo global em uma representação simplificada da seqüência;

o Conversão da estrutura de menor energia para uma representação com todos os átomos;

o Busca da conformação de menor energia da nova representação.

Esse método apresenta melhores resultados para pequenas seqüências (de até 150 aminoácidos), sendo a precisão reduzida com o aumento da quantidade de aminoácidos, além de ser mais lento que as demais aplicações teóricas. A função de energia pode ser composta por potenciais derivados de mecanismos moleculares (atração entre átomos, ângulos de ligação, etc.), presentes em ferramentas como CHARMM (Chemistry at HARvard Macromolecular

Mechanics) [CHARMM] e TINKER [TINKER], assim como por potenciais de

energia originados da análise estatística de estruturas conhecidas; a otimização é aplicada através de simulação de dinâmica molecular ou de Monte Carlo. Em termos de precisão, essa metodologia apresenta os piores resultados quando comparada aos outros métodos descritos a seguir.

Homologia ou comparação: com base nas observações obtidas nos laboratórios em que proteínas com seqüências similares apresentam estruturas similares, determina-se a estrutura de uma proteína não modelada a partir de outras conhecidas, explorando-se o grau de similaridade entre as seqüências obtido a partir do processo de alinhamento entre as seqüências. As estruturas conhecidas são obtidas nos bancos de dados públicos.

• Threading ou reconhecimento de dobras: este método de modelagem foi desenvolvido considerando a característica de que uma grande quantidade de proteínas apresenta um conjunto limitado de possíveis dobra, sendo bastante semelhante ao processo da homologia. De uma maneira breve, os passos a serem seguidos na construção do modelo são:

o A partir de uma base de dados de estruturas de proteínas é selecionado um conjunto representativo;

o Determinam-se as dobras relevantes;

o Trechos da seqüência alvo são alinhados com as dobras, permitindo inserções e remoções de laços, em um procedimento de otimização da função que determina a pontuação para o alinhamento entre seqüência e estrutura (função objetiva);

o A saída do processo é a pontuação das dobras em função dos valores da função objetiva.

Um caso especial é quando a seqüência alvo tem uma semelhança significativa com alguma estrutura do conjunto representativo, nesse caso, o problema recai em uma modelagem por homologia.

Documentos relacionados