• Nenhum resultado encontrado

3 Ferramentas para Genómica Comparativa

3.6 Ferramentas para Alinhamento Múltiplo

3.6.3 JALVIEW

Jalview [52] é um editor disponível que permite o alinhamento múltiplo de sequências e é

frequentemente usado em páginas Web como a do CLUSTALW2. O Jalview é actualmente suportado pela BBSRC (Biotechnology and Biological Siences Research Council, UK).

51 A ferramenta permite: ler e escrever alinhamentos numa variedade de formatos (FASTA,

PFAM, MSF, CLUSTAL, BLC, PIR, …), guardar alinhamentos e árvores associadas em

formato Jalview XML e inserir ou retirar gaps usando facilmente o rato ou o teclado. Também é possível realizar alinhamentos de sequências usando Web services (CLUSTAL,

MUSCLE, …), fazer análises de conservação de aminoácidos, para além de outras opções

que estão ao alcance do utilizador que pertende efectuar o alinhamento. Jalview permite calcular árvores UPGMA e NJ e desenha-las com base nas distâncias de percentagens. No que diz respeito à análise das sequências é possível agrupa-las pelo estudo dos componentes principais e remover sequências redundantes.

Jalview permite predefinir cores para os alinhamentos ou grupos, a impressão dos

alinhamentos, a visualização em páginas HTTP e a publicação em PNG ou como EPS.

3.7 Conclusão

Neste capítulo foram descritas algumas ferramentas e aplicativos de software que são usados em pesquisa em Bioinformática. Partindo de sequências de bases de nucleótidos até às proteínas, as ferramentas transformam esta rede biologicamente complicada, em métodos informáticos mais simples e capazes de ajudar o cientista na análise dos dados e na formulação de hipóteses.

As sequências biológicas, sobretudo as sequências de ácidos nucleicos e proteínas, são o tipo mais abundante de dados biológicos disponíveis electronicamente. A comparação destas sequências aos pares é uma técnica essencial em Bioinformática, pois é o ponto de partida para pesquisar em bases de dados biológicos, construir árvores de evolução e identificar características comuns de famílias de proteínas com vista à criação de modelos de semelhança.

Na primeira secção deste capítulo resume o levantamento de informação pertinente sobre ferramentas ligadas ao pacote BLAST. Primeiro, é apresentado o algoritmo e os tipos de programas a que se dedica, nomeadamente, BLASTn, BLASTp, BLASTx, tBLASTn e tBLASTx. É feita uma análise da base estatística do algoritmo e do seu relatório, são também apresentadas algumas ferramentas vastamente usadas associadas ao algoritmo BLAST, como o BLAST URLAPI e o Map Viewer. Ainda nesta secção descrevem-se

52

algumas variações ao NCBI-BLAST, especificamente, o BLAT, o PSI-BLAST e o WU-BLAST, bem como são apresentadas as ferramentas executáveis pela linha de comandos do pacote NCBI-BLAST, como o BLASTALL, para a execução de qualquer um dos programas de busca e comparação, e o FormatDB, para conversão de dados para o formato BLAST.

Na segunda secção do capítulo é feita uma descrição do algoritmo FASTA, conceptualmente este algoritmo, aplicado em pesquisas de base de dados, utiliza um procedimento rápido que verifica cada sequência da base de dados para os segmentos que são os melhores resultados no teste da sequência, isto de uma forma semelhante ao BLAST, mas metodicamente diferente.

Actualmente, todas as informações sobre ácidos nucleicos, genomas, proteínas, entre outras informações biológicas são frequentemente armazenadas em bases de dados. Pareceu-nos pertinente a exposição da pesquisa do estado da arte relativamente ao crescimento destas bases de dados, sobretudo, bases de dados de sequências biológicas como o GenBank e o Swiss-Prot/TrEMBL e de outras informações sobre dados biológicos, como o PubMed.

Os motores de busca web dedicados à genómica têm uma grande importância na partilha de dados entre investigadores, portanto, neste capítulo é relatado o ENSEMBL, este é um projecto conjunto entre a EBI e a Wellcome Trust Sanger Institute, que anota genomas de organismos eucariontes. O Genome Browser da UCSC é outra ferramenta contenplada no capítulo, que recolhe todas as informações pertinentes permitindo vários níveis de exploração e interpretação pelos investigadores.

O alinhamento múltiplo de sequências é uma das técnicas de trabalho que fornece ao utilizador mais informações sobre os dados, designadamente, na comparação de várias sequências em simultâneo, o que permite, por exemplo, retirar informações de similaridade e construir hipóteses evolucionárias. Neste sentido, pareceu-nos relevante descrever três ferramentas que permitem a construção de alinhamentos múltiplos de sequências – o MUSCLE, o CLUSTALW e o JALVIEW.

53

Capítulo 4

4 Proteo – requisitos da aplicação

Devido à característica bruta dos dados biológicos, é necessário recorrer ao seu tratamento para se obter informação que permita analisar e tomar a decisão mais eficaz para um determinado problema. Assim, surge a necessidade de aplicações como esta agora apresentada, contudo, é oportuno efectuar uma análise da informação que é necessária ao utilizador, isto é, que conjunto de dados e de que forma devem estar organizados para adquirirem um valor semântico adicional além do valor individual dos dados.

O Proteo pretende ser um sistema de informação que facilite os investigadores na análise automatizada de dados referentes ao domínio das bactérias e, por isso, este deve proporcionar um acesso transparente a bases de dados e a algumas ferramentas usuais em Bioinformática como o BLAST ou outras. Nesse sentido foram desenvolvidos alguns algoritmos para análise de grandes volumes de informação genética, bem como uma interface gráfica de utilizador, que auxilie na interpretação dos dados.

A elaboração dos requisitos para a ferramenta informática que se pretende desenvolver foi traçada pelos investigadores do BIOCANT, cuja experiência com várias ferramentas de alinhamento e visualização de dados biológicos, foi fundamental para definir as funcionalidades que a aplicação aqui apresentada necessita, para apoiar estes investigadores, no alinhamento de genomas.

54

No documento Algoritmos para Genómica Comparativa (páginas 76-80)