Como havia sido previsto no primeiro relatório enviado à Fapesp, seria realizada a construção de interfaces WEB para o ParModel e para o DistGramm. Desta forma, o usuário poderia realizar modelagens e dockings remotamente e receberia os resultados por e-mail. Neste capitulo será visto o funcionamento das interfaces e a performance na execução dos dois softwares.
5.1. DistGramm
Todas as etapas da fase de criação e funcionamento do DistGramm foram detalhadas no primeiro relatório. Será visto aqui apenas uma nova interface e será feito um comentário com relação à performance do DistGramm.
Dessa forma, foi construída uma interface WEB em HTML (Hypertext Markup Language) e PHP para o DistGramm de forma que facilite a execução do GRAMM pelos pesquisadores do Laboratório de Sistemas Biomoleculares do IBILCE/UNESP e usuários de outros laboratórios, além de diminuir consideravelmente o tempo de execução de vários dockings através da paralelização no cluster Beowulf.
Figura 5.1: Interface WEB do DistGramm
Através da interface apresentada na figura 5.1, o usuário entra primeiramente com seu nome e e- mail. Depois, ele deverá inserir os arquivos no formato pdb da proteína e do ligante aos quais serão
realizados os procedimentos do docking. Após isso ele poderá alterar os parâmetros dos arquivos rpar.gr, rmol.gr e wlist.gr através da interface WEB. Caso o usuário não tenha experiência com docking, estão presentes na interface três links (em vermelho) com as possíveis configurações destes arquivos. Ao final o usuário deverá clicar em submit e iniciará a execução do DistGramm diretamente no cluster Beowulf. Caso o usuário queira fazer vários dockings, ele deverá submeter os dados várias vezes através da interface e o programa se encarregará de enviar os processos para diferentes nós (computadores), impedindo que mais de um docking seja realizado em um nó enquanto outros nós estão ociosos.
Como já foi visto, o procedimento de docking geralmente leva horas para ser concluído. Portanto seria inviável ao usuário desta plataforma ficar esperando até que o browser retornasse o resultado dos dockings. Assim, foi implementado um sistema no qual ao término do docking, os resultados são enviados diretamente ao e-mail do usuário. Como resultado o sistema retorna o arquivo .pdb com as coordenadas da proteína e do ligante complexados e um arquivo .res com as energias em cada interação.
Com relação à performance, a vantagem do DistGramm está no fato de poder executar até quinze dockings ao mesmo tempo. Caso seja realizado um único docking, o usuário não terá vantagem com relação ao tempo de processamento, mas irá obter outras vantagens: não necessita ter conhecimentos computacionais para instalar o GRAMM, diminui a propensão a erros no momento em que são editados os arquivos de entrada do GRAMM, pode-se realizar o docking a partir de qualquer computador com acesso à Internet e não necessita ter grande conhecimento com relação a técnica de docking.
O DistGramm pode ser acessado através do link:
http://www.biocristalografia.df.ibilce.unesp.br/cluster/distgramm
Devido a motivos de segurança esta interface estará protegida por senha, portanto aqui estão username e senha temporários:
Username: fapesp
Senha: relatorio2
Dessa forma, conclui-se aqui a descrição das modificações realizadas no DistGramm.
5.2. O ParModel
Como já foi visto anteriormente, o ParModel é um programa que realiza a automatização e paralelização do software Modeller. A vantagem do ParModel com relação ao DistGramm, é o fato de poder se realizar uma modelagem com o tempo de processamento 15 vezes menor do que em uma máquina seqüencial. Dessa forma não há a necessidade de se realizar várias modelagens para se obter um ganho de tempo de processamento.
Para se obter um bom modelo para uma proteína, devem ser realizadas diversas modelagens. Entretanto, ao construir muitos modelos o Modeller demanda de um tempo de execução muito alto (leva cerca de 4 dias para realizar 1000 modelagens em uma máquina com processador de 800MHz de freqüência de clock).
Para minimizar este tempo de processamento, o ParModel realiza a edição de vários arquivos .top com 1/15 do número total de modelos para cada arquivo ( por exemplo, se forem feitas 1500 modelagens, cada arquivo se encarregará de fazer 100 modelos). Após isso cada arquivo é enviado pelo nó mestre aos demais nós do cluster através de um sistema de NFS (Network File System). Após enviados os arquivos de alinhamento e .top, o nó mestre realiza os disparos para a execução dos Modeller remotamente através de comandos rsh (Remote Shell). Conforme cada nó for terminando sua modelagem, o resultado é enviado ao nó mestre. Após todos os nós terem terminado suas modelagens, o nó mestre realiza a análise automática de todos os modelos através do software Procheck e seleciona o melhor modelo.
Através da interface (figura 5.2) o usuário deverá entrar com o arquivo contendo a seqüência de aminoácidos da proteína alvo e os arquivos no formato pdb dos templates. Além disso, o usuário deverá entrar com o seu e-mail (para que ele possa receber os resultados posteriormente), o número total de modelos que serão construídos e a resolução média dos templates (este parâmetro é usado pelo Procheck para fazer a análise dos modelos). Como resultado o usuário receberá por e-mail o arquivo .pdb do melhor modelo, o seu mapa de Ramachandran e um arquivo contendo todos os modelos gerados e seus percentuais de qualidade.
O ParModel pode ser acessado através do link:
http://www.biocristalografia.df.ibilce.unesp.br/cluster/parmodel
Devido a motivos de segurança esta interface estará protegida por senha, portanto aqui estão username e senha temporários:
Username: fapesp
Senha: relatorio2