• Nenhum resultado encontrado

2.3 Computação Distribuída Aplicada à Modelagem Molecular

2.3.2 INFRAESTRUTURAS BASEADAS EM GRIDS COMPUTACIONAIS

2.3.2.1 World Community Grid

O World Community Grid (WCG, 2016) é uma iniciativa desenvolvida pela IBM que

utiliza o ambiente de grid computacional da plataforma BOINC (BOINC, 2016) para apoiar projetos científicos voltados ao beneficio humanitário.

Alguns destes projetos são voltados para a área da saúde e executam os programas AutoDock (GOODSELL; MORRIS; OLSON, 1996) e AutoDock Vina (TROTT; OLSON, 2010) na máquina do voluntário, na tentativa de encontrar um potencial fármaco para algumas das doenças estudadas. Entre os projetos ativos que utilizam esta abordagem estão o Outsmart Ebola Together (Outsmart Ebola Together, 2016), FightAIDS@Home (FightAIDS@Home, 2016) e OpenZika (OpenZika, 2016). Outros projetos de pesquisa, já finalizados, que também utilizaram os programas AutoDock ou AutoDock Vina no World Community Grid, são: i) Say No to Schistosoma (Say No to Schistosoma, 2016); ii) GO Fight Against Malaria (GO Fight Against Malaria, 2016); iii) Drug Search for Leishmaniasis (Drug Search for Leishmaniasis, 2016); iv) Discovering Dengue Drugs – Together (Discovering Dengue Drugs, 2016); v) Help Fight Childhood Cancer (Help Fight Childhood Cancer, 2016); vi) Influenza Antiviral Drug Search (Influenza Antiviral Drug Search, 2016).

43

Este projeto possui mais de 720 mil voluntários, que disponibilizam mais de 3.200.000 dispositivos (WCG, 2016) para atender à demanda computacional. O tempo ganho com o poder de processamento doado pelos usuários deste projeto em seus dispositivos, desde o início do projeto em 2004 até os dias de hoje, equivale a incríveis mais de 1.300.000 (um milhão e trezentos mil) anos de processamento, caso este fosse feito em um único computador comum (WCG, 2016). Diariamente, o conjunto de dispositivos voluntários deste projeto processa dados que levaria mais de 480 anos em um único computador (WCG, 2016).

2.3.2.2 Rosetta@Home

O projeto Rosetta@Home (Rosetta@Home, 2016) utiliza o ambiente de grid computacional da plataforma BOINC (BOINC, 2016) para estudar como ocorre o enovelamento ("folding") de proteínas.

A metodologia deste programa para modelar o enovelamento consiste em duas fases. A primeira, começa com a proteína completamente esticada e, a partir deste estado inicial, gerar perturbações estruturais em uma parte da cadeia da proteína. Quando uma perturbação estrutural reduz a energia, ou seja, torna a estrutura mais estável, a perturbação é aceita, caso contrario a alteração é rejeitada (Rosetta@Home, 2016). Na segunda fase, denominada fase de relaxamento, são realizadas perturbações menores com o intuito de realocar os amino ácidos para uma posição mais estável, levando em consideração todos os átomos da proteína (Rosetta@Home, 2016).

O objetivo principal de se realizar o enovelamento de proteínas é tentar entender e predizer a conformação em que dada proteína aparece na natureza. Como a conformação de uma proteína pode afetar sua função e a forma como ela interage com outras moléculas, descobrir a conformação mais estável de uma proteína pode ajudar no combate à doenças como Malaria, Anthrax e HIV (Rosetta@Home, 2016), dentre outras.

44

Acontece que proteínas são estruturas grandes, muitas vezes contendo centenas ou até milhares de aminoácidos, o que torna a tentativa de enovelamento de proteínas um caso de alta demanda computacional. Este projeto possui mais de 1.200.000 voluntários (BOINC Stats, 2016), doando mais de 226.000 teraFLOPS (BOINC Stats, 2016) de processamento ao longo de mais de 2.150.000 computadores (BOINC Stats, 2016).

2.3.2.3 Folding@Home

Desenvolvido pela Universidade de Stanford, o programa Folding@Home utiliza o poder de processamento ocioso de voluntários para formar um ambiente de grid computacional com o intuito de descobrir os mecanismos por traz do enovelamento de proteínas (Folding@Home, 2016). O objetivo do projeto é descobrir quais fatores podem causar um enovelamento errôneo de uma proteína, causando doenças como Alzheimer, Huntington e alguns tipos de câncer (Folding@Home, 2016).

Ao contrário de outras iniciativas que utilizam grid computacionais, como, por exemplo, World Community Grid (WCG, 2016) e Rosetta@Home (Rosetta@Home, 2016) que utilizam a plataforma BOINC (BOINC, 2016), o projeto Folding@Home tem sua própria plataforma grid computacional dedicada ao projeto. O projeto Folding@Home possui cerca de 100 teraFLOPS de poder de processamento, vindo de mais de 110.000 computadores, e oferece suporte a vários tipos de processamento utilizando o paralelismo interno do computador em múltiplos núcleos de processamento de um computador (CPUs) e unidades de processamento gráfico (GPUs) (Folding@Home, 2016).

2.3.2.4 Foldit

O projeto Foldit (COOPER et al., 2010) consiste em um espécie de jogo online com múltiplos jogadores, que utiliza o esforço colaborativo de milhares de usuários, no intuito de elucidar aspectos importantes no processo de enovelamento de estruturas

45

tridimensionais de proteínas.

Cada proteína é apresentada como um quebra-cabeça (puzzle), onde o jogador pode escolher se deseja enovelar a proteína de maneira individual (soloist), ou em conjunto com um grupo (groups) de usuários. As regras do jogo são: i) Empacotar as proteínas no espaço mais compacto possível; ii) Evitar que os resíduos hidrofóbicos fiquem na superfície da molécula; iii) Evitar que os átomos da molécula se choquem. Assim, quanto mais compacta estiver a proteína, com o menor número possível de resíduos hidrofóbicos em sua superfície e evitando que átomos fiquem muito próximos de outros átomos, melhor será a pontuação do jogador.

O que torna esta iniciativa mais eficiente do que um método computacional tradicional para a previsão do enovelamento de proteínas é que, como cada jogador utiliza uma estratégia diferente para completar o jogo, pode-se utilizar diversas metodologias para solução dos quebra-cabeças, cada uma delas aplicada por um jogador diferente, comparado com a utilização de apenas uma metodologia aplicada em um algoritmo específico (COOPER et al., 2010). Em um teste realizado as cegas, utilizando- se 10 quebra-cabeças (proteínas) diferentes, e não disponíveis em banco de dados público, os jogadores conseguiram encontrar cinco soluções mais próximas da estrutura nativa de cada proteína, comparado-as com as soluções encontradas pelo método de predição de estrutura conhecido como Rosetta (ROHL et al., 2004). Além disso, estes jogadores encontraram a mesma solução que o programa Rosetta em três destes quebra- cabeças.

Um quebra-cabeça especial, disponível apenas por 21 dias, com uma enzima do vírus M-PMV, responsável pela AIDS em macacos, teve seu enovelamento solucionado pelos jogadores do Foldit em apenas 10 dias, encontrando-se a mesma solução observada experimentalmente (KHATIB et al., 2011), sendo este um problema que não havia sido solucionado em 15 anos (FOLDIT Portal, 2016).

46

2.3.3 INFRAESTRUTURAS BASEADAS EM UNIDADES DE PROCESSAMENTO