Top PDF Alinhamentos e comparação de sequências

MASA-OpenCL: Comparação Paralela de Sequências Biológicas Longas em GPU

MASA-OpenCL: Comparação Paralela de Sequências Biológicas Longas em GPU

A comparação de sequências biológicas é uma tarefa importante executada com frequência na análise genética de organismos. Algoritmos que realizam este proce- dimento utilizando um método exato possuem complexidade quadrática de tempo, demandando alto poder computacional e uso de técnicas de paralelização. Muitas soluções têm sido propostas para tratar este problema em GPUs, mas a maioria delas são implementadas em CUDA, restringindo sua execução a GPUs NVidia. Neste trabalho, propomos e avaliamos o MASA-OpenCL, solução desenvolvida em OpenCL capaz de executar a comparação paralela de sequências biológicas em pla- taformas heterogêneas de computação. O MASA-OpenCL foi testado em diferentes modelos de CPUs e GPUs, avaliando pares de sequências de DNA cujos tamanhos variam entre 10 KBP (milhares de pares de bases) e 47 MBP (milhões de pares de bases), com desempenho superior a outras soluções existentes baseadas em CUDA. A solução obteve um máximo de 179,2 GCUPS (bilhões de células atualizadas por segundo) em uma GPU AMD R9 280X. Até onde temos conhecimento, esta é única solução implementada em OpenCL que realiza a comparação de sequências longas de DNA, e o desempenho alcançado é, até o momento, o melhor já obtido com uma única GPU.
Mostrar mais

88 Ler mais

Fickett-CUDAlign: Comparação Paralela de Sequências Ajustáveis

Fickett-CUDAlign: Comparação Paralela de Sequências Ajustáveis

A comparação de sequências biológicas é uma operação importante na Bioinformática, que é realizada frequentemente. Os algoritmos exatos para comparação de sequências obtêm o resultado ótimo calculando uma ou mais matrizes de programação dinâmica. Estes algoritmos têm complexidade de tempo O(mn), onde m e n são os tamanhos das sequências. Fickett propôs um algoritmo que é capaz de reduzir a complexidade para O(kn), onde k é a faixa de computação e representa a quantidade de diagonais da ma- triz efetivamente calculadas. Nessa dissertação de mestrado, propomos e avaliamos o Fickett-CUDAlign, uma estratégia paralela que divide a comparação de sequências em múltiplas comparações de subsequências e calcula uma faixa de Fickett apropriada para cada comparação de sequência (bloco). Com esta abordagem, nós reduzimos potencial- mente o número de células calculadas, quando comparada ao Fickett, que usa uma única faixa para toda a comparação. Nossa estratégia multi-bloco ajustável foi programada em C/C++ e pthreads e foi integrada ao estágio 4 do CUDAlign, uma ferramenta do estado da arte para comparações ótimas de sequências biológicas. O Fickett-CUDAlign foi usado para comparar sequências reais de DNA cujo tamanho variou de 10KBP (Milhares de Pares de Base) a 47MBP (Milhões de Pares de Base), alcançando um speedup de 59,60x na comparação 10MBP x 10MBP, quando comparado ao estágio 4 do CUDAlign. Neste caso, o tempo de execução foi reduzido de 53,56 segundos para 0,90 segundo.
Mostrar mais

84 Ler mais

Um guia didático para docentes: em busca dos logaritmos na comparação entre termos de diferentes sequências

Um guia didático para docentes: em busca dos logaritmos na comparação entre termos de diferentes sequências

Na tarefa 3, propomos aos participantes que relacionem sequências da tabela utilizada na tarefa anterior buscando regularidades entre elas. Nosso objetivo aqui é que o[r]

15 Ler mais

Comparação da aquisição de /k/ e /g/ e das sequências fonéticas [kw] e [gw] no pb - variáveis intervenientes e status fonológico.

Comparação da aquisição de /k/ e /g/ e das sequências fonéticas [kw] e [gw] no pb - variáveis intervenientes e status fonológico.

Neste estudo, as variáveis dependentes foram a produção correta e a produção incorreta dos fonemas e sequências analisados. O Varbwin atribui valores de signiicância às variáveis linguísticas por meio da interação entre elas como, por exemplo, sexo versus idade; sonoridade versus número de sílabas. Com isso, o programa não atribui valor de signiicância (valor de p) às variantes contidas dentro das variáveis, mas determina pesos relativos, isto é, a probabilidade maior ou menor de interferência das variantes no fenômeno investigado.

10 Ler mais

Arquiteturas em FPGA para comparação de sequências biológicas em espaço linear

Arquiteturas em FPGA para comparação de sequências biológicas em espaço linear

Nesta tese, foi feito um levantamento dos conceitos de biologia molecular relevantes para o entendimento do problema da comparação de seqüências biológicas. Este problema é muito intensivo em computação, em muitos casos exigindo que o número de operações necessárias seja proporcional ao produto dos tamanhos das seqüências [Set97]. A comparação de seqüências pode ser feita de forma heurística ou exata. Nos métodos heurísticos, não há garantias de se encontrar o resultado ótimo.A vantagem neste caso, é que os resultados são obtidos em tempo menor. Nos métodos exatos, obtém-se o resultado ótimo que é, portanto, mais relevante do ponto de vista biológico. No entanto, os tempos de execução podem ser altos. Uma maneira de acelerar a obtenção de resultados exatos na comparação de seqüências biológicas é através do uso de arquiteturas dedicadas que têm o potencial de executar várias operações em paralelo.
Mostrar mais

151 Ler mais

Schistosoma mansoni: descoberta de novos genes e estudos de genômica funcional de uma RHO GTPase

Schistosoma mansoni: descoberta de novos genes e estudos de genômica funcional de uma RHO GTPase

Com base em alinhamentos com sequências de proteínas homólogas já identificadas em diversos organismos, análises filogenéticas moleculares, caracterização estrutural da prot[r]

156 Ler mais

Variabilidade genética de isolados de badnavírus infectando inhame (Dioscorea spp.) no nordeste do Brasil.

Variabilidade genética de isolados de badnavírus infectando inhame (Dioscorea spp.) no nordeste do Brasil.

Os produtos da ampliicação foram puriicados utilizando-se o kit GFX PCR DNA and Gel Band Puriication (GE Healthcare). O sequenciamento foi realizado comercialmente (Macrogen Inc., Seul, Coréia do Sul), diretamente a partir dos produtos de PCR puriicados. As sequências de nucleotídeos foram inicialmente submetidas ao algoritmo BLASTn para determinação preliminar das espécies com base no nível limite de 80% estabelecido pelo ICTV (Geering & Hull, 2012). As sequências foram alinhadas com base no algoritmo MUSCLE disponível no programa MEGA 5 (Tamura et al., 2011). As sequências alinhadas foram importadas para o programa PAUP* 4 (Swofford, 2003) para análise ilogenética. Árvores iniciais foram construídas usando o método Neighbour-Joining. Estas foram posteriormente comparadas com as árvores de consenso construídas a partir de análise de máxima verossimilhança com “bootstrapping” de 1000 repetições. Análise de inferência Bayesiana foi feita utilizando-se o programa MrBayes v3.1.2 (Ronquist & Huelsenbeck, 2003). Sequências de outras espécies pertencentes à família Caulimoviridae, disponíveis no GenBank, foram incluídas em todas as análises para comparação.
Mostrar mais

5 Ler mais

Variabilidade da região ITS do Cluster Ribossõnico Nuclear em populações de ostras de três estuários da costa cearense

Variabilidade da região ITS do Cluster Ribossõnico Nuclear em populações de ostras de três estuários da costa cearense

Classificações taxonômicas de ostras são problemáticas, pois estes organismos possuem características morfológicas pouco informativas. A variabilidade da região ITS do cluster ribossômico tem sido bastante utilizada em estudos filogenéticos e taxonômicos, visto que esta região apresenta uma variabilidade relativamente elevada e fácil amplificação por termociclagem. A ostra foi, por décadas, confundida com , entretanto, estudos recentes indicam que são duas espécies biologicamente distintas. Esta pesquisa objetivou analisar a variabilidade da região ITS01 de populações de ostras em três estuários da costa do Estado do Ceará e investigar a presença de uma segunda espécie de ostra pertencente ao gênero . Exemplares da ostra nativa cf. foram coletados nos estuários da costa cearense para análise de variabilidade populacional. Foram coletados também espécimes de cf. para estudo de filogenia e comparação com o primeiro grupo de ostras. Após extração de DNA e amplificação por PCR da região ITS01, seqüências desta região foram obtidas para análise filogenética realizada através dos métodos de !" e máxima parcimônia. Sequências de ITS01 descritas no # $ % para 35 indivíduos, representando 12 espécies de ostras do gênero , e mais duas seqüências de & (grupo externo), foram utilizadas para os alinhamentos com as sequências obtidas na presente pesquisa. A variabilidade intraespecífica de .cf. foi estudada pelo método da máxima parcimônia. Seqüências inéditas de ITS01 completo foram obtidas para e , com 427 e 439 pb, respectivamente. A árvore de !" evidenciou a clara separação de .cf e .cf. em ramos distintos (100%), confirmando a ocorrência de, pelo menos, duas espécies de no local de estudo. O estudo sugere a ocorrência de no Estado do Ceará. Embora alguns autores tenham considerado
Mostrar mais

58 Ler mais

Erosões localizadas junto de alinhamentos de pilares cilindricos

Erosões localizadas junto de alinhamentos de pilares cilindricos

A caracterização das erosões localizadas junto de alinhamentos de pilares carece de investigação adicional. Por comparação com a investigação relativa a pilares simples, conhecem-se relativamente poucos trabalhos sobre o assunto. Em rigor, tais trabalhos foram concebidos e realizados tendo em vista a caracterização de cavidades de erosão junto de grupos de estacas que resultam de alinhamentos paralelos. Os grupos de estacas são geralmente utilizados como fundação de pilares complexos; foram alvo dos estudos de Hannah (1978), Salim e Jones (1996), Zhao e Sheppard (1998), Ataie-Ashtiani e Beheshti (2006) e Amini et al. (2011). Naturalmente, sempre que estão em causa alinhamentos de pilares ou grupos de estacas de pilares complexos, os manuais disponíveis baseiam os respectivos métodos de cálculo no reduzido número de resultados de alguns destes cinco estudos, o que potencia importantes incertezas de previsão da profundidade de equilíbrio das cavidades de erosão.
Mostrar mais

12 Ler mais

Ipea: dos alinhamentos tecnocráticos à produção de conhecimentos para a sociedade

Ipea: dos alinhamentos tecnocráticos à produção de conhecimentos para a sociedade

Deparei-me com uma dessas implicações logo nos primeiros meses de trabalho de campo. O lugar específico de pesquisadores observados foi explicitado em algumas das primeiras situações de interação que envolviam mais de um TPP. Mesmo que alguns TPPs soubessem da existência do projeto, eu ainda era um rosto desconhecido para muitos. Diferente da relação de intimidade construída alguns meses depois da entrada em campo. Esse era o caso em uma reunião em que o comitê editorial do Boletim de Análise de Políticas Públicas (BAPI), uma publicação da Diest, se encontrou para tratar dos textos e emitir pareceres para a edição que ficaria pronta no mês seguinte. A coordenadora esquecera-se de enviar um e-mail perguntando sobre a possibilidade da minha presença na reunião, como havíamos combinado, e falou aos presentes: ―gente, ele vai nos observar hoje, tudo bem?‖. Aqueles que se manifestaram falaram positivamente e uma TPP, uma cientista social, expressou sua sensação através da citação de um trabalho antropológico: ―Quando os índios somos nós‖ (Kant de Lima, 2011) que trata justamente de pesquisadores acadêmicos, mais especificamente de uma comparação entre pesquisadores e lógicas universitárias norte-americanas e brasileiras. Um trabalho que, citado nesse contexto, mostra um movimento de aproximação entre
Mostrar mais

249 Ler mais

Ocorrência de Bacillus cereus em produtos lácteos comercializados na microrregião de Viçosa, Minas Gerais, determinação de genes de virulência e produção de toxina

Ocorrência de Bacillus cereus em produtos lácteos comercializados na microrregião de Viçosa, Minas Gerais, determinação de genes de virulência e produção de toxina

Figura 4: Comparação de sequências de DNA do gene 16S de um isolado de cada um dos produtos lácteos analisados com a sequência da estirpe Bacillus cereus KAVK4.. 29.[r]

58 Ler mais

BUSCA E CLASSIFICAÇÃO SISTEMÁTICA DAS PROTEÍNAS OXIGENASES COM FERRO NÃO HÊMICO EM PLANTAS

BUSCA E CLASSIFICAÇÃO SISTEMÁTICA DAS PROTEÍNAS OXIGENASES COM FERRO NÃO HÊMICO EM PLANTAS

O banco de domínios Pfam (http://pfam.xfam.org/) agrupa uma grande coleção de famílias de domínios proteicos, onde cada família é representada por vários alinhamentos de sequências e modelos ocultos de Markov (HMMs). O HMM é um modelo probabilístico utilizado para transformar a informação contida no alinhamento múltiplo de sequências em uma sequência consenso. O Pfam classifica suas entradas de quatro formas: 1) Família: uma coleção de regiões proteicas relacionadas; 2) Domínio: uma unidade estrutural; 3) Repetições: uma unidade curta, que é instável isoladamente, mas forma uma estrutura estável quando várias cópias estão presentes; e 4) Motivos: uma unidade curta encontrada fora dos domínios globulares (BATEMAN et al., 2002).
Mostrar mais

71 Ler mais

ELDON CARLOS QUERES GOMES DIVERSIDADE E BIOPROSPECÇÃO DE FUNGOS PRESENTES EM SOLOS ANTÁRTICOS

ELDON CARLOS QUERES GOMES DIVERSIDADE E BIOPROSPECÇÃO DE FUNGOS PRESENTES EM SOLOS ANTÁRTICOS

Figura 1. Complexo de Ilhas Shetland do Sul na Península Antártica (Google, 2017)......8 Figura 2. Aspecto geral dos ambientes de coleta de amostras superficiais de solos, sendo A – área costeira sob stack vulcânico crioclastado no interior de terraços marinhos (Coppermine); B – Vertentes recobertas por cinzas vulcânicas oxidadas com afloramento de rochas intrusivas (Pinguim); C – vertentes recobertas por cinzas vulcânicas com caimento para a área costeira (Pinguim) e D – Base de talus em área de rochas andesiticas ricas em sulfetos (Yellow Point, Rei George)...............................................................................................................................19 Figura 3. (a) percentual de isolados por ilha e (b) percentual de fungos filamentosos e leveduras...................................................................................................................................24 Figura 4. Análise filogenética das sequências de fungos (em negrito) a partir de amostras de solo da Península Antártica em comparação com as sequências tipo das espécies mais próximas após a análise no BLASTn, depositadas na base de dados GenBank. As árvores (a – f) foram construídas com base nas sequências da região ITS por meio do parâmetro composto máximo de Likelihood. As sequências de Mucor circinelloides (NR126116) e Aspergillus glaucus (AY373887) foram utilizadas como out group (OG)..................................................27
Mostrar mais

67 Ler mais

Identificação e caracterização de genes que codificam proteínas secretadas por Hemileia vastatrix na interação com o cafeeiro

Identificação e caracterização de genes que codificam proteínas secretadas por Hemileia vastatrix na interação com o cafeeiro

A comparação das sequências dos cinco genes caracterizados mais detalhadamente neste trabalho, assim como dos demais genes que codificam proteínas secretadas identificados, com sequências de cDNAs únicas derivados de esporos, demonstrou que esses genes são expressos no interior do tecido infectado. Estudos de expressão e imunolocalização deverão ser efetuados para demonstrar se esses genes são expressos exclusivamente nos haustórios. Adicionalmente, estudos funcionais deverão ser executados para comprovar a função da atividade efetora dos genes selecionados. Todavia, estudos funcionais em H. vastatrix ainda são um desafio, por vários motivos. Primeiro, essa ferrugem não possui ciclo de vida completo (Fernandes et al., 2009), o que dificulta estudos genéticos visando estabelecer a ligação gênica entre candidatos a genes efetores e genes de avirulência. Segundo, ainda não foi desenvolvido um protocolo de transformação desse fungo. Além disso, por se tratar de um parasita obrigatório, tanto a transformação e a seleção dos transformantes devem ser efetuadas in vivo, no próprio cafeeiro. Terceiro, estudos de inativação gênica, associado à ausência de ciclo completo, são dificultados pela natureza dicariótica predominante no ciclo de vida do fungo. Assim, caso seja desenvolvido um sistema de transformação, os estudos funcionais podem ser melhor executados com base na interferência de RNA (iRNA), como demonstrado recentemente para M. lini (Lawrence et al., 2010).
Mostrar mais

97 Ler mais

Topografia do Brasil profundo: votos, cargos e alinhamentos nos municípios brasileiros.

Topografia do Brasil profundo: votos, cargos e alinhamentos nos municípios brasileiros.

pela qual partidos conservadores deveriam dominar municípios rurais, enquanto partidos de centro e esquerda prevaleceriam em centros mais urbanos. A comparação da série de eleições municipais realizadas em 2000, 2004 e 2008 mostra uma tendência de crescimento de partidos de esquerda e legendas que integram a coalizão governista federal, com acentuado declínio de partidos de oposição ao governo federal. A hipótese de que alinhamento ao governo federal possa constituir importante capital político na competição eleitoral local foi confirmada, ainda, quando observou-se que a razão de probabilidade de conservação do governo municipal por um mesmo partido na eleição seguinte está associada à sua participação na coalizão de governo federal. Da mesma forma, esta continuidade apresenta probabilidade negativa quando relacionada à região nordeste, contrariando o bom senso convencional que supõe uma relação entre sua demografia rural e eleitorado com menor renda, com maiores chances para domínio tradicional. Níveis de gasto público pareceram não afetar chances de manutenção do posto. Por outro lado, o incremento de competição eleitoral não implica em deslocamentos interblocos ideológicos: a maioria das mudanças partidárias nas administrações municipais ocorre dentro da mesma família ideológica. Alinhamento com o governo federal constitui o grande trunfo para candidatos locais: eleições em que partidos que integram o governo federal foram vitoriosos correspondem a 70,1% dos municípios no pleito municipal de 2008. Em contraste, partidos oposicionistas conseguiram conquistar prefeituras dominadas por governistas em não mais do que 1 de cada 10 municípios brasileiros. A principal conclusão indica a presença prevalente de um componente nacional na disputa local, somente neutralizado de modo parcial quando prefeitura e governo estadual estão nas mãos de partidos oposicionistas.
Mostrar mais

20 Ler mais

Caracterização de amostras de mel por next generation sequencing

Caracterização de amostras de mel por next generation sequencing

O passo seguinte foi a amplificação das regiões-alvo (ribossomal e plastidial) por PCR. As regiões-alvo amplificadas apresentam regiões conservadas que permitem a identificação ao nível do género, e em alguns casos, da espécie botânica. Todas as amostras cuja amplificação destas regiões foi bem sucedida, foram posteriormente sequenciadas com a plataforma Ion Torrent . Sequenciaram-se por NGS, 41 amostras de mel (Tabela A.1). Após a sequenciação, as sequências obtidas foram identificadas através da sua comparação com sequências disponíveis na base de dados GenBank e alinhamento utilizando a ferramenta BLAST (Figura A.1).
Mostrar mais

53 Ler mais

Alinhamentos para uma formação adequada de professores de língua estrangeira para crianças (inglês)

Alinhamentos para uma formação adequada de professores de língua estrangeira para crianças (inglês)

Já os Parâmetros Curriculares Nacionais para o Ensino Fundamental , vale ressaltar, foram substituídos pelas Diretrizes Nacionais, mas servem ainda para nortear as equipes escolares na execução de seus trabalhos. Os Parâmetros apresentaram a descrição de conteúdos musicais envolvendo a compreensão da linguagem musical (BRASIL,1998, p.84). GORDON ( n.1927), professor no campo da Educação Musical nos Estados Unidos, diz que a música é aprendida da mesma forma que a língua materna. Primeiro, ouvimos o que os outros falam, nos familiarizamos com os sons da língua, depois, tentamos imitar. A seguir, começamos a pensar no contexto da língua, e finalmente começamos a improvisar. Somos capazes de utilizar as palavras para criar novas frases e organizá-las de uma forma lógica, de manter uma conversa. Aprendemos então a ler e a escrever, tudo isso devido à experiência com o ouvir, imitar, pensar e improvisar. Diante dessa comparação feita pelo professor, de algum modo a língua materna e a língua estrangeira no processo de aquisição são comparativas e auxiliam no processo de ensino e aprendizagem.
Mostrar mais

109 Ler mais

Prospecção bioquímica e molecular de fatores possivelmente envolvidos na defesa de feijãodecorda [Vigna unguiculata (L.) Walp] ao vírus do mosaico seo do caupi (CPSMV)

Prospecção bioquímica e molecular de fatores possivelmente envolvidos na defesa de feijãodecorda [Vigna unguiculata (L.) Walp] ao vírus do mosaico seo do caupi (CPSMV)

82 transcritos de RNAs das plantas, ela não apresenta a estrutura 7-metil-guanosina trifosfato (capacete), necessária para a interação com os fatores de iniciação de tradução da planta. Em vez disso, os potivírus apresentam uma estrutura protéica denominada VPg (do inglês, Viral protein linked to genome ), que age como um análogo ao capacete, por interagir com eIF4E e também eIF(iso)4E (Khan et al ., 2008). Da mesma forma que os potivírus, membros da família Secoviridae apresentam tanto VPg, como também, cauda poliadenilada, diferindo por apresentarem um genoma bipartido. Devido ao relato de resistência recessiva em alguns cultivares de feijão-de-corda ao CPSMV (família Comoviridae) (Umaharan et al ., 1997) e a semelhança estrutural do RNA viral com os da familia Potyviridae , esse estudo foi conduzido no intuito de analisar sequências dos fatores de iniciação de tradução de cultivares resistentes e susceptíveis do feijão-de-corda ao CPSMV, que permitissem prospectar possíveis padrões de polimorfismos entre os cultivares contrastantes, e, se existissem, localizá-los espacialmente, correlacionando com o descrito na literatura.
Mostrar mais

129 Ler mais

Técnicas de otimização em alinhamentos múltiplos de sequência via Cadeias de Markov

Técnicas de otimização em alinhamentos múltiplos de sequência via Cadeias de Markov

A metodologia b´asica desse algoritmo ´e baseada em 3 est´agios, e envolve t´ecnicas combinadas de alinhamentos progressivos e iterativos. O primeiro est´agio consiste na obten¸c˜ao das medidas de similaridade entre todos os pos- s´ıveis pares de sequˆencias, atrav´es da contagem dos k-mers, ou tuplas de comprimento K presentes nas sequˆencias. Os resultados s˜ao computados em uma matriz de distˆancia, que por sua vez fornece as informa¸c˜oes para a cons- tru¸c˜ao da ´arvore-guia atrav´es do algoritmo UPGMA (Unweighted Pair Group Method with Arithmetic Mean) ou via Neighbor-Joining (NJ). O alinhamento progressivo ´e ent˜ao realizado seguindo a ordem da ´arvore-guia, at´e sua raiz (Edgar, 2004b).
Mostrar mais

116 Ler mais

Show all 10000 documents...