4 MATERIAL E MÉTODOS
4.8 GENÔMICA COMPARATIVA
Para a comparação genômica foram utilizados todos os genomas das espécies de Aeromonas depositadas no banco de dados no NCBI até o release 210 (outubro de 2015) (NCBI RESOURCE COORDINATORS, 2016), as estirpes podem ser observadas nas TABELAS A1 e A2 disponíveis no ANEXO A.
4.8.1 Similaridade entre genomas
4.8.1.1 Genome-to-Genome Distance Calculator – GGDC
A hibridização DNA-DNA (DDH) foi aplicada para obter uma estimativa da semelhança global entre dois genomas em estudo. Foi utilizado o GGDC (Genome-to-Genome Distance Calculator – http://ggdc.dsmz.de/distcalc2.php) versão 2.0.
O GGDC–DDH é um serviço web que calcula as distâncias intergenômicas e as converte em valores de similaridade análogas ao DDH para apoiar a decisão sobre o parentesco da nova estirpe com estirpes conhecidas (MEIER-KOLTHOFF, 2013;
AUCH et al., 2010a, 2010b).
O GGDC–DDH compara o genoma em estudo com um genoma de referência e calcula uma distância intergenômica sob três fórmulas diferentes. A fórmula recomendada é a número 2, a qual soma todas as identidades encontradas em pares de segmento de alta pontuação (HSPs) e divide pelo comprimento total dessas HSPs.
Essa fórmula também é independente do tamanho do genoma, podendo ser utilizada em genomas incompletos.
Estirpes que apresentaram porcentagens de similaridade acima de 70%
demonstram que os genomas analisados pertencem à mesma espécie. O genoma de A. caviae 8LM foi comparado com todos os genomas de Aeromonas (ANEXO B).
4.8.1.2 Average Nucleotide Identity – ANI
Nessa metodologia o genoma em estudo é fragmentado in silico em segmentos de 1.020 nucleotídeos, os quais são alinhados utilizando o algoritmo do BLAST (Basic Local Alignment Search Tool) contra um genoma de referência a fim de calcular a identidade média dos nucleotídeos.
Valores superiores a 95% indicam que os genomas analisados pertencem à mesma espécie (GORIS et al., 2007).
O genoma de A. caviae 8LM foi analisado frente as outras espécies do gênero, disponíveis no ANEXO C, através do ANI Calculator (Average Nucleotide Identity Calculator – http://enve-omics.ce.gatech.edu/ani/) desenvolvido pelo laboratório Kostas (KONSTANTINIDIS & TIEDJE, 2005).
4.8.2 Análise estrutural
Para a comparação estrutural foram utilizadas as sequências de nucleotídeos em formato ‘FASTA’ do genoma de A. caviae 8LM e das Aeromonas com genoma completo foram submetidas ao software MUMmer versão 3.0, utilizando a ferramenta PROmer.
4.8.3 Análise do conteúdo gênico
4.8.3.1 BLAST Ring Image Generator – BRIG
A comparação do conteúdo gênico foi realizada através do programa BRIG (BLAST Ring Image Generator). Foram utilizadas nessa análise somente as estirpes de Aeromonas que apresentavam genoma completo.
As sequências de nucleotídeos em formato ‘FASTA’ do genoma sequenciado e das espécies de Aeromonas com genoma completo foram utilizadas para a produção de um Blast Atlas, por meio do algoritmo de alinhamento BLASTn (Nucleotide Basic Local Alignment Search Tool).
O BRIG é um aplicativo livre multi-plataforma que realiza comparações entre um grande número de genomas, por meio do algoritmo BLAST (ALIKHAN et al., 2011).
A imagem de saída mostra a semelhança entre uma sequência de referência central e outras sequências como um conjunto de anéis concêntricos, além de uma escala indicativa do percentual de identidade entre as sequências. É um programa de fácil acesso que não requer conhecimento computacional avançado (ALIKHAN et al., 2011).
4.8.3.2 Ilhas genômicas
A predição das ilhas genômicas em A. caviae 8LM foi realizada pelo software Gipsy versão 1.1.2, que considera os seguintes parâmetros na análise: (i) desvio da assinatura genômica, ou seja, diferenças no conteúdo de G+C e/ou no uso de codons;
(ii) a presença de genes que codificam transposases, fatores de virulência, genes associados com metabolismo, resistência à antibióticos ou simbiose; (iii) presença de genes codificando RNA transportadores flanqueando a região; e (iv) ausência dos
genes em outros organismos do mesmo gênero ou espécies intimamente relacionadas (SOARES et al., 2016).
Nesta análise utilizou-se as sequências em formato genbank, foram aplicados os parâmetros padrão do programa e como referência a estirpe A. caviae FDAARGOS 75.
O software prevê quatro classes de ilhas genômicas classificadas em (i) ilhas de patogenicidade (PAIs), que carreiam genes de virulência; (ii) ilhas metabólicas (MIs), que abrigam genes associados à biossíntese de metabólitos secundários; (iii) ilhas de resistência (RIs) que contém genes codificadores de proteínas relacionadas com resistência à antibióticos; e (iv) ilhas simbióticas (ISs) que fornecem à bacteria um repertório genômico para sustentar uma relação simbiótica hospedeiro-bactéria (SOARES et al., 2016).
4.8.3.3 Agrupamento de genes
As análises de agrupamento gênico foram realizadas na Freie Universität Berlin e no Instituto Robert Koch, Berlim – Alemanha, como parte do projeto de doutorado sanduíche no período de setembro de 2015 a agosto de 2016.
Quando é realizada a comparação de um conjunto de genes de duas ou mais espécies pertencentes ao mesmo gênero, é possível determinar os genes comuns a todas as espécies, este conjunto de genes é denominado core genoma.
Os outros genes que são compartilhados com algumas espécies e aqueles que são específicos uma determinada espécie fazem parte do chamado genoma acessório. Já o pan-genoma é a soma de todos os genomas utilizados na análise comparativa.
Os genomas das 115 estirpes de Aeromonas depositadas no NCBI até o release 210, foram utilizados para a elaboração das análises de agrupamento de genes. Primeiro, foi realizado o agrupamento somente com os genomas completos de Aeromonas e posteriormente, uma análise com todos os genomas. Essas duas análises foram realizadas através do software Roary versão 3.6.1 (PAGE et al., 2015).
Roary é um pipeline de alta velocidade que recebe montagens anotadas pelo Prokka (SEEMANN, 2014) e determina o pangenoma.
As sequências de nucleotídeos dos genomas foram anotadas pelo Prokka e posteriormente as proteínas preditas foram agrupadas pelo pipeline Roary de modo a investigar a variação genômica do conjunto de sequências.
O método baseia-se na filtragem e pré-agrupamento das proteínas mediante a comparação de todos contra todos usando o algoritmo BLASTp (Protein Basic Local Alignment Search Tool) e subsequente agrupamento com MCL (Markov Cluster Algorithm).
O critério utilizado para identificar o core genoma foi a presença dos genes em todos os isolados. Para definir o genoma acessório, os parâmetros utilizados foram:
para o soft core genoma presença dos genes entre 95 a 99% dos isolados, para o shell genoma entre 15 a 95% dos isolados e para o cloud genoma em menos de 15%
dos isolados (PAGE et al., 2015).