• Nenhum resultado encontrado

Genoma e inferências filogenéticas

2.1.4 Tipificação diretamente de amostras clínicas

A avaliação das diferenças genéticas com o esquema de SBT exige um isolado em cultura pura. Este facto aumenta o tempo de resposta e em algumas situações limita a realização da tipificação, dado que, como já foi referido anteriormente, a bactéria tem crescimento fastidioso e necessidades nutricionais específicas, não crescendo nos meios habitualmente utilizados no laboratório de microbiologia. Por esta razão nem todos os laboratórios estão aptos a realizar a cultura de Legionella.

2.1.4.1 Método de nested-SBT

No método de nested-SBT, utiliza-se um protocolo aproximado ao do SBT, isto é, sequenciam- se as mesmas zonas alvo, embora utilizando uma amostra e um processo diferente de amplificação dos sete genes.

Neste método utiliza-se ADN obtido diretamente de amostras respiratórias e a amplificação é realizada através de uma técnica de nested-PCR.

Na nested-SBT amplifica-se na primeira fase uma zona externa às regiões alvo do SBT e na segunda utiliza-se um protocolo semelhante para os locus pilE, proA e neuA. As alterações em

Figura 14 – Algoritmo da tipificação utilizando WGS (tecnologia

Illumina)

Extração ADN Preparação da biblioteca Sequenciação PCR Quantificação ADN Alinhamento reads Resumidamente,

- Extraiu-se o ADN com o kit Instagene Matrix (BioRad);

- Quantificou-se o ADN no Qubit fluorometer (Invitrogen) e diluiu-se a 5ng/µL;

- Efetuou-se a preparação da biblioteca utilizando o kit Nextera ADN Sample Preparation (Illumina Inc.);

- Sequenciou-se num MiSeq system (Illumina Inc.);

- Verificou-se a qualidade dos reads e procedeu-se à análise bioinformática com vista à obtenção do genoma de cada isolado e ao estabelecimento de relações filogenéticas entre os isolados.

I N S A

Maria de Jesus Chasqueira

47

relação ao protocolo do SBT verificam-se nos locus flaA e mompS, utilizam primers reverse diferentes, e nos locus asd e mip, utilizam protocolos de amplificação distintos (114).

No presente trabalho, para a realização deste método, utilizou-se o protocolo NESTED Sequence-Based Typing (SBT) protocol for epidemiological typing of Legionella pneumophila directly from clinical samples, version 2.0 disponível em:

http://bioinformatics.phe.org.uk/legionella/legionella_sbt/php/protocols/ESGLI%20NESTED%20SBT%2 0GUIDELINE%20v2.0.pdf.

O método foi aplicado a nove amostras respiratórias, que foram positivas para Legionella spp e L. pneumophila por PCR em tempo real, utilizando o gene 16S do ARNr e mip, respetivamente. As nove amostras foram colhidas em contextos diferentes: três expetorações em doentes com pneumonia e seis exsudados nasofaríngeos em utentes de lares da 3ª idade com infeção respiratória (projeto GERIA). Foi igualmente aplicada a dois sobrenadantes de cultura de amibas inoculadas com secreções respiratórias (Figura 15).

ST

Figura 15 – Algoritmo de tipificação utilizando o protocolo nested-SBT

Resumidamente:

Utilizou-se o protocolo do SBT exceto nos seguintes passos:

Nas expetorações realizou-se um pré-tratamento com Sputolisina (Calbiochem);

Extração do ADN:

Amostras de expetorações - kit High Pure PCR template preparation

kit (Roche);

Exsudados nasofaringeos e sobrenadantes de cultura de amibas -

QiAamp MinElute virus spin kit (Qiagen);

Amplificaram-se os sete genes utilizando uma técnica de nested-PCR; no total, foram utilizados quatro programas diferentes de PCR.

Extração ADN 2ª PCR (7 genes) Sequenciação Análise dos Fluorogramas Purificação Submissão BD-EWGLI/SBT Eletroforese 1ª PCR (7 genes)

Maria de Jesus Chasqueira

48

2.1.5 Análise dos dados

Numa primeira fase analisou-se o desempenho dos métodos MAbs (painel de Dresden), AFLP e SBT no estudo da epidemiologia da Doença dos Legionários em Portugal (1987–2016), com base nos seguintes parâmetros: capacidade de tipificação, reprodutibilidade, poder discriminante, concordância epidemiológica, recursos técnicos exigidos, rapidez e facilidade de execução e interpretação dos resultados (289). Numa segunda fase analisou-se a congruência dos resultados obtidos com os três métodos de tipificação. E por último as relações entre os STs obtidos por SBT.

O poder discriminante foi avaliado recorrendo ao índice de diversidade de Simpson (IDS), que indica a probabilidade de duas estirpes retiradas ao acaso de uma população pertencerem a dois tipos diferentes. O valor varia entre 0 e 1, em que 0 significa que os isolados são todos iguais e 1 que o método distinguiu todos os isolados (127). No caso específico do SBT, avaliou-se o desempenho global do método e de cada um dos genes em particular. A congruência dos resultados obtidos com os três métodos foi avaliada pelo coeficiente ajustado de Wallace (CAW), com intervalo de confiança de 95%. Este coeficiente indica a probabilidade de dois isolados classificados como idênticos por um método, o serem também por um outro método. Valores altos de CAW, isto é, próximos de 1, indicam que a utilização dos dois métodos é redundante (261). Ambos os cálculos foram efetuados com um calculador disponível em http://www.comparingpartitions.info/index.php?link=Tut12.

A relação filogenética entre os STs obtidos pelo método de SBT foi avaliada recorrendo ao algoritmo goeBURST (93) disponível em: https://online.phyloviz.net/index. Os complexos clonais (CCs) foram definidos com base nos STs que apresentam variação num único locus (SLV), isto é, partilham seis dos setes alelos e o fundador como o ST com mais SLVs. STs que não foram associados a nenhum CC são considerados singletons (87). Na definição do fundador utilizaram-se 1000 réplicas de bootstrap.

Os dados de WGS obtidos para cada isolado de L. pneumophila foram sujeitos a um conjunto de análises bioinformáticas com vista essencialmente a: i) reconstruir e comparar as sequências obtidas dos genomas; e, ii) inferir as dinâmicas evolutivas da estirpe do ST100 e as relações filogenéticas entre os vários isolados bacterianos em estudo.

Numa primeira fase, foi avaliada e melhorada a qualidade dos reads com o recurso às aplicações

bioinformáticas FastQC versão 0.11.5

(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) e Trimmomatic versão 0.36 (http://www.usadellab.org/cms/?page=trimmomatic), respetivamente. De seguida, os reads de elevada qualidade foram aplicados para reconstruir as sequências do genoma de cada isolado através de “de novo assembly” com recurso ao programa SPAdes (version 3.7.1) (http://bioinf.spbau.ru/spades), tendo-se usado uma cobertura média por nucleótido de

Maria de Jesus Chasqueira

49

aproximadamente 64 vezes. As sequências obtidas dos genomas (isto é, o conjunto de sequências contíguas - contigs – que representam a totalidade do genoma) foram posteriormente alinhadas através do software MAUVE versão 2.3.1 (http://darlinglab.org/mauve/mauve.html), com vista à pesquisa de regiões genómicas que não fossem partilhadas (o denominado “genoma acessório”) por todos os isolados do ST100 sob avaliação. Deleções detetadas no genoma de alguns isolados foram posteriormente confirmadas através do alinhamento dos reads originais contra a sequência do seu genoma usando o programa bioinformático Bowtie2 versão 2.1.0 (http://bowtie-bio.sourceforge.net/bowtie2/index.shtml). Adicionalmente, utilizaram-se também as ferramentas bioinformáticas Harvest tools versão 1.1.2 (http://harvest.readthedocs.io/) por forma a integrar os genomas dos isolados do ST100 na diversidade genética da espécie L. pneumophila. Neste sentido, foram comparadas as regiões genómicas partilhadas (o denominado “core-genoma”) entre estes isolados e isolados representativos da diversidade da espécie, selecionadas de Underwood e colaboradores e de Borges e colaboradores (17, 285), (Anexo V).

Numa segunda fase, procedeu-se à análise fina da microevolução e diversidade genética da estirpe ST100 através do escrutínio bioinformático de mutações pontuais (SNPs) que discriminam os vários isolados em estudo. Para isso, os reads de cada isolado foram alinhados contra a mesma sequência de “referência” usando a ferramenta bioinformática Snippy versão 3.1 (https://github.com/tseemann/snippy), a qual permite listar as SNPs obtidas para cada isolado e, posteriormente, gerar um alinhamento com todas os posições nucleotídicas (n = 152) do core-genoma informativas filogeneticamente (o denominado alinhamento de core SNPs), isto é, posições que discriminam os genomas sob comparação (excluem-se regiões recombinantes). Com vista a aumentar o poder discriminatório, foi usada como sequência de referência a sequência do genoma de um isolado de L. pneumophila em estudo (em concreto, o isolado Pt-HSC1-87 recolhido em 1987). O alinhamento de core SNPs foi seguidamente analisado usando a ferramenta bionformática MEGA5 (http://www.megasoftware.net/) com vista a gerar matrizes de distâncias nucleotídicas entre os isolados e árvores filogenéticas usando o método de “Neighbor-joining” com bootstrap (1000 réplicas). A aplicação Microreact (https://microreact.org/) foi subsequentemente usada para melhor representar a relação entre a cronologia de isolamento de L. pneumophila e ao grau de diversificação genética. Para o mesmo efeito, aplicou-se, ainda, a ferramenta PHYLOViZ online (https://online.phyloviz.net./index) para construir goeBURST full minimum spanning trees (MST) com base em matrizes de distâncias entre os isolados.

Maria de Jesus Chasqueira

50

Resumo da análise bioinformática:

Reconstrução das sequências dos genomas:

- Avaliação e melhoria da qualidade dos reads (FastQC e

Trimmomatic);

- Reconstrução dos genomas de L. pneumophila por “de novo

assembly” (SPAdes);

- Pesquisa de genoma acessório (MAUVE e Bowtie2);

- Integração dos genomas dos isolados do ST100 na diversidade genética da espécie L. pneumophila (Harvest tools);

- Escrutínio de todas as posições nucleotídicas informativas filogeneticamente (Snippy);

- Avaliação de matrizes de distâncias e reconstrução filogenética (MEGA5);

- Estabelecimento de relações entre a cronologia de isolamento e o grau de diversificação genética (Microreact e PHYLOViZ).

Análise das dinâmicas evolutivas da estirpe ST100 e das relações filogenéticas:

Maria de Jesus Chasqueira

51

2.2 Resultados

2.2.1 Tipificação dos isolados responsáveis por infeção humana em Portugal, 1991 -