• Nenhum resultado encontrado

Investigação e caracterização filogenética de Coronavírus na biota de aves silvestres e sinantrópicas provenientes das regiões Sul e Sudeste do Brasil

N/A
N/A
Protected

Academic year: 2021

Share "Investigação e caracterização filogenética de Coronavírus na biota de aves silvestres e sinantrópicas provenientes das regiões Sul e Sudeste do Brasil"

Copied!
95
0
0

Texto

(1)

Investigação e caracterização filogenética de Coronavírus na biota de

aves silvestres e sinantrópicas provenientes das regiões Sul e Sudeste

do Brasil

CAMPINAS

2015

(2)
(3)

Tese apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Doutor em Genética e Biologia Molecular, na área de Microbiologia.

(4)
(5)
(6)
(7)

RESUMO

A evolução e a dinâmica populacional dos Coronavírus (CoVs) ainda permanecem pouco exploradas. No presente estudo, análises filogenéticas e de filogeografia foram conduzidas para investigar a dinâmica evolutiva dos CoVs detectados em aves silvestres e sinantrópicas. Um total de 500 amostras, que inclui os suabes traqueais e cloacais coletados de 312 aves silvestres pertencentes a 42 espécies, foram analisadas através da RT-qPCR. Sessenta e cinco amostras (13%) provenientes de 23 espécies foram positivas para o Coronavírus aviário (AvCoV). Trezentos e duas amostras foram investigadas para a pesquisa do Pan-Coronavírus (Pan-CoV) através do nPCR, destas, 17 (5,6%) foram positivas, sendo que 11 foram detectadas em espécies diferentes. Análises filogenéticas dos AvCoVs revelaram que as sequências de DNA das amostras coletadas no Brasil não agruparam com nenhuma das sequências do gene Spike (S1) dos AvCoVs depositados no banco de dados GenBank. Análise Bayesiana estimou uma variante do AvCoV proveniente da Suécia (1999) como o ancestral comum mais recente dos AvCoVs detectados neste estudo. Além disso, as análises realizadas através do “Bayesian Skyline Plot” (BSP) inferiram um aumento na dinâmica da população demográfica do AvCoV em diferentes espécies de aves silvestres e sinantrópicas. As análises filogenéticas do Pan-CoV mostrou que a maioria das amostras se agruparam com o Vírus da Hepatite Murina A59 (MHV A59), CoV pertencente ao grupo dos Beta-CoVs. Uma amostra [CoV detectado em Amazona vinacea (Papagaio-de-peito-roxo)] se agrupou com um CoV de Suínos, o PCoV HKU15, que pertence ao gênero Delta-CoV, ainda não relatado na América do Sul. Nossos achados sugerem que as aves podem ser novos potenciais hospedeiros responsáveis pela propagação e disseminação de diferentes CoVs para diferentes espécies de animais.

(8)
(9)

ABSTRACT

The evolution and population dynamics of Coronaviruses (CoVs) still remain underexplored. In the present study, phylogenetic and phylogeographic analyses were conducted to investigate the evolutionary dynamics of CoV detected in wild and synanthropic birds. A total of 500 samples, including tracheal and cloacal swabs collected from 312 wild birds belonging to 42 species, were analysed by RT-qPCR. A total of 65 samples from 23 bird species were positive for Avian Coronaviruses (AvCoVs). Three hundred and two samples were screened for the Pan-Coronavirus (Pan-CoV) through the nPCR, 17 (5.6%) were positive, being that 11 were detected in different species. AvCoVs phylogenetic analyses revealed that the DNA sequences from samples collected in Brazil did not cluster with any of the AvCoV S1 gene sequences deposited in the GenBank database. Bayesian framework analysis estimated an AvCoV strain from Sweden (1999) as the most recent common ancestor of the AvCoVs detected in this study. Furthermore, Bayesian Skyline Plot (BSP) analysis inferred an increase in the AvCoV dynamic demographic population in different wild and synanthropic bird species. Phylogenetic analysis of the Pan-CoV showed that most of the samples clustered with the Murine Hepatitis Virus A59 strain (MHV A59) belong to the BetaCoV group. Besides, one of our samples [CoV detected in

Amazona vinacea (parrot-breasted-purple)] clustered with a CoV isolated from pigs, PCoV

HKU15, belonging to the DeltaCoV genus, still not reported in South America. Our findings suggest that birds may be potential new hosts responsible for spreading of different CoVs for different species of animals.

(10)
(11)

SUMÁRIO

RESUMO... vii

ABSTRACT... ix

1. INTRODUÇÃO E SIGNIFICÂNCIA DO ESTUDO... 1

1.2 FILOGENIA E ESTUDOS DE EVOLUÇÃO MOLECULAR... 7

1.2.1 Dinâmica evolucionária populacional... 7

1.2.2 Investigação através da filogenética molecular... 9

2. OBJETIVOS... 2.1 GERAL... 2.2 ESPECÍFICOS... 14 14 14 3. MATERIAIS E MÉTODOS... 15 3.1 Aspectos éticos... 3.2 Áreas de Coletas e Amostras... 3.3 Mapa das rotas das aves migratórias e não migratórias avaliadas no estudo... 3.4 Extração do RNA e RT-PCR quantitativo em Tempo Real (RT-qPCR) para detecção do AvCoV... 3.4.1 Extração do RNA... 3.4.2 RT-qPCR para detecção do AvCoV... 4. Nested-PCR (nPCR) para a amplificação da região S1 do AvCoV detectado por RT-qPCR... 4.1 Síntese do cDNA... 4.1.2 Gene S (Região S1)... 4.1.3 nPCR para a amplificação da RdRp para a pesquisa de 15 15 17 18 18 19 20 20 20

(12)

Pan-CoV... 4.1.4 PCR convencional para a amplificação do gene codificador do Nucleocapsídeo para a pesquisa de Delta-CoV... 5. Sequenciamento... 5.1 Eletroforese em gel de Agarose submerso... 5.2 Purificação dos amplicons e Reação de Sequenciamento... 6. Estudos de Evolução Molecular e aplicação da Bioinformática para análises das sequências virais... 6.1 Análises dos Eletroferogramas... 6.2 Edição das sequências... 6.3 Análises de Sistemática molecular... 6.3.1 Coleta das sequências e análises filogenéticas... 6.3.2 Aplicação da partição filogenética de larga escala... 6.3.3 Abordagem Bayesiana... 6.3.4 Filogeografia Bayesiana... 6.3.5 Análises de Relógio Molecular... 6.3.6 Análises de Máxima Parcimônia... 6.3.7 Números de acesso das sequências obtidas no estudo... 7. Passagem em ovos embrionados livres de patógenos específicos (SPF)... 8. RESULTADOS E DISCUSSÃO... 8.1 Prevalência do AvCoV e pesquisa de Pan-CoV em aves silvestres e sinantrópicas... 8.2 Sistemática filogenética... 21 21 22 22 22 23 23 23 24 24 28 29 30 30 31 31 33 34 34 40

(13)

8.2.1 Análises filogenéticas do Pan-CoV... 8.2.2 Análises filogenéticas dos AvCoVs... 8.2.3 Aplicação da partição filogenética de larga escala usando o Phylopart... 8.2.4 Filogenia com base na grande árvore de ML... 9. Análises das topologias das árvore com base na densidade e Inferência da históriabiogeográfica (RASP)... 10. Análises de Relógio Molecular... 11. Reconstrução do estado caráter dos nós ancestrais e inferência de fluxo gênico.. 12. Reconstrução da história demográfica... 13. Passagem em ovos embrionados SPF... 14. CONSIDERAÇÕES FINAIS... 15. CONCLUSÕES... 16. BIBLIOGRAFIA CONSULTADA... 40 42 48 48 50 55 56 58 60 62 63 64

(14)
(15)

LISTA DE ABREVIATURAS E SIGLAS

CoV Coronavírus

AvCoV Coronavírus aviário

Pan-CoV Pan-Coronavírus

Delta-CoV Delta-Coronavírus

IBV Vírus da Bronquite Infecciosa

IB Bronquite Infecciosa

TCoV Coronavírus de Perus

MHV Vírus da Hepatite Murina

UTR Região não traduzida

ORF Região de leitura aberta

SPF Livres de Patógenos Específicos

tMRCA Tempo do Ancestral Comum Mais Recente

GTR General Time Reversible

HKY Hasegawa, Kishino and Yano

NNI Nearest Neighbor Interchange

SPR Subtree Pruning and Regrafting

ML Maximum Likelihood

NJ Neighbor-Joining

RNJ Neighbor-Joining Relaxado

MCC Clado de Máxima Credibilidade

BBM Método Binário Bayesiano

(16)
(17)

DEDICATÓRIA

À minha mãe, Josélia Maria Durães. - Desejo poder ter sido merecedor de todo esforço dedicado por vossa mercê para com a minha pessoa!

(18)
(19)

AGRADECIMENTOS

Aos amigos e familiares, Gibran Durães, Bruno Durães, Henrique Oliveira, Josué Neto Durães, Thiago Durães, José Carlos Durães (in memorian), Daniel Durães (in memorian), Bruno Sodré, Leonardo Tomaselli, Jack Sodré, Higor Soares, Adriano Arthur, Josué Durães Filho, Márcio Fernandes, Thiago Leonel, Alisson Droppa, Rafael Vieira pelos momentos de força e descontração.

À Profa. Dra. Clarice Weis Arns, pela oportunidade oferecida para que este trabalho de pesquisa fosse desenvolvido e aos colegas do Laboratório de Virologia Animal da UNICAMP, Leonardo Caserta, Ana Caroline, Luíza Artacho, Márcia Bianchi, Raíssa Beck, Matheus Martini, Marina Padilla, Juliana Santiago, Ana Paula e Paula Porto.

Aos parceiros, Robert Bernedo, Luiz Henrique, Ancelmo Rabelo, Fernando Martins e Thiago Oliveira.

Ao “Dear” Prof. Dr. Marco Salemi (“Marco”), por toda ajuda e pelos valiosos ensinamentos sobre filogenia e evolução molecular, e aos colegas da Universidade da Flórida (EUA), David Nolan, Taj Azarian, Alex Weppelmann, Kristen Waterman, Britany Rife e Carla Mavian.

À minha mãe Josélia Maria Durães, Terezinha Maria Durães, aos irmãos Diana Durães, Guilherme Durães e a minha querida avó Amélia Maria Durães (in memorian) por sempre me apoiarem nos meus objetivos e jornadas;

À Maria Letícia pelo grande carinho, Cel. João Monteiro, Dona Regina Miranda e João Batista (“Netto”) por continuamente incentivar o meu crescimento.

À equipe do Parque Ecológico do Tietê, São Paulo-SP; Bosque dos Jequitibás, Campinas-SP, Granja Paulista, Iacri-SP e do Espaço Silvestre Instituto Carijós, Florianópolis-SC pela coleta das amostras investigadas no estudo;

À Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo auxílio financeiro para o desenvolvimento desta pesquisa.

(20)
(21)

“Tu não podes descer duas vezes no mesmo rio, porque novas águas sempre correm sobre ti”

(22)
(23)

1. INTRODUÇÃO E SIGNIFICÂNCIA DO ESTUDO

Coronavírus (CoVs) são um grupo de vírus envelopados de forma esférica e pleomórfica pertencentes a ordem Nidovirales, família Coronaviridae, subfamília Coronavirinae e estão agrupados dentro dos gêneros Alpha-, Beta-, Gamma- e Delta-CoV (Woo et al., 2012). Apresentam um envelope com 120 nm de diâmetro e projeções glicoprotéicas (espículas) de 20 nm (Cavanagh, 2007; Fauquet et al., 2005).

Seu genoma é composto por RNA de fita simples no sentido positivo com um tamanho aproximado de 27-31 Kb (Jackwood et al., 2012). Este está subdivido em um número variável de sequencias abertas de leitura (ORF, 6 a 9), que codificam um conjunto de proteínas não-estruturais envolvidas no processo de replicação viral (Complexo de Replicação da Polimerase, Pols 1a e b), e quatro principais proteínas estruturais: Glicoproteína de superfície (Spike ou S), Membrana (M), Envelope (E) e Nucleocapsídeo (N) (Fauquet et al., 2005; Lovato & Dezengrini, 2007). Nas extremidades 5’ e 3’ do genoma encontram-se duas regiões conservadas e não traduzidas (Untranslated Region – UTR) com cerca de 500 nucleotídeos cada uma. As UTRs tem o papel de mediar as interações físicas entre outras UTRs, proteínas replicases e as proteínas celulares do hospedeiro (Li et al., 2008) (Figura 1).

(24)

Figura 1: Representação da organização genômica de um Coronavírus aviário (AvCoV). A ORF 1a e b estão coloridas em vermelho. Os genes que codificam as proteínas estruturais estão em azul (S), rosa (E), rosa escuro (M) e ciano (N) e estão localizados na parte 3’ do genoma. A ORF que codifica proteínas acessórias está representada em cinza (A). Estrutura do vírion do AvCoV (B). Figura extraída e adaptada de Belouzard et al. (2012).

A estrutura e função das Pols virais são altamente conservadas, se tratando da RNA-polimerase RNA-dependente (RdRp), a mesma é alvo de constantes estudos filogenéticos voltados para a distinção de diferentes gêneros de CoV, bem como também para a identificação de novas variantes virais. Estratégias como esta já vem sendo utilizadas com outros modelos virais, especialmente com o vírus do papiloma humano (Bernard et al., 1994; Astori et al., 1997; Stephensen et al., 1999).

Por outro lado, se tratando da glicoproteína Spike, a mesma forma projeções sobre a superfície do vírion. Spike é clivada pós-traducionalmente para a formação das subunidades S1 e S2, a porção S1 forma a porção externa e a S2 forma uma estrutura com função semelhante a uma haste, que é incorporada na membrana viral. A subunidade S1 contém regiões hipervariáveis e desempenha um importante papel na ligação aos receptores celulares, além de ser alvo constante de estudos filogenéticos considerando o surgimento e as características das novas variantes virais (Thor et al., 2011).

A recente descoberta de uma grande variedade de novos CoVs em diferentes espécies de hospedeiros incentivou a reclassificação da família Coronaviridae em duas subfamílias:

Torovirinae e Coronavirinae. A subfamília Coronavirinae que se divide filogeneticamente em

quatro gêneros (Alpha-, Beta-, Gamma- e Delta-CoV) (Woo et al., 2012) e a junção dos quatro gêneros é popularmente conhecida como Pan-CoV. Os Alpha- e Beta-CoV infectam ou causam doença em mamíferos, enquanto os Gamma-CoV são quase que exclusivamente encontrados em

(25)

aves, com exceção dos CoV de baleia beluga (Mihindukulasuriya et al., 2008; Woo et al., 2010). O quarto gênero (Delta-CoV) foi recentemente identificado e está relacionado com doenças em aves e suínos (Woo et al., 2010) (Figura 2).

Figura 2: Árvore filogenética construída pelo método de “Neighbor-Joining” (NJ) para o gene da RNA-polimerase Dependente de RNA (RpRd) do CoV com valores de 1000 replicatas de bootstrap. Figura extraída de Woo et al. (2010).

Os Gammacoronavirus compreendem 2 espécies, detectados em diferentes famílias de aves, porém existem evidências de que as infecções em aves não se restringem a esse grupo (Woo et al., 2012). Quando o CoV bovino (Betacoronavirus) foi experimentalmente inoculado em perus, houve replicação com desenvolvimento de enterite (Ismail et al., 2001). Além disso, Betacoronavirus foi isolado de aves aquáticas migratórias popularmente conhecidas como bobo-pequeno (Puffinus

(26)

o verão (Nuttall & Harrap, 1982). Provavelmente, aves domésticas e silvestres, e ainda alguns mamíferos, são susceptíveis a outros CoV, incluindo aqueles ainda não foram identificados.

As doenças respiratórias provocadas pelo AvCoV são responsáveis por importantes perdas econômicas na avicultura industrial em todo o mundo, estando entre os grandes desafios da avicultura moderna. Esta importância também é reconhecida no Brasil, de acordo com o Programa Nacional de Sanidade Avícola (PNSA), das quatro enfermidades contempladas, duas são de etiologia viral (Brasil, 2010). A importância econômica e social da avicultura brasileira coloca o setor em evidência no âmbito nacional e internacional, visto que o Brasil tem alcançado o posto de maior exportador de carne de frango e o terceiro maior produtor, ficando somente atrás dos Estados Unidos e China (UBA, 2014). Na avicultura comercial, entre os CoV envolvidos em perdas econômicas, destacam-se o Vírus da Bronquite Infecciosa (IBV) e o CoV de perus (TCoV), (Cavanagh, 2005; Loa et al., 2006; Jackwood et al., 2012).

O IBV é o agente etiológico da Bronquite Infecciosa (BI) sendo considerada uma das doenças virais de galinhas mais importantes em países de avicultura industrial intensiva (Cavanagh & Gelb, 2008; Jones, 2010). O controle das infecções provocadas pelo IBV é realizado através de vacinas inativas e vacinas vivas atenuadas. Dentre as vacinas vivas atenuadas, a H120, descrita em 1941 e derivada de um sorotipo proveniente dos Estados Unidos, o “Massachusetts”, é uma das mais utilizadas globalmente e a única vacina viva liberada pelo Ministério da Agricultura Pecuária e Abastecimento (MAPA) para uso no Brasil (Mendonça et al., 2009), embora estudos recentes tem mostrado que vacinas vivas atenuadas contra a BI possam contribuir para o aparecimento de novas variantes patogénicas do IBV (Bande et al., 2015).

Apesar do IBV ser essencialmente de galinhas, CoV geneticamente próximos (“IBV-like”) foram detectados em outros galináceos: pavões (Pavo cristatus), galinhas d’angola (Numida

(27)

marrecos (Anas crecca), gansos (Anserinae), pombos (Columbiformes), patos (Anseriformes) (Liu et

al., 2005; Cavanagh, 2005, Fellipe et al., 2010; Jackwood et al., 2012). O TCoV é um dos principais

causadores de diarréia infecciosa em perus jovens e está envolvido na Síndrome de Mortalidade Entérica das Aves (PEMS). No geral, devido ao seu caráter altamente mutagênico, o controle dos AvCoVs torna-se um desafio constante para a avicultura industrial.

A dinâmica evolucionária do AvCoV é caracterizada pelo continuo surgimento de novas variantes virais, resultando na circulação de múltiplos sorotipos que não conferem proteção imunológica cruzada entre si (Jackwood et al., 2012). A diversidade dos AvCoVs está relacionada principalmente a três fatores: a elevada taxa de mutação da RpRd e Spike; a grande diversidade de aves de diferentes espécies, na qual fornece muitos potenciais hospedeiros alvos para diferentes genótipos do AvCoV e facilidade de transmissão e disseminação viral através de eventos migração para grandes e diferentes áreas geográficas (Haydon et al., 2002; Jackwood, 2006; Wong et al., 2007; Woo et al., 2009; Keesing et al., 2010). Estes fatores têm impulsionado a geração de grandes variedades de AvCoVs, resultando em persistentes reservatórios que podem tornar-se relevante para as populações humanas quando os animais silvestres adquirem hábitos sinantrópicos, começando a viver próximos às habitações humanas, e com estreita proximidade com as aves domésticas (Jourdain et al., 2007; Felippe et al., 2010).

Também destacamos os AvCoVs detectados em aves pertencentes a diferentes ordens que são conhecidos por “IBV-like”: Anseriformes, Columbiformes, Charadriiformes, Passeriformes,

Pelacaniformes, Ciconiiformes e Psittaciformes, que podem influenciar fortemente na

epidemiologia dos AvCoVs (Domanska-Blicharz et al., 2014). Ao que tudo indica, este vírus é capaz de se replicar em outras aves que não são galináceos (Figura 3), assintomaticamente (pelo menos em alguns casos), que agem como vetores do “IBV-like” (Montassier, 2010). Apesar da importância

(28)

sanitária e econômica dos AvCoV para a avicultura industrial, o conhecimento sobre a prevalência e distribuição destes vírus em aves silvestres e sinantrópicas assim como os seus caminhos evolutivos, ainda permanecem limitados.

Figura 3: Epidemiologia proposta e transmissão do AvCoV entre aves silvestres e domésticas. Hipótese de transmissão entre espécies (A). As linhas contínuas e tracejadas representam as vias confirmadas e as hipóteses de transmissão viral entre espécies (B) Figura extraída de Montassier (2010).

A abundância e variedade destas aves, além de populações de aves migratórias potencialmente infectadas que anualmente usam territórios intercontinentais através da migração, representam um risco potencial iminente para a introdução e disseminação de novos patógenos e/ou de novas variantes de CoVs. Portanto, faz-se necessário uma melhor caracterização das variantes de CoVs já existentes e

(29)

a investigação de novas variantes virais com potencial repercussão sanitária afim de auxiliar na caracterização filogenética da avifauna estudada facilitando assim o direcionamento de medidas ou ações que visem preservar e elucidar o status sanitário vigente.

1.2 FILOGENIA E ESTUDOS DE EVOLUÇÃO MOLECULAR 1.2.1 Dinâmica evolucionária populacional

Mutações em um gene que são passadas para a prole e que coexistem com o gene original resultam em polimorfismos. Em um sítio polimórfico, duas ou mais variantes de um gene circulam simultaneamente em uma população. Geneticistas populacionais tipicamente estudam a dinâmica da frequência destes sítios polimórficos ao longo do tempo. A localização no genoma onde duas ou mais variantes coexistem é chamada de locus. As diferentes variantes para um locus em particular são chamados de alelos (Griffiths et al., 2005).

Genomas de vírus, em particular, são muito flexíveis às alterações genéticas; vírus de RNA podem conter muitos sítios polimórficos em uma única população. HIV, por exemplo, não existe em um único hospedeiro como uma única sequência genômica, mas é composto por um grupo de variantes que se mudam constantemente, sendo referidos frequentemente como uma quasispecie (Eigen & Biebricher, 1988; Domingo et al., 2006).

A alta diversidade genética é resultado principalmente do erro e da rápida replicação dos vírus de RNA. Organismos diplóides sempre carregam dois alelos. Quando ambos os alelos são idênticos, o organismo é homozigoto; quando o organismo carrega dois diferentes alelos ele é heterozigoto. Posições heterozigóticas são polimórficas. A evolução é sempre o resultado de alterações nas frequências alélicas, também chamados de frequências gênicas. Alguns alelos são perdidos ao longo do tempo, enquanto que as vezes outros alelos aumentam a sua frequência a 100%, se fixando na população. A velocidade que isto ocorre é chamada de taxa de fixação (Figura 4). (Page & Holmes, 1998).

(30)

Figura 4: Perda ou fixação de um alelo em uma população. Figura extraída de Lemey et al. (2009b).

A evolução, a longo prazo, resulta na fixação sucessiva de determinados alelos, que reflete em fixação de mutações. Termos como: taxa de fixação, taxa de mutação, taxa de substituição e taxa evolucionária foram usados alternadamente por vários autores, mas eles podem referir-se a diferentes processos. Particularmente, taxa de mutação, deve ser reservado de preferência para as mutações que surgem a nível do DNA, normalmente expresso como o número de mudanças nos nucleotídeos (ou aminoácidos) por sítio por ciclo de replicação (Lemey et al., 2009b).

Taxa de fixação, taxa de substituição e taxa de evolução molecular são todos equivalentes quando aplicado a sequências que representam diferentes espécies ou populações, caso em que eles representam o número de novas mutações por unidade de tempo que se fixam numa espécie ou população. No entanto, quando aplicado a sequências que representam diferentes indivíduos dentro de uma população, a interpretação destes termos são sutilmente alterados, porque nem todas as diferenças mutacionais observadas entre os indivíduos (polimorfismos) acabará se tornando fixa em uma população (Li & Graur, 1991).

(31)

Nestes casos, taxas de fixação não são adequadas, mas a taxa de substituição ou a taxa de evolução molecular pode ainda ser utilizada para representar a taxa na qual os indivíduos acumulam diferenças genéticas entre si ao longo do tempo. A partir de um ponto de vista filogenético, as diferenças nas sequências de nucleotídeos ou de aminoácidos entre táxons geralmente são chamados de substituições (embora mutações recentemente geradas possam estar presentes em ramos terminais das árvores) (Li, 1997).

Se os taxóns representam diferentes espécies ou populações, as substituições serão equivalentes aos eventos de fixação. Se os táxons representam diferentes indivíduos dentro de uma população, o comprimento dos ramos mede as diferenças genéticas que se acumulam dentro dos indivíduos, que não são, mas em última análise, pode levar a eventos de fixação (Lemey et al., 2009b).

1.2.2 Investigação através da filogenética molecular

Para investigar a evolução e as relações entre genes e organismos, diferentes tipos de dados podem ser usados. A forma clássica de estimar a relação entre espécies é comparando as suas características morfológicas (Linnaeus, 1758). A taxonomia ainda se baseia em grande parte na morfologia. A informação molecular está cada vez mais disponível e cada vez temos mais dados disponíveis em banco de dados, tal como mais sequências de nucleotídeos ou de aminoácidos (Li & Graur, 1991).

Se a abordagem morfológica ou molecular é preferível para a análise das abordagens evolutivas em particular, esta questão tem sido debatida durante décadas (Li, 1997). No entanto, o uso de dados moleculares para inferir árvores filogenéticas já ganhou considerável interesse entre os pesquisadores de diferentes disciplinas, e tem sido muitas vezes utilizado para estudar as relações evolutivas com mais profundidade (Nei, 1987).

(32)

características morfológicas de múmias ou fósseis geralmente é a única forma de estimar as suas relações. Micro-organismos como vírus, em particular, a única maneira de estudar o seu passado é através das relações filogenéticas das amostras presentes na natureza (hospedeiros) através das árvores filogenéticas usando dados moleculares e testando hipóteses sobre os processos que moldaram as sequências de nucleotídeos e aminoácidos ao longo do tempo (Lemey et al., 2009b). A filogenia é uma árvore contendo nós que são conectados por ramos. Cada ramo representa a persistência de uma linhagem genética através do tempo, e cada nó representa o nascimento de uma nova linhagem (Figura 5). Se a árvore representa a relação entre um grupo de espécies, em seguida, os nós representam os eventos de especiação. Em outros contextos, a interpretação poderia ser diferente. Por exemplo, uma árvore de sequências de um gene a partir de uma amostra da população, os nós representam eventos de nascimento de indivíduos que são ancestrais a amostra, ao passo que em uma árvore de famílias de genes parálogos, os nós podem representar eventos de duplicação de genes (Yang & Rannala, 2012).

Figura 5: Estrutura de uma árvore filogenética enraizada (a) e não enraizada (b). τ0 e τ1

representam dois eventos de especiação que ocorreram em tempos diferentes. Os comprimentos dos ramos (b0, b1, b2 e b3) são tipicamente expressos em unidades de número de substituições por

(33)

sítio e mede a quantidade da evolução ao longo dos ramos. Figura extraída de Yang & Rannala (2012).

Métodos de reconstrução filogenética ou são baseados em distância ou baseado em caracteres. Em relação aos métodos que usam matrizes de distância, a distância entre cada par de sequências é calculada, e a matriz de distância resultante é utilizado para reconstrução das árvores. Por exemplo, o método de distância “Neighbor-Joining” (NJ) (Yang & Rannala, 2012) aplica um algoritmo de agrupamento usando matrizes de distância para a contrução de filogenias.

Por outro lado, os métodos baseados em caracteres incluem a Máxima Parcimônia, “Maximum Likelihood” e a Inferência Bayesiana. Estas abordagens comparam simultaneamente todas as sequências no alinhamento, considerando um carácter (um sítio no alinhamento) de cada vez para calcular um “score” para cada árvore gerada. Onde o “score” da árvore é o número mínimo de mudanças para a Máxima Parcimônia, o valor do log de “Likelihood” para ser aplicado na análise de “Maximum Likelihood” e a probabilidade posterior se tratando da Inferência Bayesiana (Yang & Rannala, 2012).

Em teoria, a árvore com o melhor “score” deve ser identificada por meio da comparação de todas as árvores possíveis. Na prática, por causa do grande número de árvores possíveis, uma pesquisa exaustiva não é computacionalmente viável, exceto quando se trata de um conjunto de dados muito pequeno. Em caso de grandes conjuntos de dados, aplica-se os algoritmos heurísticos nas análises. Estas abordagens frequentemente geram uma árvore inicial e depois executam rearranjos para tentar melhorar o “score” da árvore (Nei, 1987; Lemey et al., 2009b).

Uma pesquisa heurística não é garantida para encontrar a melhor árvore sob um determinado critério, mas, através destes métodos torna-se viável analisar grandes conjuntos de dados. Para analisar os dados, matriz de distância, “Maximum Likelihood” e Inferência Bayesiana, todos estes métodos fazem uso de modelos evolucionários e, portanto, as análises são baseadas nestes modelos

(34)

(Figura 6), enquanto que a Máxima Parcimônia não tem um modelo explícito, sendo as suas suposições evolucionárias implícitas, embora todos os métodos citados são de suma importância para uma completa caracterização filogenética de um determinado gene ou organismo em particular (Hillis et al., 1996).

Figura 6: Modelos de Markov para as substituições de nucleotídeos. A espessura das setas representam as taxas de substituições dos quatro nucleotídeos (T, C, A e G), e o tamanho dos círculos representam as frequências dos nucleotídeos quando o processo de substituição está em equilíbrio. Abreviaturas: JC69 = Jukes-Cantor, 1969; K80 = Kimura, 1980; HKY85 = Hasegawa, Kishino & Yano 1985. Figura extraída de Yang & Rannala (2012).

Inferências filogenéticas são ferramentas extremamente úteis para o estudo da ecoepidemiologia molecular de patógenos e para a elucidação das suas características epidemiologicamente importantes. Estas ferramentas permitem uma completa caracterização molecular das variantes virais existentes e a descoberta de novas variantes com potenciais repercussões epidemiológicas, conduzinto também para uma análise detalhada da sua história evolutiva (Hillis et al., 1996). Adicionalmente, estas análises fornecem informações sobre a cronologia dos processos evolutivos, podendo ser usadas para comparar e associar indivíduos provenientes de regiões geográficas específicas relacionando-as com o tempo do ancestral comum mais recente (tMRCA) de cada região estudada.

(35)

Ferramentas como a filogeografia Bayesiana, interpreta a distribuição das diferenças fenotípicas e genéticas no espaço, considerando um quadro histórico que permite estudar os processos que criam esta divergência. Estas abordagens são usadas para compreender as origens e as distribuições de diferentes variantes virais e para traçar a dinâmica evolutiva destas variantes inseridas em uma determinada população em questão. Técnicas filogeográficas têm sido aplicados a muitas infecções virais que ameaçam a saúde humana, nomeadamente: virus da Dengue, Raiva, Influenza e HIV (Lemey et al., 2009a; Holmes, 2004; Kühnert et al., 2011), mas há considerável falta de informação se tratando de CoVs em geral.

Por fim, a partir de intensas buscas em banco de dados (GenBank, CoV Database, Virus Sequence Database) e na literatura indexada, não foram encontrados nenhuma sequência do gene Spike proveniente do AvCoV relacionando com o seu isolamento e detecção em aves silvestres, consequentemente, não foram encontrados estudos filogenéticos, filogeográficos e de dinâmica evolucionária voltados a este campo; se tratando da região RdRp, existem poucas ocorrências considerando o CoV detectado em aves silvestres e sinantrópicas. Neste contexto, entendemos que há uma carência substancial de informações filogenéticas e que mais estudos são necessários para o entendimento da dinâmica evolutiva dos CoVs.

Nesta tese, aplicou-se ferramentas de filogenia e filogeografia no gene codificador da proteina Spike e na RdRp dos CoVs para avaliar a sua dinâmica evolutiva; estudar os arranjos espaciais de diferentes linhagens genéticas dentro de cada espécie e entre espécies de aves estreitamente relacionadas e para analisar os princípios e processos que determinam a distribuição geográfica destas linhagens virais, estabelecendo um recurso para uma melhor caracterização molecular das variantes de CoVs disponíveis e/ou ainda não identificadas.

(36)

2. OBJETIVOS 2.1 GERAL

Identificar e estudar a história evolutiva dos CoVs circulantes em amostras de aves silvestres e sinantrópicas provenientes do Sul e Sudeste do Brasil.

2.2 ESPECÍFICOS

- Detectar CoVs usando primers para AvCoVs, Pan-CoVs e Delta-CoVs em aves silvestres e sinantrópicas;

- Sequenciar o gene Spike (S1) e a RNA polimerase RNA-dependente (RdRp) dos CoVs detectados e realizar estudos de evolução molecular aplicando uma abordagem filogeográfica;

- Contribuir para a construção de um banco de genes que possam futuramente auxiliar no entendimento da eco-epidemiologia molecular e biodiversidade dos CoVs.

(37)

3. MATERIAIS E MÉTODOS 3.1 Aspectos éticos

A captura e manejo dos animais silvestres e sinantrópicos para a coleta das amostras biológicas foi realizada de acordo com as normas do Sistema de Autorização e Informação de Biodiversidade (SISBIO), nº 34751-1/12.

3.2 Áreas de Coletas e Amostras

No total, 500 amostras de material biológico (suabe traqueal e/ou cloacal) foram coletadas de 42 espécies pertencentes 17 famílias e 13 ordens (Tabela 1 e Figura 7) no período de 2009 a 2013 no Estado de São Paulo (Parque Ecológico do Tietê, São Paulo/SP; Bosque dos Jequitibás, Campinas/SP e Granja Paulista, Iacri/SP) e na cidade de Florianópolis (Espaço Silvestre Instituto Carijós), Estado de Santa Catarina (Figura 8). As amostras pertencentes ao Espaço Silvestre Instituto Carijós foram gentilmente cedidas por colegas através de colaborações com o estudo.

Tabela 1: Visão geral das aves silvestres e sinantrópicas envolvidas no estudo. Ordem Família Espécies/Aves (n) Suabes coletados (n)

Accipitriformes Accipitridae 1 8 Anseriformes Anatidae 11 72 Cathartiformes Cathartidae 1 24 Columbiformes Columbidae 3 194 Falconiformes Falconidae 2 15 Galliformes Cracidae 1 2 Passeriformes Emberizidae 5 22 Passeriformes Cotingidae 1 4 Passeriformes Icteridae 1 4 Passeriformes Passeridae 1 5 Passeriformes Tyrannidae 2 9 Pelecaniformes Ardeidae 2 7 Piciformes Picidae 1 4 Piciformes Ramphastidae 1 7 Psittaciformes Psittacidae 5 86 Strigiformes Strigidae 3 35 Suliformes Phalacrocoracidae 1 2 Total: 13 17 42 500

(38)

Figura 7: Quantidade de suabes traqueais e cloacais coletados das aves silvestres e sinantrópicas investigadas no estudo.

As amostras fornecidas por Centros de Triagem e Laboratórios de Diagnóstico foram resultantes de apreensão provenientes de ações contra o comércio ilegal de animais. Estas cidades citadas acima foram escolhidas, porque fazem parte da rota migratória de muitas dessas aves (Figura 8).

Os suabes contendo os materiais biológicos foram acondicionados em microtubos de 1,5 mL. Em seguida, foram identificados com o nome da espécie junto com o código estipulado pelo profissional que a coletou. Após a identificação, as amostras biológicas foram imediatamente transportadas para o Laboratório de Virologia Animal (LVA), Departamento de Genética e Evolução e Bioagentes Patogênicos, Instituto de Biologia, UNICAMP, em caixas térmicas com barras de gelo reciclável (4 °C) sendo acondicionadas a -80 °C até o seu processamento.

236

264

(39)

Figura 8: Mapa de localização das regiões de coleta das amostras. (A) Parque Ecológico do Tietê, São Paulo/SP, (B) Bosque dos Jequitibás, Campinas/SP, (C) Granja Paulista, Iacri/SP e (D) Espaço Silvestre Instituto Carijós, Florianópolis/SC.

3.3 Mapa das rotas das aves migratórias e não migratórias avaliadas no estudo

Os mapas que mostram as aves e as suas específicas rotas foram derivados dos bancos de dados da BirdLife International (Cambridge, Reino Unido) e NatureServe (Arlington, Estados Unidos da América). Estes mapas consistem de “Shapefiles” dos Sistema de Informações Geográficas (GIS) que mostram a extensão geográfica e distribuição de todas as espécies de aves investigados no estudo (Figura 9).

(40)

Figura 9: Mapa de distribuição das aves migratórias e não migratórias avaliadas no estudo. As cores representam as localizações de cada região específica em que as aves estão presentes. Os nomes destacados representam as aves que participam de eventos de migração.

3.4 Extração do RNA e RT-PCR quantitavo em Tempo Real (RT-qPCR) para detecção do AvCoV

Para a triagem, cada amostra contendo o material biológico foi destinada a extração do RNA viral seguido do Real Time RT-qPCR usando iniciadores para a região 5’ UTR do AvCoV, como descrito a seguir.

3.4.1 Extração do RNA

A extração do RNA viral foi realizada com o kit de extração QIAamp® Viral RNA Mini

(QIAGEN, Califórnia, EUA). No microtubo que continha o suabe com a amostra biológica, adicionaram-se 500 µL de Meio Mínimo Essencial (MEM), (Nutricell, Brasil). Homogeneizou-se e em seguida 140 µL foram retirados do microtubo e transferidos para um novo microtubo de 1,5

(41)

mL. A este, adicionou-se 560 µL do tampão AVL (tampão de lise viral) e 5,6 µL do carreador de RNA. O microtubo foi incubado a temperatura ambiente por 10 min. Transcorrido o tempo, adicionaram-se 560 µL de etanol absoluto seguindo por homogeneização com agitador vortex por 5 segundos. Dois volumes de 630 µL foram retirados e aplicados à coluna de sílica que foi centrifugada por 2 vezes (para cada volume) a 8.000 rpm (Eppendorf®, 5804 R, Nova York, EUA). Realizaram-se duas lavagens com 500 µL de cada tampão, AW1 e AW2, seguido por centrifugações a 8.000 rpm (AW1) e 14.000 rpm (AW2) (Eppendorf®, 5804 R, Nova York, EUA) com a finalidade de remover outros componentes celulares e resíduos indesejáveis. O RNA foi eluído em 60 µL do tampão AVE (tampão de eluição) e armazenado no biofrezzer a -80 ºC. 3.4.2 RT-qPCR para detecção do AvCoV

A amplificação do fragmento de 143 pb da região 5’ UTR do AvCoV foi padronizada utilizando-se o kit QuantiTec® Probe RT-PCR (QIAGEN, Califórnia, EUA), com concentrações

finais de 500 nM de cada iniciador e 100 nM da sonda TaqMan® (IDT, Iowa, EUA). Preparou-se o mix da reação em microtubo de 1,5 mL contendo: 7,0 µL de H2O RNase-free; 12,5 µL do

QuantiTec Probe RT-PCR Master Mix; 0,125 µL (500 nM) de cada iniciador; 0,25 µL (100 nM) da sonda UTR; 0,25 µL do QuantiTec RT Mix e 5,0 µL de RNA, totalizando 25 µL. Utilizou-se os seguintes iniciadores: 5’ UTR forward 5’-GCT TTT GAG CCT AGC GTT-3’ (IDT, Iowa, EUA) e UTR reverse 5’-GCC ATG TTG TCA CTG TCT ATT-3’ (IDT, Iowa, EUA) e a sonda 5’ UTR 5'- /5HEX/CA CCA CCA G/ZEN/A ACC TGT CAC CTC /3IABkFQ/ -3' (Callison et al., 2006) com a adição de mais um Quencher. A amplificação e detecção por fluorescência foram realizadas no termociclador 7500 Real Time PCR Cycler (Applied Biosystems, Califórnia, EUA). Os ciclos de temperaturas consistiram em 50 oC durante 30 minutos, 95 ºC por 15 minutos e 45 ciclos (94 °C por 1 segundo – 60 °C por 1 minuto).

(42)

4. Nested-PCR (nPCR) para a amplificação da região S1 do AvCoV detectado por RT-qPCR Visando o sequenciamento do fragmento da região S1 (530 pb), as amostras positivas foram direcionadas para uma nova amplicação dos fragmentos do gene supracitado. As etapas e os procedimentos da amplificação são descritos a seguir.

4.1 Síntese do cDNA

Para a síntese do cDNA foi utilizado o kit High Capacity cDNA Reverse Transcription (Applied Biosystems™, Califórnia, EUA) de acordo com as especificações do fabricante. Assim, foram adicionados a 10 µL do RNA extraído no item 3.4.1., 2,0 µL de 10X RT Buffer; 0,8 µL de 25X dNTP Mix (100 mM); 2,0 µL de 10X RT Iniciador Randômico; 1,0 µL da MultiScribe™ Reverse Transcriptase; 4,2 µL da H2O Nuclease-free perfazendo um volume final de 20 µL da

reação. As reações foram realizadas no termociclador Mastercycler®Pro S (Eppendorf, Califórnia,

EUA).

4.1.2 Gene S (Região S1)

1ª reação: em um microtubo de 200 µL foram adicionados 2,5 µL de 10x PCR Rxn Buffer (Invitrogen, Brasil); 0,75 µL de dNTP (10mM, Invitrogen, Brasil); 1,5µL de MgCl2 (50 mM);

1,25 µL dos iniciadores S7 (10 µM) e S6 (10 µM); 15,05 µL de H2O Milli-Q estéril; 0,2 µL da

Platinum®Taq DNA Polimerase (5 U/µL, Invitrogen, Brasil) e 2,5 µL do cDNA. As condições da reação foram: 95 °C por 1 minuto, 35 ciclos de 95 °C por 1 minuto, 55 °C por 1 minuto e 72 °C por 1 minuto, seguidos por 72 °C por 7 minutos para a extensão final. Para a 2ª reação: 2,5 µL de 10x PCR Rxn Buffer (Invitrogen, Brasil); 0,75 µL de dNTP (10mM, Invitrogen, Brasil); 1,5µL de MgCl2 (50 mM); 1,25 µL dos iniciadores S9 (10 µM) e S5 (10 µM); 15,05 µL de H2O Milli-Q

estéril; 0,2 µL da Platinum®Taq DNA Polimerase (5 U/µL, Invitrogen, Brasil) e 2,5 µL do cDNA proveniente da primeira reação supracitada (Bochkov et al., 2007). Os iniciadores utilizados estão descritos abaixo na Tabela 2. As reações foram realizadas no termociclador Mastercycler®Pro S

(43)

(Eppendorf, Califórnia, EUA).

Tabela 2: Iniciadores utilizados na amplificação da região S1 do AvCoV

Iniciadores Alvo Sequências dos iniciadores Tamanho do

fragmento

S7 Fwd Spike (S1) 5’-ACATC(T/A)TGTGCGGTGCCATT-3’ (IDT, Iowa, EUA) 572 pb

S6 Rev Spike (S1) 5’-TACTACTACCAGAGTGC(C/T)TT-3’ (IDT, Iowa, EUA) 572 pb

S9 Fwd Spike (S1) 5’-GTGCCATTGACAAAATAAGC-3’ (IDT, Iowa, EUA) 530 pb

S5 Rev Spike (S1) 5’-ATGGTTGGCATTT(A/G)CA(C/T)GG-3’ (IDT, Iowa, EUA) 530 pb

4.1.3 nPCR para a amplificação da RdRp para a pesquisa de Pan-CoV

O cDNA foi submetido a uma reação de nPCR tendo como alvo a RdRp, seguindo o protocolo descrito por Chu et al. (2011). Os ciclos utilizados foram: 94 °C durante 10 min; 40 ciclos de 94 °C durante 30 s, 48 °C durante 30 s, e 72 °C durante 40 s; com uma extensão final a 72 °C durante 10 min. O produto da PCR da primeira reação foi amplificado por uma nova reação de PCR sob condições idênticas às da primeira reação, exceto que um novo conjunto de iniciadores foram utilizados no ensaio (Tabela 3). O produto final da reação (440 pb) foi enviado para o sequenciamento.

Tabela 3: Iniciadores utilizados na amplificação do RdRp do CoV Iniciadores

[100 µM]

Alvo Sequências dos iniciadores Tamanho do

fragmento

Pan-CoV1 Fwd RdRp 5'-GGKTGGGAYTAYCCKAARTG-3' (IDT, Iowa, EUA) 602 pb

Pan-CoV1 Rev RdRp 5'-TGYTGTSWRCARAAYTCRTG-3' (IDT, Iowa, EUA) 602 pb

Pan-CoV2 Fwd RdRp 5'-GGTTGGGACTATCCTAAGTGTGA-3' (IDT, Iowa, EUA) 440 pb

Pan-CoV2 Rev RdRp 5'-CCATCATCAGATAGAATCATCAT-3 '(IDT, Iowa, EUA) 440 pb

4.1.4 PCR convencional para a amplificação do gene codificador do Nucleocapsídeo para a pesquisa de Delta-CoV

A pesquisa de Delta-CoV foi realizada seguindo os parâmetros descritos por Wang et al. (2014). O cDNA foi submetido a uma reação de PCR convencional tendo como alvo o gene

(44)

codificador do Nucleocapsídeo. Os iniciadores utilizados no ensaio foram: Fwd: 5'-TTTCAGGTGCTCAAAGCTCA-3' e Rev: 5'-GCGAAAAGCATTTCCTGAAC-3'. Estes iniciadores foram desenhados usando regiões conservadas de diferentes Delta-CoVs (Woo et al., 2012). O ensaio foi realizado sob as seguintes condições de ciclagem: 95 °C durante 15 min., seguido por 40 ciclos de amplificação a 95 °C durante 15 s, 55 °C durante 45 s, e 72 °C durante 1 min., com uma extensão final a 72 °C durante 7 min.

5. Sequenciamento

Ao se constatarem amostras positivas para os CoVs, os produtos da PCR foram submetidos a reação de sequenciamento, onde as etapas são descritas abaixo.

5.1 Eletroforese em gel de Agarose submerso

O produto resultante da PCR foi submetido à Eletroforese usando gel de agarose submerso (Agargen, Madri, ESP) a 1% contendo o tampão TBE 0,5 X 1M de Tris base (J.T. Baker Chemical Company, NJ, EUA), 1M de ácido bórico (J.T. Baker Chemical Company, NJ, EUA) e 20mM de EDTA (Mallinckrodt Technology, NJ, EUA) (Sambrook et al., 1989). Alíquotas de 5,0 µL do DNA amplificado foram misturadas com 1 µL do azul de bromofenol a 0,25% e 1 µL do GelRed 1:100 (Uniscience, São Paulo, BR) e em seguida aplicadas no gel e submetidas à eletroforese em cuba horizontal a 80 V, 400 mA por 40 minutos e visualizadas em um transluminador (Vilber Lourmat, ECX-20.M, FR). Utilizou-se como padrão de peso molecular o FastRuler™ Low Range DNA Ladder de 1,500 pb (Thermoscientific®, Califórnia, EUA).

5.2 Purificação dos amplicons e Reação de Sequenciamento

O produto da PCR foi diretamente purificado usando o kit MiniElute PCR Purification (QIAGEN, Califórnia, EUA) quando uma única banda no gel de agarose era visualizada no transluminador (Vilber Lourmat, ECX-20.M, FR). As amostras que apresentavam mais de uma banda visível incluindo a banda de interesse do estudo foram cortadas e purificadas usando o kit

(45)

MiniElute Gel Extraction (QIAGEN, Califórnia, EUA). A concentração total de dsDNA (doublestrand DNA) foi determinada usando o espectrofotômetro NanoDrop Epoch (Biotek, Vermont, EUA). A leitura foi realizada em um comprimento de onda de 260 nm e a concentração de DNA foi ajustada por diluição para ser usada na reação de sequenciamento.

Os produtos da PCR purificados foram sequenciados no Laboratório Central de Alta Tecnologia de Desempenho em Ciências da Vida (LaCTAD/UNICAMP, São Paulo, Brasil). As reações de sequenciamento foram realizadas utilizando o kit de Big Dye® 3.1 Terminator Cycle Sequencing (Applied Biosystems™, Califórnia, EUA) seguindo as instruções fornecidas pelo fabricante. A plataforma de sequenciamento utilizada foi a 3730XL DNA Analyser (Applied Biosystems™, Califórnia, EUA).

6. Estudos de Evolução Molecular e aplicação da Bioinformática para análises das sequências virais

6.1. Análises dos Eletroferogramas

Os Eletroferogramas gerados para cada uma das sequências senso e anti-senso de cada amostra

foram submetidos ao aplicativo Phred1 (disponível online em:

http://asparagin.cenargen.embrapa.br/phph/) para avaliação da qualidade dos mesmos, utilizando-se apenas posições com escore superior a 20 (probabilidade de um erro a cada 100 nucleotídeos). A seguir, os cromatogramas foram conferidos manualmente usando o software BioEdit Sequence Alignment Editor v.7.2.5 (http://www.mbio.ncsu.edu/bioedit/bioedit.html) para a busca e correção de erros de interpretação (bases degeneradas) e discrepâncias entre cada uma das fitas sequenciadas.

6.2 Edição das sequências

Utilizou-se o software BioEdit v.7.2.5 para a edição das sequências. Em seguida, cada amostra foi submetida ao Basic Local Alignment Search Tool nucleotide (BLASTn) para

(46)

confirmação de similaridade com as sequências de CoV depositadas no GenBank/NCBI (http://www.ncbi.nlm.nih.gov/genbank/).

6.3 Análises de Sistemática molecular

As análises filogenéticas e filogeográficas foram desenvolvidas no Departamento de Patologia, Imunologia e Medicina Laboratorial, Instituto de Patógenos Emergentes (EPI), Universidade da Flórida, Gainesville, FL, EUA. Esta estreita colaboração foi proveniente de uma proposta que surgiu para a realização de uma completa caracterização filogenética das sequências obtidas no estudo.

6.3.1 Coleta das sequências e análises filogenéticas

Todas as análises de bioinformática e de sistemática molecular foram realizados utilizando o cluster de Linux do Centro de Computação de Alta Performance (UF, HPC), Universidade da Flórida, EUA. Alternativamente, o servidor CIPRES da Universidade da Califórnia (San Diego, EUA) foi utilizado para complementação das análises (Miller et al., 2011).

Para a realização das análises filogenéticas, todas as sequências relacionadas a porção S1 do gene Spike do AvCoV, provenientes de diferentes animais, foram obtidas a partir do banco de dados GenBank (http://www.ncbi.nlm.nih.gov/genbank/) (Tabela 4) e filtradas considerando os seguintes parâmetros: “/collection_date” e “/isolation_source” (Figura 10). A região S2 do gene Spike, clones, patentes e sequências recombinantes foram excluídas das nossas análises. Alternativamente, diferentes sequências envolvendo a porção S1 do gene Spike e a RdRp de diferentes CoVs foram coletadas para representar os gêneros Alpha-, Beta-, Gamma-, e Delta-. O alinhamento das sequências foi realizado utilizando o software ClustalW-”Message Passing Interface” (MPI) (Li, 2003).

(47)

Tabela 4: Sequências do gene Spike (S1) obtidas no estudo (negrito) e triagem das sequências coletadas do banco de dados GenBank para a realização das análises

Espécies Sequências obtidas no estudo (n) Área geográfica Sequências provenientes do GenBank Intervalo de tempo

Asio clamator 2 (2009) América do

Sul 0 2009

Colaptes campestris 2 (2009) América do

Sul 0 2009

Coragyps atratus 8 (2009 – 2010) América do

Sul 0 2009 – 2010 (1 ano) Rupornis magnirostris 4 (2009) América do Sul 0 2009

Pyroderus scutatus 3 (2009) América do

Sul 0 2009

Megascops choliba 5 (2009) América do

Sul 0 2009

Caracara plancus 2 (2009) América do

Sul 0 2009

Pitangus

sulphuratus 3 (2009)

América do

Sul 0 2009

Amazona vinacea 2 (2013) América do

Sul 0 2013

Columba livia* 13 (2006 – 2008) América do

Sul - Ásia 8 (2005, 2006, 2007)

2005 – 2008 (3 anos)

Phasianus colchicus - Europa 9 (1983, 1994, 1995, 1999) 1983 – 1999 (16 anos) Meleagris gallopavo - América do Norte e América do Sul - Europa 34 (1994 - 2008) 1994 - 2008 (14 anos) Gallus gallus - América do Norte, América do Sul e América Central 2209 (1954 – 2014) 1954 - 2014 (60 anos) Ásia - Europa - Oceania - África

Numida meleagris - Europa 1 (2011) 2011

Anser anser - Europa

Anas sp. - Ásia 3 (2004) 2004

(48)

Figura 10: Sequências do gene Spike (S1) do AvCoV coletadas do GenBank. As sequências foram coletadas considerando os parâmetros “/collection_date” e “/isolation_source” presentes no banco de dados GenBank.

(49)

As árvores filogenéticas foram construídas através de quatro métodos de inferência: Método de Distância (NJ) (Tamura et al., 2013), “Maximum Likelihood” (ML) (Swofford et al., 1996), Máxima Parcimônia (Farris, 1983) e Inferência Bayesiana (Bouckaert et al., 2014). A seleção do modelo de evolução molecular mais adequado para o conjunto de dados foi feita através do software jModelTest v.2 (Santorum et al., 2014).

As análises filogenéticas iniciais foram realizadas usando os seguintes métodos: ML implementado nos softwares RAxML v.8 (Stamatakis, 2014) e FastTree v.2.1.7 (Price et al., 2010) e o Método de Distância utilizando os algorítmos NJ e “Neighbor-Joining” Relaxado (RNJ) implementados nos softwares MEGA v.6.0 (Tamura et al., 2013) e Clearcut (Sheneman et al., 2006), respectivamente, utilizando correções de Kimura para distâncias em pares (Sheneman et

al., 2006).

A análise de ML no RAxML foi conduzida utilizando os parâmetros de modelo evolutivo “General Time Reversible” (GTR) + G e no FastTree foi usado a implementação padrão que é o GTR + CAT com 20 parâmetros de distribuição gamma e um mix de “Nearest-Neighbor Interchanges” (NNI) e “Sub-Tree-Prune-Regraft” (SPR) para a busca das melhores topologias das árvores. A confiabilidade das árvores de ML foi analisada usando os valores de suporte do

bootstrap (para RAxML) e do teste de Shimodaira-Hasegawa (SH-like) (para FastTree) usando

1000 replicações (Anisimova & Gascuel, 2006).

Dois diferentes softwares (FastTree e RAxML) foram utilizados para reconstrução da árvore de “Likelihood” para avaliar possíveis diferentes padrões de agrupamento das sequências provenientes do estudo com as sequências dos AvCoVs coletadas do banco de dados GenBank. Os softwares Figtree v.1.4.2 (http://tree.bio.ed.ac.uk/software/figtree/) e OneZoom (Rosindell & Harmon, 2012) foram usados para visualizar a grande árvore de ML.

(50)

6.3.2 Aplicação da partição filogenética de larga escala

Depois das árvores de ML geradas, o software PhyloPart v.2.0 foi usado para extrair as partições baseadas na confiabilidade dos nós com o intuito de coletar as sequências mais representativas para serem usadas nas análises Bayesiana e de Máxima Parcimônia. Esta abordagem considera nós/sub-árvores com uma confiabilidade ≥ 90% assumindo ≥ 2 distintos táxons (Prosperi et al., 2011) (Figura 11).

Figura 11: Esquema de uma partição filogenética de larga escala. Árvore filogenética onde cada taxón é identificado por uma letra (A-Z) e cada nó da árvore tem um valor associado a sua confiabilidade (expresso como valores de bootstrap) (a). Histograma de distribuição da distância patrística das árvores inteiras. O método de partição identifica três clusters (amarelo, vermelho e verde) considerando nós/sub-árvores com uma confiabilidade ≥ 90% assumindo ≥ 2 distintos táxons (b). (Figura extraída de Prosperi et al., 2011).

(51)

6.3.3 Abordagem Bayesiana

A inferência Bayesiana foi realizada utilizando o software “Bayesian Evolutionary Analysis Utility” (BEAST) v.2.1.3 (Bouckaert et al., 2014) assumindo um relógio molecular estrito ou relaxado (“uncorrelated Exponential” e Log-Normal), utilizando diferentes parâmetros coalescentes [tamanho populacional constante, crescimento populacional exponencial e plotagem Bayesiana [“Bayesian Skyline Plot” (BSP)] (Drummond et al., 2005). As Cadeias de Markov (Markov Chain Monte Carlo, MCMC) foram executadas com 450 milhões de gerações e amostradas a cada 45,000 passos. Alternativamente, o software LogCombiner v.2.1.3 (disponível no pacote do BEAST v.2.1.3; http://beast.bio.ed.ac.uk/logcombiner) foi utilizado para fazer uma reamostragem dos estados de distribuição posterior para uma menor frequência. Os modelos de evolução implementados foram indicados pelo software jModelTest v.2 (Santorum et al., 2014).

Os arquivos de saída do BEAST foram analisados no software Tracer v.1.6 com 10% de burn-in (Rambaut et al., 2013). O tamanho do efetivo amostral (“Effective Sample Size”, ESS) foi ≥ 500 para cada um dos parâmetros testados. O software Densitree (Bouckaert et al., 2014) foi utilizado para a realização das análises qualitativas e de densidade das árvores geradas. Em seguida, o software TreeAnnotator v.2.1.2 (pacote do BEAST v.2.1.3; http://beast.bio.ed.ac.uk/treeannotator) foi utilizado para reconstruir árvores com clados de máxima credibilidade (MCC) provenientes de cada parâmetro coalescente. As árvores geradas foram visualizadas no visualizador gráfico Figtree v.1.4.2.

As inferências de ancestrais biogeográficos foram realizadas através do método MCMC de regressão binária Bayesiana (BBM) para predizer intervalos de faixas ancestrais biogeográficas através de múltiplas interações com as MCMC. O software “Reconstruct Ancestral State in Phylogenies” (RASP) v.2.1 foi utilizado para esta análise e as cadeias MCMC foram executados por 5 milhões de gerações. O estado foi amostrado a cada 100 gerações. As análises foram

(52)

realizadas com o modelo fixo de Jukes-Cantor + Gamma (JC + G) e o BBM com distribuições de raízes nulas (Yu et al., 2014).

6.3.4 Filogeografia Bayesiana

Os parâmetros da história evolucionária, o que inclui tempo da evolução das variantes do AvCoV e a sua dispersão espacial e temporal, foram estimadas usando uma abordagem Bayesiana implementada no pacote de software BEAST v.2.1.3 (Bouckaert et al., 2014). Para ajustar a escala de tempo das árvores, foram obtidos dados das sequências (em anos) a partir das anotações do GenBank, e para acomodar a variação entre as linhagens, foi utilizado uma abordagem de relógio molecular para estimar a localização espacial do ancestral ao longo da sua história filogenética. Os resultados foram analisados usando os softwares Tracer v.1.6 e TreeAnnotator v.2.1.2.

6.3.5 Análises de Relógio Molecular

O tMRCA e a taxa evolutiva (assumindo a substituição de nucleotídeos por sítio por ano) foram inferidas nas sequências designadas como Clado 1 [sequências da porção S1 do AvCoV detectado em aves silvestres e sinantrópicas provenientes do estudo] e Clado 2 [sequências da porção S1 do IBV coletadas do GenBank proveniente da espécie Gallus gallus (galinhas)] usando o BEAST v.2.1.3. As sequências pertencentes ao Clado 1 e 2 foram selecionadas para as leituras assumindo o relógio molecular estrito e relaxado, como descrito acima no item 6.3.3.

Os modelos de substituição de nucleotídeos implementados pelo jModelTest v.2 foram o GTR (Clado 1) e o Hasegawa, Kishino and Yano (HKY) (Clado 2). O relógios moleculares utilizados foram o relaxado para o Clado 1 e estrito para o Clado 2. Três parâmetros coalescentes (crescimento populacional constante, crescimento populacional exponencial e BSP) foram utilizados para a análise do Clado 1, enquanto que o parâmetro coalescente BSP foi usado para análise do Clado 2. A MCMC foi executada com 450 milhões de gerações e reamostrada a cada

(53)

45,000 passos, totalizando 10,000 árvores armazenadas com distribuição posterior. Os resultados foram visualizados no software Tracer v.1.5 (Rambaut et al., 2013). O valor do ESS para cada parâmetro foi ≥ 500, o que indica boa “mistura” das Cadeias de Markov.

Diferentes modelos de relógio foram comparados utilizando o “Bayes Factors”, que seria a razão entre as diferentes probabilidades marginais obtidas (marginal em relação à anterior) dos dois modelos comparados (relógio molecular estrito e relaxado) (Lemey et al., 2001a). Foram calculadas as probabilidades marginais aproximadas para cada modelo coalescente utilizando os Critérios de Informações Akaike (AICM) dos dados de amostragem de “Likelihood”.

6.3.6 Análises de Máxima Parcimônia

Para a reconstrução do estado caráter dos nós ancestrais e para a realização da inferência de fluxo gênico, uma análise de Máxima Parcimônia foi realizada utilizando o pacote do software Mesquite v.2.75 (Maddison e Maddison, 2011). Para estas análises, utilizou-se as sequências filtradas por amostragem de ano e por fonte de isolamento. Estas análises capacitam a interpretação da evolução de várias características das variantes do AvCoVs e de seu comportamento evolutivo dado a um grupo de organismos.

6.3.7 Números de acesso das sequências obtidas no estudo

Todas as sequências virais adquiridas neste estudo foram submetidas ao GenBank através da ferramenta BankIt (http://www.ncbi.nlm.nih.gov/WebSub/?tool=genbank). Os números de acesso das sequências estão descritos abaixo na Tabela 5.

(54)

Tabela 5: Números de acessos das novas sequências virais obtidas no estudo Identificação das sequências submetidas Números de acessos (GenBank) Avian Infectious Bronchitis Virus isolate 1133 KP211413

8705A_2010 KP256815 8705M_2010 KP256816 8705K_2010 KP256817 8705J_2010 KP256818 8705I_2010 KP256819 10_Southeastern_Parrot_2013 KP256820 S3_2009 KP256821 S4 KP256822 S1_2009 KP256823 S2 KP256824 S5_2009 KP256825 S7_2009 KP256826 S8_2009 KP256827 S11_2009 KP256828 S12_2009 KP256829 S13_2009 KP256830 S15_2009 KP256831 S16_2009 KP256832 S18_2009 KP256833 S20_2009 KP256834 S23_2009 KP256835 S24_2009 KP256836 S25_2009 KP256837 S26_2009 KP256838 S27_2009 KP256839 S30_2009 KP256840 S31B_2009 KP256841 S31C_2009 KP256842 S32B_2009 KP256843 S33B_2009 KP256844 S33C_2009 KP256845 S34_2009 KP256846 S35A_2009 KP256847 S38_2010 KP256848

(55)

7. Passagem em ovos embrionados livres de patógenos específicos (SPF)

Para este ensaio, foram selecionadas amostras provenientes de suabes traqueais e cloacais de

Amazona vinacea e Asio clamator que foram positivas para o AvCoV. No ensaio, inoculou-se via

cavidade corioalantóica o Meio Mínimo Essencial de Eagle (MEM) acrescido de uma solução de antibióticos (2.000 UI/mL de Penicilina e 2.0 mg/mL de Estreptomicina) totalizando 100 μL. O meio MEM já estava presente nos suabes originais para a realização da extração do RNA viral (ver procedimento no item 3.4.1).

Utilizou-se grupos de 4 ovos embrionados por amostra (embriões com 9 dias de idade). Coletou-se o líquido alantóide 5 dias após a inoculação (dpi). Realizou-se também ensaios moleculares (RT-qPCR) para verificar a presença ou não de RNA viral. Em seguida, os embriões foram avaliados para a presença de lesões características do IBV (nanismo, hemorragia petequial e enrolamento), este processo foi repetido até chegar na amplificação necessária para a visualização das lesões (Gelb et al., 1995). Utilizou-se a estirpe Massachusetts H120 do IBV como controle positivo (Matthijs et al., 2008).

(56)

8. RESULTADOS E DISCUSSÃO

8.1 Prevalência do AvCoV e pesquisa de Pan-CoV em aves silvestres e sinantrópicas

Inicialmente, 500 amostras (distribuídos em suabes traqueais e cloacais) provenientes de 42 espécies de aves foram testadas para a região 5’-UTR dos AvCoV por RT-qPCR. Destas, 65 (13,0%) amostras foram positivas em 23 diferentes espécies (Figura 12). Quarenta e três amostras (8,6%) foram provenientes de suabes traqueais e 22 amostras (4,4%) de suabes cloacais. AvCoV foi detectado em 11 ordens e 14 famílias (Tabela 6).

Figura 12: Visão geral dos resultados obtidos sobre a prevalência do AvCoV detectado em aves silvestres e sinantrópicas.

Entre as famílias de aves, o vírus foi detectado em Accipitridae (1 de 1 espécie), Anatidae (3 de 11 espécies), Ardeidae (1 de 3 espécies), Cathartidae (1 de 1 espécie), Columbidae (3 de 3 espécies), Falconidae (1 de 2 espécies), Icteridae (1 de 1 espécies), Passeridae (1 de 1 espécie),

Phalacrocoracidae (1 de 1 espécie), Picidae (1 de 1 espécie), Psittacidae (3 de 5 espécies), Ramphastidae (1 de 1 espécie), Strigidae (3 de 3 espécies) e Tyrannidae (2 de 2 espécies). Os

resultados podem ser mais bem visualizados a seguir na Tabela 6 e visualizados por locais específicos na qual as amostras foram coletadas (Figura 13).

(57)

Tabela 6: Prevalência do AvCoV e sua relação de positividade em diferentes fontes de coleta das amostras

Traqueal Cloacal Total Ordem/Família/Espécie/Aves Nome popular + - + -

Accipitriformes

Accipitridae 1 espécie

Rupornis magnirostris gavião carijó 1 3 2 2 8

Anseriformes

Anatidae 11 espécies

Amazonetta brasiliensis pé-vermelho 0 4 0 4 8

Anas aucklandica marreco-da-nova-zelândia 0 2 0 3 5

Anas bahamensis marreca-toucinho 1 8 0 9 18

Anas platyrhynchos pato-real 0 1 0 1 2

Anas flavirostris marreca-pardinha 0 3 0 4 7

Anas sp. marreco-híbrido 0 4 0 5 9

Chenonetta jubata pato-de-crina 0 1 0 1 2

Dendrocygna autmmnalis asa-branca 0 2 0 2 4

Dendrocygna viduata irerê 0 3 0 4 7

Neochen jubata pato-corredor 2 1 0 2 5

Netta rufina pato-do-bico-vermelho 1 0 1 0 2

Cathartifomes

Cathartidae 1 espécie

Coragyps atratus urubu-de-cabeça-preta 2 9 3 10 24

Columbiformes

Columbidae 3 espécies

Columba livia pombo-doméstico 17 85 1 86 189

Columbina talpacoti rolinha-roxa 1 0 1 0 2

Zenaida auriculata avoante 1 0 0 1 2

Falconiformes

Falconidae 2 espécies

Caracara plancus caracará 1 5 1 4 11

Falco peregrinus falcão-peregrino 0 2 0 2 4

Galliformes

Cracidae 1 espécie

Penelope superciliaris jacupemba 0 1 0 1 2

Passeriformes Passeridae/Emberizidae/ Icteridae/Tyrannidae/Cotingidae

9 espécies

Gubernatrix cristata cardeal-amarelo 0 2 0 1 3

Molothrus bonariensis chupim 1 0 0 1 2

Passer domesticus pardal 1 2 0 2 5

Pitangus sulphuratus bem-te-vi 2 0 1 1 4

Pyroderus scutatus pavó 0 2 0 2 4

Sicalis flaveola canário-da-terra-verdadeiro 0 3 0 6 9

Referências

Documentos relacionados

PARÁGRAFO QUARTO - Quando da efetivação do pagamento, será consultado os documentos comprobatórios de situação regular em relação à Seguridade Social, Fundo de

The main objectives of this data analysis are divided into two classes: i) General Statistics: give an overview of structured information on Wikipedia as a whole, showing raw numbers

Seu vampiro é um adolescente que frequenta salas de aulas, adora velocidade, não dorme em caixões, anda de dia, e, principalmente, irá amadurecer (mesmo tendo

Os principais objectivos definidos foram a observação e realização dos procedimentos nas diferentes vertentes de atividade do cirurgião, aplicação correta da terminologia cirúrgica,

O relatório encontra-se dividido em 4 secções: a introdução, onde são explicitados os objetivos gerais; o corpo de trabalho, que consiste numa descrição sumária das

Os principais resultados obtidos pelo modelo numérico foram que a implementação da metodologia baseada no risco (Cenário C) resultou numa descida média por disjuntor, de 38% no

The present study evaluated the potential effects on nutrient intake, when non- complying food products were replaced by Choices-compliant ones, in typical Daily Menus, based on

Após a colheita, normalmente é necessário aguar- dar alguns dias, cerca de 10 a 15 dias dependendo da cultivar e das condições meteorológicas, para que a pele dos tubérculos continue