• Nenhum resultado encontrado

3 MATERIAIS E MÉTODOS

4.7 MODELAGEM DE PROTEÍNAS

As estruturas terciárias das proteínas RBP, MCP e RdRp potencialmente codificadas pelo isolado da Indonésia foram preditas utilizando os programas I- TASSER e Phyre2. Os valores para o escores e parâmetros de avaliação dos modelos são mostrados na Tabela Suplementar 5. Não foi possível obter modelos com escores de confiabilidade significantes para as proteínas SP1 e SP2. Os modelos da MCP e RdRp também foram preditos para os três isolados do Brasil (Figuras Suplementares 5 e 6). Não foram gerados modelos da RBP para os isolados do Brasil devido à sequência de aminoácidos da proteína ser idêntica para os quatro isolados.

O melhor modelo 3D da RBP apresentou um C-Score igual a -2,26 e uma estrutura comum presente em estruturas já resolvidas para o domínio conservado DSRM disponíveis no Protein Data Bank (PDB), as quais possuem duas α-hélices e três folhas β (destacado em cinza claro na Figura 16 e na Figura Suplementar 7A). Essas estruturas também correspondem parcialmente às estruturas secundárias preditas pelo PredictProtein (Figura 12).

Figura 16: Modelo estrutural para a proteína RBP do IMNV gerado pelo I-TASSER. O domínio conservado DSRM está destacado em cinza claro. (MolProbity score 4,03, Z-Score 0,627, C-score - 2,26).

O modelo gerado no I-TASSER para o monômero da MCP apresentou um C-Score igual a -2,27 e um formato semelhante ao dos monômeros de Saccharomyces cerevisiae virus L-A (ScV-L-A) e Helminthosporium victoriae virus 190S (HvV190s), mas diferenças significativas em relação às estruturas secundárias devido o alto conteúdo de α-hélices (Figura 17) (NAITOW et al., 2002; DUNN et al., 2013). A Figura 17 mostra a localização do possível “trench” e um resíduo de His 107 identificado nesta estrutura. Um segundo modelo gerado no Phyre2 para a MCP, baseado apenas em modelagem por threading, resultou em uma estrutura composta por três α-hélices (Figura Suplementar 7B), compreendendo os aminoácidos 518 a 590.

Figura 17: Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER. O core conservado da MCP está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. (MolProbity score 3,47, Z-Score -6,341, C-score -2,27).

A modelagem por threading associada com simulações ab initio para a RdRp gerou o modelo com o melhor C-Score (0,23) em relação aos modelos da RBP e MCP. Apesar da ausência de estruturas β na estrutura, o formato da proteína foi semelhante a uma “right hand”, como esperado para uma RNA polimerase. Os domínios “thumb”, “fingers” e “palm” estão indicados na Figura 18, assim como as sequências-motivo A, B, C, D, E, F1, F2 e F3 estão destacadas em cores diferentes. O domínio conservado da RdRp também está evidenciado em cinza claro (Figura 18).

Figura 18: Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER. O domínio conservado da RdRp está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. Os domínios “thumb”, “fingers”, e “palm” estão mostrados, assim como as sequências-motivo conservadas em RdRps estão destacadas como segue: A – azul escuro; B – azul claro; C – rosa; D – verde; E – amarelo; F1, F2 e F3 – laranja. (MolProbity score 3,96, Z-Score -5,14, C-score 0,23).

4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS

4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas

Primers flanqueando uma região variável e uma região conservada do genoma do IMNV foram produzidos para detecção do vírus (Tabela 5). Os pares de primers SP-F/SP-R e RdRp-F/RdRp-R foram desenhados para amplificar um fragmento de 456 pb e 200 pb, respectivamente, e para possuírem temperaturas de melting (TM) similares a fim de serem usados tanto em uma reação multiplex como em reações separadas. Um par de primer (EF1α-F/ EF1α-R) também foi desenhado

para ser usado como controle positivo da reação e amplifica um fragmento de 600 pb presente no gene do fator de elongação-1α do camarão.

Tabela 5: Lista de primers empregados no sistema de identificação do IMNV. Nome do primer Sequência (5’→3’) TM (ºC)

SP-F CATCAAGTGTACTCGGAAG 52,85 SP-R CTTCTCTAGTTAGAACTGGATC 52,90 RdRp-F ACGTAGAGGACATACATCC 53,05 RdRp-R GATTGGTATTGTCTGATTTCTAC 53,02 EF1α-F GCGCAAGAGCGACAACTATG 59,97 EF1α-R ACATAGGCTTGCTGGGAACC 60,03

Um esquema mostrando o alinhamento de nucleotídeos referente aos fragmentos de 456 pb e 200 pb, amplificados das regiões variável e conservada, respectivamente, está mostrado na Figura 19. A figura também indica o número de sítios polimórficos presente em cada região.

Figura 19: Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb referentes às regiões variável e conservada, respectivamente. Esses fragmentos foram empregados no sistema de detecção do IMNV. Os sítios polimórficos de cada região estão mostrados em caixas.

Usando os primers SP-F/SP-R e RdRp-F/RdRp-R em duas reações de PCR separadas foi possível detectar a presença do IMNV em duas amostras diferentes de camarão como mostrado na Figura 20A. Embora esta seja uma análise qualitativa, considerando a mesma quantidade de template e a intensidade das bandas, é possível notar que a amostra 1 apresentou uma maior quantidade de partículas do IMNV do que a amostra 2. A análise de agrupamento por Neighbor joining utilizando o fragmento de 456 pb a partir dos quatro genomas do IMNV reconstitui os mesmos grupos mostrados na Figura 9 (Figura 20B).

Figura 20: Sistema de detecção do IMNV. (A) Gel de agarose mostrando os resultados do sistema de identificação do IMNV utilizando os novos marcadores para as regiões variável e conservada do genoma. O sistema foi capaz de identificar a presença do IMNV em duas amostras diferentes do camarão coletadas em diferentes locais do Brasil. 1 – marcador de peso molecular; 2 e 6 – controle positivo (EF-1α); 3 e 7 – controle negativo; 4 e 8 – detecção usando os primers da região mais variável; 5 e 9 – detecção usando primers da região conservada. Os asteriscos indicam as bandas de 456 pb e 200 pb esperadas. (B) Análise Neighbor joining baseado no fragmento de 456 pb da região mais variável. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06.

4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples

Na tentativa de desenvolvermos um sistema de identificação de ácidos nucleicos a partir da curva de desnaturação dos amplicons, seis regiões de 200 pb foram selecionadas ao longo de todo o genoma do IMNV além do fragmento de 456 pb (Reg.Frag456) já apresentado no tópico anterior. Todas essas regiões foram submetidas a 2 análises in silico: (1) predição de estrutura secundária de RNA e DNA e (2) geração de curvas de melting a partir da desnaturação do DNA de fita

dupla e do RNA de fita simples. A abordagem de desnaturação de uma fita simples é inédita, e possivelmente mais eficiente para determinar variações na sequência primária que a desnaturação de uma fita dupla (OLIVEIRA et al., 2014). Após as análises in silico algumas dessas regiões também foram utilizadas para testes preliminares in vitro (Tabela 6).

Tabela 6: Regiões selecionadas para o teste de detecção baseado na análise da curva de melting de fita simples.

Região Localização no genoma Teste in silico Teste in vitro

R1 (nt 468-667) Small proteins Sim Não

R2 (nt 969-1168) Small proteins Sim Sim

R3 (nt 1119-1318) Small proteins Sim Sim

R4 (nt 1635-1834) Small proteins Sim Não

R5 (nt 2413-2612) MCP Sim Sim

R6 (nt 6823-7022)* RdRp Sim Sim

Reg.Frag456 Small proteins Sim Não

*A região R6 corresponde ao fragmento de 200 pb do par de primers RdRp-F/RdRp-R.

A partir da desnaturação das sequências apresentadas na Tabela 6, esperávamos conseguir diferenciar os amplicons e discriminar os isolados sequenciados neste estudo. As Figuras 21 e 22 mostram resultados preliminares dos testes para as regiões R2 e R3, comparando os isolados IMNVgen1 e IMNVgen2. Os resultados obtidos de predição de estrutura secundária de RNA e DNA para a região R2 mostram estruturas bastante diferentes entre os isolados (Figura 21A-D). Por outro lado, para a região R3, essas estruturas se apresentaram mais semelhantes (Figura 22A-D). Para ambas as regiões, os resultados obtidos para a curva de melting de fita simples in silico não corresponderam às curvas geradas na análise in vitro, indicando que o método não foi eficiente na diferenciação dos isolados e precisa ser melhorado (Figuras 21E-H e 22E-H).

Figura 21: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R2. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B - estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.

Figura 22: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R3. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B - estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.

Como mostrado na Figura 19, o fragmento de 456 pb foi capaz de diferenciar os quatro isolados do IMNV após a etapa de sequenciamento. Os resultados in silico de predição de estrutura secundária de RNA e curva de melting de fita simples indicam que este fragmento é capaz de diferenciar os vírus sequenciados no presente estudo daqueles já descritos (Figura 23). De fato, as estruturas secundárias de RNA dos vírus do Brasil e Indonésia são mais semelhantes entre si (Figura 23A e B), assim como as estruturas secundárias de RNA para IMNVgen1 e IMNVgen2 (Figura 23C e D). A curva de melting de RNA fita simples realizada in silico foi capaz de refletir a diferença entre as estruturas de RNA (Figura 23E).

Figura 23: Predição de estrutura secundária de RNA e curva de melting de fita simples realizada in silico para o fragmento de 456 pb. A predição de estrutura secundária de RNA foi realizada no programa RNAfold e a curva de melting simples fita foi gerada no programa RNAheat. A – IMNV-BR; B – IMNV-Ind; C – IMNVGen1; D – IMNVGen2; E – curva de melting de fita simples in silico.

5 DISCUSSÃO

O surgimento de doenças infecciosas que acometem animais de criação é um dos principais problemas para a economia dos países produtores, causando prejuízos financeiros significativos. Sendo assim, é necessário que esse problema seja resolvido ou, pelo menos, minimizado empregando métodos de identificação e controle eficientes para evitar e/ou combater essas doenças (LANA, BEISEL & SILVA, 1992; NAGATA et al., 2006; MINGXIAO et al., 2013).

O desenvolvimento de métodos de identificação e controle eficazes requer conhecimentos aprofundados em relação à biologia do patógeno. Em termos moleculares, é necessário conhecer a sequência genômica do organismo, assim como os produtos gênicos codificados pelo genoma (POULOS et al., 2006; SILVA et al., 2014). Também é interessante estudar a filogenia e aspectos evolutivos do organismo de interesse (POULOS et al., 2006; CORTEY et al., 2011; FRAGA et al., 2012). A partir desses conhecimentos pode-se investigar a variabilidade genética das diversas espécies, identificar regiões conservadas e variáveis nas sequências, prever a estrutura tridimensional de proteínas importantes e, assim, inferir seus mecanismos de infectividade, replicação, dentre outros mecanismos e características (NIBERT, 2007; TANG et al., 2008; CORTEY et al., 2011; APTE- SENGUPTA et al., 2012; NAIM, BROWN & NIBERT, 2014).

Um método molecular eficaz para detecção molecular é a Reação em Cadeia da Polimerase (PCR). Esse sistema já é amplamente empregado na detecção de agentes infecciosos e fornece um resultado confiável (POULOS & LIGHTNER, 2006; SILVA et al., 2014). Além disso, quando realizada em tempo real, a PCR é capaz de quantificar o DNA de maneira precisa e com maior reprodutibilidade (SILVA,

PINHEIRO & COIMBRA, 2011; WEIRATHER et al., 2011; BOTELHO-SOUZA et al., 2014). Estudar o genoma, tanto no nível de nucleotídeos quanto no nível de aminoácidos, bem como as proteínas codificadas, é importante na seleção de regiões alvo para o desenho de primers (SEIBERT et al., 2010; LOY et al., 2013). A produção dos primers é o principal passo no desenvolvimento de um sistema de PCR confiável.

No presente trabalho, foi estudado o genoma, bem como os possíveis produtos de expressão gênica codificados por ele, de quatro isolados distintos do vírus causador da mionecrose infecciosa em camarões peneídeos, oriundos do Brasil e Indonésia, a fim de desenvolver um método de PCR eficiente na identificação e distinção desses isolados.

As duas amostras positivas identificadas no screening inicial para detecção de novos isolados do IMNV em camarões Litopenaeus vannamei foram suficientes para alcançar os objetivos do presente estudo. O fato de não termos conseguido encontrar o IMNV em muitas amostras, em especial aquelas cujos camarões estavam intactos, pode ser devido aos seguintes fatores: (i) os camarões realmente não estavam infectados, já que as amostras foram obtidas de grandes fazendas que tomam as devidas medidas profiláticas; (ii) a coleta das amostras pode ter sido realizada em um período no qual as condições ambientais não favoreciam a incidência do vírus ou; (iii) os métodos aplicados na identificação não foram eficientes, pois encontramos que o primer F13 (Tabela 1) não funcionou devido anelar em uma região onde existia um sítio polimórfico (nt 5.784).

A análise filogenética mostra que o grupo GLV-like compreende vírus do gênero Giardiavirus e ScV-like compreende vírus do gênero Totivirus. O gênero Victorivirus inclui dois grupos, MoV-like e GaRV-like. Os gêneros Leishmaniavirus e

Trichomonasvirus incluem os grupos LRV-like e TVV-like, respectivamente. O grupo ZbV-Z-like foi anteriormente designado como um grupo primitivo, menos derivado, parente distante dos totivírus e inclui partículas virais com organização genômica distinta desta família. Uma nova família Amalgamaviridae foi proposta para acomodar estes três vírus (LIU et al., 2012). O grupo IMNV-like aparece como o grupo menos derivado próximo a GLV-like. De fato, no estudo filogenético realizado por Poulos e colaboradores (2006), o IMNV foi agrupado com GLV, mas essa análise não levou em consideração as sequências dos vírus do grupo IMNV-like. O grupo IMNV-like não é classificado pela ICTV (KING et al., 2012). Assim, é interessante notar que o IMNV provavelmente pertence a um táxon ainda não descrito. Devido suas características peculiares, Tang e colaboradores (2008) propuseram a criação de um novo gênero na família Totiviridae para acomodar o IMNV. Nossos resultados indicam que o grupo IMNV-like poderia corresponder a esse novo gênero.

As comparações entre os quatro isolados em nível de sequência genômica completa, bem como sequências nucleotídicas e aminoacídicas das ORFs mostradas nas Tabelas 3 e 4, indicam que IMNVgen1 e IMNVgen2 são mais parecidos entre si do que com os genomas do Brasil e Indonésia, e que ambos são mais semelhantes à sequência descrita para o Brasil. É esperado que a similaridade entre os isolados coletados no Brasil seja alta, considerando que o IMNV foi primeiramente identificado no Brasil e, posteriormente, atingiu outros locais do mundo. Entretanto, a análise de agrupamento por Neighbor joining revelou a formação de dois grupos distintos: IMNVgen1/IMNVgen2 e IMNV-BR/IMNV-IND (Figura 9). É curioso e inesperado observar que o isolado do Brasil seja mais relacionado ao isolado da Indonésia. Provavelmente, o genoma está sendo afetado

mais pela variação ao longo do tempo do que pela variação devido ao isolamento geográfico, uma vez que os vírus sequenciados no presente estudo foram coletados nos anos de 2009 e 2013, enquanto que os isolados do Brasil e da Indonésia foram coletados em 2003 e 2006, respectivamente (POULOS et al., 2006; SENAPIN et al., 2007). No entanto, mudanças decorrentes de isolamento geográfico são recorrentes entre os vírus que acometem camarões, como ocorreu com o IMNV na dispersão do Brasil para a Indonésia (SENAPIN et al., 2007). Isolados de WSSV, que é um vírus de DNA, originários da China, Taiwan e Indonésia apresentaram até 13.000 pares de bases divergentes (MARKS et al., 2004). Além disso, isolados diferentes de WSSV da mesma região geográfica foram repostados na China (TAN et al., 2009). Esta observação requer uma análise mais detalhada do genoma a fim de identificar os sítios polimórficos e determinar as regiões que vem sofrendo mudanças e sua correlação com motivos estruturais proteicos.

Mutações gênicas em vírus são bastante comuns, principalmente em vírus que apresentam genoma de RNA, como o IMNV. A falta de atividade de correção de erros da RNA polimerase contribui significativamente para o grande número de mutações encontradas em vírus de RNA. Já é amplamente conhecido que a capacidade de infecção e mecanismos de patogenicidade são influenciados pelas alterações em regiões específicas do genoma de diferentes vírus. As primeiras evidências surgiram do estudo de viróides, que tinham sua capacidade de infecção, replicação e patogenicidade afetadas por alterações induzidas em seu genoma de RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Pudupakam et al. (2011), viram que deleções em uma região hipervariável da ORF1 reduziam a eficiência da replicação do vírus da hepatite E.

A proteína RBP apresentou uma estrutura semelhante àquelas já resolvidas e disponíveis para o domínio conservado DSRM (Figura 16), o que reforça o pressuposto de que os primeiros 93 aminoácidos da ORF1 codificam uma proteína de ligação a dsRNA. Não foi identificado nesta proteína nenhum polimorfismo que alterasse o quadro de leitura de aminoácidos. A função exata da RBP ainda não está bem elucidada. Ela provavelmente desempenha um papel importante no encapsulamento do vírus e modulação da imunidade inata após expressão em células infectadas (TANG, et al., 2008). Sendo assim, podemos supor que sua função requer que a proteína não sofra nenhuma variação na sequência aminoacídica e/ou na sua estrutura proteica. A alta conservação intraespecífica observada tanto na sequência de aminoácidos quanto na estrutura da proteína, indica que as características da RBP estão sendo mantidas durante a evolução. Devido à baixa variação na sequência de nucleotídeos, essa região se caracteriza como uma boa região para estudos filogenéticos e desenhos de primers, assim como pode ser considerada como um bom alvo para agentes terapêuticos. De fato, foi observado que moléculas de RNA de interferência (RNAi) destinadas à RBP fornecem uma proteção eficiente para os camarões desafiados com IMNV (LOY et al., 2013).

O gráfico gerado no Simplot ilustrou a variabilidade em toda a sequência genômica do IMNV e indicou a presença de três picos de menor escore de similaridade na primeira metade da ORF1, região que coincide com aquela que codifica as Small Proteins. Além disso, levando em consideração a região codificante, a maior densidade de sítios polimórficos, inclusive aqueles que alteram a sequência de aminoácidos, se encontra nesta região. Provavelmente a região que codifica as Small proteins é uma região hipervariável presente no genoma do IMNV

que só pôde ser detectada quando as novas sequências, IMNVgen1 e IMNVgen2, foram incluídas na comparação. Regiões hipervariáveis são definidas por comparações intragenômicas uma vez que não existe um valor absoluto que classifique uma região como hipervariável (GONZÁLEZ-CANDELAS & LÓPEZ- LABRADOR, 2013). Em alguns casos, regiões hipervariáveis podem ser identificadas usando o alinhamento de um pequeno número de sequências, como observado na região hipervariável da proteína VP2 do vírus da Doença Infecciosa de Gumboro (BAYLISS et al.,1990) ou na proteína VP1 do vírus Sacbrood (MINGXIAO et al., 2013) que foram identificadas usando três e sete sequências, respectivamente. Essas regiões geralmente são encontradas em proteínas estruturais (TSAREV et al., 1992). Em alguns vírus, regiões hipervariáveis estão associadas com infectividade viral e adaptação aos mecanismos do sistema imune do hospedeiro (BAYLISS et al., 1990; CARPENTER et al., 1991; ANJUM et al., 2013). Um ponto importante é que as Small Proteins codificadas por esta região são candidatas a codificarem as protrusões do IMNV (TANG et al., 2008). Alguns estudos tem mostrado que regiões hipervariáveis de diferentes vírus coincidem com as regiões que codificam as protrusões virais e que essas sequências estão envolvidas em vários mecanismos como a entrada do vírus na célula e neutralização de anticorpos (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et al., 2010; PROMKUNTOD et al., 2014).

Tang e colaboradores (2008) identificaram a uma resolução a 8-0 Å, que o capsídeo do IMNV possui protrusões com características de um complexo de fibras e densidade e resolução menor do que a proteína do capsídeo, o que pode ser explicado por sua flexibilidade lateral. A protrusão do IMNV compreende pelo menos três domínios morfológicos: knob, stalk e foot. Esses mesmos autores propuseram

Documentos relacionados