• Nenhum resultado encontrado

Muitos impactos causados pela última epidemia de Zika vírus no Brasil deixaram sequelas importantes para as famílias, especialmente nos casos onde a microcefalia foi manifestada, especificamente, nos casos ocorridos em Pernambuco. Os esforços da comunidade científica elucidaram várias questões sobre a infecção do ZIKV como, por exemplo, sua associação com os casos de microcefalia (CAUCHEMEZ et al., 2016; ARAÚJO et al., 2017), e as rotas do vírus que levaram à epidemia brasileira (CAMPOS et al., 2018). Mas ainda existem lacunas do conhecimento em vários aspectos como, por exemplo, o papel de animais domésticos e silvestres na propagação do vírus (LOWE et al., 2018) e a possibilidade de outros vetores ainda não confirmados (GUEDES et al., 2017; LOWE et al., 2018). A análise através de abordagens in silico das interações entre proteínas do ZIKV e dos hospedeiros deste trabalho visa incrementar o conhecimento sobre o vírus, seus processos e os desdobramentos da infecção nos hospedeiros.

A seleção de amostras é uma importante etapa na construção do modelo pois os conjuntos de amostras positivas e negativas são usados para o treinamento do algoritmo de classificação. Foram adquiridas 12707 interações, formadas por 5206 identificadores de proteínas, tendo cada interação um valor de score que indica o grau de confiabilidade da interação (CALDERONE; LICATA; CESARENI, 2015). As sequência de aminoácidos das 5206 proteínas que formam os pares de interações foram obtidos no webservice do UNIPROT, visto que os identificadores das interações obtidos no VirusMentha estão no padrão do UNIPROT (CALDERONE; LICATA; CESARENI, 2015). Foram descartadas interações com valor de score abaixo do valor ótimo de 0.3 conforme ponto de corte reportado em Villaveces et al. (2015), restando um conjunto final de 1489 interações positivas.

Para gerar o conjunto de dados negativos foi utilizada uma metodologia baseada na proposta de Eid, Elhefnawi e Heath, (2015), que utiliza alinhamento global para fazer as comparações de similaridades entre as proteínas do vírus e do hospedeiro. Ao contrário desta proposta, o presente trabalho usou alinhamento local pois domínios específicos das proteínas podem ser importantes para as interações (SINGHAL; RESAT, 2007). Para aumentar a confiabilidade do conjunto gerado, foram utilizados apenas alinhamentos com cobertura superior à 80% e assim foram obtidos

os 5.362.606 pares de proteínas com interação negativa. Destes pares obtidos, foram selecionados de forma randômica, visando manter a generalização do modelo, 1489 pares como conjunto de amostras negativas para o treinamento do algoritmo. O número de amostras do conjunto negativo foi colocado igual ao do conjunto positivo para evitar viés na construção do modelo conforme proposto em Shen et al. (2007).

O processo de extração de características físico-químicas e de normalização é semelhante ao usado em Cui et al. (2012) e Dyer et al. (2007), onde é implementado o modelo de extração de características físico-químicas de Shen et al. (2007). Este modelo é o estado da arte para esse propósito no tipo de dado utilizado neste trabalho. Durante o processo, 16 proteínas foram descartadas por estarem fora do padrão e as demais foram devidamente normalizadas utilizando a implementação em R descrita em Xiao et al. (2014).

Os vários testes realizados na construção do modelo corroboraram com Ramasubramanian e Singh (2017) e apresentaram um maior tempo de processamento na medida que o conjunto de treinamento aumentou. A acurácia do modelo foi compatível com a da metodologia utilizada em Eid, Elhefnawi e Heath, (2015), quando utilizados os padrões típicos encontrados na literatura de 75% dos dados de interação no conjunto de treinamento e validação cruzada de 5 vezes, e consequentemente comparável a outros trabalhos de predição entre um vírus e um hospedeiro ou predição intraespécie. Conforme esperado, quando diminuído o número de amostras no treinamento a acurácia do modelo diminui chegando a menos de 70% no menor conjunto de treinamento testado durante o desenvolvimento do trabalho. Essa observação está de acordo com a lei dos grandes números, teorema fundamental da estatística, conforme apresentado em Ramasubramanian e Singh (2017). Os resultados mostraram também que o aumento no número de vezes de validação cruzada, para conjunto de dados analisado neste estudo, não melhorou a acurácia do modelo ao contrário do que ocorre em outros trabalhos com outros tipos de dados e outros propósitos (ADAMS et al., 1997). Mesmo dobrando o número de vezes na validação cruzada, de cinco para dez, não foi observado um aumento na acurácia de classificação do modelo.

Os resultados relativos aos números de interações preditas pelo modelo como positivas são comparáveis com outros trabalhos encontrados na literatura. Um bom exemplo foram as predições de interações entre ZIKV e H. sapiens, onde foram

obtidas um total 34.744. No trabalho de Esteves et al. (2017) foi usada uma metodologia baseada em inferência Bayesiana com técnicas de predição de interação de proteínas, como interações de domínios, e foram preditas 32.369 interações entre ZIKV e H. sapiens, contudo foram analisadas apenas proteínas na fase madura e desconsideradas as proteínas intermediárias preM, ancC e pr, ao contrário do presente trabalho. Em Yoon et al. (2017) foram encontradas in vitro 143 interações de proteínas entre ZIKV e H. Sapiens, e dado que outros trabalhos, incluindo o presente, predizem in silico milhares de interações, há fortes indícios de que ainda há muito a ser descoberto dos processos moleculares de infecção do vírus.

A análise dos resultados referentes aos números de interações preditas por cada proteína apresenta um padrão onde as proteínas NS1 e NS5 são as proteínas que mais interagem em todos as espécies analisadas, exceto no A. aegypti. Em Xia et al. (2018) é mostrada que uma mutação na proteína NS1, percebida a partir de 2012, permitiu que essa proteína se ligasse à TBK1 reduzindo sua fosforilação e consequentemente reduzindo a indução do interferon-β. Esse mesmo trabalho investiga ainda a atuação de outras proteínas não estruturais do ZIKV, incluindo a NS5, na fosforilação de TBK1, IKKε e IRF3, tendo portanto a NS1 e a NS5 importantes papeis nos mecanismos de escape do sistema imunológico em humanos. No caso do A. aegypti, as proteínas E e M foram as que apresentaram os maiores números de interações. A proteína do envelope é a principal responsável pela entrada do vírus na célula e, portanto, é determinante na patogenicidade. Em Fontes-Garfias et al. (2017) foi realizado uma ensaio que onde foi removida a glicosilação na proteína E, e foi observada uma atenuação do vírus em camundongos. Foi observado também diminuição na infectividade oral em A. aegypti, o que indica um importante papel desta proteína na infecção pelo principal vetor do vírus. Os resultados exibidos nos grafos construídos para representar as topologias das redes de interações permitem a visualização dessas concentrações de números de interações nas proteínas E e M do A. aegypti, e das proteínas NS1 e NS5 nas demais espécies. Os mesmos resultados referentes às proporções mencionadas são observados nas duas cepas de ZIKV analisadas neste trabalho.

Os dados de enriquecimento apresentados foram baseados em anotações funcionais de processos biológicos, função molecular e via metabólica. Foi observado que mais termos foram encontrados referentes ao H. sapiens e C. jacchus, sendo que

estas foram também as espécies com maiores proteomas e tiveram maiores números de interações preditas. Não foram obtidos resultados de enriquecimento referentes ao A. albopictus. Conforme esperado, foram retornadas entradas referentes à RNA polimerase, visto que o ZIKV é um vírus de RNA e utiliza a maquinaria celular no seu processo de replicação (SAIZ et al., 2016; SIROHI et al., 2016), em todas as espécies que retornaram resultado.

Os resultados obtidos para H. sapiens, corroboram com Fontes-Garfias et al. (2017) apontando anotações relativas a resposta imunológica e via metabólica associada a infecção viral. São elencados ainda termos associados com processo de apoptose celular, concordando com dados encontrados em outros estudos (SOUZA et al., 2016a).

Um dos efeitos mais estudados na infecção do ZIKV é o impacto no sistema nervoso e, especialmente, a má-formação em fetos que levam a microcefalia. Alguns dados que chamam a atenção nos resultados foram os obtidos com relação ao desenvolvimento do sistema nervoso no C. quinquefasciatus e no C. jacchus, além do já esperado para H. sapiens. No caso específico do C. jacchus são encontrados termos referentes ao desenvolvimento específico de várias áreas do cérebro e do crânio, especialmente na fase embrionária. No trabalho de Montgomery e Mundy (2014) é mostrado que primatas tem traços genéticos específicos associados com desordens neurológicas que estão ligados aos processos adaptativos de evolução. Como os dados do presente estudo são de interações com as proteínas do ZIKV e já é comprovada a infecção do vírus com a microcefalia em H. sapiens (CAUCHEMEZ et al., 2016), abre-se a possibilidade de que os mesmo efeitos possam ocorrer no C. jacchus. O C. jacchus é um primata comumente adotado em pesquisas biomédicas (MANSFIELD, 2003), poderia ser, portanto, utilizado para elucidar possíveis questões relativas à infecção do ZIKV.

Documentos relacionados