• Nenhum resultado encontrado

3 MATERIAIS E MÉTODOS

4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE ESTRUTURA SECUNDÁRIA

Os primeiros 93 aminoácidos da ORF1 codificam uma proteína que apresenta um domínio DSRM (double-strand RNA binding motif) conservado envolvido na ligação a RNA. Para simplificar, toda a proteína foi chamada RBP (RNA binding protein). As predições de estrutura secundária revelam que a RBP é totalmente estruturada e possui alto conteúdo de α-hélices, mas nenhum coiled coil (Figura 12 e Figura Suplementar 4A). Diferente das outras proteínas do IMNV, a RBP não apresentou nenhum sítio polimórfico que causasse alteração na sequência de aminoácidos.

Figura 12: Análise de composição de aminoácidos e predição de estrutura secundária para RBP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado DSRM (em cinza claro). O eixo X representa a posição dos aminoácidos.

Proporcionalmente, as proteínas SP1 e SP2, candidatas a codificarem a protrusão, apresentaram o maior número de sítios polimórficos, dos quais 13 podem provocar mudança de aminoácidos. As análises de composição de aminoácidos e predição de estrutura secundária indicam que SP1 possui características de uma proteína estruturada apresentando uma região N-terminal hidrofóbica não exposta a solvente e grande quantidade de folhas-β (Figura 13 e Fig. Suplementar 4B). Já SP2

mostrou-se uma proteína quase totalmente desestruturada, com alta quantidade de aminoácidos carregados, alta hidrofilicidade e uma pequena região estruturada na porção C-terminal. Além disso, a região desestruturada que apresentou o maior pico coincidiu com uma região não exposta a solvente. SP2 também mostrou uma região de coiled coil com um escore significante na porção N-terminal, que foi predito em diferentes reading windows (Figura 13 e Figura Suplementar 4C).

Figura 13: Análise de composição de aminoácidos e predição de estrutura secundária para SP1 e SP2. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando os sítios polimórficos não sinônimos (traços pretos) identificados nas proteínas. O eixo X representa a posição dos aminoácidos.

A proteína principal do capsídeo (MCP) apresentou um número considerável de sítios polimórficos, sendo superada apenas pela região das proteínas SP. De acordo com o esperado para uma proteína globular, ela contém uma alta proporção de aminoácidos neutros (31%) e hidrofóbicos (50,5%). Esta proteína, formada por 901 aminoácidos, apresentou alto grau de regiões estruturadas e duas regiões desestruturadas mais evidentes na sua segunda metade. A região desestruturada entre os aminoácidos 804 a 846 contém alto conteúdo de α-hélices predito pelos programas Coils e PredictProtein (Figura 14 e Fig. Suplementar 4D). As análises in silico também revelaram cinco picos hidrofóbicos preditos pelo TMPred. A comparação entre os quatro genomas do IMNV mostrou que a região correspondente a MCP possui 15 sítios onde ocorrem mudanças de aminoácidos. Esses sítios estão distribuídos ao longo da proteína e alguns coincidem com os picos hidrofóbicos.

Um mapa contendo todos os sítios polimórficos, bem como os aminoácidos codificados, está mostrado na Tabela Suplementar 4. As mudanças de aminoácidos nos sítios 2440, 3160, 3293, 3570, 3653, 3929, 4091 e 4504, localizados na MCP, devem ser destacadas, pois ocorrem mudanças entre aminoácidos com diferentes cargas, indicando que estes sítios poderiam afetar a estrutura secundária da proteína em diferentes isolados virais.

Figura 14: Análise de composição de aminoácidos e predição de estrutura secundária para MCP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o core conservado da MCP (em cinza claro) e os sítios não sinônimos identificados na proteína (traços pretos). O eixo X representa a posição dos aminoácidos.

A RNA polimerase dependente de RNA mostrou-se uma proteína muito conservada entre os quatro isolados apresentando apenas sete sítios polimórficos não-sinônimos. As análises in silico revelaram que a RdRp possui características de uma proteína estruturada com pequenas regiões desestruturadas interpassadas, lembrando uma proteína com domínios conectados por pontes móveis (Figura 15 e Figura Suplementar 4E). Duas hélices hidrofóbicas preditas pelo TMPred estão localizadas em domínios estruturados e provavelmente estão escondidas na estrutura globular. A predição de estruturas secundárias revelou a existência de um alto conteúdo de α-hélices e dois motivos coiled coil com alta probabilidade de ocorrência compreendendo os aminoácidos 243 a 256 e 636 a 649. Em ambos os motivos não foram detectadas mudanças de aminoácidos (Figura 15). A Figura 15 mostra que as sequências-motivo conservadas em RNA polimerases estão localizadas em regiões estruturadas e, exceto pela sequência-motivo F1, todas coincidem com a região do domínio conservado da RdRp.

Como mostrado na Tabela Suplementar 4, a mudança de aminoácidos nos sítios 5299, 5520, 5784 e 6981, localizados na RdRp, devem ser destacados pois ocorre mudança de aminoácidos com diferentes cargas, indicando que estes sítios tem potencial para alterar a estrutura secundária da proteína.

Figura 15: Análise de composição de aminoácidos e predição de estrutura secundária para RdRp. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado da RdRp (em cinza claro), os sítios não sinônimos identificados na proteína (traços pretos) e as sequências-motivo conservadas em RdRps (traços azuis). O eixo X representa a posição dos aminoácidos.

Documentos relacionados