• Nenhum resultado encontrado

A proteína SEC14 está envolvida em diversas vias em organismos procariotos e eucariotos, especialmente em vias relacionadas ao transporte de lipídios (CLEVES et al., 1991; BANKAITIS et al., 2010). Apesar de sua importância, poucos estudos relatam sua função em cana-de-açúcar e outros vegetais. Tem sido observado que a proteína SEC14 possui um domínio característico de sua família, chamado de CRAL-TRIO, esse domínio é estrutural proteico que está associado com a ligação de moléculas lipofílicas pequenas (BANKAITIS et al., 2010). Este é encontrado em algumas famílias de proteínas, como as ativadoras de GTPases e proteínas ligantes hidrofóbicas, como a SEC14 (HABERMEHL et al., 2005). O alinhamento das

sequências em plantas com maior identidade com a proteína SEC14 mostrou a conservação do domínio CRAL-TRIO (destacada em azul) e CRAL-TRIO N-TERMINAL (destacada em verde), quase completamente, exceto poucos aminoácidos que se apresentavam distintos, destacadas em rosa escuro.

Figura 1 – Alinhamento via Clustal Omega com sequências homólogas a ScSEC14. Destacado em verde as porções correspondentes ao domínio CRAL-TRIO N-TERMINAL e em azul o domínio CRAL- TRIO. Os aminoácidos destacados em rosa indicam possíveis alterações nesse domínio. Ao lado esquerdo da figura, estão explicitados os nomes dos organismos ao qual a sequência corresponde, sendo eles nessa ordem: B. distachyon (XM_003576924.4), O. sativa (AK061499.1), S. italica (XM_004956307.4), Z. mays (NM_001143217.1), SEC14 em cana-de-açúcar (a sequência estudada aqui- comp75824_c0_seq1), destacada por retângulo vermelho, CScSEC14 em cana-de-açúcar (MG571103.1) (HUA-YING et al., 2018) e S. bicolor (XM_002459881.2).

O domínio CRAL-TRIO ocupa grande parte da proteína SEC14 e se encontra com alta conservação entre as gramíneas analisadas. De modo geral, o domínio CRAL-TRIO N- TERMINAL ocupa da posição 10 a 58 do alinhamento e, para CRAL-TRIO, de 88 a 240. Tendo em vista que a sequência tem aproximadamente 335 aminoácidos, mais da metade dela corresponde ao domínio CRAL-TRIO. Poucos aminoácidos divergiram das sequências analisadas (Figura 1). A figura 2 mostra o posicionamento do domínio CRAL-TRIO nas sequências de gramíneas analisadas no alinhamento acima.

Figura 2 - Análise dos domínios conservados entre proteínas homólogas a SEC14 em gramíneas e ScSEC14. Na porção esquerda da figura estão os identificadores das sequências correspondente aos organismos: Saccharum spp. (comp75824_c0_seq1), Saccharum ssp. cultivar chinês (MG571103.1),

Sorgo bicolor (XM_002459881.2), Zea mays (NM_001143217.1), Setaria italica (XM_004956307.4), Brachypodium distachyon (XM_003576924.4) e Oryza sativa (AK061499.1), na porção direita da

figura encontram-se os tamanhos das sequências.

Na Tabela 3 podemos observar a porção correspondente ao domínio CRAL-TRIO de cada sequência acima analisada.

Tabela 3 – Posicionamento do domínio CRAL-TRIO em gramíneas. Organismos Sigla para

identificação Tamanho da sequência (aa) Intervalo do domínio CRAL-TRIO Saccharum officinarum ScSEC14 364 79-239 Saccharum officinarum (cultivar chinês) CScSEC14 335 79-239

Sorghum bicolor S.bicolor 335 79-239

Zea mays Z.mays 336 82-239

Setaria italica S.italica 335 79-239

Brachypodium distachyon

B.distachyon 333 80-240

Oryza sativa O.sativa 335 79-239

A tabela 3 nos permite analisar que o tamanho de cada sequência é similar, assim como, a região de aminoácidos da sequência que corresponde ao domínio CRAL-TRIO. Pode-se observar que os intervalos possuem grande semelhança, não possuindo distância maior que 5 aminoácidos. Quando comparamos a proteína (ScSEC14) SEC14 em cana-de-açúcar

(monocotiledônea) com sua homóloga em A. thaliana (planta modelo – dicotiledônea), vemos uma conservação menor como apresentado na figura 3. A proteína SEC14 em A. thaliana tem uma sequência maior, contendo 554 aminoácidos, provavelmente pela anotação completa do genoma desse vegetal. Todavia, ainda podemos ver a conservação na parte do domínio.

Figura 3 - Alinhamento via Clustal Omega com a sequência de Arabidopsis thaliana (At4g39180) homóloga a ScSEC14. Destacado em verde as porções correspondentes ao domínio CRAL-TRIO N- TERMINAL e em azul o domínio CRAL-TRIO.

Existem apenas 4 proteínas homólogas a SEC14 revisadas em A. thaliana por meio do banco de dados Uniprot, as demais proteínas homólogas, apesar de apresentarem maior identidade, não apresentam o status de revisadas, isto significa que as proteínas revisadas foram manualmente anotadas e revisadas por curadores do UniProt, as sem revisão foram anotadas computacionalmente. Em posse apenas das revisadas, pode-se observar uma conservação do domínio CRAL-TRIO e seu posicionamento nas sequências, como apresentado na figura 4.

Figura 4 - Análise dos domínios conservados entre proteínas homólogas a SEC14 em A. thaliana e ScSEC14 (Saccharum spp.). Na porção esquerda da figura estão os identificadores das sequências pelo UNIPROT, sendo as quatro últimas de Arabidopsis e a primeira a proteína SEC14 em cana-de-açúcar, na porção direita da figura encontram-se os tamanhos das sequências. A escala horizontal está a 0,6.

A tabela 4 nos permite visualizar mais informações acerca do posicionamento do domínio e seu respectivo intervalo nas sequências, além do tamanho da sequência e em qual cromossomo está contida. Nesta tabela pode-se observar a conservação do domínio entre as sequências de A. thaliana e sua porção compartilhada na sequência de cana-de-açúcar. Os tamanhos das sequências diferem, tendo um maior número de aminoácidos nas correspondentes a A. thaliana. Um indicativo de que a SEC14 está conservada não somente da família Poaceae, como em outros grupos de plantas.

Tabela 4 – Posicionamento do domínio CRAL-TRIO em ScSEC14 e A. thaliana.

Organismos Sigla para identificação e seu respectivo gene Número do cromossomo Tamanho da sequência (aa) Intervalo do domínio CRAL-TRIO Saccharum officinarum ScSEC14 - 364 79-239 Arabidopsis thaliana F4JVA9 SFH2 4 554 138-312 Arabidopsis thaliana F4J7S8 SFH9 3 579 145-319 Arabidopsis thaliana Q93ZE9 SFH3 2 548 137-311 Arabidopsis thaliana F4JLE5 SFH1 4 554 130-304 4.2 ANÁLISE FILOGENÉTICA

Uma análise filogenética pode ser usada para muitos propósitos, para análises de famílias de genes, possível predição de função e ainda estimar relações evolutivas entre determinados organismos. Para melhor caracterizar a SEC14 de cana-de-açúcar, inferir sua conservação entre outras famílias de vegetais e visualizar como seria essa potencial relação filogenética deste gene em plantas, montou-se uma árvore filogenética com sequências de aminoácidos por meio do servidor TaxOnTree. Por meio da análise do domínio conservado CRAL-TRIO, obtivemos informações sobre a conservação desse gene em gramíneas e A. thaliana. Uma árvore filogenética possibilita abarcar maior número de organismos que contém o gene e se o domínio característico da família SEC14 apresenta-se conservado. A partir da árvore gerada pelo TaxOnTree, restringimos os organismos para a montagem de uma nova árvore no MEGA 7, utilizando sequências de aminoácidos, contendo apenas 2 a 3 exemplares

de cada família que apresentaram possíveis duplicações. A árvore (Figura 5) contém unicamente sequências de plantas.

Figura 5 - Árvore filogenética de SEC14 em vegetais. Com o programa MEGA 7 foi construída a árvore e analisada pelo método Maximum Likelihood, baseada no modelo de matriz JTT. O bootstrap foi inferido com 1000 replicatas e Cutoff de 95%. A nossa sequência de SEC em cana-de-açúcar está destacada pelo retângulo vermelho.

Nota-se a presença da proteína SEC14 em diferentes organismos, indicando ortologia entre os genes, ou seja, no passado, essas espécies tiveram um ancestral comum que apresentava em seu genoma esse gene. Quando houve a cladogênese, cada organismo herdou a SEC14, tendo uma homologia dessa proteína entre eles. Salienta-se que há um indicativo de duplicação de alguns organismos que se repetem na árvore, contudo apresentam o gene em cromossomos

diferentes. A Tabela disponível no anexo permite observar todas as sequências contidas nessa árvore e em qual cromossomo encontra-se o gene para SEC14, essas possíveis duplicações ocorrem tanto em mono como em eudicotiledôneas. Há diferença entre os grupos das eudicotiledôneas e monocotiledôneas, essa separação ficou explícita na árvore disponível no anexo. Existem 3 sequências do organismo Sorghum bicolor destacadas por apresentarem maior identidade a SEC14 na árvore, sendo elas LOC8065083, LOC8082915 e LOC8062008, que se encontram, respectivamente nos cromossomos 10, 4 e 2. O alinhamento das mesmas via Clustal Omega (Anexo) sugere que são prováveis duplicações que podem estar em processo de divergência, pois apresentam-se em cromossomos diferentes e, apesar de conservarem a sequência, já possuem alguns aminoácidos distintos. Destaca-se também que todas as sequências da árvore apresentam conservado o domínio CRAL-TRIO.

Com o intuito de observar as relações filogenéticas com um maior nível de restringência, fez-se outra árvore filogenética mais restritiva com os parâmetros de 100 alvos máximos e o threshold de 70 (Figura 6). Pode-se notar que, para estes parâmetros, esta árvore apresenta apenas a família das Poaceae (na árvore do anexo , essa família foi destacada em vermelho), o que era de se esperar devido à similaridade das sequências dentro de uma mesma família. Supõe-se que um maior nível de restrição só permite que as relações filogenéticas mais próximas estejam visíveis na árvore. Por isso, começamos com uma árvore mais abrangente com 200 organismos (disponível no anexo), seguida por uma árvore com cerca de 50 organismos (figura 5), até uma árvore contendo apenas 18 organismos (figuras 6).

A árvore filogenética exposta na figura 6, apresenta unicamente membros da família Poaceae, predominantemente os organismos são do gênero Oryza, apesar de notarmos exemplares do gênero Triticum, Hordeum, Sorghum, Setaria e Panicum. Nota-se uma das sequências de sorgo que se apresentava duplicada na árvore mais abrangente (no anexo ), novamente presente nessa última árvore.

Figura 6 - Árvore filogenética 2 da SEC14. Gerada pela plataforma TaxOnTree (Threshold 70 e 100

maximum targets) e visualizada via FigTree v1.4.3. Contendo organismos da família Poaceae. O nome

destacado em vermelho indica a sequência de cana-de-açúcar (ScSEC14). As porcentagens mostram valores de bootstrap dos nós.