• Nenhum resultado encontrado

Caracterização in silico e análise de uma sequência homóloga à sec14 em angiospermas

N/A
N/A
Protected

Academic year: 2021

Share "Caracterização in silico e análise de uma sequência homóloga à sec14 em angiospermas"

Copied!
84
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE BIOCIÊNCIAS

PROGRAMA DE PÓS-GRADUAÇÃO EM BIOQUÍMICA

CAMILA RAYANE PEREIRA DA SILVA

CARACTERIZAÇÃO IN SILICO E ANÁLISE DE UMA SEQUÊNCIA HOMÓLOGA À SEC14 EM ANGIOSPERMAS.

NATAL - RN 2019

(2)

CAMILA RAYANE PEREIRA DA SILVA

CARACTERIZAÇÃO IN SILICO E ANÁLISE DE UMA SEQUÊNCIA HOMÓLOGA À SEC14 EM ANGIOSPERMAS.

Dissertação apresentada ao programa de pós-graduação em Bioquímica da Universidade Federal do Rio Grande do Norte, como parte dos requisitos para obtenção do título de mestre em bioquímica.

Orientadora: Profª Drª Katia Castanho Scortecci

NATAL – RN 2019

(3)

Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI

Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede Silva, Camila Rayane Pereira da.

Caracterização in silico e análise de uma sequência homóloga à sec14 em angiospermas / Camila Rayane Pereira da Silva. - 2019. 84f.: il.

Dissertação (Mestrado)-Universidade Federal do Rio Grande do Norte, Centro de Biociências, Pós-graduação em Bioquímica, Natal, 2019.

Orientadora: Dra. Kátia Castanho Scortecci.

1. Secretion14 - Dissertação. 2. Saccharum spp - Dissertação. 3. Domínio de ligação a lipídios - Dissertação. 4. Estresse abiótico - Dissertação. 5. RT-qPCR - Dissertação. I. Scortecci, Kátia

Castanho. II. Título.

RN/UF/BCZM CDU 577.1 Elaborado por Raimundo Muniz de Oliveira - CRB-15/429

(4)
(5)

“The bamboo that bends is stronger than the oak that resists.” Provérbio Japonês

(6)

AGRADECIMENTOS

A seção dos agradecimentos certamente é muito prazerosa de escrever. É o momento de mostrar gratidão às pessoas que foram essenciais para conclusão de uma etapa importante, obtenção de um título de mestre.

Gostaria de agradecer à Deus, por toda graça concedida. Pela fé que me deu forças nos momentos mais difíceis dessa caminhada.

Aos meus pais, pela compreensão da minha ausência ao lado deles em alguns momentos, pelos estresses que suportaram porque sofriam comigo os prazos de entrega de relatórios, experimentos que não funcionavam e frustações. Sem eles esse caminho teria sido muito mais árduo. À vocês, todo meu amor.

Aos meus irmãos, Danycelle e Sérgio, agradeço de coração. Vocês foram inspiração para eu seguir na pós-graduação, acompanhei suas dificuldades no mestrado e doutorado e vibrei com o sucesso de vocês. Dany que me deu todo suporte emocional e incentivo para essa jornada, nossas pausas para discussões, ensinamentos e café foram um alívio em dias corridos. Sérgio me ajudou mais do que pode imaginar, me ensinando e auxiliando nos dados de dinâmica molecular, sua contribuição teve peso substancial para aprimorar esse trabalho. Amo vocês!

Aos meus familiares e amigos próximos, agradeço. À minha cunhada Ana Carolina, por todo o seu apoio, meu muito obrigada.

Agradeço de forma especial ao meu companheiro Fernando Maciel, você me deu forças para continuar batalhando, buscar meus objetivos. Foi uma companhia constante e acalentadora. Por sua compreensão em cada momento meu de aflição e sua alegria com os bons frutos desse mestrado, te dedico meu amor e gratidão.

Ao meu filho Lupin, seu amor incondicional me manteve sã durante todo o processo. Você foi a alegria que eu precisei quando o desânimo batia, foi um sopro de vida que trouxe amor, paz e serenidade nos momentos difíceis. Foi o lembrete de que a vida não se resume à um título. Gratidão, meu pequeno!

Aos meus colegas de laboratório, Kellya, Nathalia, Géssica, Verônica, Jaime, Helena, Felipe e todos que compõem o grupo de Plantas, obrigada por compartilharem bons momentos e me ajudarem direta ou indiretamente nesse trabalho. Agradeço à Gizelia pelas palavras de incentivo e auxílio no laboratório. Provavelmente algumas pessoas importantes não foram mencionadas aqui, mas certamente sou muito grata por sua colaboração.

(7)

Agradeço imensamente aos parceiros científicos Prof. Dr. Tercílio Calsa Junior e Dr. Romel Duarte Vilela por cederem gentilmente parte do material vegetal utilizado para análises nesse trabalho. Ao Prof. Dr. Carlos Henrique Salvino Gadelha Meneses, Prof. Dr. Rodrigo Juliani Siqueira Dalmolin e Prof. Dr. Eduardo Luiz Voigt, que compuseram minha banca de qualificação, obrigada pelas contribuições ao trabalho. Agradeço também pela parceria de Iara Souza que contribuiu com os dados de co-expressão.

Agradeço à minha orientadora Profa. Dra. Kátia Castanho Scortecci pela mentoria atenciosa. Sua experiência e sabedoria me guiaram nessa jornada. Sou grata por todas as vezes que pacientemente me explicou protocolos, ensinou e compartilhou pessoalmente experimentos longos e cansativos. Certamente sua orientação fez a diferença para conclusão desse trabalho.

À UFRN, CAPES e CNPq, agradeço todo apoio estrutural e financeiro, pela bolsa concedida nesses anos de mestrado e iniciação científica. Faço votos sinceros que nossos governantes percebam o valor imensurável de uma educação gratuita de qualidade e que mais pessoas possam ser beneficiadas com o privilégio de ter uma formação básica e superior de excelência.

(8)

RESUMO

O Brasil é o maior produtor mundial de cana-de-açúcar. Todas as partes dessa cultura são aproveitadas e usadas como matriz energética para produção não somente do açúcar, mas também de biocombustíveis e outros produtos. Os estudos moleculares com cana-de-açúcar se desenvolvem de forma lenta devido a sua complexidade genômica, possuindo elevada ploidia, contudo a descoberta de novos genes que possam atuar em processos chave desse organismo é valiosa para futuras contribuições à indústria sucroalcooleira. Este trabalho teve como objetivo caracterizar uma sequência homóloga a PROTEÍNA DE TRANSFERÊNCIA DE FOSFATIDILINOSITOL/FOSFATIDILCOLINA - SEC14 (PHOSPHATIDYLINOSITOL-PHOSPHATIDYLCHOLINE TRANSFER PROTEIN - SEC14) em cana-de-açúcar que foi identificada em estudos anteriores em bibliotecas subtrativas para o processo de florescimento. A caracterização in silico foi feita por análise funcional do gene, construção de redes de interação proteína-proteína, filogenia, dinâmica molecular do modelo tridimensional da proteína e análise de co-expressão. Ademais, foi realizado um ensaio de expressão por RT-qPCR em tecidos vegetais para variedades tardia e precoce, bem como, em tecidos vegetais submetidos à estresses hídrico, oxidativo e por inserção de sulfato de cálcio, além da análise de expressão em diferentes tecidos da planta (folha e raiz). Os resultados obtidos por meio das ferramentas de bioinformática mostram a existência do domínio CRAL-TRIO, que está presente em todas as sequências homólogas, essencialmente na mesma posição, revelando alta conservação da sequência SEC14 em plantas. A árvore filogenética sugere que há prováveis duplicações da proteína SEC14 em plantas. O modelo tridimensional apresenta um provável bolso hidrofóbico para ligação de lipídios, descritos em outros modelos de SEC14 consolidados, sugerindo uma conservação estrutural e que foi confirmado pela dinâmica molecular. Ainda foi verificado, por meio da simulação, um domínio ainda desconhecido no modelo proposto por homologia de SEC14. Os dados de expressão revelam que o gene SEC14 se apresentou diferencialmente expresso entre as variedades precoce e tardia. Além disso, foi verificado que a expressão foi maior em raízes quando comparado com o tecido foliar. Também foi observado que não houve diferença significativa de expressão nos tecidos foliares de plantas submetidas ao estresse hídrico e oxidativo, provavelmente devido ao estágio juvenil. Uma outra análise de expressão realizada foi com um material de campo tratado com cálcio, onde não observamos diferença na expressão, mostrando que a SEC14 não foi responsiva para as condições analisadas. Por fim, este estudo fornece informações para um melhor entendimento de como o gene/proteína de SEC14 atua em cana-de-açúcar. Revelam novos saberes sobre

(9)

estrutura tridimensional dessa proteína nessa cultura e traz novas perspectivas para os estudos moleculares com plantas de interesse econômico como a cana-de-açúcar.

Palavras-chave: SECRETION14; Saccharum spp.; RT-qPCR; Domínio de ligação a lipídios; estresse abiótico.

(10)

ABSTRACT

Brazil is the world's largest producer of sugarcane. Although its importance, the molecular studies are difficult due to its genomic complexity, a high ploidy level. However, the discovery of new genes is important to improve field and sugar-alcohol industry. The aim of this work was to characterize a sugarcane homologous sequence PHOSPHATIDYLINOSITOL-PHOSPHATIDYLCHOLINE TRANSFER PROTEIN SEC14 that has been identified in previous studies associated to the flowering process. The in silico characterization was performed by functional analysis of the gene, construction of protein-protein interaction networks, phylogeny, three-dimensional model and molecular dynamics and co-expression analysis. In addition, a RT-qPCR expression assay was performed in different plant tissues (leaves, roots or shoot apical meristem – SAM) as well drought stress, oxidative stress and calcium sulphate treatment. The results obtained using the bioinformatics tools showed the CRAL-TRIO domain presence in the same position, suggesting a conservation of the SEC14 sequence in plants. The phylogenetic analysis indicates probable duplications of the SEC14 protein in plants. The three-dimensional model showed a structural conservation due to the presence of hydrophobic pocket for lipid binding, and it was confirmed by molecular dynamics. Furthermore, it was observed in sugarcane model another domain that was not known. Expression data revealed that SEC14 gene was differentially expressed SAM in the juvenile phase from early-flowering variety and in the adult phase from late-flowering variety. Moreover, comparing the expression in leaves and roots, it was observed a lower expression in leaves. The SEC14 expression had no significant difference in leaf tissues from plants submitted to drought and oxidative stress in growth room. Furthermore, it was analyzed the potential effect of calcium treatment in sugarcane plants in field condition. Moreover, it was not observed any expression difference in leaves or in SAM. Then, the data showed here provides a better understanding of how the SEC14 gene/protein may acts on sugarcane. This data revealed new knowledge about the 3D protein structure and it also brings new perspectives for molecular studies for crops such as sugarcane.

(11)

LISTA DE FIGURAS

Figura 1 – Alinhamento com sequências homólogas a ScSEC14. 32

Figura 2 - Análise dos domínios conservados entre proteínas homólogas a SEC14 em gramíneas

e ScSEC14. 33

Figura 3 - Alinhamento com a sequência de Arabidopsis thaliana (At4g39180) homóloga a

ScSEC14. 34

Figura 4 - Análise dos domínios conservados entre proteínas homólogas a SEC14 em A.

thaliana e ScSEC14 (Saccharum spp.). 34

Figura 5 - Árvore filogenética de SEC14 em vegetais. 36

Figura 6 - Árvore filogenética 2 da SEC14. 38

Figura 7 - Distribuição da ScSEC14 entre espécies. 39

Figura 8 - Análise de distribuição de similaridade das sequências com ScSEC14. 40 Figura 9 - Co-ocorrência das proteínas do interatoma com organismos variados da árvore

filogenética. 42

Figura 10 -Modelo tridimensional de ScSEC14 e Gráfico de Ramachandran. 42 Figura 11 -Representação dos modelos 3D de SEC14 dos organismos Saccharum spp., Homo

sapiens e Saccharomyces cerevisiae. 44

Figura 12 -Sobreposição dos modelos 3D de SEC14 de de-açúcar com humano e

cana-de-açúcar com levedura. 46

Figura 13 - Desenho esquemático representando o padrão de expressão relativa da proteína

SEC14. 48

Figura 14 -Análise de co-expressão de sondas do contraste maturing-young – GSE5021. 50 45Figura 15 - Análise de co-expressão de sondas do contraste treated-control - GSE11934. 52 Figura 16 - RT-qPCR da SEC14 em variedades de cana-de-açúcar precoce e tardia. 55 Figura 17 - Gráfico do RT-qPCR da ScSEC14 em tecido foliar e radicular de cana-de-açúcar.

56 Figura 18 - RT-qPCR da ScSEC14 em tecido foliar de cana-de-açúcar submetido ao estresse

hídrico, oxidativo e com sulfato de cálcio. 57

Figura 19 - Expressão por RT-qPCR de ScSEC14 em ápice meristemático de cana-de-açúcar. 58 Figura 20 -Desenho esquemático de possível via de atuação da SEC14 em cana-de-açúcar. 67

(12)

LISTA DE TABELAS

Tabela 1 Amostras de tecido foliar da variedade SP81-3250 (precoce) coletadas entre 2011 e 2013

29

Tabela 2 Descrição dos primers utilizados para o RT-qPCR 31 Tabela 3 Posicionamento do domínio CRAL-TRIO em gramíneas 34 Tabela 4 Posicionamento do domínio CRAL-TRIO em ScSEC14 e A.

thaliana.

36

Tabela 5 Mapeamento dos termos GO 42

(13)

LISTA DE ABREVIAÇÕES, ACRÔNIMOS E SIGLAS EMPREGADAS

ABA Ácido Abscísico

ASAS Área Superficial Acessível ao Solvente

AUX Auxina

BAR Ferramenta para análise de expressão em plantas; do Inglês, The Bio-Analytic Resource for Plant Biology

cDNA Ácido desoxirribonucleico complementar

CHARMM Campo de força; do Inglês, Chemistry at HARvard Macromolecular Mechanics

CRALBP Cellular retinaldehyde-binding protein CT Ciclo limiar; do Inglês, Threshold cycles

DM Dinâmica Molecular

EF Fator de elongação

FT Florígeno; do Inglês, FLOWERING LOCUS T

FYVE Domínio de proteínas dedo de zinco; do Inglês, Finger proteins GO Ontologia do gene; do Inglês, GeneOntology

GOLD Domínio de dinâmica do Golgi; do Inglês, Golgi Dynamics domain

GROMACS Software para dinâmica molecular; do inglês, GROningen MAchine for Chemical Simulations

I-Tasser Ferramenta para predição de proteínas; do Inglês, Iterative Threading ASSEmbly Refinement

LOMETS Software para dinâmica molecular; do inglês, Local Meta-Threading-Server

MA Milhões de anos atrás

MCC Análise de centralidade de proteínas em rede; do Inglês, Maximal Clique Centrality

NCBI Banco de dados; do Inglês, The National Center for Biotechnology Information

ORP Região de leitura aberta; do Inglês, Related protein to oxysterol binding protein

PAT6 Patelin; do Inglês, Pattelin -6 PCA Análise dos componentes principais

(14)

PCR Reação da cadeia da polimerase; do inglês, Polymerase Chain Reaction PDB Banco de dados de proteínas; do inglês, Protein Data Bank

PH Domínio de homologia à Pleckstrin; do Inglês, Pleckstrin homology domain

PIP Fosfatidilinositol fosfato

PLD Fosfolipase D; do inglês, Phospholipase D PME Soma de Ewald; do Inglês, Particle Mesh Ewald PtdCho Fosfatidilcolina

RABE Proteína relacionada a Ras; do Inglês, Ras-related protein

RMSD Raiz do Desvio Quadrático Médio; do inglês, Root Mean Square Deviation

RMSF Raiz da flutuação quadrática média; do inglês, Root Mean Square Fluctuation

RNA Ácido ribonucleico

RT-qPCR Reação em cadeia da polimerase quantitativa em tempo real

SA Ácido salicílico

ScSEC14 Sequência de SEC14 de cana-de-açúcar

SEC14 PROTEÍNA DE TRANSFERÊNCIA DE

FOSFATIDILINOSITOL/FOSFATIDILCOLINA SEC14; do inglês, PHOSPHATIDYLINOSITOL-PHOSPHATIDYLCHOLINE TRANSFER PROTEIN

SNAP Synaptosomal-associated protein SYP Sintaxina; do Inglês, Syntaxin

TIP3P Potencial intermolecular transferível com 3 pontos; do Inglês, Transferable intermolecular potential with 3 points

UBQ Ubiquitina

WGD Duplicação do genoma como um todo; do inglês, Whole Genome duplication

(15)

SUMÁRIO

1. INTRODUÇÃO 17

1.1 CANA-DE-AÇÚCAR 17

1.2 ESTRESSE ABIÓTICO EM VEGETAIS 19

1.3 SEC14 20

2. OBJETIVO 22

2.1 OBJETIVO GERAL 22

2.2 OBJETIVOS ESPECÍFICOS 22

3. METODOLOGIA 23

3.1 ANÁLISE DE SEQUÊNCIAS HOMÓLOGAS E ALINHAMENTO 23

3.2 BUSCA POR DOMÍNIOS CONSERVADOS 23

3.3 ÁRVORE FILOGENÉTICA 24

3.4 ANOTAÇÃO FUNCIONAL VIA BLAST2GO 24

3.5 LOCALIZAÇÃO SUBCELULAR DA SEC14 25

3.6 REDES DE INTERAÇÃO 25

3.7 PADRÃO DE EXPRESSÃO IN SILICO 25

3.8 MODELAGEM DE PROTEÍNA POR HOMOLOGIA 26

3.8.1 ANÁLISE COMPARATIVA DOS MODELOS TRIDIMENSIONAIS 26

3.9 ANÁLISE DE CO-EXPRESSÃO 27

3.10 MATERIAL VEGETAL 28

3.11 EXTRAÇÃO DE RNA 29

3.12 SÍNTESE DO cDNA 30

3.13 PCR QUANTITATIVO EM TEMPO REAL 30

4. RESULTADOS 31

4.1 HOMOLOGIA DAS SEQUÊNCIAS DE SEC14 EM VEGETAIS 31

4.2 ANÁLISE FILOGENÉTICA 35

4.3 ANOTAÇÕES FUNCIONAIS VIA BLAST2GO 38

4.4 REDES DE INTERAÇÃO 41

4.5 MODELO TRIDIMENSIONAL DE SEC14 43

4.6 PADRÃO DE EXPRESSÃO IN SILICO 47

4.7 ANÁLISE DE CO-EXPRESSÃO 48

4.8 ANÁLISES DE RT-qPCR 54

5 DISCUSSÃO 59

(16)

7 REFERÊNCIAS 68

(17)

1. INTRODUÇÃO

1.1 CANA-DE-AÇÚCAR

A cana-de-açúcar é pertencente à família Poaceae, gênero Saccharum. Possui características morfológicas peculiares, como caule do tipo colmo, folhas grandes e laminadas, raízes fasciculadas e inflorescência em forma de panícula. Além disso, esta cultura é rica em lignocelulose (característica importante para produção do etanol de segunda geração); toda a estrutura caulinar é dividida em nós e entrenós, os quais originam os colmos com alto teor de sacarose (BILAL et al., 2018).

A origem genética das plantas híbridas de cana-de-açúcar no Brasil, se deve ao cruzamento entre as espécies selvagens S. officinarum e S. spontaneum. Estes híbridos são utilizados atualmente pela indústria sucroalcooleira brasileira (D'HONT et al., 1996; DILLON et al., 2007; TEW et al., 2008;). Com o melhoramento genético, ocorreram vários ciclos de retrocruzamento e seleção das novas variedades com maior teor de açúcar e resistência a patógenos. Esses retrocruzamentos foram modificando o genoma total dos híbridos de aneuploides a poliploides, com contribuição desigual dos genomas parentais de S. officinarum (80-90%) e S. spontaneum (10-20%) (GRIVET et al. 1996; HOARAU et al. 2002; PIPERIDIS et al. 2010). Portanto, os híbridos atualmente possuem níveis de ploidia de 10 ou mais, como tamanho do genoma total muito maior (Cultivar R570, 10.000 Mb e 2n = 115) quando comparado a outras plantas pertencentes da mesma família, tais como milho (5500 Mb, 2n =20), o sorgo (1600 Mb, 2n = 20) e o arroz (860 Mb, 2n = 24) (D'HONT et al., 2001). Dessa forma, o melhoramento gênico da cana-de-açúcar elevou o nível de sua ploidia ocasionando uma alta complexidade genômica, trazendo dificuldade a avanços genéticos e moleculares para este cultivar (WACLAWOVSKY et al., 2010; VICENTINI et al., 2012, SETTA et al., 2014).

A cana-de-açúcar carrega consigo significante atribuição ao longo da história, movendo a economia de diversos países, tendo registros de seus primeiros cultivos em Nova Guiné, - centro de origem mais provável devido à variedade de cultivares de S. officinarum, além de diversas formas de uma variedade mais selvagem, a S. robustum (WARNER, 1962). A partir desse momento houve um espalhamento para o sudeste asiático, China, até chegar a Índia, onde se iniciou a produção em larga escala dessa cultura. Atualmente, a Índia ocupa um lugar de destaque no ranking de produção mundial do açúcar, embora o Brasil, ainda tenha a maior produção dentre todos os países (STATISTA, 2018; CONAB, 2018).

(18)

Essa cultura exerce grande importância como fonte alimentar e também na produção do etanol de primeira e segunda geração, além de atuar na cogeração de eletricidade, responsável por 4% da demanda de energia elétrica no Brasil (ZUURBIER & VOOREN, 2008; CONAB, 2018). Sendo assim, o Brasil abastece diferentes países com os principais produtos da cana-de-açúcar: o açúcar e o álcool (UNICA, 2016; STATISTA, 2018). A cana-de-açúcar pode ser considerada uma planta versátil pelos produtos que pode gerar, praticamente tudo desse vegetal é aproveitado. O colmo é comumente utilizado para retirar o caldo, para produção do açúcar. Esse caldo é rico em glicose e, quando submetido ao processo de fermentação com auxílio de microrganismos fermentadores, esses consumirão a glicose e irão gerar o etanol como subproduto de seu metabolismo, usado como biocombustível (OLSSON & HAHN-HÄGERDAL, 1996). O bagaço do colmo prensado é usado nas próprias usinas para gerar energia ou produzir o biogás, podendo ainda ser destinado à produção do etanol celulósico. O etanol de segunda geração é produzido a partir de uma matéria-prima considerada sobra do processo principal, bagaço, folhas e outras partes da planta, possuindo a vantagem desses componentes não serem utilizados para alimentação, ou seja, exclui o dilema político-social de alimento versus combustível (SUN et al., 2002). Seja do extrato bruto da cana-de-açúcar moída ou de materiais lignocelulósicos provenientes do que restou da planta, o etanol produzido é quimicamente o mesmo. A cana-de-açúcar é o produto que responde por significativa parcela do etanol produzido no país, na safra de 2018/2019 alcançou o novo recorde com 32,3 bilhões de litros de etanol (CONAB, 2018).

Segundo os dados da Companhia Nacional de Abastecimento (CONAB), a produção nacional de 2017/2018 totalizou 633,26 milhões de toneladas de cana-de-açúcar, com a região Sudeste em destaque com 420,705.74 mil toneladas e a região Nordeste com 45,460.68 mil toneladas. Essa discrepância em produção entre essas regiões pode ser atribuída a diversos fatores, dentre eles a utilização de cultivares produzidos na região Sudeste na região Nordeste. Atrelado às condições edafoclimáticas diversas as quais as plantas estão susceptíveis, como os baixos índices pluviométricos em momentos críticos para o desenvolvimento do vegetal ou ainda o excesso de chuvas por longos períodos que dificultam os estágios iniciais de fixação da cana-de-açúcar, além da alta salinidade no solo em alguns locais (CARVALHO et al., 2015; SIMÕES et al., 2016).

(19)

1.2 ESTRESSE ABIÓTICO EM VEGETAIS

As angiospermas possuem natureza séssil, por isso as condições ambientais e climáticas atuam como fortes indicadores que ditam qual o melhor momento para germinar, desenvolver e reproduzir. O florescimento é um estágio crítico do ciclo de vida das plantas angiospermas, principalmente para as gramíneas que têm apenas uma chance de florescerem e, assim, garantir a propagação e sobrevivência da espécie (COLASANTI & CONEVA, 2009; GUIBOILEAU, 2010; ARALDI et al., 2010; MEDEIROS et al., 2016; WILS et al., 2016). As variações edafoclimáticas muito intensas causam um efeito negativo nos vegetais, gerando um desequilíbrio da homeostase, levando a planta a entrar em estresse. O estresse abiótico surge de um déficit ou excesso no ambiente químico ou físico. A resposta da planta é influenciada por fatores como severidade e duração do desequilíbrio homeostático, que, por sua vez, irá indicar a resposta propícia da planta, desde alteração na expressão de genes a modificações no metabolismo celular (BUCHANAN et al, 2015).

Os vegetais vêm se adaptando às intempéries climáticas desde os primórdios de seu surgimento, desenvolvendo uma complexa rede regulatória com a finalidade de distribuir sua energia para os recursos de defesa e desenvolvimento (ANNACONDIA et al., 2018). No entanto, para as plantas de interesse agrícola, como a cana-de-açúcar, o estresse abiótico impacta negativamente, causando a redução no crescimento e acelerando a fase reprodutiva. Tanto os estresses bióticos quanto abióticos induzem uma reprogramação da expressão gênica, incluindo também a reprogramação epigenética de regiões regulatórias do genoma, que por sua vez, irão gerar mudanças fisiológicas em diversos processos, principalmente em sua sobrevivência e reprodução, processo que está intrinsecamente ligado a transferência evolutiva de seu contingente gênico para as próximas gerações (CHINNUSAMY & ZHU, 2009; TOLJAMO et al., 2016; ANNACONDIA et al., 2018). As condições edafoclimáticas citadas anteriormente, podem induzir as plantas a florescerem mais cedo, ativando o fenômeno conhecido como florescimento precoce (TAKENO, 2016).

Para indústria sucroalcooleira, o processo de florescimento nas plantas de cana-de-açúcar gera um efeito negativo para a produção de cana-de-açúcar e etanol. Uma vez ativado o processo da floração, se inicia uma cascata de sinalização que desencadeia o processo chamado de isoporização. Este se trata do deslocamento da sacarose (matéria-prima responsável pela produção primária do etanol) da base do colmo para o ápice meristemático, com o objetivo de sanar os gastos energéticos despendidos na formação das estruturas reprodutivas (ROZEFF, 1995; JUNIOR et al., 2009). Em condições de estresse, há uma mudança na expressão de genes

(20)

responsáveis pelo transporte de açúcares, que está associado a uma alteração da relação fonte-dreno, impactando a alocação de carbono e da energia (DURAND et al., 2018). O consumo de sacarose ocasiona uma perda hídrica na região dos entrenós e provoca redirecionamento de compostos orgânicos e inorgânicos. Este processo ainda é pouco compreendido em cana-de-açúcar (LOEHWING, 1953; ARALDI et al., 2010).

É bem descrito a relação entre estresses abióticos e respostas ao florescimento, em cana-de-açúcar, pesquisas mostram essa interação dos estresses abióticos como fatores que aceleram o florescimento (MEDEIROS et al., 2016). As pesquisas com genes participantes do processo de floração fornecem informações sobre o desenvolvimento meristemático e órgãos florais nos modelos vegetais (IRISH, 2010; WILS et al., 2016). A identificação e a caracterização de genes chave para controle de respostas ao estresse ou de aspectos para desenvolvimento é de extrema importância, pois estes estão ligados a processos vitais, seja em respostas fisiológicas imediatas ou em mudanças epigenéticas que irão conferir memória ao vegetal para uma melhor resistência e recuperação em estresses subsequentes (TOMBESI et al., 2018).

Deste modo, as ferramentas de bioinformática e genômica são importantes metodologias que permitem compreender a complexidade da regulação da expressão de genes visando correlacionar as respostas de sinalização e síntese de produtos celulares.

1.3 SEC14

Em estudos anteriores de nosso grupo de pesquisa (FURTADO, 2007), identificou-se em bibliotecas subtrativas construídas com materiais de ápices meristemáticos de variedades com florescimento precoce e tardio cultivadas, em condições de campo e em estádio competente para floração, na região Nordeste do Brasil, oito cDNAs que, provavelmente, estavam associados ao processo de floração em cana-de-açúcar. Dentre os cDNAs obtidos, estava um homólogo à PHOSPHATIDYLINOSITOL-PHOSPHATIDYLCHOLINE TRANSFER PROTEIN (SEC14). Outro estudo de nosso grupo (MEDEIROS et al., 2016) mostrou que a sequência de SEC14 se apresentou 34 vezes repetida na biblioteca subtrativa para o florescimento tardio, e sua expressão, verificada por RT-qPCR, também foi mais alta quando comparada com a variedade de florescimento precoce.

A proteína SEC14 foi inicialmente descrita em Saccharomyces cerevisiae, atuando na via de secreção com função principal de transporte de fosfatidilinositol e fosfatidilcolina (NOVICK et al., 1980; NOVICK et al., 1981; AITKEN et al., 1990; BANKAITIS et al., 1990). É uma proteína essencial que transporta o fosfatidilinositol e a fosfatidilcolina das membranas,

(21)

revelado por estudos in vitro, e regula o metabolismo celular de lipídeos, especificamente o tráfego de membranas na rede trans-Golgi e em compartimentos endossomais (BANKAITIS et al, 1990). O gene SEC14 se encontra conservado em diversos organismos, leveduras, animais, humanos e plantas (BANKAITIS et al., 2010).

Em plantas, a proteína SEC14 atua em funções que vão além das vias de tráfego de membranas, estando envolvida na biogênese de raízes (VINCENT et al., 2005). O domínio SEC14 associa-se com módulos que incluem domínio de nodulina (ANANTHARAMAN et al., 2002) e dinâmica do Golgi (KAPRANOV et al., 2001). A proteína nodulina-SEC14 estimula síntese de fosfatidilinositóis em capilares radiculares, provendo elongação de raízes, por meio da sinalização de fosfolipídios que regulam a reorganização do citoesqueleto (HUANG et al., 2013), determinando o fluxo citosólico durante a elongação dos pelos radiculares, atuando em conjunto com outras proteínas quinases para promover tanto o tráfego de membranas como a organização de actina e sinalização de cálcio nas raízes em crescimento (VICENT et al., 2005). Proteínas do domínio SEC14-GOLD, como a PATELLIN 1, podem operar de forma semelhante, ligando-se a fosfatidilinositol fosfato (PIP) (PETERMAN et al., 2004).

A proteína SEC14 apresenta atividade voltada para mecanismos de defesa da planta, tendo um papel chave na interface entre sinalização do metabolismo de lipídeos e respostas do sistema imune inato das plantas (KIBA et al., 2014). Além disso, proteínas SEC14 e SEC14-like, como a família PATELLIN estão associadas a respostas ao estresse, como visto para estresse por baixas temperaturas (CHU et al., 2018). Possuem atuação contra o estresse osmótico em arroz (DOVE et al., 1997), conferindo uma maior estabilidade de membrana e tolerância ao estresse por déficit de nitrogênio em sorgo (GELLI et al., 2014). Além disso, apresentam atividades ligadas ao florescimento, como participação no desenvolvimento de flor em Arabidopsis thaliana (PETERMAN et al., 2004), regulação do florescimento atuando em conjunto aos genes FLOWERING LOCUS D (FLD) e GIGANTEA (GI) (UPADHYAYA et al., 2015). Essa possível interação indireta através da fosfatidilcolina com a proteína FLOWERING LOCUS T (FT), é sugestiva de uma atuação por transmissão de sinais indutores para a floração das folhas para o ápice meristemático, por meio da sua ligação in vitro com a fosfatidilcolina. Ademais, foi visto in vivo, que o aumento nos níveis de fosfatidilcolina no ápice meristemático acelerava o florescimento e a sua redução atrasava o processo (NAKAMURA et al., 2014).

Estudos moleculares para caracterização de novos genes são relevantes, assim como entender sua função e atuação em sistemas biológicos, pois nos permite verificar detalhadamente processos em redes metabólicas que possibilitam identificar lacunas existentes

(22)

e também aprimorar métodos para atingir o melhoramento de respostas em determinadas situações. Nesse sentido, é valioso obtermos uma melhor caracterização de genes envolvidos em vias de biossíntese e transporte de lipídeos, como a SEC14, que possui participação em resposta a diversos estresses abióticos, além das funções anteriormente descritas. Aqui, mostramos que SEC14 pode ser uma proteína chave para resposta a estresses osmótico e salino em cana-de-açúcar (HUA-YING et al., 2018), tendo até agora estudos insuficientes para abarcar todo seu potencial e compreender completamente sua função em plantas. Desse modo, visou-se aprofundar os estudos com a visou-sequência SEC14 em cana-de-açúcar, principalmente, com cultivares brasileiros. A cultura cana-de-açúcar tem destaque econômico mundial e possui uma vasta lacuna em âmbito científico para explorar e, futuramente, corroborar para melhoramento dessa planta em campo.

2. OBJETIVO

2.1 OBJETIVO GERAL

Caracterizar in silico o papel do gene ortólogo a SEC14 em vegetais e avaliar seu padrão de expressão em plantas de cana-de-açúcar.

2.2 OBJETIVOS ESPECÍFICOS

 Analisar sequências ortólogas a SEC14 em busca por domínios conservados.

 Analisar relações filogenéticas e possíveis duplicações da sequência de SEC14 em cana-de-açúcar e demais sequências obtidas.

 Analisar in silico redes de co-expressão da SEC14 em cana-de-açúcar.  Identificar in silico possíveis interações da proteína alvo SEC14.

 Obter um modelo tridimensional da proteína SEC14 em cana-de-açúcar para avalia-la estruturalmente.

 Analisar o padrão de expressão da SEC14 em diversos tecidos vegetais de cana-de-açúcar submetidos a diferentes condições.

(23)

3. METODOLOGIA

3.1 ANÁLISE DE SEQUÊNCIAS HOMÓLOGAS E ALINHAMENTO

A sequência de SEC14 de cana-de-açúcar, proveniente de uma biblioteca subtrativa de cDNA para florescimento, foi utilizada para busca de uma sequência completa no banco de dados do SUCEST FUN (http://sucest-fun.org), que foi nomeada por ScSEC14 ao longo do texto. De posse dessa sequência (ID: comp75824_c0_seq1), se fez a busca por sequências homólogas através dos bancos de dados, The National Center for Biotechnology Information (NCBI: www.ncbi.nlm.nih.gov), por meio da ferramenta Blastp (ALTSCHUL et al., 1997). Buscou-se domínios conservados das sequências por meio do alinhamento usando a ferramenta Clustal Omega (https://www.ebi.ac.uk/Tools/msa/clustalo/) (SIEVERS et al., 2011). Os parâmetros utilizados foram input da sequência proteica, alinhamento da sequência no modo Pairwise padrão para essa ferramenta. Posteriormente, foi feita análise individual na plataforma do Pfam (https://pfam.xfam.org/) (EL-GEBALI et al., 2018), com parâmetro padrão (e-value igual a 1.0), destacando os domínios presentes nas sequências e se estavam ou não conservados dentro dos organismos selecionados da família Poaceae para essa comparação.

3.2 BUSCA POR DOMÍNIOS CONSERVADOS

Além do alinhamento no Clustal Omega e destaque dos domínios conservados via Pfam de sequências com maior identidade a SEC14, fez-se também a identificação do domínio CRAL-TRIO nas sequências dos organismos utilizados para o alinhamento, CScSEC14 (ID: A0A2Z4I215), Sorghum bicolor (ID: XP_002459926.1), Zea mays (ID: LOC100216821), Setaria italica (ID: XP_004956364.1), Brachypodium distachyon (ID: XP_003576972.1) e Oryza sativa (ID: XP_015612037.1), bem como, as sequências de Arabidopsis thaliana (ID: F4JVA9, F4J7S8, Q93ZE9 e F4JLE5) homólogas a SEC14 que se apresentaram revisadas no banco de dados Uniprot, para isso, utilizou-se a ferramenta ScanProsite (https://prosite.expasy.org/scanprosite/) (DE CASTRO et al., 2006). Em seguida, fez-se uma busca por motivos dentro da coleção disponível no banco de dados do Prosite (SIGRIST et al., 2012).

(24)

3.3 ÁRVORE FILOGENÉTICA

A árvore filogenética foi feita por meio do programa TaxOnTree (http://bioinfo.icb.ufmg.br/taxontree/) (SAKAMOTO & ORTEGA, 2016). Inicialmente, foram utilizados dados de entrada a sequência FASTA proteica de ScSEC14, seguido pela busca feita pela plataforma por meio do Blast no repositório Uniprot Reference Proteome (que faz uso de proteínas que são parte de um proteoma de referência). Os resultados obtidos foram selecionados por meio do parâmetro padrão da ferramenta (com exclusão de possíveis isoformas, limites de identidade em 50% e 200 hits de sequências por análise). Passando esses parâmetros, o alinhamento foi realizado por meio da ferramenta MUSCLE (EDGAR, 2004) e suportada pelo TrimAl (CAPELLA-GUTIERREZ et al., 2009), ferramenta para remoção automática de regiões alinhadas sem confiabilidade. As árvores foram visualizadas e editadas pelo programa FigTree v1.4.3. A partir dessa árvore gerada por meio do TaxOnTree, selecionou-se alguns exemplares de cada família, utilizando o critério de serem organismos que se repetiram na árvore, a sequência de aminoácidos de cada exemplar foi retirada pelo repositório do Uniprot ou NCBI, de acordo com cada identificador próprio das sequências. No programa MEGA versão 7.0 (KUMAR et al., 2016) foi feito o alinhamento via Clustal W e construiu-se uma árvore utilizando a metodologia de construção filogenética de Maximum Likelihood, modelo de matriz JTT (sugerido pelo próprio programa), com parâmetros de 1000 replicatas e um cutoff de 95%.

3.4 ANOTAÇÃO FUNCIONAL VIA BLAST2GO

Para essa análise, utilizou-se a ferramenta Blast2GO (https://www.blast2go.com/) (CONESA et al., 2008), onde a sequência de aminoácidos da SEC14 em cana-de-açúcar no formato FASTA foi submetida para uma busca, via blastp, contra o bando de dados do NCBI e locais. Utilizando a ferramenta InterProScan (https://www.ebi.ac.uk/interpro/search/sequence-search) (JONES et al., 2014), a proteína SEC14 foi anotada a fim de recuperar informações sobre famílias e domínios de maneira sequencial. Essa ferramenta utiliza os termos identificados no GeneOntology (GO) e no banco de dados NCBI para suplementar os dados do InterProScan. Desse modo, por meio dessa combinação de ferramentas obteve-se dados referentes a função molecular, processo biológico e componente celular.

(25)

3.5 LOCALIZAÇÃO SUBCELULAR DA SEC14

A predição da localização subcelular da proteína SEC14 em cana-de-açúcar foi feita por meio da ferramenta LocTree3 (rostlab.org/services/loctree3) (GOLDBERG et al., 2014) com o intuito de conhecer seu possível direcionamento no interior celular e assim correlacionar com as funções já descritas para essa proteína em plantas. Para essa análise utilizamos a sequência proteica de ScSEC14 em formato .FASTA, escolheu-se o domínio Eucariota como parâmetro para a busca.

3.6 REDES DE INTERAÇÃO

Para inferir interações da SEC14 com outras proteínas, gerou-se um interatoma com a ferramenta STRING 10.5 (www.string-db.org) selecionando a sequência homóloga a SEC14 de Arabidopsis thaliana, por meio dessa ferramenta foi vista também a ocorrência e a co-expressão da SEC14 em outros organismos. Dentre os parâmetros para análise, o score mínimo para interação foi de 0.400 (confiança média).

Com o intuito de buscar um maior número de ferramentas para avaliar as interações, utilizou-se o programa Cytoscape (www.cytoscape.org/) (SAITO et al., 2012). A partir do interatoma gerado por meio do STRING, exportou-se os dados da rede para o Cytoscape, com auxílio de um aplicativo para extensão do STRING. Nesse software, fez-se uso do plugin cytoHubba (CHIN et al., 2014), o qual permitiu fazer a análise de Maximal Clique Centrality (MCC), mostrando quais proteínas são mais indispensáveis à rede.

3.7 PADRÃO DE EXPRESSÃO IN SILICO

Com a finalidade de observar o possível padrão de expressão in silico da SEC14 em tecidos vegetais, para posterior comparação com dados in vivo por análises de RT-qPCR (quantitativo em tempo real), utilizou-se a ferramenta The Bio-Analytic Resource for Plant Biology (BAR: http://bar.utoronto.ca/). Com isso, permitiu-se avaliar a expressividade da sequência homóloga a ScSEC14 nas seguintes plantas: A. thaliana e Oryza sativa. Para isso, fez-se uso das sequências de aminoácidos desses organismos por meio do Blast,

(26)

selecionando-os pela maior identidade. As sequências de A. thaliana (ID: At1g55840) e O. sativa (ID: LOC_Os09g08390) foram utilizadas para análise na ferramenta BAR, com os parâmetros para expressão relativa (normalizada).

3.8 MODELAGEM DE PROTEÍNA POR HOMOLOGIA

A estrutura das proteínas permite inferir várias informações sobre a mesma, como suas propriedades químicas e função (WHISSTOCK & LESK, 2003). Desse modo, por meio do

programa Iterative Threading ASSEmbly Refinement (I-Tasser:

www.zhanglab.ccmb.med.umich.edu/I-TASSER/) (YANG et al., 2015) realizou-se uma busca a partir da estrutura primária de SEC14. Esse programa compara as estruturas de proteínas similares por meio de dados obtidos no banco de dados, o Protein Data Bank (PDB). Assim, quando a sequência foi enviada, este nos forneceu, por homologia com os organismos mais próximos, modelos tridimensionais de proteínas. O I-Tasser funciona por meio de uma abordagem de encadeamento múltiplo Local Meta-Threading-Server (LOMETS) (WU et al., 2007). Este utiliza alguns programas semelhantes para gerar os modelos (XU et al., 2014; SÖDING, 2005; LOBLEY et al., 2009; WU et al., 2008; XU et al., 2000). De posse do modelo,

este foi refinado utilizando a ferramenta ModRefiner

(https://zhanglab.ccmb.med.umichedu/ModRefiner/), o processo de refinamento é dividido em dois passos essenciais: a construção da cadeia principal com minimização da energia e um passo de alta resolução construindo as cadeias laterais, com minimização de energia (XU & ZHANG 2011). Essa ferramenta permitiu aperfeiçoar o modelo para deixá-lo o mais similar ao possível estado nativo, considerando principalmente o posicionamento das cadeias laterais dos aminoácidos e das ligações de hidrogênio entre eles. Após refinamento, a plataforma MolProbity avaliou os modelos gerados (http://molprobity.biochem.duke.edu/) (CHEN et al., 2010). O arquivo em formato .pdb gerado foi usado no programa UCFS Chimera, para visualização de propriedades moleculares (www.cgl.ucsf.edu/chimera/) (PETTERSEN et al., 2004).

3.8.1 ANÁLISE COMPARATIVA DOS MODELOS TRIDIMENSIONAIS

A comparação dos modelos de SEC14 para cana-de-açúcar, Homo Sapiens e Saccharomyces cerevisiae foi feita da seguinte forma: as sequências e modelos tridimensionais foram retiradas da plataforma PDB (Protein data Bank - https://www.rcsb.org/), sendo estas correspondentes aos cristais 4TLG (SEC14 de Homo sapiens) e 1AUA (SEC14 de Saccharomyces cerevisiae). Dispondo desses cristais, esses foram comparados com o modelo

(27)

3D de cana-de-açúcar utilizando do programa UCSF Chimera versão 1.12 (PETTERSEN et al., 2004), além das informações obtidas do NCBI (https://blast.ncbi.nlm.nih.gov/Blast.cgi) em relação à disposição dos domínios conservados feita pela a ferramenta CD-search (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi). O cálculo do RMSD também foi feito utilizando do programa UCSF Chimera versão 1.12 (PETTERSEN et al., 2004).

3.9 ANÁLISE DE CO-EXPRESSÃO

Para essa análise fez-se o alinhamento da sequência do gene ScSEC14 de cana-de-açúcar, disponibilizada com as sequências das sondas da plataforma SugarCane Genome Array (Affymetrix, GPL3844), a fim de identificar qual sonda corresponde ao gene SEC14. Os três experimentos usaram a mesma plataforma citada. O alinhamento foi feito usando o blastn, buscando sequências altamente similares por meio do megablast, no qual a sonda encontrada foi a Sof.4499.1.S1_at. Em seguida, foi feito o alinhamento das sondas contra as proteínas de A. thaliana, retiradas do banco de dados TAIR (https://www.arabidopsis.org/), e as sondas foram alinhadas por meio do blastx com as sequências em formato .FASTA. Escolheu-se apenas as sondas que apresentaram uma identidade maior que 50 % contra as proteínas de A. thaliana.

A partir desses dados, foi observada a expressão diferencial. Três experimentos foram selecionados por apresentarem uma quantidade de amostras satisfatórias com um n > 3. A análise dos componentes principais (PCAs) (dado apresentado no anexo I) mostrou-se similar entre amostras do mesmo grupo e diferente entre grupos, contudo apenas os datasets nos quais a sonda correspondente a SEC14 apresentou-se diferencialmente expressa em pelo menos um dos contrastes foi analisada. Desse modo, consideraram-se os datasets: GSE5021, onde o gene SEC14 aparece diferencialmente expresso no contraste maturing-young e no dataset GSE11934, onde o gene SEC14 aparece diferencialmente expresso no contraste treated-control. Com o intuito de se observar a inferência dos genes diferencialmente expressos, utilizou-se scripts em R por meio dos pacotes limma e affy, sendo considerado diferencialmente expressos aqueles com p valor < 0.0001.

Para análise de co-expressão e construção das redes, fez-se uso do pacote RedeR. As correlações significativas selecionadas com o p valor < 0,05 (1.000 permutações), com correlação maior que 0,8 ou menor que – 0,8 a fim de filtrar as sondas mais correlacionadas

(28)

com o SEC14. Identificou-se os clusters de sondas co-expressas e fez-se os dendrogramas e as redes dos datasets. Os nós das redes foram identificados pelo UNIPROT ID.

3.10 MATERIAL VEGETAL

O material vegetal utilizado para as análises de RT-qPCR foram provenientes de condições distintas. Para a análise da expressão entre variedades precoce (RB99395) e tardia (RB867515), foram utilizadas amostras de ápice meristemático de cana-de-açúcar cultivadas em condições de campo na Usina Estivas (Arês, RN - 6°11′40″ S 35°09′37″ W), coletadas nos meses de agosto, novembro e dezembro de 2014 e janeiro e fevereiro de 2015. Essas amostras estavam em triplicatas biológicas, foram maceradas em nitrogênio líquido e armazenadas em freezer – 80 ºC até o momento de sua utilização. Do mesmo modo, a análise comparativa de expressão da SEC14 em diferentes tecidos vegetais de cana-de-açúcar foi feita com amostras de folha e raiz da variedade 3280 cultivadas com dois meses de idade e crescidas em casa de vegetação na UFRN (5°50'27.4"S 35°12'09.8"W), seguindo também a mesma forma de armazenamento.

Para o padrão de expressão de SEC14 em condições de estresses por suspensão de rega e por tratamento com o agente estressor peróxido de hidrogênio, foram utilizadas amostras de tecido foliar da variedade SP81-3250 (precoce), com dois meses, coletadas entre 2011 (suspensão de rega) e 2013 (tratamento com peróxido de hidrogênio) em trabalhos anteriores de nosso grupo de pesquisa (BARRETO, 2013), a tabela 1 descreve os tratamentos feitos. O estresse por peróxido de hidrogênio foi feito nas concentrações de 0, 10, 20 e 30 mM, enquanto que o estresse por suspensão de rega teve dois tratamentos com 5 e 10 dias sem rega, com um controle para cada idade da planta, respectivamente.

(29)

Tabela 1 – Amostras de tecido foliar da variedade SP81-3250 (precoce) coletadas entre 2011 e 2013 submetidas a estresse por suspensão de rega e por inserção do agente estressor peróxido de hidrogênio

As amostras de ápice meristemático e folha da variedade RB867515 submetidas ao tratamento com sulfato de cálcio a 58 mM, coletadas entre os meses de janeiro e fevereiro de 2013 e fevereiro e março de 2014, foram cedidas gentilmente por VILELA (2016), grupo de pesquisa parceiro coordenado pelo Professor Dr. Tercílio Calsa na Universidade Federal de Pernambuco. Estas amostras de ápice meristemático vieram de um pool com 5 réplicas biológicas, com os seguintes tratamentos: Pré e Pós - indução do florescimento sem cálcio (somente adubação convencional); Pré e Pós - indução do florescimento - adubação convencional + aplicação foliar de 58,0 mM de sulfato de cálcio (CaSO4) (CRUZ, 2010; ENDRES et al., 2015). Foram analisadas seis amostras de ápice meristemático: Pré - Floração Cálcio e controle 2013, Pós - Floração Cálcio e controle 2013 e Pré - Indução Cálcio e controle 2014; e duas réplicas de amostra de folha com os tratamentos Pré-Indução cálcio e controle em 2014.

3.11 EXTRAÇÃO DE RNA

A extração do RNA foi feita utilizando o protocolo da Ambion e o TRI Reagent Solution. O material obtido foi ressuspendido em 100 µL de água previamente tratada com DEPC 0,1 % (SAMBROOK et al., 2001). A qualidade das amostras foi avaliada tanto em um gel de agarose a 2 %, como por meio da estimativa da concentração e grau de pureza da amostra no NanoDrop

PERÍODO DE

COLETA TIPO DO ESTRESSE TRATAMENTOS

2013 PRESENÇA DO AGENTE ESTRESSOR PERÓXIDO DE HIDROGÊNIO

Concentrações do agente estressor

0 mM 10 mM 20 mM 30 mM

2011 SUSPENSÃO DE

REGA

Controle Tratamento 1: 5 dias sem rega

Tratamento 2: 10 dias sem rega

(30)

One/OneC Microvolume UV-Vis Spectrophotometer (ThermoFisher Scientific). Apenas as

amostras que apresentaram a razão de A260/A280 entre 1,8 até 2,1 seguiram para a próxima etapa. Estas amostras agora foram tratadas com DNAse utilizando o kit DNase I (RNase-free) da Ambion (AM1907,) conforme protocolo recomendado pelo fabricante. Após este tratamento, a concentração das amostras foi novamente avaliada em espectrofotômetro NanoDrop descrito acima. Somente as amostras que apresentaram a qualidade necessária seguiram para a próxima etapa de síntese do cDNA.

3.12 SÍNTESE DO cDNA

Para construção dos cDNAs utilizou-se o kit cDNA High Amplification (Applied Biosystem), utilizando 3 µg de RNA e a reação foi realizada de acordo com o fabricante em um volume final de 20 µL. Os tubos foram colocados no termociclador (Mastercycler Personal da Eppendorf) com programação adequada ao procedimento (20 ºC por 10 min, 37 ºC por 2 h e 85 ºC por 5 min). Depois este material foi diluído para um volume final de 200 µL.

3.13 PCR QUANTITATIVO EM TEMPO REAL

O procedimento de RT-qPCR foi utilizado para analisar a expressão do gene SEC14 em diferentes tecidos e condições. Antes de realizarmos os experimentos para avaliar a expressão do gene SEC14, foi testado a eficiência de síntese dos cDNAs. Esta eficiência foi comprovada por meio de amplificação dos fragmentos com os primers EF1αT1 e EF1αT2 (Tabela 2). Estes primers localizam-se próximos em uma diferença de 70 pb no cDNA. Assim, somente os cDNAS que apresentaram um ∆CT ≤ 3 entre os primers utilizados foram utilizados para a avaliação do RT-qPCR (CZECHOWSKI et al. 2004; UDVARDI et al. 2008). Para este procedimento, foram utilizadas placas de 48 poços no equipamento StepOne Real-Time PCR System (Applied Biosystems - Ref:4376599). As reações continham 5 μL 2X SYBR Green Master Mix, 1,0 μL da diluição original do cDNA, e 0,5 μM de cada primer específico para uma reação com volume final de 10 μL. Dois genes de referência foram usados em cada placa, Ubiquitina (UBQ) e Fator de Elongação (EF1α) (Tabela 2). Todas as reações foram realizadas com esses dois primers de referência: EF e UBQ. Os valores de expressão do gene de interesse foram normalizados para Ubiquitina. O experimento seguiu o padrão de perfil termal de 50 °C por 2 min; 95 °C por 10 min; 40 ciclos de 95 °C por 15 s, e 60 °C por 1 min, seguido por uma

(31)

curva de dissociação. O desenho experimental contou com 3 replicatas biológicas e 3 replicatas técnicas para cada reação. O threshold cycles (Ct) foi normalizado pela eficiência do PCR igual a 2 [CT’ = CT x (log2 E/log2 2)] (Pant et al. 2008). Todos os primers utilizados tem suas sequências descritas na tabela 2. Os dados foram analisados com o erro padrão. O dado referente às variedades precoce e tardia foi analisado utilizando a Análise de Variância ANOVA (fator único), com p-value < 0,05.

Tabela 2 - Descrição dos primers utilizados para o RT-qPCR Nome do

Primer

DFCI number

Foward Reverse

EF1αT1* TC72754 5´AAG GCC CGT TAT GAT GAG ATT GTG 3´

5’CAA AAC CAG AGA TTG GGA CGA AAG 3´

EF1αT2* TC72754 5´ CTT GAG GCT CTT GAC CAG ATC ACC 3´

5´GGG ACA GTT CCA ATA CCA CCA ATC 3´

EF1α** TC72754 5´ AAG GCC CGT TAT GAT GAG ATT GTG 3´

5´CAA AAC CAG AGA TTG GGA CGA AAG 3´

UBQ TC72899 5´GTC AAG ACC CTC

ACT GGC AAG ACT 3´

5´GAT TCC CTC CTT GTC CTG GAT CTT 3´

SEC14 TC78676 5’TAG CTA AAC CCA

TTC TGC CAT CTGA 3’ 5’ATA AAC AGG TTG TCC CTG CTT GGA G 3’

*: gene de referência usado para conferir a qualidade do cDNA

**: gene de referência usado para conferir contaminação do DNA genômico

4. RESULTADOS

4.1 HOMOLOGIA DAS SEQUÊNCIAS DE SEC14 EM VEGETAIS

A proteína SEC14 está envolvida em diversas vias em organismos procariotos e eucariotos, especialmente em vias relacionadas ao transporte de lipídios (CLEVES et al., 1991; BANKAITIS et al., 2010). Apesar de sua importância, poucos estudos relatam sua função em cana-de-açúcar e outros vegetais. Tem sido observado que a proteína SEC14 possui um domínio característico de sua família, chamado de CRAL-TRIO, esse domínio é estrutural proteico que está associado com a ligação de moléculas lipofílicas pequenas (BANKAITIS et al., 2010). Este é encontrado em algumas famílias de proteínas, como as ativadoras de GTPases e proteínas ligantes hidrofóbicas, como a SEC14 (HABERMEHL et al., 2005). O alinhamento das

(32)

sequências em plantas com maior identidade com a proteína SEC14 mostrou a conservação do domínio CRAL-TRIO (destacada em azul) e CRAL-TRIO N-TERMINAL (destacada em verde), quase completamente, exceto poucos aminoácidos que se apresentavam distintos, destacadas em rosa escuro.

Figura 1 – Alinhamento via Clustal Omega com sequências homólogas a ScSEC14. Destacado em verde as porções correspondentes ao domínio TRIO N-TERMINAL e em azul o domínio CRAL-TRIO. Os aminoácidos destacados em rosa indicam possíveis alterações nesse domínio. Ao lado esquerdo da figura, estão explicitados os nomes dos organismos ao qual a sequência corresponde, sendo eles nessa ordem: B. distachyon (XM_003576924.4), O. sativa (AK061499.1), S. italica (XM_004956307.4), Z. mays (NM_001143217.1), SEC14 em cana-de-açúcar (a sequência estudada aqui- comp75824_c0_seq1), destacada por retângulo vermelho, CScSEC14 em cana-de-açúcar (MG571103.1) (HUA-YING et al., 2018) e S. bicolor (XM_002459881.2).

O domínio CRAL-TRIO ocupa grande parte da proteína SEC14 e se encontra com alta conservação entre as gramíneas analisadas. De modo geral, o domínio CRAL-TRIO N-TERMINAL ocupa da posição 10 a 58 do alinhamento e, para CRAL-TRIO, de 88 a 240. Tendo em vista que a sequência tem aproximadamente 335 aminoácidos, mais da metade dela corresponde ao domínio CRAL-TRIO. Poucos aminoácidos divergiram das sequências analisadas (Figura 1). A figura 2 mostra o posicionamento do domínio CRAL-TRIO nas sequências de gramíneas analisadas no alinhamento acima.

(33)

Figura 2 - Análise dos domínios conservados entre proteínas homólogas a SEC14 em gramíneas e ScSEC14. Na porção esquerda da figura estão os identificadores das sequências correspondente aos organismos: Saccharum spp. (comp75824_c0_seq1), Saccharum ssp. cultivar chinês (MG571103.1),

Sorgo bicolor (XM_002459881.2), Zea mays (NM_001143217.1), Setaria italica (XM_004956307.4), Brachypodium distachyon (XM_003576924.4) e Oryza sativa (AK061499.1), na porção direita da

figura encontram-se os tamanhos das sequências.

Na Tabela 3 podemos observar a porção correspondente ao domínio CRAL-TRIO de cada sequência acima analisada.

Tabela 3 – Posicionamento do domínio CRAL-TRIO em gramíneas. Organismos Sigla para

identificação Tamanho da sequência (aa) Intervalo do domínio CRAL-TRIO Saccharum officinarum ScSEC14 364 79-239 Saccharum officinarum (cultivar chinês) CScSEC14 335 79-239

Sorghum bicolor S.bicolor 335 79-239

Zea mays Z.mays 336 82-239

Setaria italica S.italica 335 79-239

Brachypodium distachyon

B.distachyon 333 80-240

Oryza sativa O.sativa 335 79-239

A tabela 3 nos permite analisar que o tamanho de cada sequência é similar, assim como, a região de aminoácidos da sequência que corresponde ao domínio CRAL-TRIO. Pode-se observar que os intervalos possuem grande semelhança, não possuindo distância maior que 5 aminoácidos. Quando comparamos a proteína (ScSEC14) SEC14 em cana-de-açúcar

(34)

(monocotiledônea) com sua homóloga em A. thaliana (planta modelo – dicotiledônea), vemos uma conservação menor como apresentado na figura 3. A proteína SEC14 em A. thaliana tem uma sequência maior, contendo 554 aminoácidos, provavelmente pela anotação completa do genoma desse vegetal. Todavia, ainda podemos ver a conservação na parte do domínio.

Figura 3 - Alinhamento via Clustal Omega com a sequência de Arabidopsis thaliana (At4g39180) homóloga a ScSEC14. Destacado em verde as porções correspondentes ao domínio CRAL-TRIO N-TERMINAL e em azul o domínio CRAL-TRIO.

Existem apenas 4 proteínas homólogas a SEC14 revisadas em A. thaliana por meio do banco de dados Uniprot, as demais proteínas homólogas, apesar de apresentarem maior identidade, não apresentam o status de revisadas, isto significa que as proteínas revisadas foram manualmente anotadas e revisadas por curadores do UniProt, as sem revisão foram anotadas computacionalmente. Em posse apenas das revisadas, pode-se observar uma conservação do domínio CRAL-TRIO e seu posicionamento nas sequências, como apresentado na figura 4.

Figura 4 - Análise dos domínios conservados entre proteínas homólogas a SEC14 em A. thaliana e ScSEC14 (Saccharum spp.). Na porção esquerda da figura estão os identificadores das sequências pelo UNIPROT, sendo as quatro últimas de Arabidopsis e a primeira a proteína SEC14 em cana-de-açúcar, na porção direita da figura encontram-se os tamanhos das sequências. A escala horizontal está a 0,6.

(35)

A tabela 4 nos permite visualizar mais informações acerca do posicionamento do domínio e seu respectivo intervalo nas sequências, além do tamanho da sequência e em qual cromossomo está contida. Nesta tabela pode-se observar a conservação do domínio entre as sequências de A. thaliana e sua porção compartilhada na sequência de cana-de-açúcar. Os tamanhos das sequências diferem, tendo um maior número de aminoácidos nas correspondentes a A. thaliana. Um indicativo de que a SEC14 está conservada não somente da família Poaceae, como em outros grupos de plantas.

Tabela 4 – Posicionamento do domínio CRAL-TRIO em ScSEC14 e A. thaliana.

Organismos Sigla para identificação e seu respectivo gene Número do cromossomo Tamanho da sequência (aa) Intervalo do domínio CRAL-TRIO Saccharum officinarum ScSEC14 - 364 79-239 Arabidopsis thaliana F4JVA9 SFH2 4 554 138-312 Arabidopsis thaliana F4J7S8 SFH9 3 579 145-319 Arabidopsis thaliana Q93ZE9 SFH3 2 548 137-311 Arabidopsis thaliana F4JLE5 SFH1 4 554 130-304 4.2 ANÁLISE FILOGENÉTICA

Uma análise filogenética pode ser usada para muitos propósitos, para análises de famílias de genes, possível predição de função e ainda estimar relações evolutivas entre determinados organismos. Para melhor caracterizar a SEC14 de cana-de-açúcar, inferir sua conservação entre outras famílias de vegetais e visualizar como seria essa potencial relação filogenética deste gene em plantas, montou-se uma árvore filogenética com sequências de aminoácidos por meio do servidor TaxOnTree. Por meio da análise do domínio conservado CRAL-TRIO, obtivemos informações sobre a conservação desse gene em gramíneas e A. thaliana. Uma árvore filogenética possibilita abarcar maior número de organismos que contém o gene e se o domínio característico da família SEC14 apresenta-se conservado. A partir da árvore gerada pelo TaxOnTree, restringimos os organismos para a montagem de uma nova árvore no MEGA 7, utilizando sequências de aminoácidos, contendo apenas 2 a 3 exemplares

(36)

de cada família que apresentaram possíveis duplicações. A árvore (Figura 5) contém unicamente sequências de plantas.

Figura 5 - Árvore filogenética de SEC14 em vegetais. Com o programa MEGA 7 foi construída a árvore e analisada pelo método Maximum Likelihood, baseada no modelo de matriz JTT. O bootstrap foi inferido com 1000 replicatas e Cutoff de 95%. A nossa sequência de SEC em cana-de-açúcar está destacada pelo retângulo vermelho.

Nota-se a presença da proteína SEC14 em diferentes organismos, indicando ortologia entre os genes, ou seja, no passado, essas espécies tiveram um ancestral comum que apresentava em seu genoma esse gene. Quando houve a cladogênese, cada organismo herdou a SEC14, tendo uma homologia dessa proteína entre eles. Salienta-se que há um indicativo de duplicação de alguns organismos que se repetem na árvore, contudo apresentam o gene em cromossomos

(37)

diferentes. A Tabela disponível no anexo permite observar todas as sequências contidas nessa árvore e em qual cromossomo encontra-se o gene para SEC14, essas possíveis duplicações ocorrem tanto em mono como em eudicotiledôneas. Há diferença entre os grupos das eudicotiledôneas e monocotiledôneas, essa separação ficou explícita na árvore disponível no anexo. Existem 3 sequências do organismo Sorghum bicolor destacadas por apresentarem maior identidade a SEC14 na árvore, sendo elas LOC8065083, LOC8082915 e LOC8062008, que se encontram, respectivamente nos cromossomos 10, 4 e 2. O alinhamento das mesmas via Clustal Omega (Anexo) sugere que são prováveis duplicações que podem estar em processo de divergência, pois apresentam-se em cromossomos diferentes e, apesar de conservarem a sequência, já possuem alguns aminoácidos distintos. Destaca-se também que todas as sequências da árvore apresentam conservado o domínio CRAL-TRIO.

Com o intuito de observar as relações filogenéticas com um maior nível de restringência, fez-se outra árvore filogenética mais restritiva com os parâmetros de 100 alvos máximos e o threshold de 70 (Figura 6). Pode-se notar que, para estes parâmetros, esta árvore apresenta apenas a família das Poaceae (na árvore do anexo , essa família foi destacada em vermelho), o que era de se esperar devido à similaridade das sequências dentro de uma mesma família. Supõe-se que um maior nível de restrição só permite que as relações filogenéticas mais próximas estejam visíveis na árvore. Por isso, começamos com uma árvore mais abrangente com 200 organismos (disponível no anexo), seguida por uma árvore com cerca de 50 organismos (figura 5), até uma árvore contendo apenas 18 organismos (figuras 6).

A árvore filogenética exposta na figura 6, apresenta unicamente membros da família Poaceae, predominantemente os organismos são do gênero Oryza, apesar de notarmos exemplares do gênero Triticum, Hordeum, Sorghum, Setaria e Panicum. Nota-se uma das sequências de sorgo que se apresentava duplicada na árvore mais abrangente (no anexo ), novamente presente nessa última árvore.

(38)

Figura 6 - Árvore filogenética 2 da SEC14. Gerada pela plataforma TaxOnTree (Threshold 70 e 100

maximum targets) e visualizada via FigTree v1.4.3. Contendo organismos da família Poaceae. O nome

destacado em vermelho indica a sequência de cana-de-açúcar (ScSEC14). As porcentagens mostram valores de bootstrap dos nós.

4.3 ANOTAÇÕES FUNCIONAIS VIA BLAST2GO

Considerando que a análise filogenética, explicitada no tópico anterior, mostrou uma conservação do domínio CRAL-TRIO e da sequência de SEC14, a próxima abordagem foi realizar uma análise via Blast2GO, para identificar, em bancos de dados atrelados a essa ferramenta, como está a distribuição desta sequência nas espécies, bem como, conseguir informação de como está a distribuição de domínios para a sequência analisada. As análises via Blast2GO nos permitem obter melhor caracterização da ontologia dos genes analisados, possibilitando uma explanação da orientação biológica dos processos e uma capacidade de mineração de dados e enriquecimento da análise. A anotação inicial foi feita por meio de uma

(39)

busca contra bancos de dados, a fim de encontrar a distribuição de SEC14 nas espécies. A Figura 7 apresenta a distribuição da sequência SEC14 nas espécies.

Figura 7 - Distribuição da ScSEC14 entre espécies feita através do Blast2GO. O eixo x representa o número de ocorrências de cada sequência no Blast, enquanto o eixo y mostra em quais espécies foram essas respectivas ocorrências.

O número de vezes que a sequência aparecia presente em determinado organismo está exposto na parte superior da figura, nomeado como número de Hits. Podemos observar novamente o organismo Sorghum bicolor com maior número de hits no Blast (6 hits), possivelmente devido a sua maior identidade com a sequência de cana-de-açúcar, assim como foi visto na árvore filogenética.

Para corroborar com esse dado, a Figura 8 mostra a distribuição de similaridade das sequências do blast com a ScSEC14. Esse gráfico mostra a distribuição de todas as porcentagens calculadas para similaridade das sequências, mostrando o perfil geral dos alinhamentos. Essa análise nos permite visualizar uma similaridade acima de 80% para todas as sequências, corroborando para confiabilidade dessas análises.

(40)

Figura 8 - Análise de distribuição de similaridade das sequências com ScSEC14 feita via Blast2GO. O eixo x corresponde à similaridade das sequências no alinhamento em porcentagem. O eixo y representa ao número de hits das respectivas sequências analisadas.

Seguindo para uma análise em nível de família e domínios dessas sequências, identificou-se no InterProScan os termos de ontologia dos genes, mostrando a distribuição de domínios e famílias do Anexo. Dentre esses, as sequências encontram-se contidas nas superfamílias CRAL-TRIO N-TERMINAL e CRAL-TRIO, assim como os domínios que carregam o mesmo nome da superfamília. Famílias e superfamílias de proteínas podem carregar o nome do principal domínio presente na proteína, como a superfamília SEC14, também chamada de CRAL-TRIO, por este ser o principal domínio dessa proteína. Essa análise contribui para inferir a conservação desse domínio para as sequências de SEC14, salientando sua importância para a funcionalidade de SEC14 em processos biológicos, uma vez que, se apresenta conservado em diversos organismos, tanto em monocotiledôneas quando eudicotiledôneas.

Seguido da anotação feita pelo InterPro, fez-se o mapeamento de termos GO no que diz respeito a sua função molecular, processos biológicos e componente celular. Essa análise permite nortear qual a principal função molecular que a proteína SEC14 pode estar envolvida, os processos biológicos no qual ela pode participar e em qual componente celular ela pode atuar. Obteve-se 100% de distribuição nesses processos analisados (Tabela 5). A distribuição das sequências no que diz respeito à função molecular agrupou todas em uma só função,

(41)

atividade de transporte. O dado correspondente à participação em processos biológicos, por sua vez, corrobora com o dado anterior de função molecular, indicando para atividade de transporte todas as sequências analisadas. A análise de componente celular, mostra 100% das distribuições de sequências na porção intracelular.

Tabela 5 – Mapeamento dos termos GO

Como a análise dos dados obtidos até o momento sugere a participação desta proteína no transporte de lipídeos, fez-se uma análise utilizando o LocTree3, que mostrou a predição da localização subcelular da proteína ScSEC14. Essas análises propõem que a proteína pode se encontrar na mitocôndria, com 82% de acurácia. Os termos GO propõe a proteína SEC14 como componente integral da membrana, dessa forma pode-se inferir que sua localização em membranas também pode inclui a membrana das organelas, como mitocôndria, Golgi, dentre outras.

4.4 REDES DE INTERAÇÃO

Considerando os dados expostos, pode-se notar que há presença de SEC14 em diversos organismos, essa proteína pode atuar em conjunto para exercer determinadas funções, para melhor compreender essa interligação de SEC14 com outras proteínas, fez-se uma rede de interação. As redes de interação nos permitem visualizar as proteínas que estão, de alguma maneira, interagindo com a proteína de interesse. Os dados são fomentados por bancos de dados, pesquisas experimentais e materiais teóricos publicados. Dessa maneira, visou-se com o uso da ferramenta para construção de redes de interação, obter conhecimentos acerca de possíveis proteínas que mostram ter interação com a SEC14 e suas funções, atentando para funções compartilhadas.

O interactoma gerado por meio do programa Cytoscape, com auxílio do STRING 10.5, foi feito utilizando uma sequência homóloga a ScSEC14 no organismo modelo A. thaliana, pois a mesma possui seu genoma totalmente sequenciado, ao contrário da cana-de-açúcar.

Termos GO mapeados Distribuição das sequências (%)

Atividade

Função molecular 100 Transporte

Processos biológicos 100 Transporte

Referências

Documentos relacionados

Este dado diz respeito ao número total de contentores do sistema de resíduos urbanos indiferenciados, não sendo considerados os contentores de recolha

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Fugiu – forma verbal do verbo “fugir”, no Pretérito Perfeito do Indicativo, na 3.ª pessoa do singular. Forma afirmativa: Eu

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

Os dados referentes aos sentimentos dos acadêmicos de enfermagem durante a realização do banho de leito, a preparação destes para a realização, a atribuição

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Por último, temos o vídeo que está sendo exibido dentro do celular, que é segurado e comentado por alguém, e compartilhado e comentado no perfil de BolsoWoman no Twitter. No