3.3.1. Inferência filogenética
4.2.3.4. Análises dos SNPs implicados nas perdas de start-codon
O start-codon é o primeiro códon de um RNA mensageiro (mRNA), atua como
sítio de início da tradução da ORF e nos eucariotos está dada pela trinca de bases
nitrogenadas ATG, que codifica a uma metionina. A perda do códon de início por uma
mutação pontual (SNP), implica que a tradução da ORF será iniciada no próximo ATG,
sendo as modificações ocasionadas relativas a cada sequência específica.
Dependendo da posição do próximo códon que possa funcionar como início de
transcrição, o mRNA transcrito perderá a sequência anterior. Se estas perdas afetarem
sítios ativos em enzimas ou motivos estruturais chaves para o funcionamento proteico
ou dos RNA não-codantes, pode haver mudança de função e perda da mesma.
Nossas análises detectaram 5 SNPs comuns entre as cepas industriais, sendo 2
deles particularmente interessantes. O primeiro é no gene SSK22 (YCR073C), que
codifica uma MAP kinase-kinase-kinase envolvida na cascata MAP. As proteínas
kinases ativadas por mitógenos (MAPK, do inglês, Mitogen-Activated Protein Kinase)
estão envolvidas diretamente na resposta de estímulos celulares, tais como estresse,
choque osmótico e de temperaturas, atuando na regulação de processos tais como
proliferação, expressão gênica, sobrevivência e apoptose (PEARSON et al., 2001). A
kinase SSK22 tem sido descrita como um componente fundamental durante a
exposição a estresse osmótico, já que tem como papel principal a ativação da PBS2
(MAPKK) que ativa subsequentemente a HOG1 (MAPK). A via HOG (do inglês, High
Osmolarity Glycerol response), é a via mais importante já descrita de resposta a
estresse hiperosmótico em leveduras, e a ativação de HOG1 regula a expressão de
mais de 600 genes para restabelecer o equilíbrio osmótico (HOHMANN; MAGER,
2002). Uma mudança no sítio de início de transcrição poderia acarretar grandes
modificações na regulação desta via, já que é nesta região onde SSK22 tem o sítio de
ancoragem a PBS2 ao lado do domínio kinase (TATEBAYASHI; TAKEKAWA; SAITO,
2003), porém, na sequência de aminoácidos, esta proteína apresenta uma metionina
muito perto do start inicial, que poderia servir para início da transcrição, sem afetar a
funcionalidade da mesma.
O segundo gene que apresentou perda de start-codon comum nas industriais foi
MIC60 (YKR016W), que codifica a uma proteína de membrana mitocondrial interna.
Esta proteína é parte central de complexo conhecido como MICOS, encarregado de
interagir com os complexos respiratórios (proteínas encarregadas das cadeias
transportadoras de elétrons para produção de ATP) e os lipídeos de manter para
estabelecer a arquitetura da membrana mitocondrial interna (FRIEDMAN et al., 2015).
As mitocôndrias apresentam uma dupla membrana, sendo a interna uma membrana
com várias subdivisões estruturais e funcionais, fundamentais para o correto
funcionamento mitocondrial. Mais importante ainda, MIC60 é o componente upstream
do complexo, que regularia ativamente as outras subunidades do MICOS (FRIEDMAN
et al., 2015). Friedman e colaboradores (2015) quantificaram os fenótipos aberrantes
nas mitocôndrias devido a deleções nos diferentes componentes do complexo MICOS,
sendo a de maior comprometimento mitocondrial no MIC60. Porém, na sequência de
aminoácidos, esta proteína apresenta uma metionina muito perto do start inicial, que
poderia servir para início da transcrição, sem afetar a funcionalidade da mesma, o que
é condizente com a ausência de fenótipos aberrantes nas cepas brasileiras.
Entre as cepas brasileiras não foi encontrada perda de start-codon comum a
todas elas em genes que codifique algum produto funcional. As cepas PE-2 e SA-1,
apresentaram uma perda cada uma, porém pertencentes a ORFs que não codificam
proteínas funcionais, de acordo com a predição do SGD. A BG-1 apresentou 5 genes
com perda de start-codon, sendo 4 deles em pseudogenes e o TNA1 (YGR260W), que
codifica uma permease encarregada da captação de ácido nicotínico. O ácido
nicotínico ou niacina, é uma vitamina hidrossolúvel precursora do NAD+/NADH e
NADP+/NADPH, sendo esta molécula chave para grande parte das reações redox que
acontecem dentro da célula, além de estarem envolvidas no reparo do DNA (LI; BAO,
2007). Breslow e colaboradores (2008) avaliaram em testes em larga escala que os
mutantes nulos de TNA1, apresentam fitness competitivo reduzido (avaliado por
comparação de crescimento), o que sugeriria que talvez essa perda de start-codon não
tenha um efeito considerável no fenótipo, já que a próxima metionina que servirá como
novo start-codon, está a 6 posições na frente, e a perda de aminácidos é muito
pequena e não afeta nenhum sítio ativo.
Finalmente, na cepa VR-1 foram encontrados 2 genes com perda de start-
codon, sendo elas em genes que não codificam produtos funcionais, e o MET28
(YIR017C), um fator de transcrição envolvido no metabolismo de enxofre. O enxofre é
parte do metabolismo central para o funcionamento normal das leveduras. Está
envolvido em várias funções celulares, algumas como a síntese de alguns aminoácidos
como metionina e cisteína, assim como a síntese de thioles, compostos chave para o
balanço redox da célula e a homeostase de ferro (KOK et al., 2015). Outros autores
destacam a importância da assimilação do enxofre devido as vias que são controladas
por este elemento, uma delas é a via catabólica da degradação da alantoína (PETTI et
al., 2012), que como já descrito no item 4.2.3.2, poderia contribuir como fonte de
nitrogênio. Desta forma, o enxofre não só participa na formação das proteínas como
cisteína e metionina, assim como para os complexos proteicos de Fe/S (ferro e
enxofre), também tem um papel fundamental no aproveitamento das escassas fontes
de nitrogênio na dorna de fermentação, nutriente fundamental para a síntese proteica.
Foi provado inclusive, que sob limitação de enxofre, o perfil proteico da levedura muda
drasticamente, perto de um 30%, obrigando a célula a ‘reformular’ o conteúdo proteico
para manter a funcionalidade (FAUCHON et al., 2002). Desta forma, se a mudança
acontecida no MET28 é importante é possível que os níveis de aproveitamento de
nitrogênio e outros elementos se vejam alterados, assim como também o perfil de
expressão proteico, devido a que a próxima metionina que servirá como novo start-
codon, está a 25 posições na frente, sendo uma perda de aminácidos consideráveis.
As análises de SNPs mostraram que as cepas industriais possuem muitas
alterações em comum, independente da origem geográfica. Estas variações convergem
em grandes grupos de genes relacionados ao estresse celular, tais como regulação da
síntese de parede e membrana, regulação de assimilação de nutrientes, controles de
qualidade do DNA, vias de sinalização em resposta a estresse, transporte de íons e
genes de exportação de susbtâncias tóxicas. Este elevado número de polimorfismos
compartilhados poderia justificar as adaptações das cepas industriais, e sugere que a
base genética para que isso aconteça já se encontrava presente na cepa ancestral, ou,
menos provavelmente, que houve uma evolução convergente sobre características
proveitosas para a sobrevivência frente as condições adversas que acontecem na
dorna. Podemos destacar que isso ocorre dada uma ação antropogênica na seleção de
cepas com caraterísticas desejáveis, e por causas naturais, como a competição intra e
interespecífica dentro das dornas.
4.2.4. Análise de Variação de Número de Cópias
Quando um gene é duplicado, ele e sua nova cópia são chamados de parálogos,
genes com uma origem evolutiva comum, dentro da mesma linhagem
(SONNHAMMER; KOONIN, 2002). A duplicação gênica pode ter vários caminhos
evolutivos diferentes: a manutenção de ambas cópias com função idêntica, a divisão de
tarefas entre as cópias ou a diversificação de função, sendo este último um recurso
importante de inovação para a célula (WAPINSKI et al., 2007).
Em organismos eucariotos, muitos genes apresentam uma relação
estequiométrica de quantidade de cópias de um gene, expressão e fenótipo
(BIRCHLER et al., 2001). Quando a duplicação dos genes é recente, e ainda não há
divergência entre eles, uma maior quantidade de cópias, supõe, em muitos casos, um
aumento no efeito ou funcionalidade daquele gene. É conhecido que S. cerevisiae
conta com várias estratégias de duplicação gênica sob diferentes tipos de estresse
(ADAMS et al., 1992; DUNN et al., 2012), fazendo deste um recurso importante para
aumentar o impacto da expressão de um dado gene. Por essa razão, foi feita uma
análise de variação de número de cópias (CNV, do inglês, Copy Number Variartion),
para verificar se isso ocorreu em genes relacionados a tolerância a estresse.
Entre as cepas brasileiras foi verificado que o gene PDR18 (YNR070W) possui
duas cópias a mais que a referência (S288C), e que está ausente nas cepas CEN.PK e
Ethanol Red. Este gene codifica um transportador da família ATP-bindinding cassette
(ABC), que participa do controle da composição de esteróis na membrana plasmática,
a qual acredita-se ser pela via não vesicular do retículo endoplasmático (CABRITO et
al., 2011). Já tem sido amplamente descrito que uma maior quantidade de esteróis na
membrana aumenta significativamente a tolerância a etanol (YOSHIKAWA et al., 2009;
ZHANG et al., 2016). Testes em membranas artificias mostram que o aumento de
ergosterol afeta significativamente a estabilidade da membrana devido a uma
diminuição da fluidez (TIERNEY; BLOCK; LONGO, 2005). Inclusive, já foi testada a
super-expressão deste transportador, que quando o promotor nativo foi substituído por
um mais forte (PDR5), as cepas testadas produziram 6% a mais de etanol e a
tolerância aumentou em 17% em relação às cepas parentais (TEIXEIRA et al., 2012).
Assim, o aumento do número de cópias do gene PDR18 pode fornecer vantagens
adaptativas para as leveduras submetidas a estresse alcoólico durante a fermentação,
aumentando desta forma sua tolerância ao etanol.
É interessante destacar que nas análises de CNV conseguimos constatar um
aumento de número de cópias em diferentes genes da família PAU nas cepas Ethanol
Red e CEN.PK. Estas proteínas são de função desconhecida, porém, tem sido
relacionadas ao aumento de tolerância de etanol (RACHIDI et al., 2000; LUO; VAN
VUUREN, 2009). É destacável também que o gene PDR18 segundo nossas análises
não se encontra nestas cepas, o que sugeriria que os grupos desenvolveram
estratégias diferentes visando resolver um mesmo problema: as altas concentrações de
etanol.
Na cepa PE-2 foram encontrados dois genes com CNV aumentado não
reportados previamente: o SMF2 (YHR050W) e o CUP1-1 (YHR053C), ambos com oito
cópias a mais que a cepa de referência S288C. O gene SMF2 codifica para um
transportador de íons divalentes, pertencente à família Nramp, envolvido na
homeostase de manganês. As leveduras precisam assimilar manganês para a síntese
da enzima superoxido dismutase (SOD) sintetizada exclusivamente na mitocôndria,
que tem um papel importante no estresse oxidativo (LONGO; GRALLA; VALENTINE,
1996). A produção de etanol encontra-se diretamente ligada a geração de ROS durante
a fermentação, e o aumento da SOD indiretamente é fundamental para a tolerância ao
etanol (LUK; CULOTTA, 2001). O CUP1-1 codifica a uma metalotioneína, fundamental
para a tolerância a altas concentrações de cobre e cádmio (COSTA et al., 1997). Esta
proteína tem atividade de SOD, e também é ativada por choque térmico por calor e
starvation de glucose, induzindo ao crescimento das células em fontes de carbono não
fermentáveis como glicerol e etanol (COSTA et al., 1993). Possivelmente estes genes
foram duplicados na cepa PE-2 e foram mantidos devido as vantagens adaptativas que
eles conferem. Ambas proteínas codificadas pelos respectivos genes atuam
protegendo as células do estresse oxidativo, somado ao efeito do CUP1-1 contra a
destoxificação do cobre e cadmio, e estimulando às células a crescer em fontes de
carbono alternativas, característica que contribui ao destacável desempenho da cepa
PE-2 durante a fermentação alcoólica.
Foi verificado na cepa CAT-1 que o gene YNL134C tem um número de cópias 4
vezes superior à referência. Este gene codifica a uma enzima aldeído redutase NADH-
dependente, envolvido na detoxificação de furfural (ZHAO et al., 2015), composto
gerado no pré-tratamento da biomassa lignocelulósica para a produção de etanol 2G.
Ela pertence à família das MDR (do inglês, Medium Chain dehydrogenase/ reductase,
desidrogenase/redutase de cadeia média), um amplo grupo de enzimas encarregadas
de destoxificação contra álcool e outros compostos, ajudando a combater, dependendo
do caso, estresse oxidativo, estresse hiperosmótico ou choque térmico contra elevadas
temperaturas (TAMAI et al., 1994). Resultados preliminares do projeto FAPESP
2017/02124-0 desenvolvido pelo nosso grupo, mostraram durante fermentações em
licor C5 com diferentes cepas industriais brasileiras, que a cepa CAT-1 é uma das mais
tolerantes às concertações mais elevadas do licor (dados não publicados). Dado que o
licor C5 contém outros inibidores além do furfural, não podemos afirmar que o fenótipo
observado seja atribuído exclusivamente a este aumento de número de cópias, porém
esta modificação deve contribuir com o desempenho da cepa.
Durante a análise de CNV, conseguimos constatar que os telômeros das cepas
industriais são mais curtos que os da CEN.PK e da referência, S288C. Como
previamente descrito, os telômeros são estruturas com a função de manter a
integridade cromossômica e sua perda ou encurtamento estão associadas a
senescência celular (KUPIEC, 2014). Zhao e colaboradores (2015) testaram vários
estresses diferentes sobre as leveduras, e concluíram que o estresse por etanol e
ácido acético produz um alongamento dos telômeros, enquanto o estresse por
elevadas temperaturas, produz um encurtamento dos mesmos (ROMANO et al., 2013).
Tanto o estresse por etanol como por ácido acético ativam grupos de genes de
estresse de vias específicas, ao contrário do choque térmico (ROMANO et al., 2013).
Como já menionadao, o processo de produção de etanol é exotérmico, submetendo as
células a altas temperaturas (BASSO et al., 2011). Durante a exposição ao calor, todas
as vias celulares são potencialmente ameaçadas, já que todas as proteínas correm o
mesmo risco de serem desnaturadas, e consequentemente de perderem sua função
(HOHMAN; MAGNER, 2003). Devido à intensidade do estresse causado pela
temperatura, ele pode ser o responsável por pela redução da região telomérica.
Os dados sugerem que duplicação gênica é um fator importante na evolução
genômica, porque permite posterior divergência e especialização dos parálogos. As
duplicações encontradas em grupos específicos de genes envolvidos em resposta/
tolerância a estresse aponta que este processo tem um papel importante na adaptação
da cepa às perturbações provocadas pelo ambiente industrial. Similar a análise de
expansão de famílias, os CNV com relevância fisiológica devem ser avaliados
individualmente, pois um aumento no número de cópias e uma subsequente
divergência entre os parálogos, sugeriria não uma vantagem do gene dosagem-
dependente, mas sim a aquisição de uma nova função nesta mesma rota metabólica,
ou em rotas alternativas.
No documento
Genômica comparativa de cepas de Saccharomyces cerevisiae produtoras de etanol
(páginas 76-83)