• Nenhum resultado encontrado

Análise transcricional de Trichoderma harzianum CBMAI-0179 durante a degradação de celulose : Transcriptional analysis of Trichoderma harzianum CBMAI-0179 during cellulose degradation

N/A
N/A
Protected

Academic year: 2021

Share "Análise transcricional de Trichoderma harzianum CBMAI-0179 durante a degradação de celulose : Transcriptional analysis of Trichoderma harzianum CBMAI-0179 during cellulose degradation"

Copied!
75
0
0

Texto

(1)

INSTITUTO DE BIOLOGIA

DÉBORAH AIRES ALMEIDA

“ANÁLISE TRANSCRICIONAL DE Trichoderma harzianum

CBMAI-0179 DURANTE A DEGRADAÇÃO DE CELULOSE”

“TRANSCRIPTIONAL ANALYSIS OF Trichoderma harzianum

CBMAI-0179 DURING CELLULOSE DEGRADATION”

CAMPINAS 2019

(2)

“ANÁLISE TRANSCRICIONAL DE Trichoderma harzianum

CBMAI-0179 DURANTE A DEGRADAÇÃO DE CELULOSE”

“TRANSCRIPTIONAL ANALYSIS OF Trichoderma harzianum

CBMAI-0179 DURING CELLULOSE DEGRADATION”

Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestra em Genética e Biologia Molecular, na área de Genética de Microrganismos.

Dissertation presented to the Institute of Biology of the University of Campinas in partial fulfillment of the requirements for the degree of Master in Genetics and Molecular Biology, in the area of Genetics of Microorganisms.

CAMPINAS 2019 Orientador: Profa. Dra. Anete Pereira de Souza

ESTE ARQUIVO DIGITAL CORRESPONDE À VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELA ALUNA DÉBORAH AIRES ALMEIDA E ORIENTADA PELA PROFESSORA DOUTORA ANETE PEREIRA DE SOUZA.

(3)

Informações para Biblioteca Digital

Título em outro idioma: Transcriptional analysis of Trichoderma harzianum CBMAI-0179

during cellulose degradation

Palavras-chave em inglês: RNA-seq Secretome Cellulose Fungi Gene expression

Área de concentração: Genética de Microorganismos Titulação: Mestra em Genética e Biologia Molecular Banca examinadora:

Anete Pereira de Souza [Orientador] Marcelo Falsarella Carazzolle Adriano Rodrigues Azzoni

Data de defesa: 21-08-2019

Programa de Pós-Graduação: Genética e Biologia Molecular

Identificação e informações acadêmicas do(a) aluno(a)

- ORCID do autor: https://orcid.org/0000-0002-5095-5177 - Currículo Lattes do autor: http://lattes.cnpq.br/2325346260670233

Mara Janaina de Oliveira - CRB 8/6972

Almeida, Déborah Aires, 1992-

AL64a Alm Análise transcricional de Trichoderma harzianum CBMAI-0179 durante a degradação de celulose / Déborah Aires Almeida. – Campinas, SP : [s.n.], 2019.

Alm Orientador: Anete Pereira de Souza.

Alm Dissertação (mestrado) – Universidade Estadual de Campinas, Instituto de Biologia.

Alm1 . RNA-seq. 2. Secretoma. 3. Celulose. 4. Fungos. 5. Expressão gênica. I. Souza, Anete Pereira de, 1962-. II. Universidade Estadual de Campinas. Instituto de Biologia. III. Título.

(4)

COMISSÃO EXAMINADORA

Profa. Dra. Anete Pereira de Souza

Prof. Dr. Marcelo Falsarella Carazzolle

Prof. Dr. Adriano Rodrigues Azzoni

Os membros da Comissão Examinadora acima assinaram a Ata de Defesa, que se encontra no processo de vida acadêmica do aluno.

(5)

Dedico aos meus pais Henes e Ilda, ao meu irmão Gabriel e ao meu namorado Saquib, por todo apoio, força, incentivo e amor.

(6)

Primeiramente, agradeço a Deus por toda força e bênção recebida.

Agradeço à minha orientadora Profa. Dra. Anete Pereira de Souza por ter me recebido em seu grupo de pesquisa, por todos ensinamentos, por compartilhar conhecimentos, experiências e por toda ajuda e apoio recebido. Agradeço pela confiança depositada em mim e por me fazer acreditar que o término dessa jornada seria exitoso.

À Dra. Maria Augusta C. Horta por todo ensino, auxílio, motivação, conselho e pela grande contribuição no meu aprendizado. Ao Dr. Jaire Alves F. Filho por todo ensinamento, conselho e auxílio no meu projeto de pesquisa. À Dra. Carla Cristina da Silva, ao Dr. Américo José C. Viana e ao doutorando João Guilherme P. Vieira pelo auxílio nos experimentos.

A todos os colegas de trabalho do LAGM/CBMEG - Barracão, por me ajudarem em diversos momentos, especialmente à Maria Augusta, Jaire, Rafaela, Maria Lorenza, Clelton, Beatriz, Carla e Mariana. Obrigada pela amizade, discussões, sugestões e contribuições no meu trabalho.

Ao Luís, Thamiris, Juciara, Carla, Herminia e Jéssica pela amizade, conversas e momentos de descontração.

Aos técnicos do laboratório Danilo, Aline, Patrícia e Juverlandi por toda ajuda.

Aos meus pais, meu irmão e ao meu namorado por todo amor, paciência, apoio, força, incentivo, conselho e compreensão. Por estarem sempre presentes mesmo à distância em momentos alegres e extremamente difíceis da minha vida. Por todas as conversas e ensinamentos. Eles foram essenciais nessa minha caminhada.

Aos meus amigos de infância e faculdade Bruna, Karol, Stéfani, Carla e Sayron por todas conversas, momentos de alegria, descontração e apoio recebido.

(7)

O presente trabalho foi realizado com o apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001.

À CAPES (Programa de Excelência Acadêmica - PROEX) pela concessão da bolsa de estudos (Programa Biologia Computacional - 88882.160100/2017-01, 88887.336686/2019-00) e pelo auxílio na pesquisa.

À Fundação de Amparo a Pesquisa do Estado de São Paulo (FAPESP) pela bolsa de mestrado concedida (2017/17782-2) e suporte financeiro ao projeto (2015/09202-0).

(8)

“For I know the plans I have for you,” declares the LORD, “plans to prosper you

and not to harm you, plans to give you hope and a future.”

(9)

O Brasil é o maior produtor de cana-de-açúcar do mundo, a qual após ser processada gera uma grande quantidade de subprodutos, com destaque para o bagaço de cana que pode ser convertido em etanol de segunda geração. No entanto, um dos principais desafios para implementar essa tecnologia está na obtenção de enzimas eficientes para a hidrólise da biomassa vegetal. Diante desse cenário, os microrganismos saprófitos desempenham um papel importante por produzirem enzimas que degradam a parede celular vegetal, sendo dessa forma, alvos atrativos para aplicações em processos industriais biotecnológicos. Assim sendo, espécies do gênero ascomiceto filamentoso Trichoderma vêm sendo amplamente exploradas. T. harzianum é uma espécie comumente empregada como agente de biocontrole, contudo diversos estudos também demonstraram o seu potencial em produzir um conjunto de enzimas capazes de promover a degradação da biomassa vegetal de forma bastante eficaz e, portanto, tem sido investigada como uma valiosa fonte de enzimas hidrolíticas para uso industrial. Este trabalho teve por objetivo identificar e analisar por intermédio do sequenciamento de RNA (RNA-Seq) e do exoproteoma, o conjunto de genes relacionados à hidrólise da biomassa vegetal pelo fungo

T. harzianum CBMAI-0179, utilizando celulose cristalina e glicose como fonte de carbono. As

enzimas relacionadas à degradação de carboidratos são catalogadas em um banco de dados denominado CAZy (Carbohydrate-active enzymes). Foram identificados nessa linhagem, 219 genes diferencialmente expressos em celulose em relação a glicose e dentre esses, foram identificados 35 CAZymes, sendo 2 AAs (atividades auxiliares), 21 GHs (hidrolases glicosídicas), 1 GT (glicosil transferase), 2 CEs (carboidrato esterases) e 9 CBMs (módulos de ligação a carboidratos). As famílias CAZymes foram classificadas, quantificadas e com isso as principais famílias de celulases e hemicelulases foram analisadas com base no nível de expressão. Nessa análise dos dados do transcriptoma, foram encontradas 9 CAZymes diferencialmente expressas (GH1, GH3, GH5, GH6, GH7, GH45 e AA9) relacionadas à degradação de celulose e 1 CAZyme diferencialmente expressa (GH10) relacionada à degradação de hemicelulose, no qual esses dados foram comparados com outras espécies do mesmo gênero (T. harzianum IOC-3844 e T. atroviride CBMAI-0020). No exoproteoma foi identificado um total de 32 proteínas secretadas em celulose como β-glicosidases, endoglucanases, celobiohidrolase, monooxigenase lítica de polissacarídeo (LPMO), endo-1,4-β-xilanases e β-mannanase. Esses dados foram correlacionados com os dados do transcriptoma a fim de observar o nível de expressão dos genes que codificam essas proteínas. Dessa maneira,

(10)

agem sinergisticamente para degradação de celulose. Ademais, mediante anotação funcional foi possível identificar genes importantes relacionados à fatores de transcrição (TFs), transportadores da superfamília dos facilitadores majoritários (MFS) e transportadores ABC. Estes resultados demonstram o potencial de T. harzianum para bioprospecção de enzimas hidrolíticas eficientes com aplicação em coquetéis enzimáticos para produção de etanol de segunda geração.

(11)

Brazil is the leading producer of sugarcane in the world that after being processed it generates large quantities of by-products, principally sugarcane bagasse, which can be converted into second-generation ethanol. However, one of the main challenges is to obtain efficient enzymes for the hydrolysis of plant biomass. Saprotrophic microorganisms play an important role in producing plant cell wall-degrading enzymes being an attractive target for applications in industrial biotechnological processes. Thus, species in the filamentous ascomycete genus Trichoderma have been widely exploited. T. harzianum is a commonly employed species as a biocontrol agent but studies have also shown their potential in producing a set of enzymes capable of promoting the saccharification of plant biomass efficiently and are, therefore, being investigated as a valuable source of hydrolytic enzymes for industrial usage. This work aimed to identify and analyze, through RNA sequencing (RNA-Seq) and exoproteome, the set of genes related to the hydrolysis of plant biomass by T. harzianum CBMAI-0179 using crystalline cellulose and glucose as a carbon source. Enzymes related to carbohydrate degradation are classified according to the Carbohydrate-active enzymes (CAZy) database. We identified in this strain, 219 differentially expressed genes under cellulose condition in relation to glucose and among these, 35 CAZymes were identified including 2 AAs (auxiliary activities), 21 GHs (glycoside hydrolases), 1 GT (glycosyltransferase), 2 CEs (carbohydrate esterases) and 9 CBMs (carbohydrate-binding modules). CAZyme families were classified, quantified and the main families of cellulases and hemicellulases were analyzed based on the expression level of the genes. We found in the transcriptomic analysis, 9 differentially expressed CAZymes (GH1, GH3, GH5, GH6, GH7, GH45 and AA9) related to cellulose degradation and 1 differentially expressed CAZyme (GH10) related to hemicellulose degradation, in which the data was compared with other species of the same genus (T.

harzianum IOC-3844 and T. atroviride CBMAI-0020). In the exoproteome analysis, a total of

32 secreted proteins were detected in the cellulose aqueous extract such as β-glucosidases, endoglucanases, cellobiohydrolase, lytic polysaccharide monooxygenase (LPMO), endo-1,4-β-xylanases and β-mannanase. These data were correlated with the transcriptome analysis in order to observe the expression level of the genes that encoded the secreted proteins. Thus, co-expression networks were constructed from correlation data of the co-expression level of the genes where it was possible to explore the relationship among the genes with secreted proteins that act synergistically for cellulose degradation. In addition, through the functional annotation, we

(12)

results demonstrate the potential of T. harzianum for efficient hydrolytic enzymes bioprospection for application in enzymatic cocktails for second-generation ethanol production. Keywords: RNA-Seq, exoproteome, cellulose, fungi, co-expression networks.

(13)

Revisão Bibliográfica

Figura 1: Os principais componentes e a estrutura da lignocelulose ... 19 Figura 2: Visão geral de um processo de conversão bioquímica convencional para produção de bioetanol a partir da biomassa lignocelulósica... 20 Figura 3: Mecanismo de hidrólise de holocelulose em T. reesei ... 22 Figura 4: Fungos do gênero Trichoderma crescidos em meio sólido ... 25 Figura 5: Perfil da atividade enzimática de celulase (FPAse) em Trichoderma spp. utilizando o bagaço de cana explodido delignificado como substrato celulósico... 26 Figura 6: Pipeline para o desenvolvimento de redes de interação gênica... 28

Artigo

Figura 1: Semelhanças e diferenças entre os perfis transcricionais e a comparação de expressão gênica sob condição de crescimento em celulose em Trichoderma spp. ... 39 Figura 2: Distribuição das famílias CAZymes em Trichoderma spp. ... 40 Figura 3: Avaliação da expressão das famílias CAZymes em Trichoderma spp. por meio de RNA-Seq ... 42 Figura 4: Termos GO de T. harzianum CBMAI-0179 sob condição de crescimento em celulose ... 44 Figura 5: Redes de co-expressão de T. harzianum CBMAI-0179 ... 48

Material Suplementar

Figura S1: Perfil da atividade enzimática de β-glicosidase, celulases e xilanases e de proteínas totais em Trichoderma spp. após 96 h de crescimento...62 Figura S2: Comparação dos dados de RT-qPCR com os dados de RNA-Seq para validação da análise de transcriptoma de Trichoderma spp. ...63 Figura S3: Diagramas de Venn dos genes identificados em Trichoderma spp. com expressão maior que zero nas duas condições de crescimento ... 63

(14)

1 INTRODUÇÃO GERAL ... 15

2 REVISÃO BIBLIOGRÁFICA ... 17

2.1 Produção de etanol de segunda geração ... 17

2.2 Hidrólise enzimática ... 20

2.3 Produção de enzimas hidrolíticas por fungos filamentosos ... 22

2.4 O gênero Trichoderma ... 24

2.5 Estudo do transcriptoma através da tecnologia de sequenciamento de nova geração RNA-Seq... 26 2.6 Redes de co-expressão ... 27 3 OBJETIVOS ... 29 3.1 Objetivo Geral ... 29 3.2 Objetivos Específicos... 29 4 ARTIGO ... 30

“Synergistic action of hydrolytic genes in co-expression networks reveals the potential of Trichoderma harzianum for cellulose degradation” ... 30

Material Suplementar ... 62

5 CONCLUSÕES GERAIS ... 64

6 PERSPECTIVAS ... 65

7 REFERÊNCIAS BIBLIOGRÁFICAS ... 66

ANEXO I - DECLARAÇÃO CIBio ... 74

(15)

1 INTRODUÇÃO GERAL

O Brasil se destaca por abrigar uma das maiores reservas de biodiversidade do mundo, a floresta Amazônica, que abrange vários micro ecossistemas e condições climáticas ideais para o crescimento de microrganismos saprófitos, muitos dos quais são de grande relevância biotecnológica (Souza et al., 2018; Valencia & Chambergo, 2013). Neste cenário, os fungos filamentosos, que demonstram grande diversidade genética e metabólica, alta capacidade de produção e secreção de enzimas e por serem no geral microrganismos não patogênicos vêm sendo amplamente explorados. Esses microrganismos também se destacam por produzirem substâncias bioativas e metabólitos como antibióticos e ácidos orgânicos, além de produzirem enzimas ativas em carboidratos que desempenham papel fundamental na decomposição da biomassa vegetal sendo, dessa forma, alvos atrativos para aplicações em processos industriais biotecnológicos (de Oliveira & de Graaff, 2011; Krull et al., 2013; Stroparo et al., 2012).

Trichoderma é o gênero de fungo ascomiceto filamentoso mais comumente isolado

dentre os fungos saprófitos com destaque para Trichoderma harzianum, uma espécie de grande importância biotecnológica (Ahmed et al., 2017; Horta et al., 2018; Qualhato et al., 2013), o qual é empregada como agente de biocontrole devido a sua habilidade antagonista a fungos fitopatogênicos como Rhizoctonia solani, Sclerotinia sclerotiorum e Botrytis cinerea em virtude de múltiplos mecanismos de ação, tais como: micoparasitismo, antibiose e competição por espaço e nutrientes (Deng et al., 2018; Hernández-Melchor et al., 2019). Além disso, é frequentemente encontrado no solo e crescendo sob diversos tipos de habitats e substratos como casca de árvore, matéria vegetal, madeira em decomposição e diferentes tipos de biomassa, secretando enzimas hidrolíticas que promovem a degradação dos polissacarídeos da parede celular vegetal (Delabona et al., 2012; Horta et al., 2018; Sharma et al., 2017).

A seleção, produção e otimização de enzimas hidrolíticas tem por objetivo aprimorar a tecnologia de hidrólise enzimática, a qual é uma das etapas mais importantes do processo de produção de etanol de segunda geração. Uma vez que o custo elevado está relacionado às enzimas, a busca por enzimas mais eficientes para a hidrólise da biomassa lignocelulósica é o atual foco das biorrefinarias. Devido a isso, grandes esforços têm sido dedicados à melhoria dos coquetéis enzimáticos de forma a aprimorar as misturas enzimáticas para a conversão de substratos lignocelulósicos específicos, uma vez que cada substrato possui características particulares e exige condições distintas para sua completa hidrólise (Lopes et al., 2018).

Nesse contexto, estudos anteriores desenvolvidos pelo presente grupo de pesquisa foram realizados com diferentes espécies de Trichoderma, como o primeiro transcriptoma da

(16)

linhagem de T. harzianum IOC-3844 durante o crescimento em bagaço de cana (Horta et al., 2014). Outros estudos envolveram a construção da primeira biblioteca genômica de BACs (Bacterial Artificial Chromossome) para T. harzianum IOC-3844 (Crucello et al., 2015), a caracterização estrutural e bioquímica de uma proteína recombinante, uma GH1 β-glicosidase (Santos et al., 2016), a produção de uma suolenina recombinante (Santos et al., 2017) e uma GH1 β-glicosidase modificada para a melhoria de suas propriedades funcionais frente aos altos níveis de glicose (Santos et al., 2019). Além disso, foi feito um estudo aprofundado no conteúdo de CAZymes em Trichoderma spp. (Ferreira Filho et al., 2017) e a construção de redes de co-expressão de três espécies do gênero Trichoderma em condições de degradação da biomassa (Horta et al., 2018).

Dando continuidade na investigação de potenciais espécies do gênero Trichoderma, o estudo da expressão dos genes envolvidos na hidrólise de celulose e hemicelulose pela linhagem de T. harzianum CBMAI-0179 pode ser realizado por meio da técnica de sequenciamento de RNA (RNA-Seq), uma metodologia que utiliza o sequenciamento de nova geração na análise de transcriptomas (Lorito et al., 2010; Steindorff et al., 2014).

Através da análise transcricional, é possível determinar o conjunto de enzimas ativas em carboidratos, as quais são definidas na literatura internacional como “Carbohydrate-active

enzymes – CAZymes”. As famílias de proteínas que compõem esse amplo conjunto podem ser

encontradas no banco de dados CAZy (www.cazy.org), no qual são agrupadas em seis diferentes classes de acordo com a função que desempenham: hidrolases glicosídicas (GHs), glicosil transferases (GTs), polissacarídeo liases (PLs), carboidrato esterases (CEs), atividades auxiliares (AAs) e módulos de ligação a carboidratos (CBMs) (Lombard et al., 2014). Dentre essas classes, as GHs são as mais numerosas do banco CAZy e são enzimas chave na hidrólise de carboidratos, posto que algumas têm a capacidade de clivar ligações glicosídicas entre as moléculas de glicose. E, T. harzianum possui um conteúdo bastante amplo relacionado às essas enzimas (Ferreira Filho et al., 2017).

Em virtude disso, por T. harzianum ser uma espécie promissora que expressa e secreta uma série de enzimas capazes de promover eficientemente a degradação da biomassa celulósica espera-se determinar o perfil de expressão dos principais genes relacionados à hidrólise da biomassa vegetal pelo fungo T. harzianum CBMAI-0179, além de analisar redes de co-expressão e as proteínas secretadas por essa linhagem sob condições de crescimento em celulose. Essa informação poderá ser utilizada para bioprospecção de novas enzimas, no aprimoramento das tecnologias de produção heteróloga de enzimas hidrolíticas com elevada capacidade degradativa para aplicações industriais na produção de bioetanol.

(17)

2 REVISÃO BIBLIOGRÁFICA

2.1 Produção de etanol de segunda geração

A combinação de crescimento populacional com o desenvolvimento socioeconômico dos países contribui para o aumento da demanda de energia, e a partir desta situação, há uma intensa busca pela autossustentabilidade energética (Teixeira et al., 2016; Tolmasquim et al., 2007). Há muitos anos vem-se utilizando os combustíveis fósseis (petróleo, carvão mineral e gás natural) como a principal fonte de energia. Porém, devido ao aumento do preço de combustíveis derivados do petróleo, ao impacto causado no meio ambiente com emissões de gases do efeito estufa, poluição, mudança climática global e ao aumento dos riscos à saúde fazem com que a necessidade de sua substituição por fontes de energia renováveis, sustentáveis, eficientes, econômicas e com baixa emissão de gases poluentes, seja de extrema urgência (Koroneos et al., 2003; Panwar et al., 2011; Teixeira et al., 2016). As fontes de energia renováveis são consideradas limpas e inesgotáveis, no qual incluem a energia hidrelétrica, solar, eólica, geotermal, das ondas e marés e da biomassa (Owusu & Asumadu-Sarkodie, 2016).

O Brasil é o maior produtor mundial de cana-de-açúcar (Saccharum spp.), seguido pela Índia e China (Singh & Tiwari, 2018). As safras brasileiras correspondem a mais de 620 milhões de toneladas por ano. Dentre os estados brasileiros, sobressai o estado de São Paulo, que teve uma produção na safra referente à 2018/2019 de aproximadamente 333 milhões de toneladas de cana-de-açúcar, o que corresponde a 53,7% do total produzido no país (Scheiterle et al., 2018; UNICA, 2018/2019).

Diante desse cenário, visto que o Brasil é o maior produtor de cana-de-açúcar uma grande quantidade de subprodutos são gerados, destacando-se o bagaço de cana. É estimado que através do processamento industrial de 1 tonelada de cana, uma média de 280 kg de bagaço são gerados, e apesar de ser geralmente queimado nas indústrias para produção de energia, há um grande potencial para a sua utilização na produção de etanol de segunda geração (conhecido também como etanol 2G, bioetanol ou etanol celulósico) (Chandel et al., 2012; Ferreira et al., 2018; Sun et al., 2004).

Biomassas lignocelulósicas como bagaço de cana, palha de milho, palha de arroz e de trigo constituem o material orgânico mais abundante, acessível e bio renovável do planeta, sendo de grande interesse para a produção de etanol de segunda geração, pois além dessas matérias-primas lignocelulósicas não serem a parte comestível da planta, no qual não interferem

(18)

no suprimento de alimentos, estas podem diminuir a poluição atmosférica por meio da redução das emissões de gases do efeito estufa (Isikgor & Becer, 2015; Saini et al., 2015).

A biomassa lignocelulósica é composta principalmente por três polímeros: celulose, hemicelulose e lignina (Figura 1), além de pequenas quantidades de outros componentes como pectina, minerais e grupos acetila (Isikgor & Becer, 2015; Mellinger-Silva et al., 2011; Ribeiro et al., 2016; Sorek et al., 2014).

A composição química da biomassa é bastante variável entre as espécies ou até mesmo na mesma espécie vegetal, variando de acordo com o tecido, com a maturidade da parede celular da planta e de acordo com as condições ambientais de crescimento. Geralmente, a biomassa lignocelulósica consiste de 35-50% de celulose, 20-35% de hemicelulose e 10-25% de lignina; os outros componentes compõem a fração restante (Isikgor & Becer, 2015; Saini et al., 2015; Sorek et al., 2014).

A celulose, um homopolissacarídeo linear e o principal componente estrutural da parede celular da planta é constituído por monômeros de glicose conectados por ligações β-1,4-glicosídicas formando uma estrutura cristalina, sendo a celobiose a menor unidade repetitiva. Associada a celulose, tem-se a hemicelulose, o segundo polímero mais abundante. Ao contrário da celulose, a hemicelulose é um heteropolissacarídeo de estrutura amorfa composta por várias unidades de monossacarídeos de 5 e 6 carbonos incluindo xilana, arabinoxilano, glucoronoxilano, galactomanano, glucomanano e xiloglucano. Ademais, a hemicelulose tem o papel de unir quimicamente a celulose e a lignina (Isikgor & Becer, 2015; Saini et al., 2015; Salgaonkar & Bragança, 2017).

Assim, esta microestrutura (celulose e hemicelulose) é coberta pela lignina que é um polímero aromático, amorfo, heterogêneo, de estrutura tridimensional derivado de unidades fenilpropanoides (p-hidroxifenil (H), guaiacil (G) e siringil (S)) em diferentes proporções, no qual depende da sua origem. Este componente proporciona rigidez à parede celular e resistência à insetos e patógenos (Isikgor & Becer, 2015; Saini et al., 2015; Salgaonkar & Bragança, 2017). Devido à presença de lignina, ao grau de polimerização dos polissacarídeos, ao grau de cristalinidade da celulose, a área superficial disponível e ao teor de umidade fazem com que a biomassa lignocelulósica seja altamente resistente a degradação, ou seja, esses fatores tornam a matriz de celulose-hemicelulose-lignina altamente recalcitrante (Manavalan et al., 2015).

(19)

Figura 1 – Os principais componentes e a estrutura da lignocelulose (Isikgor & Becer, 2015).

Deste modo, para a realização do processo de produção de bioetanol a partir da biomassa lignocelulósica são necessários três passos principais: o pré-tratamento, a hidrólise e a fermentação (Figura 2) (Maitan-Alfenas et al., 2015).

O pré-tratamento é realizado para a quebra da parede celular vegetal alterando sua estrutura e composição química para facilitar o acesso rápido e eficiente das enzimas. Entre os métodos utilizados no pré-tratamento da biomassa lignocelulósica compreendem métodos físicos, químicos, físico-químicos e biológicos. Posteriormente, tem-se a hidrólise, que converte os polissacarídeos em açúcares simples podendo ser feita através da hidrólise enzimática ou química. Quando comparadas, a hidrólise enzimática se torna mais vantajosa por requerer menos energia, custos de manutenção mais baixos, podendo fornecer um alto rendimento (Meng & Ragauskas, 2014).

(20)

Todavia, essa é uma das etapas mais dispendiosas do processo e uma etapa crítica na produção de bioetanol sendo assim o atual foco das pesquisas em biotecnologia, onde grandes esforços têm sido dedicados à melhoria de coquetéis enzimáticos. Seja pela busca por novas enzimas ou pela engenharia das enzimas existentes, o interesse está no aprimoramento de misturas enzimáticas para substratos lignocelulósicos específicos (Lopes et al., 2018).

Uma vez que o custo relativamente alto de enzimas necessárias para a hidrólise dos polissacarídeos das plantas é um dos principais gargalos para a indústria de bioetanol, a seleção de coquetéis enzimáticos apropriados é de fundamental importância para poder maximizar o rendimento geral dos açúcares fermentescíveis (Chundawat et al., 2017). Assim, as etapas de pré-tratamento e hidrólise são consideradas como as principais barreiras que impedem a ampla conversão industrial da biomassa lignocelulósica em bioetanol (Meng & Ragauskas, 2014).

Por fim, tem-se a terceira etapa, que é a fermentação, onde os monossacarídeos glicose, manose e galactose (hexoses), xilose e arabinose (pentoses) provenientes do processo de hidrólise são fermentados por vários microrganismos produzindo o bioetanol ou produtos químicos (Maitan-Alfenas et al., 2015; Saini et al., 2015; Teixeira et al., 2016).

Figura 2 – Visão geral de um processo de conversão bioquímica convencional para produção de bioetanol a partir da biomassa lignocelulósica (Payne et al., 2015).

(21)

Uma das principais limitações da conversão da biomassa lignocelulósica em açúcares simples está na desconstrução enzimática da lignocelulose que por ser bastante complexa devido a numerosas características estruturais como a sua composição química, a cristalinidade da celulose, ao grau de lignificação e a estrutura física da parede celular, a tornam muito recalcitrante (Maitan-Alfenas et al., 2015; Sindhu et al., 2016; Zhao et al., 2012).

Dessa forma, a hidrólise enzimática pode ser influenciada não só pela eficácia das enzimas, mas também pelas características físicas, químicas e morfológicas dos materiais lignocelulósicos. Parâmetros relacionados à enzima e ao susbstrato são os principais fatores que afetam essa hidrólise. Em relação a enzima, os esforços se concentram principalmente em melhorar parâmetros como atividade enzimática, inibição do produto final, estabilidade térmica, sinergismo e adsorção. Em relação ao substrato, estão concentrados principalmente na melhoria da acessibilidade das enzimas às cadeias de celulose (Sun et al., 2016).

Em virtude da estrutura recalcitrante, a completa degradação da parede celular vegetal requer a ação coordenada de uma ampla gama de enzimas com especificidades variadas agindo sinergísticamente (Figura 3). Para uma completa degradação da celulose é necessário a ação sinérgica de três classes enzimáticas: endo-β-1,4-glucanases (EC 3.2.1.4), celobiohidrolases (EC 3.2.1.91/176), e β-glicosidases (EC 3.2.1.21). Enquanto que para a degradação da hemicelulose requer-se um grupo mais complexo de enzimas, como: endo-1,4-β-xilanases (EC 3.2.1.8), β-xilosidases (EC 3.2.1.37), β- mananases (EC 3.2.1.78), arabinofuranosidases (EC 3.2.1.55), acetil-xilano esterases (EC 3.1.1.72), feruloil esterases (EC 3.1.1.73), α-glucuronidases (EC 3.2.1.139), entre outras (Maitan-Alfenas et al., 2015; Ribeiro et al., 2016).

Já para a degradação da lignina incluem-se as enzimas lignolíticas lacase (Lac) (EC 1.10.3.2), manganês peroxidase (MnP) (EC 1.11.1.13), lignina peroxidase (LiP) (EC 1.11.1.14) e peroxidase versátil (VP) (EC 1.11.1.16) (Manavalan et al., 2015). Além dessas, proteínas auxiliares como lytic polysaccharide monooxygenases (LPMOs), proteína induzida por celulose 1 e 2 (CIP1 e CIP2) e suoleninas também são consideradas essenciais em coquetéis enzimáticos por facilitar a liberação de açúcares e consequentemente aumentar o rendimento durante a degradação da biomassa (Bischof et al., 2016; Silveira et al., 2014).

Adicionalmente, módulos de ligação a carboidratos (CBMs), conectados ao domínio catalítico de proteínas por um peptídeo ligante, possuem um papel importante de se ligar aos polissacarídeos, aumentando assim a concentração enzimática e a atividade enzimática sobre o substrato insolúvel. Como exemplo, tem-se o módulo de ligação a carboidratos da família 1 (CBM1) que é encontrado principalmente em celulases e xilanases fúngicas (Martinez et al., 2015).

(22)

Figura 3 – Mecanismo de hidrólise de holocelulose em T. reesei. Estrutura esquemática da biomassa lignocelulósica, sendo constituída por lignina e holocelulose (a). As enzimas que atacam a hemicelulose agem em sinergia para hidrolisá-la eficientemente e promover uma área de superfície mais acessível à celulose para potencializar as atividades de celulases (b). Degradação enzimática da celulose incluindo SWO que expande a cadeia celulolítica para melhorar a acessibilidade da celulase a ela, e a AA9 que funciona através do metabolismo oxidativo dependente de íon metálico bivalente (c) (de Paula et al., 2018).

2.3 Produção de enzimas hidrolíticas por fungos filamentosos

Vários microrganismos, incluindo fungos e bactérias, evoluíram ao longo do tempo tornando-se capazes de produzir uma grande quantidade de enzimas hidrolíticas que degradam a biomassa vegetal. No entanto, apenas alguns grupos de fungos são capazes de degradar eficientemente a biomassa lignocelulósica (Chulalaksananukul, 2014; Daniel, 2016; Manavalan et al., 2015).

Essa eficácia dos fungos em degradar materiais lignocelulósicos é devido ao seu sistema enzimático extracelular altamente eficiente, sendo classificados em dois tipos: o primeiro que consiste em um sistema hidrolítico no qual produzem hidrolases responsáveis pela degradação

(23)

dos polissacarídeos e o segundo, que consiste em um sistema lignolítico extracelular único e oxidativo que degrada a lignina e abre os anéis fenólicos (Sánchez, 2009).

Assim, os grupos de fungos capazes de degradar a biomassa lignocelulósica compreendem: fungos da podridão branca (Phanerochaete chrysosporium, Trametes versicolor e Pycnoporus cinnabarinus), podridão parda (Gloeophyllum trabeum e Coniophora puteana) e podridão mole (Aspergillus, Penicillium e Trichoderma spp.) (Daniel, 2016). Dentre esses, sobressaem os fungos ascomicetos T. reesei e A. niger que devido a sua eficiência na produção e na secreção de uma ampla gama de celulases e hemicelulases, têm suas enzimas usadas em coquetéis enzimáticos comerciais (Borin et al., 2015).

Em vista disso, as enzimas utilizadas nas indústrias para produção de biocombustíveis são quase inteiramente de origem fúngica possuindo características específicas para que possam ser aplicadas em escala industrial (Kubicek & Kubicek, 2016). Segundo os dados da Embrapa (2014), a decomposição da celulose em glicose exige coquetéis enzimáticos com cerca de 20 celulases diferentes, cuja interação entre si é determinante para a viabilidade do processo.

Deste modo, diversos secretomas microbianos têm sido utilizados buscando entender a ação sinérgica das enzimas secretadas para maximizar o rendimento total da hidrólise e assim otimizar os coquetéis enzimáticos. Esta é uma abordagem bastante considerada uma vez que a ação combinada de um conjunto de enzimas com diferentes especificidades, permite que uma enzima atue sobre o produto de outra enzima (Chundawat et al., 2017).

Além disso, num coquetel enzimático, é possível complementar com uma enzima individual para satisfazer os requisitos de um determinado substrato. Como diferentes interações podem ocorrer entre enzimas e substratos, e inibidores enzimáticos específicos podem ser gerados durante o processo de hidrólise, estudos sobre mecanismos de ação enzimáticos são necessários. A otimização de coquetéis enzimáticos é essencial para o aumento da conversão de lignocelulose em açúcares fermentescíveis, uma vez que cada substrato possui características particulares e exige condições distintas para sua completa degradação (Lopes et al., 2018).

Entre as empresas líderes na produção de coquetéis enzimáticos com concentração ótima para a utilização industrial destacam-se: Novozymes, Genencor, DSM, Biocatalysts e DuPont (Chundawat et al., 2017).

Com base nisso, vários projetos de pesquisa no Brasil estão voltados para a viabilização do processo de hidrólise enzimática em materiais lignocelulósicos como o bagaço de cana, buscando a bioprospecção de novas enzimas que sejam altamente eficientes para serem utilizadas nas biorrefinarias a fim de tornar esse processo economicamente rentável.

(24)

2.4 O gênero Trichoderma

Trichoderma é o gênero de fungo ascomiceto filamentoso mais comumente isolado

dentre os fungos saprófitos (Horta et al., 2018) (Figura 4). São frequentemente encontrados no solo, em casca de árvores, madeira em decomposição e em diversos outros substratos, demonstrando seu alto potencial oportunista e sua adaptabilidade a diversas condições ecológicas (Druzhinina et al., 2011). Espécies do gênero Trichoderma possuem uma grande importância biotecnológica sendo empregados tanto como agente de biocontrole (biofungicidas) (Mukherjee et al., 2014; Qualhato et al., 2013) como em coquetéis enzimáticos na produção de etanol de segunda geração (Schuster & Schmoll, 2010).

T. reesei é o fungo mais bem estudado dentro desse gênero, conhecido pela alta

capacidade de produzir e secretar enzimas celulolíticas e hemicelulolíticas, sendo amplamente utilizado na indústria na conversão da biomassa lignocelulósica em bioetanol (de Paula et al., 2018). Foi originalmente isolado das Ilhas Salomão durante a Segunda Guerra Mundial, nomeado como T. reesei QM6a. Mediante uma série de experimentos de mutagênese induzida dessa linhagem, originou-se a linhagem hipercelulolítica, conhecida como T. reesei RUT-C30 (Bischof et al., 2016; Borin et al., 2017; Peterson & Nevalainen, 2012). A maquinaria celulolítica de T. reesei é composta por duas celobiohidrolases (CBHs) (Cel7A e Cel6A), cinco endoglucanases (Cel7B, Cel5A, Cel12A, Cel61A e Cel45A), e duas β-glicosidases (BGLI e BGLII), além de inúmeras hemicelulases incluindo xilanases, mananases e galactosidases (Silva et al., 2012).

T. atroviride e T. harzianum são espécies amplamente utilizadas como agentes de

biocontrole devido suas habilidades antagônicas a fungos fitopatogênicos por micoparasitismo, antibiose e competição por espaço e nutrientes (Guzmán-Guzmán et al., 2017; Qualhato et al., 2013; Rubio et al., 2017). Além disso, estudos demonstram o potencial principalmente de T.

harzianum em expressar e secretar uma série de enzimas hidrolíticas que promovem a

degradação dos polissacarídeos da parede celular vegetal de modo bastante eficiente (Delabona et al., 2012; Ferreira Filho et al., 2017; Silva et al., 2012).

Horta et al. (2014), publicou o primeiro transcriptoma de T. harzianum IOC-3844 em diferentes condições (bagaço, celulose e lactose) analisando o potencial desse fungo para degradação da biomassa vegetal. Além do mais, outros trabalhos têm sido realizados com linhagens de T. harzianum mostrando o potencial dessa espécie na produção de enzimas hidrolíticas (A. L. Rocha et al., 2016; Benoliel et al., 2013; Souza et al., 2018).

(25)

T. harzianum CBMAI-0179 é uma linhagem pública, depositada na Coleção Brasileira

de Micro-organismos de Ambiente e Indústria - CBMAI, CPQBA/UNICAMP, em Campinas, em que em estudos prévios apresentou uma alta atividade enzimática de celulase (FPAse) quando comparado com T. reesei (T. reesei QM6a) e com outras linhagens de T. harzianum (Crucello, 2014) (Figura 5), razão pela qual foi escolhida para uma melhor compreensão do conjunto de enzimas hidróliticas produzidas por esse fungo em condição de degradação da biomassa vegetal, sendo esse o primeiro trabalho biotecnológico envolvendo diferentes abordagens com essa linhagem.

Através do gráfico do perfil da atividade enzimática de celulase abaixo utilizando o bagaço de cana explodido delignificado como substrato celulósico, observamos que as duas linhagens de T. harzianum (IOC-3844 e CBMAI-0179) apresentaram uma atividade de celulase elevada e semelhante a T. reesei (TrQM6a) em um tempo de fermentação entre 72 e 96 horas (3 a 4 dias), motivo pela qual foram escolhidas, com o interesse de fazer uma comparação entre linhagens da mesma espécie. Enquanto que T. atroviride (CBMAI-0020), foi utilizado nesse estudo como um controle negativo do nosso experimento, pois como observado no gráfico de FPAse (Figura 5) ele não apresenta atividade de celulase como as outras linhagens, não sendo eficiente para a degradação de celulose quando comparado com T. harzianum.

Foto: Dra. Maria Augusta C. Horta Figura 4 – Fungos do gênero Trichoderma crescidos em meio sólido.

(26)

Figura 5 – Perfil da atividade enzimática de celulase (FPAse) das diferentes linhagens de T.

harzianum (CBMAI-0010, CBMAI-0084, CBMAI-0099, CBMAI-0178, CBMAI-0179,

CBMAI-0180, CBMAI-0844, IOC-3844) comparadas com T. reesei (TrQM6a) e T. atroviride (CBMAI-0020) utilizando o bagaço de cana explodido delignificado como substrato celulósico (Crucello, 2014).

2.5 Estudo do transcriptoma através da tecnologia de sequenciamento de nova geração RNA-Seq

O transcriptoma é o conjunto completo de transcritos (RNAs) em uma célula, e sua quantidade, para um estágio de desenvolvimento específico ou condição fisiológica. Compreender o transcriptoma é essencial para a interpretação dos elementos funcionais do genoma e revelar os constituintes moleculares das células e tecidos nos diferentes estágios de desenvolvimento. Os principais objetivos das análises transcriptômicas são: catalogar todas as espécies de transcritos (mRNAs, non-coding RNAs, small RNAs); determinar a estrutura transcricional dos genes em termos de seus locais de início, padrões de splicing alternativo e outras modificações pós-transcricionais; e quantificar as mudanças nos níveis de expressão de cada transcrito durante o desenvolvimento e sob diferentes condições (Wang et al., 2009).

Várias tecnologias foram desenvolvidas para análises de transcriptoma e o sequenciamento de RNA (RNA-Seq) que é o uso da tecnologia de sequenciamento de nova

(27)

geração (NGS), tem se tornado um método rotineiro, além de ser uma abordagem poderosa para avaliar mudanças na expressão gênica durante certos processos biológicos (Gao et al., 2018).

É amplamente utilizada para análises do perfil transcricional de eucariotos por ter se mostrado vantajosa em vários aspectos, como: 1) altamente preciso na quantificação do nível de expressão; 2) consegue identificar genes com baixos ou elevados níveis de expressão; 3) promove mais informações para identificar expressão alelo-específica; 4) revela novos promotores e isoformas; 5) oferece maior rendimento e menos ruído; 6) requer uma menor quantidade de RNA; 7) custo relativamente baixo quando comparado com outros métodos (Gao et al., 2018; Wang et al., 2009).

Contribuindo com os avanços nessa área, foi analisado através de RNA-Seq o transcriptoma do fungo T. harzianum CBMAI-0179, sendo essa a primeira análise genética envolvendo essa linhagem de T. harzianum sob duas condições diferentes de crescimento, celulose e glicose, a fim de investigar o seu potencial na produção de enzimas degradadoras da parede celular vegetal (celulose e hemicelulose) e os níveis de expressão dos genes (CAZymes) relacionados às essas enzimas.

2.6 Redes de co-expressão

Com a tecnologia de sequencimento de nova geração high-throughput, uma grande quantidade de dados ômicos (transcriptômica, proteômica) são gerados, porém um dos desafios está em como extrair informações significativas desses dados. Uma direção é utilizar abordagens de bioinformática para explorar os dados biológicos, como os dados de expressão gênica. Métodos de análise foram desenvolvidos com o propósito de inferir as interações regulatórias a partir de dados transcriptômicos, uma vez que as interações entre os genes possuem correlação na regulação da expressão gênica (Khosravi et al., 2015).

Nesse contexto, com a crescente necessidade de desenvolver plataformas para integrar esses dados e derivar modelos descrevendo interações biológicas, as redes de interação gênica se tornaram uma abordagem atraente para gerenciar, exibir e contextualizar esses grandes conjuntos de dados, com objetivo de obter um nível de sistema e compreensão molecular dos principais processos biológicos (Serin et al., 2016).

Deste modo, através dos dados transcriptômicos, a biologia de sistemas pôde aplicar a teoria dos grafos para o desenvolvimento de redes de interação gênica (Figura 6). Graficamente, as redes são representadas como um conjunto de componentes (nós) e interações representadas por links (arestas) conectando pares de nós. Neste caso, os nós representam os genes e as arestas

(28)

representam as conexões entre esses genes através dos dados de co-expressão entre os genes. Essas redes de interação são construídas a partir de correlações de covariância gene-gene, utilizando medidas como o coeficiente de correlação de Pearson. Genes apresentando padrões de expressão similares são designados com uma interação entre eles, o que permite visualizar os padrões de correlação entre os genes estudados (Azevedo et al., 2015; Serin et al., 2016).

Genes que compartilham a mesma função ou que estão envolvidos na mesma via de regulação tendem a apresentar perfis de expressão semelhantes e, portanto, formam clusters ou módulos na rede. Assim, dentro do mesmo módulo, genes de função conhecida podem ser usados para prever a função de genes desconhecidos co-expressos (Serin et al., 2016).

E, nós com maior centralidade, apresentam maior relevância na manutenção da estrutura da rede, e consequentemente maior relevância biológica sendo alvo atrativo para diversos estudos (Azevedo et al., 2015). Assim, foram criadas redes de interação gênica para T.

harzianum CBMAI-0179 em condições de degradação de celulose, que nos forneceram um

esquema gráfico para o estudo da co-expressão e das relações sinérgicas de genes relacionados à degradação de carboidratos.

Figura 6 – Pipeline para o desenvolvimento de redes de interação gênica (Adaptado de Azevedo et al., 2015).

(29)

3 OBJETIVOS

3.1 Objetivo Geral

Analisar o perfil transcricional relacionado à degradação de celulose pelo fungo T.

harzianum CBMAI-0179 com ênfase nos genes CAZymes e comparar com outros fungos do

mesmo gênero (T. harzianum IOC-3844 e T. atroviride CBMAI-0020).

3.2 Objetivos Específicos

 Utilizar o genoma público de T. harzianum T6776 como referência para o alinhamento de reads do RNA-Seq de T. harzianum CBMAI-0179;

 Determinar os genes que estão diferencialmente expressos nas condições de estudo (Celufloc e glicose) no transcriptoma das espécies;

 Identificar os genes CAZymes diferencialmente expressos por T. harzianum CBMAI-0179 obtidos por dados de RNA-Seq, realizar anotação e comparar com outras espécies do gênero Trichoderma (T. harzianum IOC-3844 e T. atroviride CBMAI-0020);

 Utilizar e correlacionar o exoproteoma com o perfil de transcrição de T. harzianum CBMAI-0179;

 Construir rede de co-expressão para T. harzianum CBMAI-0179 identificando genes diferencialmente expressos nas condições de celulose e glicose, as respectivas CAZymes, bem como os genes que codificam as proteínas secretadas no meio;

 Selecionar os genes diferencialmente expressos e, validar a metodologia da análise in

(30)

4 ARTIGO

“Synergistic action of hydrolytic genes in co-expression networks reveals the potential of Trichoderma harzianum for cellulose degradation”

Déborah Aires Almeida1,2, Maria Augusta Crivelente Horta1,3, Jaire Alves Ferreira Filho1,2, Natália Faraj Murad1 and Anete Pereira de Souza1,4,*

1Center for Molecular Biology and Genetic Engineering (CBMEG), University of Campinas (UNICAMP), Campinas, SP, Brazil

2Graduate Program in Genetics and Molecular Biology, Institute of Biology, UNICAMP, Campinas, SP, Brazil

3Holzforshung München, TUM School of Life Sciences Weihenstephan, Technische Universität München, Freising, Germany

4Department of Plant Biology, Institute of Biology, UNICAMP, Campinas, SP, Brazil

*Corresponding author Profa Anete Pereira de Souza Dept. de Biologia Vegetal

Universidade Estadual de Campinas CEP 13083-875

Campinas, São Paulo, Brazil Tel.: +55-19-3521-1132 E-mail:anete@unicamp.br

(31)

Abstract

Background: Bioprospecting key genes and proteins related to plant biomass degradation is an attractive approach for the identification of target genes for biotechnological purposes, especially genes with potential applications in the biorefinery industry that can enhance second-generation ethanol production technology. Trichoderma harzianum is a potential candidate for cellulolytic and hemicellulolytic enzyme production. Herein, the transcriptome, exoproteome and co-expression networks of the strain T. harzianum CBMAI-0179 under biomass degradation conditions were examined.

Results: We used RNA-Seq to identify differentially expressed genes (DEGs) and carbohydrate-active enzyme (CAZyme) genes related to cellulose and hemicellulose degradation and compared them with genes of other species of the same genus (T. harzianum IOC-3844 and T. atroviride CBMAI-0020). T. harzianum CBMAI-0179 harbors species- and treatment-specific CAZyme genes, transporters and transcription factors. Additionally, we detected important proteins related to biomass degradation, including β-glucosidases, endoglucanases, cellobiohydrolases, lytic polysaccharide monooxygenases (LPMOs), endo-1,4-β-xylanases and β-mannanases, in the exoproteome under cellulose growth conditions. Co-expression networks were constructed to explore the relationships among the genes with corresponding secreted proteins that act synergistically for cellulose degradation. An enriched cluster with degradative enzymes was described, and the subnetwork of CAZymes shows near correlation among secreted proteins (AA9, GH6, GH10, GH11 and CBM1) and differentially expressed CAZyme genes (GH45, GH7, AA7 and GH1).

Conclusions: Our results provide valuable information for future studies on the genetic regulation of plant cell wall-degrading enzymes. This knowledge can be exploited for the improvement of enzymatic reactions to degrade plant biomass, which is useful for bioethanol production.

Keywords: Trichoderma harzianum, Cellulose, RNA-Seq, CAZymes, Exoproteome, Co-expression networks

(32)

Background

The expanding worldwide demand for renewable and sustainable energy sources has increased the interest in alternative energy sources, and the production of second-generation biofuels seems to be the most viable option to confront these issues [1, 2]. Lignocellulosic biomass is the most abundant renewable organic carbon resource on earth, consisting of three major polymers, cellulose, hemicellulose, and lignin [2]. However, due to its recalcitrant characteristics that prevent enzyme access, degrading this complex matrix is still a major challenge [3]. For the complete hydrolysis of lignocellulose, a variety of enzymes acting in synergy are required, which has become the focus of research in recent decades [4]. For efficient biomass degradation, interactions between different enzymes have been investigated to design optimal combinations and ratios of enzymes, which are highly dependent on the properties of the lignocellulosic substrates and the surface structure of cellulose microfibrils [4, 5]. Due to their abundance in nature, microorganisms are considered natural producers of enzymes, and many of them, including bacteria and fungi, have evolved to digest lignocellulose [6, 7]. Thus, the search for microorganisms that are able to efficiently degrade lignocellulosic biomass is pivotal for the establishment of the sustainable production of bioethanol [8].

Filamentous fungi, including the genera Trichoderma, Aspergillus, Penicillium and

Neurospora, play an important role in producing extracellular proteins that act synergistically

to degrade plant cell walls and are widely used in the enzymatic industry [9]. Species in the filamentous ascomycete genus Trichoderma [10] are important from the biotechnological perspective [7]. They are widely used in agriculture as biocontrol agents due their ability to antagonize plant-pathogenic fungi and in industry as a producer of plant cell wall-degrading enzymes [11-14]. In addition, Trichoderma species are easily isolated from soil and decomposing organic matter [15]. Within the Trichoderma genus, Trichoderma reesei is the most intensively studied species [16]. T. reesei is a well-known producer of cellulase and hemicellulase, and due to the high effectiveness of the synergistic cellulases in this species, it is widely employed in industry, as technologies for its use and handling are based on seventy years of experience [8, 16-19]. However, studies on T. harzianum strains have shown their potential to produce a set of enzymes that can degrade lignocellulosic biomass [20-23]; therefore, T. harzianum strains are being investigated as potentially valuable sources of industrial cellulases [6].

The identification of carbohydrate-active enzymes (CAZymes) that act synergistically under biodegradation conditions [4] has the potential to improve the enzymatic hydrolysis process by optimizing and reducing bioethanol costs. The CAZy database (www.cazy.org)

(33)

classifies CAZymes into six major groups, glycoside hydrolases (GHs), glycosyltransferases (GTs), polysaccharide lyases (PLs), carbohydrate esterases (CEs), auxiliary activities (AAs), and carbohydrate-binding modules (CBMs) [24], which are extensively used for the genetic classification of important hydrolytic enzymes [22, 25].

The conversion of cellulose to glucose involves the synergistic action of three principal groups of enzymes: endo-β-1,4-glucanases (EC 3.2.1.4), β-glucosidases (EC 3.2.1.21), and cellobiohydrolases (EC 3.2.1.91/176) [20, 26]. For hemicellulose hydrolysis, several enzymes are needed, such as endo-1,4-xylanases (EC 3.2.1.8), xylosidases (EC 3.2.1.37), β-mannanases (EC 3.2.1.78), arabinofuranosidases (EC 3.2.1.55), acetylxylan esterases (EC 3.1.1.72), and many others [26, 27]. In addition, there are a number of auxiliary enzymes involved in this process, such as lytic polysaccharide monooxygenases (LPMOs), cellulose-induced protein 1 and 2 (CIP1 and CIP2) and swollenin, that can increase the hydrolytic performance of enzymatic cocktails used in industry for bioethanol production [6, 28-30].

In the present study, data derived from the transcriptome and exoproteome of T.

harzianum CBMAI-0179 were compared with other Trichoderma strains. The RNA-Seq

analysis allowed the construction of co-expression networks, providing novel information about the potential of this T. harzianum strain in biotechnological applications. Taken together, our findings provide new insights into the genes/proteins that act synergistically in plant biomass conversion and that can be exploited for the improvement of enzymatic hydrolysis to make the saccharification of lignocellulosic substrates more efficient for bioethanol production.

Methods

Fungal strains, fermentation and enzymatic activities

The species originated from the Brazilian Collection of Environment and Industry Microorganisms (CBMAI), located on CPQBA/UNICAMP, in Campinas, Brazil. T. harzianum CBMAI-0179 (Th0179), T. harzianum IOC-3844 (Th3844) and T. atroviride CBMAI-0020 (Ta0020) strains were grown as described in a previous work on solid medium to produce sufficient spores for the fermentation process, which was performed in biological triplicate using crystalline cellulose (Celuflok, São Paulo, Brazil, degree of crystallinity 0.72 g/g, composition 0.857 g/g cellulose and 0.146 g/g hemicellulose) or glucose as the carbon source [10]. Glucose was used as a control in all experimental conditions. Supernatants were collected to measure enzymatic activity and determine the exoproteome profile.

(34)

Xylanase and β-glucosidase activities were determined using the method described by Bailey and Poutanen [60] and Zhang et al. [61], respectively. Cellulase activity was determined using the filter paper activity (FPA) test according to Ghose [62]. Protein levels were measured based on the Bradford [63] method. The enzymatic activities and protein contents in culture supernatants were performed in a previous work and are shown in Additional file 1: Fig. S1.

RNA extraction

Mycelial samples from cellulose and glucose conditions were extracted from Th0179, Th3844 and Ta0020 after 96 h of fermentation, stored at -80 °C, ground in liquid nitrogen using a mortar and pestle, and used for RNA extraction using the LiCl RNA extraction protocol according to the method reported by Oliveira et al. [64].

Data sources

The nucleotide and protein sequences of T. harzianum T6776 (PRJNA252551) and T. atroviride IMI 206040 (PRJNA19867) used as reference for transcriptome assembly were downloaded from the NCBI database (www.ncbi.nlm.nig.gov).

Library construction and RNA-Seq

RNA samples were quantified using a NanoDrop 8000 (Thermo Scientific). The libraries were constructed using 1 µg of each RNA sample obtained from the mycelial samples and the TruSeq RNA Sample Preparation Kit protocol v2 [65] (Illumina Inc., San Diego, CA, USA) according to the manufacturer’s instructions. The expected target sizes were confirmed using a 2100 Bioanalyzer (Agilent Technologies, Palo Alto, CA, USA) and the DNA 1000 Kit, and the libraries were quantified by qPCR using the KAPA library quantification Kit for Illumina platforms (Kapa Biosystems, Wilmington, MA, USA). The average insertion size was 260 bp. A total of 18 biological triplicate samples were multiplexed with different adapters and organized in different lanes of the flow cell for high-throughput sequencing. The sequencing was carried out on the HiSeq 2500 platform (Illumina, San Diego, CA, USA) according to the manufacturer’s specifications for paired-end reads of 150 bp.

Transcriptome assembly and mapping

After sequencing was completed, the data were transferred to a local high-performance computing server at the Center for Molecular Biology and Genetic Engineering (CBMEG, University of Campinas, Campinas, Brazil). FastQC v 0.11.5 [66] was used to check the quality

(35)

of the sequencing reads visually. Removal of the remaining adapter sequences and quality trimming with a sliding window of size 4, minimum quality of 15, and length filtering (minimal length of 36 bp) was performed with Trimmomatic v0.36 [67].

The RNA-Seq data were analyzed using CLC Genomics Workbench software (CLC bio – 6.5.2 v; Finlandsgade, Dk) [68]. The reads were mapped against the reference genomes of T.

harzianum T6776 [31] and T. atroviride IMI 206040 [32] using the following parameters:

minimum length fraction = 0.5; minimum similarity fraction = 0.8; and maximum number of hits for a read = 10. For the paired settings, the parameters were minimum distance = 150 and maximum distance = 300, including the broken pairs counting scheme. The gene expression values were expressed in reads per kilobase of exon model per million mapped reads (RPKM), and the normalized value for each sample was calculated in transcripts per million (TPM) [69]. To statistically analyze the differentially expressed genes (DEGs), the following parameters were used: fold change greater than or equal to 1.5 or lower than or equal to -1.5 and p-value lower than 0.05.

Gene comparison between species

Venn diagrams were constructed to compare the genes with TPM expression values greater than zero under both conditions from all species using

http://bioinformatics.psb.ugent.be/webtools/Venn/

Transcriptome annotation and CAZyme determination

Sequences were functionally annotated according to the Gene Ontology (GO) terms [70] with Blast2Go v 4.1.9 [71] using BLASTx-fast and a cutoff e-value of 10-6. Information derived from the CAZy database [24] was downloaded (www.cazy.org) to locally build a CAZy database (2017). The protein sequences of T. harzianum T6776 and T. atroviride IMI 206040 were used as queries in basic local alignment search tool (BLAST) searches against the locally built CAZy BLAST database. BLAST matches showing an e-value less than 10-11, identity greater than 30% and queries covering greater than 70% of the sequence length were selected and classified according to the CAZyme catalytic group as GHs, CBMs, GTs, CEs, AAs or PLs and their respective CAZyme families.

CAZymes were also annotated according to the Enzyme Commission (EC) number [72] through BRENDA (Braunschweig Enzyme Database) [73] (www.brenda-enzymes.org) using BLASTp with an e-value cutoff of 10-10, identity greater than 30% and queries covering greater than 60% of the sequence length.

(36)

Co-expression networks

The co-expression networks for Th0179 were assembled from the mapped RNA-Seq data against the genome of T. harzianum T6776 using biological triplicates. The network was assembled by calculating Pearson’s correlation for each pair of genes. Genes showing null values for most of the replicates under different experimental conditions were excluded to decrease noise and to remove residuals from the analysis. The highest reciprocal rank (HRR) method proposed by Mutwil et al. [74], was used to empirically filter the edges. Only edges representing the strongest correlations were selected. Cytoscape software v 3.6.0 [75] was used for data analysis and network construction. The cluster analysis procedure was performed with the Heuristic Cluster Chiseling Algorithm (HCCA) [74].

Exoproteome analysis

The analysis of the exoproteome of Th0179 under both fermentative conditions was performed via liquid chromatography tandem mass spectrometry (LC-MS/MS) using the data-independent method of acquisition MSE as described by Horta et al. [10] The LC-MS/MS data were processed using ProteinLynx Global Server (PLGS) v 3.0.1 software (Waters, Milford, MA, USA), and the processed files (.pkl) were identified by comparison to the Trichoderma sequence database available in the UniProt Knowledgebase (UniProtKB;

https://www.uniprot.org/uniprot/). BLASTp searches of the fasta sequences of the identified proteins were performed against the T. harzianum T6776 genome to identify the secreted proteins and compare them to the transcriptome.

RT-qPCR analysis

To validate the expression profiles of the transcriptome analysis, reverse transcription-quantitative PCR (RT-qPCR) was performed for selected genes. The RNeasy Mini Kit (Qiagen) was used for RNA extraction, and cDNA was synthesized using the QuantiTect Reverse Transcription Kit (Qiagen, Germany) according to the manufacturer’s instructions. DEGs with a high number of reads and TPM were selected and are shown in Additional file 2: Table S1, together with the primers and annealing temperatures. Primers were synthesized using the Primer3Plus web interface [76] with a fusion temperature between 58 and 60 °C and amplicon sizes between 120 and 200 bp.

Quantification of gene expression was performed by continuously monitoring SYBR Green fluorescence. The reactions were performed in triplicate in a total volume of 6.22 μL.

(37)

Each reaction contained 3.12 μL of SYBRGreen Supermix (Bio-Rad, USA), 1.0 μL of forward and reverse primers and 2.1 μL of diluted cDNA. The reactions were assembled in 384-well plates. PCR amplification-based expression profiling of the selected genes was performed using specific endogenous controls for each strain, which are described in Additional file 2: Table S1. RT-qPCR was conducted with the CFX384Touch Real-Time PCR Detection System (Bio-Rad). The real-time PCR program was as follows: initial denaturation at 95 °C for 10 min, followed by 40 cycles of 15 sec at 95 °C and 60 sec at 60 °C. Gene expression was calculated via the delta-delta cycle threshold method [77]. The obtained RT-qPCR results were compared with the RNA-Seq results from the assemblies generated. The selected genes exhibited the same expression profile in the RT-qPCR and RNA-Seq analyses (Additional file 3: Fig. S2).

Results

Transcriptome analysis of Trichoderma spp. under cellulose growth conditions

This is the first deep genetic analysis for Th0179 that describes and compares the transcriptome by RNA-Seq under two different growth conditions, cellulose and glucose, to identify the genes involved in plant biomass degradation. Reads were mapped against reference genomes of each species, generating 96.3, 111.8 and 133.3 million paired-end reads for Th0179, Th3844 and Ta0020, respectively. To establish the degrees of similarity and difference in gene expression between the strains and treatments, a principal component analysis (PCA) was performed using the T. harzianum T6776 genome as a reference. The PCA results showed clustered groups with a higher similarity between treatments than between strains. The transcriptomes of Th0179 and Th3844 were more similar to each other than to the transcriptome of Ta0020 (Fig. 1a), showing that it is possible to capture differences between the three strains.

Venn diagrams of the genes exhibiting expression levels greater than zero were constructed based on the similarities among the genes from all strains, thus showing the species-specific genes expressed under both conditions (Additional file 4: Fig. S3). Through the transcriptome analysis of the strains, we identified 11,250 genes exhibiting expression levels greater than zero under cellulose growth conditions and 11,235 genes exhibiting expression levels greater than zero under glucose growth conditions. The number of genes shared by Th0179 and Th3844 was higher under both conditions than that shared by either Th0179 or Th3844 and Ta0020. Th0179 exhibited the highest number of unique genes, with 374 and 168 unique genes under the cellulose and glucose growth conditions, respectively. Among these unique genes under cellulose growth conditions, we found major facilitator superfamily (MFS)

(38)

transporters (THAR02_00234, THAR02_00911, THAR02_03251, THAR02_03935, THAR02_07021, THAR02_07705 and THAR02_07942), an ATP-binding cassette (ABC) transporter (THAR02_09958), a drug resistance protein (THAR02_04837), a fungal specific transcription factor (TF) (THAR02_07743), and a C2H2 TF (THAR02_11070). Under cellulose growth conditions, we identified 219 genes that were differentially expressed for Th0179, 281 genes for Th3844 and 718 genes for Ta0020 (Fig. 1b).

CAZyme identification and distribution in Trichoderma spp.

For CAZymes important in the degradation of biomass, the set of CAZymes was identified by mapping all of the proteins of T. harzianum T6776 and T. atroviride IMI 206040 against the CAZy database using the BLASTp search tool. Based on the filtering criteria, a total of 631 proteins were maintained as CAZyme genes for T. harzianum, which corresponds to 5.5% of the total 11,498 proteins predicted for this organism [31], and 640 proteins were maintained for

T. atroviride, which corresponds to 5.4% of the total 11,816 proteins predicted for this organism

[32].

Among the DEGs under cellulose growth conditions and using the CAZy database established, we found 35, 78 and 31 differentially expressed CAZyme genes in our data (Fig. 1b) for Th0179, Th3844 and Ta0020, respectively. We identified the main CAZyme classes (AA, GH, GT, CE and CBM) and their contents for all strains (Table 1). The differences regarding the specific CAZyme families for each strain are shown in Fig. 2. The Th3844 strain presented the highest number of classified genes from the AA family, a high number of CBMs and twice the number of identified GHs compared with that identified in the two other strains. The Ta0020 strain presented a higher number of genes from the GT family than Th0179, which exhibited the highest number of classified genes from the CBM family.

Table 1. Total differentially expressed CAZymes identified in Trichoderma spp. under cellulose growth conditions

CAZyme classes Strains Th0179 Th3844 Ta0020 AA 2 5 1 GH 21 42 21 GT 1 3 4 CE 2 6 3 CBM 9 22 2

(39)

Total 35 78 31

The GH group was the most numerous class of enzymes present in all evaluated strains, and they are key enzymes for carbohydrate hydrolysis, which includes the enzymes capable of degrading cellulose [33-35], as many of them have the ability to cleave glycosidic bonds between glucose molecules. Another important family involved in the plant cell wall degradation process, AAs, was also identified in all strains [36]. The AA class currently harbors 9 families of ligninolytic enzymes and 6 families of lytic polysaccharide mono-oxygenases that may not act on carbohydrates, but because lignin is invariably and intimately associated with carbohydrates in the plant cell wall, these lignolytic enzymes cooperate with classical polysaccharide depolymerases, named auxiliary enzymes [24, 36], that influence the degradative activity differently between species.

Fig. 1. Similarities and differences across the transcriptome profiles and gene expression comparison among strains. PCA of transcriptome mapping according to species and growth conditions (CEL – cellulose and GLU – glucose) (a), number of DEGs and differentially expressed CAZyme genes in T. harzianum CBMAI-0179 (Th0179), T. harzianum IOC-3844 (Th3844), and T. atroviride CBMAI-0020 (Ta0020) under cellulose growth conditions (b).

Referências

Documentos relacionados

This log must identify the roles of any sub-investigator and the person(s) who will be delegated other study- related tasks; such as CRF/EDC entry. Any changes to

E como objetivos específicos: (1) decompor os conceitos de coaching; (2) analisar se a metodologia contribuiu no estímulo da motivação dos pacientes oncológicos; (3) averiguar se

In this study, some physiological conditions affecting the activity of xylanase enzyme produced from Trichoderma harzianum 1073 D3 , namely pH, temperature, reaction time and

(...) ética é um assunto muito novo dentro da própria empresa, as pessoas ainda não definiram muito bem se ética está ligada à responsabilidade social, se responsabilidade social

Visto isto, o dilema do processo de legitimação da fotografia como arte moderna é que o meio praticamente não oferece características dispensáveis, como por exemplo,

Para a realização deste trabalho foram coletados swabs nasal do leito e retal (ou fezes), na internação e na alta, de pacientes admitidos para procedimentos eletivos no

Thus, this study aimed to evaluate the use of a Trichoderma harzianum -based biofungicide combined with liming in reducing the severity of clubroot in cauliflower and their effects

Abstract – The objective of this work was to evaluate isolates of Trichoderma harzianum regarding biocontrol of common bean seed-borne pathogens, plant growth promotion,