• Nenhum resultado encontrado

Análise do sequenciamento parcial dos clones selecionados na biblioteca genômica

6. RESULTADOS

6.2 GENÔMICA FUNCIONAL DE ACIDOBACTERIA

6.2.2 Análise do sequenciamento parcial dos clones selecionados na biblioteca genômica

A partir do sequenciamento parcial dos cinco clones selecionados da biblioteca genômica da Acidobacteria AB60, o total de ORFs identificadas foi 50. Para a identificação das ORFs utilizou-se o valor de corte de e-value abaixo de 1e-4 (0,0183), desta forma todas as sequências com valor acima deste foram descartadas. Das ORFs identificadas 38% foram descartadas por possuírem o valor do e-value acima do valor de corte. Restaram 31 ORFs que foram consideradas sequências reais de proteínas (Apêndice B).

Por meio da análise inicial do sequenciamento dos clones selecionados seis ORFs de possível interesse foram identificadas como possíveis responsáveis pela atividade hidrolítica. Estas ORFs estão apresentadas abaixo (Tabela 8).

Tabela 8 - Identificação das ORFs dos clones sequenciados da biblioteca genômica da AB60, que podem conter genes de importância relacionados a degradação de polissacarídeos.

Clone ORF Tamanho ORFs identificadas Identidade (%) e-value

D10-2 (2F) 612 Glicosil hidrolase [Acidobacteriaceae bacterium URHE0068]

71% 9e-100

(1R) 1387 ramnosidase [Streptomyces sp. PRh5] 40% 7e-74

E4-7 (1F) 1656 β-glicosidase [Acidobacteriaceae bacterium URHE0068]

88% 0.0

(1R) 1902 ramnosidase [Streptomyces prunicolor] 41% 3e-101

(2R) 1016 α-L-ramnosidase [Asticcacaulis biprosthecium] 45% 9e-58

G4-5 (1R) 1020 Proteína hipotética [Actinoplanes sp. RP-AC33] 25% 1e-12 Fonte: próprio autor.

Os esquemas representando o sequenciamento dos clones será mostrado somente para os clones que possuem ORFs que tem alguma possível relação com a degradação de polissacarídeos, entretanto, o esquema do sequenciamento para todos os clones selecionados

esta disponível (Apêndice D). As ORFs presentes na tabela 8 foram analisadas em maior detalhe. Todas estas ORFs foram utilizadas para a construção de árvores filogenéticas e a ORF com o melhor e-value foi escolhida para mostrar o alinhamento proteico.

6.2.2.1Clone D10-2 6.2.2.1.1ORF 2(F)

O clone D10-2 apresenta duas ORFs com similaridade a enzimas capazes de realizar a hidrólise de polissacarídeos complexos. Estas são a ORF 2(F) e a ORF 1(R) (Tabela 8) (Figura 27).

Figura 27 - Esquema representativo do sequenciamento do clone D10-2. Análise das ORFs do sequenciamento parcial. As ORFS em cinza escuro são as possíveis ORFs responsáveis pela atividade do clone. As outras ORFs em cinza claro terão a sua informação apresentada em forma de tabela no Apêndice. A região em branco esta sequenciada, enquanto a região em cinza ainda não foi finalizado o sequenciamento.

Fonte: próprio autor.

A ORF 2(F) possui similaridade com uma glicosil hidrolase pertencente a Acidobacteriaceae bacterium, como já era esperado, por ser proveniente de uma biblioteca genômica de Acidobacteria. De acordo com o dendrograma, pode-se inferir que esta ORF é uma glicosil hidrolase pertencente a uma bactéria do filo Acidobacteria, assim como as outras que estão relacionadas a ela, entretanto não é possível determinar a qual família pertence esta hidrolase (Tabela 8) (Figuras 27 e 28).

Figura 28 - Dendrograma mostrando a relação da ORF 2F do clone D10-2 com ORFs similares encontradas em análises do programa Blastx. Alinhamento e construção realizados utilizando os programas Muscle e Mega 6. Dendrograma obtido pelo método Maximum Likelihood Tree. Os valores dos clados são referentes ao bootstrap de 1000 repetições.

Fonte: próprio autor.

6.2.2.1.2 ORF 1(R)

A segunda ORF interessante é a ORF 1(R), que possui a maior similaridade com uma ramnosidase pertencente a uma bactéria do gênero Streptomyces sp.. Entretanto, ao analisarmos o dendrograma, mesmo que ela esteja fora do clado, é possível verificar que ela possui similaridade com ramnosidases de bactérias do filo Acidobacteria. Esta ORF termina juntamente com o inserto do clone, se a sua sequência estivesse completa, possivelmente sua similaridade seria maior com este grupo de ramnosidases de Acidobacteria (Tabela 8) (Figuras 27 e 29).

Figura 29 - Dendrograma mostrando a relação da ORF 1R do clone D10-2 com ORFs similares encontradas em análises do programa Blastx. Alinhamento e construção realizados utilizando os programas Muscle e Mega 6. Dendrograma obtido pelo método Maximum Likelihood Tree. Os valores dos clados são referentes ao bootstrap de 1000 repetições.

Fonte: próprio autor.

6.2.2.2 Clone E4-7

O clone E4-7 possui três ORFs com similaridade a enzimas envolvidas na degradação de polissacarídeos. As ORFs 1(F), 1(R) e 2(R) (Figura 30) (Tabela 8).

Figura 30 - Esquema representativo do sequenciamento do clone E4-7. Análise das ORFs do sequenciamento parcial. As ORFS em cinza escuro são as possíveis ORFs responsáveis pela atividade do clone. As outras ORFs em cinza claro terão a sua informação apresentada em forma de tabela no Apêndice. A região em branco esta sequenciada, enquanto a região em cinza ainda não foi finalizado o sequenciamento.

6.2.2.2.1 ORF 1(F)

A ORF 1F tem 88% de identidade com uma β-glicosidase de uma Acidobacteriaceae bacterium. É possível verificar no dendrograma que ela está inserida dentro do grupo de β- glicosidases de Acidobacteria como era esperado. A partir do alinhamento proteico é possível verificar que a enzima com a qual possui o melhor alinhamento é uma β-xilosidase de Acidobacterium capsulatum (Tabela 8) (Figuras 30, 31, 32 e 33).

Figura 31 - Dendrograma mostrando a relação da ORF 1F do clone E4-7 com ORFs similares encontradas em análises do programa Blastx. Alinhamento e construção realizados utilizando os programas Muscle e Mega 6. Dendrograma obtido pelo método Maximum Likelihood Tree. Os valores dos clados são referentes ao bootstrap de 1000 repetições.

Fonte: próprio autor.

Figura 32 - Dendrograma montado pelo programa Uniprot. Baseado no alinhamento abaixo (Blastp). A proteína correspondente a ORF 1F do clone E4-7 esta inserida no clado da β-xilosidade B de Acidobacterium capsulatum.

Figura 33 - Alinhamento da ORF 1(F) do clone E4-7. Em branco com fundo verde (322 aa) está o resíduo conservado aspartato (D) potencialmente parte do sítio ativo e as regiões com fundo azul são as regiões que apresentam a similaridade com a sequência alinhada (C1F1A8_ACIC5 – Beta-xilosidase B de Acidobacterium capsulatum). O resíduo que possivelmente faz parte do sítio ativo foi baseado em alinhamento anterior com a sequência curada de Prevotella ruminicola e sua nomenclatura é XYL3A_PRER2. As regiões cujo aminoácidos estão apresentados com o fundo vermelho representam aminoácidos com propriedades negativas, enquanto as regiões cujo aminoácidos estão apresentados com o fundo verde representam aminoácidos com propriedades positivas.

Fonte: próprio autor.

6.2.2.2.2 ORF 1(R) e 2(R)

As ORFs 1R e 2R do clone E4-7 apresentam similaridade com a enzima ramnosidase de bactérias do gênero Streptomyces sp. e Asticcacaulis sp.. A partir da análise do dendrograma não é possível concluir que a ORF1R é filogeneticamente mais próxima de ramnosidases pertencentes ao bactérias do filo Acidobacteria. Entretanto esta ORF apresenta

similaridade com ORF de ramnosidase de Acidobacteria (Tabela 8) (Figura 30 e 34). Em relação a ORF 2R, ela finaliza com o fim do inserto clonado, é possível que, se ela estivesse completa no inserto a sua similaridade seria maior com uma enzima ramnosidase de Acidobacteria. Ao analisar o dendograma é possível verificar que ela possui similaridade com uma proteína hipotética de Acidobacteriaceae bacterium (Tabela 8) (Figuras 30 e 35).

Figura 34 - Dendrograma mostrando a relação da ORF 1R do clone E4-7 com ORFs similares encontradas em análises do programa Blastx. Alinhamento e construção realizados utilizando os programas Muscle e Mega 6. Dendrograma obtido pelo método Maximum Likelihood Tree. Os valores dos clados são referentes ao bootstrap de 1000 repetições.

Figura 35 - Dendrograma mostrando a relação da ORF 2R do clone E4-7 com ORFs similares encontradas em análises do programa Blastx. Alinhamento e construção realizados utilizando os programas Muscle e Mega 6. Dendrograma obtido pelo método Maximum Likelihood Tree. Os valores dos clados são referentes ao bootstrap de 1000 repetições.

Fonte: próprio autor.

6.2.2.3 Clone G4-5 6.2.2.3.1 ORF 1(R)

A ORF 1R do clone G4-5 é interessante pois ela parece ser muito diferente da proteína hipotética de Actinoplanes subtropicus, pois como é possível verificar no dendrograma, nenhuma ORF de Acidobacteria está próxima, entretanto existem diversas hidrolases, micodextranases e até uma CBM 6 próxima a esta ORF. Existe a possibilidade de ser uma enzima próxima a estas que ainda não foi verificada para o grupo Acidobacteria. Entretanto, não é possível afirmar por se tratar de uma proteína hipotética (Tabela 8) (Figuras 36 e 37).

Figura 36 - Esquema representativo do sequenciamento do clone G4-5. Análise das ORFs do sequenciamento parcial. As ORFS em cinza escuro são as possíveis ORFs responsáveis pela atividade do clone. As outras ORFs em cinza claro terão a sua informação apresentada em forma de tabela no Apêndice. A região em branco esta sequenciada, enquanto a região em cinza ainda não foi finalizado o sequenciamento.

Figura 37 - Dendrograma mostrando a relação da ORF 1R do clone G4-5 com ORFs similares encontradas em análises do programa Blastx. Alinhamento e construção realizados utilizando os programas Muscle e Mega 6. Dendrograma obtido pelo método Maximum Likelihood Tree. Os valores dos clados são referentes ao bootstrap de 1000 repetições.

7. DISCUSSÃO

A busca de genes de interesse biotecnológico pode ser realizada por diversas metodologias. No presente trabalho, foi realizada uma busca de genes que codificam glicosil hidrolases pela verificação de sua atividade em meio sólido. A partir de duas bibliotecas, uma metagenômica de rúmen de caprino da raça moxotó e uma genômica de um isolado de Acidobacteria de solo de Cerrado (AB60) (CUNHA, KRUGER; QUIRINO, 2009; DE CASTRO et al., 2013). A biblioteca genômica foi construída no presente trabalho. Foram selecionados inicialmente 24 clones pertencentes as duas bibliotecas. Dos quais 19 clones oriundos da biblioteca metagenômica e 5 da biblioteca genômica.

7.1 ESTRATÉGIA DE TRIAGEM

Cerca de 64% dos clones triados e sequenciados provenientes da biblioteca metagenômica permaneceram com a atividade até a última etapa de confirmação de atividade em xilana. Em bagaço de cana-de-açúcar cerca de 28% do total de clones triados provenientes da mesma biblioteca permaneceram com atividade até a última etapa de confirmação. Na biblioteca genômica, cinco clones foram selecionados e 100% destes permaneceram com atividade em xilana, entretanto na triagem com bagaço de cana-de-açúcar 80% permaneceram com atividade até a última etapa de confirmação de atividade.

A possibilidade de se detectar um gene baseado em sua função utilizando as abordagens genômicas e metagenômicas depende de alguns fatores, que podem explicar a causa da perda da detecção da atividade, em alguma etapa do processo. Como por exemplo: o sistema vetor-hospedeiro utilizado, o tamanho do gene a ser detectado, o quão abundante este gene está presente na amostra utilizada para a montagem da biblioteca, o método de detecção utilizado e, a eficiência da expressão heteróloga do hospedeiro utilizado para a expressão (UCHIYAMA; MIYAZAKI, 2009).

O vetor pCF430 foi criado para ser utilizado em Escherichia coli, assim como o pCC1BAC, onde o fabricante recomenda o uso em uma cepa específica de E. coli, EPI300 que foi a cepa utilizada no trabalho durante todo o processo de triagem. Sendo assim o sistema vetor-hospedeiro utilizado para as duas abordagens é coerente (NEWMAN; FUQUA, 1999; EPICENTRE, 2012).

Em relação ao tamanho do gene a ser detectado, a informação sobre o tamanho dos genes relativos as classes de enzimas de interesse foi utilizada para decidir qual o tamanho de inserto deveria ser utilizado na montagem das bibliotecas para que os genes procurados

pudessem estar inseridos nos insertos clonados. Como base para a decisão do tamanho do inserto a ser clonado. Como exemplo, o gene de β-xilosidade de Acidobactéria cuja sequência está disponível no Uniprot é composto por um máximo de 896 aminoácidos, ou aproximadamente 2700 pb, desta forma, o tamanho escolhido entre 4 e 8 kb para a montagem biblioteca genômica considerado de pequenos insertos seria um tamanho viável para a presença destes genes e possível detecção de suas atividades, assim como na biblioteca metagenômica cuja montagem foi escolhido o tamanho entre 2 e 8 kb, e a média do tamanho dos insertos é de 5 kb.

Um outro aspecto importante é a abundância esperada dos genes presentes nas amostras. Como o rúmen é um ambiente muito rico em organismos procariontes e a alimentação dos caprinos é basicamente material lignocelulósico presente no ambiente onde estão inseridos, espera-se que o metagenoma apresente genes de diversas glicosil hidrolases, capazes de hidrolisar este material. O animal possui uma microbiota capaz de desconstruir esta biomassa para a retenção de nutrientes para a sua sobrevivência e consequente disponibilidade para o uso dos caprinos (OLIVEIRA, ZANINE; SANTOS, 2007; CUNHA, KRUGER; QUIRINO, 2009; CUNHA, 2010).

Em relação à biblioteca genômica, estudos baseados em cultivo mostraram que as acidobactérias são capazes de utilizar xilana como fonte de carbono, sendo que algumas glicosil hidrolases de membros deste filo já foram purificadas e caracterizadas. Estudos baseados em similaridade de sequências utilizando alguns dos genomas já sequenciados de Acidobacteria, mostraram que este grupo fazia parte, no momento em que foram sequenciados, do grupo dos 5% de genomas com maior número de genes codificantes para glicosil hidrolases. Desta forma, é esperado que a abundância destes genes de interesse seja suficiente para a detecção de atividade nas duas bibliotecas utilizadas neste trabalho(WARD et al., 2009; ANDERSON et al., 2012; GARCIA COSTAS et al., 2012; RAWAT, MANNISTO, BROMBERG, et al., 2012; RAWAT, MANNISTO, STAROVOYTOV, et al., 2012; DE CASTRO et al., 2013).

O método de detecção de atividade enzimática utilizado é de grande importância, pois a partir dele é que são selecionados os clones para a busca de ORFs de interesse e todos as etapas subsequentes até chegar na enzima de interesse biotecnológico. O ensaio para a atividade enzimática dos clones das bibliotecas genômica e metagenômica foi realizado em meio sólido. Todos os clones inicialmente apresentaram atividade nas triagens iniciais em xilana e ou bagaço de cana-de-açúcar pré-tratado com ácido, mas posteriores análises

revelaram que alguns destes clones perderam a atividade após a re-transformação ou eram falsos positivos.

Apesar desse método já ter sido usado em trabalhos anteriores (PALUAN, 2011; RAMOS, 2011; RODRIGUES, 2014) ele apresenta algumas dificuldades, que podem explicar alguns dos resultados observados. O uso do corante vermelho do congo para a detecção de atividades foi inicialmente utilizado para polissacarídeos que possuem ligações β-1,4 e β-1,3 de gluco-piranosídeos, ou seja, polissacarídeos cuja a base fosse glicose, além de a possibilidade de hemiceluloses ricas em galacto-glucomanose, hemiceluloses que possuem uma grande proporção de lactose, glicose e manose (TEATHER; WOOD, 1982). A xilana utilizada na identificação e confirmação da atividade dos clones foi a xilana de madeira de faia, cujos açúcares componentes principais são xilose e arabinose, entretanto ainda assim foi possível visualizar a atividade por parte dos clones. No uso do bagaço de cana-de-açúcar pré- tratado a dificuldade principal não está no uso do corante vermelho do congo, pois a parede celular desta é composta basicamente por celulose, hemicelulose e lignina. O uso do pré- tratamento ácido leva à remoção da maior parte da hemicelulose presente na parede celular do bagaço (UCHIYAMA; MIYAZAKI, 2009), desta forma como o corante se liga a polissacarídeos ricos em glicose a celulose principal componente restante é corada. Entretanto a cana-de-açúcar mesmo que macerada não vira pó. Ficam pequenos pedaços que algumas vezes podem dificultar ainda mais o processo de visualização da atividade.

A seleção dos clones é feita de forma qualitativa, sendo assim existe um aspecto subjetivo presente nesta avaliação, que pode levar à seleção de clones falso positivos, assim bem como a não seleção de clones positivos considerados falsos. A atividade enzimática, utilizando esse protocolo, foi baseada na metodologia desenvolvida para detecção em micro- organismos isolados (TEATHER; WOOD, 1982). No presente estudo, no entanto, foi utilizada para verificar a atividade em bibliotecas de expressão heteróloga em E. coli. No caso dos isolados, o nível de expressão gênica é maior, assim atividade é detectada com mais facilidade. No caso das bibliotecas, os vetores utilizados são vetores de clonagem e não vetores de expressão, apesar da possibilidade da indução a expressão destes vetores, levando a uma expressão mais baixa dificultando a visualização da atividade em relação a micro- organismos isolados. O uso dos vetores de clonagem é necessário durante a montagem destas bibliotecas por conta da estabilidade destes em relação à célula hospedeira e ao inserto clonado neste (HANDELSMAN, 2004; SCHMEISSER, STEELE; STREIT, 2007; SABREE, RONDON; HANDELSMAN, 2009).

Uma abordagem diferente que também pode ser utilizada para aumentar a eficiência na confirmação da atividade dos clones considerados positivos é através da realização de um ensaio em meio líquido utilizando o método de DNS (baseado na quantificação de açúcares redutores). Neste caso, a atividade dos clones pode ser detectada após a lise celular destes clones crescidos e induzidos em meio líquido. Esta abordagem foi utilizada com um clone da biblioteca de pequenos insertos de rúmen e alguns clones de uma biblioteca de grandes insertos clonada em vetor pCC1FOS (DUTRA, 2014).

A eficiência da expressão heteróloga pelo hospedeiro utilizado é de grande importância também, pois primeiro existe uma variação nos códons utilizados para a formação das proteínas entre as bactérias, podendo levar a não formação da proteína pelo hospedeiro (LORENZO, 2005; FAKRUDDIN et al., 2013). Além disso, um trabalho mostrou que a existência de uma variação no modelo de expressão entre bactérias de grupos taxonômicos distintos e sugeriu que cerca de 40% das atividades enzimáticas poderia ser detectada a partir da clonagem em Escherichia coli (UCHIYAMA; MIYAZAKI, 2009). Muitas vezes as proteínas são produzidas, porém permanecem em corpos de inclusão e não são secretadas. Existem outras bactérias que também podem ser utilizadas para montagem de bibliotecas conhecidas pelo alto nível de expressão como Bacillus sp., entretanto ao utilizar-se um hospedeiro diferente todas as etapas relativas ao vetor de expressão devem ser bem analisadas, pois a maioria dos vetores são criados para serem utilizados em hospedeiros específicos, e existe a possibilidade de um vetor para E. coli não funcionar bem em Bacillus sp. (VAN DIJL; HECKER, 2013).

7.2 BIBLIOTECA METAGENÔMICA

Dos 14 clones sequenciados da biblioteca metagenômica de rúmen de caprino, quatro deles apresentaram ORFs que contém algum gene com similaridade à enzimas envolvidas na degradação de polissacarídeos. No total, são cinco ORFs analisadas em detalhes, sendo que o clone B2-34 é o único clone que apresenta duas ORFs analisadas.

Três ORFs apresentam similaridade com uma enzima envolvida na degradação de xilana. A primeira é a ORF 1 do clone B2-34, que apresenta similaridade com uma β- glicuronidase bacteriana que pertencente à família 2 da classe das glicosil hidrolases. Esta família contém enzimas com diversas atividades descritas como: β-galactosidase (EC 3.2.1.23), β-manosidase (EC 3.2.1.25), β-glicuronidase (EC 3.2.1.31), endo-β-manosidase (EC 3.2.1.152) e exo-β-glicosaminidase (EC 3.2.1.165) e α-L-arabinofuranosidase (EC

3.2.1.55), esta última tem ação direta na degradação de xilana (CANTAREL et al., 2008; NAUMOFF, 2011). As α-L-arabinofuranosidases são responsáveis pela liberação do açúcar arabinose da cadeia lateral da xilana, facilitando o acesso à cadeia principal da xilana ou hemicelulose por outras enzimas, além da possibilidade do uso do açúcar para a fermentação e produção de etanol (SAHA, 2000). Outras atividades citadas acima, podem ser utilizadas para fins biotecnológicos como, na formação de prebióticos como os galacto-oligossacarídeos, estes são importantes pois ajudam a regular o trato intestinal, reduzem do risco de câncer no cólon, além de melhorar na absorção de nutrientes como cálcio e magnésio. A formação destes galacto-oligossacarídeos é feita a partir da atividade de transgalactosilação sobre a lactose, catalisada pela enzima β-galactosidase (LISBOA et al., 2012; MUTANDA et al., 2014). As β-glicuronidases são enzimas utilizadas como genes repórteres, ou seja, para verificar a expressão de algum outro gene, durante a montagem do sistema de expressão um gene como este pode ser adicionado com a finalidade de verificar se o sistema está funcionando e o gene de interesse é expressado, principalmente em estudos com plantas (KIM et al., 2006). O alinhamento da sequência de aminoácidos apresentado para esta ORF, mostrou que esta possui os sítios ativos presentes nas enzimas β-glicuronidases.

A segunda ORF que apresenta similaridade é ORF 1 do clone D8-76 com identidade de 70% com uma glicosil hidrolase da família 31. No entanto, a sequência finaliza com o final do inserto e a ORF não está completa. Por outro lado, grande parte dela é representada na sequência presente no inserto e a partir do alinhamento proteico é possível verificar que ela apresenta os três sítios catalíticos conservados, e o domínio apesar de possuir algumas diferenças, também é bem conservado. A família 31 das glicosil hidrolases apresenta algumas atividades descritas como: α-glicosidase (EC 3.2.1.20); α-1,3-glicosidase (EC 3.2.1.84); sucrose-isomaltose (EC 3.2.1.48) (EC 3.2.1.10); α-xilosidase (EC 3.2.1.177); α-glucano liase (EC 4.2.2.13); isomaltosiltransferase (EC 2.4.1.-); α-manosidase (EC 3.2.1.24); oligossacarídeo α-1,4-glicosiltransferase (EC 2.4.1.161) (CANTAREL et al., 2008; NAUMOFF, 2011). A mais relacionada com a atividade xilanolítica é a α-xilosidase e dentro do dendrograma é com enzimas deste tipo que esta ORF apresenta maior relação. As α- xilosidases são enzimas responsáveis pela liberação de α-xilose ligadas a xiloglucanos que são constituintes da hemicelulose presentes em plantas dicotiledôneas. Um trabalho recente demonstrou que uma α-xilosidase de fungo não somente é capaz de liberar monômeros de xilose, como também aumentar a liberação de glicose e xilose quando utilizada junto de um grupo de celulases comerciais em alguns casos específicos, fazendo que a suplementação com

este tipo de enzima possa levar a um aumento significativo na eficiência da produção de etanol utilizando a biomassa lignocelulósica como fonte de açúcares (JABBOUR et al., 2013). A ORF 3 do clone B2-34 apresenta similaridade com uma enzima da família alfa/beta hidrolase, esta família de enzimas pode ter função de hidrolases, liases, transferases, precursores ou transportadores de hormônios, chaperonas entre outras funções. A quantidade

Documentos relacionados