• Nenhum resultado encontrado

Identificação e caracterização dos genes da família MADS-box em Passiflora organensis

N/A
N/A
Protected

Academic year: 2021

Share "Identificação e caracterização dos genes da família MADS-box em Passiflora organensis"

Copied!
153
0
0

Texto

(1)

HELENA AUGUSTO GIOPPATO

Identificação e caracterização dos genes da família MADS-box em

Passiflora organensis

ORIENTADOR: MARCELO CARNIER DORNELAS

CAMPINAS 2019

UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIA

(2)

Identificação e caracterização dos genes da família

MADS-box em Passiflora organensis

Orientador: Marcelo Carnier Dornelas

CAMPINAS 2019

Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestra em Biologia Vegetal.

Este trabalho corresponde à versão final dissertação defendida pela aluna Helena Augusto Gioppato e orientada pelo Prof. Dr. Marcelo Carnier Dornelas

(3)
(4)

Prof. Dr. Marcelo Carnier Dornelas

Prof. Dr. Fábio Pinheiro

Prof. Dr. Jean Carlos Cardoso

A Ata da defesa com as respectivas assinaturas dos membros encontra-se no SIGA/Sistema de Fluxo de Dissertação/Tese e na Secretaria do Programa da Unidade.

(5)

À Universidade Estadual de Campinas - UNICAMP, aos seus professores, alunos e funcionários, que tornam possível a expansão da formação acadêmica para a formação pessoal. Ao Instituto de Biologia da Unicamp pelos cursos em Ciências Biológicas e Mestrado em Biologia Vegetal, que me trouxeram até esta dissertação.

Ao CNPq por ter financiado este projeto de pesquisa.

Ao Centro de Energia Nuclear na Agricultura – CENA/ ESALQ – Universidade de São Paulo, por todo apoio desde o cultivo das plantas e análises de biologia molecular até as amizades que lá encontrei, uma delas a doutoranda Tatiana de Souza Moraes, com quem aprendi e ainda aprendo muito sobre biologia e sobre a vida.

Ao orientador Prof. Dr. Marcelo Carnier Dornelas que desde a iniciação científica me orienta, me ensina e me incentiva a ir além, sempre confiando muito em meu trabalho, por toda a dedicação em me orientar este tempo todo e em especial neste projeto.

Ao Prof. Dr. Diego Ismael Rocha, por todos os ensinamentos durante minha iniciação científica, os quais com toda certeza foram fundamentais para que chegasse até aqui.

Às Profas. Dras. Sandra Maria Carmello-Guerreiro e Adriana Martinelli Pinheiro, convidadas para as bancas examinadoras de etapas anteriores à defesa, por todas as sugestões e contribuições para o melhor desenvolvimento do trabalho.

Aos Profs. Drs. Fábio Pinheiro e Jean Carlos Cardoso, convidados para a banca examinadora, por aceitarem o convite e contribuírem com o trabalho.

Ao meu pai Silvio por ter me apresentado desde pequena o universo da ciência e pelo incentivo em permanecer na área, sempre contribuindo para a minha formação pessoal e intelectual, à minha mãe Georgete pelo amor incondicional e por todo apoio e incentivo que me dá para seguir em frente com minhas escolhas, e aos meus irmãos Gustavo e Fernando pela amizade e lições de vida que temos juntos.

Às amizades que me acompanham desde a graduação pela companhia e apoio constantes, que sempre fizeram a diferença no meu dia a dia. Agradeço especialmente a minha grande amiga Carla Maneira da Silva por estar sempre presente para me apoiar e compartilhar as alegrias e mazelas da vida acadêmica.

Às amigas, Jusceley, Tatiane, Mariana e Bruna, companheiras de bancada e campo que alegraram meus dias no laboratório, cada uma a sua maneira.

(6)

sempre que necessário, por toda a ajuda, pela companhia e aprendizados que tornaram o trabalho ainda mais prazeroso.

(7)

produzidas e como elas afetaram o processo evolutivo. Para se estudar essa questão, foi necessário lançar mão de estudos na área da biologia do desenvolvimento. Estes estudos levaram à descrição de diversos genes reguladores que controlam muitos processos de desenvolvimento em todos os organismos. Alguns destes genes fazem parte de uma família multigênica chamada MADS-box, que entre as angiospermas, é responsável por regular vários processos de seu desenvolvimento, dentre eles o desenvolvimento floral. Duplicações ou perdas parálogos de MADS-box podem alterar o padrão de desenvolvimento das estruturas florais. O gênero Passiflora é um dos grupos de angiospermas que possui indivíduos que produzem estruturas complexas cujas origens ainda não foram elucidadas, como os filamentos da corona. Sendo assim, e considerando também o seqüenciamento recente do genoma de uma espécie de Passiflora, Passiflora organensis, o presente trabalho identificou e caracterizou 72 genes da família MADS-box nesta espécie, bem como possíveis expansões ou retrações da família, e a partir destes dados, inferir possíveis explicações para a morfologia floral distinta encontradas dentro do gênero Passiflora. Oito genes foram relacionados ao desenvolvimento de estames e carpelos. Análises da expressão diferencial destes genes revelaram um papel potencial na diversificação das estruturas florais em Passilfora.

(8)

they affected the evolutionary process. In order to study these subjects, it was necessary to use studies in the field of developmental biology. These studies have led to the description of several regulatory genes that control many developmental processes in all organisms. Some of these genes are part of a multigenic family called MADS-box, which among the angiosperms, is responsible for regulating various processes of its development, among them the floral development. Doubling or loss paralogs of MADS-box may alter the pattern of development of floral structures. The genus Passiflora is one of the groups of angiosperms that has individuals that produce complex structures whose origins have not yet been elucidated, such as the corona filaments. The present work identified and characterized 72 genes of the MADS-box family in this species, as well as possible expansions or retractions of the family, and from this data, to infer possible explanations for the distinct floral morphology found within the genus Passiflora. Eight genes were related to the development of stamens and carpels. Analyzes of the differential expression of these genes revealed a potential role in the diversification of floral structures in Passiflora.

(9)

Genes MADS-box de Arabidopsis thaliana: AP1 APPETALA 1 AP2 APETALA 2 AP3 APETALA 3 AG AGAMOUS CAL CAULIFLOWER FUL FRUITFULL PI PISTILLATA STK SEEDSTICK SHP SHATTERPROOF SEP SEPALLATA TM6 TOMATO 6 GOA GORDITA TT16 TRANSPARENT TESTA 16

Genes MADS-box de Passiflora organensis:

PoAP1 APPETALA 1 PoAP2 APETALA 2 PoAP3 APETALA 3

PoAG AGAMOUS

PoPIci PISTILLATA com íntrons PoPIsi PISTILLATA sem íntrons

PoSTK SEEDSTICK

PoSHP SHATTERPROOF

PoSEP SEPALLATA

PoTM6 TOMATO 6

PoGOA GORDITA

PoTT16 TRANSPARENT TESTA 16

RT-qPCR e RT-PCR:

Ct Cycle Threshold (ciclo no qual a reação atinge o limiar da fase exponencial)

FW Primer no sentido ‘forward’ RV Primer no sentido ‘reverse’ Tm Temperatura de anelamento

Genes de referência:

CAC Clathrin adaptor complex; ADAPTOR PROTEIN-2 SAND SAND family protein;

MONENSIN SENSITIVITY1

(10)

RESUMO ABSTRACT

LISTA DE ABREVIATURAS E SIGLAS

INTRODUÇÃO GERAL ... 11

OBJETIVOS GERAIS ... 18

OBJETIVOS ESPECÍFICOS ... 19

CAPÍTULO I: Identificação dos genes ortólogos aos genes da família MADS-box em Passiflora organensis ... 20 Resumo ... 20 Abstract ... 20 Introdução ... 21 Objetivos ... 25 Materiais e métodos ... 25 Material genômico ... 25

Identificação dos genes da família MADS-box em Passiflora organensis ... 25

Caracterização estrutural dos genes MADS-box de Passiflora organensis... 26

Resultados e discussão ... 27

Identificação e filogenia dos genes MADS-box de Passiflora organensis... 27

Estrutura gênica dos genes MADS-box de Passiflora organensis ... 30

CAPÍTULO II: Identificação dos genes de classe B da família MADS-box em Passiflora organensis ... 32 Resumo ... 32 Abstract ... 32 Introdução ... 33 Objetivos ... 34 Materiais e métodos ... 34 Material genômico ... 34

Identificação dos genes de classe B da família MADS-box em Passiflora organensis ... 34

Caracterização estrutural dos genes de classe B da família MADS-box de Passiflora organensis ... 35

(11)

Estrutura gênica dos genes de classe B de Passiflora organensis ... 44

CAPÍTULO III: Validação do gene PoPIsi em Passiflora organensis ... 49

Resumo ... 49 Abstract ... 49 Introdução ... 49 Objetivos ... 51 Materiais e métodos ... 51 Resultados e discussão ... 54

CAPÍTULO IV: Caracterização do padrão de expressão dos genes de classe B da família MADS-box em Passiflora organensis ... 59

Resumo ... 59 Abstract ... 59 Introdução ... 60 Objetivos ... 60 Materiais e métodos ... 60 Material vegetal ... 60

Microscopia de varredura (MEV) ... 60

Extração de RNA, síntese de cDNA e RT-qPCR ... 61

Resultados e discussão ... 66

Rt-qPCR ... 66

Conclusões Gerais ... 81

Bibliografia ... 81

(12)

INTRODUÇÃO GERAL

As angiospermas dominam os ambientes terrestres com um número estimado de 295.383 espécies, as quais representam quase 95,8% de todas as plantas vasculares conhecidas atualmente. Elas fazem parte do grupo vegetal mais diverso e que obteve o maior sucesso evolutivo até hoje (Christenhusz e Byng 2016). Uma série de eventos ao longo da evolução contribuiu para tal sucesso, contudo existe um número considerável de evidências que sugerem que dentre todos os eventos que favoreceram o sucesso das angiospermas, o mais determinante deles foi o desenvolvimento das flores, isso porque elas são as principais responsáveis pela atração de polinizadores. Em outras palavras, as flores foram capazes de ‘terceirizar e fidelizar o processo de polinização’ (Sazima e Sazima 1978; Fenster et al. 2004; Theissen e Melzer 2007; Zhu et al. 2017). As flores são as estruturas reprodutivas das angiospermas, e a maioria delas apresenta uma estrutura típica organizada em quatro círculos concêntricos, chamados verticilos. O primeiro e mais externo desses verticilos é formado pelas sépalas, cuja função geralmente é a proteção dos outros órgãos florais até a antese. Em seguida estão as pétalas, as quais geralmente são pigmentadas e vistosas, uma vez que sua principal função é a atração de polinizadores. Esses dois primeiros verticilos envolvem os dois últimos, formados pelas estruturas reprodutivas masculina e feminina, sendo estas os estames e carpelos, respectivamente (Figura 1a).

Essa organização floral é a encontrada em flores de Arabidopsis thaliana (Coen e Meyerowitz 1991). Por ser uma planta de fácil cultivo e manutenção, e principalmente por ter sido a primeira espécie vegetal que teve seu genoma completamente sequenciado (Arabidopsis Genome Initiative 2000), A.thaliana é o organismo modelo para estudos de biologia vegetal. Nos últimos dezoito anos essa espécie foi intensamente estudada o que fez com que inicialmente uma parte considerável dos modelos experimentais fossem desenvolvidos com base nos seus mecanismos genéticos e fisiológicos (Bevan e Walsh 2005). O processo do desenvolvimento floral, portanto, não foi diferente. Em 1991, Coen e Meyerowitz propuseram um modelo molecular para o desenvolvimento floral, chamado de modelo ABC, o qual foi criado com base em estudos de mutantes homeóticos de A.thaliana, nos quais as identidades dos órgãos florais são diferentes. Em A.thaliana existem três classes de mutantes, A, B e C (Figura 1). Os mutantes de classe A apresentam carpelos ao invés de sépalas no primeiro verticilo, e estames ao invés de pétalas no segundo verticilo (Figura1b). Mutantes de classe B têm sépalas no lugar das pétalas no segundo verticilo, e carpelos no lugar dos estames no terceiro verticilo (Figura 1c). Os mutantes de classe C, por sua vez, possuem pétalas no lugar dos estames no terceiro verticilo, e sépalas no lugar dos carpelos no quarto verticilo (Coen e Meyerowitz 1991) (Figura 1d).

(13)

A partir dos fenótipos dos mutantes de classes A, B e C sugeriu-se a existência de três classes de genes homeóticos (A, B e C) que controlam a identidade dos órgãos florais. Cada uma das três classes de genes afeta dois verticilos adjacentes. Os genes de classe A (AP1 e AP2) quando expressos sozinhos levam à formação de sépalas no primeiro e mais externo dos verticilos. O segundo verticilo, as pétalas, é formado a partir da expressão combinada dos genes de classe A com os genes de classe B (PI e AP3). A combinação da expressão dos genes de

B A C B C A C A B S P E C C E E C S S C C S P P S

Selvagem Mutante A Mutante B

a

b

c

d

Mutante C

Figura 1: Representação do modelo molecular ABC e os mutantes homeóticos (Coen and Meyerowitz, 1991). a. Modelo ABC de uma flor tipo selvagem; b. Mutante do tipo A em que os dois primeiros verticilos são afetados com as sépalas sendo substituídas por carpelos e as pétalas por estames; c. Mutante do tipo B no qual o segundo e o terceiro verticilos são afetados: pétalas substituídas por sépalas e os estames substituídos por carpelos; d. Mutante do tipo C no qual os estames do terceiro verticilo são substituídos por pétalas e os carpelos do quarto verticilo substituídos por sépalas.

(14)

classe B com os de classe C (AG) dá origem aos estames no terceiro verticilo. O quarto verticilo com os carpelos, por sua vez, surge a partir da expressão exclusiva dos genes de classe C, completando a estrutura da flor (Figura 1a). Além disso, o modelo ABC possui mais duas premissas: (1) a expressão dos genes de classe B independe da expressão dos genes de classes A e C e atividade dessas duas classes gênicas são mutuamente exclusivas; (2) genes de classe C determinam o meristema floral (Theissen et al. 2000).

Posteriormente, através de estudos com transgênicos, descobriu-se que os genes do modelo ABC são necessários, mas não são suficientes para a especificação da identidade dos órgãos florais (Honma e Goto 2001). Além deles, foram incluídas mais duas classes gênicas no modelo inicial, as classes D e E, sendo que os genes de classe D (STK, SHP1 e SHP2) atuam no desenvolvimento dos óvulos no interior dos carpelos, e os genes de classe E (SEPs) participam do desenvolvimento dos quatro verticilos florais (Pelaz et al. 2000; Pinyopich et al. 2003). Dessa forma o modelo original foi expandido para ABCDE (Theißen e Saedler 2001) (Figura 2). Todos os genes do modelo, com exceção de APETALA2 (AP2) pertencem à uma família multigênica chamada MADS-box, que em A.thaliana apresenta 107 membros até o momento (Theißen 2001; Parenicova 2003). Esse número é resultado de pelo menos duas duplicações totais do genoma e diversas outras duplicações gênicas independentes (Purugganan et al. 1995; Theißen e Saedler 2001; Becker e Theißen 2003; Martinez-Castilla e Alvarez-Buylla 2003; Nam et al. 2003; Zahn et al. 2005).

Figura 2: Representação esquemática do modelo molecular ABCDE expandido demonstrando o conjunto de classes de genes envolvidos na determinação da identidade e organização de cada órgão floral (Adaptado de Theißen e Saedler 2001; Zahn et al. 2005).

(15)

Nas últimas décadas, estudos de biologia genética e evolutiva do desenvolvimento (‘evodevotica’), mostraram que os mecanismos moleculares capazes modificar a morfologia de um indivíduo sempre ocorrem a partir da alteração dos padrões de expressão de genes que atuam na regulação e no controle do desenvolvimento. Existem dois mecanismos principais capazes de alterar o padrão de expressão de um gene. O primeiro deles (1) se dá através da alteração das suas regiões regulatórias com o acumulo de mutações não deletérias. O segundo mecanismo (2), por sua vez, ocorre através da duplicação de genes que codificam fatores de transcrição seguida de diversificação (sub- ou neofuncionalização) das suas regiões regulatórias e/ou codificadoras.

Genes duplicados, por sua vez, podem surgir a partir de diferentes formas, sendo que as principais delas são a poliploidização, a duplicação segmentada ou in tandem, e a transposição. Geralmente, após serem duplicados, a maioria das cópias gênicas acumulam mutações deletérias em suas regiões codificadoras ou regulatórias, o que resulta na perda de função ou no seu silenciamento (Nei e Roychoudhury 1973; Lynch 2000). Entretanto, algumas cópias podem ‘sobreviver’. Com mais cópias de um mesmo gene presentes no genoma, existe mais material genético disponível para que novas funções sejam geradas a partir do mecanismo (1) de alteração do padrão de expressão explicado anteriormente, sem que haja a perda da função ‘ancestral’, dando origem a novos genes (Des Marais e Rausher 2008).

Em plantas, esses eventos de duplicação que favorecem o “nascimento” de novos genes são bem mais comuns do que em animais: em plantas já foram identificados pelo menos 12 grandes eventos de duplicação enquanto que em animais foram identificados apenas 3 (Murat et al. 2012). A principal hipótese para explicar essa diferença entre as linhagens e a maior plasticidade genômica das plantas é o fato de que em animais, a presença precoce dos sistemas de cromossomos sexuais X/Y ou Z/W em praticamente todas as linhagens deste reino, com exceção de invertebrados, alguns peixes e anfíbios, podem fazer com que eventos de duplicação (principalmente duplicações totais do genoma) tenham efeito deletério, uma vez que os cromossomos sexuais, por não serem homomórficos, ficam sujeitos ao efeito da catraca de Muller mesmo que as populações se reproduzam sexuadamente, pois os cromossomos sexuais não podem sofrer recombinação (Murat et al. 2012).

Essa maior plasticidade do genoma vegetal (quando comparado ao genoma animal), portanto, permite que uma rede maior de genes possa interagir de formas diferentes, gerando padrões de expressão distintos que podem afetar o fenótipo das plantas. Isso é observável, por exemplo, no padrão morfológico dos órgãos florais estabelecido pela expressão dos genes da família MADS-box.

(16)

Em teoria, todas as flores, independente da espécie, deveriam ter seus órgãos florais organizados de acordo com o modelo ABCDE. Contudo, na natureza esse padrão sofre variações em diversos grupos de angiospermas. As espécies de Zingiberaceae apresentam estames petaloides (Bartlett e Specht 2010), orquídeas possuem o labelo (uma pétala modificada) (Mondragón-Palomino e Theißen 2008), etc. Estas estruturas que a princípio não são explicadas pelo modelo molecular ABCDE, podem ser consideradas novidades evolutivas e foram relacionadas com duplicações gênicas seguidas de divergência de função de membros da família gênica MADS-box pertencentes à classe B (Kim et al. 2004; Hernández-Hernández et al. 2007; Rijpkema et al. 2010).

Outro exemplo de morfologia floral distinta é encontrado entre as flores do gênero Passiflora. Desde que foram descritas pela primeira vez nas Américas por exploradores europeus no século XVI, e durante o século seguinte, as flores de Passiflora foram motivo de fascínio e interesse principalmente dos colecionadores de plantas. Parte dessa fama era devida a grande diversidade de formas e cores de suas espécies, mas o principal motivo para tamanha evidência na época, na realidade era o simbolismo atribuído às suas flores. Quando foram descritas as primeiras espécies de Passiflora, a morfologia floral destas foi relacionada à crucificação de Cristo (Ulmer e MaCDougal 2004). Algumas ilustrações produzidas durante o século XVII pelos europeus representavam as flores de Passiflora com coroas de espinhos no lugar do que hoje chama-se de filamentos da corona, uma analogia a coroa de espinhos usadas por Cristo no momento de sua crucificação. As cinco pétalas e cinco sépalas representavam os dez discípulos fiéis (Judas e Pedro desconsiderados), os cinco estames, representavam os ferimentos e os três estigmas representavam os três pregos utilizados para pregar Cristo na cruz (Ulmer e MaCDougal 2004). Além disso, muitas espécies florescem de novembro à meados de abril, período no qual ocorrem as celebrações religiosas da Páscoa. Essa relação da morfologia floral com a religião foi tão forte na época, que o nome designado ao gênero dessas plantas foi Passiflora, que em sua etimologia significa ‘flor da paixão’, referente à paixão de Cristo (Ulmer e MaCDougal 2004).

Atualmente o gênero Passiflora (Passifloraceae) é representado por mais de 600 espécies, sendo o maior dentro da família Passifloraceae. Inicialmente acreditava-se que o gênero Passiflora poderia ser subdividido em aproximadamente 23 subgêneros (Ocampo et al. 2015), entretanto estudos recentes sugerem que Passiflora pode ser organizado em apenas 4 subgêneros: Astrophea (~60 espécies), Deidamioides (13 espécies), Decaloba (~215 espécies) e Passiflora (~240 espécies) (Hansen et al. 2006; KUBITZKI 2007; Muschner et al. 2012).

(17)

As plantas de Passiflora são essencialmente tropicais, reconhecidas por sua morfologia floral particular que geralmente apresenta um ou mais verticilos de estruturas filamentosas entre as pétalas e os cinco estames, chamados de corona, e um androginóforo que corresponde a uma coluna no centro da flor que eleva o androceu e o gineceu (Figura 3) (Schmid et al. 1995).

As espécies do subgênero Decaloba (objeto de estudo deste trabalho) geralmente são pequenas trepadeiras, com flores e frutos igualmente pequenos. Entre elas está a Passiflora organensis, uma espécie nativa da Serra dos Órgãos, Rio de Janeiro, Brasil. Suas folhas, durante a fase juvenil, podem ter dois ou três lóbulos e apresentam pontuações ou manchas de cor verde clara ou mesmo prateadas, sobre as três nervuras centrais na face adaxial, além de uma coloração arroxeada na face abaxial (Figuras 4A, 4B).

Figura 3: Esquema de um corte longitudinal de uma flor de Passiflora.

Estigma Ovário Estame Androginóforo Corona Pétala Sépala

(18)

Durante as fases adultas vegetativa e reprodutiva, as plantas passam a produzir gavinhas, suas folhas passam a ter apenas dois lóbulos, as manchas verde claras ou prateadas desaparecem, e surgem nectários extraflorais na face abaxial (Figuras 4C e 4D). Esses nectários extraflorais atraem outros organismos, como algumas espécies de formigas, que protegem a planta contra ataques de herbívoros ao patrulharem a planta em busca de néctar como recurso alimentar (Coley e Barone 1996; Agosti e Alonso 2000; Cogni et al. 2003; McGarry e Ayre 2012). As flores de P.organensis são pequenas, chegando a no máximo 5 cm de diâmetro, com sépalas e pétalas cremes, enquanto que os filamentos da corona são roxos, com pontas e base brancas (Figura 5) (Ulmer e MaCDougal 2004).

Figura 4: Folhas de P.organensis nas fases juvenil (A, B) e adulta (C, D). A. Face adaxial da folha juvenil com as manchas prateadas características da fase juvenil; B. Face abaxial da folha juvenil apresentando coloração arroxeada característica da espécie; C. Face adaxial de folha na fase adulta, sem a presença das manchas prateadas, com gavinha na axila (marcador da fase adulta)e uma fileira na região mediana da folha com as marcas dos nectários extraflorais, sendo um outro marcador da fase adulta; D. Face abaxial de folha na fase adulta, com a presença de nectários extraflorais evidentes e manutenção da coloração roxa. Fotos: Helena A. Gioppato

A B

(19)

Assim como os estames petaloides de espécies de Zingiberaceae e o labelo das orquídeas, os filamentos da corona em Passiflora também não se encaixam no modelo ABCDE e a identidade desse órgão floral ainda não é bem compreendida (Hemingway et al. 2011).

Neste contexto e considerando o fato de que P.organensis já possui seu genoma sequenciado por nosso grupo, o presente trabalho pretende identificar e caracterizar ortólogos dos genes da família MADS-box em P.organensis, além de caracterizar o padrão de expressão de alguns genes dessa família. A hipótese central deste trabalho é que variações no padrão de expressão de membros da família MADS-box da classe B estejam relacionadas com o desenvolvimento dos filamentos da corona. Para testar esta hipótese serão empregadas ferramentas apropriadas ao estudo do desenvolvimento floral, que incluem técnicas de bioinformática e análises de expressão gênica.

OBJETIVOS GERAIS

Identificar e caracterizar ortólogos dos genes da família MADS-box em P.organensis, bem como caracterizar o padrão de expressão dos genes de classe B dessa família.

(20)

OBJETIVOS ESPECÍFICOS

A partir da caracterização dos ortólogos da família MADS-box e do padrão de expressão dos genes de classe B desta mesma família gênica, o presente trabalho visa contribuir para a compreensão dos mecanismos moleculares envolvidos no desenvolvimento dos filamentos da corona.

(21)

4. CAPÍTULO I

Identificação dos genes ortólogos aos genes da família MADS-box

em Passiflora organensis

Resumo

Estudos de evodevótica levaram à descrição de vários genes reguladores que controlam diversos processos de desenvolvimento em todos os organismos. Alguns deles fazem parte de uma família multigênica chamada MADS-box. Entre as angiospermas, vários processos de seu desenvolvimento são controlados por genes da MADS-box, os quais atuam como seletores homeóticos. Como exemplo, todos os genes do modelo molecular ABC, com exceção do gene APETALLA2 (AP2), são genes MADS-box e são responsáveis pelo controle das fases vegetativa e reprodutiva, e também pelo desenvolvimento e pela arquitetura floral. Sendo assim, determinou-se que as mudanças na estrutura de um gene MADS-box, no seu padrão de expressão e/ou da sua função foram as principais causas de inovações no desenvolvimento reprodutivo na evolução das plantas. Considerando portanto a grande relevância desta família gênica nos processos de desenvolvimento vegetal, especialmente no desenvolvimento floral, e também o seqüenciamento recente do genoma da espécie Passiflora organensis, este capítulo é inteiramente focado na análise da família MADS-box como um todo em P.organensis. Foram identificados cerca de 70 genes da família MADS-box, com representantes das principais subfamílias já caracterizadas em plantas modelo. Análises de expansão e retração do número de parálogos em cada subfamília aponta para uma possível relação entre a evolução da família MADS-box e a diversificação floral em Passiflora.

Abstract

Studies of evodevotics lead to the description of several regulatory genes that control developmental processes in all organisms. Some of them are all part of a multigenic family called MADS-box. Among the angiosperms, several processes of their development are controlled by MADS-box genes that act as a homeotic selector. As an example, all genes of the ABC molecular model, except for the APETALLA2 (AP2) gene, are MADS-box genes and they are responsible for the control of vegetative and reproductive phases, and also for the floral development and architecture. By that information, it has been assumed that changes in MADS-box gene structure, expression pattern and/or function have been the main cause of innovations in reproductive development during plant evolution. Considering the high relevance of the

(22)

MADS-box gene family in plant developmental processes, especially in floral development, and also the recent genome sequencing of a Passiflora species, Passiflora organensis, by our group, this chapter is entirely focused on the analysis of the MADS-box family as a whole in P.organensis. About 70 genes of the MADS-box gene family were identified, with representatives of the main subfamilies already characterized in model plants. Analyzes of expansion and retraction of the number of paralogs in each subfamily points to a possible relationship between the evolution of the MADS-box family and floral diversification in Passiflora.

Introdução

Inicialmente os estudos de biologia do desenvolvimento e evolução eram duas frentes distintas de abordagens biológicas que não se relacionavam. Além disso, acreditava-se que a evolução era a única responsável pela diversidade das formas da natureza. Contudo, nas últimas três décadas essas duas frentes da biologia (desenvolvimento e evolução) passaram a ser estudadas em conjunto com o auxílio das abordagens genéticas, no que hoje chama-se de genética evolutiva do desenvolvimento, ou ‘evodevótica’. (Theissen et al. 2000). Os estudos nessa área mostraram que existe uma relação entre os genes (genótipo) e as estruturas (fenótipo), além de explicar como essa relação se comporta ao longo da evolução. Dessa forma, todo o processo do desenvolvimento fenotípico de um ser vivo passou a ser interpretado como o resultado de uma rede de genes que dão as instruções sobre a morfologia, em conjunto com sinais, tanto endógenos quanto ambientais, para dar origem às formas que se encontram na natureza (Theissen et al. 2000). Dessa forma é possível dizer que a diversidade e a complexidade dos organismos são o produto resultante não apenas de processos evolutivos como acreditava-se, mas sim da relação entre a evolução e processos do desenvolvimento.

Além de tais esclarecimentos, os estudos de evodevótica também levaram a descoberta de que genes regulatórios que codificam fatores de transcrição são responsáveis pelo controle dos processos de desenvolvimento de animais, plantas e fungos (Theissen et al. 2000).

Alguns desses genes regulatórios fazem parte de uma família multigênica chamada de família MADS-box. Esta é encontrada tanto em animais e fungos quanto em plantas, fato este que sugere que o ancestral comum desses três grupos provavelmente apresentava ao menos um gene MADS-box e, portanto, a família tem no mínimo 1 milhão de anos (Theißen et al. 1996).

Análises filogenéticas estabeleceram que os genes MADS-box de animais e fungos são divididos em dois grupos: MADS-box do tipo SRF (SERUM RESPONSE FACTOR-like), que atuam principalmente na diferenciação celular nos mamíferos; e os MADS-box do tipo MEF2

(23)

(MYOCYTE ENHANCER FACTOR2-like), que atuam na diferenciação celular de músculos (Theißen et al. 1996; Theissen et al. 2000). Diferentemente dos animais que possuem apenas dois genes MADS-box, as plantas possuem algumas dezenas deles. Com o sequenciamento completo do genoma de A.thaliana (Arabidopsis Genome Initiative 2000) foi possível identificar 107 MADS-box (Theißen 2001; Parenicova 2003). Além de A.thaliana, os genes da família MADS-box foram identificados em diversas outras espécies de plantas, como por exemplo Populus trichocarpa: 102 genes MADS-box (Leseberg et al. 2006); uva (Vitis vinífera): 58 genes (Diaz-Riquelme et al. 2009); arroz (Oryza sativa): 75 genes MADS-box (Arora et al. 2007) ; e maçã (Malus domestica): 146 genes MADS-box (Tian et al. 2015). Isso se deve à uma série de eventos de duplicações gênicas ou até mesmo do genoma todo, pelos quais as plantas passaram ao longo da evolução (Purugganan et al. 1995; Becker e Theißen 2003; Martinez-Castilla e Alvarez-Buylla 2003; Nam et al. 2003)

Todos os membros da família MADS-box codificam fatores de transcrição com grande importância nos processos do desenvolvimento (Schwarz-Sommer et al. 1990a; Riechmann e Meyerowitz 1997; Becker e Theißen 2003). Além disso, existe um domínio de reconhecimento e ligação ao DNA, chamado domínio MADS-box, comum a todos os membros da família, e que deu nome à ela, sendo um acrônimo referente aos quatro primeiros membros encontrados e identificados (MCM1 identificado em Saccharomyces cerevisiae; AGAMOUS identificado em Arabidopsis thaliana; DEFICIENS identificado em Antirrhinum majus;SRF identificado em Homo sapiens).

Nas plantas, genes MADS-box atuam como reguladores importantes em diversos processos do desenvolvimento vegetal (Schwarz-Sommer et al. 1990b; Riechmann e Meyerowitz 1997; Becker e Theißen 2003). Entre as angiospermas, todos os genes do modelo ABC, com exceção dos gene APETALLA2 (AP2) fazem parte dessa família (Theißen et al. 1996; Riechmann et al. 2000; Theißen 2001; Melzer et al. 2014). Outros grupos vegetais, como briófitas, pteridófitas e gimnospermas, também possuem genes da família MADS-box, entretanto as funções ainda são pouco conhecidas (Becker et al. 2000; Shepard e Purugganan 2002; Chen et al. 2017a; Ruelens et al. 2017).

Levando em consideração a relevância e a quantidade de genes que pertencem à família MADS-box em plantas, diversos estudos vêm sendo conduzidos a fim de entender e explicar melhor sua origem, evolução e funções.

De acordo com análises filogenéticas, estabeleceu-se que os MADS-box de plantas são divididos em duas linhagens, MADS-box do tipo I e do tipo II, e que os membros de cada linhagem são ortólogos dos genes SRF e MEF2, respectivamente, de animais e fungos

(24)

(Henschel et al. 2000; Gramzow e Theissen 2010). Cada uma dessas duas linhagens passou por diferentes pressões seletivas ao longo da evolução. Existem evidências de que os genes MADS-box do tipo I tem uma taxa maior de “nascimento e morte” gênicas e estão sob uma menor pressão purificadora do que os MADS-box do tipo II, os quais possivelmente, após eventos de duplicação, adquiriram novas funções em um curto período de tempo enquanto que os genes do tipo I, não (Nam et al. 2004). Dessa forma, deleções de genes redundantes pouco importantes para o desenvolvimento vegetal não gerariam grandes problemas (Nam et al. 2004).

Em A.thaliana, os genes MADS-box que fazem parte da linhagem tipo I possuem um ou nenhum íntron e na sua estrutura proteica existem apenas dois domínios: domínio MADS-box, o qual é extremamente conservado; e o domínio C-terminal, muito pouco conservado (Figura 6) (Alvarez-Buylla et al. 2000; De Bodt et al. 2003; Parenicova 2003). Essa linhagem ainda é subdividida em quatro outros subgrupos: Mα, Mγ, Mβ e Mδ (Figura 7) (Parenicova 2003). Em plantas, os genes dessa linhagem também são chamados de ‘M-type genes’ e as funções dos membros de toda essa linhagem foi pouco estudada até o momento.

Já os genes MADS-box de tipo II fazem parte da linhagem que em animais corresponde ao gene MEF2 e são divididos em dois subgrupos: MIKCC e MIKC* (Figura 7) (Parenicova 2003). A estrutura proteica destas duas linhagens apresenta quatro domínios bem característicos que se distribuem desde a região N-terminal até a C-terminal, sendo eles: domínio MADS-box (M), que é considerado o mais conservado e que codifica uma região de ligação ao DNA (Riechmann e Meyerowitz 1997); o domínio intermediário (I), domínio queratina-like (K); domínio caboxiterminal (C) que é o mais variável e divergente (Figura 6) (Purugganan et al. 1995). Devido a extrema conservação da organização modular nesses domínios, a linhagem do tipo II também é denominada MIKC (Parenicova 2003).

Os genes MIKC (linhagem tipo II), diferentes dos da linhagem tipo I, foram extensamente estudados e, portanto, suas funções já são conhecidas e caracterizadas. Os genes dessa linhagem podem ser divididos em dois clados: MIKCC e MIKC* (Parenicova 2003), com

base na divergência das sequências do domínio I, sendo que nos genes do subgrupo MIKC* este domínio é maior (Henschel et al. 2002; Verelst et al. 2006) (Riese et al. 2005).

(25)

Os genes MIKCC já foram identificados na maioria dos principais grupos vegetais (angiospermas, gimnospermas, pteridófitas e briófitas) e vários deles participam do desenvolvimento floral, da regulação das fases vegetativa e reprodutiva e do desenvolvimento de frutos (Bowman et al. 1993; Alvarez-buylla et al. 2000; Theißen 2001; Becker e Theißen 2003; Kaufmann et al. 2005). Já os genes MADS-box MIKC* foram originalmente identificados em exemplares de briófitas, e também estão presentes em A.thaliana (Kofuji et al. 2003). Suas funções não são tão bem compreendidas como as dos genes MIKCC, contudo existem evidências de que A.thaliana possui 6 genes MIKC* que apresentam papel fundamental no desenvolvimento dos grãos de pólen (Verelst et al. 2006, 2007; Adamczyk e Fernandez 2009).

~ 60 aminoácidos ~ 50 aminoácidos ~ 70 aminoácidos ~ 40 aminoácidos

Tipo II

Tipo I

Adaptado de Alvarez-Buylla et al., 2000

Figura 6: Estrutura proteica das duas principais linhagens dos genes da família MADS-box.

MADS-box Mγ Mα Tipo I Mβ Tipo II ou MIKC Mδ MIKC* MIKCC

(26)

Considerando a grande relevância desta família gênica no desenvolvimento vegetal e principalmente no desenvolvimento floral como apresentado acima, além do recente sequenciamento de uma espécie de Passiflora, Passiflora organensis, por nosso grupo, este capítulo está inteiramente voltado para a análise da família MADS-box como um todo em P.organensis.

Objetivos

Os objetivos deste capítulo são a identificação e caracterização de todos os ortólogos dos genes da família MADS-box em Passiflora organensis a partir de comparações com os genes da mesma família de Arabidopsis thaliana em termos filogenéticos e estruturais.

Materiais e métodos Material genômico

Nosso grupo obteve recentemente o sequenciamento completo do genoma de três genótipos de P. organensis (Dornelas et al. publicação em preparação). Um genoma consensual para a espécie, com cobertura de pelo menos 80x/base está em fase de anotação, mas já disponível para busca de sequências por similaridade, com o uso do algoritmo BLAST (Altschul et al. 1997; Proost et al. 2009; Van Bel et al. 2012). Os membros da família MADS-box foram obtidos através de uma abordagem já utilizada anteriormente pelo nosso grupo (Dornelas e Rodriguez 2001; Dornelas et al. 2007) através da utilização de bait-sequences e Markov-Montecarlo Chain search, com o uso do consenso da região conservada de reconhecimento de DNA das proteínas MADS, gerada pelo programa COBBLER (Consensus Biasing By Locally Embedding Residues, http://blocks.fhcrc.org/blocks/cobbler.html) com a utilização do Phytozome v. 9.1 (Goodstein et al. 2012) e PLAZA (Van Bel et al. 2012) para a obtenção das sequências conservadas.

Identificação dos genes da família MADS-box em Passiflora organensis

A predição total dos genes de P.organensis foi feita através do uso do banco de dados de sequenciamento do genoma dessa espécie (dados ainda não publicados, Prof. Dr. Marcelo Dornelas, IB/UNICAMP) e o software Augustus (versão 3.2.3, Keller, Kollmar, Stanke, & Waack, 2011) para as três bibliotecas existentes. Em seguida, a partir dos modelos gênicos dos genes MADS-box de A.thaliana, foi feita a predição de todos os possíveis genes ortólogos da família MADS-box dentro de cada biblioteca através do uso do algoritmo BLASTp (Altschul et al. 1997) utilizando-se como sequências isca as sequências proteicas de A.thaliana. A partir dos

(27)

resultados obtidos, cada um dos candidatos a MADS-box foi avaliado através de um BLASTp

feito no National Center for Biotechnology Information

(https://blast.ncbi.nlm.nih.gov/Blast.cgi). A biblioteca LB15042 foi escolhida como primeira a ser analisada.

Após a identificação das sequências corretas, o software BioEdit foi utilizado para a busca dos genes candidatos dentro de cada contig indicado nos resultados das análises anteriores. A partir de um arquivo de texto gerado para as sequências de DNA com tradução dos quadros abertos de leitura, foi possível identificar e caracterizar a estrutura de cada gene estudado.

A confirmação da identidade dos genes de P.organensis foi obtida através de uma análise filogenética em que as sequências proteicas resultantes dos genes que foram previamente identificados, foram alinhadas e com as sequências proteicas dos genes da família MADS-box de A.thaliana. A filogenia foi construída a partir de um alinhamento no qual todas as proteínas MADS-box encontradas no genoma de P.organensis foram alinhadas de maneira múltipla global às proteínas MADS-box de A.thaliana usando o algoritmo L-INS-i do software MAFFT v7 (Katoh e Standley 2013). Este algoritmo de alinhamento iterativo permite o melhor alinhamento de genes muito variáveis nas regiões fora dos domínios, reduzindo a penalidade de gaps.

O alinhamento das proteínas produtos dos genes MADS-box foi submetido ao ajuste de modelo de substituição de aminoácidos, usando o teste “ModelFinder” (Kalyaanamoorthy et al. 2017) implementado no software IQ-TREE v1.5.4 (Nguyen et al. 2015). Seguindo o critério AKAIKE, o modelo de maior ajuste foi o JTT+F+G4, usado em seguida na reconstrução filogenética. A filogenia, por fim, foi reconstruída pelo método de Máxima Verossimilhança do software IQ-TREE v1.5.4 (Nguyen et al. 2015) com teste de sustentação de ramos por bootstraps, usando 1000 repetições.

A partir da filogenia, foi possível inferir possíveis eventos de duplicações ou perdas gênicas nas duas espécies, sendo que os dados apresentados são referentes à comparação entre P.organensis e A.thaliana, ou seja, uma expansão em uma das duas espécies só é uma expansão se comparada à outra incluída na análise, o que não significa que é uma expansão em relação a outros grupos de plantas não incluídos na filogenia.

Caracterização estrutural dos genes MADS-box de Passiflora organensis

A caracterização estrutural dos genes MADS-box foi feita a partir de uma busca pela sequência proteica dentro do arquivo de texto com a tradução dos quadros abertos de leitura

(28)

gerado para cada uma das sequências de DNA correspondentes, seguida pelo estabelecimento das fronteiras entre éxons e íntrons feito de forma manual através dos resultados obtidos inicialmente pelo software AUGUSTUS (versão 3.2.3, Keller et al., 2011). A checagem dessas fronteiras pré-estabelecidas foi feita de forma preditiva pelo servidor NetGene2Server (DTU Bioinformatics).

O resultado dessa caracterização é um arquivo que contém as informações sobre a sequência, estrutura e tamanho do gene. A partir desses dados, a estrutura gênica pôde ser representada de forma ilustrativa com a utilização do software GSDS 2.0 Gene Structure Display Gene (Hu et al. 2015).

Resultados e discussão

Identificação e filogenia dos genes MADS-box de Passiflora organensis

Através da predição gênica feita pelo software AUGUSTUS, foram encontrados 93406 genes na biblioteca LIB15042, 98938 genes na biblioteca LIB15043 e 98068 genes na biblioteca LIB15044. Em média o genoma de P. organensis possui aproximadamente 96.804 genes preditos. Em seguida, foi feita a predição de todos os possíveis genes MADS-box dentro de cada biblioteca através do BLASTp que resultou nos seguintes valores: biblioteca LB15042 possui 104 possíveis genes MADS-box; biblioteca LB15043 possui 110 possíveis genes MADS-box; biblioteca LB15044 possui 106 possíveis genes MADS-box. A partir destes dados iniciais, partimos do princípio de que existem por volta de uma centena de genes desta família em P.organensis, contudo, assim como o número de genes totais, é provável que este valor esteja bem acima da realidade, mas serve como um ponto de partida.

Inicialmente as três bibliotecas estavam sendo analisadas de forma simultânea, com uma checagem manual de todos os 320 possíveis MADS-box. Entretanto, por questões de tempo, decidiu-se analisar uma biblioteca por vez, sendo que a primeira a ser totalmente analisada foi a LB15042. A escolha desta como sendo a primeira deve-se a menor presença de sequências incompletas, fato identificado previamente quando as três bibliotecas ainda estavam sendo analisadas em conjunto.

A partir da busca pelos ortólogos dos genes MADS-box no banco de dados de P.organensis criado a partir de seu genoma sequenciado, das 104 sequências dos possíveis genes MADS-box sugeridos pela predição gênica na biblioteca LB15042, apenas 72 de fato fazem parte dessa família gênica e estão com suas sequências completas.

De acordo com as análises filogenéticas, dos 72 MADS-box encontrados até o momento, 32 deles fazem parte do tipo I e 40 do tipo II. Tanto em P.organensis quanto em

(29)

A.thaliana, o subgrupo da família MADS-box que mais sofreu expansão foi o Mα, enquanto que P.organensis apresentou mais retrações em relação a A.thaliana (Figura 8, Tabela 1).

Por serem mais estudados, expansões e retrações de subgrupos de MADS-box de tipo II são mais significativas para questões biológicas e por isso esse grupo será discutido com mais detalhamento, especialmente os subgrupos que fazem parte do modelo molecular ABC (Parenicova 2003; Litt e Kramer 2010).

Figura 8: Filogenia de todos os genes MADS-box encontrados no genoma de P.organensis juntamente com os genes desta mesma família de A.thaliana. Os clados identificados em tons de azul fazem parte do grupo dos MADS-box de tipo I (Mα, Mγ, Mβ e Mδ) enquanto que os demais fazem parte do grupo de tipo II (MIKC* e MIKCC), divididos em seus subgrupos. Os genes de P.organensis são indicados por cores distintas. Círculos coloridos representam expansões de P.organensis em relação a A.thaliana; círculos pretos representam expansões de A.thaliana em relação a P.organensis; triângulos coloridos representam retrações de P.organensis em relação a A.thaliana; e triângulos pretos representam retrações de A.thaliana em relação a P.organensis.

(30)

MADS-box do tipo II

Dentre os genes deste grupo, foram encontrados 16 ortólogos dos genes que fazem parte do modelo ABCDE em A.thaliana, sendo eles um APETALA 1 – AP1, (classe A), dois PISTILLATAS - PI, três APETALA 3 – AP3, um TRANSPARENT TESTA 16 – TT16, um GORDITA - GOA (classe B), um AGAMOUS - AG (classe C), três SEEDSTICK -STK , e quatro SEPALLATA - SEP (classe E). Em relação à A.thaliana, a classe B de P.organensis foi a que sofreu a maior expansão, pois em A.thaliana existem apenas um gene AP3 e um gene PI.

Em relação a retrações, a comparação entre as duas espécies mostra que este tipo de evento ocorreu apenas em P.organensis, sendo uma delas nos MADS-box do tipo I, no subgrupo Mγ, e as outras duas nos MADS-box do tipo II, sendo uma no subgrupo A e outra no subgrupo C/D (Tabela 1).

Tabela 1: Valores de expansões e retrações nos principais grupos das duas grandes linhagens da família MADS-box, tipos I e II, respectivamente.

MADS-box do tipo II

EXPANSÕES P.organensis A.thaliana

A - 1 B 3 - C/D 1 1 E 2 2 FLC - 1 SVP 1 - SVP-like 1 - SOC 1 2 ANR1-like - 1

RETRAÇÕES P.organensis A.thaliana

A 1 - B - - C/D 1 - E - - FLC - - SVP - - SVP-like - - SOC - - ANR1-like - - MADS-box do tipo I

EXPANSÕES P.organensis A.thaliana

Alfa 4 6

Beta - 1

Gama 3 2

Delta 1 -

RETRAÇÕES P.organensis A.thaliana

Alfa - -

Beta - -

Gama 1 -

(31)

Estrutura gênica dos genes MADS-box de Passiflora organensis

A estrutura de cada um dos 72 genes MADS-box encontrados na biblioteca LIB15042 de P.organensis é condizente com o esperado de acordo com a literatura, sendo os MADS-box de tipo I (M-type), com exceção dos Mδ, apresentam um ou nenhum íntron e sua extensão gênica, agora sem nenhuma exceção, varia de menos de 1kb a até quase 3kb (Parenicova 2003) (Figura 10). Mesmo fazendo parte da linhagem tipo I, os genes do subgrupo Mδ apresentam bem mais de um íntron, fato este também relatado na literatura (Parenicova 2003). Entretanto, suas estruturas proteicas não apresentam os quatro domínios característicos dos MADS-box de tipo II, portanto, mesmo com a presença de mais éxons e íntrons, os genes do subgrupo Mδ fazem parte da linhagem tipo I.

Os genes MADS-box de tipo II (MIKC), por sua vez, apresentam vários éxons e íntrons com extensões variando entre pouco mais de 1kb até mais de 15kb (Parenicova 2003) (Figura 9). Em P.organensis, contudo, foi encontrado um gene de classe B que não apresenta nenhum íntron. A veracidade desse dado, assim como suas possíveis origem e consequências para a fisiologia e o desenvolvimento da planta serão abordadas nos próximos capítulos.

Figura 9: Representação gráfica das estruturas gênicas de todos os genes MADS-box do tipo II, também chamados de MIKC, de P.organensis. Os genes deste grupo estão separados nos subgrupos assim como estão dispostos na filogenia da Figura 8.

(32)

Figura 10: Representação gráfica das estruturas gênicas de todos os genes MADS-box do tipo I, também chamados de M-type, de P.organensis. Os genes deste grupo estão separados e identificados com cores diferentes nos subgrupos que foram identificados na filogenia da Figura 8.

(33)

5. CAPÍTULO II

Identificação dos genes de classe B da família MADS-box em

Passiflora organensis

Resumo

Os mecanismos moleculares que deram origem às flores, principal órgão das angiospermas, ainda não são bem conhecidos. Entretanto, sabe-se que alguns membros da família gênica MADS-box desempenham papeis fundamentais nos processos de desenvolvimento floral, atuando principalmente na determinação e na identidade dos órgãos florais. Diversos estudos relacionados à evolução dos genes MADS-box em plantas deixam clara a presença de uma quantidade considerável de eventos de duplicação, seguidos de divergência de funções em membros dessa família, principalmente entre os genes do modelo ABC. De acordo com a literatura, algumas dessas duplicações que afetaram principalmente genes de classe B deste modelo contribuíram para a diversificação da morfologia floral das angiospermas. Neste capítulo foram analisados os genes de P.organensis da linhagem de tipo II do subgrupo B, o qual apresentou mais eventos de expansão. Foram encontrados oito genes pertencentes à esse subgrupo, sendo três parálogos AP3, dois parálogos de PI, um parálogo de GOA, um de TT16 e um parálogos de TM6.

Abstract

The molecular mechanisms that gave rise to flowers, which are the main organs of angiosperms, are still not well known, but there is no doubt that some members of the MADS-box gene family play key roles in floral development processes. Members of the MADS-box family encode transcription factors that are important for several developmental processes, including the floral arrangement of angiosperms. Several studies related to the evolution of MADS-box genes have uncovered the presence of a considerable amount of duplication events, followed by divergence of functions in members of this family, especially among the genes of the ABC model. According to the literature, some of these duplications that mainly affected class B genes of this model contributed to the diversification of floral morphology of angiosperms. This chapter seeks to analyze in more detail the B class genes of the family MADS-box in P.organensis and to suggest possible implications for the floral structure of this group. Were analyzed the genes of type II lineage of subgroup B in P.organensis, once this gene class presented more expansion

(34)

events. Eight genes belonging to this subgroup were found, with three AP3 paralogs, two PI paralogs, one GOA paralog, one TT16, and one TM6 paralog.

Introdução

Devido ao fato de cada tipo de polinizador possuir diferentes morfologias, habitats, necessidades nutricionais e sistemas sensoriais, houve uma pressão seletiva para que as plantas desenvolvessem características que de alguma forma fossem capazes de atraí-los, garantindo maiores chances de reprodução (Hermann e Kuhlemeier 2011). Dessa forma, as características florais, principalmente aquelas relacionadas a morfologia do perianto, podem ser consideradas adaptações para ‘manipular’ o processo de polinização (Fenster et al. 2004).

Como estabelecido pelo modelo ABC, os órgãos que compõem o perianto (sépalas e pétalas) são formados a partir da atividade de genes de três classes do modelo ABCDE clássico, sendo elas as classes A, B e E. As sépalas são resultado da expressão de genes A+E, enquanto que as pétalas são produto da atividade de genes A+E+B (Theißen e Saedler 2001).

Análises filogenéticas mostram que genes da função A foram os últimos integrantes do modelo ABC a surgir e provavelmente evoluíram a partir de genes de classe E (a mais antiga das cinco classes). A função desses genes é produzir pétalas, logo apenas as angiospermas possuem genes de classe A. Sendo assim, por serem muito recentes em termos evolutivos, eles fazem parte da classe com função menos conservada (Litt 2007; Pabõn-Mora et al. 2013; McCarthy et al. 2015). Os genes de classe B, por sua vez, são mais antigos que os de classe A, também sendo encontrados em gimnospermas (Theißen e Becker 2004; Lovisetto et al. 2018; Winter et al. 2018), sendo que nas angiospermas eles participam do desenvolvimento dos estames e das pétalas.

Nas últimas décadas, diversos estudos mostraram que a grande diversidade de morfologias do perianto, como o das orquídeas e espécies da ordem Zingiberales, está relacionada com a atividade de genes de classe B e suas duplicações (Tsai et al. 2005; Bartlett e Specht 2010; Cantone et al. 2011; Chen et al. 2017b).

Dado que as flores de Passiflora apresentam morfologia bastante distinta com características exclusivas do grupo que a princípio não são explicadas pelo modelo ABC clássico, além do registro de que em outros grupos com morfologias florais distintas parte dessa diversificação se deve a duplicações de genes de classe B da família MADS-box (Gioppato e Dornelas 2018), este capítulo está voltado para a análise e caracterização mais detalhadas dos genes MADS-box de classe B já identificados previamente no capítulo anterior.

(35)

Objetivos

Identificar e caracterizar os genes MADS-box de classe B ortólogos em P.organensis e, a partir disso avaliar possíveis eventos de expansão e/ou retração da classe gênica e como tais eventos afetam a morfologia floral.

Materiais e métodos Material genômico

Nosso grupo obteve recentemente o sequenciamento completo do genoma de três genótipos de Passiflora organensis (Dornelas et al. publicação em preparação). Um genoma consensual para a espécie, com cobertura de pelo menos 80x/base está em fase de anotação, mas já disponível para busca de sequências por similaridade, com o uso do algoritmo BLAST (Altschul et al. 1997; Proost et al. 2009; Van Bel et al. 2012). Os membros da família MADS-box foram obtidos através de uma abordagem já utilizada anteriormente pelo nosso grupo (Dornelas e Rodriguez 2001; Dornelas et al. 2007) através da utilização de bait-sequences e Markov-Montecarlo Chain search, com o uso do consenso da região conservada de reconhecimento de DNA das proteínas MADS, gerada pelo programa COBBLER (Consensus Biasing By Locally Embedding Residues, http://blocks.fhcrc.org/blocks/cobbler.html) com a utilização do Phytozome v. 9.1 (Goodstein et al. 2012) e PLAZA (Van Bel et al. 2012) para a obtenção das sequências conservadas.

As sequências proteicas dos genes MADS-box encontrados no genoma de P.organensis, juntamente com as sequências proteicas dos MADS de Arabidopsis thaliana foram alinhadas com o uso do software Clustal X, com uma matriz de penalidades BLOSUM, gap opening cost = 10 e extended gap cost = 0.1. A árvore filogenética foi construída pelo método de agrupamento dos vizinhos – Neighbor-Joing method (Nei e Saitou 1987) utilizando o software MEGA 7 (Kumar et al. 2016). Valores de bootstrap>80% (1000 reamostragens) foram apresentados nos ramos da árvore filogenética.

Identificação dos genes de classe B da família MADS-box em Passiflora organensis A partir da predição total dos genes de P.organensis que foi feita através do uso do banco de dados de sequenciamento do genoma dessa espécie (dados ainda não publicados, Prof. Dr. Marcelo Dornelas, IB/UNICAMP) e do software AUGUSTUS (versão 3.2.3, Keller, Kollmar, Stanke, & Waack, 2011) para as três bibliotecas existentes, seguida pela predição de todos os possíveis genes ortólogos da família MADS-box dentro de cada biblioteca através do uso do algoritmo BLASTp (Altschul et al. 1997) utilizando-se como sequências isca as

(36)

sequências proteicas de A.thaliana, foi possível avaliar cada um dos candidatos através de um BLASTp feito no National Center for Biotechnology Information (https://blast.ncbi.nlm.nih.gov/Blast.cgi) a fim de identificar apenas os genes MADS-box de classe B dentro do genoma de P.organensis.

Após a identificação das sequências corretas, o software BioEdit foi utilizado para a busca dos genes candidatos dentro de cada contig indicado nos resultados das análises anteriores. A partir de um arquivo de texto gerado para as sequências de DNA com tradução dos quadros abertos de leitura, foi possível identificar e caracterizar a estrutura de cada gene estudado.

A confirmação da identidade dos genes de P.organensis foi obtida através de uma análise filogenética em que as sequências proteicas resultantes dos genes que foram previamente identificados, foram alinhadas e com as sequências proteicas dos genes da família MADS-box de A.thaliana. A filogenia foi construída pelo método de agrupamento dos vizinhos – Neighbor-Joing method (Nei e Saitou 1987) utilizando o software MEGA 7 (Kumar et al. 2016). Valores de bootstrap>80% (1000 reamostragens) foram apresentados nos ramos da árvore filogenética.

Caracterização estrutural dos genes de classe B da família MADS-box de Passiflora organensis

A caracterização estrutural dos genes MADS-box de classe B foi feita a partir de uma busca pela sequência proteica dentro do arquivo de texto com a tradução dos quadros abertos de leitura gerado para cada uma das sequências de DNA correspondentes, seguida pelo estabelecimento das fronteiras entre éxons e íntrons feito de forma manual através dos resultados obtidos inicialmente pelo software Augustus. A confirmação dessas fronteiras pré-estabelecidas foi feita de forma manual e posteriormente foram checadas de forma preditiva pelo servidor NetGene2Server (DTU Bioinformatics).

O resultado dessa caracterização é um arquivo que contém as informações sobre a sequência, estrutura e tamanho de cada gene. A partir desses dados, a estrutura gênica pôde ser representada de forma ilustrativa com a utilização do software GSDS 2.0 Gene Structure Display Gene (Hu et al. 2015).

(37)

Resultados e Discussão

Filogenia e alinhamentos dos genes de classe B da família MADS-box em Passiflora organensis

Em A.thaliana existem quatro genes que pertencem à essa classe, sendo PISTILLATA (PI) e APETALA3 (AP3) os principais e GORDITA (GOA) e TRANSPARENT TESTA 16 (TT16), estes dois últimos chamados de B-sisters (Becker et al. 2001). A duplicação que deu origem aos genes B e B-sisters ancestrais ocorreu após a divergência das pteridófitas (~400 milhões de anos) e antes da separação de gimnospermas e angiospermas (~300 milhões de anos), uma vez que essas linhagens são encontradas em gimnospermas e angiospermas, mas não nas pteridófitas (Goremykin et al. 1997; Mnster et al. 1997; Becker et al. 2000; Theissen et al. 2000).

Posteriormente, cada uma dessas duas linhagens sofreu outros eventos de duplicação, sendo que o evento que deu origem às linhagens PISTILLATA e APETALA3 aconteceu nas angiospermas, antes da divisão desse grupo em monocotiledôneas e eudicotiledôneas (Kramer et al. 1998). Ainda mais recentemente, mais especificamente antes da divergência das eudicotiledôneas, a linhagem APETALLA3 passou por mais um evento de duplicação, o qual deu origem a uma nova linhagem gênica, a TM6 (TOMATO MADS-box 6). Essa linhagem foi identificada durante estudos em membros da família Solanaceae, sendo que essa duplicação não foi mantida em A.thaliana (Drinnan et al. 1994; Kramer et al. 1998; Kramer e Irish 2000). Por esse motivo, foi incluída a sequência do gene TM6 (ou TDR6) de tomate (Solanum lycopersicum) durante as análises e discussão.

A identificação dos homólogos putativos dos genes MADS-box em P.organensis, revelou a existência de oito membros pertencentes à classe B (Figura 11). De acordo com os resultados de similaridade expressos pelo algoritmo BLAST, com as suas posições nas árvores filogenéticas e bem como pela presença de domínios conservados (considerados assinaturas moleculares de cada grupo; Parenicova, 2003), estes possíveis ortólogos foram denominados: PoAP3.1, PoAP3.2, PoAP3.3, PoPisi e PoPIci; PoTT16 e PoGOA, PoTM6.

A partir da filogenia, é possível afirmar que em P.organensis as linhagens PISTILLATA e APETALA3 foram duplicadas e que, diferente de A.thaliana, a linhagem TM6 não foi perdida em P.organensis.

A fim de facilitar a compreensão, os eventos de duplicação serão analisados e discutidos de forma independente para cada uma das duas linhagens.

(38)

Linhagem APETALA3

Na literatura é possível encontrar diversos exemplos de duplicações gênicas seguidas de divergência, inclusive em membros da família MADS-box, as quais geralmente são relacionadas a inovações evolutivas que geralmente afetam a morfologia floral (Tsai et al. 2004; Jaramillo e Kramer 2007; Viaene et al. 2009; Bartlett e Specht 2010; Cantone et al. 2011; Pan et al. 2011; Roque et al. 2013; Sharma e Kramer 2013). Um exemplo clássico são as orquídeas, que apresentam um perianto diferenciado e exclusivo do grupo. Diferente de outras espécies, que possuem um conjunto homogêneo de órgãos no perianto, as orquídeas apresentam três tipos distintos de órgãos: tépalas externas, tépalas laterais internas (ambas coloridas, características comuns de pétalas), e uma única tépala modificada chamada de labelo. Essas características, sobretudo a presença do labelo, podem ter contribuído para a especialização de diferentes tipos de polinizadores (Dressler 1993; Rudall e Bateman 2002; Cozzolino e Widmer 2005).

Diversos estudos indicam que a morfologia diferenciada do perianto das orquídeas é resultado da atividade de quatro genes AP3, produtos de duplicações seguidas de alterações nas Figura 11: Filogenia de todos os genes MADS-box de classe B de Passiflora organensis, juntamente com os genes MADS-box de classe B de Arabidopsis thaliana e o gene TM6 de Solanum lycopersicum. A filogenia foi obtida através do método do vizinho mais próximo (Neighbor-Joining).

(39)

suas regiões codificadoras (Tsai et al. 2004, 2005; Kim et al. 2007; Mondragón-Palomino e Theißen 2008; Chang et al. 2010; Xu et al. 2010).

Contudo, A.thaliana que é a planta modelo melhor caracterizada até hoje, possui a morfologia floral clássica e em seu genoma existe apenas um gene AP3. Ao comparar a quantidade e as relações filogenéticas do genes de classe B de A.thaliana com P.organensis, mais especificamente do gene AP3, foram encontrados em P.organensis três parálogos AP3, chamados de PoAP3.1, PoAP3.2, PoAP3.3, respectivamente.

De acordo com os alinhamentos das sequências dos três parálogos de P.organensis com o AP3 de A.thaliana (Figuras 12 e 14), o gene PoAP3.1 é o que possui mais mutações acumuladas. Além disso, os parálogos PoAP3.2 e PoAP3.3 possuem sequências proteicas idênticas, com a sequência genômica divergindo em apenas 6 nucleotídeos não adjacentes (Figura 15).

Existem algumas possibilidades para explicar a origem desses genes. Uma delas seria a ocorrência dois eventos de duplicação, o que faria com que um único gene passasse a ter quatro cópias, sendo que um deles foi perdido ao longo da evolução (Figura 13a). Esses eventos de duplicação, por sua vez poderiam ser duplicações totais do genoma, ou isoladas. Neste caso, o mais provável é que as duplicações tenham sido isoladas, uma vez que outros grupos de genes MADS-box não apresentam tantos parálogos. Uma outra possibilidade seria a ocorrência de dois eventos de duplicação isoladas, sendo que o segundo tenha ocorrido apenas em uma das duas cópias, dando origem aos três parálogos resultantes, sendo que a cópia que não duplicou teria acumulado mais mutações (Figura 13b).

Figura 12: Filogenia dos genes MADS-box de classe B, com enfoque nos ramos que incluem os parálogos AP3 em P.organensis.

(40)

Entre os dois possíveis cenários propostos acima, o mais provável de ter acontecido é o cenário ‘b’ (Figura 13b), pois de acordo com a filogenia a duplicação da segunda cópia que deu origem aos PoAP3.2 e PoAP3.3 parece ser bem recente, uma vez que os comprimentos de ramo estão de acordo com o número de mudanças entre as sequências e que entre essas duas sequências, não há praticamente nenhuma diferença (Figura 15). Caso houvesse uma duplicação também na outra cópia, para não ser possível encontrar as duas sequências resultantes, uma delas teria que ter acumulado mutações suficientes para perder a característica de gene, já que mesmo com o acúmulo de mutações fazendo com que um gene deixe de ser funcional, sua sequência ainda seria encontrada no genoma. Para que um gene perca sua identidade, o número de mutações acumuladas deve ser muito alto, o que leva muito tempo se considerarmos que este acúmulo ocorre de forma neutra (imagina-se que não há pressão de seleção negativa para perda de um desses genes, pois as outras duas cópias ainda podem ser encontradas, sugerindo que, neste caso, o aumento de cópias não seja selecionado negativamente). Sendo assim, para que o cenário da hipótese ‘a’ faça sentido, a duplicação que deu origem à cópia PoAP3.1 teria que ter acontecido há muito tempo. Contudo, dado que a duplicação que deu origem às cópias PoAP3.2 e PoAP3.3 é recente e aparentemente próxima à cópia PoAP3.1, a hipótese do cenário ‘b’ é a mais plausível.

Sendo assim, e considerando que as flores de P.organensis possuem estruturas particulares no seu perianto (os filamentos da corona), é possível supor que essas duplicações de AP3 identificadas em seu genoma tenham relação com a presença dos filamentos da corona característicos de espécies do gênero Passiflora. Contudo, ainda são necessárias outras análises para averiguar essa suposição, uma vez que já está muito bem descrito na literatura que os genes da família MADS-box só apresentam função biológica quando suas proteínas interagem entre si formando complexos proteicos (Theißen e Saedler 2001; Theißen et al. 2016).

GENE 1.1’ GENE 1.1” GENE 1.2’ GENE 1.2” GENE 1 GENE 1” GENE 1’ GENE 1’ GENE 1“ GENE 1.1’ GENE 1.2’ GENE 1 GENE 1”

Figura 13: Representação esquemática das duas possíveis origens dos parálogos AP3 em P.organensis. Os triângulos vermelhos representam eventos de duplicação; tracejado preto representa linhagem perdida.

Referências

Documentos relacionados

Com a finalidade da obtenção do parecer do Comitê de Ética em Pesquisa - CEPUNISUL, os representantes legais das instituições envolvidas no projeto de pesquisa

Foram avaliadas as atividades clínicas (alterações cutâneas típicas e fraqueza muscular) e laboratoriais (aumento de enzimas musculares e provas inflamatórias) da doença e

Sistema de acionamento para máquina síncrona de magnetos permanentes com barramento CC de tensão variável para frenagem regenerativa em veículos elétricos.. / Eliabe

Temos que saber suas funções intrínsecas, o que é natural para essa coisa, o que essa coisa simplesmente não pode deixar de fazer pelo simples fato de ser o que é, sendo vivo..

Administrar empresa ou propriedade se tornou um processo necessário devido as constantes mudanças repentinas, que providas do ambiente exige ainda mais atenção por parte

Pretendo, a partir de agora, me focar detalhadamente nas Investigações Filosóficas e realizar uma leitura pormenorizada das §§65-88, com o fim de apresentar e

Doutoramento em Estudos de Literatura e de Cultura, na especialidade de Estudos Americanos na Faculdade Letras da Universidade de Lisboa, sob orientação da Professora Doutora Teresa

In the studied period, it was observed a rising trend in CRC incidence and mortality in Brazil from 2002 to 2016, with higher mortality rates founded in elderly patients.. In