• Nenhum resultado encontrado

Evolução do S-locus em Rosaceae

N/A
N/A
Protected

Academic year: 2021

Share "Evolução do S-locus em Rosaceae"

Copied!
87
0
0

Texto

(1)

Evolução do S-locus

em Rosaceae

José Pedro Oliveira Pimenta

Dissertação de Mestrado apresentada à

Faculdade de Ciências da Universidade do Porto em Área Científica

(2)

Evolução do S-locus

em Rosaceae

José Pedro Oliveira Pimenta

Mestrado em Biologia Funcional e Biotecnologia de Plantas Departamento de Biologia

2018

Orientador

Cristina Alexandra Gonçalves Paula Vieira, Investigadora auxiliar no IBMC, cgvieira@ibmc.up.pt

Coorientador

Jorge Manuel de Sousa Basto Vieira, Investigador principal no IBMC, jbvieira@ibmc.up.pt

Endereço

(3)

Todas as correções determinadas pelo júri, e só essas, foram efetuadas. O Presidente do Júri,

(4)

Eu, José Pedro Oliveira Pimenta, aluno com o número 201307759, inscrito no mestrado Biologia Funcional e Biotecnologia de Plantas presente ano letivo 2017/18, declaro por minha honra que sou o autor da totalidade do texto apresentado, não aprento texto plagiado, e tomei conhecimento das consequências de uma situação de plágio.

Porto, data 01 de Outubro de 2018

Evolução do S-locus em

Rosaceae

José Pedro Oliveira Pimenta

Mestrado em Biologia Funcional e Biotecnologia de Plantas Departamento de Biologia

(5)

i

Agradecimentos

Quero agradecer à minha orientadora, Cristina Vieira, pelos ensinamentos proporcinados ao longo deste ano, incluindo todo o apoio oferecido. Não esquecendo o apoio do co-orientador Jorge Vieira.

Aos meus colegas de laboratório queria agradecer pelos bons momentos, divertimentos e apoio, neste ano letivo.

Não esquecendo a minha família e amigos, agradeço pelo conforto e pelo apoio neste caminho percorrido e por me terem ajudado a definir a pessoa que sou hoje.

(6)

ii

Resumo

Em Rosaceae, dois sistemas distintos de auto incompatibilidade gametofítica (AIG) foram descritos. Estes sistemas diferem quer nos genes envolvidos na especificidade da reação, quer no tipo de reação. Assim, em Prunus, existem somente dois genes, um feminino (denominado por S-RNase) e outro masculino (denominado por SFB) envolvidos na especificidade desta reação. Os genes do mesmo S-haplótipo interagem, e como resultado desta interação a S-RNase fica ativa e degrada o RNA do tubo polínico de pólen geneticamente relacionado (self-pólen). Em Malus, Pyrus e Sorbus (Maleae) o gene feminino é também uma proteína com atividade ribonucleica (também denominado por S-RNase), mas existem múltiplos genes do pólen, denominados SFBBs, envolvidos na determinação da especificidade da reação de AIG. Neste caso, nenhum dos SFBBs tem afinidade para a S-RNase do mesmo S-haplótipo, mas cada um deles reconhece as diferentes S-RNases presentes numa determinada população. Ambos os componentes da reação de AIG nestas espécies tiveram histórias evolutivas diferentes. Embora o sistema de AIG tenha aparecido há 120 milhões de anos (Ma), diferentes duplicados dos genes ancestrais estão envolvidos na determinação desta reação em Prunus e em espécies de

Malus, Pyrus e Sorbus (espécies de Maleae que estão a divergir à 30 Ma; Figura 4). A

identificação de genes (feminino e masculino) da linhagem de Prunus em Fragaria (Potentilleae; que está a divergir à cerca de 100 Ma) sugere que o sistema ancestral seria do tipo de Prunus. Contudo, como o sistema em espécies de Maleae funciona de forma idêntica ao descrito em Petunia (Solanaceae), tem sido sugerido que este sistema possa também existir no ancestral de Rosaceae. Neste trabalho, identificamos a partir de análises genómicas, o possível gene feminino deste sistema em espécies de Vauquelinia (Maleae) e Gillenia (Gillenieae), que divergiram depois da separação de Prunus e Maleae à 46 e 48 Ma, respetivamente. A presença de genes da linhagem da S-RNase de Malus e não da linhagem de Prunus nestas espécies, sugere que à 52 Ma o sistema de AIG podia ser semelhante ao de espécies de Malus. Contudo, para confirmar esta hipótese, análises semelhantes às aqui realizadas para o gene feminino teriam de ser feitas para o(s) gene(s) do S-pólen. Análises genómicas dos genes da linhagem da S-RNase em Physocarpus (ancestral à separação de Maleae e Prunus) revelaram a presença de sequências da linhagem de Prunus, o que sugere que o ancestral de Rosaceae teria um sistema semelhante ao de Prunus e que o sistema presente em Malus teria evoluído de novo. Mais uma vez, análises do(s) gene(s) masculino(s) terão de ser realizados nesta espécie para validar esta hipótese. Contudo, estas análises não podem ser realizadas em genomas fragmentados como os analisados neste trabalho, pois os genes do S-pólen pertencem a uma das maiores famílias de genes em plantas, em que os genes apresentam níveis de divergência baixos (o que implica não reconhecer estes genes como diferentes). Para validar se o sistema AIG no ancestral de Rosaceae era do tipo de Prunus, neste trabalho analisamos 12 genomas de Rosa (Roseae, ancestral a Physocarpus). Neste caso, o grande número de espécies analisadas, mesmo que os genomas usados tenham uma cobertura baixa (ou seja, sejam incompletos), permite assumir que um gene está ausente num genoma, se o mesmo não for identificado em nenhuma das espécies analisadas. Assim, podemos concluir que a linhagem do gene feminino de Malus não está presente em Rosa,

(7)

iii e que o gene responsável pela especificidade feminina neste grupo de espécies é da linhagem de Prunus. Neste trabalho, usamos a segregação do alelo S2-RNase em R.

arvensis para validar que as sequências putativas S-RNase estão de facto envolvidas em

AIG. Devido à qualidade dos genomas de R. chinensis e R. multiflora pudemos também fazer análises do(s) gene(s) S-pólen. Em Rosa, a S-RNase identificada está localizada no cromossoma 3. Assim, fizemos análises filogenéticas de todos os genes com semelhança aos genes S-pólen de Malus e Prunus que se localizavam neste cromossoma em R.

chinensis. Incluímos, nesta análise, todos os genes que tinham estas características

pertencentes a R. multiflora. O resultado sugere que o gene masculino que determina a especificidade AIG é do tipo de Malus. Assim, a história evolutiva dos dois genes envolvidos em AIG é diferente. O estudo da evolução dos dois sistemas AIG em Rosaceae é mais complexo e requer análises dos genes femininos e masculinos em espécies da linhagem de Geum e Rubus para perceber a sua evolução.

Palavras chave: Auto-incompatibilidade gametofítica (AIG), RNase, SFB, SFBB, S-locus, Rosa, Amygdaloideae

Abstract

In Rosaceae, two distinct systems of gamethophytic self-incompatibility (GSI) are described. These systems differ in both the genes involved in the specificity and the type of reaction. Thus, in Prunus, there are only two genes, one female (denominated as

S-RNase) and the other male (called SFB) involved in the specificity of this reaction. The

genes of the same S-haplotype interact with each other, and, as result of this interaction, the S-RNase becomes active and degrades the pollen tube RNA of the pollen genetically related (pollen self). In Malus, Pyrus and Sorbus (Maleae), the female gene is also a protein with a ribonucleic activity (also called S-RNase), but there are multiple pollen genes, called SFBBs, involved in determining the specificity of the GSI reaction. In this case, none of the SFBBs have affinity for the S-RNase of the same S-haplotype, but each of them recognizes the different S-RNases present in a given population. Both components of the GSI reaction, in this species, have different evolutionary histories. Although, GSI system appeared 120 million years (MY) ago, different duplicates of the ancestral gene are involved in determining this reaction in Prunus and in the species of

Malus, Pyrus and Sorbus (Maleae species that are diverging at 30 MY; Figure 4). The

identification of genes (female and male) of the Prunus lineage in Fragaria (Potentilleae; wich is diverging about 100 MY) suggests that the ancestral system would be of the

Prunus type. However, as the system present in the species of Malus, Pyrus and Sorbus

(Maleae), functions in the same way as described in Petunia (Solanaceae), it has been suggested, that this system may also exist in the Rosaceae ancestor. In this work, we identified from the genomic analyses the possible female gene, of this system, in

Vauquelinia (Maleae) and Gillenia (Gillenieae) species, wich diverged after the Prunus

separation at 46 and 48 MY, respectively. The presence of genes of the Malus S-RNase lineage and not of the Prunus lineage in these species, suggests that at 52 MY the GSI

(8)

iv system could be similar to the Malus species. Nevertheless, to confirm this hypothesis, similar analyses to those performed here for the female gene would have to be carried out for the S-pollen gene. Genomic analyses of S-RNase lineage genes in Physocarpus (ancestral to Malus and Prunus separation) revealed the presence of Prunus lineage in the sequences, suggesting that the Rosaceae ancestor would have a similar system to Prunus and the system present in Malus have evolved de novo. Again, analyses of the male gene(s) will have to be performed on this species to validate this hypothesis. However, these analyses cannot be performed on fragmented genomes like those analysed in this work, because S-pollen gene belongs to one of the largest gene families in plants, where genes have low levels of divergence (which implies not to recognize these genes as different). To validate whether the GSI system in the Rosaceae ancestor was of the Prunus type, in this work we analysed 12 genomes of Rosa (Roseae, ancestral to Physocarpus). In this case, the large number of species analysed, although the genomes used have low coverage (incomplete), allows to assume that one gene is absent in a genome, if it is not identified in any of the analysed species. Therefore, we can conclude that the lineage of the female gene in Malus is not present in Rosa, and that the gene responsible for the female specificity, in this group of species, is from the Prunus lineage. In this work, we used the segregation of the S2-RNase allele in R. arvensis to validate whether the putative

S-RNase sequences are indeed involved in GSI. Due to the quality of two of the genomes

of Rosa (R. multiflora and R. chinensis) we also performed analyses for the S-pollen gene(s). In Rosa, the identified S-RNase is located in the chromosome 3. Thus, we carried out phylogenetic analyses of all genes with similarity to the S-pollen genes of Malus and

Prunus that were located in this chromosome in R. chinensis. We included, in this

analyses, all the genes that had these characteristics belonging to R. multiflora. The result suggests that the male gene that determines the GSI specificity is of the Malus type. Therefore, the evolutionary history of the two genes involved in GSI is different. The study of the evolution of the two GSI systems in Rosaceae is more complex and requires analyses of the female and male genes in the species of Geum and Rubus to perceive its evolution.

Key words: Gametophytic Self-incompatibility (GSI), S-RNase, SFB, SFBB, S-locus,

(9)

v

Índice

Agradecimentos...i Resumo...ii Abstract...iii Lista de Figuras...vii Lista de Tabelas...viii Lista de Abreviações...ix 1.Introdução...1 1.1 Auto-polinização...1 1.2 Auto-incompatibilidade...1 1.3 Gene da S-RNase...4 1.4 Gene da F-box...5

1.5 Evolução do sistema AIG em Rosaceae...7

1.6 Família de Rosaceae...8

1.7 Objectivos...10

2. Materiais e Métodos...11

2.1 Análise do ponto isoelétrico (PI) de S-RNases de Malus e de Prunus...11

2.2 Identificação, no NCBI, de dados genómicos das espécies de interesse...11

2.3 Montagem do genoma ...12

2.4 Caracterização do gene S-pistilo...13

2.5 Caracterização de genes S-pólen em Rosa chinensis e R. multiflora...13

2.6 Caracterização do gene S-locus em Rosa arvensis...13

2.6.1 Material vegetal...13

2.6.2 Extração do DNA genómico de R. arvensis...14

2.6.3 PCR (“Polymerase chain reaction”)...14

2.6.4 Extração do DNA do gel de agarose – QIAEX gel extraction protocol...15

2.6.5 Clonagem- “TOPO TA cloning control reaction”………..15

2.6.6 Extração do DNA plasmídico – protocolo NZYminiprep...15

(10)

vi

3. Resultados e Discussão...17

3.1 Valores de PI (ponto isoelétrico) em diferentes regiões da proteína codificada pelo gene S-RNase em Rosaceae...17

3.2 Análise do gene da S-RNase na subfamília das Amygdaloideae...18

3.3 Identificação do gene putativo da S-RNase no género de Rosa...27

3.4 Análises de segregação do gene putativo da S-RNase em Rosa arvensis...47

3.5 Caracterização do S-pólen em Rosa...49

4. Conclusão...54

5. Trabalho Futuro...55

6. Referências...56

(11)

vii

Lista de Figuras

Figura 1. Representação simplificada da regulação da morte celular programada (MCP) no sistema AIG de Papaveraceae (A) e Rosaceae (B)...4 Figura 2. Estrutura do S-locus de Prunus...6 Figura 3. Modelo colaborativo do reconhecimento “non-self”, juntamente com a estrutura do S-locus de Malus...7 Figura 4. Cladograma das espécies de Rosaceae e tipo de AIG nas espécies estudadas...9 Figura 5. Ponto isoelétrico das sequências proteicas das S-RNases de Prunus...17 Figura 6. Ponto isoelétrico das sequências proteicas das S-RNases de Malus...18 Figura 7. Relação filogenética das sequências de Vauquelinia com as sequências de referência (Aguiar et al. 2015), em que é analisada a região do motivo proteico 1...21 Figura 8. Relação filogenética das sequências de Vauquelinia com as sequências de referência (Aguiar et al. 2015), em que é analisada a região do motivo proteico 2 e a região dos dois motivos

proteicos (sequência completa).

...22 Figura 9. Relação filogenética das sequências de Vauquelinia com as sequências de referência (Aguiar et al. 2015), em que é analisada a região do motivo proteico 2 e a região de ambos os motivos proteicos (sequência completa)...23 Figura 10. Relação filogenética das sequências de Gillenia com as sequências de referência (Aguiar et al. 2015), em que é analisada a região do motivo proteico 1...25 Figura 11. Relação filogenética das sequências de Physocarpus com as sequências de referência (Aguiar et al. 2015), em que é analisada a região do motivo proteico 1...26 Figura 12. Relação filogenética das sequências de Rosa com as sequências de referência (Aguiar

et al. 2015), em que é analisada a região do motivo proteico 2 e a região que cobre ambas as

regiões proteícas (Sequências completas)...46 Figura 13. Produtos de amplificação, a partir do DNA genómico, das diferentes variedades de Rosa arvensis...47 Figura 14. Confirmação da inserção do fragmento de aproximadamente 300 bp...48 Figura 15. Produtos de amplificação, a partir das sequências obtidas da sequênciação, com a utilização do primer foward específico S2 com o primer reverse RA11...49 Figura 16. Localização das possíveis F-box, em R. chinensis, ao longo do cromossoma 3...51 Figura 17. Localização dos cinco genes F-box nos scaffold sc0001861 e sc0006888 (respetivamente) de R. multiflora...51 Figura 18. Relação filogenética das sequêncas de Rosa com as sequências de referência (Aguiar et al. 2015), em que é analisada a região do F-box...52

(12)

viii

Lista de Tabelas

Tabela 1. Motivos que permitem distinguir os genes S-RNase e S-lineage de outros genes

T2-RNase (Vieira et al. 2008)...5

Tabela 2. Genomas de Rosaceae disponíveis no NCBI, usadas para a caracterização do gene da S-RNase...11

Tabela 3. Indivíduos utilizados para o estudo de segregação...13

Tabela 4. Parâmetros utilizados para a amplificação do plasmídeo inserido no vetor pCRTM 4-TOPO, com a utilização dos primers M13 Forward e M13 Reverse...16

Tabela 5. Sequências de Vauquelinia com homologia a S-RNases de Rosaceae...19

Tabela 6. Sequências de Kageneckia com homologia a S-RNases de Rosaceae...24

Tabela 7.Sequências de Gillenia com homologia a S-RNases de Rosaceae...24

Tabela 8.Sequências de Physocarpus com homologia a S-RNases de Rosaceae...25

Tabela 9.Sequências de R. multiflora com homologia a S-RNases de Rosaceae...28

Tabela 10.Sequências de R. damascena com homologia a S-RNases de Rosaceae...29

Tabela 11. Sequências de R. chinensis INRA com homologia a S-RNases de Rosaceae...30

Tabela 12.Sequências de R. chinensis presente no NCBI com homologia a S-RNases de Rosaceae...31

Tabela 13. Sequências de R. odorata com homologia a S-RNases de Rosaceae...32

Tabela 14. Sequências de R. odorata gigantea com homologia a S-RNases de Rosaceae...33

Tabela 15. Sequências de R. rugosa 14 com homologia a S-RNases de Rosaceae...34

Tabela 16. Sequências de R. rugosa 19 com homologia a S-RNases de Rosaceae...35

Tabela 17. Sequências de R. laevigata com homologia a S-RNases de Rosaceae...36

Tabela 18. Sequências de R. moschata com homologia a S-RNases de Rosaceae...37

Tabela 19. Sequências de R. xanthina com homologia a S-RNases de Rosaceae...38

Tabela 20. Sequências de R. arvensis com homologia a S-RNases de Rosaceae...39

Tabela 21. Sequências de R. majalis com homologia a S-RNases de Rosaceae...41

Tabela 22.Sequências de R. minutifolia com homologia a S-RNases de Rosaceae...41

Tabela 23. Sequências de R. persica com homologia a S-RNases de Rosaceae...43

Tabela 24. Gene F-box com semelhança a Prunus SFBs, Malus SFBBs, e Prunus SLFL genes localizados no cromossoma 3 de R. chinensis...50

(13)

ix

Lista de Abreviaturas

bp- pares de base

DNA- ácido desoxirribonucleico

AIG- auto-incompatibilidade gametofítica GSI- gametophytic self-incompatibility AI- auto-incompatibilidade

AIE- auto-incompatibilidade esporofítica AP- auto-polinização

Ma- milhões de anos

MCP- morte celular programada PI- ponto isoelétrico

RNA- ácido ribonucleico

S-RNase- T2-RNase que determina a especificidade feminina SFB- “S-haplotype specific F-box”- gene S-pólen Prunus SFBB- “S-locus F-box brothers”- genes S-pólen Malus

SFLF-S-locus F-box like”- genes F-box de Prunus que estão na região do S-locus mas

não estão implicados na especificidade da reação AIG

(14)

1

1. Introdução

1.1. Auto-polinização

As angiospérmicas são presentemente o grupo de plantas mais frequentes, consistindo num grupo grande e variado com mais de 300000 espécies (Naik, 1984). São definidas como o grupo de plantas com flor, em que possuem óvulos fechadas dentro de um ou mais carpelos, embora haja exceções (Naik, 1984). A flor, de uma forma genérica, é constituída pela parte masculina (as anteras) e a pela parte feminina (os pistilos), geralmente na mesma estrutura floral. A presença desta arquitetura floral (hermafroditismo) leva a um aumento na probabilidade de ocorrer a auto-polinização (AP). A AP é uma boa estratégia quando a quantidade de polinizadores é reduzida, como por exemplo nos limites de distribuição de uma população ou após a destruição parcial da população por acção do fogo (Kalisz et al., 2004; Iwano e Takayama, 2011). Contudo, esta estratégia reprodutiva causa diminuição da variabilidade genética e acumulação de mutações deletérias, levando a uma redução do potencial adaptativo e a redução da flexibilidade evolutiva (Charlesworth e Charlesworth, 1993; Takebayashi e Morrell, 2001; Roalson e McCubbin, 2003). Deste modo, as angiospérmicas desenvolveram vários mecanismos de prevenção à AP, incluindo mecanismos de prevenção genéticos, denominadas por auto-incompatibilidade (Charlesworth e Charlesworth, 1993).

1.2. Auto-incompatibilidade

A auto-incompatibilidade (AI) é uma barreira genética (pré-zigótica) que descrimina o pólen relacionado geneticamente do pólen geneticamente não relacionado, permitindo somente a polinização do pólen não relacionado (De Nettancourt, 1997). A descriminação do pólen “self” do pólen “non-self” é realizada pelo sistema reprodutor feminino (Iwano e Takayama, 2012) e em muitas angiospérmicas é controlado por um único locus, com múltiplos haplótipos, denominado por S-locus (De Nettancourt, 2001). A incompatibilidade ocorre quando a informação genética do pólen é idêntica ao expresso no pistilo, resultando na inibição da germinação do grão de pólen ou do crescimento do tubo polínico (Watanabe et al., 2012). Este mecanismo genético previne a auto-polinização e mantêm os níveis elevados de heterozigotia, e pensa-se que este mecanismo tem tido um papel importante na diversificação e expansão das angiospérmicas. (Stebbins, 1950; Iwano e Takayama, 2012).

A AI pode ser classificada consoante a sua morfologia, em heteromórfica ou homomórfica. As espécies que apresentam a AI heteromórfica possuem flores com diferentes morfologias, por exemplo, podem possuir um pistilo longo e um estame curto (“pin”) ou um pistilo curto com estames longos (“thrum”), e estão presentes em espécies de Primula (Primulaceae), Fagophyrum (Polygonaceae) e Averrhoa (Oxalidaceae). A polinização nesta divisão ocorre entre flores com morfologias diferentes e o tubo polínico cessa o seu crescimento quando o pólen é oriundo de flores com a mesma forma (Allen

et al. 2011; Watanabe et al. 2012). Neste caso, o locus que controla a polinização cruzada

(15)

2 e dos estames). Embora o sistema tenha sido descrito por Darwin em 1877 (Darwin, 1877; Franklin-Tong, 2008), os mecanismos genéticos não estão completamente caracterizados, uma vez que, os polimorfismos sexuais evoluíram de forma independente nas várias angiospérmicas que apresentam este sistema. Contudo, no caso de Primula vulgaris, a partir do pressuposto de que os genes além de estarem relacionados com a incompatibilidade, também estão relacionados com o dimorfismo sexual, determinou-se a existência de cinco genes (CCMT, GLOT, CYPT, PUMT e KFBT) no S-locus que só são encontrados no genoma com o fenótipo “thrum”, como uma inserção hemizigótica (Li et

al. 2015; Huu et al. 2016; Burrows e McCubbin 2017). Estes genes do S-locus, foram

identificados a partir da sequência de grandes contigues provenientes de livrarias BAC, que por hibridação in situ demonstraram estar localizados próximo da região do centrómero do maior cromossoma metacêntrico de Primula. Estes contigues foram obtidos pela análise genética de recombinantes de três cruzamentos bem como de mutantes (Li et al. 2015). O gene CCMT (motivo conservado de cisteína) codifica uma proteína com um domínio carboxi (C)-terminal que é conservado em monocotiledóneas e em dicotiledóneas, o gene PUMT codifica uma proteína Pumilio-like39 que se liga ao RNA, o gene KFBT codifica uma proteína semelhante à Kelch repetitiva F-box presente na Arabidopsis, que está envolvida na regulação da atividade da citocinina. O gene

PvGLO2 tem homologia com os fatores de transcrição MADS-box e o gene CYP734A50

está envolvido na regulação hormonal (Burrows e McCubbin 2017). Assim foi sugerido que, o S-locus regula indiretamente uma grande quantidade de genes e provavelmente leva a um diferencial nas cascatas de expressão entre os dois tipos de flores (Burrows e McCubbin 2018).

As flores das plantas homomórficas só possuem uma forma e estão divididas em auto-incompatibilidade esporofítica (AIE) e auto-auto-incompatibilidade gametofítica (AIG) (Hinata et al. 1993, De Nettancourt, 2001), dependendo, se o fenótipo 2.6AI do pólen é determinado pelo o seu próprio genótipo haplóide ou gametofítico (AIG) ou pelo genótipo diplóide ou esporófito (AIE) (Iwano e Takayama, 2012).

O sistema AIE de Arabidopsis (Brassicaceae) é controlado por uma única região no genoma. Esta região é composta por dois genes em desiquilíbrio gamético que codificam o S-locus. O gene do pólen é rico em cisteínas (SCR) e o receptor femenino é uma cinase (SRK) presente no estigma, em que, a ligação entre a molécula receptora e o ligando levam à rejeição do pólen “self” (Durand et al. 2014). O reconhecimento do fenótipo do pólen é controlado pelo genótipo diplóide parental. Apesar da maioria das plantas ser heterozigótica, o reconhecimento do fenótipo do pólen é tipicamente determinado por um dos alelos, de acordo com a sua posição relativa dos alelos na hierarquia ou com as interações de dominância-recessividade entre os S-alelos (De Nettancourt, 2001). Estes componentes moleculares não foram encontrados em espécies de Convolvulaceae (Rahman et al. 2007) e Asteraceae (apresentam AIE, Allen et al. 2011), o que sugere que este sistema evoluiu independentemente múltiplas vezes. O género Leavenworthia (Brassicaceae) apresenta dois genes em desiquilíbrio gamético que exibem características de S-locus, tais como altos níveis de polimorfismo e padrões de expressão característicos

(16)

3 do S-locus. Além disto, os genes do S-locus do género Leavenworthia ocupam a mesma posição genómica de dois genes que não são S-locus em Arabidopsis (são parálogos aos genes SRK e SCR de Arabidopsis), sugerindo que estes genes evoluíram para assumir o sistema de reconhecimento AI no género Leavenworthia. Deste modo, foi proposto que os genes S-locus em Brassicacea possuem origens independentes e que os genes S-locus ancestral se perderam em Leavenworthia (Chantha et al. 2013).

O sistema AIG é o sistema mais comum de AI em Angiospérmicas (Sassa 2016;

Franklin-Tong e Franklin 2003). Embora na maioria das espécies exista um único S-locus, no caso de Secale cereal L. (o centeio) e em outras gramíneas o sistema é determinado pela ação complementar de dois loci expressos na zona haplóide, denominados por S e Z. A rejeição do pólen ocorre quando ambos os alelos S e Z do grão de pólen haplóide são expressos no tecido estigmático (Hackauf e Wehling 2005; Klaas et al. 2011). O sistema AIG pode ser dividido em dois grupos de acordo com os genes envolvidos na especificidade AI, que pode ser determinada por proteínas transmembranares do pólen mediadas pelo Ca2+ (presente em Papaveraceae), ou determinada por ribonucleases, denominadas S-RNases (presente em Solanaceae, Rosaceae e Plantagenaceae; Iwano e Takayama 2012; Meng et al. 2010).

Nas Papaveraceae, o sistema AIG é determinado por proteínas transmembranares do pólen mediadas pela sinalização dos catiões Ca2+. O S-locus desta família é constituído pelo determinante feminino (PrsS-“Papaver rhoeas stigmatic”), expresso no estilete, e o determinante masculino (PrpS-“Papaver rhoeas pollen”), que é expresso no pólen (Wheeler et al. 2009). Neste sistema, quando o haplótipo masculino reconhece o S-haplótipo feminino, há um aumento na libertação Ca2+ do citosol (excreção do Ca2+)e uma despolimerização da actina do citoesqueleto do tubo polínico, levando à inibição do pólen e à morte celular programada (MCP; Figura 1A; Wheeler et al. 2009, Wheeler et

al. 2010, Wu et al. 2011, Iwano and Takayama 2012).

O sistema AIG também pode ser determinado por genes da família T2-RNase expressos no pistilo (denominados S-RNase). Este sistema AIG está presente nas Solanaceae, Rosaceae, Scophulariaceae e Rubiaceae (Igic e Kohn 2001; Lai et al. 2002; Entani et al. 2003; Ushijima et al. 2003, McClure 2009, Meng et al. 2010). A S-RNase é o componente feminino da AI, é expressa no pistilo e tem atividade de ribonuclease. No caso de uma reação de incompatibilidade, esta proteína funciona, possivelmente, como uma toxina que degrada especificamente o RNA do tubo polínico (Roalson e McCubbin 2003; Nowak et

al. 2011).

Inicialmente, pensava-se que a rejeição do pólen “self” e inibição posterior do tubo polínico era feita somente com a interação das S-RNases que degradam o RNA do pólen “self”, que assim cessa o crescimento do tubo polínico. Contudo, sabe-se que a MCP tem o papel importante na rejeição do pólen “self”, quando há a interação entre o componente feminino e o(s) componente(s) masculino(s) e consequente rejeição do pólen “self”. Estudos de polinização in vitro e in vivo realizados em diferentes espécies identificaram

(17)

4 alterações na integridade do citoesqueleto, que podem desencadear MCP após interações pólen-pistilo, em polinizações com pólen “self”.

As S-RNases são capazes de especificamente disromper a localização das ROS (moléculas hemicamente reativas derivadas do oxigénio como consequência do metabolismo celular) localizadas na extremidade do tubo polínico, causadas por alterações mitocondriais e decréscimo da NADPH oxidase na mitocôndria e no citosol. Estas alterações levam à modificação na corrente de Ca2+ intracelular, uma despolimerização do citoesqueleto de actina e a degradação do DNA nuclear, características da MCP (Figura 1B; Serrano et al. 2015).

A

B

Figura 1. Representação simplificada da regulação da morte celular programada (MCP) no sistema AIG de Papaveraceae (A) e Rosaceae (B) (Serrano et al. 2015).

A presença da S-RNase em espécies de Angiospérmicas distantes, assumindo que este gene é responsável por este mecanismo AI, sugere que este sistema emergiu no ancestral comum de três quartos das espécies de plantas, há mais de 120 Ma, antes da separação de Asteridae e Rosidae (Igic e Kohn 2001; Steinbachs e Holsinger 2002; Vieira et al. 2008; Ramanauskas et al. 2017).

1.3. Gene da S-RNase

O gene da S-RNase pertence à família de genes T2-RNases e encontra-se em todos os reinos (bacteria, fungi, animais e plantas), excetuando um grupo específico denominado por Archae (Condon e Putzer 2002; Nicholson 2011; Ramanauskas et al. 2017). A grande distribuição destas proteínas sugere que as RNases têm um papel biológico importante, o que explica a sua conservação durante a evolução (Ramanauskas et al. 2017).

(18)

5 Nas plantas, a família das T2-RNases, para além de participarem nos mecanismos de AI (Ramanauskas e Igic 2017), desempenham outros processos biológicos, como a resposta ao dano, senescência ou a resposta à invasão de patogénicos (Kimura et al. 2004; Lers et

al. 2006; Köck et al. 2006; Ramanauskas et al. 2017). As T2-RNases das plantas, segundo

as análises filogenéticas, podem ser divididas em três classes (I, II ou III, Igic e Kohn 2001). A classe I é constituída por RNases com dois ou três intrões, em que a maior parte das proteínas possuem um ponto isoelétrico (PI) acídico, sendo expressas durante a senescência e a falta de fosfato, na maior parte da linhagens de plantas terrestres (Ramanauskas et al. 2017). A classe II apresenta mais de quatro intrões e produzem proteínas com PI acídicos. Esta classe é expressa constitutivamente, o que sugere que estas proteínas podem ter um papel de “housekeeping” (Ramanauskas et al. 2017). A classe III, a que pertence o gene da S-RNase, possui um ou dois intrões, produzem proteínas com valores básico de PI e são expressas restritivamente nos eudicotes (Igic e Kohn 2001; Vieira e Charlesworth 2002; Ramanauskas et al. 2017).

O gene da S-RNase possui um ou dois intrões (característico da classe III) e codifica uma proteína com PI superior a 8,5, apresentando motivos aminoacídicos específicos no domínio funcional da sua proteína (Tabela 1, Igic e Kohn 2001; Ramanauskas et al. 2017). Três padrões aminoacídicos, descritos em Vieira et al. (2008), são usados para distinguir o gene da S-RNase e genes S-lineage (genes com a mesma origem da S-RNase, mas não envolvidos na AI) de outros genes T2-RNase. Os motivos proteicos 1 e 2 são específicos do gene da S-RNase, enquanto o motivo proteico 4 nunca é encontrado nas S-RNases ou em genes S-lineage. O motivo proteico 3 está presente tanto na S-RNase como em genes

S-lineage (Vieira et al. 2008). As características das S-RNases, juntamente com as

análises filogenéticas, podem ser usadas para identificar as sequências pertencentes à linhagem da S-RNase (Vieira et al. 2008). O gene feminino da AIG está sobre seleção balanceadora, em que a S-RNase rara é que tem maior vantagem seletiva, pois tem maior probabilidade de fecundar os indivíduos de uma dada população (Wright 1939; Charlesworth 2006; Newbigin et al. 2008). Assim, as S-RNases são genes que possuem elevados níveis de diversidade nucleotídica, superiores a 20%. Este parâmetro é o que destingue a S-RNase de genes S-lineage (Vieira et al. 2008).

Tabela 1. Motivos que permitem distinguir os genes S-RNase e S-lineage de outros genes T2-RNase (Vieira et al. 2008).

Motivo proteico Padrão aminoacídico 1 [FSV][AST][AITV][HNR]G[ILV]W[PQ][DEGNS][DHIKNST] 2 W[AILMPTV][DEHNQR][AFLMV][^ACHNPW][^CMP][^CW] 3 [HY]EW 4 (ausência) [CG]P[QLRSTIK][DGIKNPSTVY][ADEIMNPSTV][DGKNQST]

(19)

6 1.4. Gene F-box

O gene F-box é o componente AIG do pólen, podendo o seu número variar de um único gene F-box, no caso de Prunus (Rosaceae; S-haplótipo específico do gene F-box abreviada por SFB), até 18 genes F-box, como em Malus, Sorbus e Pyrus (Rosaceae; S-locus box irmãos, abreviados por SFBBs), Petunia e Nicotiana (Solanaceae; S-S-locus F-box, abreviado por SLFs) (Aguiar et al. 2015). As proteínas F-F-box, expressas pelos genes acima descritos são componentes ubiquitina ligase Skp1-Cullin-F-box-type (Qiao et al. 2004).

No caso de Prunus, que possui um único gene S-pólen, observam-se níveis de polimorfismo elevados, como o observado para o gene da S-RNase. O gene SFB é expresso unicamente em anteras e no pólen. As análises filogenéticas demostram uma história de co-evolução entre os genes do S-pólen e do S-pistilo, evidenciando que o SFB é o único gene masculino presente no S-locus (Entani et al. 2003; Ushijima et al. 2003; Ikeda et al . 2004; Sonneveld et al. 2005; Nunes et al . 2006; Ramanauskas et al. 2017). A presença de vários F-box no S-locus, como nas espécies de Maleae, Petunia e

Nicotiana, em que o reconhecimento é do tipo “non-self” (observar secção 1.5), os níveis

de diversidade são diferentes para ambos os determinantes do S-locus. Deste modo, é expectável níveis baixos de diversidade no S-pólen nestas espécies pois a seleção não actua a nível do gene mas sim dos diferentes genes de um S-haplótipo (Kubo et al. , 2010; Minamikawa et al. 2010; Aguiar et al. 2013; Pratas et al. 2018).

Como os genes, que determinam a especificidade AIG, estão sobre a seleção balanceadora, é possível identificar os aminoácidos que estão sobre seleção positiva. Em

Prunus, o número de sítios selecionados positivamente, é semelhante em alelos do

S-gene. No entanto, o mecanismo de reconhecimento “non-self”, os genes S-pólen são altamente homólogos entre si, sendo expectável que se liguem à mesma zona da S-RNase. Portanto, a diversidade alélica, entre os diferentes S-pólens, não é necessária e não é favorecida pela seleção natural (Minamikawa et al. 2010; Aguiar et al. 2013; Pratas et al. 2018).

Figura 2. Estrutura do S-locus de Prunus. Neste género o modelo de interação é o inibidor geral, em que há interação entre a S-RNase e o SFB é do mesmo haplótipo.

A presença de diferente números de genes S-pólen implica diferentes mecanismos de reconhecimento. No caso de Prunus, a interação entre os determinantes feminino e masculino possuem um reconhecimento do tipo “self”, ou seja, pensa-se que o SFB se

(20)

7 liga à S-RNase do mesmo S-haplótipo, ativando-a (Yamane et al. 2003, Ushijima et al. 2004, Tao et al. 2007). Resumidamente, em Prunus, o sistema de interação entre as duas moléculas de reconhecimento (F-box e a S-RNase) é denominado por modelo inibidor geral (Yamane et al. 2003, Ushijima et al. 2004, Tao et al. 2007; Ramanauskas et al. 2017). Assim, os dois S-genes precisam de co-evoluir para o reconhecimento específico, já que ambos os genes apresentam níveis similares de diversidade e o número de aminoácidos sobre a seleção positiva é o mesmo (estes aminoácidos poderão estar envolvidos na determinação específica; Figura 2; Yamane et al. 2003, Ushijima et al. 2004, Tao et al. 2007; Ramanauskas et al. 2017). As SLFLs (F-box like) encontram-se na proximidade do S-locus, mas não estão envolvidos na reação de especifidade da AI. Estes genes são filogeneticamente próximos de SFBBs de Malus mas são expressos noutros tecidos para além do pólen e das anteras (Figura 2; Aguiar et al. 2015).

O modelo colaborativo de reconhecimento “non-self” foi proposto para explicar as interações de vários genes S-pólen, presente em Solanaceae, Plantaginaceae e Maleae. As S-RNases reconhecem as SLF/SFBB de haplótipos diferentes (Figura 3). As proteínas SLF/SFBB para cada S-haplótipo interagem e desintoxicam, via proteossoma de ubiquitina, um conjunto de S-RNases, excluindo as S-RNases “self” (Figura 3; Kubo et

al. , 2010; Iwano e Takayama, 2011; Fujii et al. 2016).

Figura 3. Modelo colaborativo do reconhecimento “non-self”, juntamente com a estrutura do S-locus de Malus. 1.5. Evolução do sistema AIG em Rosaceae

O sistema AIG (baseado nas S-RNase) evoluiu uma única vez, antes da separação das Asteridae e Rosidea, à 120 Ma (Igic e Kohn 2001; Steinbachs e Holsinger 2002; Vieira

et al. 2008; Ramanauskas et al. 2017). Na família das Rosaceae, existem dois mecanismos

AIG (estes dois mecanismos estão descritos no subcapítulo anterior), em que, no caso de

Prunus, possui apenas uma F-box e na sub-família Maleae tem múltiplos F-box. Desta

forma, para se perceber como estes dois mecanismos evoluíram, é necessário utilizar análises comparativas, com espécies divergentes (Yamane et al. 2003, Ushijima et al. 2004, Tao et al. 2007; Kubo et al. , 2010; Iwano e Takayama, 2011; Fujii et al. 2016; Ramanauskas et al. 2017). Duas hipóteses explicam o sistema AI ancestral em Rosaceae: a primeira hipótese implica que o sistema ancestral é o mesmo que está presente em

Prunus e que o sistema presente em Malus evoluiu de novo. A segunda hipótese presupõe

(21)

8

Prunus e o outro loci é semelhante ao que está presente em Malus, uma vez que o sistema

que está presente em Malus, apresenta semelhanças com AIG de Petunia (Solanaceae) e

Antirrhinum (Plantaginaceae), duas espécies ancestrais a Rosaceae (Aguiar et al. 2015).

A evolução por duplicação de múltiplos genes foi sugerida para explicar a evolução do AIG em Rosaceae (Jung et al. 2012). Denota-se que a única evolução do gene S-RNase não exclui a possibilidade de que os genes S-RNase parálogos podem determinar a especificidade do pistilo em diferentes espécies. De facto, análises comparativas entre o

S-pólen e a S-RNase de Malus e Prunus demonstram que estes genes não são ortólogos

(Aguiar et al. 2015). Análises filogenéticas revelam que os genes putativos do S-locus em

Fragaria apresentam uma relação filogenética próxima com os genes S-locus de Prunus,

o que sugere que o sistema presente em Prunus pode ser o sistema ancestral. Em

Fragaria, a região putativa do S-locus possui sintenia com o S-locus de Prunus, o que

suporta a hipótese que os genes S-locus destes dois géneros possuem um ancestral comum (Aguiar et al. 2015). No entanto, devido às similaridades do tipo de reconhecimento AIG entre Malus e Petunia (mútiplos F-box), a hipótese de que o S-locus ancestral de Rosaceae é composto por dois loci (um dos loci é semelhante ao que está presente em

Prunus/Fragaria e o outro é semelhante ao S-locus de Malus) não pode ser excluida

(Aguiar et al. 2015).

Para distinguir as duas hipóteses, é necessário caracterizar a região S-locus em outras espécies de Rosaceae. Assim, neste trabalho, caracterizaram-se T2-RNases com homologia às S-RNases no genoma de Kageneckia (Maleae), Gillenia (Gillenieae),

Vauquelinia (Maleae), Physocarpus (Neillieae), pertencentes à subfamília da

Amygdaloideae. Análises semelhantes foram feitas no género de Rosa (Roseae) da subfamília Rosoidea. Posteriormente, análises filogenéticas foram feitas para identificar os genes putativos das S-RNases nestes géneros. Para caracterizar funcionalmente o gene da S-RNase de Rosa, foram utilizadas análises de segregação em R. arvensis.

1.6. Família de Rosaceae

Rosaceae é uma família das angiospérmicas, da ordem das Rosales, com mais de 3000 espécies. Esta família, com uma distribuição mundial, possui interesse económico para a espécie humana, tanto a nível alimentar como ornamental. Esta família de angiospérmicas encontra-se dividida por três subfamílias: Amygdaloideae (nesta subfamília estão presentes os géneros de Prunus e Malus), Rosoideae (em que está presente o género de

Rosa) e Dryadoideae (a subfamília mais pequena das Rosaceae, Xiang et al. 2016). Xiang et al. (2016) utilizou 4180 genes ortólogos para estabelecer a relação filogenética entre as

diferentes espécies de Rosaceae. A divisão das Amygdaloideae e Rosoideae ocorreu há 100 Ma, no Cretáceo, originando dois ramos distintos, apresentando sete tribos em Amygdaloideae. A separação das tribos Kerrieae, Exochordeae e Sorbarieae das tribos Maleae e Gillenieae ocorreu há 92 Ma. A separação de Gilleneae e Maleae ocorreu há 52 Ma. Além do mais, a tribo Maleae possui um maior número de cromossomas, se comparado com as espécies de Gilleneae, indicando a possibilidade da ocorrência de uma duplicação total do genoma (DTG) nas espécies de Maleae (o DTG mais recente em

(22)

9 Rosaceae). Contudo, os géneros de Kageneckia (Maleae) e Vauquilenia (Maleae) não apresentam DTG (Figura 4; Xiang et al. 2016).

A m yg d alo id ea e R o so id ea e Malus Pyrus Sorbus Amelanchier Crateagus Vauquelinia Kageneckia Gillenia Kerria Prinsepia Prunus Aruncus Physocarpus Cliffortia Hagenia Potentilla Fragaria Comarum Dasiphora Rosa Filipendula Geum Rubus Sibbaldia 0 Age (Mya) 20 40 60 80 1 0 0 1 2 0 29 90 105

Maleae reconhecimento non-self"Sistema de

45

Amygdaleae Sistema de

reconhecimento self"

Potentilleae

A linhagem das S-RNases em Fragaria é semelhante ao sistema de Prunus ? ? ? ? ? 62 52 96

Figura 4. Cladograma das espécies de Rosaceae e tipo de AIG nas espécies estudadas. O círculo azul indica o evento de duplicação mais recente na família das Rosaceae, segundo Xiang et al. 2016. A vermelho encontra-se os géneros analisados neste trabalho, para os quais espécies foram sequenciadas e estão disponíveis no NCBI.

Em Rosoideae, a separação entre as diferentes tribos ocorreu entre, aproximadamente, 82 Ma e 62 Ma (Figura 4). Nesta subfamília está presente o género Rosa (Xiang et al. 2016). O género Rosa (plantas lenhosas e ornamentais) possui um grande interesse económico, já que estas plantas são utilizadas, pela espécie humana, como decoração, alimentação e criação de fragâncias. Devido à hibridação interespecífica e eventos de poliploidismo, tornam a história evolutiva destas espécies muito complexa, já que os níveis de ploidia podem variar entre 2n=2 e 2n=10 (Hibrand et al. 2018).

Em Rosa estudos de segregação permitem revelar potenciais reguladores genéticos que determinam características de interesse para a espécie humana, tais como floração contínua, número de pétalas, e densidade dos espinhos, que estão correlacionadas com a auto-incompatiblidade (Hibrand et al. 2018). Para identificar o sistema AI de Rosa, caracterizaram-se as sequências putativas das S-RNases em 12 espécies (Rosa multiflora,

R. damascena, R. chinensis, R. odorata, R. rugosa, R. laevigata, R. moschata, R. xanthina, R. arvensis, R. majalis, R. minutifolia e R. persica). Todas estas espécies são AI (Schanzer

e Vagina, 2007; MacPhail e Kevan, 2009). Em R. chinensis, Hibrand et. 2018 propôs três sequências denominadas por S26-RNase, S30-RNase e S36RNase como genes putativos de RNase. Contudo, as três sequências putativas não possuem característica de

S-RNase, pois os genes são expressos noutros órgãos, como as anteras ou as folhas (Hibrand

(23)

10 caracterizadas filogeneticamente. Em R. chinensis, após identificar o gene putativo da

S-RNase, que está localizado no cromossoma 3, como descrito anteriormente (Hibrand et al. 2018) procedemos à caracterização de genes F-box neste cromossoma. Igual

metodologia foi aplicada aos contigues de R. multiflora que continam o gene S-RNase. Deste modo identificamos a região putativa do S-locus em Rosa.

1.7. Objectivos

A família Rosaceae é uma família de grande interesse económico, pois muitas espécies produzem frutos usados na alimentação humana. O mecanismo de AI é um entrave à produção de frutos, pois implica a coexistência de vários cultivares. Nesta família outras espécies como Rosa, que tem um papel fundamental na floricultura, apresentam várias características que determinam o valor da flor (como o número de pétalas, e número de espinhos) associadas à AI. Assim, estudos de AI são fundamentais nestas espécies. Por outro lado, perceber como sistemas complexos, como a AI, evoluem é uma questão fundamental em Biologia.

Este trabalho tinha como objectivo a caracterização do S-locus ancestral putativo de Rosaceae, bem como identificar os genes envolvidos em AI do genero de Rosa.

(24)

11

2. Materiais e Métodos

2.1. Análise do ponto isoelétrico (PI) de S-RNases de Malus e de Prunus

Utilizou-se a sequência P. avium S3-RNase (AJ298312) como query no Blastn. Selecionou-se Prunus como base de dados e utilizou-se baixa homologia, obtendo todas as entradas de Prunus com homologia ao nosso query. Todas as sequências contendo as palavras completa e DNA linear foram selecionadas para análise (Tabela Suplementar 1). A mesma metodologia foi usada para obter sequências nucleotídicas de Maleae usando como query a sequência M. domestica Sh-RNase (AB032247), e Malus e Pyrus como bases de dados (Tabela Suplementar 2). Após a identificação das sequências nucleotídicas, organizou-se os dados: no caso de Prunus dividiu-se os dados em quatro grupos: o primeiro exão mais a região do motivo proteico 1, a região do motivo proteico 1, a região do motivo proteico 2 e a sequência nucleotídica completa(Tabela Suplementar 1). No caso de Malus, organizou-se os dados referente à região do motivo proteico 1, a região do motivo proteico 2 e a sequência nucleotídica completa (Tabela Suplementar 2). Para cada sequência, calculou-se o valor do PI da proteína codificada por estas sequências nucleotídicas, com a utilização do ExPASy (https://web.expasy.org/compute_pi/, Gasteiger et al. 2005).

2.2. Identificação, no NCBI, de dados genómicos das espécies de interesse

A base de dados do NCBI assembly possui os genomas montados, como o de Rosa

multiflora, R. damascena e R. chinensis. Os genomas presentes no NCBI assembly podem

ser comparados com as sequências aminoacídicas de referência das S-RNases (Prunus, com o número de acesso AJ298312; Malus, com o número de acesso AB032247; e

Fragaria com os números de acesso gi561957436, gi561674690 e gi561985884), com a

utilização do tblastx. As sequências putativas obtidas, por este método serão caracterizadas, em termos dos motivos aminoacídicos que a sua proteína putativa confere e o ponto isoelétrico.

A base de dados SRA (“Sequence Read Archive”, https://www.ncbi.nlm.nih.gov/sra) do NCBI possui leituras genómicas ou transcriptómicas referentes à subfamília de Rosaceae. Com base nas relações filogenéticas das espécies desta família, estabelecidas recentemente por Xiang et al. 2016. Selecionaram-se as espécies correspondentes a cada tribo para as quais existam dados de sequenciação genómico. A base de dados SRA, presente no NCBI, possibilita o download das sequências de interesse (Tabela 2), no formato FASTQ.

(25)

12 Tabela 2. Genomas de Rosaceae disponíveis no NCBI, usadas para a caracterização do gene da S-RNase. Os genomas encontram-se montados (Assembly) ou em pequenos fragmentos de sequênciação (SRA).

Base de dados Espécie (subfamília) Número de acesso

Assembly Rosa damascena (Roseae) PRJNA322107 Assembly R. multiflora (Roseae) PRJDB4738

Assembly/SRA R. chinensis (Roseae) PRJNA413292/SRR7077020

SRA Kageneckia oblonga (Maleae) SRX1570293/ SRX1568359

SRA Vauquelinia californica (Maleae) SRX1550524/ SRX1529442

SRA Gillenia stipulate (Gillenieae) SRX1583691

SRA Physocarpus opulifolius

(Neillieae)

SRX1583744/ SRX1567867

SRA R. moschata (Roseae) SRR7077017/ SRR6175508

SRA R. laevigata (Roseae) SRR7077018

SRA R. rugosa (Roseae) SRR7077019/ SRR6175514

SRA R. persica (Roseae) SRR7077021

SRA R. xanthina spontanea (Roseae) SRR7077022

SRA R. minutifolia (Roseae) SRR7077023

SRA R. odorata (Roseae) SRR6175507/ SRR6175516

SRA R. arvensis (Roseae) SRR6175512

SRA R. majalis (Roseae) SRR6175513

2.3. Montagem do genoma

Os ficheiros FASTQ de cada espécie, com características de genómico, foram descarregados no SRA (Tabela 2). Antes do tratamento computacional removem-se os adaptadores presentes nos “reads”. As ferramentas do FASTQ, implementadas na plataforma Galaxy (Blankenberg et al 2010; Goecks et al. 2010) são utilizadas para remover os “reads” das sequências de ambas as zonas terminais.

Procede-se à montagem de novo do genoma de cada espécie (Tabela 2), utilizando o programa Abyss 2.0 (Jackman et al. 2017), para a formação de “contigs”. Os programas do SSPACE (Boetzer et al. 2011) e Minimus2 (Sommer et al. 2007), juntam os “contigs” e formam os “scaffold. Os “open reading frames” putativos foram obtidos com o BDBM (https://www.sing-group.org/BDBM/). Procedeu-se ao blast (utilizando o tblastx) com as sequências de referência indicadas em 2.2. Consideram-se as sequências que possuem um valor superior a 0,05. Para a análise foram consideradas todas as sequências com tamanho superior a 100 bp. O programa SEDA (http://www.sing-group.org/seda/) permitiu

(26)

13 convergir as sequências obtidas (“contigs” que apresentam 100% de homologia) e remover aquelas que são redundantes. As sequências obtidas foram analizadas para as características do gene em estudo.

2.4. Caracterização do gene S-pistilo

Para cada espécie da família da Rosaceae, presentes na Tabela 2, caracteriza-se as sequências do gene putativo da S-RNase, obtidas em 2.2. Por homologia (utilizando o tblastn,

https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=tblastn&PAGE_TYPE=BlastSearc h&LINK_LOC=blasthome) com a sequência aminoacídica de referência de Prunus (com o número de acesso AJ298312) Malus (com o número de acesso AB032247) e Fragaria (com os números de acesso gi561957436, gi561674690 e gi561985884), identificou-se as sequências codificantes do gene em estudo. Com as sequências putativas codificantes obtidas, determina-se as sequências aminoacídicas putativas (com a utilização do programa ProSeq versão 2.0, http://en.bio-soft.net/format/ProSeq.html) e calcula-se o ponto isoelétrico (PI), com a utilização do programa ExPASy (https://web.expasy.org/compute_pi/). Comparou-se as sequências aminoacídicas com os padrões caracteristicos das RNases. As sequências com as características do gene da

S-RNase foram utilizadas para a construção das árvores filogenéticas. As árvores

filogenéticas foram obtidas usando o algoritmo de alinhamento do ClustalW2 presente no MEGAX (https://www.megasoftware.net/).

2.5 Caracterização de genes S-pólen em Rosa chinensis e R. multiflora

Para as espécies de R. chinensis e R. multiflora, em que os contigues têm mais de 30 Kb, procedemos à identificação de genes S-pólen F-box na região do gene S-RNase putativo. No caso de R. chinensis esta análise foi executada para todo o cromossoma 3. As sequências F-box foram obtidas por homologia (utilizando o tblastn, https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=tblastn&PAGE_TYPE=BlastSearc h&LINK_LOC=blasthome) com as sequências aminoacídicas de P. avium S3-SFB (AY571665 ), P. mume SLFL1 (AB280956 ), e Malus S3-SFBB3 (AB5398459). As sequências obtidas foram utilizadas para a construção das árvores filogenéticas. As árvores filogenéticas foram obtidas usando o algoritmo de alinhamento do ClustalW2 e presente no MEGAX (https://www.megasoftware.net/).

2.6. Caracterização dos genes do S-locus em Rosa arvensis 2.6.1 Material vegetal

Folhas da espécie de Rosa arvensis com diferentes haplótipos (Tabela 3) foram utilizadas para a extração do DNA genómico, recorrendo ao método presente em 2.6.2.

(27)

14 Tabela 3. Indivíduos utilizados para o estudo de segregação. Os S-haplótipos foram estabelecidos de acordo com os progenitores usados para obter estes indivíduos (Pascal, comunicação pessoal).

S-haplótipo Indivíduo(s)

S1S2 E404; Osenbuhr (OSO)

S1S3 E201; E400; E412

S2S3 E200 S3S6 Widensolen (Wi) S4S5 Urlozenholz (Ur) S1S(2/4) E459 S2S(3/6) E433; E435 S(1/2)S(4/5) E893; E894

2.6.2 Extração do DNA genómico de R. arvensis

Selecionaram-se duas a três folhas de cada indivíduo de Rosa arvensis com o haplótipo conhecido (Tabela 3) para um almofariz, esmagando o tecido vegetal em azoto líquido. Recolhe-se o pó obtido, para um tubo e procedemos à extração de DNA genómico de usando o método de Ingram et al. 1997, com pequenas alterações. Resumidamente, ao do tecido em pó adicionamos o tampão de extração (50 mM EDTA; pH 8; 0.1 mM NaCl; 0.1 M Tris–HCl, pH 8; 1% (p/v) dodecil sulfato de sódio (SDS)) que permite a quebra da parede e da membrana celular, obtendo os núcleos que contêm o DNA genómico. Centrifugaram-se os tubos a 4000 rpm para precipitar os núcleos, desprezando o sobrenadante. Ressuspende-se a pellet com 300 µl de tampão de extração, de seguida, adiciona-se 300 µl de tampão de lise nucleica (NaCl 400 mM; EDTA 25 mM; Tris-HCl 50 mM, pH 8) mais 120 µl de sarcosil a 5% (v/v). Agita-se os tubos e incuba-se a 65ºC durante 20 min. Após este período de incubação, adiciona-se 600 µl de clorofórmio. Centrifuga-se a mistura a 11000 rpm num período de 5 min, desprezando a pellet. Adiciona-se 600 µl de fenol-clorofórmio (numa proporção de um para um) ao sobrenadante, procedendo a uma centrifugação a 11000 rpm durante 5 min.

Ao sobrenadante adiciona-se 600 µl de clorofórmio (neste passo, o sobrenadante é aplicado às colunas Phase Lock Gel (PLG; Eppendorf) e adiciona-se o clorofórmio), procedendo de novo à centrifugação descrita anteriormente. Adiciona-se 500 µl de isopropanol ao sobrenadante, centrifugando a mistura durante 2 min a 11000 rpm. Remove-se o sobrenadante e à pellet obtida adiciona-se 200 µl de etanol 75%, com uma centrifugação durante 2 min. O álcool adicionado permite a precipitação do DNA, ficando retido na pellet após a centrifugação. Remove-se o sobrenadante e procede-se à secagem do etanol. Após o período de 10 minutos de secagem, dissolve-se a pellet em 50 µl de H2O com 5 µl de RNaseA (Ingram et al. 1997).

2.6.3 PCR (“Polymerase chain reaction”)

A partir dos locais conservados das sequências putativas do gene da S-RNase de Rosa

(28)

15 1). Os primers desenhados são utilizados para a amplificação do gene da S-RNase em

Rosa arvensis nos diferentes haplótipos da Tabela 3.

As condições utilizadas na amplificação do DNA genómico são uma desnaturação inicial a 95 ºC durante 5 min, procedida por uma segunda desnaturação a 95 ºC por 30 seg. A fase do emparelhamento tem um período de 45 seg, com uma temperatura de 52 ºC (Figura Suplementar 1). A extensão do primer é a uma temperatura de 72 ºC durante 2 min, existindo uma repetição de 35 ciclos desde a segunda desnaturação até à fase da extensão. Termina a fase da amplificação durante 5 min a 72 ºC (fase da extensão final). 2.6.4 Extração do DNA do gel de agarose – QIAEX gel extraction protocol

Após o corte dos produtos de amplificação, com o tamanho esperado (Figura Suplementar 1), adiciona-se 450 µl de QX1 (tampão de solubilização) por cada 0,1 gramas de produto com a adição de 10 µl de lã de vidro a cada tubo. Incuba-se os tubos a 50ºC durante 10 min. De seguida, centrifuga-se a mistura à velocidade máxima, num período de 1 min. Despreza-se o sobrenadante e à pellet acrescenta-se 500 µl de QX1, com a ressuspensão da pellet, centrifugando de novo a mistura ressuspendida (durante um minuto à velocidade máxima). Procede-se à adição de 500 µl de PE (tampão de lavagem), após a remoção do sobrenadante, ressuspendendo a pellet. Centrifuga-se esta mistura à velocidade máxima e durante um minuto, sendo necessária a repetição da lavagem com PE. Remove-se o sobrenadante e segue-se à secagem da pellet (num período de 10 min). Ressuspende-se a pellet em 3 µl de H20 e espera-se 10 min para a eluição do DNA da

pellet. Centrifuga-se um minuto à velocidade máxima e transfere-se dois µl do sobrenadante para um tubo limpo para posterior clonagem.

2.6.5 Clonagem- “TOPO TA cloning control reaction”

Aos 2 µl de DNA, adicionou-se 0,3 µl de vetor pCRTM 4-TOPO mais 0,5 µl de solução salina, com um período de incubação de 5 min. Este período de incubação permite que o fragmento de DNA seja inserido no vetor. A mistura é adicionada às células competentes, procedendo-se a uma incubação em gelo durante 30 min. Após este período de incubação, segue-se o choque térmico das células competentes (o choque térmico permite que o vetor mais o fragmento inserido consiga atravessar a parede celular bacteriana e entre para o citoplasma). As células competentes são incubadas a 42 ºC durante 30 s e colocadas imediatamente em gelo durante dois min. Após o período de dois min, adiciona-se 100 µl de meio SOC às células transformadas. Incuba-se as células a 37 ºC durante 1h10min, com agitação horizontal. Este período de incubação permite a multiplicação do vetor mais o fragmento inserido. Procede-se ao plaqueamento das células transformadas, com uma incubação “overnight”.

2.6.6 Extração do DNA plasmídico – protocolo NZYminiprep

As colónias, com o fragmento inserido no vetor e com padrões de corte enzimáticos diferentes, são selecionadas para recrescer, em meio líquido (5 ml de LB para 5 µl de ampicilina, com um crescimento “overnight” a 37 ºC e com agitação horizontal).

(29)

16 Centrifuga-se os tubos a 4000 rpm num período de 10 min, desprezando o sobrenadante. Ressuspende-se a pellet em 250 µl de tampão A1 (tampão de ressuspensão) e adiciona-se 250 µl de tampão A2 (tampão de lise), invertendo os tubos. Adiciona-se 300 µl de tampão A3 (tampão de neutralização) e centrifuga-se a mistura durante 10 min à velocidade máxima. O sobrenadante é aplicado nas colunas (NZYminiprep) e centrifuga-se as colunas durante um minuto. Despreza-se o líquido presente no tubo coletor e adiciona-se 500 µl de tampão AY (tampão de lavagem), centrifugando durante um minuto. O líquido obtido após a centrifugação é desprezado e adiciona-se 600 µl de tampão A4 (tampão de lavagem), com o tempo de espera de três minutos após a adição do tampão A4. Procede-se a uma centrifugação durante um minuto e elimina-Procede-se os resíduos preProcede-sentes no tubo coletor, centrifugando de novo para a eliminação do tampão de lavagem (tampão A4), durante um minuto. Coloca-se a coluna em tubos limpos e elui-se em 50 µl de H20, com

um tempo de espera de cinco minutos antes da centrifugação. 2.6.7 Sequenciação

2.6.7.1 Amplificação do plasmídeo - ABI PRISM BigDye cycle-sequencing

Para sequenciar o plasmídeo (vetor mais fragmento) é necessário amplificá-lo. Deste modo, a cada tubo, adiciona-se 2 µl de Big DYE mais 0,63 µl de um do primers M13 (na sequenciação só se amplifica uma das cadeias do plasmídeo). A esta mistura, adiciona-se 2,6 µl de DNA plasmídico, extraído em 2.4.6. Com os ciclos presentes na Tabela 4. Tabela 4. Parâmetros utilizados para a amplificação do plasmídeo inserido no vetor pCRTM 4-TOPO, com a utilização dos primers M13 Forward e M13 Reverse.

Parâmetros temperatura /tempo

Passos Temperatura/tempo

Desnaturação 96ºC – 2 min

Desnaturação 95ºC – 30 seg

Emparelhamento 50ºC – 15 seg 25 x

Extensão 60ºC – 4 min

2.6.7.2 Limpeza dos produtos de sequênciação

Para cada 3 tubos de sequenciação, prepara-se uma solução de stock de 50 µl de etanol (EtOH) a 95% com 2 µl de NaAC (acetato de sódio) 3M. Adicionar 15 µl desta mistura a cada tubo de sequenciação, vortexando cada tubo durante 30 segundos. Incuba-se as amostras em gelo, durante 30 min, e de seguida centrifugam-se à velocidade máxima, com o mesmo período de tempo. Despreza-se o sobrenadante e adiciona-se 150 µl de EtOH a 75%, a cada tubo. Centrifuga-se as amostras à velocidade máxima durante 2 min, desprezando o sobrenadante. Procede-se à secagem dos tubos para remover o excesso do etanol, para não ocorrer interferências de leitura na sequenciação. As amostras tratadas foram sequenciadas pela STAB vida (https://www.stabvida.com/pt/).

(30)

17

3. Resultados e Discussão

3.1. Valores de PI (ponto isoelétrico) em diferentes regiões da proteína codificada pelo

gene S-RNase em Rosaceae

A maior parte das sequências obtidas neste trabalho são sequências parciais, em que só possuem a região nucleotídica que contém o primeiro motivo proteico (Tabela 1) ou a região nucleotídica do segundo motivo proteico (Tabela 1). Deste modo, a utilização do PI como uma característica para identificação da S-RNase só é possível se ambas as regiões codificarem para proteínas com PI a cima de oito como observado nas S-RNases completas (Igic e Kohn 2001; Ramanauskas et al. 2017). Assim, procedemos à análise de PI das diferentes regiões para S-RNases de Prunus e Malus.

Na base de dados do NCBI, encontra-se 29 proteínas da S-RNase em 14 espécies diferentes de Prunus (Tabela Suplementar 1). O gene da S-RNase de Prunus possui três regiões exónicas (Entani et al. 2003; Tao et al. 2007). A região exónica 1 é bastante pequena (≈ 100 bp) e não possui qualquer motivo aminoácido que possa ser usado para a sua identificação. As regiões exónica 2 e 3 podem ser facilmente identificadas pela presença do motivo proteico 1 e motivo proteico 2, respetivamente (ver a Tabela 1). Assim, consideramos três grupos: o exão 1 mais o exão 2, o exão 2 e o exão 3 (região do segundo motivo proteico). Para estes três grupos procedemos ao cálculo do PI (PI1+2, PI2 e PI3). O PI1+2 variou entre 8,80 e 10,16, e o PI2 (região do motivo proteico 1 sem a região exónica 1) variou entre 8,55 e 10,62. O PI3 (região do segundo motivo proteico) variou entre 8,58 e 9,48. A análise do PI da proteína total da S-RNase apresentou uma variação de 9,02 até 9,65 (Figura 5), como reportado na literatura (Igic e Kohn 2001; Ramanauskas et al. 2017). 6 8 10 12 0 5 10 15 20 25

1 e 2 exão 2 exão 3 exão completa

PI

Número da sequência de acordo com Tabela Suplementar 1

Figura 5. Ponto isoelétrico das sequências proteicas das S-RNases de Prunus.

Em Malus, 46 sequências encontram-se disponíveis no NCBI, pertencentes a quatro espécies diferentes (Figura 6, Tabela Suplementar 2). Em Malus, o gene da S-RNase possui dois exões. O exão 1 pode ser facilmente identificado pelo motivo proteico 1 e o exão 2 é identificado pelo motivo proteico 2 (Tabela 1). Assim, dividimos as sequências de acordo com os exões e calculamos o PI das proteínas codificadas por estas regiões. Nos dados apresentados da Figura 6, a proteína total apresenta valores de PI entre 8,59 e 9,53, como reportado na literatura (Igic e Kohn 2001; Ramanauskas et al. 2017). O PI da região proteica codificada pelo 1º exão varia entre 5,29 e 9,47, enquanto a região proteica

(31)

18 codificada pelo 2º exão, o PI varia entre 8,75 e 9,61. 31 sequências (Figura 6) apresentam valores abaixo de 8 (analisando somente o primeiro exão). Isto implica que não se podemos excluir sequências putativas parciais que cobrem somente o primeiro exão, a partir do valor o PI.

4 6 8 10 12 0 5 10 15 20 25 30 35 40 45

1 exão 2 exão Completa

PI

Número da sequência de acordo com Tabela Suplementar 2

Figura 6. Ponto isoelétrico das sequências proteicas das S-RNases de Malus.

Assim, consideramos para análises futuras todas as sequências que cubram as regiões do primeiro e do segundo motivo aminoacídico, típico das S-RNases, que codificam para proteínas que apresentam PI a cima de 7. Nas sequências parciais, considerámos todas as sequências, independetemente do PI, que cubram a região do primeiro motivo proteico. Para as sequências que só apresentam a região do motivo proteico 2, que codifica para proteínas putativas, considerou-se valores de PI igual ou superior a 7.

3.2. Análise do gene da S-RNase na subfamília das Amygdaloideae

No NCBI está disponível o genoma das espécies V. californica, K. oblonga, G. stipulate e P. opulifolius, todas pertencem à subfamília das Amygdaloideae (Tabela 2; Figura 4). Os géneros Vauquelinia e Kageneckia, bem como Malus, Pyrus e Sorbus, pertencem à tribo Maleae, sendo Kageneckia a espécie mais divergente. Gillenia pertence à tribo Gillenieae e está a divergir de Maleae à 52 Ma. Physocarpus é um outgroup a Maleae e Amygdaleae (Prunus), estando a divergir destes há 91 Ma (Xiang et al. 2016). Os genomas destas espécies estão disponíveis na base de dados NCBI em formato SRA (reads) e por isso neste trabalho procedemos à sua montagem como descrito em Material e Métodos. As sequências obtidas foram anotadas após BlastX, de acordo com a homologia obtida com sequências de S-RNases. A homologia na região dos motivos proteicos 1 e 2 permite identificar as possíveis regiões codificantes, pois em todas as

S-RNases descritas existe um intrão a separar estes motivos (Igic e Kohn 2001; Vieira e

Charlesworth 2002; Ramanauskas et al. 2017). Procurámos regiões de conservação de “Splicing” de intrões para anotação putativa dos mesmos.

No genoma de V. californica foi possível identificar 34 sequências com homologia a sequências de S-RNase de Malus, Prunus e Fragaria. A sequência valq2 é a única sequência que cobre a região do primeiro e do segundo motivo proteico das S-RNases.

Referências

Documentos relacionados

Fatores de sucesso + - Acesso a Tecnologia Insumos Colheita Mão-de-obra Terra Escala Pequena Média Grande Crédito Garantias/Risco Carência Custo do capital Segurança Fiscal

Fazendo um paralelo com o caso da ponte Hercílio Luz, conclui-se que é possível a responsabilização da União, do Estado de Santa Catarina e do Município de Florianópolis pelos

Um dos conhecimentos que mais me provocaram inquietações diz respeito a Libras (Língua Brasileira de Sinais), que culminaram com outros conhecimentos construídos nas

a) Executar os serviços durante 12 (doze) meses, a contar da publicação do extrato desta Ata no Jornal Oficial do Município, os itens relacionados na presente Ata, na forma

Esta disserta¸c˜ ao baseia-se em medidas de roteadores de backbone reais, assim como os trabalhos de [16] e [11], instalados em um ambiente de laborat´ orio de uma em- presa

CST para a rampa de carga ...111 Figura 6-28 Potência Reativa das unidades de geração controladas da Área Centro com CST para a rampa de carga de potência reativa ...112 Figura

Fondamento :  O  conhecimento  divide‐se  de  seguintes  maneiras :    o  conhecimento  a    prior,   

Tal procedimento não visa, de forma alguma, a classificação qualitativa ou quantitativa dos resultados. Mas apenas teve o objetivo de funcionar como alternativa