• Nenhum resultado encontrado

Estudos genômicos em Eucalyptus : mapeamento de genes candidatos e QTLs, estimativa de desequilíbrio de ligação e análise de estrutura de populações

N/A
N/A
Protected

Academic year: 2017

Share "Estudos genômicos em Eucalyptus : mapeamento de genes candidatos e QTLs, estimativa de desequilíbrio de ligação e análise de estrutura de populações"

Copied!
390
0
0

Texto

(1)

DANIELLE ASSIS DE FARIA

Estudos genômicos em Eucalyptus: Mapeamento de genes

candidatos e QTLs, estimativa de desequilíbrio de ligação e

análise de estrutura de populações

Tese apresentada ao Programa de

Pós-Graduação Strictu-Senso em Ciências

Genômicas e Biotecnologia da

Universidade Católica de Brasília, como requisito para obtenção do Título de Doutor em Ciências Genômicas e Biotecnologia

Orientador: Rinaldo Wellerson Pereira

Co-orientador: Dario Grattapaglia

BRASÍLIA

2008

(2)

Ficha elaborada pela Sistema de Bibliotecas da Universidade Católica de Brasília ± SIBI//UCB.

!

!

!

F224e Faria, Danielle Assis de

Estudos genômicos em Eucalyptus : mapeamento de genes candidatos e QTLs, estimativa de desequilíbrio de ligação e análise de estrutura de populações / Danielle Assis de Faria. - 2008.

390 f. ; il. ; 30 cm.

Tese (doutorado) ± Universidade C atólica de B rasília,

2008.

Orientação: Rinaldo Wellerson Pereira

1. Genética. 2. Eucalipto. 3. Clonagem molecular. 4. Melhoramento genético. I. Pereira, Rinaldo Wellerson, orient. II. Título.

(3)

7HVH GH DXWRULD GH 'DQLHOOH $VVLV GH )DULD LQWLWXODGD ³(678'26

GENÔMICOS EM Eucalyptus: MAPEAMENTO DE GENES CANDIDATOS E QTLs, ESTIMATIVA DE DESEQUILÍBRIO DE LIGAÇÃO E ANÁLISE DE ESTRUTURA

*(1e7,&$'(3238/$d®(6´DSUHVHQWDGDFRPRUHTXLVLWRSDUFLDOSara obtenção

do grau de Doutor em Ciências Genômicas e Biotecnologia da Universidade Católica de Brasília, em 03 de outubro de 2008, defendida e aprovada pela banca examinadora abaixo assinada:

____________________________________________________ Prof. Dr. Rinaldo Wellerson Pereira

Orientador

Curso Ciências Genômicas e Biotecnologia/ Universidade Católica de Brasília ± UCB

____________________________________________________ Prof. Dr. Dário Grattapaglia

Co-Orientador

Curso Ciências Genômicas e Biotecnologia/ Universidade Católica de Brasília ± UCB

____________________________________________________

Prof.Dr. Alexandre Siqueira Guedes Coelho

Examinador Externo

Universidade Federal de Goiás ± UFG

____________________________________________________ Prof. Dr. Márcio Elias Ferreira

Examinador Externo

Embrapa Recursos Genéticos e Biotecnologia

____________________________________________________ Prof. Dr. Georgios Joannis Pappas Júnior

Examinador Interno

Curso Ciências Genômicas e Biotecnologia/ Universidade Católica de Brasília ± UCB

(4)

!

! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !

Aos meus pais Joanita e Washington e ao meu esposo Samuel, Por acreditarem em mim e no meu trabalho! Por todo amor e compreensão!

(5)

AGRADECIMENTO

À Universidade Católica de Brasília e ao programa de Programa de

Pós-*UDGXDomR³Stricto Sensu´HP&LrQFLDV*HQ{PLFDVH%LRWHFQRORJLD, por apoiarem a

realização desse trabalho.

Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

pela concessão da bolsa de estudos durante o curso.

Ao Prof. Rinaldo Wellerson Pereira por concordar em ser meu orientador e

junto comigo investir num campo ainda pouco explorado na genética de Eucalytpus.

Ao Dr. Dario Grattapaglia por acreditar no meu trabalho, pela amizade e pelos

infinitos ensinamentos, paciência e conselhos.

Ao Laboratório de Genética Vegetal ± Embrapa Recursos Genéticos e

Biotecnologia que me acolheu para realização de todos experimentos apresentados

neste trabalho.

Aos membros da banca examinadora: Dr. Alexandre Siqueira Guedes Coelho,

Dr. Márcio Elias Ferreira e Dr. Georgios Joanis Pappas Júnior, que durante a

execução da tese sempre estiveram à disposição para esclarecimentos sobre o

tema.

Aos demais pesquisadores da Embrapa: Dra. Gláucia Buso, Dra. Ana Ciampi,

Dra. Vânia Azevedo, Dr. Márcio Moretzsoh, Marco Antônio Ferreira e Zilneide

Amaral pelo carinho no laboratório e ajuda nos momentos difíceis.

Aos estagiários e estudantes que passaram pelo Laboratório de Genética

Vegetal nesse período, que de uma forma ou de outra se tornaram amigos e

companheiros de dúvidas e alegrias.

$RV PHXV ³ILOKRV´ H DPLJRV /HDQGUR *RPLGH H /HRQDUGR 4XHLUR] TXH PH

ajudaram dentro e fora do laboratório, sempre me acalmando e pegando no pesado

comigo quando necessário.

Aos estagiários do Genolyptus Laís Pinheiro e Mariana Caldas que além de

me ajudarem dentro do laboratório me deram a oportunidade de participar dos seus

projetos e aprender juntamente com elas também.

Aos meus amigos de Genolytpus: Carol, Cesar, Eva, Juliana e Juliano que

apesar dos momentos de aperto e às vezes de correria sempre estiveram ao meu

(6)

À pesquisadora Marília Pappas, que ao longo dessa caminhada se tornou

uma amiga especial sempre disposta a ajudar e consolar nos momentos difíceis

dessa jornada.

¬GXDVDPLJDVHVSHFLDLVH³SULPDV´7KDtVDH%UXQDTXHVHPSUHHVWLYHUDP

junto comigo no lab e fora dele para ouvir desabafos e conversar besteiras.

Agradeço muito às duas pois elas demonstraram ao longo da convivência

experiências de vida que me marcaram e mudaram a minha concepção de vida e

trabalho.

Aos meus pais que sempre acreditaram em mim e mesmo depois de casada,

eles sempre incentivaram meus objetivos profissionais e me apoiaram nos

momentos em que tive que decidir por mudanças radicais na minha carreira.

Ao meu amado esposo e melhor amigo do mundo, Samuca, que agüentou

todos os choros, todas as incertezas, ansiedades e dificuldades nessa caminhada.

Por ele sempre estar ao meu lado até altas horas no seqüenciador e/ou no

computador. Por me ajudar a descobrir como funcionam vários programas de

análise que nunca havíamos usado antes. Principalmente por me amar e me deixar

(7)

RESUMO

Faria, Danielle Assis de. Estudos genômicos em Eucalyptus: Mapeamento de genes

candidatos e QTLs, estimativa de desequilíbrio de ligação e análise de estrutura de

populações. 2008. 388. Tese de doutorado em Ciências Genômicas e Biotecnologia,

Universidade Católica de Brasília, Brasília ± DF, 2008.

As florestas plantadas com espécies do gênero Eucalyptus e seus híbridos

constituem a base da produção nacional de celulose, papel e carvão vegetal. Estes

setores envolvem empresas que executam melhoramento genético visando o

aumento da produtividade e qualidade produção de matéria prima florestal em nível

altamente competitivo. Neste cenário o uso de tecnologias genômicas associadas às

estratégias de melhoramento genético convencional pode acelerar e aumentar a

eficiência de todo o processo de melhoramento. Este trabalho envolveu um conjunto

de experimentos visando gerar informações para estudos de genética de associação

no gênero Eucalyptus no Brasil. Foram estudadas seis espécies pertencentes ao

gênero Eucalyptus utilizadas no melhoramento florestal no Brasil (E. grandis, E.

camaldulensis, E. urophylla, E. globulus, E. dunnii e E. saligna). Além das espécies puras, foram também avaliados clones híbridos espontâneos utilizados em plantios

operacionais. Trechos de genes candidatos selecionados foram seqüenciados em

amostras populacionais destas espécies. A identificação de genes e regiões

genômicas para futuros estudos de associação foi realizada utilizando mapeamento

de QTLs para diferentes características (volume, densidade básica, altura, DAP,

relação siringil:guiacil, teor de lignina e rendimento depurado) em uma família

envolvendo parentais híbridos (E. dunnii x E. grandis) X (E. urophylla x E. globulus). No mapa genético gerado com microssatélites foram posicionados os genes

candidatos COMT, C4H, SAMS, Celulose Synthase, CCR, F5H, MYB PAL,

(8)

foram encontrados 12 QTLs para todas as características. O grupo de ligação com a

maior concentração de QTLs encontrados foi o grupo seis. O mapeamento de genes

candidatos foi uma estratégia válida, pois foram encontrados dois genes (SAMS e

Alfatubulina) co-localizados em um intervalo contendo QTLs para características

correlacionadas. A estrutura genética existente nas amostras populacionais das seis

espécies foi avaliada com o programa STRUCTURE com base em 35 locos

microssatélites nucleares, 11 locos microssatélites cloroplastidiais e SNPs também

pertencentes ao genoma cloroplastidial. Os marcadores moleculares revelaram uma

clara diferenciação entre espécies e procedências dentro de espécies

geograficamente separadas, mas não para procedências próximas. Tanto os dados

moleculares autossômicos, como os dados de cloroplasto mostraram uma alta

diversidade genética nas seis espécies do gênero Eucalyptus. Os clones híbridos avaliados para os mesmos marcadores (microssatélites nucleares e cloroplastidiais;

e SNPs) foram alocados quanto à sua origem híbrida, nas espécies E. grandis e E.

urophylla. Os marcadores no cloroplasto revelaram uma origem materna

predominante de E. grandis. Estimativas de desequilíbrio de ligação (DL) derivadas

de marcadores SNPs revelaram que o DL em regiões gênicas não se estende além

de 1000 pares de base. As estimativas de DL, entretanto variam dependendo do

gene analisado e da espécie. De maneira geral, E. grandis e E. camaldulensis

apresentaram as menores extensões de DL. E. dunnii e E. globulus, apresentam

polimorfismos altamente correlacionados e em DL por até 1000 pb. Para a espécie

E. saligna, a extensão do DL ao longo do gene CAD é intermediária em relação às demais espécies. Já para o gene 4CL, os indivíduos analisados pertencentes a esta

espécie, demonstraram correlações significativas entre os polimorfismos

identificados, estendendo assim o DL por até 900 pares de base. Os clones também

avaliados quanto à extensão do desequilíbrio de ligação, apresentaram extensões

similares por até 400 a 500pb nos dois genes avaliados. Porém no gene 4CL, os

valores da correlação entre os SNPs par a par (r2) foram muito maiores do que os

valores encontrados no gene CAD. Levando em consideração a rápida queda do

desequilíbrio de ligação reportada aqui para o gênero Eucalyptus, a associação

entre genótipos e fenótipos encontrada via mapeamento de QTLs em uma

determinada família não pode ser estendida para outra família. Novas técnicas de

seqüenciamento e genotipagem em larga escala vêm aumentando o número de

(9)

PALAVRAS-CHAVE: desequilíbrio de ligação, estrutura genética, mapeamento de

associação, marcadores moleculares, melhoramento florestal, QTL.

(10)

ABSTRACT

!

Cellulose and charcoal dependent industries in Brazil are based on

commercial eucalyptus forests developed during the last fifty years in a well

established and highly competitive breeding program looking for improvements in

lignin or cellulose. Genomic based technologies bring to these programs the promise

to improve gains in time and productivity. DNA markers discovery and their

application in linkage mapping and association mapping represent the basic

application of genomics in any organism breeding program. This work involved a

series of experiments in order to generate information for genetic association studies

in Eucalyptus. We studied six species of the genus Eucalyptus used in breeding

programs in Brazil (E. grandis, E. camaldulensis, E. urophylla, E. globulus, E. saligna

and E. dunnii). Besides of pure species, expontaneous hybrid clones, used in

operational plantations, were also evaluated. Fragments of selected candidate genes

were sequenced on these species. The identification of genes and genomic regions

for future association studies were performed using QTL mapping for traits related to

growth and wood quality in a cross involving hybrid parents (E. dunnii x E. grandis) X

(E. urophylla x E. globulus). The genetic map generated with microsatellites was

used to position candidate genes as, COMT, C4H, SAMS, Cellulose Synthase, CCR,

F5H, MYB PAL, Alpha tubulin, among others, using SNPs genotyped by sequencing.

A total of twelve QTLs were found representing all phenotypes investigated with

exception to wood density measured by NIRS. Both parental maps showed a high

number of QTLs mapped to linkage group number six. Among the candidate genes,

two of them (SAMS and alfa-tubulin) were mapped in QTL intervals. Candidate gene

mapping in QTLs intervals showed to be a good strategy to select genes or regions

to be included in association mapping. Marker-assisted selection based on

long-range marker-trait association detected by QTL analysis may only be useful

within-family selection. Population genetic structure was evaluated using 35 autosomal, 11

chloroplast microsatellites loci, besides single nucleotide polymorphisms from

chloroplast genome. Both autosomal and chloroplast markers show that samples

(11)

in provenance level. Structured species based on provenance are those from distinct

Australian latitudes. For all kind of markers analyzed, the six species showed high

level of genetic diversity. Hibryd clones evaluated using the same molecular markers

were allocated as having their origin in E. grandis e E. urophylla. Specifically about

the maternal origin, chloroplast markers pointed to E. grandis. The results of genetic

population structure investigated here shows that we have to pay special attention in

hybrids to avoid spurious marked-trait association, since these hybrids are the most

used breeding population in Brazil. The genes CAD and 4CL, both from the

lignification pathway were resequenced in DNA samples from species and also in

hibryd clones. In general, significant linkage disequilibrium (LD) has been found no

longer than 1000 bp. The results were distinct based on gene or specie evaluated.

For CAD gene: E. grandis and E. camaldulensis showed rapidly LD decay. However,

in E. dunnii and E. globulus the decay does not start until 1000 bp. In E. saligna, the

LD showed intermediate values compared to other species. For 4CL gene: E. saligna

presented no LD decay in short distances when compared to the others species. For

the hybrids, the LD decay found was similar to that found in species, in the 4CL gene

analysis, the LD decay was slower than in the CAD gene. Considering the rapid

decay of LD reported here for Eucalytpus, the marked-trait association detected in one segregating population cannot be assumed to hold in a different pedigree. The

great challenge in the application of marker-assisted selection, is the low level of

linkage disequilibrium between genetic markers and QTLs in natural and breeding

populations. Next generation sequencing and highthroughput genotyping strategies

will increase the number of molecular markers available for use in marker-assisted

selection and this study aims to elucidate the genetic basis of association studies in

Eucalyptus.

KEYWORDS: association mapping, forest breeding, genetic structure, linkage

(12)

LISTA DE FIGURAS

CAPÍTULO 01

Figura 01± Posição de mapa dos microssatélites utilizados na análise de diversidade e estruturação

genética das populações de Eucalyptus. Em verde encontram-se assinalados os microssatélites no mapa genético construído para a população IP (Mammani & Grattapaglia, 2006a). ... 49!

Figura 02 ± Quantificação de DNA em gel de agarose 1% corado com brometo de etídeo para as

amostras de duas procedências da espécie E. grandis. Canaletas 1 a 3 (pente inferior e superior) ± padrões DNA de fago lambda (Invitrogen), concentração de 20Kg/PL, 50Kg/PL e 100Kg/PL, respectivamente. Canaletas 4 a 27 (pente superior) e 4 26 (pente inferior) ± amostras de DNA concentrado tratados com RNase. ... 54!

Figura 03 ± Eletroforese em gel de agarose 1% das amostras da espécie E. grandis diluídas para aproximadamente 2Kg/PL. Canaletas 1 e 2 (pente inferior e superior) ± padrões de DNA de fago lambda (Invitrogen), concentração de 10 Kg/PL e 20 Kg/PL, respectivamente. Canaletas 3 a 26 ± amostras de DNA diluídas onde foram aplicados 5µl. ... 55!

Figura 04± Dendrograma da relação genética entre as procedências e o conjunto de clones obtido

pela metodologia de agrupamento UPGMA a partir da matriz de distância genética de Nei (Nei, 1972). Valores apresentados entre os nós representam os valores de bootstrap com 1000 replicações. ... 70!

Figura 05± Dendrograma da relação genética entre as espécies e o conjunto de clones obtido pelo

método de agrupamento de UPGMA a partir da matriz de distância genética de Nei (Nei, 1972). Valores apresentados entre os nós representam os valores de bootstrap com 1000 replicações. ... 71!

Figura 06 ± Dendrograma da relação genética entre os indivíduos das espécies analisadas obtido

pela metodologia de agrupamento UPGMA a partir da proporção de alelos compartilhados. Verde ±E.

camaldulensis; Azul ±E. grandis; Vermelho ±E. urophylla; Laranja ±E. globulus; Amarelo ±E. dunnii

e Rosa ±E. saligna. ... 72!

Figura 07 ± Agrupamento individual das amostras analisadas das seis espécies de Eucalyptus

utilizando o software STRUCTURE. Agrupamentos mostrados para K 2 ao K 6. Números 1 ao 18 indicam as procedências (1 ± Flinder, 2 ± Jeeralang, 3 ± Pine Creek, 4 ± Coff´s Harbour, 5 ± Atherton, 6 ± Irvinebank, 7 ± Walsh River, 8 ± Kennedy, 9 ± Flores, 10 ± Timor, 11 ± Moleton, 12 ± 612, 13 ± 613, 14 ± 614, 15 ± Clouds Creek, 16 ± Chaelundi, 17 ± Sheas Nob, 18 ± Wild Creek). ... 74!

Figura 08 ± Agrupamento individual das amostras analisadas das seis espécies de Eucalyptus

utilizando o software STRUCTURE. Agrupamentos mostrados para K 7 ao K 18. Números um ao 18 indicam as procedências (1 ± Flinder, 2 ± Jeeralang, 3 ± Pine Creek, 4 ± Coff´s Harbour, 5 ± Atherton, 6 ± Irvinebank, 7 ± Walsh River, 8 ± Kennedy, 9 ± Flores, 10 ± Timor, 11 ± Moleton, 12 ± 612, 13 ± 613, 14 ± 614, 15 ± Clouds Creek, 16 ± Chaelundi, 17 ± Sheas Nob, 18 ± Wild Creek). ... 75!

Figura 01 ± Géis de agarose para algumas amostras do gênero Eucalyptus referentes aos três

(13)

Figura 02 ± Géis de agarose para algumas amostras do gênero Eucalyptus referentes aos seis fragmentos do gene 4CL amplificados para posterior seqüenciamento. Em cada gel encontra-se o tamanho do fragmento amplificado a partir de comparação com marcador molecular de peso conhecido. ... 114!

Figura 03. Blocos haplotípicos estimados para o gene CAD. 1 - E. camaldulensis; 2 - E-globulus; 3 -

E. saligna; 4 - E. grandis; 5 - E. urophylla; 6 - Clones;7 - E. dunni.i ... 120!

Figura 04. Blocos haplotípicos estimados para o gene 4Cl. 1 - E. camaldulensis; 2 - E-globulus; 3 - E.

saligna; 4 - E. grandis; 5 - E. urophylla; 6 - Clones;7 - E. dunnii. ... 122!

Figura 05. Representação Gráfica DL em Eucalyptus para o gene CAD. 1 - E. camaldulensis; 2 -

E-globulus; 3 - E. saligna; 4 - E. grandis; 5 - E. urophylla; 6 - Clones;7 - E. dunnii. ... 133!

Figura 06. Representação Gráfica DL em Eucalyptus para o gene 4Cl. 1 - E. camaldulensis; 2 -

E-globulus; 3 - E. saligna; 4 - E. grandis; 5 - E. urophylla; 6 - Clones;7 - E. dunnii. ... 140!

Figura 07± Gráficos representando a extensão do Desequilíbrio de ligação no gene CAD versus a

distância em pares de base. O desequilíbrio de ligação foi estimado a partir dos valores de r2. Os pontos vermelhos representam os valores de r2 para cada par de SNPs. ... 142!

Figura 08 - Gráficos representando a extensão do Desequilíbrio de ligação no gene CAD versus a

distância em pares de base. Desequilíbrio de ligação calculado baseado em valores de r2. Os pontos vermelhos representam os valores de r2SDUDFDGDSDUGH613VVLJQLILFDWLYRV/2'• ... 143!

Figura 09 - Gráficos representando a extensão do desequilíbrio de ligação no gene 4CL versus a

distância em pares de base. Desequilíbrio de ligação calculado baseado em valores de r2. Os pontos vermelhos representam os valores de r2 para cada par de SNPs. ... 144!

Figura 01. Representação esquemática dos iniciadores desenhados para cada gene. A.

Representação dos quatro iniciadoresdesenhados, sendo dois posicionados externamente com base no consenso de EST (laranja) e dois internos (azul). B. Representação das quatro combinações possíveis de amplificação dos genes ilustrando os segmentos de tamanhos diferentes gerados a partir da referência. ... 159!

Figura 02 ± Representação gráfica em porcentagem do total de locos testados na população de

mapeamento do cruzamento DG x UGL. ... 173!

Figura 03± Triagem de genes candidatos nas famílias de mapeamento (IP e DGxUGL). ... 174!

Figura 04± Resumo da sucesso de mapeamento de ESTs nas famílias de mapeamento (IP e DG x

UGL). ... 175!

Figura 05 ± Alinhamento da seqüência gerada para o EST 981, evidenciando um dos SNPs que

apresentam alelos improváveis na progênie. ... 176!

Figura 06 ± Gráfico representando em porcentagem os locos microssatélites informativos para o

cruzamento DG x UGL. ... 177!

Figura 07. Produto da amplificação do EST 2727 analisado por eletroforese em gel de agarose 3%

(14)

Figura 08. Produto da amplificação de segmento do gene 2727 em gel de poliacrilamida 6% mostrando a segregação de alelos para um padrão indel. Segunda e terceira canaletas são relativas ao genitor masculino G38 (E. grandis) e ao feminino U15 (E. urophylla), respectivamente, seguidos por 15 indivíduos F1 e um controle negativo. A e B são codificações para os alelos do parental 1 (P1

± G38) e C e B para os alelos do parental 2 (P2 ± U15). Abaixo de cada indivíduo encontra-se seu genótipo com base nesta codificação. Primeira canaleta corresponde ao marcador DNA ladder 1kb

plus (Invitrogen®) e última ao marcador DNA ladder 10 pb. ... 182!

Figura 09± Mapas genéticos dos genitores masculino (UGL) e feminino (DG) construídos com base

em uma família de 188 irmãos completos de um cruzamento (E. dunnii x E. grandis) x (E. urophylla x

E. globulus) pela estratégia de pseudo cruzamento-teste. As linhas ligam os microssatélites

completamente informativos mapeados em ambos os parentais. Os marcadores destacados em verde são microssatélites originados de seqüências de EST. Os marcadores destacados em vermelho são os genes e ESTs mapeados neste cruzamento. Os grupos de ligação estão numerados de acordo com o mapa de referência para o gênero Eucalyptus (Brondani et al., 2006). ... 186!

Figura 10± Ancoragem dos genes e ESTs no mapa genético E. urophylla x E. grandis (IP) (Mamani

et al. 2006). Marcadores microssatélites genômicos apresentados em preto e aqueles originados de biblioteca de EST em verde; genes candidatos e ESTs apresentados em vermelho. ... 187!

Figura 11± Localização dos marcadores (sublinhados) ligados a QTLs para DAP no mapa de cada

parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. ... 189!

Figura 12 ± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para DAP mapeado por

intervalo composto no grupo de ligação 6 do genoma do genitor UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados pela análise de marca simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,6. ... 190!

Figura 13 ± Localização dos marcadores (sublinhados) ligados a QTLs para altura das árvores no

mapa de cada parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1%, ***Significativo a 0,1% pelo teste F. ... 191!

Figura 14 ± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para altura das árvores

mapeado por intervalo composto no grupo de ligação 6 do genoma do UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados pela análise de marca simples. *Significativo a 5% e **Significativo a 1%. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,6. ... 192!

Figura 15 ± Localização dos marcadores (sublinhados) ligados a QTLs para volume no mapa de

(15)

Figura 16 ± Gráficos gerados pelo QTL Cartographer demonstrando o QTL para volume mapeado por Intervalo Simples (linha preta) e Intervalo Composto (linha azul) no grupo de ligação 6 do genoma do UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples. **Significativo a 1% e ***Significativo a 0,1%. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,7. ... 194!

Figura 17 ± Localização dos marcadores (sublinhados) ligados a QTLs para Pylodin no mapa de

cada parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. ... 196!

Figura 18± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para Pylodin mapeado por

intervalo composto no grupo de ligação 8 do genoma do DG. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples. *Significativo a 5% e ***Significativo a 0,1%. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,6. ... 197!

Figura 19 ± Localização dos marcadores (sublinhados) ligados a QTLs para densidade básica no

mapa de cada parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. ... 198!

Figura 20 ± Localização dos marcadores (sublinhados) ligados a QTLs para densidade básica no

mapa de cada parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. ... 200!

Figura 21 ± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para teor total de lignina

mapeado por intervalo composto no grupo de ligação 3 do genoma do UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples. ***Significativo a 0,1%. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,6. ... 201!

Figura 22 ± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para teor total de lignina

mapeado por intervalo composto no grupo de ligação 5 do genoma do UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples. ***Significativo a 0,1%. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,6. ... 202!

Figura 23 ± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para teor total de lignina

(16)

Figura 24± Localização dos marcadores (sublinhados) ligados a QTLs para relação siringil/guaiacil no mapa de cada parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. ... 204!

Figura 25± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para relação siringil/guaiacil

mapeado por intervalo composto no grupo de ligação 5 do genoma do DG. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples.***Significativo a 0,1% O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,3. ... 205!

Figura 26± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para relação siringil/guaiacil

mapeado por intervalo composto no grupo de ligação 6 do genoma do DG. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples.***Significativo a 0,1% O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,3. ... 206!

Figura 27± Localização dos marcadores (sublinhados) ligados a QTLs para rendimento depurado de

celulose no mapa de cada parental construído pelo programa Mapmaker. Os locos apresentados na figura foram significativos apenas na análise de Marca Simples. *Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1%. ... 207!

Figura 28± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para rendimento depurado

de celulose mapeado por intervalo composto no grupo de ligação 3 do genoma do UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples.*Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1% O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,5. ... 208!

Figura 29± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para rendimento depurado

de celulose mapeado por intervalo composto no grupo de ligação 6 do genoma do UGL. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. Marcadores assinalados apresentaram-se significativamente correlacionados com o mesmo QTL pela análise de marca simples.*Significativo a 5%, **Significativo a 1% e ***Significativo a 0,1% O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,5. ... 209!

Figura 30± Gráfico gerado pelo QTL Cartographer demonstrando o QTL para rendimento depurado

de celulose mapeado por intervalo composto no grupo de ligação 5 do genoma do DG. Eixo Y: valor de LOD; Eixo X: intervalo entre os marcadores do grupo de ligação. O valor de LOD definido pelo teste de permutação com 5% de significância foi de 2,5. ... 210!

Figura 31± Localização dos QTLs, para todos os caracteres fenotípicos analisados, nos diferentes

(17)

Figura 32± Localização dos QTLs, para todos os caracteres fenotípicos analisados, nos diferentes no grupo de ligação do parental feminino DG. São demonstrados apenas os grupos de ligação e as características para as quais foram identificados QTLs por mapeamento de intervalo. As barras demonstram as regiões onde o valor de LOD ultrapassou o limiar definido pelo teste de permutação

FRP QtYHO GH VLJQLILFkQFLD GH DR QtYHO GH WRGR R H[SHULPHQWR ³H[SHULPHQWZLVH´ $V VHWDV

localizam a região mais provável de cada QTL. ... 220!

Figura 01 ± Mapa do continente Australiano ilustrando a localização geográfica das procedências

onde foram coletadas as sementes utilizadas neste trabalho. ... 230!

Figura 02 ± Representação do genoma cloroplastidial de E. globulus evidenciando a posição dos

marcadores microssatélites utilizados neste trabalho. Figura modificada a partir de Steane (2005). 233!

Figura 03 ± Gel de agarose 1% corado com brometo de etídeo, exemplificando a quantificação do

DNA das amostras utilizadas. Primeira e segunda linha ± canaleta 1: O50Kg/Pl; canaleta 2: O100Kg/Pl; demais canaletas 2Pl das amostras de DNA total. ... 242!

Figura 04 ± Eletroferogramas ilustrando a amplificação dos locos de microssatélites cloroplastidiais

em amostras de diferentes espécies ... 243!

Figura 05± Análise de network a partir dos haplótipos obtidos pelos onze locos de microssatélites.

Cada círculo representa um haplótipo e a área do círculo representa a freqüência haplotípica. mv são vetores médios que representam haplótipos hipotéticos não amostrados neste estudo. Em laranja ± E. globulus, vermelho ± E. urophylla, azul ± E. grandis, verde ± E. camaldulensis, rosa ± E. saligna, amarelo ± E. dunnii. ... 259!

Figura 06 - Análise de network a partir dos haplótipos obtidos pelos SNPs e seqüências de bancos

de dados. Cada círculo representa um haplótipo e a área do círculo representa a freqüência haplotípica. mv são vetores médios que representam haplótipos hipotéticos não amostrados neste estudo. Em laranja ± E. globulus, vermelho ± E. urophylla, azul ± E. grandis, verde ± E. camaldulensis, rosa ± E. saligna, amarelo ± E. dunnii. Em vermelho sobre as linhas que interligam os haplótipos estão representados os pontos mutacionais encontrados em pares de base. Em azul claro as espécies cujas seqüências foram obtidas no GenBank; Co: amostras do gênero Corymbia. ... 266!

Figura 07± Gráficos representando a freqüência alélica encontrada para cada loco no conjunto de 51

clones avaliados. ... 268!

Figura 08± Dendrograma baseado na análise de cada amostra individual gerado a partir da matriz

de compartilhamento de alelos dos 11 locos de microssatélites entre os clones híbridos (amarelo) e os indivíduos das espécies E. grandis (azul), E. urophylla (vermelho), E. saligna (roxo) e E. camaldulensis (verde). ... 269!

Figura 09 - Dendrograma baseado na análise de cada amostra individual gerado a partir da matriz de

compartilhamento de alelos dos cinco locos de microssatélites com maiores valores de diversidade gênica entre os clones híbridos (CL) e os indivíduos das espécies E. grandis (GC, GP e GA), E. urophylla (UT, UF). Valores nos ramos correspondem a valores de bootstraping (1000 repetições).270!

Figura 10 - Análise de network a partir dos haplótipos obtidos pelos SNPs entre espécies

(18)

± E. saligna, preto ± Clones. Em vermelho, sobre as linhas que interligam os haplótipos estão representados os pontos mutacionais encontrados em pares de base... 272!

Figura 11± Cladograma obtido por neighbor joining a partir do modelo de máxima verossimilhança

(19)

LISTA DE TABELAS

CAPÍTULO 01

Tabela 01 ± Espécie, procedência, latitude aproximada, código utilizado, número de indivíduos e

empresa fornecedora das árvores utilizadas no estudo. ... 45!

Tabela 02 ± Hibridização, código utilizado, número de indivíduos e empresa fornecedora para as

amostras de clones híbridos utilizadas para o experimento. ... 46!

Tabela 03 ± Microssatélites utilizados na análise de diversidade e estruturação genética das

populações de Eucalyptus. ... 48!

Tabela 04± Locos de microssatélites selecionados após a triagem. ... 58!

Tabela 05 ± Sistemas de co-amplificação (multiplex) utilizados para a análise dos 35 locos

microssatélites visando a análise de diversidade e de estrutura genética. ... 59!

Tabela 06 ± Estatísticas descritivas para os 35 locos microssatélites analisados para todas as

procedências estudadas e para o conjunto de clones. Número de alelos (Na), Heterozigosidade Esperada (He), Heterozigosidade Observada (Ho), Conteúdo de informação polimórfica (PIC), Coeficiente de endocruzamento entre indivíduos em relação ao total (FIT), diferença em pares de base entre o menor e o maior alelo encontrado (Amplitude Alélica) e Riqueza alélica (AR). ... 60!

Tabela 07 ± Resumo dos parâmetros genéticos populacionais para as procedências avaliadas

baseado em 35 locos de microssatélites. N ± número de indivíduos; Ne ± média do número efetivo de alelos; Amplitude alélica ± média da diferença em pares de base entre o menor e o maior alelo encontrado em todos os locos; He ± heterozigosidade esperada; Ho ± heterozigosidade observada; EHW ± número de locos que apresentaram desvios no equilíbrio de Hardy-Weinberg; FIS ±

Coeficiente de endocruzamento intrapopulacional e o p-valor do teste de significância; PIC ± Conteúdo de informação polimórfica. ... 64!

Tabela 08± Resumo dos parâmetros genéticos populacionais para as espécies e conjunto de clones

avaliados baseado em 35 locos de microssatélites. N ± número de indivíduos; Ne ± média do número efetivo de alelos; Amplitude alélica ± diferença em pares de base entre o menor e o maior alelo encontrado; He ± heterozigosidade esperada; Ho ± heterozigosidade observada; EHW ± número de locos que apresentaram desvios no equilíbrio de Hardy-Weinberg; FIS ± Coeficiente de

endocruzamento intrapopulacional; PIC ± Conteúdo de informação polimórfica. ... 65!

Tabela 09 ± Análise de variância molecular (AMOVA) em diferentes níveis de estruturação entre e

dentro de procedências e espécies de Eucalyptus estudadas. ... 66!

Tabela 10 ± Análise de variância molecular (AMOVA) entre e dentro de procedências para cada

espécie estudada. ... 66!

Tabela 11 ± Estimativa par a par de diferenciação genética (valores de FST ± diagonal superior) e

distância genética (distância de Nei ± diagonal inferior) entre todas as procedências e conjunto de clones avaliados. Barras entre as procedências separam as espécies. nsValores de Fst não

(20)

Tabela 12± Estimativas par a par de diferenciação genética (valores de FST - acima da diagonal) e

distância genética (distância de Nei - abaixo da diagonal) para o conjunto de espécie e clones avaliados. Todas as estimativas de FSTIRUDPVLJQLILFDWLYDVS” ... 69!

Tabela 13 ± Probabilidades de alocação de indivíduos das espécies puras (E. grandis -EGR, E.

urophylla -EUR, E. saligna ±ESA e E. camaldulensis -ECA) bem como indivíduos híbridos F1

derivados de cruzamentos controlados de E. grandis e E. urophylla (EURGR) com base na análise de 35 locos microssatélites. ... 78!

Tabela 14 ± Probabilidades de alocação dos 54 clones analisados nas espécies E. grandis, E.

urophylla, E. saligna e E. camaldulensis com base na análise de 35 locos microssatélites. ... 79

CAPÍTULO 02

Tabela 01 ± Espécie, procedência, latitude aproximada, código utilizado, número de indivíduos e

empresa fornecedora para as amostras de espécie pura utilizadas para o experimento. ... 101!

Tabela 02 ± Iniciadores desenhados a partir da seqüência completa do gene CAD e 4Cl obtidas

através do seqüenciamento e anotação de BACs contendo os genes. Cada primer seguido pela seqüência 5´- 3´... 104!

Tabela 03 ± Temperatura de anelamento para as combinações de iniciadores utilizados para o

reseqüenciamento dos genes CAD e 4CL. ... 105!

Tabela 04 ± SNPs apresentados pelas espécies estudadas e o conjunto de clones fixados e

diferentes da referência utilizada para montagem e alinhamento do gene CAD. ... 112!

Tabela 05± SNPs identificados nas amostras das seis espécies puras de Eucalyptus seqüenciadas e

um conjunto de clones elite para as regiões do gene CAD. ... 113!

Tabela 06 ± SNPs apresentados pelas espécies estudadas e o conjunto de clones fixados e

diferentes da referência utilizada para montagem e alinhamento do gene 4CL. ... 115!

Tabela 07 ± Resumo dos SNPs encontrados nas amostras das seis espécies seqüenciadas e o

conjunto de clones para as regiões do gene 4CL. ... 116!

Tabela 08± (VWLPDWLYDGDGLYHUVLGDGHKDSORWtSLFDQDVUHJL}HVJrQLFDVVHTHQFLDGDVʌSDUDFDGD

população estudada. ... 117!

Tabela 09 ± Sumário dos SNPs utilizados efetivamente pelo programa para estimativas de

desequilíbrio de ligação nos dois genes seqüenciados nas amostras de espécies puras e clones híbridos. ... 118

Tabela 10. Discriminação dos Tag SNP identificados para cada espécie de Eucalyptus estudada. 125

CAPÍTULO 03

Tabela 01± Nome, seqüência, resultado do BLAST X e temperatura de anelamento dos iniciadores

(21)

Tabela 02 ± Nome, seqüência e temperatura de anelamento dos iniciadores disponíveis no laboratório de trabalho anteriores, para genes candidatos da rota de lignificação e formação de parede celular (veja texto). ... 163!

Tabela 03 ± Estatísticas descritivas das características fenotípicas avaliadas em 188

irmãos-completos. ... 171!

Tabela 04 ± Locos de EST informativos para o cruzamento DG x UGL, motivo de repetição e

similaridade encontrada pela ferramenta BLAST com o banco de dados GenBank. ... 178!

Tabela 05 ± Genes e ESTs mapeadas em dois cruzamentos (G38 x U15 ± DG x UGL) a partir da

segregação de haplótipos de SNPs genotipados por re-seqüenciamento da progênie segregante. . 180!

Tabela 06 ± Resumo dos genes e ESTs posicionados nos mapas de ligação de duas famílias do

gênero Eucalyptus. ... 188!

Tabela 07 ± Sumário dos QTLs detectados pelas metodologias de mapeamento de Intervalo pela

estratégia de pseudo-cruzamento teste. Estão descritos os genitores e os grupos de ligação onde os QTLs foram detectados, bem como os seus valores de LOD, porcentagem da variação explicada e os marcadores que os flanqueiam. ... 218

CAPÍTULO 04

Tabela 01 ± Espécie, seção taxonômica, procedência, latitude aproximada, código utilizado e número de indivíduos para as amostras de indivíduos das espécies estudadas do subgênero Symphyomyrtus. ... 231!

Tabela 02 ± Número e origem dos clones elite estudados. ... 231!

Tabela 03 ± Loco, seqüência, posição, motivo de repetição, tamanho esperado do fragmento original seqüenciado e marcação fluorescente utilizada para os iniciadores de microssatélites de cloroplasto genotipados. ... 234!

Tabela 04 ± Iniciadores, seqüência e temperatura de desnaturação utilizadas para obtenção das seqüências do genoma de cloroplasto. ... 234!

Tabela 05 ± Sistemas multiplex, locos e temperaturas de anelamento utilizados na PCR para os locos de microssatélites de cloroplasto. ... 235!

Tabela 06 ± Locos de microssatélites cloroplastidiais e suas características nas seis espécies estudadas. ... 245!

Tabela 07 ± Freqüências alélicas e diversidade gênica dos onze locos de microssatélites cloroplastidiais estudados em seis espécies de Eucalytpus. ... 246!

Tabela 08 ± Verificação da origem materna de haplótipos cloroplastidiais nos trios originados de polinização controlada. ... 249!

Tabela 09 ± Freqüências haplotípicas e haplótipos encontrados nas procedências analisadas de seis espécies de Eucalyptus. ... 251!

(22)

Tabela 11- Matriz de diferenciação genética par a par (FST) baseada em freqüências haplotípicas entre as 17 procedências de Eucalyptus estudadas... 256!

Tabela 12 ± Matriz de diferenciação genética (FST) estimada entre as espécies de Eucalyptus estudadas baseada na metodologia da contagem do número de alelos diferentes entre dois haplótipos. ... 257!

Tabela 13 ± Matriz de diferenciação genética (FST) estimada entre as espécies de Eucalyptus estudadas baseada na metodologia de freqüências haplotípicas. ... 257!

Tabela 14 ± Análise de variância molecular (AMOVA) para haplótipos de onze microssatélites cloroplastidiais entre as espécies de Eucalyptus estudadas e procedências dentro de espécies. .... 257!

Tabela 15 ± Análise de variância molecular (AMOVA) para haplótipos de onze microssatélites cloroplastidiais entre e dentro de procedências para cada espécie estudada. ... 258!

Tabela 16 ± Espécies, Gênero, Subgênero e Seção taxonômica das seqüências retiradas do banco de dados GenBank. ... 260!

Tabela 17 ± Haplótipos obtidos a partir do seqüenciamento de 517 pb do genoma cloroplastidial nas 93 amostras analisadas de seis espécies do gênero Eucalyptus. N= número de indivíduos encontrados para cada haplótipo; Freq.=freqüência observada de cada haplótipo. ... 261!

Tabela 18 ± Freqüência haplotípica e diversidade nucleotídica (S) por espécie de Eucalyptus utilizada. ... 262!

Tabela 19 ± Haplótipos encontrados através do alinhamento das amostras utilizadas e as seqüências de outras espécies disponíveis no GenBank. ... 264!

(23)

SUMÁRIO

INTRODUÇÃO GERAL ... 26

GENÉTICA E MELHORAMENTO DE EUCALYPTUS ... 26

MARCADORES MOLECULARES,MAPAS GENÉTICOS E QTLS ... 29 GENÉTICA DE ASSOCIAÇÃO... 32

OBJETIVOS ... 35 REFERÊNCIA BIBLIOGRÁFICAS ... 36

CAPÍTULO 1: VARIABILIDADE E ESTRUTURAÇÃO GENÉTICA EM

POPULAÇÕES NATURAIS E CLONES ELITE DE EUCALYPTUS ... 41

1.1RESUMO ... 41 1.2INTRODUÇÃO ... 43 1.3MATERIALEMÉTODOS ... 45

1.3.1 Material Genético ... 45 1.3.2 Extração e Quantificação de DNA ... 46 1.3.3 Escolha dos locos de Microssatélites ... 46 1.3.4 Amplificação por PCR ... 50 1.3.5 Eletroforese Capilar ... 50 1.3.6 Análises Estatísticas... 51

1.4RESULTADOS ... 54

1.4.1 Extração de DNA ... 54 1.4.2 Análises dos locos de microssatélites ... 55 1.4.3 ± Diversidade Genética entre espécies e/ou procedências de Eucalyptus spp. ... 62 1.4.4 ± Estrutura genética das populações de Eucalyptus spp. ... 72 1.4.5 ± Testes de Alocação de Clones híbridos plantados no Brasil. ... 76

1.5DISCUSSÃO ... 80

1.5.1 Análises dos locos de microssatélites ... 80 1.5.2 ± Diversidade Genética entre espécies e/ou procedências de Eucalyptus spp. ... 84 1.5.3 ± Estrutura genética das populações de Eucalyptus spp. ... 87 1.5.4 ± Testes de Alocação de Clones híbridos plantados no Brasil. ... 88

1.6REFERENCIASBIBLIOGRÁFICAS... 92

CAPÍTULO 2: ESTIMATIVAS DE DESEQUILÍBRIO DE LIGAÇÃO EM REGIÕES GÊNICAS DE EUCALYPTUS SPP. ... 96

2.1RESUMO ... 96 2.2INTRODUÇÃO ... 98 2.3MATERIALEMÉTODOS ... 100

2.3.1 Material Vegetal e Extração de DNA ... 100 2.3.2 Regiões Genômicas e Iniciadores escolhidos ... 102 2.3.3 Amplificação dos fragmentos gênicos via PCR ... 105 2.3.4 Purificação e reação de seqüenciamento dos fragmentos gênicos ... 106 2.3.5 Alinhamento das seqüências e análises estatísticas ... 108

2.4RESULTADOS ... 110

(24)

2.4.3 Estimativas de Tag SNPs a partir dos Polimorfismos encontrados ... 123 2.4.4 Estimativas de Desequilíbrio de Ligação ... 126

2.5DISCUSSÃO ... 144 2.6REFERÊNCIASBIBLIOGRÁFICAS... 148

CAPÍTULO III: MAPEAMENTO DE QTLS PARA QUALIDADE DA MADEIRA EM UMA POPULAÇÃO SEGREGANTE ENVOLVENDO QUATRO ESPÉCIES DE EUCALYPTUS ... 150

3.1RESUMO ... 150 3.2INTRODUÇÃO ... 152 3.3MATERIALEMÉTODOS ... 154

3.3.1 Material Vegetal e extração de DNA ... 154 3.3.2 Avaliação das características quantitativas ... 155 3.3.3 Triagem e seleção de locos microssatélites ... 157 3.3.4 Triagem e seleção de genes candidatos ... 157 3.3.5 Amplificação dos locos microssatélites e segmentos gênicos via PCR.... 165 3.3.6 Geração dos dados genotípicos dos locos microssatélites ... 166 3.3.7 Geração dos dados genotípicos dos genes e ESTs ... 166 3.3.8 Construção do mapa genético ... 168 3.3.9 Detecção dos QTLs por Marca Simples, Intervalo Simples e Intervalo Composto ... 169

3.4RESULTADOS ... 170

3.4.1 Avaliação das Características Fenotípicas ... 170 3.4.2 Triagem e seleção de microssatélites ... 171 3.4.3 Triagem e seleção de genes candidatos ... 173 3.4.4 Geração dos dados genotípicos dos microssatélites, genes e ESTs ... 176 3.4.5 Construção dos mapas genéticos pela estratégia de pseudo-cruzamento teste ... 182 3.4.6 Análises de QTL ... 188 3.4.7 QTLs para diâmetro das árvores à altura do peito (DAP) ... 189 3.4.8 QTLs para altura das árvores ... 190 3.4.9 QTL para volume ... 192 3.4.10 QTL para densidade da madeira pela profundidade de penetração do Pylodin... 195 3.4.11 QTLs para Densidade Básica da Madeira predita via NIRs ... 197 3.4.12 QTLs para teor de lignina total da madeira ... 199 3.4.13 QTLs para relação Siringil/Guaiacil da madeira ... 203 3.4.14 QTLs para rendimento depurado de celulose ... 206

3.5DISCUSSÃO ... 211

3.5.1 Triagem e seleção de marcadores microssatélites, genes e ESTs ... 211 3.5.2 Mapeamento de QTLs para características de desempenho e qualidade da madeira ... 215 3.5.3 Análise da co-localização de QTLs ... 217

3.6REFERÊNCIASBIBLIOGRÁFICAS... 223

CAPÍTULO 4 VARIABILIDADE HAPLOTÍPICA NO GENOMA DO CLOROPLASTO E SUA UTILIZAÇÃO PARA A CARACTERIZAÇÃO DE POPULAÇÕES E CLONES DE EUCALYPTUS ... 226

(25)

4.3.1 Material Genético ... 230 4.3.2 Extração e Quantificação de DNA ... 232 4.3.3 Iniciadores utilizados na PCR ... 233 4.3.4 Amplificação via PCR e visualização dos polimorfismos ... 235 4.3.5 Genotipagem e análise das seqüências ... 237 4.3.6 Análises Estatísticas... 239

4.4RESULTADOS ... 242

4.4.1 Extração e quantificação de DNA ... 242 4.4.2 Transferibilidade e polimorfismo dos locos de microssatélites ... 242 4.4.3 Verificação da origem materna ... 248 4.4.4 Diversidade haplotípica e estrutura genética inter e intra-específica

baseada em locos de microssatélites ... 249 4.4.5 Diversidade haplotípica e estrutura inter e intra-específica baseada em SNPs ... 259 4.4.6 Estimativa da origem materna dos clones híbridos por haplótipos de cpDNA ... 266

4.5DISCUSSÃO ... 274

4.5.1 Transferibilidade e polimorfismo dos locos de microssatélites ... 274 4.5.2 Verificação da Origem Materna ... 275 4.5.3 Diversidade haplotípica e estrutura inter e intra-específica baseada em locos de microssatélites ... 276 4.5.4 Diversidade haplotípica e estrutura inter e intra-específica baseada em SNPs ... 278 4.5.5 Inferência da origem materna dos clones híbridos elite com base nos haplótipos de cpDNA ... 280

4.6REFERÊNCIASBIBLIOGRÁFICAS... 282

ANEXO 1 ± CAPÍTULO I ... 284

(26)

INTRODUÇÃO GERAL

!

GENÉTICA E MELHORAMENTO DE EUCALYPTUS

As espécies de Eucalyptus são nativas da Austrália e ilhas ao norte da Oceania (Potts & Pederick, 2000) e estão entre as espécies mais plantadas no

mundo (Doughty, 2000). A linhagem do gênero Eucalyptus é antiga, provavelmente

da era Mezozóica no período Cretáceo a cerca de 70 milhões de anos (Crisp, 2004).

Taxonomicamente, o gênero Eucalyptus é de difícil classificação, apresentando

ambigüidades semelhantes aquelas encontradas para o gênero Pinus (Liston et al.,

1999; Qiao et al., 2007; Syring et al., 2005). Esta dificuldade reside, provavelmente,

no fato de que variações clinais, convergências morfológicas e hibridizações entre

subgêneros sejam comuns. Atualmente, são reconhecidas aproximadamente 700

espécies tendo suas origens em 13 principais linhagens evolutivas (Brooker, 2000).

O gênero abrange desde pequenos arbustos até as árvores mais altas do mundo. As

espécies do subgênero Symphyomyrtus são as mais utilizadas comercialmente.

O gênero é predominantemente polinizado por animais tais como: insetos,

pássaros, marsupiais e algumas espécies de morcegos (Barbour et al., 2005). O tipo

de reprodução é preferencialmente alógamo, sendo descritos até o momento poucos

casos de autofecundação expontânea (Eldridge et al., 1993a). Também não é

comum o intercruzamento entre subgêneros distintitos, porém dentro de cada

subgênero o cruzamento interespecífico é comum (Potts & Dungey, 2004).

Cruzamentos híbridos artificiais têm sido produzidos e em geral a inviabilidade do

híbrido aumenta com o distanciamento taxonômico entre os pais (Potts & Dungey,

2004).

A partir do século 18, diversas espécies do gênero Eucalyptus foram

introduzidas em países como Índia, França, Chile, Brasil, África do Sul e Portugal

onde apresentaram excelente adaptação climática, sucesso reprodutivo e índices

produtivos elevados (Potts et al., 2004). A partir da década de 1960, com o

desenvolvimento de métodos industriais de processamento das fibras curtas do

eucalipto, as plantações de espécies do gênero começaram a apresentar

importância comercial crescente e os programas de melhoramento tiveram início no

(27)

posteriormente, testes procedência/progênie foram realizados para a espécie E.

camaldulensis em vários países (Eldridge et al., 1993b). Em 1970 iniciaram-se as

plantações clonais no Congo e no Brasil com destaque para a espécie E. urophylla

principalmente em função da maior facilidade de propagação vegetativa desta

espécie. A partir de 1980, populações base de melhoramento foram formadas,

envolvendo principalmente as espécies E. grandis, E. tereticornis e E. viminalis (Eldridge et al., 1993b).

Segundo Ferreira (1992), depois da Austrália e Indonésia, o Brasil é o país

com maior acervo genético de Eucalyptus spp. Em 1904, Edmundo Navarro Andrade

introduziu oficialmente o gênero no Brasil com a criação do Horto de Rio Claro, onde

diversas espécies nativas da Austrália foram plantadas. As sementes originadas

dessas árvores do Horto de Rio Claro constituíram a base inicial para o início dos

programas de plantio e melhoramento genético de eucalipto no país. As árvores que

apresentaram melhor crescimento, adaptabilidade e tolerância a doenças em

plantios comerciais eram, em sua grande maioria, híbridos espontâneos oriundos de

eventos de cruzamentos interespecíficos não controlados que ocorreram no Horto

de Rio Claro. Estas árvores elite foram as primeiras a serem utilizadas

exaustivamente no processo de clonagem para formação de populações comerciais.

Entre 1970 e 1984, aproximadamente 2.200 lotes de sementes de 55

espécies foram incluídos na pesquisa florestal brasileira. A importação destas

sementes e a execução dos testes de espécie/procedência/progênies dos materiais

genéticos mais adaptados permitiram estabelecer as diretrizes para a instalação de

populações-base com o objetivo principal de recombinação de genótipos superiores

e a produção de sementes (Oda et al., 2007).

Atualmente, os principais produtos obtidos a partir da madeira de Eucalyptus

no Brasil são a celulose, papel e carvão vegetal para a indústria siderúrgica. O país

possui cerca de 3,4 milhões de hectares cobertos por Eucalyptus e em 2007,

segundo dados da Bracelpa (Associação Brasileira de Celulose e Papel), produziu

11,9 milhões de toneladas de celulose e 8,96 milhões de toneladas de papel. Para o

ano de 2008 as projeções são de crescimento de 7,4% na produção de celulose e

3,2% na produção de papel.

O termo clone é comumente utilizado para identificar uma árvore superior

propagada vegetativamente, tanto para fins de plantio operacional quanto para atuar

(28)

clonagem é integralmente transmitido à descendência, permitindo assim capturar

toda a superioridade daquela árvore. Esta metodologia representou um grande salto

nos programas de melhoramento especialmente para as características silviculturais

e de qualidade da madeira.

Na produção de celulose e papel, florestas clonais de híbridos de E. grandis e

E. urophylla selecionados durante a década de 1980 permitiram avanços importantes em características de produção e resistência a doenças. Porém,

atualmente, a espécie E. globulus vem sendo intensamente utilizada na produção de

híbridos de segunda geração visto que esta espécie apresenta excelentes

propriedades físicas e químicas da madeira. O emprego de E. globulus e seus

híbridos no Brasil ainda é restrito em razão desta espécie ser adaptada

fisiologicamente a ambientes temperados demandando assim a produção de

cruzamentos absorventes e seleção direcional visando combinar adaptabilidade,

crescimento e qualidade da madeira. O sucesso do seu crescimento como espécie

pura na América do Sul, só é observado em parte da região Sul do país e em países

como o Chile, Uruguai e Argentina.

Discussões, como a exposta anteriormente, foram potencializadas,

principalmente, em razão do desenvolvimento e adaptação de novas estratégias e

metodologias paralelas ao melhoramento tradicional. Desta forma, com o advento

das técnicas de biotecnologia e genômica, procura-se hoje a união do melhoramento

clássico ao melhoramento molecular para acelerar o processo de obtenção de

materiais com características específicas, auxiliando a busca de plantas com alto

desempenho no campo.

Com objetivos GH VH HYLWDU R ³DSDJmR IORUHVWDO´ TXH SRGH YLU D SHUWXUEDU D

economia nacional futuramente, o melhoramento genético e, nele, a utilização de

tecnologias genômicas para a seleção acelerada de genótipos superiores representa

uma ferramenta de grande potencial de utilização. A associação encontrada entre

um marcador de DNA e uma característica quantitativa, permite potencialmente a

redução do tempo para seleção de materiais geneticamente superiores, visto que,

teoricamente, possibilita a seleção em idade precoce antes mesmo de esperar o

crescimento da árvore e a manifestação do fenótipo.

Em termos de genômica, o eucalipto é uma planta diplóide com um número

haplóide de 11 cromossomos (Eldridge et al., 1993b). A poliploidia não acontece de

(29)

(Grattapaglia & Bradshaw, 1994) a 644 Mpb (E. globulus) (Pinto, 2005), próximo em

tamanho ao genoma das espécies do gênero Populus (473 Mpb) (Poke et al., 2005)

e significativamente menor do que Pinus com cerca de 23 Gpb (Ahuja, 2001).

MARCADORES MOLECULARES, MAPAS GENÉTICOS E QTLS

Os marcadores moleculares têm auxiliado o melhoramento de espécies

florestais principalmente permitindo a identificação e descriminação de clones elite,

em processos de proteção varietal, caracterização de coleções de germoplasma e

populações de melhoramento, predição de desempenho com base na distância

genética entre os genitores e gerenciamento de variabilidade genética. Os

marcadores utilizados podem se localizar no genoma nuclear ou em organelas

citoplasmáticas como mitocôndrias e cloroplastos.

Várias classes de marcadores moleculares podem ser aplicadas para auxiliar

o melhoramento florestal. Porém, marcadores com alta repetibilidade e

codominantes, como os microssatélites e os polimorfismos de base única (Single

Nucleotide Polymorphisms ± SNPs), tendem a ser mais utilizados em razão de

menor dificuldade de intercâmbio de dados entre diversos núcleos de melhoramento.

Adicionalmente, com o desenvolvimento das teorias de genética quantitativa,

reconheceu-se que caracteres complexos ou quantitativos são controlados pelos

mesmos fatores hereditários descritos por Mendel, com diferença que vários fatores,

cada um contribuindo com uma pequena parcela, estão envolvidos na expressão do

caráter.

Na década de 1980, com o surgimento de diversas classes de marcadores,

baseados tanto em hibridação com sondas marcadas como em Reações da

Polimerase em Cadeia (PCR), tornou-se possível a busca de regiões do genoma

responsáveis por parte da variabilidade fenotípica em qualquer espécie de interesse

(Tanksley, 1993). Entre as várias ferramentas de genética molecular disponíveis

para auxílio ao melhoramento, os mapas genéticos baseados na freqüência de

recombinação entre marcadores polimórficos em uma progênie, tornaram-se

ferramentas fundamentais para acelerar o processo de seleção de marcadores

associados a caracteres quantitativos.

Os mapas genéticos permitem a localização de genes e regiões genômicas

(30)

relação estatística entre regiões genômicas e dados fenotípicos de indivíduos de um

dado cruzamento. O mapeamento genético em espécies florestais possui

peculiaridades quando comparado às culturas agrícolas anuais. As espécies

florestais possuem longo ciclo de vida e alta depressão por endogamia o que

dificulta a obtenção de linhagens homozigóticas, e, portanto o emprego de

delineamentos clássicos de mapeamento, tais como populações F2,

retrocruzamentos e linhagens recombinantes endogâmicas (RILs). Dado isso, os

mapas genéticos têm sido construídos utilizando-se famílias F1 já existentes

derivadas do simples cruzamento de duas árvores. A segregação neste caso será

resultado da recombinação meiótica entre os dois parentais e a fase de ligação é

desconhecida (Butcher et al., 2002).

Em gimnospermas, a presença do tecido haplóide nas sementes

(megagametófito) permite a análise direta da co-segregação de pares de

marcadores, a estimativa da freqüência de recombinação além da determinação da

fase de ligação, o que não é possível para as angiospermas (Grattapaglia, 2007b). A

abordagem via megagametófitos foi utilizada na detecção de ligação gênica entre

locos isoenzimáticos em Pinus taeda (Adams & Joly, 1980). Posteriormente, foram

utilizados marcadores dominantes, tais como: RAPD e AFLP, em diversas espécies

de coníferas: Pinus ellioti (Nelson et al., 1993), Picea abies (Norway spruce) (Paglia

et al., 1998), Pinus radiata (Kuang et al., 1999), Pinus taeda (Remington et al., 1999)

e Pinus pinaster (Costa et al., 2000).

Em angiospermas, o mapeamento começou a partir da década de 1990,

quando Grattapaglia & Sederoff (1994) desenvolveram uma estratégia de

mapeamento denominada de pseudocruzamento-teste (pseudo-testcross). A partir

daí os mapas genéticos de diversas espécies alógamas foram construídos: Pinus

(Carlson et al., 1991), cana-de-açúcar (Sobral & Honeycutt, 1993) e Populus

(Cervera et al., 2001). Para o gênero Eucalyptus também não foi diferente, utilizando

também marcadores dominantes foram construídos alguns mapas genéticos: com

marcadores RAPD, E. grandis x E. urophylla (Grattapaglia & Sederoff, 1994), E.

urophylla x E. grandis (Verhaegen & Plomion, 1996), E. grandis x E. globulus

(Myburg et al., 2003), com marcadores AFLP, E. tereticornis x E. globulus (Marques

et al., 1998) e, com uma combinação de marcadores AFLP, RFLP e isoenzimas para

(31)

Os mapas genéticos em árvores, posteriormente evoluíram dos marcadores

com menor repetibilidade (marcadores dominantes) para marcadores com maior

repetibilidade e herança codominante (microssatélites) (Brondani et al., 1997). A

conservação dos locos microssatélites entre as espécies do mesmo gênero, como

observado em Eucalytpus e Populus e em menor escala em Pinus, torna possível,

SRUWDQWRDJHUDomRGHPDSDV³FRQVHQVR´SHUPLWLQGRDFRPSDUDomRHLQWHJUDomRGH

informação de mapeamento genético de marcadores, genes e QTLs (Grattapaglia,

2007b). Vários trabalhos foram publicados com microssatélites nas mais diversas

espécies de árvores: Pinus taeda, (Brown et al., 2001; Sewell et al., 1999; Zhou et

al., 2003), Populus (Yin et al., 2004), Picea abies (Achere et al., 2004), Cryptomeria

japonica (Tani et al., 2003).

No gênero Eucalyptus, os mapas utilizando marcadores microssatélites ainda

são poucos e podemos citar como o primeiro mapa consenso construído baseado

somente neste tipo de marcador, o mapa desenvolvido por Brondani et al. (2006). O

mapa contém 240 microssatélites e cobertura genômica estimada de 90%. A

transferibilidade dos microssatélites em diferentes espécies de Eucalyptus facilita a

sua adoção em processos de seleção assistida, uma vez que a hibridação é o

método utilizado no melhoramento desse gênero (Grattapaglia, 2007c).

Posteriormente aos mapas genéticos, foram mapeados QTLs para

características de interesse econômico em várias espécies florestais (Devey et al.,

1995; Emebiri et al., 1998; Plomion et al., 1996; Weng et al., 2002). Não

diferentemente das demais espécies florestais, mapas de QTLs foram construídos

para o gênero Eucalyptus. Os mapas de QTLs foram construídos baseados em

mapas genéticos com os mais diversos tipos de marcadores (dominantes e

codominantes). As características avaliadas nestes mapas são características de

interesse econômico para a indústria. QTLs para características juvenis tais como,

peso da semente, área foliar e tolerância das sementes ao frio já foram mapeados

(Byrne et al., 1997a; Byrne et al., 1997b; Vaillancourt et al., 1995). QTLs para

características de vegetação propagativa (Grattapaglia et al., 1995; Marques et al.,

1999) também já foram identificados. Diversos mapas de QTLs também já foram

construídos até o momento na área de características relacionadas com qualidade

da madeira e desempenho (Grattapaglia et al., 1996; Kirst et al., 2004; Missiaggia,

Imagem

Tabela 01 ± Espécie, procedência, latitude aproximada, código utilizado, número de indivíduos  e empresa fornecedora das árvores utilizadas no estudo
Tabela 02  ±  Hibridização, código utilizado, número de indivíduos e empresa fornecedora para  as amostras de clones híbridos utilizadas para o experimento
Tabela  03  ±   Microssatélites  utilizados  na  análise  de  diversidade  e  estruturação  genética  das  populações de Eucalyptus
Figura 01  ±  Posição de mapa dos microssatélites utilizados na análise de diversidade e estruturação genética das populações de  Eucalyptus
+7

Referências

Documentos relacionados

Objetivos - Avaliar a prevalência de anemia e seus determinantes entre crianças de 2 a 5 anos de idade, atendidas pelo programa Estratégia Saúde da Família ESF; analisar a

Entretanto, algumas melhorias em rela¸c˜ao `as estrat´egias de compensa¸c˜ao de movimento do H.261 (como o uso de meio pixel de resolu¸c˜ao para a compensa¸c˜ao de movimento,

O primeiro passo para introduzir o MTT como procedimento para mudança do comportamento alimentar consiste no profissional psicoeducar o paciente a todo o processo,

Em que pese ausência de perícia médica judicial, cabe frisar que o julgador não está adstrito apenas à prova técnica para formar a sua convicção, podendo

National Center for Biotechnology Information - NCBI Consultado em 11/04/2005 2.054 TOTAL 252 Vírus 902 Eucariotos 839 Eubactérias 61 Arqueobactérias Genomas completos Classe

O Conselho Federal de Psicologia (CFP) apresenta à categoria e à sociedade em geral o documento de Referências Técnicas para a Prática de Psicólogas(os) em Programas de atenção

Afinal de contas, tanto uma quanto a outra são ferramentas essenciais para a compreensão da realidade, além de ser o principal motivo da re- pulsa pela matemática, uma vez que é

hospitalizados, ou de lactantes que queiram solicitar tratamento especial deverão enviar a solicitação pelo Fale Conosco, no site da FACINE , até 72 horas antes da realização