• Nenhum resultado encontrado

Mapeamento de QTLs para caracteres de importancia agronomica em duas populações F2 de milho tropical

N/A
N/A
Protected

Academic year: 2021

Share "Mapeamento de QTLs para caracteres de importancia agronomica em duas populações F2 de milho tropical"

Copied!
121
0
0

Texto

(1)

i

8QLYHUVLGDGH(VWDGXDOGH&DPSLQDV

,QVWLWXWRGH%LRORJLD

'HSDUWDPHQWRGH*HQpWLFDH(YROXomR

$OH[DQGUH)UDQFR*DUFLD

0DSHDPHQWRGH47/VSDUD&DUDFWHUHVGH,PSRUWkQFLD$JURQ{PLFD

HP'XDV3RSXODo}HV)



GH0LOKR7URSLFDO

7HVH DSUHVHQWDGD DR ,QVWLWXWR GH %LRORJLD

SDUD REWHQomR GR 7tWXOR GH 0HVWUH HP

*HQpWLFD H %LRORJLD 0ROHFXODU QD iUHD GH

*HQpWLFD9HJHWDOH0HOKRUDPHQWR

2ULHQWDGRU&OiXGLR/RSHVGH6RX]D-U

&RRULHQWDGRUD$QHWH3HUHLUDGH6RX]D

&DPSLQDV63



(2)
(3)

iii

Data da defesa: 17/10/2003

Banca Examinadora:

Prof. Dr. Cláudio Lopes de Souza Jr. (orientador) ______________________________________

Prof. Dr. Louis Bernard Klascko ______________________________________

Prof. Dr. Carlos Augusto Colombo ______________________________________

(4)

iv

$SDODYUDPiJLFD

Certa palavra dorme na sombra

de um livro raro.

Como desencantá-la?

É a senha da vida

a senha do mundo.

Vou procurá-la.

Vou procurá-la a vida inteira

no mundo todo.

Se tarda o encontro, se não a encontro,

não desanimo,

procuro sempre.

Procuro sempre, e minha procura

ficará sendo

minha palavra.



Carlos Drummond de Andrade

“Cuspa o chiclete.”

Ascensão e Queda da Cidade de Mahagonny (1930)

(5)

v

A minha mãe, pela luta dedicada de uma vida inteira e por toda fé.

Aos meus irmãos Zaíra, Tu e Ana pela melhor infância que eu poderia desejar.

Ao meu pai, por ter tentado tanto.

A toda minha família, enfim, por tudo que puderam me ensinar.

A minha noiva, Carolina, pela presença incondicional, apoio e compreensão irrestritos. Pela doçura comovente e por dar sentido a tudo. Amo você.

(6)

vi Meus sinceros agradecimentos...

Ao Prof. Dr. Cláudio Lopes de Souza Jr. pelas sugestões, críticas, preocupação e ensinamentos, além da orientação nesta e em outras etapas importantes da minha vida.

À Profa. Dra. Anete Pereira de Souza pela co-orientação sensata, pela disponibilidade e otimismo constante e por ter acreditado sempre.

Ao Prof. Dr. Antônio Augusto Franco Garcia, por toda a disposição, companheirismo e ajuda indispensáveis durante as análises dos dados.

Aos Profs. Dr. Carlos Augusto Colombo, Dr. Luis Eduardo Aranha Camargo e Dr. Isaías Olívio Geraldi, pela disponibilidade em participar da pré-banca, pelas discussões, correções e sugestões para a melhoria do trabalho.

Aos Profs. Dr. Carlos Augusto Colombo, Dr. Louis Bernard Klazcko pela disponibilidade em participar da banca, pelas discussões e contribuições significativas para a melhoria do trabalho. Aos membros suplentes da pré-banca e banca: Dr. Sizuo Matsuoka (pré-banca) e Dra. Maria Elisa Ayres Guidetti Zagatto Paterniani (banca).

À Profa. Dra. Yoko Bomura Rosato pelo empréstimo dos termocicladores, durante o período crítico do trabalho.

Ao Centro Nacional de Processamento de Alto Desempenho CENAPAD/Unicamp pelo auxílio no cálculo dos limites de significância.

Aos queridos companheiros do “esquema power” por terem me ensinado tanto: Claudete pela garra, disposição e persistência na obtenção dos resultados; Sibov, pela capacidade de organização, idéias fundamentais e discussão dos processos; Adelmo, pela insistência e todas as tentativas de tornar o trabalho melhor.

À Heloísa, Ana Carolina, Andreza, Zildene, Aline, Juverlande e Zilda pela inestimável amizade e disposição no duro trabalho da bancada (à Zildinha também pelos pães deliciosos)

(7)

vii

Ao Jucelino, Ariberto, Miguel e Márcio pela ajuda indispensável nos experimentos de campo.

Aos amigos do laboratório (Andréia, Susely, Prianda, Karine, Milena, Samantha, Débora, Fabíola, Lu, Marlene, Paulo Beiço e tantos outros que passaram por ali) pela convivência mais que agradável.

À Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) pelo apoio financeiro (Fapesp, 99/04455-3) para a realização deste trabalho

(8)

viii

Ë1',&(



/LVWDGH7DEHODV [

/LVWDGH)LJXUDV  [L

5HVXPR 

6XPPDU\  



,QWURGXomR  

2EMHWLYRV 

5HYLVmR%LEOLRJUiILFD 

$VSHFWRV(FRQ{PLFRVH*HQpWLFRVGR0LOKR

 

 0DUFDGRUHV0ROHFXODUHV

 

 0DUFDGRUHV0RUIROyJLFRV

 





 0DUFDGRUHV,VRHQ]LPiWLFRV







 0DUFDGRUHV0ROHFXODUHV&RGRPLQDQWHV







 5)/3 ³5HVWULFWLRQ)UDJPHQW/HQJWK3RO\PRUSKLVP´

 





 0LFURVVDWpOLWHVRX665 ³6LPSOH6HTXHQFH5HSHDWV´

 





 0DUFDGRUHV0ROHFXODUHV'RPLQDQWHV

 





 5$3' ³5DQGRP$PSOLILHG3RO\PRUSKLF'1$´







 $)/3 ³$PSOLILHG)UDJPHQW/HQJWK3RO\PRUSKLVP´

 





 0DSDV*HQpWLFRV

 





 3ULQFtSLRV*HQpWLFRV

 





 0DSDVGH/LJDomR

 





7HVWHGH6HJUHJDomR







 7HVWHGH/LJDomR

 





 2UGHQDomRGDV0DUFDV

 





)XQo}HVGH0DSHDPHQWR







 0DSHDPHQWRGH47/V

 





 'HVHTXLOtEULRGH/LJDomR







 0pWRGRVGH0DSHDPHQWR







 $QiOLVHGH0DUFDV6LPSOHV

 





 0DSHDPHQWRSRU,QWHUYDOR

 







(9)

ix 0DSHDPHQWRSRU,QWHUYD OR&RPSRVWR







 /LPLWHVGH6LJQLILFkQFLD

 





 47/VHP0LOKR

 







$UWLJR 

5HVXPR

  

 ,QWURGXomR

  

 0DWHULDOH0pWRGRV

 

 5HVXOWDGRVH'LVFXVVmR

 

 5HIHUrQFLDV%LEOLRJUiILFDV

  



&RQFOXV}HV  

3HUVSHFWLYDV  

5HIHUrQFLDV%LEOLRJUiILFDV 

(10)

x

/LVWDGH7DEHODV

5HYLVmR%LEOLRJUiILFD

Tabela 1: Freqüências esperadas dos gametas parentais e recombinantes, considerando ou não ligação entre os locos.



19 Tabela 2: Relação entre distância física e distância de mapa.



22

$UWLJR

Tabela 1: Média e intervalo de confiança (95%) dos caracteres produção de grãos (g.planta-1), comprimento da espiga (cm), diâmetro da espiga (cm), número de fileiras da espiga, número de grãos por fileira, altura da planta (m), altura da espiga (m), número de folhas da primeira espiga e número de ramificações do pendão, das progênies F2 das populações OL (20-01 x 02-03) e PR (08-05F x 14-4B).



91 Tabela 2: Correlações fenotípicas entre os caracteres das populações OL (acima da diagonal) e PR (abaixo da diagonal).



92 Tabela 3: Localização, estimativas dos efeitos genéticos e dos coeficientes de determinação dos QTL's associados aos caracteres produção de grãos, comprimento da espiga, diâmetro da espiga e número de fileiras da espiga da população OL, obtidos através de mapeamento por intervalo composto.



93 Tabela 4: Localização, estimativas dos efeitos genéticos e dos coeficientes de determinação dos QTL's associados aos caracteres altura da planta, altura da espiga, número de folhas da espiga superior e número de ramificações do pendão da população OL, obtidos através de mapeamento por intervalo composto.



94 Tabela 5: Localização, estimativas dos efeitos genéticos e dos coeficientes de determinação dos QTL's associados aos caracteres produção de grãos, comprimento da espiga, diâmetro da espiga, número de fileiras da espiga e número de grãos por fileira da população PR, obtidos através de mapeamento por intervalo composto.



95 Tabela 6: Localização, estimativas dos efeitos genéticos e dos coeficientes de determinação dos QTL's associados aos caracteres altura da planta, altura da espiga, número de folhas da espiga superior e número de ramificações do pendão da população PR, obtidos através de mapeamento por intervalo composto.



96

(11)

xi

/LVWDGH)LJX UDV

5HYLVmR%LEOLRJUiILFD

Figura 1: Comparação entre as funções de mapeamento de Haldane e Kosambi.



22 Figura 2: Representação do mapeamento de um QTL (

Q

j) condicionado à presença de dois

locos flanqueadores (

M

i e

M

i+1). As distâncias são representadas pelas freqüências de

recombinação, sendo

θ

1 a distância entre o loco marcador

M

i e

Q

j;

θ

2 a distância entre

M

i+1

e

Q

j e

θ

12 a distância entre

M

i e

M

i+1.



32

Figura 3: Mapeamento de QTL’s, ilustrando o método de mapeamento por intervalo. No eixo da distância, estão indicadas as estimativas das posições das marcas (×) e dos QTL's (•).



33 Figura 4: Representação do método de mapeamento por intervalo composto, que permite investigar o QTL (

Q

j) localizado entre as marcas flanqueadoras (

M

i e

M

i+1), considerando

também as marcas

M

i−1 e

M

i+2 como cofatores.



35

$UWLJR

Figura 1: Mapeamento de QTL's associados à produção de grãos, obtidos por mapeamento por intervalo composto. As duas primeiras figuras representam o cromossomo 2 das populações PR e OL, respectivamente. As demais figuras representam os cromossomos 5, 7 e 8 da população OL. O limite de significância da população PR foi 16,19 e da população OL foi 15,80.



88 Figura 2: Mapa genético da população OL, construído com 75 marcadores do tipo microssatélite. Os locos dos marcadores, bem como as distâncias entre eles, em cM, estão indicados à direita dos cromossomos, enquanto a representação dos QTL's mapeados estão indicados à esquerda dos mesmos. O comprimento do mapa é de 1.437 cM e o intervalo médio entre marcas é de 19,16 cM.



89 Figura 3: Mapa genético da população PR, construído com 117 marcadores do tipo microssatélite. Os locos dos marcadores, bem como as distâncias entre eles, em cM, estão indicados à direita dos cromossomos, enquanto a representação dos QTL's mapeados estão indicados à esquerda dos mesmos. O comprimento do mapa é de 1.658 cM e o intervalo médio entre marcas é de 14,17 cM.



90

(12)

5HVXPR

A produção de grãos e outros caracteres de importância econômica para a cultura do milho, tais como a altura da planta, o comprimento e o diâmetro da espiga, apresentam herança poligênica, o que dificulta a obtenção de informações sobre as bases genéticas envolvidas na variação desses caracteres. Este trabalho foi realizado para mapear QTL's associados à produção de grãos, a componentes da produção e a caracteres morfológicos. Para isso, foram utilizadas duas populações F2, (OL e PR), originadas a partir do cruzamento de linhagens tropicais obtidas das populações IG-1, IG-2 e BR-106. Para a população OL, composta de 404 plantas, foram empregados 75 marcadores do tipo microssatélite na construção de um mapa de ligação com 1.437 cM de extensão e 19,16 cM de intervalo médio entre marcas. Para a população PR, composta de 446 plantas, o mapa de ligação de 1.658 cM de extensão e de 14,17 cM de intervalo médio entre marcas foi obtido pelo emprego de 117 marcadores do tipo microssatélite. Em ambas populações, foram mensurados os caracteres produção de grãos, altura da planta, altura da espiga, número de folhas acima da espiga superior, número de ramificações do pendão, comprimento e diâmetro da espiga, número de fileiras de grãos por espiga e número de grãos por fileira por espiga. O número e distribuição genômica dos QTL's, bem como o tipo e magnitude de seus efeitos foram determinados pela utilização do método de mapeamento por intervalo composto. Para a população OL, foram mapeados cinco QTL's para produção de grãos, distribuídos nos cromossomos 2, 5, 7 e 8. A porcentagem da variância fenotípica explicada por cada QTL variou de 4,12% a 7,59% e os tipos de ação gênica predominante foram dominância e dominância parcial. Para a população PR, foi mapeado apenas um QTL para produção de grãos, localizado no cromossomo 2. Tal QTL apresentou ação gênica do tipo dominância parcial e explicou 5,15% da variação fenotípica. Dos 27 QTL's detectados para a população OL, sete foram localizados no cromossomo 3, sete no cromossomo 5 e quatro no cromossomo 7, representando 67% do total de QTL's mapeados em todo o genoma para essa população. Para a população PR, dos 35 QTL's detectados, quatro foram mapeados no cromossomo 1, seis no cromossomo 2, três no cromossomo 3, seis no cromossomo 5, dois no cromossomo 7, quatro do cromossomo 8, dois no cromossomo 9 e dois no cromossomo 10, representando 83% do total de QTL's mapeados em todo o genoma. Embora tenha havido a formação de blocos de QTL's nas duas populações, somente as observações do tamanho de cada intervalo e das correlações fenotípicas dos caracteres envolvidos não permitem concluir se essas regiões genômicas contém QTL's ligados e/ou QTL's com efeitos pleiotrópicos.

(13)

6XPPDU\

Grain yield and other important economic traits in maize, such as plant height, stalk length, and stalk diameter, exhibit polygenic inheritance, making difficult information achievement about the genetic bases related to the variation of these traits. The objective of this study was mapping QTLs associated with grain yield, yield components, and morfological traits in two F2 populations (OL and PR), obtained from tropical lines of IG-1, IG-2 and BR-106 populations. The OL population was composed of 404 plants, and its genotypes were obtained from 75 microsatellites markers, which provided a linkage map with 1,437 cM total length and 19.16 cM mean markers distance. The PR population was composed of 446 plants, and its genotypes were obtained from 117 microsatellites markers, which provided a linkage map with 1,658 cM total length and 14.17 cM mean intermarker distance. Both populations were evaluated for grain yield, plant and ear height, above-ear leaf number, tassel branches number, stalk length and diameter, kernel row number, kernel number per row. Composite interval mapping was used to estimate the number of QTLs, their chromosomallocation, type, and magnitude of effect. Five grain yield QTLs were located on chromosomes 2, 5, 7 and 8 in the OL population. They accounted for 4.12% to 7.59% of the phenotypic variance and showed dominant and partial dominant gene action. Only one grain yield QTL was located on chromosome 2. It showed partial dominant gene action and explained 5.15% of the phenotypic variance. Out of the 27 QTLs detected in the OL population, seven were located on chromosome 3, seven on chromosome 5 and four on chromosome 7, representing 67% of the total QTLs detected for this population. Out of the 35 QTLs detected in the PR population, four were located on chromosome 1, six on chromosome 2, three on chromosome 3, six on chromosome 5, two on chromosome 7, four on chromosome 8, two on chromosome 9 and two on chromosome 10, representing 83% of the QTLs detected in this population. Although it has been observed QTLs blocks formation on chromosomes in both population, only the information on blocks extent and on phenotypic correlation of traits involved in their formation does not allow conclusions about linkage or pleiotropic effects of QTL within these blocks.

(14)

,QWURGXomR

A maioria dos caracteres vegetais de importância econômica podem ser classificados como quantitativos. Caracteres desse tipo são aqueles cuja expressão fenotípica apresenta uma variação contínua, atribuída à segregação simultânea de muitos genes espalhados pelo genoma, em regiões definidas como QTL’s (“Quantitative Trait Loci”). Adicionalmente, tal variação é também atribuída à sobreposição da variação proveniente de causas não-genéticas, chamada variação ambiental (Falconer e Mackay, 1996). Em milho, exemplos importantes de caracteres quantitativos são a produção de grãos, a altura da planta, o comprimento e o diâmetro da espiga.

O conhecimento das proporções genéticas e ambientais que compõem a variação contínua desse tipo de caráter é fundamental para o melhoramento de plantas, pois permite explorar de modo eficiente o potencial genético das espécies de interesse. As metodologias de análise empregadas com esse objetivo têm tido sucesso nessa exploração, contribuindo, por exemplo, para o aumento da produtividade das culturas e fornecimento de alimentos para a crescente população humana (Falconer e Mackay, 1996; Stuber et al., 1999).

Contudo, grande parte dessas metodologias consideram o efeito médio do conjunto gênico envolvido na expressão dos caracteres quantitativos e, assim, fornecem pouca informação sobre as bases genéticas e fisiológicas envolvidas na variação desses caracteres, tais como o número de locos envolvidos, localização cromossômica e contribuição dos locos para a expressão do caráter, bem como efeitos pleiotrópicos e interações epistáticas entre os locos. Assim, bastante ênfase tem sido dada no desenvolvimento das tecnologias dos marcadores moleculares, na tentativa de melhorar o entendimento sobre tais questões, possibilitar uma manipulação mais eficiente de tais caracteres e, conseqüentemente, melhorar também a precisão e eficiência dos programas de melhoramento (Stuber et al., 1999).

Dentre as diversas abordagens possíveis, o mapeamento de QTL's tem sido empregado com freqüência. Tal procedimento permite localizar, estimar os efeitos e a contribuição de regiões que influenciam a variação dos caracteres quantitativos. Para isso, diversos métodos estatísticos recentemente desenvolvidos são empregados para avaliar conjuntamente dados fenotípicos de caracteres quantitativos e a segregação dos alelos de marcadores organizados em mapas genéticos (Lynch e Walsh, 1997; Liu, 1998).

A identificação de QTL's ligados a alelos marcadores é uma etapa inicial importante na aquisição de informações sobre a variação dos caracteres quantitativos. O mapeamento de QTL’s pode auxiliar na identificação de regiões relevantes em populações ou linhagens, na introgressão de QTL’s em linhagens elite ou na predição da performance de híbridos, sem a

(15)

necessidade de testar centenas ou milhares de cruzamentos, contribuindo de maneira efetiva para a diminuição dos custos e o aumento da eficiência dos programas de melhoramento (Stuber, 1994; Stuber et al., 1999). As informações fornecidas pelo mapeamento também permitem que seja praticada seleção com base em marcadores moleculares associados a QTL's, processo denominado seleção assistida por marcadores (MAS –“marked assisted selection”). A MAS permite que QTL's sejam manipulados como caracteres qualitativos, uma vez que os dados obtidos da utilização de marcadores são de natureza discreta. A possibilidade de monitorar QTL's ao longo de gerações ou transferir QTL's de interesse entre materiais pode contribuir na diminuição de custos e aumento da eficiência dos programas, sendo, portanto, de grande interesse para os programas de melhoramento (Openshaw et al., 1994; Stuber, 1994; Eathington et al., 1997; Stuber et al., 1999; Willcox et al., 2002).

De forma geral, o mapeamento depende do desequilíbrio de ligação entre as linhagens que formam a população de mapeamento, da escolha de marcadores moleculares polimórficos para a construção do mapa de ligação e do emprego de métodos de mapeamento adequados. Assim, diversos caracteres têm sido associados a QTL's, em diferentes combinações de tipos de população de mapeamento, marcadores moleculares e métodos de mapeamento. Por exemplo, QTL's têm sido mapeados para produção de grãos, componentes da produção, tais como comprimento e diâmetro da espiga, caracteres morfológicos, tais como altura da planta e número de ramificações do pendão, além de QTL's relacionados à resistência à doenças (Edwards et al. 1987; Stuber et al. 1987; Berke e Rocheford, 1995, 1999; Maroof et al. 1996; McMullen et al. 1998; Lee et al. 1998).

Contudo, a grande maioria dos estudos dessa natureza tem sido realizada na Europa e nos Estados Unidos, utilizando linhagens de clima temperado, em condições ambientais muito diferentes das encontradas nas regiões tropical e subtropical. Considerando que caracteres quantitativos sofrem grande influência ambiental, estudos envolvendo materiais tropicais podem ser de interesse nacional, pois podem permitir a incorporação dessa tecnologia e de seus benefícios aos programas de melhoramento de milho brasileiros.

(16)

2EMHWLYR

O objetivo desse trabalho foi utilizar marcadores do tipo microssatélite e mapeamento por intervalo composto em duas populações F2 de milho tropical, para mapear QTL's associados à produção de grãos, a componentes da produção e a caracteres morfológicos. Os QTL's foram analisados quanto ao seu número e distribuição genômica, bem como quanto ao tipo e magnitude de seus efeitos na variação dos caracteres quantitativos. Além disso, buscou-se identificar possíveis ligações e efeitos pleiotrópicos entre os QTL's mapeados.

(17)

5HYLVmR%LEOLRJUiILFD

$VSHFWRV(FRQ{PLFRVH*HQpWLFRVGR0LOKR

O milho é uma das espécies agrícolas de maior área cultivada no mundo. Cereal plantado em praticamente todos os continentes, sua produção mundial, distribuída em cerca de 140 milhões de hectares, está estimada em 586 milhões de toneladas anuais e seu consumo estimado é de 525 milhões de toneladas. Os maiores produtores mundiais são os Estados Unidos, a China e o Brasil, com produções de, aproximadamente, 238, 105 e 37 milhões de toneladas, respectivamente. Os Estados Unidos são, também, os maiores consumidores e exportadores mundiais, consumindo 177 milhões de toneladas e exportando 61 milhões de toneladas (Viana

et al., 1999; Duarte, 2000; Paterniani et al., 2000).

No Brasil, o milho é cultivado em todo território nacional, numa área estimada em 12 milhões de hectares, valor que o coloca na posição de cereal mais cultivado do país, com uma produtividade média de 2,5 toneladas por hectare, que corresponde à quinta maior do mundo (Andrade, 2000; Duarte, 2000). É utilizado principalmente na alimentação de aves, suínos e bovinos. Além disso, produtos tais como grãos, matéria verde fresca e amido são utilizados na alimentação humana, diretamente ou após industrialização (Viana et al., 1999). Na indústria, é utilizado como matéria-prima em cerca de 600 produtos, entre os quais óleos, corantes, papéis, colas, cosmésticos e antibióticos (Paterniani et al., 2000).

Além de ser uma espécie economicamente importante, algumas características morfológicas, genéticas e fisiológicas contribuem para que o milho seja uma espécie bastante estudada (Nass e Paterniani, 2000). Gramínea pertencente à família Poaceae, à tribo Maydeae, ao gênero Zea e à espécie mays (Zea mays L.), o milho é diplóide, com 20 cromossomos autossômicos nas células somáticas (

2

n

=

2

x

=

20

) (Paterniani e Campos, 1999; Viana et al., 1999). É uma espécie alógama de reprodução sexuada, apresentando os órgãos produtores de gametas masculinos e femininos na mesma planta, em estruturas separadas: os gametófitos masculinos são produzidos no pendão ou inflorescência masculina, localizado no ápice da planta; os gametófitos femininos são produzidos na espiga ou inflorescência feminina, que se desenvolve na axila de folhas localizadas na parte central da planta (Viana et al., 1999).

A distância entre as estruturas reprodutivas, a disposição das folhas entre ambas e a liberação de grãos de pólen do pendão antes da emergência dos estigmas da espiga da mesma planta (protandria) favorecem a polinização cruzada sem, contudo, dificultar a autopolinização manual (Paterniani e Campos, 1999; Viana et al., 1999). Essa relativa facilidade no controle dos cruzamentos permitiu que diferentes métodos de melhoramento pudessem ser

(18)

desenvolvidos, avaliados e empregados para o milho e posteriormente estendidos para outras espécies alógamas (Nass e Paterniani, 2000; Viana et al., 1999).

Por ser uma espécie alógama, as plantas de milho não transferem o seu genótipo integralmente para a geração seguinte. Para isso, os genótipos das populações são fixados através de uma tecnologia desenvolvida no início do século, baseada num sistema de endogamia seguida de hibridação. Nesse sistema, as plantas são autofecundadas sucessivamente por seis a oito gerações para a obtenção de linhagens homozigóticas, isto é, plantas com genótipos fixados (East, 1908, 1909; Shull, 1908, 1909, 1910). Como cada linhagem produz apenas um tipo de gameta, o cruzamento entre linhagens também fixa o genótipo dos híbridos gerados, permitindo que os genótipos (híbridos) possam ser reproduzidos integralmente a cada geração de cruzamentos. Isso é importante, pois permite avaliar, classificar e selecionar genótipos de interesse, para posterior multiplicação e liberação dos mesmos como cultivares (Souza Jr., 2001).

De forma geral, os híbridos formados do cruzamento de linhagens de populações de origens diferentes apresentam desempenho superior em relação àqueles obtidos de linhagens de populações de mesma origem, devido ao fenômeno da heterose. Assim, é comum classificar as diversas populações em grupos heteróticos, para que a heterose dos cruzamentos seja maximizada e, conseqüentemente, sejam selecionados os híbridos de melhor desempenho (Souza Jr., 2001).

Uma forma de estabelecer esses grupos consiste em cruzar diversos materiais entre si, em todas as combinações possíveis, e avaliar tais cruzamentos em experimentos com repetições para a estimação do parâmetro denominado capacidade específica de combinação. Esse parâmetro permite mensurar a complementação das linhagens quanto aos alelos favoráveis nos locos com níveis altos de dominância e permite a organização dos grupos. Como a quantidade de combinações de cruzamentos é muito elevada e dificulta a realização de todos os cruzamentos possíveis, as linhagens de um grupo heterótico são avaliadas em cruzamentos com algumas linhagens elites derivadas de outro grupo heterótico. De forma alternativa, as linhagens também podem ser alocadas em grupos heteróticos através da análise dos padrões de segmentos de DNA, obtidos com o emprego de marcadores moleculares (Lanza, 1997; Pinto, 2000; Barbosa, 2003).

(19)

0DUFDGRUHV0ROHFX ODUHV

Os conhecimentos recentes de biologia molecular e celular sobre a biologia e a genética dos organismos permitiram o desenvolvimento de diversas metodologias biotecnológicas, entre elas, técnicas moleculares de análise genômica que permitem acessar e manipular a variabilidade de, potencialmente, toda a molécula de DNA (Souza, 2001).

Qualquer forma alélica originada de um genoma pode ser utilizada como um marcador genético, seja um dado fenotípico, uma proteína ou um fragmento de DNA. Para isso, basta que haja polimorfismo genético entre indivíduos, isto é, diferenças entre tais formas alélicas. Os marcadores morfológicos e isoenzimáticos exploram o polimorfismo dos produtos da expressão de um ou mais genes, ou seja, da fração da molécula de DNA que é transcrita. O polimorfismo dos marcadores moleculares, por sua vez, é originado de formas alélicas de fragmentos de DNA que podem corresponder a qualquer região da molécula, de seqüência única ou repetida e que codifique ou não um gene (Ferreira e Grattapaglia, 1996, Souza, 2001).

Os marcadores moleculares sofrem pouca ou nenhuma influência ambiental. Além disso, são abundantes e apresentam grande número de alelos por loco, quando comparados aos outros tipos de marcadores. Considerando suas vantagens, podem ser empregados em diversas situações, tais como em análises de diversidade genética, na alocação de linhagens em grupos heteróticos, na construção de mapas genéticos, no mapeamento de caracteres de interesse e, possivelmente, na seleção assistida por marcadores (Stuber, 1994; Ferreira e Grattapaglia, 1996, Pinto 2000, Souza, 2001).

Entre os diversos tipos de marcadores moleculares disponíveis, os mais utilizados em análise genética de plantas podem ser classificados em dois tipos principais: marcadores moleculares codominantes e marcadores moleculares dominantes.

3. 2.1 . Marca dore s Mor fol ógi cos

Os primeiros marcadores utilizados em estudos genéticos foram os marcadores morfológicos, que correspondem a fenótipos de fácil distinção, tais como nanismos, deficiências clorofíticas, cores de pétalas ou morfologia foliar (Ferreira e Grattapaglia, 1996). Foi a partir da investigação da associação entre pigmentação de feijão, um caráter qualitativo utilizado como marcador morfológico, e tamanho das sementes, um caráter quantitativo (Sax, 1923), que a lógica do mapeamento de QTL’s foi utilizada pela primeira vez (Mackay, 2001).

A utilização ampla desse tipo de marcador, no entanto, foi dificultada pela pequena quantidade de características morfológicas disponíveis como marcadores morfológicos. Além disso, por serem produto de expressão gênica, marcadores morfológicos podem ser influenciados pelo ambiente, pela ação de outros genes ou, ainda, influenciar o

(20)

desenvolvimento normal da planta. Embora mapas genéticos desenvolvidos a partir desses marcadores sejam pouco saturados e de difícil obtenção, mapas de plantas como o milho (Emerson et al., 1935) e o tomate (MacArthur, 1934) foram construídos.

3. 2.2 . Marca dore s I soen z imátic os

A disseminação da utilização de marcadores genéticos em estudos de genética e melhoramento iniciou-se com o desenvolvimento dos marcadores isoenzimáticos. As informações relativas a esses marcadores são obtidas do polimorfismo de formas alélicas de proteínas, mais especificamente, de grupos de diferentes formas moleculares de uma mesma enzima (Moss, 1982).

O controle genético dessas formas moleculares é comandado por vários genes, que podem ser alelos de um mesmo loco ou de locos distintos. Geralmente, o polimorfismo das isoenzimas é detectado através de eletroforese em gel de amido e de métodos histoquímicos. Considerando que as enzimas possuem função metabólica, o nível desse polimorfismo possui um limite e, assim, marcadores isoenzimáticos são pouco abundantes, o que reduz o potencial de utilização da técnica. Por exemplo, em espécies em que espera-se detectar mais de 100 locos isoenzimáticos, o número de sistemas isoenzimáticos polimórficos visualizados varia, em geral, de 10 a 20 (Murphy et al., 1990).

Além disso, isoenzimas são produtos de expressão gênica e, portanto, podem ser influenciadas tanto pelo ambiente quanto pela ação de outros genes. Ainda assim, a quantidade de sistemas isoenzimáticos disponíveis em relação aos marcadores morfológicos, aliada à possibilidade de identificar heterozigotos e homozigotos em seus locos e do baixo custo da técnica, representam vantagens que estimularam sua utilização em estudos genéticos. Há, ainda, a vantagem de permitir a obtenção relativamente rápida dos dados (Ferreira e Grattapaglia, 1996; Souza, 2001). No caso do milho, marcadores isoenzimáticos foram utilizados, por exemplo, no mapeamento dos mais diversos caracteres, tais como produção de grãos, altura da planta e número de ramificações do pendão (Edwards et al., 1987) e também no estudo de seleção assistida por marcadores (Stuber, 1994).

(21)

3. 2.3 . Marca dore s Mol ecul ar es Codomin ante s

Os marcadores moleculares dessa classe fornecem grande quantidade de informação genética. São espécie-específicos e permitem a visualização simultânea dos alelos de um mesmo loco. Geralmente, os mais utilizados em plantas são aqueles denominados RFLP (“Restriction Fragment Length Polymorphism”) e microssatélites ou SSR (“Simple Sequence Repeats”) (Souza, 2001), descritos a seguir.

3 .2 .3 .1 . R F L P ( “ R e s tr ic t io n F ra g me n t L e n g t h P o ly mo rp h is m” )

O polimorfismo dos marcadores do tipo RFLP ocorre pelas diferenças no tamanho de fragmentos de DNA obtidos por enzimas de restrição, as quais cortam o DNA em seqüências particulares, chamadas sítios de restrição. Essas diferenças de tamanho ocorrem quando há variação, entre indivíduos, na distribuição genômica dos sítios de restrição de uma determinada enzima, em conseqüência de mutações pontuais, o que leva à criação ou eliminação de sítios. Outras causas do polimorfismo são inserções, deleções, translocações ou inversões nas seqüências de DNA, que alteram o tamanho do fragmento sem modificar o sítio (Botstein et al., 1980).

Quando o DNA é submetido à ação de enzimas de restrição, a quantidade de fragmentos gerados impossibilita a distinção visual destes em géis de eletroforese. Assim, a detecção do polimorfismo é obtida pela hibridação de sondas moleculares marcadas com radioatividade ou quimioluminescência. Esse processo envolve: desnaturação e transferência dos fragmentos para uma membrana, hibridação da sonda desnaturada com sua seqüência homóloga correspondente, e exposição da membrana a um filme autoradiográfico. Como fragmentos de tamanhos diferentes migram distintamente no gel, os sinais correspondentes a cada fragmento com sua respectiva sonda ocuparão posições distintas na autoradiografia. Assim, um marcador polimórfico do tipo RFLP é definido por uma combinação entre uma determinada enzima de restrição e uma sonda (Murray et al., 1988; Ferreira e Grattapaglia, 1996; Milach, 1998).

De acordo com o tipo de sonda utilizada, é possível identificar diferentes utilizações para esses marcadores. Sondas obtidas a partir de cDNA correspondem a genes que necessariamente se expressam, limitando a análise do polimorfismo às regiões codificadoras. As sondas genômicas podem corresponder também a regiões não codificadoras do genoma, sejam elas de cópia única ou múltipla. Quando correspondem a regiões de cópias múltiplas, marcadores do tipo RFLP podem ser utilizados em estudos de diversidade ou em identificações de variedades. Quando correspondem a regiões de cópia única podem ser utilizados no

(22)

mapeamento genético de características de interesse. A quantidade disponível de marcadores do tipo RFLP é potencialmente maior que a quantidade de marcadores morfológicos e isoenzimáticos. Além disso, são consistentes e eficientes na obtenção dos resultados. Isso é comprovado pela intensa utilização a que têm sido submetidos no estudo de diversas espécies vegetais. Contudo, o desenvolvimento desse tipo de marcador é árduo e minucioso, além de dispendioso em tempo e dinheiro, o que dificulta sua automatização e implementação em experimentos que envolvam análise de grandes quantidades de indivíduos e locos marcadores, tais como na rotina de um programa de melhoramento de plantas (Edwards et al., 1992; Newbury e Ford-Loyd, 1993; Wu e Tanksley, 1993; Cai et al., 1994; Coe et al., 1995; Loarce et al., 1996; Blanco et al., 1998; Peng et al., 1999).

3 .2 .3 .2 . M ic ro s s a t é lit e s o u SSR (“ Simp le Se q u e n c e R e p e a t s ” )

Nos genomas eucariotos são encontradas diferentes regiões de seqüências repetidas. Dentre elas, seqüências de DNA de 1 a 6 pares de bases repetidas em tandem, denominadas microssatélites ou SSR. O polimorfismo desses microssatélites deve-se à variação no número de repetições desses pares de bases e é comum entre indivíduos de uma espécie. Entretanto, apesar dessa variação, a seqüência de bases adjacentes a um determinado microssatélite pode ser única no genoma e conservada entre os indivíduos. Isso permite que oligonucleotídeos específicos para essas seqüências adjacentes sejam construídos e então utilizados para a amplificação do loco via PCR (“Polymerase Chain Reaction”). Assim, indivíduos que apresentam diferenças no número de repetições de um loco microssatélite produzem segmentos amplificados de diferentes tamanhos. Esse polimorfismo pode ser discriminado em géis de alta resolução de poliacrilamida, de agaroses especiais ou através de sequenciador automático, quando os produtos amplificados são marcados com compostos fluorescentes (Hamada et al., 1982; Saiki et al., 1985; Litt e Luty, 1989; Weber e May, 1989; Gupta et al., 1996; Schlötterer, 2000).

Os marcadores do tipo microssatélite apresentam grande quantidade de locos multialélicos dispersos pelo genoma, com elevado nível de heterozigosidade e conteúdo informativo. Apresentam as mesmas vantagens dos marcadores do tipo RFLP, porém, ao contrário destes, a metodologia para detecção do polimorfismo entre indivíduos é simples e permite automatização. Assim, marcadores desse tipo podem ser utilizados com eficiência em estudos de diversidade genética, caracterização de germoplasma, construção de mapas genéticos e mapeamento de caracteres de interesse. Contudo, sua utilização é limitada a espécies que possuem um conjunto razoável de microssatélites disponíveis, como aquelas de grande importância econômica, como o milho, o trigo e o arroz, o que justifica o elevado investimento no seu desenvolvimento (Akkaya et al., 1992; Condit e Hubbell, 1991; Zhao e

(23)

Kochert, 1992; 1993; Senior e Heun, 1993; Wu e Tanksley, 1993; Yang et al., 1994; Yu et al., 1994; Röder et al., 1995; Chin et al., 1996).

3. 2.4 . Marca dore s Mol ecul ar es Dominan tes

Os marcadores dessa classe não são dirigidos a regiões particulares do genoma e, conseqüentemente, revelam simultaneamente o polimorfismo em dezenas de locos diferentes. Têm ação dominante, ou seja, não permitem a visualização simultânea dos alelos de um mesmo loco. Os mais utilizados nas análises genéticas de plantas são aqueles denominados RAPD (“Random Amplified Polymorphic DNA”) e AFLP (“Amplified Fragment Length Polymorphism”), descritos a seguir (Souza, 2001).

3 .2 .4 .1 . R A PD (“ R a n d o m A mp lifie d Po ly mo r p h ic D N A ” )

A obtenção dos marcadores do tipo RAPD envolve a utilização de oligonucleotídeos de seqüência curta e arbitrária em amplificações via PCR. Tais oligonucleotídeos unem-se a seqüências do genoma que são parcial ou totalmente complementares a sua própria seqüência, o que permite a amplificação simultânea de vários fragmentos de DNA. O polimorfismo, nesse caso, resulta de mutações ou rearranjos no sítio ou entre os sítios complementares à seqüência do oligonucleotídeo empregado (Mullis e Faloona, 1987; Williams

et al., 1990).

As vantagens desse tipo de marcador são o baixo custo e a simplicidade da técnica na obtenção do polimorfismo. Sua implementação não envolve qualquer sistema especial para sua detecção, tais como hibridações, marcação radioativa ou compostos quimioluminescentes, como no caso de marcadores do tipo RFLP. Além disso, esse tipo de marcador não requer conhecimento prévio de seqüências de DNA, como no caso de marcadores do tipo microssatélite. O polimorfismo no tamanho dos fragmentos amplificados é, na maioria das vezes, facilmente visualizado em gel de agarose após coloração com brometo de etídeo. Por esses motivos, os marcadores do tipo RAPD são muito utilizados na caracterização de bancos de germoplasma, em estudos filogenéticos e na análise de diversidade genética. Em espécies onde não há marcadores codominantes disponíveis, são também utilizados na construção de mapas genéticos e no mapeamento de caracteres de interesse (Rafalski et al., 1991; Welsh et al., 1991; Waugh e Powell, 1992; Waugh et al., 1992; Cai et

al., 1994; Lanza et al., 1997).

As principais desvantagens dos marcadores do tipo RAPD são a baixa reprodutibilidade dos experimentos e a dominância dos locos amplificados, que os tornam menos informativos quando comparados aos locos obtidos com a utilização de marcadores

(24)

codominantes. Essas características prejudicam a análise de populações segregantes, comumente utilizadas na construção de mapas genéticos e no mapeamento de características de interesse. Por exemplo, no caso de populações de mapeamento do tipo F2, a utilização de marcadores de efeito dominante fornece dois grupos de indivíduos, organizados de acordo com a presença ou a ausência do alelo no loco marcador, em vez de três grupos, de acordo com a proporção esperada de 1:2:1 (Williams et al., 1993).

3 .2 .4 .2 . A F L P ( “ A mp lif ie d F ra g me n t L e n g t h P o ly mo rp h is m” )

Os marcadores do tipo AFLP são obtidos pela exploração da distribuição genômica aleatória dos sítios de restrição entre indivíduos e também pela amplificação aleatória de fragmentos de DNA. São, portanto, obtidos pela combinação das estratégias de detecção de polimorfismo dos marcadores do tipo RFLP (sítios de restrição) e RAPD (amplificação aleatória) (Zabeau e Vos 1993; Lin e Kuo, 1995; Vos et al., 1995).

A técnica consiste em digerir o DNA genômico com enzimas de restrição, ligar adaptadores às extremidades dos fragmentos obtidos e amplificá-los via PCR. A amplificação dos fragmentos digeridos está associada à constituição dos adaptadores, que são pequenos segmentos de DNA dupla fita que contêm o sítio de restrição da enzima utilizada na digestão, além de uma seqüência arbitrária. O sítio de restrição permite a ligação do adaptador às extremidades dos fragmentos gerados. Em seguida, ligam-se oligonucleotídeos complementares à seqüência arbitrária do conjunto adaptador-fragmento, permitindo sua amplificação. Normalmente, antes da amplificação propriamente dita, realiza-se uma outra amplificação, denominada pré-seletiva. Isso ocorre devido ao grande número de fragmentos gerados na digestão enzimática, aliado ao tamanho dos genomas vegetais, que tornam a avaliação do polimorfismo muito complexa. Nessa etapa, são empregados oligonucleotídeos que contêm a seqüência de bases complementares ao adaptador, adicionada de um nucleotídeo aleatório. Esse nucleotídeo permite somente a amplificação dos fragmentos que possuem o nucleotídeo completar a ele, isto é, disponibiliza para a próxima etapa apenas uma parte dos fragmentos gerados pela digestão com a enzima de restrição. Na amplificação seguinte são empregados oligonucleotídeos constituídos pela seqüência do adaptador. A esse oligonucleotídeo adicionam-se três nucleotídeos aleatórios, sendo o primeiro deles igual ao utilizado na amplificação pré-seletiva, para que os fragmentos selecionados na amplificação pré-seletiva possam ser amplificados. O subconjunto de fragmentos amplificados é, então, separado em gel desnaturante de acrilamida e pode ser visualizado após coloração com prata ou após exposição à um filme autoradiográfico, caso um dos oligonucleotídeos utilizados na amplificação seletiva seja marcado radiativamente (Vos et al., 1995; Souza, 2001).

(25)

Embora seja possível detectar diferenças de tamanho de fragmento entre dois alelos, o polimorfismo detectado pelos marcadores do tipo AFLP é considerado dominante, uma vez que as relações alélicas entre polimorfismo codominante e dominante são extremamente difíceis de serem determinadas para esse tipo de marcador. Assim, considera-se apenas o polimorfismo de fácil observação, baseado na presença e ausência de bandas (dominante) e não se considera o polimorfismo de difícil identificação, baseado no tamanho de fragmentos (codominante). As diferenças entre presença e ausência de bandas nos locos são atribuídas a modificações dos sítios de restrição ao longo do genoma. Tais modificações podem ser devidas à mutação, à deleção e à adição de novas bases ou, ainda, devidas à inserções, deleções ou inversões de seqüências entre os dois sítios de restrição (Souza, 2001).

Dada a quantidade de fragmentos que podem ser analisadas utilizando marcadores do tipo AFLP, é possível caracterizar genótipos com relativamente poucas análises, o que torna esse tipo de marcador útil como técnica de “DNA fingerprinting” (“impressão digital do DNA”). Assim, marcadores desse tipo têm sido utilizados principalmente em estudos de diversidade genética, embora sua utilização seja relativamente comum também na construção de mapas, no mapeamento de caracteres de interesse ou, ainda, na saturação de regiões específicas de mapas genéticos já existentes (Powell et al., 1996; Maheswaran et al., 1997; Alonso-Blanco et al., 1998; Castiglioni et al., 1998, 1999; Pejic et al., 1998, Vuylsteke et al., 1999, Ajmone-Marsan et al., 2001).

A detecção do polimorfismo dos marcadores do tipo AFLP é relativamente difícil, quando comparada a de outros tipos de marcadores. Isso exige certa familiaridade do laboratório com técnicas moleculares. Além disso, a ação dominante desse tipo de marcador, fornece menos informação por loco que marcadores de ação codominante, limitando sua utilização na construção de mapas genéticos e no mapeamento de características de interesse (Souza, 2001).

(26)

0DSDV*HQpWLFRV

Mapas genéticos são representações gráficas/estatísticas dos cromossomos de uma espécie. Indicam a ordenação de locos ao longo dos cromossomos, bem como as distâncias relativas entre eles, sejam tais locos associados a genes (marcadores morfológicos ou isoenzimáticos) ou não (marcadores moleculares). São importantes nos estudos genéticos dos organismos, pois estruturam a base do conhecimento genômico, a partir do qual podem ser elucidados diversos aspectos relativos ao mapeamento de caracteres de interesse, à manipulação genética, à evolução das espécies e à expressão e função gênica (Lynch e Walsh, 1997; Griffiths et al., 2000).

A distribuição das marcas ao longo do genoma fornece um meio de mapear caracteres de interesse. Diversos métodos estatísticos permitem investigar se tais marcas estão associadas a genes simples ou a QTL’s. Dessa forma, os mapas genéticos servem de ponto de partida na identificação de regiões genômicas relevantes, que podem, então, ser melhor compreendidas e exploradas. Por exemplo, a localização cromossômica de um gene é o início do processo de manipulação genética. De forma análoga, o mapeamento de QTL’s amplia o conhecimento sobre as bases da variação quantitativa e pode direcionar processos de introgressão gênica ou viabilizar a seleção assistida por marcadores (Edwards et al., 1987; Osborn et al., 1987; Nienhuis et al., 1987; Lynch e Walsh, 1997; Griffiths et al., 2000).

Os mapas genéticos são importantes também em estudos evolutivos, pois fornecem informações sobre a estrutura, função e evolução dos genomas, tais como a detecção de distorções de segregação em segmentos cromossômicos e a detecção de inversões, translocações e duplicações de segmentos de DNA (Slocum et al., 1990; Tanksley et al., 1995; Griffiths et al., 2000). Permitem, além disso, a comparação das estruturas genômicas de diferentes espécies ou populações, quanto à homologia de genes e conservação de distância e ordem de ligação nos cromossomos (Slocum et al., 1990; Bonierbale et al., 1988; Tanksley et

al., 1988; Kianian e Quiros, 1992; Weeden et al., 1992; Whitkus et al., 1992; Ahn e Tanksley, 1993;

Prince et al., 1993).

Mapas genéticos podem, ainda, fornecer informações adicionais sobre os genes, uma vez que a localização cromossômica de um gene pode afetar sua expressão ou indicar sua função. A expressão de um gene pode ser influenciada por outros genes próximos a ele ou por sua distância em relação à heterocromatina. Genes agrupados em cromossomos de bactérias, por exemplo, são transcritos como uma unidade, normalmente por apresentarem funções relacionadas (Griffiths et al., 2000).

(27)

3. 3.1 . Pri ncí pio s Gené ti cos

O indício de associação física entre genes foi notado pela primeira vez quando observou-se que classes fenotípicas de plantas F2 de ervilha apresentavam grandes desvios em relação à proporção mendeliana esperada (Bateson e Punnett, 1905). Embora tais resultados indicassem que havia exceções ao princípio da segregação independente, a idéia de que os genes estavam ligados foi proposta quando observou-se que as combinações alélicas mais freqüentes da progênie de um cruzamento teste em Drosophila melanogaster eram iguais as dos parentais (Morgan, 1910). Esses resultados sugeriam que os alelos de tais combinações freqüentes estavam localizados no mesmo cromossomo, o que impedia a segregação independente e explicava os desvios de segregação observados (Griffiths et al., 2000; Borecki e Suarez, 2001).

A explicação para a ocorrência de recombinantes, em função da formação de quiasmas durante a sinapse na meiose I, foi sugerida num estudo de genes ligados ao sexo em

D. melanogaster. A associação entre recombinação e quiasmas, forneceu as bases citológicas

do fenômeno, uma vez que já haviam sido relacionados comportamento cromossômico e segregação gênica (Griffiths et al., 2000).

Como a freqüência de recombinação está vinculada à ocorrência de quiasmas, a probabilidade de ocorrência de recombinação entre dois locos é, portanto, função da distância entre eles. Dessa forma, a freqüência de recombinação pode ser usada como uma medida de distância entre locos (Borecki e Suarez, 2001). A partir desse princípio, foi construído o primeiro mapa genético em D. melanogaster, que representa a posição dos genes em relação a outros genes ao longo dos cromossomos (Sturtevant, 1913). Esse princípio também é utilizado para a construção de mapas genéticos utilizando marcadores moleculares.

3. 3.2 . Mapas de Li gação

Para a obtenção dos dados utilizados na construção dos mapas de ligação,

normalmente são utilizadas populações segregantes, tais como populações F2 ou

retrocruzamentos. Os indivíduos dessas populações são então analisados por algum tipo de marcador genético e os dados obtidos são submetidos a análises estatísticas (Lynch e Walsh, 1997; Borecki e Suarez, 2001).

A construção de mapas de ligação envolve basicamente três etapas: i) o teste de segregação; ii) o teste de ligação; iii) a ordenação das marcas, conforme descrito a seguir (Lynch e Walsh, 1997).

(28)

3 .3 .2 .1 . T e s te d e Se g re g a ç ã o

De acordo com o tipo de população utilizada para a construção do mapa, espera-se certa proporção de segregação dos marcadores empregados. Por exemplo, se a população utilizada for do tipo F2, a segregação esperada dos marcadores deve apresentar a proporção 1:2:1. A forma mais comum de verificar se a freqüência observada de determinada classe desvia-se significativamente de sua freqüência esperada é através do teste de Qui-quadrado, a partir da seguinte equação (Liu, 1998):

(

)

e e o

f

f

f

X

2 2

=

, em que 2

X

: valor calculado do Qui-quadrado;

o

f

: freqüência observada em cada uma das classes; e

f

: freqüência esperada em cada uma das classes (proporção mendeliana do modelo

genético adotado).

Os valores obtidos para cada 2

X

são comparados a valores tabelados, o que permite concluir sobre a significância desse valor.

Assim, a utilização de testes de segregação permite avaliar o funcionamento do sistema de marcadores adotado. Desvios significativos podem ser devidos ao não funcionamento correto do sistema marcador empregado, bem como ao tamanho inadequado da amostra ou, ainda, à causas biológicas específicas do organismo estudado como, por exemplo viabilidade diferencial de gametas.

Um aspecto importante a ser considerado na construção de mapas é quanto ao nível de significância adotado. Considerando que não haja desvios significativos entre as freqüências observadas e esperadas dos marcadores empregados, de cada 100 marcadores utilizados 5 serão descartados incorretamente, se o nível de significância adotado for de 5% (

α

=

0

,

05

) para cada marcador. Uma forma de resolver situações desse tipo (erro tipo I), consiste em adotar um nível de significância global, que leva em consideração todas as marcas empregadas, por exemplo, utilizando a correção de Bonferroni (Lynch e Walsh, 1997):

n

γ

α

=

, em que

(29)

α

: nível de significância;

γ

: probabilidade de encontrar pelo menos um teste falso positivo (nível de significância global);

n

: número de testes independentes, que corresponde ao número de marcadores empregados.

Dessa forma, o nível de significância para cada marcador pode ser obtido dividindo-se o nível de significância global pelo número de marcadores empregados. Considerando

05

,

0

=

γ

e empregando-se 100 marcadores, têm-se

α

=

0

,

0005

, ou seja, a probabilidade de descartar marcadores incorretamente é de 5 em cada 1 milhão de marcadores empregados, considerando que não haja desvios significativos entre as freqüências observadas e esperadas de tais marcadores.

3 .3 .2 .2 . T e s te d e L ig a ç ã o

Quando os genes estão em cromossomos diferentes, a freqüência esperada de recombinantes corresponde a 50% da progênie, devido à segregação independente de tais genes. Contudo, quando os genes estão ligados a freqüência de recombinantes varia entre 0 e 50% (Griffiths et al., 2000).

Conforme já visto, a variação na freqüência de recombinação depende da distância

entre os locos considerados. Considerando

θ

o parâmetro que indica a freqüência de

recombinação entre dois locos, pode-se afirmar que para dois locos distantes em um cromossomo, ou localizados em cromossomos diferentes, o valor de

θ

deve ser próximo de 0,5, conforme o princípio de segregação independente. Quando os locos estão próximos (ligados), o valor de

θ

é menor que 0,5 (Borecki e Suarez, 2001).

Com base nesse princípio, modelos permitem testar estatisticamente o valor de

θ

. Considerando 2 2 1 1 B A B A

um parental heterozigoto para dois locos A e B ligados em associação, a distribuição das freqüências esperadas dos gametas pode ser deduzida (Tabela 1).

(30)

Tabela 1: Freqüências esperadas dos gametas parentais e recombinantes, considerando ou não ligação entre os locos.

Com ligação Sem ligação

A1B1 parental (1/2)(1-θ) 1/4

A2B2 parental (1/2)(1-θ) 1/4

A1B2 recombinante (1/2)θ 1/4

A2B1 recombinante (1/2)θ 1/4

Gametas Tipo Freqüências esperadas

Nesse caso, o mais simples estimador de

θ

é a proporção de gametas recombinantes observados. Deve-se então testar se

θ

é significativamente diferente de 0,5, o que usualmente é feito através do LOD score (Morton, 1955; Lander e Green, 1987; Lander et al., 1987; Borecki e Suarez, 2001).

Tal método consiste em calcular a probabilidade de se obter um conjunto de dados numa situação de segregação independente e, alternativamente, sob a ocorrência de ligação. Em seguida, calcula-se a razão entre as probabilidades dessas duas situações e, finalmente, o logaritmo na base 10 dessa razão. Valores elevados desse LOD favorecem a hipótese de ligação, enquanto valores próximos de 1 fornecem evidência de segregação independente (Griffiths et al., 2000; Borecki e Suarez, 2001). Na prática, considera-se ligados locos que apresentam valores de LOD superiores ou iguais a 3 (Zeng, 2001)

O logaritmo é empregado para tornar mais fácil comparar resultados. Um LOD score de valor 3 significa que a hipótese de ligação é 103 vezes mais provável que a hipótese de os locos não estarem ligados (Griffiths et al., 2000; Borecki e Suarez, 2001).

3 .3 .2 .3 . O rd e n a ç ã o d a s M a r c a s

Tendo sido obtidos os grupos de ligação, testados através do LOD score, a etapa seguinte consiste em determinar a ordem das marcas dentro de cada grupo. Embora isso possa ser feito de diversas maneiras, o método estatístico mais utilizado baseia-se no conceito de verossimilhança.

De acordo com o princípio da máxima verossimilhança, a melhor ordem de ligação das marcas de um determinado conjunto de dados é a ordem que fornece a máxima verossimilhança para tal conjunto. Dessa forma, basta testar todas as ordens possíveis para um conjunto de marcas, calculando em seguida a máxima verossimilhança para cada uma das ordens (Zeng, 2001).

(31)

Diversos programas executam essa tarefa. Um dos mais utilizados é o Mapmaker/EXP (Lander et al., 1987; Lincoln et al., 1992), que permite testar as ordens das marcas dentro dos grupos de ligação, através de um comando denominado “compare”.

Uma das limitações à aplicação desse método de testar todas as ordens, é que à medida que aumenta o número de marcas dentro dos grupos, aumenta também a quantidade de ordens de ligação que devem ser testadas. Isso pode tornar a escolha da melhor ordem de ligação um processo lento e dependente dos recursos computacionais disponíveis ou, até mesmo, impedir a seleção da melhor ordem. O número de ordens possíveis é dado por

2

!

n

, em que

n

é o número de marcas.

Situações desse tipo são conhecidas em estatística e computação como “problema do caixeiro viajante” (Zeng, 2001). É fácil verificar que o número de ordens a serem testadas aumenta muito rapidamente, uma vez que é função de um número fatorial. Dessa forma, os programas para construção de mapas fornecem alternativas para contornar esse problema. No caso do Mapmaker/EXP, por exemplo, diversos algoritmos traduzidos em comandos do tipo “try” e “order” possibilitam a ordenação de grande quantidade de marcas, mesmo com recursos computacionais limitados.

3 .3 .2 .4 . F u n ç õ e s d e M a p e a me n to

Embora o método básico para a construção de mapas seja utilizar a freqüência de recombinação como medida de distância entre os locos, nem sempre tais freqüências fornecem medidas precisas dessas distâncias. A presença de um “crossing-over” numa determinada região diminui a probabilidade de ocorrência de “crossing-over” em regiões adjacentes. Dessa forma, à medida que a distância entre dois locos aumenta, maior a probabilidade de ocorrência desse tipo de interferência e, conseqüentemente, menos precisa é a utilização da freqüência de recombinação para estimar a distância (Trow, 1913; Lynch e Walsh, 1997; Griffiths et al., 2000).

Além disso, as freqüências de recombinação são estimativas das probabilidades de ocorrência de “crossing-over” e tais probabilidades não têm a propriedade de serem aditivas em relação à soma. Dessa forma, faz-se necessária alguma transformação de escala (Lynch e Walsh, 1997; Liu, 1998).

Diversas funções matemáticas relacionam freqüência de recombinação e distância entre locos de maneira mais precisa, minimizando esses desvios e contornando o problema da aditividade. As funções de mapeamento mais utilizadas são a de Haldane (1919) e a de Kosambi (1944). A função de mapeamento de Haldane supõe ausência de interferência,

(32)

enquanto a de Kosambi supõe uma quantidade moderada de interferência (Lynch e Walsh, 1997; Griffiths et al., 2000). Suas expressões são, respectivamente:

2

)

2

1

ln(

θ

=

m

e

+

=

θ

θ

2

1

2

1

ln

4

1

m

, em que

m: distância entre locos;

θ: freqüência de recombinação.

Quando dois locos estão fisicamente próximos, a distância relativamente pequena entre eles diminui ou inviabiliza a ocorrência de “crossing-over”. Assim, os valores de m fornecidos por ambas funções de mapeamento são semelhantes, indicando a pequena interferência existente entre locos próximos. No entanto, à medida que aumenta a distância entre os locos, os valores de m apresentam diferenças maiores (Figura 1) (Liu, 1998; Griffiths et

al., 2000).

Nota-se que quando θ <0,25, os valores de m (distância) são parecidos para as duas funções. Para θ>0,25, a distância obtida com a função de mapeamento de Haldane é maior que a obtida com a função de Kosambi. Isso mostra que a função de Kosambi, por levar em conta o fenômeno da interferência, tende a diminuir os valores da distância quando θ é próximo de

0

,

5

.

(33)

0.0 0.4 0.8 1.2 1.6 2.0 0 0.1 0.2 0.3 0.4 0.5 Freqüência de recombinação (θθ) Distância (m) +DOGDQH .RVDPEL  Figura 1: Comparação entre as funções de mapeamento de Haldane e Kosambi.

Quando a construção do mapa de ligação de um organismo é iniciada ou quando o genoma deste é relativamente grande, é comum encontrar regiões do genoma com grandes distâncias entre os locos. Nesse tipo de situação, a escolha da função de mapeamento é particularmente importante, pois melhora as estimativas das distâncias e, conseqüentemente, melhora a qualidade das informações do mapa (Liu, 1998; Griffiths et al., 2000). Usualmente, emprega-se a função de Kosambi.

Contudo, é importante notar que as distâncias estimadas não apresentam uma relação universal com a distância física (Tabela 2). Um centimorgan pode corresponder desde 10 até 1.000 kilobases, dependendo da espécie (Lynch e Walsh, 1997).

Tabela 2: Relação entre distância física e distância de mapa

Espécies Tamanho do Genoma

Haplóide (kb) Levedura 2,2 x 104 3.700 6 Neurospora 4,2 x 104 500 80 Arabidopsis 7,0 x 104 500 140 Drosophila 2,0 x 105 290 700 Tomate 7,2 x 105 1.400 510 Humana 3,0 x 106 2.710 1.110 Milho 3,0 x 106 1.400 2.140 Comprimento do Mapa (cM) kb/cM

(34)

Isso é particularmente importante quando há interesse na clonagem de QTL's (Tanksley

et al., 1995). Em teoria, é possível investigar os genes contidos em um determinado QTL, caso tal

QTL seja identificado em uma região suficientemente pequena do DNA. A partir dessa idéia, diversas estratégias podem ser utilizadas, entre elas a clonagem posicional (Lynch e Walsh, 1997).

(35)

0DSHDPHQWRGH47/¶V

Mapear QTL’s consiste em analisar regiões cromossômicas que contenham genes (ou locos) que influenciam a variação de caracteres quantitativos. Análises desse tipo permitem tanto identificar o número como a distribuição genômica dos QTL’s, além de identificar o tipo e a magnitude de seus efeitos (Lynch e Walsh, 1997, Liu, 1998; Zeng, 2001).

De forma geral, no mapeamento de QTL’s a herança complexa dos caracteres quantitativos é relacionada à herança simples de caracteres qualitativos conhecidos, com base em marcadores genéticos. Diversos métodos estatísticos permitem quantificar essa relação, analisando a associação entre a variação de dados fenotípicos contínuos e o padrão de segregação de marcadores em populações segregantes. Associações significativas entre os fenótipos e os marcadores indicam a existência de QTL’s localizados próximos a esses locos marcadores e permitem que sejam feitas inferências sobre os QTL’s (Liu, 1998).

Embora a lógica do mapeamento de QTL’s não seja nova (Sax, 1923), a disseminação de análises desse tipo ocorreu com o desenvolvimento dos marcadores moleculares e de métodos baseados em princípios estatísticos mais eficientes. Os marcadores moleculares possibilitam a construção de mapas genéticos saturados, enquanto os métodos estatísticos melhoram a qualidade das informações de mapeamento (Mackay, 2001). Além disso, sofisticações na análise são permitidas em função do desenvolvimento computacional (Zeng, 2001).

Informações precisas sobre os QTL’s contribuem para aumentar o conhecimento sobre a base da variação dos caracteres quantitativos e podem estruturar a exploração eficiente do potencial genético dos caracteres de importância econômica das espécies, por exemplo, direcionando programas de seleção assistida (Falconer e Mackay, 1996; Mackay, 2001).

Diversos conceitos estão envolvidos no mapeamento. Dentre eles, o desequilíbrio de ligação, a construção dos mapas genéticos, os princípios estatísticos de máxima verossimilhança e diversos modelos estatísticos, conforme será visto a seguir.

3. 4.1 . Deseq uil íbr io de Li gação

O mapeamento baseia-se na segregação conjunta dos alelos marcadores e dos QTL’s, permitindo relacioná-los. Isso significa que a eficiência do mapeamento é função da intensidade do desequilíbrio de ligação entre ambos (Lynch e Walsh, 1997; Liu, 1998; Mackay, 2001).

Uma população está em equilíbrio de ligação quando seus gametas são formados por combinações aleatórias dos alelos que constituem tal população. Nesse caso, as freqüências gaméticas são resultado do produto das freqüências alélicas de tal população. Por outro lado,

(36)

quando a combinação dos alelos não é aleatória, as freqüências gaméticas apresentam desvios em relação ao produto das freqüências alélicas e, nessa situação, a população está em desequilíbrio de ligação (Falconer e Mackay, 1996; Lynch e Walsh, 1997; Mackay, 2001). Esses desvios podem ser representados por

j i j i j iB AB A B A

P

p

p

D

=

, em que j iB A

D

: desequilíbrio de ligação entre os locos

A

i e

B

j;

j iB

A

P

: freqüência gamética dos locos

A

i e

B

j; i A

p

: freqüência do alelo

A

i; j B

p

: freqüência do alelo

B

j.

Por essa expressão, nota-se que ocorre desequilíbrio sempre que a freqüência gamética não puder ser explicada pelo produto das freqüências individuais dos alelos.

O desequilíbrio pode ocorrer em função da ocorrência de ligação entre os locos ou pela presença de alguma alteração na panmixia. Quando, em função da ligação, determinado alelo está em desequilíbrio de ligação com alelos de outros locos, a ocorrência de “crossing-over” entre o loco desse alelo e os demais locos tende a restaurar o equilíbrio ao longo das gerações de cruzamento ao acaso. Como o “crossing-over” depende da distância entre os locos considerados, a intensidade da ligação gênica é um fator importante na redução da velocidade de diminuição do desequilíbrio (Falconer e Mackay, 1996; Lynch e Walsh, 1997; Mackay, 2001).

A relação entre distância e desequilíbrio, em função da geração, pode ser representada por t t D D = 0(1−θ) , em que t

D

: desequilíbrio na geração

t

; 0

D

: desequilíbrio na geração inicial; θ: freqüência de recombinação;

Referências

Documentos relacionados

Figure III. 37: Water vapor-liquid interfacial tension.. 38: Ethanol vapor-liquid interfacial tension. Interfacial tension was calculated using these coefficients in

Los porcentajes del market share durante 2012 se ubicaron en los núme- ros habituales que se vienen dando desde hace años: entre el 2% en Perú y Uruguay y el 13% en Chile

Dessa forma, a partir da perspectiva teórica do sociólogo francês Pierre Bourdieu, o presente trabalho busca compreender como a lógica produtivista introduzida no campo

No Estado do Pará as seguintes potencialidades são observadas a partir do processo de descentralização da gestão florestal: i desenvolvimento da política florestal estadual; ii

Our contributions are: a set of guidelines that provide meaning to the different modelling elements of SysML used during the design of systems; the individual formal semantics for

After analyzing all the procedures involved in the production process of GFRP profiles, it was concluded that it would be possible to improve the sustainability and

Afastamento da sala de audiências: reflete a sensibilidade dos juízes quanto ao impacto das condições físicas, sobretudo das características austeras da sala da audiência de

Apresenta a Campanha Obra-Prima, que visa a mudança comportamental por meio da conscientização diante de algumas atitudes recorrentes nas bibliotecas da