• Nenhum resultado encontrado

Caracterização genético-molecular em Panicum maximum : identificação de marcadores moleculares SNPs e mapeamento genético

N/A
N/A
Protected

Academic year: 2021

Share "Caracterização genético-molecular em Panicum maximum : identificação de marcadores moleculares SNPs e mapeamento genético"

Copied!
102
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS

INSTITUTO DE BIOLOGIA

CAMILA FORNEZARI RABELLO

CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum

maximum: IDENTIFICAÇÃO DE MARCADORES

MOLECULARES SNPs E MAPEAMENTO GENÉTICO

CAMPINAS 2017

(2)

CAMILA FORNEZARI RABELLO

CARACTERIZAÇÃO GENÉTICO-MOLECULAR EM Panicum

maximum: IDENTIFICAÇÃO DE MARCADORES MOLECULARES

SNPs E MAPEAMENTO GENÉTICO

Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do Título de

Mestra em Genética e Biologia

Molecular na área de Genética Vegetal e Melhoramento.

ESTE ARQUIVO DIGITAL CORRESPONDE À

VERSÃO FINAL DA DISSERTAÇÃO

DEFENDIDA PELA ALUNA CAMILA FORNEZARI RABELLO E ORIENTADA PELA DR. ANETE PEREIRA DE SOUZA.

Orientador: ANETE PEREIRA DE SOUZA

CAMPINAS 2017

(3)
(4)

Campinas, 17 de fevereiro de 2017.

COMISSÃO EXAMINADORA

Prof.a Drª. Anete Pereira de Souza (Orientadora) Prof. Dr. Geraldo Magela de Almeida Cançado Prof. Dr. João Ricardo Bachega Feijó Rosa

Os membros da Comissão Examinadora acima assinaram a Ata de Defesa, que se encontra no processo de vida acadêmica do aluno.

(5)

Aos meus pais, Lúcia e Donizeti, com todo amor, dedico.

(6)

AGRADECIMENTOS

Agradeço sincera e profundamente à professora Anete Pereira de Souza pela oportunidade de trabalhar em seu laboratório, pela confiança depositada em mim,

pela gentileza e humanidade com que sempre tratou a todos ao seu redor.

Agradeço ao Dr. Guilherme de Toledo e Silva por me permitir dar continuidade ao seu trabalho e pelo imprescindível suporte ao longo desta caminhada.

Agradeço ao Dr. Antonio Augusto Franco Garcia e ao Rodrigo Rampazo pela inestimável ajuda na construção dos mapas genéticos.

Agradeço aos colegas do LAGM/CBMEG, sem os quais a conclusão deste trabalho não teria sido possível. Obrigada por compartilharem seus conhecimentos e me

ajudarem nos momentos de dificuldade.

Agradeço aos meus colegas Luciano, Camila, Aline e Benício pela contribuição durante o desenvolvimento desta tese.

Agradeço aos meus amigos e à minha família por todo apoio e compreensão nos momentos de ausência.

Agradeço ao meu marido, Rafael, por ser calmaria em meio à turbulência, meu porto seguro, meu amor.

Agradeço aos meus pais pelo amor incondicional, por terem sempre primado pela minha educação e por apoiarem minhas escolhas.

Agradeço à Deus e à Nossa Senhora Aparecida por me darem forças para prosseguir quando tudo parecia ruir e por abrirem tantas portas em meu caminho.

(7)

RESUMO

A espécie Panicum maximum, também conhecida como capim-colonião, é tida como uma das gramíneas mais importantes e difundidas do Brasil, entretanto, embora o país possua excelentes programas de melhoramento, nossas pastagens ainda são cultivadas predominantemente em sistemas de monocultura, o que vulnerabiliza a cadeia produtiva. Desta forma, estudos que visem a caracterização molecular da espécie são de suma importância para o sucesso e o aceleramento do lançamento de novos cultivares. O presente estudo visou a identificação de marcadores moleculares do tipo polimorfismo de nucleotídeo único (single nucleotide

polymorphism - SNP) relacionados a características de interesse para os programas

de melhoramento (fixação de nitrogênio, metabolismo do carbono, resistência e produção de lignocelulose) e a construção de um mapa genético-molecular para a espécie. Para tanto, foram identificados 86.312 SNPs e, a partir desse conjunto, 147 marcadores presentes em genes das vias de interesse foram selecionados e validados via espectrometria de massas. Estes marcadores, aliados a um conjunto de marcadores do tipo microssatélites (simple sequence repeat – SSR) previamente desenvolvidos para a espécie, foram utilizados para a construção de mapas genéticos utilizando os programas TetraploidMap e OneMap. Utilizando a metodologia do programa TetraploidMap, foi obtido um mapa genético para cada um dos parentais da população de mapeamento de Panicum maximum. O mapa do genitor S10 contou com 113 marcadores posicionados e cobriu uma distância de 808,4 cM, distribuídos em 10 grupos de ligação. O mapa do genitor Mombaça, foi construído a partir da ligação de 119 marcadores, cobrindo uma distância total de 897,1 cM e contando com 13 grupos de ligação. Com o auxílio do software OneMap, por sua vez, foi obtido um mapa com 122 marcadores moleculares posicionados, distribuídos em 32 grupos de ligação e 1.248 cM. Assim, pela primeira vez, foi possível a construção de um mapa genético para a espécie constituído de marcadores do tipo SNP e SSR.

(8)

ABSTRACT

Panicum maximum, also known as Guineagrass, is one of the most important

and widespread grasses of the country, nevertheless, although Brazil has excellent breeding programs, our pastures are still cultivated mainly in monoculture systems, which cause a vulnerability on the productive chain. Thus, studies that aim the molecular characterization of the species are of great importance to the success and acceleration of the launching of new cultivars. The present study aimed the identification of single nucleotide polymorphism (SNP) markers related to interest traits for the breeding programs (nitrogen fixation, carbon metabolism, resistance and lignocellulose production) and the construction of a molecular map for the species. For that, it was identified 86.312 SNPs and, from this, 147 markers present on the genes of the pathway of interest were selected and validated through mass spectrometry. These markers, together with a previous developed set of markers from the microsatellites type (simple sequence repeat – SSR), were used for the construction of genetic maps using TetraploidMap and OneMap computational programs. Using the methodology of the TetraploidMap, it was obtained a genetic map for each parental of the population. The S10 parent map had 113 markers and covered 808,4 cM, distributed in 10 linkage groups. The parent map for Mombaça, was built from a connection of 119 markers, covering 897,1 cM and 13 linkage groups. With the aid of the software OneMap, it was constructed a map with 122 molecular markers, distributed in 32 linkage groups and 1.248 cM. Therefore, for the first time, it was possible to build a genetic map for the species consisting of markers of the SNP and SSR types.

(9)

SUMÁRIO

1. INTRODUÇÃO ... 11

2. REVISÃO BIBLIOGRÁFICA ... 13

2.1 Pastagens no Brasil ... 13

2.2 Panicum maximum Jacq ... 14

2.2.1 A espécie e sua introdução no Brasil ... 14

2.2.2. Mecanismos de reprodução: reprodução sexual e apomítica ... 16

2.2.3 Diversidade e melhoramento genético da espécie ... 18

2.3 Marcadores moleculares ... 20

2.3.1. Histórico ... 20

2.3.2. Os marcadores SNPs ... 23

2.3.3 Genotipagem de SNPs ... 24

2.4 Mapas de ligação ... 25

2.5 Mapeamento genético em poliploides ... 29

3. OBJETIVOS... 31

3.1. Objetivo Geral ... 31

3.2. Objetivos Específicos ... 31

CAPÍTULO I ... 32

Construção de um mapa ligação para Panicum maximum a partir de marcadores moleculares SNP e SSR ... 33

CAPÍTULO II ... 51

Construção de um mapa de ligação para Panicum maximum utilizando o software OneMap ... 52

4. RESULTADOS COMPLEMENTARES ... 60

4.2.1 Seleção e genotipagem de marcadores moleculares SNPs e sua distribuição nas vias metabólicas de interesse ... 60

4.2.2 Análise de ploidia e dosagem alélica nos marcadores SNP ... 63

4.2.3 Análise dos locos SNPs com ploidia elevada ... 66

4.2.4 Informações adicionais aos mapas obtidos ... 68

4.2.4.1 Informações relacionadas aos mapas obtidos pelo TetraploidMap ... 68

4.2.4.2 Informações relacionadas ao mapa obtido pelo OneMap ... 73

5. RESUMO DOS RESULTADOS ... 75

6. CONCLUSÕES ... 76

7. PERSPECTIVAS ... 77

8. REFERÊNCIAS BIBLIOGRÁFICAS ... 78

(10)

PREFÁCIO

Esta tese inicia-se com uma Introdução geral sobre o assunto que será abordado no manuscrito e sua importância para a ciência e economia do Brasil, seguida de uma Revisão Bibliográfica referente aos aspectos teóricos mais relevantes do presente estudo, tais como a importância das pastagens no contexto nacional, a história e a biologia da espécie Panicum maximum, a diversidade dos marcadores moleculares e a relevância dos mapas de ligação no melhoramento vegetal.

Na sequência, serão apresentados os Objetivos deste trabalho e os

Resultados obtidos, sendo que tais resultados serão divididos em dois capítulos. O Capítulo I descreve, nos moldes de um artigo científico, a prospecção de SNPs para

a espécie, com base em transcriptoma de folhas da espécie, e a montagem de mapas de ligação pelo programa TetraploidMap. O Capítulo II, por sua vez, detalha os resultados de mapeamento obtidos pela utilização de uma segunda metodologia de mapeamento, o software OneMap.

Adicionalmente, serão apresentados os Resultados Complementares referentes aos dados obtidos nos Capítulos I e II. Para fechar a linha de raciocínio, será apresentado um Resumo dos Resultados, as Conclusões e as Perspectivas referentes ao trabalho desenvolvido. Por fim, será apresentada a Bibliografia utilizada na construção desta dissertação.

(11)

1. INTRODUÇÃO

O setor agropecuário é historicamente um dos setores mais importantes da economia brasileira, sendo responsável por aproximadamente um terço do produto interno bruto (PIB) do país. Neste cenário, destacam-se a produção de bioenergia, cuja riqueza gerada em um ano equivale ao PIB do Uruguai (UNICA, 2008), e a pecuária, por apresentar o maior rebanho comercial do mundo, com mais de 200 milhões de cabeças de gado (IBGE, 2016).

Estima-se que apenas 3% do rebanho brasileiro seja criado em sistema de confinamento, o que explicita a importância das pastagens para a sustentação da atividade. Considerando a intensificação dos sistemas de produção bovina e a forte tendência ao crescimento do mercado de sementes de forrageiras para pastagem, a espécie Panicum maximum, pelo seu potencial produtivo, qualidade e palatabilidade, é uma das gramíneas mais indicadas para suportar essa demanda (Jank et al., 1997).

Embora a disponibilidade de cultivares melhorados tenha sido responsável pela ampliação da área de cultivo da espécie nos últimos anos, nossas pastagens ainda são cultivadas predominantemente em sistemas de monocultura, ou seja, com predominância de um ou poucos cultivares, o que vulnerabiliza a cadeia produtiva. Somando-se a este cenário o fato de que cerca de 50% das nossas pastagens se encontram em estágio de degradação (Dias Filho, 2007), fica evidente a urgente necessidade do aumento dos programas de melhoramento genético da espécie.

A maior parte dos estudos com P. maximum limitam-se a compreender os aspectos fisiológicos da planta e características agronômicas de interesse. Raros são os trabalhos concentrados na caracterização genética da espécie (Jank et al., 2011). O único mapa de ligação construído para P. maximum data de 2005 e foi desenvolvido por pesquisadores japoneses (Ebina et al., 2005). Desde então, outro avanço significativo em termos genéticos para a espécie só foi dado em 2013, quando um conjunto de transcritos da espécie foi analisado (Toledo-Silva et al., 2013).

Assim, este trabalho teve como objetivo aumentar o conhecimento genético da espécie, visando fornecer ferramentas aos programas de melhoramento vigentes e futuros. Neste contexto, a proposta de identificação de marcadores moleculares do tipo SNP (single nucleotide polymorfism) foi um trabalho pioneiro para a espécie. A

(12)

construção de um novo mapa de ligação, enriquecido, impactará positivamente na velocidade de geração de dados e lançamento de novos cultivares, o que certamente contribuirá direta e indiretamente para a intensificação da produção de carne, leite, couro, lã e bioenergia no país.

(13)

2. REVISÃO BIBLIOGRÁFICA 2.1 Pastagens no Brasil

A formação vegetal genericamente denominada pastagem é a mais comum e a que ocupa a maior área de extensão na Terra, fato que se explica pela sua alta capacidade de adaptação a condições climáticas e nutricionais que vão da tundra ártica até os arredores do deserto do Sahara (Valle et al., 2009).

No Brasil, as áreas de pastagem ocupam mais de 160 milhões de hectares, o que, em conjunto com as áreas de pastos naturais, equivalem a 49% de toda a área agrícola do país (ABIEC, 2016). Esta vasta extensão é composta basicamente por espécies de leguminosas e gramíneas forrageiras, dentre as quais destacam-se

Panicum maximum (capim-colonião), Brachiaria spp., Pennisetum purpureum

(capim-elefante), Setaria sphacelata, Cynodon spp. (capim-estrela), Melinis

minutiflora (capim-gordura), Hyparrhenia rufa (capim-jaraguá), Andropogongayanus

spp., Cenchrus ciliaris (capim-buffel) e Paspalum spp. (capim-pensacola) (Jank et

al., 2005).

De modo geral, as forrageiras tem um papel importante na agricultura, melhorando a qualidade dos solos através da fixação do nitrogênio e do carbono, contribuindo para a retenção de água e estabilização do terreno, além de auxiliar no controle de pragas e doenças em sistemas de rotação de culturas e atuar no processo de fitorremediação (Salton et al., 2009; Severiano et al., 2010; Olatunji et

al., 2014). Entretanto, seus dois usos comerciais de maior destaque são a

alimentação animal e o mercado de produção de sementes.

Atualmente, o Brasil destaca-se como maior produtor, exportador e consumidor de sementes de forrageiras tropicais (Lazia, 2012), sendo que este comércio no país está estimado em US$ 240 milhões anuais (Andrade, 2001). Deste montante, cultivares de P. maximum são responsáveis por aproximadamente 30% das sementes comercializadas (Abrasem, 2004).

Já no campo da agropecuária, o Brasil se destaca como o maior produtor e exportador de carne bovina com cerca de 200 milhões de cabeças de gado (IBGE, 2016; Fonseca et al., 2010). Visto que esta produção animal é desenvolvida quase que exclusivamente em sistema extensivo, no qual 90% dos nutrientes exigidos

(14)

pelos animais são oriundos do pasto (Euclides et al., 2010), as forrageiras são essenciais para a manutenção do país em posição de destaque.

Embora a adaptabilidade das gramíneas aos nossos ecossistemas seja notável, o centro de origem de grande parte das espécies mais utilizadas comercialmente é o continente africano, no qual tais plantas evoluíram sob constante exposição a herbívoros e superpastejo, o que não ocorreu com as espécies nativas das Américas (Valle et al., 2009).

O fato dessas forrageiras serem originárias da África, resultou em uma escassez de trabalhos de coletas dirigidos. Para P. maximum, por exemplo, foram relatadas apenas duas coletas direcionadas: uma por um grupo francês em 1967 e 1969 (Combes & Pernès, 1970), e a segunda por pesquisadores japoneses de 1971 a 1973 (Hojito & Horibata, 1982).

Esta ausência de conhecimento sobre a diversidade genética das espécies contribui para que as pastagens cultivadas sejam perigosamente compostas por poucas variedades, o que torna toda a cadeia produtiva susceptível às pressões de pragas e doenças (Seiffert, 1984).

2.2 Panicum maximum Jacq.

2.2.1 A espécie e sua introdução no Brasil

O gênero Panicum L. é um dos maiores e mais importantes dentro da família Poaceae, pertencendo à subfamília Panicoideae e tribo Paniceae. Este gênero compreende cerca de 400 espécies de acordo com a circunscrição atual (Aliscioni et

al., 2003) e no Brasil temos relatada a ocorrência de 114 espécies (Guglieri et al.,

2004).

De forma geral, o gênero Panicum apresenta uma grande variabilidade genética e morfofisiológica, com espécies de diferentes hábitos de crescimento e exigências nutricionais e climáticas (Botrel et al., 1998), sendo encontradas em uma faixa latitudinal bastante ampla, que vai de 40º S até 50º N, e com variação em altitude que vai do nível do mar até próximo dos 2.000 m (Skerman & Riveros, 1992). A capacidade de utilizar eficientemente altas intensidades luminosas e apresentar rápido desenvolvimento permite a classificação do gênero Panicum como plantas pioneiras (Dias Filho, 1995).

Dentre elas, o capim Panicum maximum, também conhecido como capim- colonião, é tido como uma das gramíneas mais importantes e difundidas no país,

(15)

sendo também a forrageira propagada por semente mais produtiva do mercado nacional (Valle et al., 2009). A espécie pode ser descrita como uma cultura perene, formadora de touceiras com sistema radicular profundo, altura variável entre 60 a 200 cm e formadora de panículas (Skerman & Riveros, 1992; Molinari, 1952).

Figura 1. Ilustração e fotografias de Panicum maximum. A) Ilustração das estruturas de P. maximum (extraída de Hitchcock, 1971). B) Parte aérea da planta C) Híbridos de população utilizada no presente estudo.

Esta espécie é nativa da África Tropical, podendo ser encontradas formas nativas até nas áreas subtropicais da África do Sul, embora seja na região leste africana que esteja concentrada a maior diversidade da espécie (Jank, 1995; Bogdan, 1977; Herling et al., 2000). O capim-colonião foi introduzido nas Américas, provavelmente no século XVIII (Parsons, 1972). Após a sua introdução, esta forrageira se espalhou rapidamente pelas Ilhas do Caribe, América do Sul e Central e no sudeste dos Estados Unidos (Bogdan, 1977; Herling et al., 2000).

Em relação à introdução da planta no Brasil, a versão mais difundida e aceita é a teoria descrita por Chase (1944), segundo a qual a introdução ocorreu com a importação de escravos africanos em navios negreiros, nos quais este capim era utilizado como cama (Parsons, 1972).

Após um primeiro momento, a espécie foi difundida das regiões costeiras do Sul e Sudeste, para o interior (Centro-Oeste e Norte) do país pela ação combinada

(16)

dos ventos, animais e pela ação humana, e se disseminou amplamente devido à sua capacidade de aclimatação às diversas condições de clima e solo do país, chegando até mesmo a ser considerada nativa em algumas regiões (Bogdan, 1977; Herling et

al., 2000).

O capim-colonião foi amplamente difundido no país nos anos 50 e 60, por ser resistente à queimadas e apresentar alta produção de forragem (Vieira, 1994; Aronovich, 1995). Posteriormente, entre as décadas de 60 a 80, a espécie desempenhou um papel importante na expansão da fronteira agrícola para as regiões da Amazônia, além de apresentar bons resultados também na criação de equinos e ovinos (Jank, 2003). A partir de então, com o advento de novos bancos ativos de germoplasma (BAG), o uso da espécie se consolidou no mercado brasileiro como sinônimo de forragem de alta qualidade (Santos, 1997), e seu plantio foi expandido nos últimos vinte anos em decorrência do seu alto potencial produtivo (Da Silva, 1995), chegando, em 2008, a ocupar 20% de toda a área de pastagem cultivada no país (Martuscello et al., 2008).

2.2.2. Mecanismos de reprodução: reprodução sexual e apomítica

Panicum maximum também é um importante modelo de estudo para

mecanismos de reprodução, uma vez que esta espécie apresenta tanto reprodução sexual quanto reprodução por apomixia (Savidan, 2000; Hanna et al., 1973).

Embora a reprodução sexuada seja o mecanismo reprodutivo mais difundido entre as plantas superiores, muitas espécies apresentam propagação assexuada ou vegetativa, de forma facultativa ou obrigatória. Os mecanismos mais comuns de reprodução assexuada são por meio de rizomas, tubérculos, bulbos ou outros órgãos vegetativos (Bueno et al., 2002).

Um outro tipo de reprodução assexuada encontrado entre vegetais é a apomixia, modo pelo qual há formação do embrião sem que haja a união do núcleo espermático do pólen com a oosfera (Bashaw, 1980), ou seja, formação de semente sem que haja fecundação (Asker & Jerlin, 1992). Trata-se de um modo de reprodução encontrado em cerca de 15% das famílias das angiospermas, presente principalmente nas famílias das Gramineae (Poaceae), Asteraceae e Rosaceae.

A primeira referência sobre o fenômeno da apomixia data de 1841, quando uma planta feminina de Alchornea (Euphorbiaceae) cultivada isoladamente formou sementes. Poucas décadas após esta observação, Mendel executou “cruzamentos”

(17)

com o gênero Hieracium, com o intuito de angariar mais material de suporte às suas teorias, sem saber que estava diante de plantas apomíticas. A progênie deste cruzamento, entretanto, apresentou características de plantas oriundas de autofecundação, o que o levou a duvidar de seus dados com Pisum (Asker & Jerling, 1992; Nogler, 1994).

Segundo Asker & Jerling (1992), há dois tipos principais de apomixia, a esporofítica e a gametofítica, sendo que o tipo gametofítico pode ser subdividido em apospórico ou diplospórico.

Na apomixia gametofítica, cuja ocorrência é frequente, inclusive em gêneros de interesse econômico como Panicum, Brachiaria e Paspalum, há formação de um saco embrionário não reduzido (diploide) por diplosporia ou por aposporia. Na diplosporia, a célula-mãe do megásporo entra em mitose antes de completar a meiose, formando sacos embrionários com oito núcleos e morfologicamente semelhantes ao saco meiótico. Já na aposporia, a meiose é completada, mas os gametas se degeneram, e as células iniciais apospóricas (ou apósporos) entram em mitose, formando os sacos embrionários não reduzidos.

Já na apomixia esporofítica, relatada em algumas espécies de Citrus, não há formação de sacos embrionários e os embriões desenvolvem-se a partir das células dos envoltórios do óvulo (Nogler, 1984).

Em P. maximum, a reprodução apomítica é muito mais comum do que a reprodução sexual (diploides sexuais 2n = 2x = 16) e as plantas sexuadas foram primeiramente descritas para a espécie em uma pequena população da Tanzânia por Combes & Pernès (1970). Assim, a espécie é, em via de regra, uma autotetraploide (2n = 4x = 32) (Nakajima et al., 1979) embora sejam existentes exemplares diploides (2n = 16), triploides (2n = 24), pentaploides (2n = 40), hexaploides (2n = 48), octaploides (2n = 64), nonaploides (2n = 72) e também plantas com números cromossômicos irregulares (2n = 30, 31, 34, 36, 37, 38)

(Bogdan, 1977).

A descoberta da sexualidade no gênero, porém, foi de grande importância por gerar inúmeras possibilidades ao melhoramento genético da espécie (Savidan, 1981), visto que variedades assexuadas tendem a ser altamente heterozigotas e segregam amplamente quando se reproduzem por via sexual (Bueno et al., 2002). Desta forma, a relação entre sexualidade e apomixia pode ser utilizada por

(18)

programas de melhoramento como mecanismo para promoção da fixação do vigor do híbrido na população (Nogler, 1984).

Para tanto, é necessário a identificação de plantas sexuais como genitores maternais, que podem ser cruzadas com genótipos apomíticos, doadores de pólen. Entretanto, é mais comum a ocorrência natural de genótipos sexuais diploides. Para contornar tal característica, é necessária a duplicação cromossômica antes ou após o cruzamento (Dall’Agnol & Schifino-Wittmann, 2005). A técnica mais comumente empregada para realizar esta duplicação é a teraploidização dos genitores via uso de colchicina, recurso que vem sendo utilizado em P. maximum desde 1971, ainda na África (Savidan, 1980).

2.2.3 Diversidade e melhoramento genético da espécie

Os primeiros exemplares de Panicum maximum introduzidos no Brasil, de origem africana, deram origem à primeira cultivar, o chamado Colonião (Jank, 1995), que foi responsável por grande parte da engorda de bovinos no Brasil até a criação de BAGs, a partir de acessos coletados no centro de origem da espécie e genótipos oriundos de programas de melhoramento genético.

O primeiro passo para a introdução de novos cultivares no país foi dado na década de 70, com a introdução dos ecótipos K 187B, em 1976, e T58, em 1978. Estes materiais foram provenientes de coletas realizadas por pesquisadores do ORSTOM (Institut Français de Recherche Scientifique pour le Développment en

Coopération) no Quênia e na Tanzânia no final dos anos 60 (Combes & Pernès,

1970).

A partir de então, foram diversas as entradas de genótipos provenientes de grupos de pesquisa estrangeiros, como é o caso do cultivar africano Aruana e os cultivares Gatton e Hamil (Jank, 1995). O grande marco que revolucionaria a pesquisa de novos cultivares se deu em 1982, quando o ORSTOM, disponibilizou parte da sua coleção para a EMBRAPA (Empresa Brasileira de Pesquisa Agropecuária). O material disponibilizado contava com 426 ecótipos apomíticos assexuados e 417 plantas sexuais, sendo considerada uma coleção com boa representatividade da diversidade da espécie (Jank et al., 1990; Savidan et al., 1989).

Dentre os materiais lançados por programas de melhoramento desde então, estão o Tobiatã (Jank, 1995), o Massai (Brâncio et al., 2002) e o híbrido Atlas,

(19)

resultante do cruzamento dos cultivares IAC- Tobiatã e K- 67. Além do Aruana, Tanzânia-1 (originário do cultivar T58) e Mombaça, lançados, respectivamente, em 1989, 1990 e 1993.

Dentre estes, o Mombaça e o Tobiatã são cultivares de grande porte e folhas largas, seguidas pelo Colonião e Tanzânia-1 em termos de tamanho da planta. Já o cv. Massai se distingue do grupo por apresentar porte baixo e folhas mais finas, mas é uma planta que apresenta grande velocidade de estabelecimento e de rebrota (Savidan et al., 1990).

Em relação aos outros cultivares de Panicum, o capim Massai apresenta, além das diferenças morfológicas citadas, maior tolerância à acidez e reduzida fertilidade dos solos, apresentando, em contrapartida, valor nutritivo inferior (Valentim et al., 2001; Brâncio et al., 2003). Já a espécie Panicum maximum cv. Mombaça, lançada pelo Centro Nacional de Pesquisa de Gado de Corte da EMBRAPA, é altamente produtivo, com elevada capacidade de manutenção foliar durante o ano e, principalmente, durante a estação de seca, além de apresentar excelente resposta à adubação (Muller, 2000).

Embora o número de BAGs disponíveis no mercado nacional para o plantio tenha aumentado nas últimas décadas, as pastagens brasileiras ainda podem ser caracterizadas como grandes monoculturas clonais, geneticamente pobres e vulneráveis à patógenos, o que torna necessário o investimento em programas de melhoramento genético da espécie (Valle et al., 2009; Verzignassi & Fernandes, 2001).

O melhoramento de forrageiras tem como objetivos centrais o aumento da produtividade, o aumento da resistência aos patógenos, a produção de sementes, e a maior adaptação aos diferentes estresses. Além disso, como essas plantas são utilizadas para alimentação animal direta, é interessante que os programas visem também a palatabilidade e os valores nutricionais indiretos, visando conseguir maior eficiência na sua transformação em produção animal (Valle et al., 2008; Valle et al., 2009).

Os poucos programas de melhoramento de forrageiras são, tradicionalmente, realizados por melhoramento genético clássico, no qual há seleção de genótipos através de uma série de cruzamentos, o que leva aproximadamente uma década. O sucesso desse tipo de abordagem depende de vários fatores, dentre os quais a escolha adequada dos genitores, o desenho de experimentos com bom alcance

(20)

estatístico e a escolha correta dos caracteres e épocas de avaliação (Moose & Mumm, 2008).

Estas limitações impostas pelo processo de melhoramento tradicional podem ser reduzidas por meio do uso de técnicas avançadas em biotecnologia, através das quais os genes de interesse podem ser mapeados nos genitores, o que reduz o tempo envolvido no processo de melhoramento e aumenta a chance de sucesso dos cruzamentos (Meuwissen et al., 2001; Valle et al., 2009). Dentre tais técnicas, os programas de melhoramento têm adotado o uso de marcadores moleculares para o melhoramento de diversas culturas.

2.3 Marcadores moleculares 2.3.1. Histórico

Os marcadores moleculares são regiões existentes no genoma que podem atuar como sinalizadores na busca por regiões de interesse, representando assim, uma forma indireta de avaliar e comparar diferentes genótipos (Laborda, 2011). Os marcadores moleculares utilizados no melhoramento genético são freqüentemente elementos genéticos que, por co-segregarem com os genes de interesse, permitem o estudo comparativo de genótipos e de suas progênies (Sakiyama, 1993). Estes marcadores podem ser baseados em características morfológicas, fisiológicas, bioquímicas ou moleculares (Sakijama, 1993). Até meados da década de 60, as análises genéticas eram realizadas com base na utilização de marcadores morfológicos de fácil identificação visual e, predominantemente, controlados por um único gene (Ferreira & Grattapaglia, 1998).

A revolução neste campo de estudo se iniciou com o descobrimento de marcadores isoenzimáticos a partir do ano de 1959 (Market & Moller, 1959), o que permitiu um rápido aumento do número de marcadores genéticos descritos e estendeu a aplicação da técnica para praticamente todas as espécies de plantas (Ferreira & Grattapaglia, 1998). Embora este tipo de marcador tenha propiciado uma grande expansão do conhecimento, é normalmente encontrado um baixo número de variantes nas proteínas, limitando o desenvolvimento de mapas genéticos a partir desta abordagem.

Foi apenas em meados dos anos 80, com a expansão dos métodos de análise de DNA, que a descoberta e uso de marcadores se tornou recorrente. Então, em menos de quarenta anos, nossa compreensão sobre os marcadores foi

(21)

drasticamente expandida, o que ampliou e modificou nossa visão sobre muitos fenômenos naturais.

Embora tenham sido descobertos uma grande gama de novos marcadores, podemos classificá-los em três categorias conceituais: variantes proteicas (aloenzimas), polimorfismos na sequência do DNA (como RFLP e AFLPs) e variações em repetições do DNA, como minissatélites e microssatélites (SSR) (Schlötterer, 2004).

Já Gupta (1999), também classifica os marcadores em três classes, mas adota como parâmetro o método utilizado para a sua detecção: marcadores baseados na hibridização do DNA, como os polimorfismos de comprimento de fragmentos de restrição do DNA (RFLP), os baseados na reação em cadeia da polimerase (PCR), tais como AFLPs e microssatélites e os baseados na variação entre sequências e na utilização de chips de DNA, como, por exemplo, os marcadores SNP (Single Nucleotide Polymorphism).

Maheswaran (2004), por sua vez, sintetiza a história dos marcadores moleculares na Tabela 1 e a classifica em três etapas: marcadores de primeira geração, marcadores de segunda e marcadores de nova geração.

(22)

Tabela 1. Evolução dos marcadores moleculares (Maheswaran, 2004).

Primeira Geração e Marcadores Moleculares

Ano Acronimo Nomenclatura

1974 RFLP Restriction Fragment Length Polymorphism 1985 NTR variable Number Tandem Repeats 1986 ASO Allele Specific Oligonucleotides 1988 AS - PCR Allele Specific Polimerase Chain Reaction 1988 OP Oligonucleotide Polymorphism 1989 SSCP Single Stranded Conformational Polymorphism

1989 STS Sequence Tagged Site

Segunda Geração e Marcadores Moleculares

Ano Acrônimo Nomenclatura

1990 RAPD Randomly Amplified Polymorphic DNA 1990 AP - PCR Arbitrarily Primed Polymerase Chain Reaction 1990 STMS Sequence Tagged Micro Satellite Sites 1991 RLGS Restriction Landmark Genome Scanning 1992 CAPS Cleaved Amplified Polymorphic Sequence 1992 DOP - PCR Degenerate Oligonucleotide Primer - PCR

1992 SSR Simple Sequence Repeats

1993 MAAP Multiple Arbitrary Amplicon Profiling 1993 SCAR Sequence Characterized Amplified Region

Nova Geração e Marcadores Moleculares

Ano Acronimo Nomenclatura

1994 ISSR Inter Simple Sequence Repeats

1994 SAMPL Selective Amplification Of Micro Satellite Polymorphic Loci 1994 SNP Single Nucleotide Polymorphisms

1995 AFLP (SRFA) Amplified Fragment Length Polymorphism (Selective Restriction Fragment Amplification) 1995 ASAP Allele Specific Associated Primers 1996 CFLP Cleavase Fragment Length Polymorphism 1996 ISTR Inverse Sequence-tagged Repeats 1997 DAMD-PCR Directed Amplification Of Mini Satellite DNA-PCR 1997 S - SAP Sequence-specific Amplified Polymorphism 1998 RBIP Retrotransposon Based Insertional Polymorphism 1999 IRAP Inter-retrotransposon Amplified Polymorphism 1999 REMAP Retrotransposon-Microsatellite Amplified Polymorphism 1999 MSAP Methylation Sensitive Amplification Polymorphism 2000 MITE Miniature Inverted-repeat Transposable Element 2000 TE - AFLP Three Endonuclease AFLP

2001 IMP Inter-MITE Polymorphisms 2001 SRAP Sequence-related Amplified Polymorphism

Com os avanços na caracterização de novos marcadores e das técnicas em biologia molecular, que possibilitaram o avanço das pesquisas em larga escala, os marcadores têm, cada vez mais, sido incorporados em programas de melhoramento como geradores de informações valiosas aos melhoristas genéticos, tais como a identificação e discriminação de genótipos, avaliação da variabilidade genética de

(23)

uma população, e a aceleração do lançamento de novos genótipos no mercado (Borém & Caixeta, 2004).

2.3.2. Os marcadores SNPs

Os SNPs são variações em um único nucleotídeo nas sequências de bases em fragmentos homólogos do DNA, sendo esta a mais freqüentes forma de polimorfismo encontrada no genoma (Kwok, 1996; Kruglyak, 1997).

Para que tais variações sejam consideradas um SNP, convencionou-se que, para um dado loco, o alelo menos frequente na população tenha uma abundância superior a 1%. Essa frequência mínima reduz a chance de que polimorfismos verdadeiros sejam confundidos com mutações raras e pontuais (Wang et al., 1998).

Teoricamente, os SNPs podem ser polimorfismos bialélicos, trialélicos, ou tetralélicos, entretanto são encontrados predominantemente na forma bialélica (Brookes, 1999). Isso é justificado pela predominância da ocorrência de transições em comparação com as transversões, em função da alta taxa de desaminação espontânea da 5–metilcitosina para timina em dinucleotídeos C e G (Vignal et al., 2002; Coulondre et al., 1978).

Os SNPs ocorrem com alta freqüência em todos os organismos, sendo relatadas taxas em genomas vegetais de 1 SNP a cada 100-300 pares de base (Gupta et al., 2001). Devido à sua alta disseminação pelo genoma, os SNPs são uma rica fonte de variabilidade e possivelmente são responsáveis pela maioria das contribuições do genótipo na variação do fenótipo (Botstein & Risch, 2003).

Esses polimorfismos ocorrem tanto nas regiões gênicas codificadoras (éxons) quanto nas não codificadoras (íntrons), embora seja muito mais comum a ocorrência fora das regiões gênicas (Rafalski, 2002). Os SNPs que ocorrem em éxons podem ser categorizados em duas classes: sinônimos, quando não levam à alteração da seqüência de aminoácidos, e não-sinônimos, quando o polimorfismo altera o aminoácido.

Os SNPs podem atuar, de forma direta ou indireta, alterando a conformação de proteínas (Chamary et al., 2006; Gupta & Lee, 2008), a ligação de fatores de transcrição às regiões regulatórias, influenciando no processo de splicing alternativo, alterando o nível de expressão gênica (Kudla, 2009) e a estrutura do RNA e sua estabilidade, refletindo, portanto, na concentração final da proteína. Além disso,

(24)

SNPs nas proximidades de genes codificantes de miRNA podem alterar o processamento e a função de pequenos RNAs (Sun et al., 2009).

Nas últimas décadas, com o intenso desenvolvimento tecnológico, vem sendo possível gerar um grande número de sequências de ácidos nucleicos, o que possibilitou o desenvolvimento de metodologias para identificar SNPs utilizando ferramentas de bioinformática (Wang et al., 2005). Além disso, várias metodologias vêm sendo exploradas no melhoramento genético assistido por marcadores SNP, como análises de PCR (reação em cadeia da polimerase) em tempo real utilizando TaqMan, microarranjos de DNA, cromatografia líquida de alta pressão desnaturante, espectrometria de massas e técnicas que empregam sequenciamento de nova geração (Blondal et al., 2003; Langaee & Ronaghi, 2005; Nielsen et al., 2011).

2.3.3 Genotipagem de SNPs

Os marcadores SNPs são altamente informativos, pois possuem natureza codominante em espécies poliploides, ou seja, não só determinam a existência do polimorfismo em um determinado loco como também são capazes de determinar a abundância das variações alélicas desse loco em diferentes genótipos e dentro do mesmo genótipo. Assim, a genotipagem de loco SNPs deve envolver não apenas a identificação do polimorfismo, mas também a estimação do número de cópias alélicas do mesmo.

A quantificação desta dosagem é possível quando se utiliza genotipagem do SNP de forma quantitativa, como as tecnologias empregadas pelo Illumina Golden GateTM (Fan et al., 2003) e pelo Sequenom iPLEX MassARRAY® (Oeth et al., 2007, 2009), que geram dois sinais para cada locos SNP.

A plataforma MassARRAY (Sequenon Inc.), baseada em espectrometria MALDI-TOF (matrix-assisted laser desorption/ionization time-of-flight), é amplamente reconhecida pela sua capacidade de realizar análises apuradas nas genotipagens por marcadores SNPs (Gabriel et al., 2009).

O ensaio é composto por uma reação inicial de PCR que amplifica o DNA nas adjacências do local de ocorrência do polimorfismo. A seguir, o produto desta reação é tratado para a eliminação dos dNTPs livres remanescentes e submetido a uma nova PCR, conhecida como reação iPLEX, que visa amplificar apenas uma pequena região imediatamente antecessora ao sítio do SNP. Além disso, na reação iPLEX, são utilizados iniciadores com massa modificada pela inserção de um nucleotídeo

(25)

marcado. O produto desta reação pode ser, então, submetido à espectrometria de massas baseada no tempo de voo (MALDI-TOF) através da transferência da mesma para um chip específico com uma matriz especial.

Esta matriz é excitada por um laser, processo conhecido como dessorção, e a transferência de energia promove a vaporização da amostra com o DNA, que passa então para o tubo de voo do equipamento e é acelerada até um detector, sendo o tempo que a partícula de DNA leva para percorrer o caminho é chamado tempo de voo. Como os iniciadores desenhados para os polimorfismos apresentarão massas diferentes, e em razão disso, apresentarão um tempo de voo diferente, a distinção dos alelos é facilmente identificada baseando-se na diferença de peso molecular (Gabriel et al., 2009).

Desta forma, uma vez que os iniciadores são desenhados para SNPs bialélicos, o equipamento gerará dois sinais, cada um correspondendo à intensidade registrada por um dos possíveis alelos. Então, o valor esperado de cada intensidade do sinal é proporcional à dosagem presente no alelo (Oeth et al., 2009; Akuhunov et

al., 2009). A possibilidade desta diferenciação faz dos SNPs excelentes marcadores

para estudos em espécies poliploides, fazendo com que essa técnica torne possível observar diversas classes genotípicas, diferentemente dos marcadores SSRs (Mollinari, 2012).

Entretanto, a função “SNP genotype call” do software TYPER, distribuído juntamente com a plataforma Sequenom iPLEX MassARRAY, não pode ser aplicada a poliploides, limitando consideravelmente o uso dos dados gerados na genotipagem de SNPs destas espécies. Felizmente, tal restrição pode ser contornada aplicando aos dados uso dos modelos gráficos Bayesianos (Serang et al. 2012).

Serang et al. (2012) converteram estes modelos complexos em uma plataforma online denominada SuperMASSA, a qual pode ser livremente utilizada para inferir o genótipo para os locos SNPs dos genitores e de cada indivíduo em uma população F1 (dentre outras possibilidades). Assim, o modelo possibilita estimar o nível de ploida e a dosagem alélica de SNPs, fornecendo novas possibilidades de estudo para organismos autopoliploides complexos (Garcia et al., 2013).

2.4 Mapas de ligação

Os mapas de ligação, também chamados de mapas genéticos, podem ser definidos como representações lineares da posição de genes e/ou marcadores

(26)

moleculares ordenados em grupos de ligação, de modo que, para um mapa densamente saturado, o número de grupos de ligação seja igual ao número de cromossomos da espécie.

Os mapas genéticos possibilitam a localização de genes, estudos de associação de genes a características quantitativas (QTLs - quantitative trait locus), cobertura e análise completa de genomas, além de informações a respeito da arquitetura genética, ligações gênicas e auxiliam no entendimento da história evolutiva das espécies (Garcia et al., 2006).

A pedra fundamental para o conceito de mapa de ligação proveio da descoberta de Thomas Hunt Morgan e equipe, em 1910, quando observaram, em

Drosophila melanogaster, proporções fenotípicas não coincidentes com as propostas

pela segunda lei de Mendel, a lei da segregação independente dos genes. A partir dessa observação, Morgan sugeriu que a distorção das proporções poderia indicar o agrupamento de alguns genes e a ocasional permutação de alguns genes entre os cromossomos homólogos (Coelho & Silva, 2005).

Poucos anos depois, em 1913, Sturtevant, foi o responsável pela criação do primeiro mapa de ligação, posicionando e ordenando seis genes de D. melanogaster e sugerindo o uso da porcentagem de recombinantes como indicador da distância linear dos genes para a construção de mapas. Tal distância é dada usualmente em centimorgans (cM), em homenagem a T.H. Morgan.

Devido aos poucos recursos na descoberta de marcadores moleculares da primeira metade do século XX, os primeiros mapas genéticos, desenvolvidos para culturas como milho, ervilha e tomate, foram baseados em marcadores morfológicos e citológicos, o que tornava impossível a obtenção de mapas com uma boa cobertura do genoma. Entretanto, a partir da década de 80, com a explosão de novas metodologias baseadas em DNA, os mapas puderam se tornar amplamente saturados e virtualmente ilimitados (Carneiro & Vieira, 2002; Ferreira & Grattapaglia, 1998).

Atualmente, mapas genéticos estão sendo desenvolvidos para centenas de espécies com uma resolução cada vez maior, devido à grande disponibilidade de marcadores altamente polimórficos a baixos custos. A evolução das técnicas de detecção e genotipagem de marcadores, aliada a procedimentos estatísticos cada vez mais complexos e específicos, tem permitido a construção de mapas de ligação

(27)

para a maioria das espécies vegetais de interesse agronômico (Slate, 2005; Carneiro & Vieira, 2002).

No contexto do melhoramento de plantas, mapas de ligação detalhados são extremamente úteis ao possibilitarem a cobertura e análise do genoma, a decomposição de características genéticas complexas nos seus componentes mendelianos, o mapeamento comparativo entre espécies, estudos de análises filogenéticas, a predição de descendências em cruzamentos experimentais, a identificação de marcas relacionadas com regiões-chave do genoma para a expressão de características quantitativas (QTL) e a quantificação do efeito destas regiões na característica estudada e a canalização de toda esta informação para o uso em programas de melhoramento, além de serem o primeiro passo para a clonagem posicional de genes responsáveis por características importantes (Tanksley, 1993; Semagn et al., 2006; Ferreira & Grattapaglia, 1998).

Entretanto, para um mapa genético poder ser utilizado para os fins listados acima, ele precisa ser robusto e bem construído. Para tanto, deve seguir critérios como simplicidade, robustez, transferência, e relação custo-eficácia (Lorieux et al., 2000). Desta forma, a metodologia de construção de um mapa genético integra uma série de procedimentos e análises, que incluem (Carneiro & Vieira, 2002; Wu et al., 2007; Mollinari, 2009):

1) Escolha de genitores contrastantes: o delineamento dos cruzamentos deve ser realizado de modo a maximizar a probabilidade de detectar os polimorfismos. Para tanto, é necessário avaliar a distância genética que separa os genitores, já que quanto mais próximos geneticamente, menos frequente será a obtenção de polimorfismos (Paterson et al., 1991). Deste modo, torna-se essencial a utilização de populações segregantes com o máximo possível de desequilíbrio de ligação (provocado, basicamente, pela ligação física entre os locos), o qual é, normalmente, bastante elevado em populações de cruzamentos controlados (Tanksley, 1993; Falconer & Mackay, 1996; Lynch & Walsh, 1998). Populações advindas de diferentes tipos de cruzamentos podem ser utilizadas para a construção de mapas de ligação, tais como as obtidas por retrocruzamentos, populações F2, linhagens puras recombinantes, linhagens de duplo-haplóides e, no caso de espécies com fecundação cruzada, cruzamentos entre indivíduos heterozigotos (Collard et al., 2005; Ferreira & Grattapaglia 1998; Coelho, 2000);

(28)

2) Desenvolvimento de uma população segregante: a escolha da população mais apropriada ao mapeamento está relacionada com o tipo de marcador a ser analisado, a finalidade do mapa e as características da espécie (Tanksley, 1993). O tamanho da população de mapeamento também é um fator relevante, embora não haja um padrão de ordem numérica estabelecido (Bhering et al., 2008; Yarnes et al., 2013). Mapas desenvolvidos com um pequeno número de indivíduos fornecem grupos de ligação fragmentados e incompletos (Ferreira et al., 2006) e populações muito grandes podem encarecer a análise desnecessariamente. Na prática, são utilizadas populações com tamanho variando de 50 a 250 indivíduos (Rocha et al., 2003).

3) Escolha do(s) tipo(s) de marcador(es) a ser(em) utilizados na genotipagem da população: a escolha do tipo de marcador a ser utilizado deve levar em consideração as vantagens e desvantagens dos marcadores, a infraestrutura laboratorial, o tempo necessário para a realização das avaliações na população e as ferramentas bioinformáticas disponíveis para a avaliação dos marcadores. Além disso, é importante também considerar o padrão de segregação dos marcadores (codominante ou dominante) (Liu, 1998). Sempre que possível, a construção dos chamados mapas genéticos integrados, que utilizam de diferentes tipos de marcadores moleculares, é a abordagem mais interessante, já que permite aumentar a saturação do mapa de ligação (Maliepaard et al., 1997).

4) Verificação do padrão de segregação de cada loco marcador: um padrão mendeliano típico é esperado na segregação dos marcadores, porém a ausência deste padrão é muito usual e é chamado de desequilíbrio de ligação (Coelho & Silva 2002). Tal distorção é importante e pode, inclusive, aumentar o poder estatístico dos mapeamentos de QTLs com efeitos aditivos e diminuir o poder em mapeamento de QTLs com efeitos dominantes (Xu, 2008). O método mais importante e comum de mapeamento utiliza a freqüência de recombinação para determinar a distância relativa em centimorgans, entre dois marcadores ligados (Bhering et al., 2009). O princípio do mapeamento genético é a observação de que a freqüência de quiasmas entre dois genes ligados é proporcional à distância física entre ambos. Com base nessa frequência é realizada uma análise para distribuição independente entre os locos segregantes para identificar pares de características ligadas. (Ritter et

(29)

5) Análise da ligação entre os marcadores para a formação dos grupos de ligação: uma vez determinada a freqüência de recombinação, os marcadores podem ser agrupados dentro dos chamados grupos de ligação, que, basicamente, são grupos cujos locos estão localizados no mesmo cromossomo (Collard et al., 2005). A ordem linear dos marcadores dentro de cada grupo é deduzida da distância genética relativa a cada um dos marcadores analisados separadamente.

6) Determinação da ordem e da distância dos marcadores dentro desses grupos de ligação: para análise da ligação e ordenamento das marcas nos grupos de ligação são requeridos pacotes computacionais otimizados, que levam em conta o tipo de marcador utilizado e a ploidia da espécie estudada. Para tanto, diversos programas computacionais, baseados em diferentes metodologias de análise, foram desenvolvidos, como “Mapmaker” (Lander et al., 1987), “JoinMap” (Van Ooijein & Voorrips, 2001), “OneMap” (Margarido et al., 2007) e “TetraploidMap” (Hackett et al., 2007).

Tendo em vista todas as variáveis inerentes a cada uma das etapas do processo, cada fator pode afetar a eficiência do processo de mapeamento e, como consequencia, é comum a obtenção de diferentes mapas gerados para populações diferentes da mesma espécie (Liu, 1998; Paterson et al., 2000).

2.5 Mapeamento genético em poliploides

A teoria e as metodologias necessárias para obtenção de mapas genéticos em espécies diploides são bem estabelecidas e otimizadas, o que não ocorre para as espécies poliploides (Leach et al., 2010; Ripol et al., 1999). Tais espécies, que correspondem a cerca de 75% dos vegetais, possuem complexos padrões de segregação e alta diversidade de genótipos (Henry, 2008).

A construção de mapas genéticos para espécies poliploides é mais desafiadora do que em diploides devido: (1) os modelos estatísticos e os modelos computacionais necessários são mais complexos, visto que devem levar em consideração os diferentes níveis de ploidia, (2) uma ampla variedade de genótipos é esperada na população segregante, (3) há vários modos de formação de gametas e pareamento randômico dos múltiplos cromossomos homólogos, (4) as diferentes frequências dos gametas constituem um desafio adicional, devido à segregação dos alelos com diferentes níveis de dosagem (Wu et al., 1992).

(30)

Visto que nenhum modelo foi desenvolvido até o momento afim de atender a esta realidade, uma abordagem comum é o uso de marcadores em dose única (MDU), como proposto por Wu et al. (1992). Deste modo, independente de qual seja a dose de um marcador em um loco, somente se analisa a presença ou a ausência dos alelos de cada marcador. Portanto, leva-se em conta apenas os marcadores em dose única segregando na proporção 1:1, o que na progênie de um cruzamento biparental, no qual o marcador está presente em um genitor e ausente em outro (Wu

et al.,1992).

Como consequência da desconsideração das informações sobre a dosagem alélica, os marcadores codominantes passam a ter comportamento similar aos marcadores dominantes, caso em que se aplica os SSRs e aos SNPs, levando a perda informações (Da Silva et al., 1995).

Vários mapas foram feitos utilizando a estratégia do pseudo-testcross e marcadores em dose única segregantes na proporção 1:1 (Daugrois et al., 1996; Ming et al., 2001; AlJanabi et al., 2007). Garcia et al.(2006), baseando-se na metodologia de Wu et al. (2002) propuseram a utilização dos marcadores segregantes na proporção 3:1, possibilitando a construção de mapas genéticos integrados em cana-de-açúcar (Oliveira et al., 2007). Essa forma trouxe vantagem pois permitiu aumentar a saturação do mapa de ligação e estender a caracterização da variação polimórfica em todo o genoma (Garcia et al., 2006).

Apesar do avanço implementado pelo emprego da metodologia de MDU na análise para o mapeamento de cana-de-açúcar, por exemplo, o uso somente de marcadores com segregações 1:1 e 3:1 torna o conhecimento genético da espécie muito limitado. É conhecido que o uso de somente essas segregações é menos informativo que outros tipos, como por exemplo, o uso de marcadores que segregam nas proporções 1:2:1 ou 1:1:1:1, no caso de espécies diploides (Wu et al., 2002).

(31)

3. OBJETIVOS

3.1. Objetivo Geral

 Contribuir para o conhecimento molecular da espécie Panicum maximum, auxiliando assim os programas de melhoramento genético da espécie.

3.2. Objetivos Específicos

 A partir do trancriptoma analisado por Toledo-Silva e colaboradores (2013), identificar genes relacionados as vias do metabolismo no nitrogênio, fixação de carbono, resistência a infecções e via de formação da lignocelulose;

 Identificar e genotipar marcadores moleculares do tipo SNP para os genes selecionados;

 Construir um novo mapa de ligação para a espécie, em conjunto com informações dos marcadores SSRs já genotipados anteriormente pelo nosso grupo de pesquisa.

(32)
(33)

Construção de um mapa de ligação para Panicum maximum a partir de marcadores moleculares SNPs e SSRs

Camila Fornezari Rabelloa, Guilherme Toledo-Silvad, Rodrigo Rampazob, Liana Jankc,

Augusto Garciab, Anete Pereira Souzaa.

aCentro de Biologia Molecular e Engenharia Genética (CBMEG), Departamento de Genética e Biologia

Molecular, Universidade Estadual de Campinas (UNICAMP), Campinas, São Paulo, Brasil

bDepartamento de Genética, Escola Superior de Agricultura Luiz de Queiroz (ESALQ), Universidade de São

Paulo (USP), Piracicaba, São Paulo, Brasil

cEmbrapa Gado de Corte, Campo Grande, Mato Grosso do Sul, Brasil

dDepartamento de Bioquímica, Universidade Federal de Santa Catarina (UFSC), Florianópolis, Santa Catarina,

Brasil

Resumo

Os programas de melhoramento genético de espécies de importância comercial têm evoluído muito pelo emprego de marcadores moleculares e mapas de ligação. A espécie Panicum maximum é uma das mais importantes gramíneas forrageiras do Brasil, sendo cultivada em uma área superior a 34 milhões de hectares. Entretanto, dado o escasso número de trabalho voltados para a elucidação dos seus aspectos genético-moleculares, um único e limitado mapa de ligação está disponível para a espécie. Assim, o objetivo deste trabalho foi a construção de um novo mapa de ligação para P. maximum, integrando marcadores do tipo SSR e SNP, através de um software específico para espécies tetraploides, o TetraploiMap. Como resultado, foram identificados 86.312 SNPs e foram construídos mapas de ligação para dois genótipos (S10 e Mombaça). O mapa do genitor Mombaça contou com 119 marcadores e cobriu 897,1 cM, enquanto o mapa do genitor S10 possui 113 marcadores, distribuídos em 808,4 cM. Estes resultados ampliam o conhecimento genético da espécie e servirão como base para estudos que visem o melhoramento genético de P. maximum assistido por marcadores moleculares.

(34)

Introdução

A espécie Panicum maximum, popularmente conhecida como capim-colonião, é uma das gramíneas mais importantes e populares do Brasil, ocupando aproximadamente 20% da área de pastagens cultivadas do país (Martuscello et al., 2008), o que corresponde a 34 milhões de hectares. A espécie é ainda a responsável por 30% do mercado nacional de sementes de plantas forrageiras (Abrasem, 2004).

O sucesso de P. maximum decorre de suas características de adaptabilidade e performance, tais como elevadas taxas de produtividade, baixa exigência em relação à fertilidade do solo, resistência à secas e queimadas e alto desempenho sob sistema intensivo de produção. Adicionalmente, a espécie oferece alta palatabilidade, boa digestibilidade e elevadas taxas nutricionais ao gado, além de poder ser oferecida a espécies de equinos e ovinos (Jank et al., 1997; Jank, 2003; Aronovich, 1995, Martuscello et al., 2006).

Embora sua importância para o agronegócio brasileiro seja notável, a espécie ainda permanece pouco estudada, possuindo, consequentemente, poucos cultivares lançados comercialmente. Isso contribui, dentre outros fatores, para que as pastagens sejam cultivadas em grandes áreas de monocultura clonais, geneticamente pobres e vulneráveis à patógenos e pragas, o que torna evidente a necessidade do investimento em programas de melhoramento genético da espécie (Valle et al., 2009; Verzignassi & Fernandes, 2001).

Atualmente, o único programa de melhoramento de P. maximum do país é conduzido pela Embrapa Gado de Corte (Campo Grande, Mato Grosso do Sul), que conta com uma coleção de acessos apomíticos e sexuais introduzida no Brasil na década de 80, por meio de um acordo com o Institut Français de Recherche Scientifique pour le Développement en Coopération (ORSTOM). A partir daí, trabalhou-se na caracterização dos acessos e iniciou-se o melhoramento genético da espécie, possibilitando o lançamento dos cultivares como o P. maximum cv. Tanzania-1 (1990), P. maximum cv. Mombaça (1993) e o P. maximum cv. Massai (2001) (Jank et al., 2005).

Para o avanço da assertividade do programa e aceleração do lançamento de novos cultivares, faz-se necessário o entendimento de características genéticas e moleculares da espécie. O único mapa molecular disponível de P. maximum foi

(35)

publicado em 2005 por Ebina e colaboradores. Tal mapa, possui apenas marcadores de caráter dominante e foi baseado em uma única cultivar (único parental de um cruzamento biparental) lançada pelo programa de melhoramento genético japonês (Ebina et al., 2005).

No contexto do melhoramento de plantas, mapas de ligação são muito úteis ao possibilitarem a cobertura e análise do genoma, a decomposição de características genéticas complexas nos seus componentes mendelianos, o mapeamento comparativo entre espécies, estudos filogenéticos, a predição de descendências em cruzamentos e a identificação de marcas relacionadas com regiões-chave do genoma para a expressão de características quantitativas (QTL –

Quantitavive Trait Locus) (Tanksley, 1993; Semagn et al., 2006; Ferreira &

Grattapaglia 1998).

O mapeamento em espécies poliploides, como é o caso de P. maximum (2n = 4x = 32), é mais complexo e desafiador, uma vez que a dosagem e frequência alélica dos locos marcadores precisam ser estimadas e há mais possibilidades na formação dos gametas com, consequentemente, maior variabilidade genética entre a população de indivíduos. A estes pontos soma-se o fato de existirem um número limitado de ferramentas de mapeamento e análise de dados para espécies poliploides (Wu et al., 1992).

Este trabalho teve como objetivo a construção do primeiro mapa molecular da espécie com informações de marcadores moleculares do tipo SSR e SNP, utilizando, para tanto, uma metodologia desenvolvida especificamente para espécies tetraploides, implementado no software TetraploiMap. O mapa gerado nesta pesquisa poderá ser empregado em estudos genéticos sobre o comportamento genômico em híbridos, fornecendo informações que auxiliem o programa de melhoramento genético da espécie, além de poder ser utilizado como base para estudos futuros.

Materiais e métodos

População de mapeamento e material vegetal

A população de mapeamento utilizada é composta por uma progênie de 137 indivíduos (irmãos completos de F1), gerada a partir do cruzamento entre o genitor

(36)

sexual S10 e a cultivar apomítica Mombaça, ambos tetraploides (2n = 4x = 32) e dotados de características de produção contrastantes. Para a viabilização do cruzamento, o genótipo sexual foi anteriormente tetraploidizado através do uso de colchicina. A progênie gerada a partir do cruzamento é bastante heterogênea e alguns indivíduos foram utilizados como parentais em outros cruzamentos, o que faz desta população uma importante fonte de variabilidade genética para o programa de melhoramento genético da espécie.

Para cada indivíduo da população e seus parentais, foram coletadas de 3 a 4 folhas, as quais foram liofilizadas e processadas com auxílio de um moinho laboratorial (IKA Works Inc., USA). O DNA foi extraído segundo protocolo otimizado para a espécie (Sousa, 2010) e a integridade deste material foi avaliada através de gel de agarose 1%. O DNA de cada indivíduo foi quantificado utilizando o aparelho NanoDrop 8000 UV-Vis Spectrophotometer (Thermo Scientifc, USA), e teve sua qualidade estimada a partir das razões 260/280 nm e 230/260 nm.

Mapeamento do transcriptoma e prospecção de SNPs

A partir do transcriptoma de folhas publicado para a espécie (Toledo-Silva et

al., 2013), foram selecionadas as leituras (reads) provenientes dos genótipos

Mombaça e S10. Foi então realizado o mapeamento destas leituras nos transcritos de P. maximum através do programa CLC Genomics Workbench 4.9 (Qiagen, DEU). Dentre os parâmetros de mapeamento utilizados, destacam-se a Lenght fraction = 0,9 e Similarity = 0,9.

A busca de SNPs foi realizada pelo emprego da ferramenta SNP detection disponível no mesmo programa, utilizando os parâmetros: Maximum expected

variations = 4, Minimum coverage = 20, Variants = 2 (considerando apenas SNPs

bialélicos) e Minimum variant frequency = 35%.

A re-anotação dos transcritos oriundos do mapeamento do transcriptoma foi realizada através da ferramenta Blast2GO (Conesa et al., 2005), utilizando o algoritmo blastx contra o banco de proteínas não reduntantes (nr) do SwissProt, com filtro de e-value em 10-6 e no mínimo 30% de pct_hit_len_aligned (porcentagem alinhada do contig frente ao gene homologo encontrado). A partir das informações obtidas, foram filtrados manualmente os contigs referentes a genes relacionados às vias do metabolismo no nitrogênio, fixação de carbono, resistência biótica/abiótica e via de formação da lignocelulose. Foram ainda selecionados um máximo de quatro

(37)

contigs pertencentes ao mesmo gene predito e um limite de três SNPs pertencentes

ao mesmo contig.

Uma vez que não há genoma para P. maximum, a filtragem de SNPs em possíveis regiões intronicas foi realizado via BLAST com dados de Panicum

virgatum no banco Phytozome v9.1 (http://www.phytozome.net). Foram selecionados

os marcadores presentes em regiões com: (I) aproximadamente 150 pares de bases (pb) em cada flanco, (II) que não apresentassem outro SNP a, pelo menos, 50 pb de distância, (III) ausência de regiões intrônicas a uma distância mínima de 50 pb do SNP (IV) ausência de íntrons com tamanho superior a 100 pb nas porções flanqueadoras de ~300 pb.

Mapeamento genético utilizando o software TetraploidMap

Para a construção do mapa de ligação, foram utilizados os marcadores SNPs identificados e marcadores do tipo SSR desenvolvidos previamente (Toledo-Silva et

al., 2013; Souza et al., 2011a; Souza et al., 2011b).

A genotipagem dos marcadores SSR foi realizada por coloração por nitrato de prata (Creste et al., 2001) ou em genotipador Li-Cor 4300 DNA Analyzer (Schuelke, 2000) por Toledo-Silva (2013). A genotipagem dos SNPs foi realizada via espectrometria de massas na plataforma Sequenom iPLEX MassARRAY® (Sequenom Inc., San Diego, California, USA).

O mapa de ligação foi construído utilizando-se o programa TetraploidMap (Hackett et al., 2007), que permite a construção de mapas a partir de marcadores dominantes e codominantes, em populações de irmãos-completos provenientes de cruzamento de espécies autotetraploides utilizando marcas SSR e AFLP.

Para os marcadores tipo SSR, a segregação foi verificada através da ferramenta findgeno, disponível no TetraploidMap. Apenas as marcas com segregação 1:1, 3:1 e 5:1 foram utilizadas. Já para os marcadores tipo SNP, foi necessária a conversão das marcas para marcadores dominantes AFLP. A ploidia e dosagem alélica dos SNPs foi estimada pelo software SuperMASSA (Serang et al., 2012) e apenas SNPs com segregação 1:1 e 3:1 foram utilizados no mapeamento. O mapa genético final foi desenhado pelo programa MapChart 2.3 (Voorrips, 2002).

(38)

Resultados e discussão

Identificação de marcadores moleculares SNP para Panicum maximum

Através do mapeamento do transcriptoma de folhas dos parentais S10 e Mombaça, foi possível a identificação de 86.312 SNPs. Este número é superior ao obtido em outros trabalhos que visaram o mapeamento de marcadores moleculares do tipo SNP tomando como base dados de transcriptoma, como trigo e grão de bico, para os quais foram obtidos 36 mil SNPs (Schnable et al., 2009; Jhanwar, et al., 2012), e eucalipto, pimenta Capsicum annuum e Artemisia tridentata, com números entre 20 e 25 mil SNPs (Novaes et al., 2008; Ashrafi et al., 2012; Bajgain et al., 2011).

O número, porém, foi inferior ao obtido para P. maximum por Toledo-Silva e colaboradores (2013), quando foram mapeados 106.951 SNPs para os genótipos S10 e Mombaça. A diferença do número de marcadores prospectados, da ordem de 19,30%, reflete o emprego de diferentes programas computacionais e o uso de parâmetros estringentes no presente estudo. A importância da escolha dos parâmetros de busca é corroborada por outros dados, como os de Trick e colaboradores (2009), para os quais houve redução de 45,22% do número de SNPs mapeados pela alteração de um único parâmetro (Minimum coverage, de 4 para 8

reads).

Dentre os SNPs identificados neste estudo, 64,17% são classificados como transições e 35,83% são transversões (Tabela 1). Esta porcentagem significativamente maior de transições é observada para diferentes espécies e com diferentes metodologias para busca de SNPs (Garg et al., 1999; Picoult-Newberg et

al., 1999; Deutsch et al., 2001; Toledo-Silva et al., 2013) e provavelmente se deve

ao fato deste tipo de fenômeno ocasionar mais frequentemente mutações sinônimas a nível de proteína, o que torna evolutivamente mais provável sua fixação nas populações.

A profundidade mínima (mínima cobertura) estabelecida como critério de busca dos marcadores foi de 20 reads por contig, e esta foi a profundidade com o maior número de SNPs mapeados, totalizando 2.177 SNPs, o que representa 2,5% do total de dados. A profundidade máxima alcançada foi de 274.960 reads/ contig.

Referências

Documentos relacionados

O relatório encontra-se dividido em 4 secções: a introdução, onde são explicitados os objetivos gerais; o corpo de trabalho, que consiste numa descrição sumária das

psicológicos, sociais e ambientais. Assim podemos observar que é de extrema importância a QV e a PS andarem juntas, pois não adianta ter uma meta de promoção de saúde se

Os principais resultados obtidos pelo modelo numérico foram que a implementação da metodologia baseada no risco (Cenário C) resultou numa descida média por disjuntor, de 38% no

Afinal de contas, tanto uma quanto a outra são ferramentas essenciais para a compreensão da realidade, além de ser o principal motivo da re- pulsa pela matemática, uma vez que é

Desde então, vários autores deram o seu contributo, uns convergindo outros divergindo, contudo, apesar de mais de 20 anos de discurso académico e de gestão sobre o

Roma: Multigrafica Editrice, 1985 (prefácio do primeiro volume).. isto é, através da palavra, o homem transmite os pensamentos, enquanto que, através da arte, ele transmite

Ratificar a assinatura do “Instrumento Particular de Escritura da Segunda Emissão de Debêntures Simples, Não Conversíveis em Ações, da Espécie Subordinada, em

The aims of this work were to isolate and characterize a protease from the visceral mass of the mussel Mytella charruana (deemed MycP, M. charruana protease) and to