• Nenhum resultado encontrado

DISSERTAÇÃO_Inclusão de efeitos de dominância no modelo gblup multivariado para predição de híbridos simples de milho

N/A
N/A
Protected

Academic year: 2021

Share "DISSERTAÇÃO_Inclusão de efeitos de dominância no modelo gblup multivariado para predição de híbridos simples de milho"

Copied!
91
0
0

Texto

(1)JHONATHAN PEDROSO RIGAL DOS SANTOS. INCLUSÃO DE EFEITOS DE DOMINÂNCIA NO MODELO GBLUP MULTIVARIADO PARA PREDIÇÃO DE HÍBRIDOS SIMPLES DE MILHO. LAVRAS-MG 2015.

(2) JHONATHAN PEDROSO RIGAL DOS SANTOS. INCLUSÃO DE EFEITOS DE DOMINÂNCIA NO MODELO GBLUP MULTIVARIADO PARA PREDIÇÃO DE HÍBRIDOS SIMPLES DE MILHO. Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Genética e Melhoramento de Plantas, para obtenção do título de Mestre.. Orientador Dr. Renzo Garcia Von Pinho Coorientador Dr. Marcio Balestre. LAVRAS- MG 2015.

(3) Ficha catalográfica elaborada pelo Sistema de Geração de Ficha Catalográfica da Biblioteca Universitária da UFLA, com dados informados pelo (a) próprio (a) autor (a)..

(4) JHONATHAN PEDROSO RIGAL DOS SANTOS. INCLUSÃO DE EFEITOS DE DOMINÂNCIA NO MODELO GBLUP MULTIVARIADO PARA PREDIÇÃO DE HÍBRIDOS SIMPLES DE MILHO. Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Genética e Melhoramento de Plantas, para obtenção do título de Mestre.. APROVADA em 01 de abril de 2015. Dr. Renzo Garcia Von Pinho. UFLA. Dr. Marcio Balestre. UFLA. Dr. Roberto Fritsche-Neto. ESALQ. Dr. Renzo Garcia Von Pinho Orientador Dr. Marcio Balestre Coorientador LAVRAS - MG 2015.

(5) AGRADECIMENTOS A Deus, pela saúde, disposição e paciência concedida para a realização deste trabalho. Aos meus Pais, Maria Elenir Rigal dos Santos e Álvaro Cesar dos Santos pelo dom da vida, amor incondicional e todo apoio. Ao meu irmão Gustavo Eugênio Rigal dos Santos pela amizade, incentivo e apoio. A minha namorada Thaise Caroline Moço Zerbinati por todo carinho, paciência e amor. A Universidade Federal de Lavras, ao programa de pós-graduação em Genética e Melhoramento de Plantas e a FAPEMIG pela oportunidade e financiamento à execução desse trabalho. Ao professor Renzo Garcia Von Pinho, pela orientação, concelhos, paciência, amizade e ensinamentos transmitidos ao longo do curso. Ao professor Marcio Balestre, pela amizade, orientação, dedicação, paciência e longas horas de escritório dedicadas ao meu crescimento profissional, técnico e pessoal. Aos meus orientadores de ontem e hoje Gilberto Pozar, Justino Mario, Adriana Gonela, Maria Celeste Gonçalves Vidigal e Pedro Soares Vidigal Filho, pelos ensinamentos transmitidos. Aos amigos Luiz Paulo Miranda Pires e Renato Coelho de Castro Vasconcellos pelas contribuições acadêmicas e pessoais. A todos que contribuíram direta ou indiretamente para a realização desse trabalho..

(6) RESUMO GERAL Novas propostas de modelos e aplicações de processos de predição com informações de marcadores moleculares podem contribuir na redução de gastos financeiros e identificações de genótipos superiores em programas de melhoramento de milho. Estudos avaliando modelos GBLUP com a inclusão de efeitos de dominância não foram realizados no contexto univariado e multivariado na análise de dados dessa cultura. Assim, neste estudo foi conduzido um procedimento de construção de híbridos simples com dados fenotípicos e de marcadores moleculares reais de 4.091 linhagens de milho do banco de dados público Panzea. Nesse processo, obteve-se 400 híbridos simples que foram analisados com o modelo GBLUP univariado e multivariado, considerando apenas efeitos aditivos, e em outra configuração com a inclusão de efeitos de dominância. Utilizou-se cenários de herdabilidade histórica de cinco caracteres e em outras condições de arquitetura genética para investigação comparativa entre os modelos, avaliando a capacidade preditiva e a de decomposição de componentes de variância. Diferenças expressivas não foram detectas entre os modelos multivariados e univariados. As principais justificativas para essa pequena discrepância entre os modelos são as correlações de magnitude baixa à moderada entre os caracteres estudados e as moderadas herdabilidades observadas. Essa condição não favorece as vantagens da análise multivariada. A inclusão de efeitos de dominância nos modelos mostrou ser uma estratégia eficiente para melhorar a capacidade preditiva e a qualidade da decomposição dos componentes de variância. Palavras-chave: Modelo GBLUP. Análise Univariada. Análise Multivariada. Efeitos não aditivos..

(7) GENERAL ABSTRACT New proposals of models and application of prediction processes using molecular markers information can contribute to the reduction of financial expenses and identification of superior genotypes in maize breeding programs. Studies evaluating GBLUP model with the inclusion of dominance effects were not made in the univariate and multivariate context in the analysis of maize data. In this study, it was conducted a construction procedure of simple hybrids with phenotypic data and real molecular markers of 4091 maize lines of the public database Panzea. In this process, 400 simple hybrids were obtained and then analyzed using univariate and multivariate GBLUP model considering only additive effects, and in another configuration with the inclusion of dominance effects. Historical heritability scenario of five maize characters and in other conditions of genetic architecture for comparative research among the models, assessing their predictive capacity and decomposition of variance components. Significant differences were not detected between the multivariate and univariate models. The main reason for this small discrepancy between the models is the low to moderate magnitude correlations among the characters studied and the moderate heritability observed. This condition does not favor the advantages of multivariate analysis. The inclusion of dominance effects in models is an efficient strategy to improve the predictive capacity and the quality of the variance components decomposition. Keywords: GBLUP Model. Univariate analysis. Multivariate Analysis. Non-additive effects..

(8) LISTA DE TABELAS. Tabela 1. Tabela 2 Tabela 3 Tabela 4. Tabela 5. Tabela S1 Tabela S2 Tabela S3. Tabela S4. Tabela S5. SEGUNDA PARTE - ARTIGO Contagens de coincidência de QTLs identificados no processo de ordenamento dos 100 maiores efeitos aditivos ( a ) e dos 100 maiores efeitos de dominância ( d ) em relação aos efeitos genéticos totais obtidos na análise com o modelo BayesB entre os cinco caracteres.............................................. Grupos heteróticos de linhagens definidas por análise de componentes principais............................................................. Herdabilidades médias históricas de cinco caracteres de milho......................................................................................... Valores de correlações genéticas paramétricas (P) e estimados entre cinco caracteres pelos modelos GBLUP-UVA, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD em herdabilidades históricas........................................................... Componentes de variância genética estimados e paramétricos e soma do quadrado dos erros de predição dos efeitos genéticos estimados pelos modelos GBLUP-UV-A, GBLUPUV-AD, GBLUP-MV-A e GBLUP-MV-AD em herdabilidades históricas........................................................... TABELAS SUPLEMENTARES Correlações aditiva entre caracteres estimadas pelo modelo GBLUP-MV-A......................................................................... Correlações aditiva, dominante e genética total entre caracteres estimada pelo GBLUP-MV-AD.............................. Componentes de variância paramétricos dos valores genéticos aditivos, dominância e genético total dos híbridos simples...................................................................................... Componentes de variância genética e soma do quadrado dos erros de predição dos efeitos genéticos estimados pelo modelo GBLUP-UV-A, GBLUP-UV-AD em faixas de herdabilidade (em parêntesis) fixas (em parêntesis) em 0,3; 0,5 e 0,7 para os cinco caracteres, respectivamente.................. Componentes de variância genética e soma do quadrado dos erros de predição dos efeitos genéticos estimados pelo modelo GBLUP-MV-A, GBLUP-MV-AD em faixas de herdabilidade (em parêntesis) fixas em 0,3; 0,5 e 0,7 para os cinco caracteres, respectivamente, e por ordem determinada por sorteio.................................................................................. 47 48 50. 56. 58. 80 81. 82. 83. 84.

(9) Figura 1. Figura 2. Figura 3. Figura S1. LISTA DE FIGURAS Agrupamento genético de 4.091 linhagens utilizando análise de componentes principais (PCA). As linhagens são pertencentes ao banco de germoplasma do departamento de agricultura dos Estados Unidos (USDA). O eixo X representa o primeiro componente principal (pc1) e o Y ao segundo componente principal (pc2). As cores foram atribuídas de acordo com o grupo genético, em que azul equivale as 19 linhagens próximas da B73 e vermelho as 19 linhagens próximas da Mo17.................................................... Correlações entre efeitos genéticos paramétricos e estimados dos caracteres ajustados em herdabilidades históricas. Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) correlações entre os efeitos genéticos totais paramétricos e estimados; (B) correlações entre os efeitos aditivos paramétricos e estimados; (C) correlações entre os efeitos de dominância paramétricos e estimados................................................................................... Coeficientes de herdabilidade dos caracteres ajustados em herdabilidade histórica. Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) Coeficientes de herdabilidade no sentido amplo; (B) Coeficientes de herdabilidade aditiva; (C) Coeficientes de herdabilidade de dominância.................................................... FIGURAS SUPLEMENTARES Correlações entre efeitos genéticos paramétricos e estimados dos caracteres ajustados em herdabilidade fixa de 0,3.Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) correlações entre os efeitos genéticos totais paramétricos e estimados; (B) correlações entre os efeitos aditivos paramétricos e estimados; (C) correlações entre os efeitos de dominância paramétricos e estimados.................................................................................... 54. 60. 61. 86.

(10) Figura S2. Figura S3. Figura S4. Figura S5. Correlações entre efeitos genéticos paramétricos e estimados dos caracteres ajustados em herdabilidade fixa de 0,5.Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) correlações entre os efeitos genéticos totais paramétricos e estimados; (B) correlações entre os efeitos aditivos paramétricos e estimados; (C) correlações entre os efeitos de dominância paramétricos e estimados................................................................................... Correlações entre efeitos genéticos paramétricos e estimados dos caracteres ajustados em herdabilidade fixa de 0,7.Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) correlações entre os efeitos genéticos totais paramétricos e estimados; (B) correlações entre os efeitos aditivos paramétricos e estimados; (C) correlações entre os efeitos de dominância paramétricos e estimados................................................................................... Correlações entre efeitos genéticos paramétricos e estimados dos caracteres ajustados em herdabilidade sorteada. Modelos utilizados: GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) correlações entre os efeitos genéticos totais paramétricos e estimados; (B) correlações entre os efeitos aditivos paramétricos e estimados; (C) correlações entre os efeitos de dominância paramétricos e estimados...................................... Coeficientes de herdabilidade dos caracteres ajustados em herdabilidadefixade0,3.Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) Coeficientes de herdabilidade no sentido amplo; (B) Coeficientes de herdabilidade aditiva; (C) Coeficientes de herdabilidade de dominância..................................................... 87. 88. 89. 89.

(11) Figura S6. Figura S7. Figura S8. Coeficientes de herdabilidade dos caracteres ajustados em herdabilidadefixade0,5.Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) Coeficientes de herdabilidade no sentido amplo; (B) Coeficientes de herdabilidade aditiva; (C) Coeficientes de herdabilidade de dominância.................................................... 90 Coeficientes de herdabilidade dos caracteres ajustados em herdabilidadefixade0,7.Modelos utilizados: GBLUP-UV-A, GBLUP-UV-AD, GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A)Coeficientes de herdabilidadeno sentido amplo; (B) Coeficientes de herdabilidade aditiva; (C) Coeficientes de herdabilidade de dominância.................................................... 91 Coeficientes de herdabilidade dos caracteres ajustados em herdabilidade sorteada. Modelos utilizados: GBLUP-MV-A e GBLUP-MV-AD. Caracteres analisados: Altura de planta (AP), altura de inserção de espiga (AIE), comprimento de espiga (CE), número de fileiras por espiga (NFE) e peso de grãos (PG).(A) Coeficientes de herdabilidade no sentido amplo; (B) Coeficientes de herdabilidade aditiva; (C) Coeficientes de herdabilidade de dominância........................... 91.

(12) SUMÁRIO. 1 2 2.1 2.2 2.3 2.4 2.5 3. PRIMEIRA PARTE......................................................................... INTRODUÇÃO GERAL................................................................. REFERENCIAL TEÓRICO........................................................... Predição do desempenho de híbridos de milho baseada em covariâncias entre parentes e distâncias genéticas........................ Modelos lineares mistos.................................................................... Modelos lineares mistos em processos de análise genética............ Predição do desempenho de híbridos simples de milho utilizando modelos lineares mistos com informação de parentesco....................... Análise genética de componentes de produção de milho.............. CONCLUSÕES................................................................................. REFERÊNCIAS................................................................................ SEGUNDA PARTE – ARTIGO...................................................... INCLUSÃO DE EFEITOS DE DOMINÂNCIA NO MODELO GBLUP MULTIVARIADO PARA PREDIÇÃO DE HÍBRIDOS SIMPLES DE MILHO ............................................................................... INTRODUÇÃO................................................................................. MATERIAL E MÉTODOS............................................................. RESULTADOS.................................................................................. DISCUSSÕES.................................................................................... CONCLUSÕES.................................................................................. REFERÊNCIAS................................................................................ INFORMAÇÕES SUPLEMENTARES.......................................... TEXTO SUPLEMENTAR............................................................... TABELAS SUPLEMENTARES...................................................... FIGURAS SUPLEMENTARES....................................................... 13 13 15 15 17 19 22 26 30 31 38. 38 41 44 54 63 70 71 75 78 80 86.

(13) 13. PRIMEIRA PARTE 1 INTRODUÇÃO GERAL Entre as dificuldades dos programas de melhoramento de milho, uma das principais é o teste de todos os híbridos simples sintetizados por todas as combinações de linhagens derivadas de populações em processo de melhoramento. Isso decorre do elevado custo financeiro e as dificuldades operacionais em condições de ensaios com várias repetições e instalados em número excessivo de locais. Nesse contexto, a disponibilidade de técnicas acuradas de predição das melhores combinações, entre linhagens, pode ser um ponto-chave para a maximização do aproveitamento de recursos financeiros em programas de melhoramento. Recentemente, um grande interesse científico foi despertado com a proposta de novos modelos de regressão, aplicados em procedimentos de seleção e predição de forma integrada em um processo conhecido popularmente por seleção genômica (MEUWISSEN; HAYES; GODDARD, 2001). A principal premissa desse método é cobrir amplamente o genoma com marcadores moleculares, procurando encontrar relações entre os marcadores e variantes fenotípicos de uma população, sendo ou não possível esses marcadores serem pertencentes à regiões genômicas causais (DE LOS CAMPOS et al., 2013; STRANGER; STAHL; RAJ, 2011). Essa técnica permite a predição de grupo de híbridos simples não testados, devido ao parentesco genético capturado por marcadores moleculares, com outro grupo avaliado fenotipicamente em condição de campo. Vários trabalhos relatam a melhoria na capacidade preditiva utilizando modelos que consideram informações de caracteres secundários de alta herdabilidade, em conjunto com o caráter-alvo (BALESTRE et al., 2013; HENDERSON; QUAAS, 1976; PIEPHO et al., 2008). Esses modelos são.

(14) 14. conhecidos como múltiplos caracteres ou multivariados. Praticamente não há relatos sobre uso dessa classe de modelo em trabalhos utilizando espécies cultiváveis anuais (PIEPHO et al., 2008). Relatos de utilização de modelos multivariados que consideram relacionamento de parentesco estimados por marcadores moleculares são menos ainda frequentes (CALUS; VEERKAMP, 2011; JIA; JANNINK, 2012; MALOSETTI et al., 2007). Assim, os objetivos com este trabalho são: (i) elaborar a construção de híbridos simples de milho com informações fenotípicas e genotípicas reais de linhagens de milho, de modo que seja conservada a arquitetura genética de caracteres; (ii) propor a inclusão do efeito de dominância no modelo GBLUP multivariado (GBLUP-MV-AD); (iii) comparar o modelo GBLUP-MV-AD com os modelos GBLUP multivariado aditivo (GBLUP-MV-A); GBLUP univariado aditivo (GBLUP-UV-A); e GBLUP univariado com a inclusão do efeito de dominância (GBLUP-UV-AD)..

(15) 15. 2 REFERENCIAL TEÓRICO 2.1 Predição do desempenho de híbridos de milho baseada em covariâncias entre parentes e distâncias genéticas Entre as dificuldades dos programas de melhoramento, uma das principais é obter todas as combinações entre linhagens elites e testar todos os descendentes na forma de híbridos simples. Isso decorre do elevado custo financeiro e das dificuldades operacionais em testes situados em vários locais. Por exemplo, a combinação entre 50 linhagens de um grupo heterótico e 50 linhagens de outro grupo heterótico permite a obtenção de 1225 combinações de híbridos simples. Assim, a disponibilidade de técnicas acuradas de predição das melhores combinações, entre linhagens, é um ponto-chave quando almeja-se maximizar o aproveitamento de recursos financeiros em programas de melhoramento. Um dos trabalhos pioneiros na predição de desempenho de híbridos de milho foi o realizado por Jenkins (1934). Nesse trabalho foram propostos quatro métodos de predição de desempenho de híbridos duplos, utilizando dados de desempenho de híbridos simples.. O método mais efetivo foi chamado de. método B. Nesse método a predição era baseada no desempenho médio de quatro híbridos simples não parentais. Nessa época, a metodologia teve grande aceitação e reduziu significativamente a quantidade de híbridos duplos testados, o que proporcionou marcante aumento na eficiência dos programas de melhoramento da época (HALLAUER et al., 2010). Após alguns anos, Ebenhart (1964) dessecou os métodos propostos por Jenkins (1934) e sugeriu uma nova metodologia de predição de híbridos duplos, utilizando valores médios de produtividade de híbridos simples e triplos. Nesse novo método proposto, era considerado efeito de epistasia dominante-dominante, ao contrário dos métodos sugeridos por Jenkins (1934), que assumiam ausência de efeitos de epistasia. Cockerham (1967) também propôs uma nova metodologia de.

(16) 16. predição de híbridos duplos. Nesta proposta, foi considerado tanto efeitos genéticos quanto ambientais, e também foram utilizados valores de desempenho de híbridos simples nas predições de híbridos duplos. Com o predomínio de vendas de híbridos simples no mercado de sementes após a década de 60, os trabalhos relacionados à predição de híbridos duplos se desalinharam com o interesse comercial dos programas de melhoramento. A descoberta do DNA e a intensificação de estudos com marcadores moleculares despertaram grande interesse de desenvolvimento de novos processos de predição. Vários estudos foram desenvolvidos explorando as informações de marcadores moleculares em procedimentos preditivos de desempenho de híbridos simples de milho(BALESTRE et al., 2008; LANZA et al., 1997; LEE et al., 1989). A principal justificativa no uso das marcas nas predições de híbridos simples foi oriunda da própria teoria da genética quantitativa, em que híbridos com locos com maior dominância direcional positiva, obtidos de linhagens com maior divergência. genética apresentam maior heterose. (FALCONER;. MACKAY, 1996). Portanto, acreditava-se que a divergência genética, estimada por marcadores moleculares na forma de distâncias genéticas, poderia predizer as melhores combinações entre as linhagens na síntese dos melhores híbridos simples (LEE et al., 1989). Entretanto, predições baseadas apenas nas distâncias genéticas não foram eficientes para prever o desempenho de híbridos (MELCHINGER, 1999). De acordo com Reif, Hahne Melchinger (2012) as principais razões foram: (1) pequena associação entre a heterozigosidade dos locos - que controlam caracteres quantitativos - e a heterozigosidade estimada pelas marcas; (2) pobre associação entre heterozigosidade e a heterose; (3) epistasia..

(17) 17. 2.2 Modelos lineares mistos Após a década de 50, várias contribuições científicas foram realizadas por C. R. Henderson ao melhoramento de animais e plantas. A principal contribuição deste pesquisador foi a percepção de que seria conveniente na construção de modelos genéticos tanto a inclusão de efeitos fixos, fatores ambientais ( β ), quanto aleatórios, valores genéticos ( g ), amostrados de uma distribuição de probabilidade (HENDERSON, 1948). Neste trabalho foi proposta pela primeira vez a metodologia BLUP – Best Linear Unbiased Predictors (HILL, 2014). Após essa proposta inicial, Henderson e outros pesquisadores aprimoraram essa abordagem. Uma obra descritiva deste método de análise pode ser encontrada em Henderson (1984). Porém, para melhor compreensão dessa metodologia, uma descrição geral do BLUP será realizada na sequência. O BLUP é um procedimento estatístico que prediz efeitos aleatórios em modelos mistos (PIEPHO et al., 2008). Os modelos mistos são modelos estatísticos que apresentam efeitos fixos e aleatórios (SEARLE et al., 2006). De acordo com Henderson (1975), um modelo misto com várias aplicações genéticas, pode ser descrito matricialmente por:. y = Xβ + Zg + e. (1). em que y é um vetor de observações n × 1, X é uma matriz de incidência dos efeitos fixos n × p, β é vetor de efeitos fixos, Z é uma matriz de incidência dos efeitos aleatórios n × q, g e e são vetores de efeitos aleatórios genéticos e ambientais. As distribuições dos efeitos aleatórios são consideradas como. g ~ MVN (0, G) e e ~ MVN (0, R) ..

(18) 18. As observações são assumidas y ~ MVN ( Xβ ,V ) . A matriz V é estruturada por: Var ( y ) = ZGZ´+ R = V. (2). em que: G é uma matriz de variância-covariância genética, e R é uma matriz de variância-covariância residual. Os efeitos fixos são estimados via BLUE – Best Linear Unbiased Estimators – e os aleatórios, como supracitado, pelo BLUP. As letras das siglas BLUP e BLUE significam: (1) Best: o quadrado médio do erro E ( gˆ − g ) é 2. minimizado, quando dentro da classe dos estimadores não viesados; (2) Linear: gˆ são funções lineares de y em situações de componentes de variância dados como conhecidos; (3) Unbiased: gˆ é um estimador não viesado de g , ou seja, E ( gˆ − g ) = 0 (THOMPSON, 2008). De acordo com Henderson (1975) o melhor preditor linear (BLP) de. k ′ β * + m′g , quando β , G , e R são conhecidos, é dado por: k ′β + m ′GZ'V −1 ( y − Xβ ). (3). em que V −1 é a inversa da matriz de variância-covariância fenotípica ( V ) .. Entretanto, no modelo (1) β é desconhecido. Uma alternativa é utilizar o βˆ estimado pelo método dos quadrados mínimos generalizados: XV −1 Xβˆ = X ′V −1 y. (4).

(19) 19. Com o novo βˆ obtém-se o BLUP de k ′ β * + m′g :. (. k ′ βˆ + m ′GZ'V −1 y − X βˆ. Como. ). (5). tem uma dimensão muito grande para ser invertida diretamente,. é atrativo computacionalmente utilizar equações de modelos mistos (EMM) descritas em Henderson (1975), que são dadas por:.  X'R −1 X  −1  Z'R X. X'R −1 Z.   βˆ   X'R −1 y    =  Z ′R −1 Z + G −1   gˆ   Z'R −1 y . (6). A resolução da EMM é obtida pela inversão direta do sistema de equações (6). Os componentes de variância podem ser estimados via resoluções numéricas, com os componentes das matrizes de variância-covariância R e G obtidos por métodos matemáticos iterativos, que maximizam de forma direta a função de máxima verossimilhança residual ou REML (Residual Maximum Likelihood) de Paterson e Thompson (1971). Por exemplo, o método simplex proposto por Nelder e Mead (1965). Outros algoritmos que podem ser utilizados para a estimação dos componentes de variância são: (i) Expectation-Maximization (EM) (DEMPSTER, 1977); (ii) Average Information (AI) (GILMOUR et al., 1995) e (iii) Newton/Raphson (MRODE; THOMPSON, 2005).. 2.3 Modelos lineares mistos em processos de análise genética A possibilidade de utilização de informações geradas por pedigrees complexos em programas de melhoramento ou por marcadores moleculares são características importantes do método BLUP. As informações de parentesco são recuperadas devido às correlações entre os indivíduos de uma população original, relacionados pelo pedigree, até a uma população de referência, da qual os componentes de variância são inerentes (PIEPHO et al., 2008). Várias.

(20) 20. estimativas úteis em programas de melhoramento, como por exemplo: o coeficiente de herdabilidade, o ganho esperado com a seleção e a correlação entre caracteres, são funções dos componentes de variância (RAMALHO, 2012). As informações de parentesco são recuperadas utilizando a matriz de parentesco genético (estruturada pelo parentesco médio de Malecot) ou genômico (estimado por marcadores moleculares). Cada elemento da matriz G pode ser definido como resultado de uma “contribuição gamética” de parentais ao longo das gerações, estruturada pela informação de parentesco. A variância genética total teoricamente é dada por:. σˆ g2 = σˆ u2 + σˆ δ2 + σˆ uu2 + …. (10). De acordo com Henderson (1985), o valor genotípico ( gˆ ) e a matriz podem ser decompostos em: gˆ = uˆ + δˆ + uu + …. (10). i. G = ∑Gi = Gu + Gδ +Guu + … = Aσˆ u2 + Dσˆδ2 + A # Aσˆ uu2 + …. (11). 1. O valor σˆ u2 é a variância genética aditiva, que corresponde à variância dos valores genéticos ou breeding values ( uˆ ), σˆ δ2 é a variância genética de dominância, à variância relacionada aos desvios de dominância ( δˆ ), σˆ uu2 é a variância genética aditiva-aditiva epistática, à variância relacionada aos efeitos de desvio aditivo-aditivo epistático ( uu ), que é um exemplo possível de efeito de epistasia. Todas essas variâncias são estimativas de parâmetros inerentes a uma população de referência, de onde os indivíduos foram derivados..

(21) 21. O valor uˆ é definido como o valor de um indivíduo, julgado pelo valor médio de sua progênie. O valor δˆ é definido como o efeito oriundo da interação entre alelos, ou seja, o valor resultante de dois alelos juntos, especificamente, na constituição de um dado genótipo. Por fim, o valor de epistasia (no caso do exemplo do tipo uu ) pode ser definido como o desvio adicional devido à combinação de dois ou mais genes, ou seja, a falta de aditividade dos valores genotípicos de dois genes diferentes (FALCONER; MACKAY, 1996). A matriz G u equivale a matriz de variância-covariância genética aditiva, a G δ a matriz de variância-covariância genética de dominância. Por fim, a matriz A , a matriz de parentesco aditiva e a D , a matriz de parentesco de dominância, ambas estimadas com informação de pedigree. A matriz A informa nas EMM os parentescos relacionados aos valores aditivos dos indivíduos. Cada elemento não diagonal de A corresponde a duas vezes o coeficiente de parentesco ( f ), que pode ser definido como a probabilidade de um alelo tomado ao acaso de um indivíduo, seja idêntico por descendência a outro alelo, do mesmo loco, tomado ao acaso de um segundo indivíduo. Em relação aos elementos da diagonal de A , cada elemento tem equivalência à ( 1 + F ), em que F corresponde ao coeficiente de endogamia, que é definido como a. probabilidade de dois alelos de um mesmo loco tomados ao acaso de um indivíduo sejam idênticos por descendência (SCHAEFFER, 2010). Sobre a matriz D , cada elemento dessa matriz representa a probabilidade de que dois indivíduos parentes apresentem o mesmo par de alelos idênticos por descendência (MRODE; THOMPSON, 2005). Por fim, a matriz A # A , em que ( # ) equivale ao produto matricial de Hadamard, é a matriz que relaciona os parentescos dos indivíduos em relação ao efeito uu (HENDERSON, 1985; MRODE; THOMPSON, 2005)..

(22) 22. As mesmas equações de modelos mistos (EMM) considerando a decomposição de G e g sugerido por Henderson (1985) podem ser observadas abaixo:  X'X  Z'X   Z'X   Z'X  M. X'Z ′ Z Z + Gu −1σˆ e2 Z ′Z Z ′Z M. X'Z Z'Z Z ′Z + Gδ −1 σˆ e2 Z ′Z M. X'Z Z'Z Z ′Z Z ′Z + Guu −1 σˆ e2 M. L  βˆ   X'y    L  uˆ   Z'y  …  δˆ  =  Z'y  (12)     …  uu   Z'y    O  M   M   . Por fim, os componentes de variância podem ser estimados via EMREML por:. σˆ e2 = ( e′e − tr (WC −1W' ) / n. (. ). ( = ( uu'(A#A). ). ˆ −1uˆ + tr ( C22−1 ) σˆ e2 / qu σˆ u2 = u'A ˆ −1δˆ + tr ( C −1 )σˆ 2 / q σˆδ2 = δ'D e δ 33. σˆ uu2. −1. ). −1 uu + tr ( C 44 )σˆ e2 / quu. em que qu é o número de estimativas de uˆ ; qδ é o número de estimativas de δˆ ; quu é o número de estimativas uu ; e = y − Xβˆ − Zgˆ o resíduo; C é a resolução. do sistema de equações (12); e W = [ X | Z ] é a matriz X concatenada com a matriz Z .. 2.4 Predição do desempenho de híbridos simples de milho utilizando modelos lineares mistos com informação de parentesco Após o insucesso dos métodos de predição de desempenho híbridos de milho baseados em distâncias genéticas, estimadas por marcadores moleculares, Bernardo (1994) propôs uma nova metodologia de predição utilizando modelos.

(23) 23. lineares mistos. Esse novo método era baseado no modelo genético sugerido por Henderson (1985), porém com algumas particularidades. Entre as diferenças, um ponto importante entre o modelo de Bernardo (1994) e Henderson (1985) era o processo de construção das matrizes de parentesco. A matriz A de Henderson (1985) era gerada por informações de pedigree, já a de Bernardo (1994) era estimada por informações oriundas de marcadores moleculares. No modelo proposto por Henderson (1985) eram estimados os efeitos genéticos aditivos, de dominância e desvios epistáticos. Já no sugerido por Bernardo (1994), as estimativas obtidas eram a capacidade geral de combinação (CGC) e capacidade específica de combinação (CEC) de linhagens de milho. Em outro trabalho, Bernardo (1994) realizou a validação do método com um maior volume de dados. Este autor conseguiu encontrar correlações de ordem de 0,5 a 0,81 entre valores preditos e observados, para o caráter produtividade de híbridos simples de milho. No começo do século XXI, Meuwissen, Hayes e Goddard (2001) propuseram um novo método preditivo conhecido na atualidade como Seleção Genômica Ampla (SGA) – do termo em inglês Genome-Wide Selection. O método era baseado na regressão de valores fenotípicos, utilizando marcadores moleculares (uma marca a cada 1 cM) espalhados densamente pelo genoma como covariáveis em uma função de regressão (DE LOS CAMPOS et al., 2013). Meuwissen, Hayes e Goddard (2001) utilizaram quatro métodos de análise genômica em um estudo de simulação, os métodos eram: (i) métodos dos quadrados mínimos (MQM); (ii) BLUP; (iii) Bayes A;. (iv) Bayes B.. Meuwissen, Hayes e Goddard (2001) conseguiram encontrar correlações entre os valores estimados e observados de 0,318 (MQM), 0,732 (BLUP), 0,798 (Bayes A) e 0,848 (Bayes B) na simulação executada no trabalho. Detalhe sobre particularidades dos métodos podem ser encontrados no trabalho original. Uma crítica detalhada sobre esses métodos em Gianola (2013) e uma revisão recente em de los Campos et al. (2013). Resultados e comentários de estudos práticos e.

(24) 24. de simulação dessa metodologia em grandes culturas podem ser encontrados em Jannink, Lorenz e Iwata (2010) e em específico na cultura do milho em Albrecht et al. (2011) e Habier, Fernando e Garrick (2013). Os modelos bayesianos BayesA e BayesB utilizados no trabalho de Meuwissen, Hayes e Goddard (2001) permitem a incorporação de informações a priori, modelagem de heterogeneidade da variância de locos e a seleção e. encolhimento de marcas de pequeno efeito, atribuindo, desta forma, o relaxamento de fortes pressupostos e maior versatilidade de modelagem. A principal desvantagem dos modelos bayesianos de variância específica relaciona-se a sua deficiência em descrever a variância genética de forma efetiva e devido à baixa entropia presente nas distribuições prioris, pouco se aprende com os dados observados (GIANOLA, 2013). Após a proposta de Meuwissen, Hayes e Goddard (2001), especialmente em relação ao uso do método BLUP, é muito frequente em trabalhos com SGA a utilização de um modelo conhecido por rrBLUP (Ridge Regression BLUP). Neste modelo são estimados efeitos genéticos de marcadores moleculares espalhados no genoma de um grupo de indivíduos. A soma dos efeitos das marcas de cada indivíduo recupera o valor genético de cada indivíduo. A principal desvantagem desse método é a realização de uma regressão direta nas marcas (identidade por estado), sem considerar uma estrutura de parentesco comum entre os indivíduos. Uma alternativa para melhorar esse modelo foi considerar um relacionamento genético entre os indivíduos, via identidade por descendência, assumindo uma população base de passado comum. Nesse sentido, Powell, Visscher e Goddard (2010) sugeriram um processo de estimação da matriz por marcadores moleculares. A proposta encontra-se em harmonia com a teoria da coalescência, que estabelece que todos os indivíduos compartilham um ancestral.

(25) 25. comum. O método é baseado em considerar a população “atual” como a “base”. O estimador de Powell, Visscher e Goddard (2010) é dado por:.  ( xik − 2 pk ) ( x jk − 2 pk ) 1  ,i≠ j ∑ N k 2 pk qk  A= (13) xik 2 − (1 + 2 pk ) xik + 2 pk 2 1  ,i= j  1+ N ∑ 2 pk qk k  em que A é a matriz de parentesco unificada de Powell, x é a soma de alelos (marcas) de um dado loco de um indivíduo i ou j em um loco k , com cada alelo favorável codificado por 1 e cada desfavorável por 0, p é a frequência do alelo favorável e q frequência do alelo desfavorável, N é o número de locos. Um ajuste empírico, visando eliminar o viés e torná-lo um estimador não viesado do parentesco entre indivíduos, de acordo com Powell, Visscher e Goddard (2010), pode ser encontrado em Yang et al. (2010). Porém, em algumas situações, é possível que a matriz A não seja positiva semidefinida (DE LOS CAMPOS et al., 2013). Nessa situação, Meuwissen, Luan e Woolliams(2011) recomendam não calcular a diagonal separadamente, como proposto originalmente por Powell, Visscher e Goddard (2010), e adicionar uma constante 10-4 a matriz A . Assim, com a utilização da matriz A estimada pelos marcadores é possível estimar o valor uˆ e a σˆ u2 por um novo método chamado Genomic BLUP ou GBLUP (VANRADEN, 2008).. Em trabalhos envolvendo SG é. comum observar-se a utilização da matriz de parentesco A proposta por VanRaden (2008). Foi exatamente nesse trabalho em que foi proposto pela primeira vez o modelo GBLUP. O modelo GBLUP, estruturalmente, é o mesmo modelo usado por muito tempo no melhoramento animal, conhecido popularmente como modelo animal, porém, com a estrutura de variância-.

(26) 26. covariância genética ( G ) entre os indivíduos, estimada por marcadores moleculares. A principal limitação da matriz de VanRaden (2008) é que a parametrização da matriz de desvios não é realizada loco a loco ou em pairwise. Também, conforme salientado por Meuwissen, Luan e Woolliams (2011), o uso dessa matriz com dados reais acaba subestimando a participação de alelos em baixa frequência, que na maioria das vezes refletem com intensidade na expressão fenotípica. Por exemplo, genes que conferem resistência à doenças de herança monogênica. Por fim, em um estudo prático, Massman et al. (2013) compararam o método preditivo BLUP proposto por Bernardo (1994) e o método rrBLUP sugerido por Meuwissen, Hayes e Goddard (2001). Nesse trabalho, o autor concluiu que o método BLUP e rrBLUP se equivalem quando não existe desequilíbrio de ligação (LD) entre as marcas - o que é esperado na teoria - e que em condições de maior LD o rrBLUP tende a tornar-se um método preditivo mais eficiente. O maior valor de acurácia média entre os valores genéticos preditos e observados no processo de validação cruzada foi obtido quando as informações relativas aos dois parentais dos híbridos não testados eram utilizadas na análise. 2.5 Análise genética de componentes de produção de milho. O aumento da produtividade de grãos é o principal objetivo de programas de melhoramento de milho, seja de forma direita ou indireta (HALLAUER et al., 2010). Por exemplo, mesmo quando é direcionado alguns cruzamentos visando ao aumento da resistência a doenças, indiretamente, aumenta-se o desempenho produtivo em híbridos. Sobre a arquitetura genética do caráter produção de grãos, as principais características são: (i) baixa herdabilidade; (ii) controlado por vários genes de pequeno efeito; (iii) poucos genes de grande efeito; (iv) genes de efeito.

(27) 27. epistático; (v) e genes com efeito pleiotrópico (ALESTRE et al., 2012; BERNARDO, 2009; HALLAUER et al., 2010;MA et al., 2007; PATERNIANI; AJUSTAR, 1999). Devido à alta complexidade genética da produção de grãos, vários estudos foram realizados buscando estratégias de maximização do ganho com a seleção de genótipos superiores na expressão deste caráter. Uma das estratégias foi a seleção indireta de caracteres secundários de alta herdabilidade e correlacionados com a produção de grãos em milho (BENTO; RAMALHO; SOUZA, 2003; CARENA; SANTIAGO,1998; LONNQUIST, 1967; SINGH; KHERRA; DHILLON, 1986). Uma tabela sumarizando o resultado médio de 390 estudos, com parâmetros de correlação genética entre caracteres em nível de planta e em nível de espiga, em relação à produção de grãos na cultura do milho, pode ser encontrada em Hallauer et al. (2010). De acordo com Bernardo (2010), o que se observou após vários anos de pesquisa com a seleção indireta avaliando componentes de produção, não só para o milho, mas também para outras culturas, é que a seleção direta é mais efetiva no aumento de produtividade de grãos. Falconer e Mackay (1996) afirmam que a principal justificativa é que à medida em que é praticada, a seleção indireta, e aumenta-se favoravelmente a expressão de dois caracteres, ao mesmo tempo, outros caracteres, que também são componentes de produção, e que são negativamente correlacionados aos que foram selecionados, acabam reduzindo a produtividade média final na maioria das vezes após o ciclo de melhoramento. Entretanto, vários trabalhos relatam a melhoria na capacidade preditiva utilizando modelos que consideram informações de caracteres secundários de alta herdabilidade, em conjunto com dados de produção de grãos (HENDERSON; QUAAS, 1976; MALOSETTI et al., 2007; MRODE; THOMPSON, 2005;PIEPHO et al., 2008). Esses modelos são conhecidos por.

(28) 28. “multipletraits” ou múltiplos caracteres ou multivariados. Praticamente não há relatos sobre uso dessa classe de modelo em trabalhos utilizando espécies cultiváveis anuais (MALOSETTI et al., 2007; PIEPHO et al., 2008). Malosetti (2007) propôs um modelo com o uso de informações de vários caracteres em ambientes diversos. O objetivo principal desse trabalho foi identificar QTLs que explicavam a variação genética de componentes de produção da cultura do milho. Esse autor analisou e identificou QTLs com efeitos pleiotrópicos, ligados e também conseguiu quantificar efeitos de interação QTLs x ambientes. Por fim, foi concluído no final do trabalho que informações obtidas por ensaios em vários locais podem ser úteis no entendimento da arquitetura genética de caracteres de importância econômica. Balestre (2013) também realizou uma proposta de um modelo de múltiplos caracteres, porém, adicionalmente, comparou este modelo com outros modelos considerando os caracteres separadamente. O principal objetivo do trabalho foi verificar se os modelos de múltiplos caracteres proporcionavam estimativas com maior precisão, do que os modelos considerando cada caráter separadamente. As análises foram executadas tanto na abordagem de modelos mistos quanto na bayesiana.. Este autor concluiu que quando não existem. informações a priori sobre os parâmetros, tanto os métodos bayesianos quanto os modelos mistos se equivalem, o que, conforme afirmado pelo próprio autor, é esperado na teoria. Em relação aos modelos de múltiplos caracteres, relatou que, em geral, quando são utilizados dados fenotípicos de componentes de produção, em conjunto com dados de produtividade, a análise é mais eficiente do que quando se analisa cada caráter em separado, principalmente, quando os componentes de produção apresentam alta correlação entre si. Outro ponto mencionado, é que no geral, a análise é mais eficiente quando são utilizados componentes com herdabilidade mediana à baixa..

(29) 29. Um estudo comparativo entre o método de seleção indireta com caracteres secundários, com o método da SGA, especialmente para tolerância à seca, foi conduzido por Ziyomo e Bernardo (2013). Neste trabalho, foi estimado com resultados fenotípicos de ensaio de campo as variâncias dos caracteres secundários, as covariâncias e a correlações entre os caracteres usando as duas metodologias. A principal conclusão desses autores foi que, no geral, a SGA é 24% mais eficiente do que a seleção indireta baseada apenas em dados fenotípicos. Também relataram que praticando três ciclos de seleção (em 1 ano) com a SGA, a eficiência predita é cerca de 3,7 vezes mais alta, em termos de ganho genético, do que praticar um ciclo de avaliação fenotípica indireta por resultados de test crosses (em 2 anos). Porém, alertam a possibilidade de superestimação, baseado em resultados de outros estudos práticos (MASSMAN et al., 2013). Nesse último estudo, não foi utilizado um modelo multivariado, seja no uso do método de seleção indireta fenotípica, ou na utilização do método de SGA..

(30) 30. 3 CONCLUSÕES. Processos de predição de híbridos simples apresentam alto potencial para promover a redução de gastos financeiros em programas de melhoramento genético de milho. Modelos mistos apresentam propriedades de grande relevância para execução de predições. As pressuposições de normalidade, propriedades estatísticas e versatilidade de modelagem o torna atrativo. Estimações de matrizes de parentesco com informações de marcadores moleculares são alternativas eficientes para capturar relacionamentos genéticos entre indivíduos. O modelo GBLUP multivariado pode recuperar informações genéticas aditivas e não aditivas entre caracteres e indivíduos. Essa característica pode torná-lo mais eficiente do que os modelos atuais..

(31) 31. REFERÊNCIAS. ALBRECHT, T. et al. Genome-based prediction of testcross values in maize. Theoretical and Applied Genetics, Berlin, v. 123, n. 2, p. 339–350, July 2011.. BALESTRE, M. et al. Applications of multi-trait selection in common bean v. 189, n. 2, using real and simulated experiments. Euphytica, Wageninggen, p. 225–238, Sept. 2013.. BALESTRE, M. et al. Bayesian mapping of multiple traits in maize: the importance of pleiotropic effects in studying the inheritance of quantitative traits. Theoretical and Applied Genetics, Berlin, v. 125, n. 3, p. 479–493, Aug. 2012.. BALESTRE, M. et al. Genetic distance estimates among single cross hybrids and correlation with specific combining ability and yield in corn double cross hybrids. Genetics and Molecular Research, Ribeirão Preto, v. 7, n. 1, p. 65–73, 2008.. BENTO, D. A. V.; RAMALHO, M. A. P.; SOUZA, J. C. Seleção massal para prolificidade em milho na época normal e na “safrinha”. Revista Brasileira de Milho e Sorgo, Sete Lagoas, v. 2, n. 3, p. 78–87, 2003.. BERNARDO, R. Breeding for quantitative traits in plants. 2nd ed. Woodbury: Stemma, 2010. 390 p.. BERNARDO, R. Genomewide Selection for Rapid Introgression of Exotic Germplasm in Maize. Crop Science, Madison, v. 49, n. 2, p. 419, 2009.. BERNARDO, R. Prediction of Maize Single-Cross Performance Using RFLPs and Information from Related Hybrids. Crop Science, Madison, v. 34, n. 1, p. 20–25, 1994..

(32) 32. CALUS, M. P. L.; VEERKAMP, R. F. Accuracy of multi-trait genomic selection using different methods. Genetics, Selection, Evolution , Paris, v. 43, p. 26, Jan. 2011.. CARENA, M. J. I.; SANTIAGO, A. O. Direct and correlated response to recurrent selection for prolificacy in maize at two planting densities. Maydica, Bergamo, v. 43, p. 95–102, 1998.. COCKERHAM, C. C. Prediction of double crosses from single crosses. Theoretical and Applied Genetics, Berlin, v. 37, n. 4, p. 160–169, 1967.. DE LOS CAMPOS, G. et al. Whole-genome regression and prediction methods applied to plant and animal breeding. Genetics, Austin, v. 193, n. 2, p. 327– 345, Feb. 2013.. DEMPSTER, A. P. Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, London, v. 39, n. 1, p. 1–38, 1977.. EBERHART, S. A. Theoretical relations among single, three-way, and doubled cross hybrids.1964. Disponível em: <http://www.jstor.org/>. Acesso em: 5 mar. 2014.. FALCONER, D. S.; MACKAY, T. F. Introduction to quantitative genetics. 4th ed. London: Longman group, 1996. 464 p.. GIANOLA, D. Priors in whole-genome regression: the bayesian alphabet returns. Genetics, Austin, v. 194, n. 3, p. 573–596, July 2013..

(33) 33. GILMOUR, A. R. et al. Linear mixed models algorithm for average information REML: an efficient in linear mixed models variance parameter estimation. Biometrics, Washington, v. 51, n. 4, p. 1440–1450, 1995.. HABIER, D.; FERNANDO, R. L.; GARRICK, D. J. Genomic BLUP decoded: a look into the black box of genomic prediction. Genetics, Austin, v. 194, n. 3, p. 597–607, July 2013.. HALLAUER, A.R. et al. Quantitative genetics in maize breeding. 2nd ed.Ames: Iowa State University, 2010. 468p.. HENDERSON, C. R. Applications of linear models in animal breeding. Guelph: University of Guelph, 1984. 384p.. HENDERSON, C. R. . Best linear unbiased estimation and prediction under a selection model. Biometrics, Washington, v. 31, n. 2, p. 423–447, 1975.. HENDERSON, C. R. Best linear unbiased prediction of nonadditive genetic merits in noninbred populations. Journal of Animal Science, Champaign, v. 60, n. 1, p. 111–117, 1985.. HENDERSON, C. R. Estimation of general, specific and maternal combing abilities in crosses among inbred lines of swine. 1948. Thesis (PhD) - Iowa State University, Ames, 1948.. HENDERSON, C. R.; QUAAS, R. L. Multiple trait evaluation using relatives’ records. Journal of Animal Science, Champaign, v. 43, n. 6, p. 1188–1197, 1976..

(34) 34. HILL, W. G. Applications of population genetics to animal breeding, from wright, fisher and lush to genomic prediction. Genetics, Austin, v. 196, n. 1, p. 1–16, Jan. 2014.. JANNINK, J. L.; LORENZ, A. J.; IWATA, H. Genomic selection in plant breeding: from theory to practice. Briefings in Functional Genomics, London, v. 9, n. 2, p. 166–177, Mar. 2010.. JENKINS, M. T. Methods of estimating the performance of double crosses in corn. Journal American Society of Agronomy, Madison, v. 26, p. 199–204, 1934.. JIA, Y.; JANNINK, J. L. Multiple-trait genomic selection methods increase genetic value prediction accuracy. Genetics, Austin, v. 192, n. 4, p. 1513–22, Dec. 2012.. LANZA, L. L. B. et al. Genetic distance of inbred lines and prediction of maize single-cross performance using RAPD markers. Theoretical and Applied Genetics, Berlin, v. 94, n. 8, p. 1023–1030, 27 Juny 1997.. LEE, M. Association of restriction length polymorphism among maize inbreds with agronomic performance of their crosses. Crop Science, Madison, v. 29, p. 1067–1071, 1989.. LEE, J. H. Mass selection for prolificacy in corn. Der Züchter, Berlin, p. 185–188, 1967.. v. 37,. MALOSETTI, M. et al. A multi-trait multi-environment QTL mixed model with an application to drought and nitrogen stress trials in maize (Zea mays L.). Euphytica, Wageningen, v. 161, n. 1/2, p. 241–257, Dec. 2007..

(35) 35. MASSMAN, J. M. et al. Genomewide predictions from maize single-cross data. Theoretical and applied genetics,Berlin, v. 126, n. 1, p. 13–22, Jan. 2013.. MA, X. Q. et al. Epistatic interaction is an important genetic basis of grain yield and its components in maize. Molecular Breeding, dordrecht, v. 20, n. 1, p. 41– 51, Mar. 2007.. MELCHINGER, A. E. Genetic diversity and heterosis.In: COORS, J. G.; PANDEY, S. (Ed.).The genetics and exploitation of heterosis in crops. Madison: ASA - CSSA, 1999. p. 99-118.. MEUWISSEN, T. H. E.; HAYES, B. J.; GODDARD, M. E. Prediction of total genetic value using genome-wide dense marker maps. Genetics, Austin, v. 157, n. 4, p. 1819–1829, Apr. 2001.. MEUWISSEN, T. H. E.; LUAN, T.; WOOLLIAMS, J. A. The unified approach to the use of genomic and pedigree information in genomic evaluations revisited. Journal of Animal Breeding and Genetics, Berlin, v. 128, n. 6, p. 429–439, Dec. 2011.. MRODE, R. A.; THOMPSON, R. Linear models for the prediction of animal breeding values. 2nd. ed. Cambridge: CABI, 2005. 344p.. NELDER, J. A.; MEAD, R. A simplex method for function minimization. Computer Journal, London, v.7, n.4, p. 308-313,1965.. PATERNIANI, E.; AJUSTAR, B. Melhoramento do milho. In: BORÉM, A. Melhoramento de espécies cultivadas. Viçosa, MG: UFV, 1999.p. 491–547..

(36) 36. PATTERSON, H. D.; THOMPSON, R. Recovery of inter-block information when block sizes are unequal. Biometrika, London, v. 58, n. 3, p. 545-554, Dec. 1971.. PIEPHO, H. P. et al. BLUP for phenotypic selection in plant breeding and variety testing. Euphytica, Wageningen, v. 161, n. 1-2, p. 209–228, July 2008.. POWELL, J. E.; VISSCHER, P. M.; GODDARD, M. E. Reconciling the analysis of IBD and IBS in complex trait studies. Nature reviews. Genetics, London, v. 11, n. 1, p. 800–805, Nov. 2010.. RAMALHO, M. A. P. Experimentação em genética e melhoramento de plantas. 3. ed. Lavras: UFLA. 2012. 328 p.. REIF, J. C.; HAHN, V.; MELCHINGER, A. E. Genetic basis of heterosis and prediction of hybrid performance. Helia, Novi Sad, v. 35, n. 57, p. 1–7, 2012.. SCHAEFFER, L. R. Linear models and animal breeding. Guelph: University of Guelph, 2010. 314 p.. SEARLE, S. R. et al. Variance components. 2nd ed. New Jersey: J. Wiley & Sons, 2006. 501 p.. SINGH, M. A. S.; KHERRA, A. S.; DHILLON, B. S. Direct and correlated response to recurrent full-sib selection for prolificacy in maize. Crop Science, Madison, v. 26, p. 275–278, 1986.. STRANGER, B. E.; STAHL, E. A.; RAJ, T. Progress and promise of genomewide association studies for human complex trait genetics. Genetics, Austin, v. 187, n. 2, p. 367–83, Feb. 2011..

(37) 37. THOMPSON, R.; BROTHERSTONE, S.; WHITE, I. M. S. Estimation of quantitative genetic parameters. Philosophical transactions of the Royal Society of London. Series B, Biological sciences, London, v. 360, n. 1459, p. 1469–1477, July 2005.. THOMPSON, R. Estimation of quantitative genetic parameters. Proceedings. Biological sciences / The Royal Society, Edinburg, v. 275, n. 1635, p. 679–686, Mar. 2008.. VANRADEN, P. M. Efficient methods to compute genomic predictions. Journal of Dairy Science, Champaign, v. 91, n. 11, p. 4414–4423, Nov. 2008.. YANG, J. et al. Common SNPs explain a large proportion of the heritability for human height. Nature Genetics, New York, v. 42, n. 7, p. 565–571, July 2010.. ZIYOMO, C.; BERNARDO, R. Drought tolerance in maize: indirect selection through secondary traits versus genomewide gelection. Crop Science, Madison, v. 53, n. 4, p. 1269–1275, 2013..

(38) 38. SEGUNDA PARTE - ARTIGO. ARTIGO: INCLUSÃO DE EFEITOS DE DOMINÂNCIA NO MODELO GBLUP MULTIVARIADO PARA PREDIÇÃO DE HÍBRIDOS SIMPLES DE MILHO. Normas da Revista Científica Plos One.

(39) 39. Inclusão de Efeitos de Dominância no Modelo GBLUP Multivariado para Predição de Híbridos Simples de Milho. Jhonathan Pedroso Rigal dos Santos1¶, Renato Coelho de Castro Vasconcellos 1&. 1. , Luiz Paulo Miranda Pires3&, Marcio Balestre2¶*, Renzo Garcia Von Pinho 3&. Departamento de biologia (DBI), Universidade Federal de Lavras, Lavras,. Minas Gerais, Brasil. 2. Departamento de ciências exatas (DEX), Universidade Federal de Lavras,. Lavras, Minas Gerais, Brasil. 3. Departamento de agricultura (DAG), Universidade Federal de Lavras, Lavras,. Minas Gerais, Brasil. *. Corresponding author. E-mail: marciobalestre@dex.ufla.br (MB) ¶. These authors contributed equally to this work.. &. These authors also contributed equally to this work..

(40) 40. RESUMO. Novas propostas de modelos e aplicações de processos de predição com informações de marcadores moleculares podem contribuir na redução de gastos financeiros e identificações de genótipos superiores em programas de melhoramento de milho. Estudos avaliando modelos GBLUP com a inclusão de efeitos de dominância não foram realizados no contexto univariado e multivariado na análise de dados dessa cultura. Assim, neste estudo foi conduzido um procedimento de construção de híbridos simples com dados fenotípicos e de marcadores moleculares reais de 4.091 linhagens de milho do banco de dados público Panzea. Nesse processo, obteve-se 400 híbridos simples que foram analisados com o modelo GBLUP univariado e multivariado considerando apenas efeitos aditivos, e em outra configuração com a inclusão de efeitos de dominância. Utilizou-se cenários de herdabilidade histórica de cinco caracteres e em outras condições de arquitetura genética para investigação comparativa entre os modelos, avaliando a capacidade preditiva e a de decomposição de componentes de variância. Diferenças expressivas não foram detectas entre os modelos multivariados e univariados. As principais justificativas para essa pequena discrepância entre os modelos são as correlações de magnitude baixa à moderada entre os caracteres estudados e as moderadas herdabilidades observadas. Essa condição não favorece as vantagens da análise multivariada. A inclusão de efeitos de dominância nos modelos mostrou ser uma estratégia eficiente para melhorar a capacidade preditiva e a qualidade da decomposição dos componentes de variância. Palavras-chave: Modelo GBLUP. Análise Univariada. Análise Multivariada. Efeitos de dominância..

(41) 41. INTRODUÇÃO. Entre as dificuldades dos programas de melhoramento de milho, uma das principais é o teste de todos os híbridos simples, sintetizados por todas as combinações de linhagens derivadas de populações em processo de melhoramento. Isso decorre do elevado custo financeiro e as dificuldades operacionais em condições de ensaios com várias repetições e instalados em número excessivo de locais. Por exemplo, a combinação entre 50 linhagens de um grupo heterótico e 50 linhagens de outro grupo heterótico permite a obtenção de 1225 combinações de híbridos simples. Nesse contexto, a disponibilidade de técnicas acuradas de predição das melhores combinações, entre linhagens, pode ser um ponto-chave para a maximização do aproveitamento de recursos financeiros em programas de melhoramento. Nos últimos anos, devido ao desenvolvimento de técnicas de genotipagem em larga escala, por exemplo, Genotyping-by-sequencing (GBS) [1], e a diminuição do custo de genotipagem, associado à forte tendência de aumento de gastos com fenotipagem, há um interesse crescente de programas de melhoramento na exploração de processos de predição com informações de marcadores moleculares [2]. Recentemente, novos modelos de regressão foram propostos para análise de dados fenotípicos e de marcadores moleculares de programas de melhoramento, aplicados em procedimentos de seleção e predição de forma integrada em um processo conhecido popularmente por seleção genômica (SG) [3]. A principal premissa desse método é cobrir amplamente o genoma com marcadores moleculares, procurando encontrar relações entre os marcadores e variantes fenotípicos de uma população, sendo ou não possível esses marcadores serem pertencentes à regiões genômicas causais [4,5]. Essa metodologia do ponto de vista prático é vantajosa, pois não necessita a adoção de delineamentos.

(42) 42. e. estruturas. populacionais. específicas,. quando. comparado. às. outras. metodologias tradicionais que utilizam marcadores, por exemplo, o processo de mapeamento de QTLs (Quantitative Trait Nucleotide). Na SG geralmente são utilizados com maior frequência modelos de regressão múltipla, best linear unbiased prediction (BLUP), ridge regression, métodos semi-paramétricos e modelos bayesianos [6]. Após vários trabalhos, poucas diferenças foram observadas entre esses métodos na estimação de efeitos genéticos aditivos, com diferenças marginais dependendo da espécie e da arquitetura genética do caráter avaliado [7–10]. Modelos bayesianos permitem estimações de variâncias genéticas específicas dos efeitos genéticos dos marcadores e incorporações de informações a priori sobre as distribuições de probabilidade dos efeitos genéticos. O BLUP pode ser empregado por regressão direta nas marcas pelo método ridge regression BLUP (rrBLUP) ou utilizando o método Genomic BLUP (GBLUP). Este último método recupera informações genéticas entre indivíduos por matrizes de parentesco construídas por marcadores moleculares. Essas matrizes elaboradas por marcadores têm evidenciado maior vantagem em relação às estimadas por pedigrees, principalmente por recuperar informações tanto em função de amostragem mendeliana quanto em relação a parentes próximos, permitindo a exploração de relacionamentos genéticos desde gerações recentes até as mais distantes [2]. Vários trabalhos relatam a melhoria na capacidade preditiva utilizando modelos que consideram informações de caracteres secundários de alta herdabilidade, em conjunto com o caráter-alvo [11–13]. Esses modelos são conhecidos como múltiplos caracteres ou multivariados. Praticamente não há relatos sobre uso dessa classe de modelo em trabalhos utilizando espécies cultiváveis anuais [13]. Relatos de utilização de modelos multivariados que consideram. relacionamento. de. parentesco. moleculares são ainda menos frequentes [14–16].. estimados. por. marcadores.

(43) 43. Durante o melhoramento de espécies em que é possível a exploração do fenômeno da heterose, como o caso da cultura do milho, efeitos de desvio dominância, oriundos de interação intraloco, podem ter impacto positivo na estimação de efeitos genéticos obtidos em procedimentos de seleção e predição. O entendimento da predominância de efeitos aditivos e de dominância de populações em estágio de melhoramento são preponderantes em algumas tomadas de decisão. Por exemplo, a escolha de parentais em sistemas de cruzamentos, e identificação de populações segregantes promissoras. No contexto de SG, inclusão de efeitos de dominância pode ser realizada no modelo GBLUP com a utilização da matriz de parentesco de dominância estimada por marcadores moleculares [17]. O modelo GBLUP multivariado (GBLUP-MV) [11] permite a exploração de informação entre caracteres secundários, por meio da covariância entre esses caracteres, e entre indivíduos [15,16]. Especialmente no caso do milho, há carências de trabalhos procurando avaliar a utilidade desses modelos. Inclusões de efeitos de dominância no contexto de SG com modelos multivariados ainda não foram reportados na literatura. Assim, os objetivos com este trabalho são: (i) elaborar a construção de híbridos simples de milho com informações fenotípicas e genotípicas reais de linhagens de milho, de modo que seja conservada a arquitetura genética de caracteres; (ii) propor a inclusão do efeito de dominância no modelo GBLUP multivariado (GBLUP-MV-AD); (iii) comparar o modelo GBLUP-MV-AD com os modelos GBLUP multivariado aditivo (GBLUP-MV-A); GBLUP univariado aditivo (GBLUP-UV-A); e GBLUP univariado com a inclusão do efeito de dominância (GBLUP-UV-AD)..

(44) 44. MATERIAL E MÉTODOS Banco de dados Panzea de linhagens de milho. Neste estudo foram utilizados dados de genotipagem SNPs/GBS e fenotipagem das linhagens derivadas da Nested Association Mapping population (NAM) do banco de germoplasma do Departamento de Agricultura dos Estados Unidos (USDA-ARS), caracterizado geneticamente por [18]. Esse banco de dados está disponível publicamente pela plataforma Panzea (http://www.panzea.org/). A população NAM foi obtida a partir dos cruzamentos entre a linhagem B73 com outras 25 linhagens endogâmicas de alta diversidade genética. Esses cruzamentos foram planejados visando à representação do pool gênico mundial da cultura do milho. Amostragem sistemática de 27,000 marcadores distribuídos uniformemente ao longo dos 10 grupos de ligação do milho foi promovida. A seleção dos marcadores foi realizada pelo sorteio da primeira marca na faixa entre a 1° e a 25° marcas, e as demais foram selecionadas linearmente a cada 25 marcas até a cobertura completa de todos grupos de ligação (2,700 marcas selecionadas por cromossomo). As marcas perdidas foram imputadas pela função A.mat, método meando pacote rrBLUP [19] do software R (R core team, 2014). No total foram estudados cinco caracteres: (i) altura de planta – AP (4,065 linhagens); (ii) altura de inserção de espiga – AIE (4,061 linhagens); (iii) comprimento de espiga – CE (3,178 linhagens); (iv) número de fileiras por espiga – NFE (3,084 linhagens); (v) peso de grãos - PG (3,313 linhagens). Os dados fenotípicos foram obtidos em ensaios conduzidos no ano de 2006, na safra de verão, na cidade de Aurora no estado de Nova York na latitude 42,75º N e longitude 76,70º W. O processo de manipulação de dados do projeto Panzea foi realizado no software TASSEL [21] e software R..

Referências

Documentos relacionados

The view that qualitative research methods can be used to identify causal relation- ships and develop causal explanations is now accepted by a significant number of both qualitative

A primeira compõe a introdução ao Logo, onde apresenta-se brevemente sua origem; a segunda traz uma breve contextualização das influências da linguagem referida na

Para melhor comparação, foram construídos gráficos contendo espectros no infravermelho da poliacrilamida em diferentes estados: não degradado (nd), degradado

CONCLUSÕES No planejamento experimental entre a sílica gel e a epicloridrina os resultados apresentados no tratamento de dados estatístico evidenciaram que a temperatura e o tempo

«O mês de Abril [1931] começa revolucionariamente» (Faria, 2000, 173): abriu com a “Revolta da Madeira” que se estendeu aos Açores e à Guiné; implantou-se a

As alterações climáticas verificadas no Alentejo nas últimas décadas apontam para uma tendência de crescimento gradual do consumo de água pelas culturas, induzida pelo aumento

Nessa ideia da figura reconheciada, o quadro abaixo esboça a relação da imagem com as instituições e atitudes da sociedade relacionada no estudo (fig.1) de

Ridendo Castigat Mores