• Nenhum resultado encontrado

2 Materiais e Métodos

N/A
N/A
Protected

Academic year: 2021

Share "2 Materiais e Métodos"

Copied!
5
0
0

Texto

(1)

TÍTULO: ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA: “SELEÇÃO DE VARIÁVEIS RELEVANTES NA PRODUÇÃO DE MARACUJÁ”

Autores: Ana Verginia Libos Messetti (1) e Martha Viviana Torres Cely (2)

1 Introdução

O Brasil é atualmente, uns dos maiores produtores de maracujá do mundo. Nos últimos anos a produção deste fruto há alcançado valores acima das 700.000 toneladas e a área total plantada já supera os 50.000 hectares. Devido à crescente importância econômica desta cultura, têm sido conduzidos vários programas orientados ao melhoramento dos cultivares, visando uma maior produtividade e uma melhor qualidade da matéria prima.

Nestes estudos a relação entre caracteres morfológicos do fruto e a produção de polpa, têm sido usados frequentemente como ferramentas de seleção de fenótipos. O principal objetivo foi realizar uma análise de regressão múltipla do rendimento em relação às características do fruto, assim como, realizar uma seleção de variáveis pelo método backward para determinar as características do fruto mais relevantes no rendimento final.

2 Materiais e Métodos

Os dados usados neste trabalho foram cedidos pelo Instituto Agronômico do Paraná (IAPAR), e correspondem a experimentos realizados no período de 2006 a 2007 com vários híbridos de maracujá na estação experimental da cidade de Londrina. Para a análise de regressão as variáveis referentes ao fruto tais como, peso (g), comprimento (mm), diâmetro (mm), espessura da casca e número de frutos por planta foram definidas como variáveis independentes; o rendimento (t/ha) foi considerado variável resposta. Estas análises foram feitas no pacote estatístico R version 2.13.2 (2011-09-30), Copyright (C) 2011 The R Foundation for Statistical Computing. ISBN 3-900051-07-0.

_____________________________________________________________________________

(1)

Docente da Universidade Estadual de Londrina do Departamento de Estatística- [email protected] (2)

(2)

O modelo de regressão linear múltiplo para relacionar uma variável dependente com p variáveis independentes é definido por: Yi 01xi12xi2 ...pxipei , onde a subscrição i denota a unidade de observação e p as variáveis independentes do modelo. De forma semelhante a regressão linear simples o modelo de regressão múltipla devem satisfazer os seguintes pressupostos: a variável dependente é função linear das variáveis regressoras ; os erros são homocedásticos; os erros são independentes e os erros tem distribuição normal.

Para avaliar o modelo de regressão múltiplo é preciso testar os parâmetros,

0 ..., , 0 : 0 0  p

H   , no caso de rejeitar , pode-se concluir que há uma contribuição significativa de uma ou mais variáveis regressoras no comportamento de uma variável independente. A análise de variância para regressão apresenta a estatística teste F sobH0, a

distribuição F com p e (n-p-1) graus de liberdade. Os p graus de liberdade do numerador se deve ao fato de se ter p parâmetros.

As estatísticas de diagnóstico verificadas no trabalho foram: o fator de inflação da variância, a análise de resíduos, verificação de pontos influentes. A importância de detectar pontos influentes num conjunto de dados, esta na influência que estes causam no ajuste do modelo. As estatísticas usadas para diagnósticos foram: pontos de alavanca (hii), DFBetasj(i), Dffitsi

distância Cook ( ) e COVRATIO.

Os métodos de seleção stepwise são métodos alternativos de seleção de variáveis que têm sido desenvolvidos para identificar um subconjunto de modelos, através de menos cálculos dos que exigidos nos métodos de todas as possíveis regressões. Nestes métodos os subconjuntos de modelos são identificados sequencialmente pela adição ou eliminação de uma variável que exerce grande influência sob a soma de quadrados dos resíduos. Método backward: O procedimento caracteriza-se por incorporar, inicialmente, todas as variáveis auxiliares em um modelo de regressão múltiplo (completo) e percorrer etapas, nas quais uma variável por vez pode ser eliminada. No programa R as funções de seleção de variáveis, utilizaram como critério de inclusão ou exclusão de uma variável o Critério de Informação de Akaike (AIC).

(3)

3. Resultados e Discussões

Os resultados da análise de regressão múltipla usando as cinco variáveis independentes estão resumidos na Tabela 1 e pela análise de variância para a regressão o modelo foi significativo com Fcalc (8.733) e p-valor (p <0.0001), por outro lado os coeficientes estimados foram estatisticamente significativos influenciado pelas variáveis: comprimento do fruto (p=0.05) e espessura da casca (p<0.0001).

Tabela 1. Resultados da análise de variância e teste de significância dos coeficientes da regressão do rendimento com as cinco variáveis independentes.

Variável Std erro( ) t valor Pr(>|t|) Intercepto 12.791 4.853 2.635 0.00971* Peso 0.005 0.003 1.639 0.10427 N0 Fruto 0.006 0.024 0.261 0.79450 Diâmetro 0.102 0.113 0.901 0.36945 Comprimento 0.168 0.085 1.970 0.05149* Espessura -2.32 0.474 4.887 3.82e-06* FV gl SQ QM F p-valor Regressão. 5 171.2235 171.2235 8.783337 5.879e-07* Resíduo. 102 1988.401 19.49413 Total 107 2844.519

(*) Representa diferença significativa (0.05)

Pela análise de resíduo os pressupostos foram atendidos e o teste de Shapiro Wilk (W=0.9957) e p-valor (p=0.9838) verificou a normalidade dos resíduos do modelo de regressão.

Segundo Marquart (1970), uma colinearidade séria pode ser diagnosticada quando VIF>10. Os valores dos elementos da diagonal da matriz inversa da correlação entre as variáveis regressoras foram:VIFn.fruto=1.139; VIFpeso=1.420; VIFDiam=4.101; VIFComp=3.312; VIFesp=1.139. O fator de inflação da variância calculado para as variáveis independentes demonstraram a não existência de colinearidade entre as variáveis.

As estatísticas de diagnósticos (pontos de alavanca, Dffits, Dbetas, Distância Cook, Covratio) detectaram oito observações influentes, que podem estar interferindo na qualidade do ajuste do modelo completo. Por esta razão foram retirados do conjunto, assim com a nova matriz

(4)

de dados (sem pontos influentes) foi realizado o procedimento de seleção de variáveis pelo método backward. O modelo de regressão final selecionado incluiu três variáveis regressoras que segundo o modelo, o rendimento do maracujá estaria bem explicado pelas variáveis: número de frutos, peso do fruto e espessura da casca. O melhor modelo segundo a seleção de variáveis para o rendimento do maracujá foi dado por: Y35.850.0045X10.04X23.2967X5.

4 Conclusões

A análise de regressão múltipla do rendimento do fruto de maracujá em função dos cinco parâmetros estimados somente o comprimento do fruto e a espessura da casca foram estatisticamente significativos para explicar o rendimento do fruto.

Quanto aos pontos influentes, oito observações que podem estar influenciando no ajuste do modelo completo o qual foi conferido na representação gráfica dos resíduos padronizados que permitiu observar uma variância homogênea para o número de frutos e a espessura da casca, já o peso, comprimento, e diâmetro do fruto apresentaram alguns pontos distanciados da maioria das observações indicando uma maior variação neste grupo de dados. Após a eliminação dos pontos influentes, a seleção de variáveis definiu o modelo reduzido final com as variáveis: número de frutos por planta, peso do fruto e espessura da casca.

Dos parâmetros (β’s), o maior valor estimado de β foi calculado para a variável espessura da casca, com sinal negativo indicando que os fenótipos mais favoráveis para um rendimento maior da cultura do maracujá são aqueles que apresentem uma baixa espessura da casca. O número de frutos, peso do fruto e espessura da casca foram determinantes no rendimento final do fruto. As análises constituem uma aplicação prática da análise de regressão linear múltipla que pode ser considerada uma ferramenta importante na análise de dados experimentais multivariados.

(5)

5 Referências Bibliográficas

CARVALHO, C.G.P. de; OLIVEIRA, V.R.; CRUZ, C.D.; CASALI, V.W.D. Análise de trilha sob multicolinearidade em pimentão. Pesquisa Agropecuária Brasileira, Brasília, v.34, n.4, p.603-613, 1999.

CUNHA, M.A.P. da; CARDOSO, C.E.L. Variabilidade genética e melhoramento do maracujá. In: QUEIROZ, M. A. de; GOEDERT, C. O.; RAMOS, S. R. R. (Orgs.). Simpósio de Recursos

INFORAGRO. Consultoria, inovação e solução em agropecuária. 2011. Disponível em: http://inforagro.wordpress.com/2011/04/04/cultivo-de-maracuja-parte-1/#more-928 >. Acesso em 4/10/2011.

MELETTI, L.M.M.; SOARES-SCOT, M.D.; BERNACCI, L.C.; P ASSOS, I.R. DA S. Melhoramento genético do maracujá: passado e futuro. In: FALEIRO, F.G.; JUNQUEIRA, N.T.V.; B R AGA, M.F. (Org.). Maracujá: germoplasma e melhoramento genético. Planaltina: Embrapa Cerrados, 2005; p. 55-78.

NEGREIROS, J.R.da S.; ÁLVARES, V.de S.; BRUCKNER, C.H.; MORGADO, Dell'Orto. M.A.; CRUZ, C.D. Relação entre características físicas e o rendimento de polpa de maracujá-amarelo. Revista Brasileira de Fruticultura, Jaboticabal, v. 29, n. 3, p. 546-549, 2007.

OLIVEIRA, E.J. de; SANTOS, V.da S.; LIMA, D.S.de; MACHADO, M.D.; LUCENA, R.S.; MOTTA, T. B.N. Estimativas de correlações genotípicas e fenotípicas em germoplasma de maracujazeiro. Bragantia, Campinas: v. 70, n. 2, p. 255-261, 2011.

RAWWINS, J.O.; PANTULA, S.G.; DICKEY, D.A. Applied Regression Analysis, A Research Tool. 2 ed. New York: Springer-Verlag, 1998. p.618.

SEAGRI. Secretaria de estado da agricultura, pecuária e regional fundiária. 2011. Disponível em:< http://www.seagri.ba.gov.br/Maracuja.htm>. Acesso em: 4/10/2011.

WEKERMA, C.; AGUIAR, S. Análise de Regressão: como entender o relacionamento entre as variáveis de um processo. Fundação Cristiano Ottoni, Belo horizonte: Editorial Wekerma, 1996.302p. ZIMMERMAN, F.J.P. Estatística aplicada à pesquisa agrícola. 1 ed. São Antônio de Goiás: Embrapa Arroz e Feijão, 2004. p 402.

Referências

Documentos relacionados

Para que o objetivo geral desse trabalho seja atingido, algumas metas precisaram ser cumpridas: - Síntese e caracterização do óxido de grafite, material precursor do óxido de grafeno;

Assinale a opção ERRADA com relação ao(s) produto(s) preferencialmente formado(s) durante a reação de nitração deste tipo de composto nas condições experimentais apropriadas..

O Colegiado de Curso de Engenharia de Computação definirá normas para a escolha dos componentes optativos de formação complementar, de modo que seja assegurada a formação de

To determine a systematic uncertainty in the number of non-W(µν)+jets events in the single-muon control sample, the production cross sections of Drell-Yan, diboson, tt, and

Os problemas de saúde se atenuam consideravelmente sob a ação do contato físico, que induz a um estado emocional positivo que, por sua vez, ajuda o corpo em seu processo de

Therefore, this text aims to identify and analyse the economic (external constraint and productive structure) and political limits (configuration of class fractions in the power

A princípio o trabalho com o esporte extraclasse é mais prazeroso e tranqüilo, tendo em vista que todos ou a grande maioria dos alunos envolvidos

Nestas situações, a escola e todos os ciclos de ensino (pré-escolar, 1.º, 2.º e 3.º ciclos), bem como nas respostas sociais de 1.ª infância (creche, creche familiar