• Nenhum resultado encontrado

Uso de modelos lineares generalizados para avaliar táticas de manejo no controle do tripes do prateamento na cultura do amendoim

N/A
N/A
Protected

Academic year: 2021

Share "Uso de modelos lineares generalizados para avaliar táticas de manejo no controle do tripes do prateamento na cultura do amendoim"

Copied!
36
0
0

Texto

(1)UNIVERSIDADE ESTADUAL DA PARAÍBA CENTRO DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE ESTATÍSTICA. Luzidark Alves Maciel. Uso de modelos lineares generalizados para avaliar táticas de manejo no controle do tripes do prateamento na cultura do amendoim. Campina Grande - PB Abril de 2016.

(2) Luzidark Alves Maciel. Uso de modelos lineares generalizados para avaliar táticas de manejo no controle do tripes do prateamento na cultura do amendoim. Trabalho de Conclusão de Curso apresentado ao Curso de Especialização em Estatística Aplicada do Departamento de Estatística do Centro de Ciências e Tecnologia da Universidade Estadual da Paraíba em cumprimento às exigências legais para obtenção do título de especialista em Estatística.. Orientador: Profa . Dra . Ana Patricia Bastos Peixoto. Campina Grande - PB Abril de 2016.

(3) É expressamente proibida a comercialização deste documento, tanto na forma impressa como eletrônica. Sua reprodução total ou parcial é permitida exclusivamente para fins acadêmicos e científicos, desde que na reprodução figure a identificação do autor, título, instituição e ano da dissertação.. M152u. Maciel, Luzidark Alves Uso de modelos lineares generalizados para avaliar táticas de manejo no controle do tripes do prateamento na cultura do Amendoim [manuscrito] / Luzidark Alves Maciel. - 2016. 35 p. : il. Digitado. Monografia (Estatística Aplicada) - Universidade Estadual da Paraíba, Centro de Ciências e Tecnologia, 2016. "Orientação: Profa. Dra. Ana Patricia Bastos Peixoto, Estatística do Centro de Ciências e Tecnologia da Universidade Estadual da Paraíba".. 1.Modelo linear generalizado. 2. Delineamento. 3. Enneothrips flavens Moulton. I. Título. 21. ed. CDD 519.535 2.

(4)

(5) Aos meus pais Adão e Luzitana e ao meu amado Francisco, que sempre acreditaram na minha capacidade e me apoiaram em todos os momentos, dedico com muito amor e carinho..

(6) Agradecimentos A DEUS por ter me concedido a vida e me dado forças nas horas difíceis. Aos meus pais, Adão Francisco Maciel e Luzitana Alves Maciel, ao meu irmão Luziardo Alves Maciel pelo amor, carinho e dedicação. Ao meu amado, Francisco Aranha Neto, por sempre estar ao meu lado dando-me força, coragem e companhia nos momentos mais difíceis. A minha orientadora Dra . Ana Patricia Bastos Peixoto, pela paciência, amizade e dedicação. Aos colegas de turma com quem tive momentos de estudo, e também de descontração. Ao Professor Dr. João Gil de Luna , coordenador do curso de Especialização, por seu empenho. A todos que acreditaram em mim e fazem parte da minha vida, o meu MUITO OBRIGADA!!!.

(7) “O fato de uma opinião ser amplamente compartilhada não é nenhuma evidência de que não seja completamente absurda; de fato, tendo-se em vista a maioria da humanidade, é mais provável que uma opinião difundida seja tola do que sensata.” (Bertrand Russell).

(8) Resumo A produção de amendoim é influenciada por fatores como clima, cultivares, práticas culturais e insetos (pragas), sendo que o ataque das pragas causa injúrias à cultura que vão desde a alimentação ocasional até a destruição da planta. Entre as pragas que atacam a cultura, o tripes do prateamento Enneothrips flavens Moulton pode ser considerada a mais importante. Os modelos lineares generalizados são uma extensão dos modelos normais lineares. A ideia básica consiste em abrir um várias opções para a distribuição da variável resposta, permitindo que a mesma pertença a família exponencial de distribuições, bem como da maior flexibilidade para a relação funcional entre a média da variável resposta e o preditor linear. O trabalho teve por objetivo avaliar diferentes efeitos de táticas de manejo do tripes do prateamento e seus reflexos na produtividade em amendoim de crescimento rasteiro. O delineamento utilizado foi de blocos casualizados em esquema de parcelas subdivididas no tempo, com 77 tratamentos e 4 repetições. Utilizou-se uma escala de notas para quantificar os sintomas de injúrias causadas pelos tripes às plantas. O modelo que se ajustou melhor aos dados foi o Quase- Poisson. Palavras-chaves:Modelos Lineares Generalizados; Delineamento; Enneothrips flavens Moulton..

(9) Abstract Peanut production is influenced by factors such as climate, varieties, cultural practices and insects (pests) and the attack of pests cause injuries to culture ranging from the occasional feeding to the destruction of the plant. Among the pests culture, thrips of silvering Enneothrips flavens Moulton can be considered the most important. Generalized linear models are an extension of linear normal models. The basic idea is to open a number of options for the distribution of the response variable, allowing the belonging to the same exponential family of distributions, as well as greater flexibility in the functional relationship between the mean of the response variable and the linear predictor. The study aimed to evaluate different effects management tactics thrips of silvering and its effects on productivity growth of peanut. The design was a randomized block in split plot in time with 77 treatments and 4 repetitions. We used a rating scale to quantify the symptoms caused injuries by thrips to the plants. The model that best fit the data was the quase poisson Key-words:Generalized Linear Models; design; Enneothrips flavens Moulton..

(10) Lista de ilustrações Figura 1 – Representação gráfica da interação entre Manejo e Avaliações . . . . . 29 Figura 2 – Gráfico de diagnóstico dos dados ajustados ao modelo Quase-Poisson para a variável sintomas . . . . . . . . . . . . . . . . . . . . . . . . . . 31.

(11) Lista de tabelas Tabela 1 – Distribuições de probabilidade pertencentes à família exponencial . . Tabela 2 – Distribuições de probabilidade da família exponencial e sua ligação canônica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela 3 – Resíduo de Ascombe para as principais distribuições. . . . . . . . . . Tabela 4 – Análise de desvios do modelo Quase-Poisson com função de ligação logarítmica ajustado para a variável resposta sintomas . . . . . . . . Tabela 5 – Estimativas dos parâmetros do modelo Quase-Poisson com função de ligação logarítmica ajustado para a variável resposta sintomas . . . .. . 15 . 15 . 22 . 30 . 30.

(12) Sumário 1. INTRODUÇÃO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11. 2 2.1 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.2 2.3 2.4 2.4.1 2.4.2 2.5 2.5.1 2.5.2 2.6 2.7 2.7.1 2.7.2 2.7.3 2.7.4. FUNDAMENTAÇÃO TEÓRICA . . . Modelo lineares generalizados . . . . Distribuição Normal . . . . . . . . . . . Distribuição Poisson . . . . . . . . . . . Distribuição Binomial . . . . . . . . . . . Distribuição Gama . . . . . . . . . . . . Distribuição Normal inversa . . . . . . . Ligações canônicas . . . . . . . . . . . Função Desvio . . . . . . . . . . . . . Função escore e Informação de Fisher Escore e Fisher para β . . . . . . . . . . Escore e Fisher para φ . . . . . . . . . . Estimação dos parâmetros . . . . . . Estimação de β . . . . . . . . . . . . . . Estimação de φ . . . . . . . . . . . . . . Testes de Hipóteses . . . . . . . . . . Técnicas de diagnóstico . . . . . . . . Pontos de alavanca . . . . . . . . . . . . Resíduos . . . . . . . . . . . . . . . . . Influência local . . . . . . . . . . . . . . Técnicas gráficas . . . . . . . . . . . . .. 3. MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . 26. 4. RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . . . . 29. 5. CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32. 6. REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . 33. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. 12 12 13 13 14 14 14 15 15 16 16 17 17 17 18 18 20 20 21 24 24.

(13) 11. 1 Introdução A produção de amendoim é influenciada por fatores como clima, cultivares, práticas culturais e insetos pragas (DIOLINO NETO et al., 1998). O ataque das pragas causa injúrias à cultura que vão desde a alimentação ocasional até a destruição da planta (FUNDERBURG; BRANDERBURG, 1995). Entre as pragas, destaca-se o tripes do prateamento, Enneothrips flavens Moulton, considerada a praga mais importante da cultura do amendoim no Brasil, pelos prejuízos causados, pela ocorrência generalizada na cultura e pelos elevados níveis populacionais. A adoção de inseticidas sistêmicos utilizados para controle do tripes do prateamento e outras pragas, em sementes e plântulas amendoim, tornou-se uma prática eficiente e econômica para os agricultores, que passaram a produzir amendoim em maior quantidade e melhor qualidade, sem onerar significativamente o custo de produção (MORAES et al., 2005). A seleção de modelos é crucial para toda pesquisa em modelagem estatística e envolve a busca de um modelo que seja o mais simplificado e que descreva bem o processo estudado, que estão presentes em diversas áreas do conhecimento como agricultura, demografia, ecologia, economia, engenharia, geologia, medicina, ciência política, sociologia e zootecnia, dentre outras. Os modelos lineares clássicos não são usualmente apropriados para analisar dados de contagens ou proporções, que são muito frequentes nas mais diversas áreas, pois as pressuposições do modelo (normalidade, aditividade, variância constante, independência) não são atendidas. Neste caso, a teoria de modelos lineares generalizados (MLGs) é a mais adequada, pois envolve uma transformação conhecida como função de ligação, onde o principal objetivo é encontrar uma escala sobre o qual um modelo linear aditivo ocorra. O modelo linear generalizado (MLG) é definido por uma distribuição de probabilidade, pertencente à família exponencial, para a variável resposta, um conjunto de variáveis independentes descrevendo a estrutura linear do modelo e uma função de ligação entre a média da variável resposta e a estrutura linear (CORDEIRO e LIMA NETO, 2006). A ideia primordial de MLG consiste em abrir o leque de opções para a distribuição da variável resposta, tornando possível que a mesma pertença à família exponencial de distribuições, tal como dar maior flexibilidade para a relação funcional entre a média da variável resposta e o preditor linear η (PAULA, 2013). Considerando-se que o uso de sementes tratadas com inseticidas e a adoção do nível de controle do tripes do prateamento, o presente trabalho teve por objetivo avaliar por meio do uso de modelos lineares generalizados os efeitos de táticas de manejo no controle do tripes do prateamento e seus reflexos na produtividade da cultura do amendoim..

(14) 12. 2 Fundamentação Teórica O conteúdo desta seção relata os principais aspectos da utilização dos modelos lineares generalizados e análise de resíduos, utilizando-se de artigos práticos e teóricos, com o objetivo de obter-se informações sobre o assunto abordado.. 2.1 Modelo lineares generalizados Nelder e Wedderburn(1972) mostraram que uma série de técnicas estatísticas, usualmente estudadas separadamente, podia ser formulada, de uma maneira unificada como uma classe de modelos de regressão. A essa teoria unificadora de modelagem estatística, uma extensão dos modelos clássicos de regressão, deram o nome de modelos lineares generalizados. Além disso apresentaram um método iterativo para estimar os parâmetros, e ainda, introduziram o conceito de desvio, sendo muito importante na avaliação da qualidade do ajuste dos modelos, colaborando assim, com o desenvolvimento dos resíduos e técnicas de diagnósticos. Os modelos de quasi-verossimilhança, que ampliam a ideia dos MLG’s para situações mais globais incluindo dados correlacionados, foram propostos por Wedderburn (1974). Os modelos de dispersão (JORGENSEN, 1983) abrem várias possibilidades para a distribuição da variável resposta. Liang e Zeger (1986) estendem os modelos de quasi-verossimilhança supondo as equações de estimação generalizadas (EEGs) que possibilitam o estudo de variáveis aleatórias correlacionadas não gaussianas. Os modelos não lineares de família exponencial (CORDEIRO E PAULA, 1989 e WEI, 1998) admitem preditor não linear nos parâmetros. Quando se tem uma única variável aleatória Y , associada a um conjunto de variáveis explanatórias X1 , · · ·, Xp , pode-se usar os modelos lineares generalizados. A família exponencial de distribuições garante aos parâmetros uma estatística suficiente (FISHER, 1934). Sejam Y1 , . . . , Yn variáveis aleatórias independentes, cada uma com função densidade ou função de probabilidade dada por f (yi ; θi , φ) = exp[φ{yi θi − b(θi )} + c(yi , φ)],. i = 1, · · · , n. (2.1). quando, b(.) e c(.) são funções conhecidas para cada observação, b(θi ) é o parâmetro natural ou canônico e φ−1 > 0 é o parâmetro de dispersão (precisão). O MLG envolve os três componentes i) Componente aleatório - as variáveis respostas Y1 , Y2 . . . , Yn são independente e seguem.

(15) Capítulo 2. Fundamentação Teórica. 13. uma distribuição pertencente à família exponencial linear dado pela expressão (2.1), com médias µi e parâmetro de escala constante φ. ii) Componente sistemático - é representado por g(µi ) = ηi , sendo que, ηi = β0 + β1 Xi1 + β2 Xi2 + ... + βk Xik. (2.2). quando, ηi é o preditor linear, portanto, a parte sistemática que pode ser utilizada para realizar possíveis previsões para a equação da reta estimada. iii) Função de ligação - uma função que liga o componente aleatório ao componente sistemático, ou seja, relaciona a média ao preditor linear. Na ordem serão apresentadas as funções θ, φ, b(θ) e c(y, φ), das distribuições de probabilidade.. 2.1.1 Distribuição Normal Seja uma variável aleatória Y com distribuição Normal com média µ e variância σ , ou seja, Y ∼ N (µ, σ 2 ), a função de densidade é dada por 2. 1 1 µ2 1 y2 1 f (y) = √ exp{− 2 (y − µ)2 } = exp[{ 2 (µy − ) − {log 2πσ 2 + 2 }], 2σ σ 2 2 σ σ 2π em que, para θ = µ, b(θ) = θ2 /2 = µ2 /2, φ = σ −2 , e c(y, φ) = 1/2{log φ/2π − φy 2 /2}. A função de variância é dada por V (µ) = 1.. 2.1.2 Distribuição Poisson Uma variável aleatória Y com distribuição Poisson, Y ∼ P oisson(µ), tem função de probabilidade que é dada por P (Y = y) = e−µ µy /(y!) = exp{y log(µ) − µ − log(y!), onde, µ > 0 e y = 0, 1 . . .. Fazendo log(µ) = θ, b(θ) = eθ , φ = 1 e c(y, φ) = − log y!. A função de variância é dada por V (µ) = µ..

(16) Capítulo 2. Fundamentação Teórica. 14. 2.1.3 Distribuição Binomial Seja Y a proporção de sucessos em n ensaios independentes de Bernoulli. Assumindo que Y ∼ Binomial(n, µ). A função de probabilidades de Y é apresentada da seguinte forma . P (Y = y) = .  . . . .  . !. n  ny n  µ µ (1 − µ)n−ny = exp log  + ny log + n log (1 − µ) , 1−µ ny ny . . µ na qual, φ = 1, θ = log 1−µ , b(θ) = n log(1 − µ) e c(y, φ) = log é dada por V (µ) = µ(1 − µ)..   n y. . A função de variância. 2.1.4 Distribuição Gama Seja Y uma variável aleatória com média µ e coeficiente de variação φ−1/2 ou seja,Y ∼ Gama(µ, φ).A função densidade de Y é apresentada da seguinte forma:. 1 f (y) = Γ(φ). φy µ. !φ. (. ). (. !. φy −y exp − d(logy) = exp φ − log(µ) − log Γ(φ) + φ log(φy) − log y µ µ. onde, θ = −1/µ, φ = 1/(CV )2 , b(θ) = − log(−θ) e c(y, φ) = (φ−1) log y+φ log φ−log Γ(φ). A função de variância é dada por V (µ) = µ2 .. 2.1.5 Distribuição Normal inversa Seja Y uma variável aleatória com distribuição normal inversa de média µ e parâmetro de precisão φ, denotada por Y ∼ N I (µ, φ) e cuja função densidade é dada por 1. (. φ2 φ(y − µ)2 f (y) = √ exp − 2µ2 y 2πφy 3. −y 2  2µ. . ). = exp. + φ. 1 µ. . 1 1 − − log(2πφy 3 ) 2yφ 2. no qual, θ = −1/2µ2 , φ = σ 2 , b(θ) = 1/µ e c(y, φ) = (−1/2yφ) − (1/2) log(2πφy 3 ). Têm-se ainda que a função de variância V (µ) = µ3 . Na Tabela 1 apresentamos um resumo das distribuições.. ).

(17) Capítulo 2. Fundamentação Teórica. 15. Tabela 1 – Distribuições de probabilidade pertencentes à família exponencial Distribuição b(θ) Normal θ2 /2 Poisson eθ Binomial n log(1 − µ) Gama − log(−θ) Normal Inversa 1/µ. θ µ log µ log{µ/(1 − µ)} −1/µ −1/2µ2. φ σ −2 1 1 1/(CV )2 σ2. V (µi ) 1 µ µ(1 − µ) µ2 µ3. 2.2 Ligações canônicas Uma particularidade relevante ocorre quando o parâmetro canônico θ coincide com o preditor linear, obtém-se uma ligação canônica, isto é, quando θi = ηi Neste caso, L(β) = g −1 (ηi ) = g −1 (β0 + β1 xi1 + · · · + βk xik ). Um dos benefícios de usarmos ligações canônicas é que as mesmas garantem a concavidade de L(β) e consequentemente muitos resultados assintóticos são obtidos mais facilmente Paula(2013). As ligações canônicas para os modelos mais usuais estão apresentados na Tabela 2, a seguir. Tabela 2 – Distribuições de probabilidade da família exponencial e sua ligação canônica. Distribuição η Normal µ Poisson log µ Binomial log{µ/(1 − µ)} Gama 1/µ Normal Inversa 1/µ2. 2.3 Função Desvio Um dos objetivos da função desvio é analisar a adequação do modelo como um todo e a realização de uma investigação minuciosa quanto às discrepâncias locais que, no caso de serem significativas, podem levar a uma nova escolha do modelo inicialmente proposto. Uma das medidas existentes para verificarmos a bondade do ajuste é denominada desvio e equivale à diferença de log-verossimilhanças maximizadas. Ajustar um modelo estatístico a um determinado conjunto de dados é resumir razoavelmente a informação de n observações para p parâmetros, isto é, substituir um.

(18) Capítulo 2. Fundamentação Teórica. 16. conjunto de valores observados y por um conjunto de valores ajustados µ , com um número menor de parâmetros. O modelo mais simples, chamado de modelo nulo, contém apenas um parâmetro que representa a média µ comum a todas as observações do vetor y e o modelo saturado contém n parâmetros, um para cada observação. ˆ y) o máximo da log-verossimilhança para o modelo em estudo com p Seja L(µ; parâmetros L(y; y) e o modelo saturado com n parâmetros. A função desvio é escrita da seguinte forma: ˆ = 2{L(y; y) − L(µ; ˆ y)}. D∗ (y; µ) ˆ = φD(y; µ). (2.3). A palavra desvio é uma tradução de “deviance” feita por Cordeiro (1986), que serve para medir a distância dos valores ajustados aos dados.. 2.4 Função escore e Informação de Fisher 2.4.1 Escore e Fisher para β De acordo com Paula(2013), para a estimação dos β’s é preciso realizar a maximização da função do logaritmo da verossimilhança. Inicialmente calculamos as derivadas em relação ao parâmetro β, para assim obtermos a função escore ∂L ∂βj. n X. (. db(θi ) dθi dµi ∂ηi dθi dµi ∂ηi = φ yi − dµi dηi ∂βj dθi dµi dηi ∂βj i=1 = =. n X i=1 n X. ). φ{yi Vi−1 (dµi /dηi )xij − µi Vi−1 (dµi dηi )xij } (s. φ. i=1. ). wi (yi − µi )xij , Vi. em que, wi = (dµi /dηi )2 /Vi . Portanto, a função escore é escrita na forma matricial U (β) =. ∂L = φX T W 1/2 V −1/2 (y − µ), ∂β. (2.4). na qual, X é uma matriz n × p de posto completo e suas linhas serão demonstradas por XiT com i = 1, · · · , n, W = diag{w1 , · · ·, wn } sendo a matriz dos pesos, V = diag{V1 , · · · , Vn }, y = (y1 , · · ·, yn )T e também µ = (y1 , · · ·, µn )T . Precisa-se das derivadas para obter-se a matriz de informação de Fisher n X ∂ 2L d2 θi = φ (yi − µi ) 2 ∂βj ∂βl dµi i=1. n X. dµi dηi. !2. n X dθi d2 µi dθi +φ (yi − µi ) x x − φ 2 ij il dµi dηi i=1 i=1 dµi. xij xil. dµi dηi. !2. xij xil.

(19) Capítulo 2. Fundamentação Teórica. 17. no qual, os valores esperados são dados por n X. dθi E(∂ L/∂βj ∂βl ) = −φ i=1 dµi 2. = −φ = −φ. dµi dηi. !2. xij xil. n X. (dµi /dηi2 ) xij xil Vi i=1. n X. wi xij xil .. i=1. Portanto, escrevendo a informação de Fisher na forma matricial para β, têm-se: ∂ 2L K(β) = E − ∂β∂β T. !. = φX T W X.. (2.5). Para ligação canônica,onde (θ1 = n1 ), as equações tomam formas simplificadas, ou seja: U (β) = φX T (y − µ) e K(β) = φX T V X.. 2.4.2 Escore e Fisher para φ A função escore para o parâmetro φ é dada por: U (φ) = =. ∂L ∂φ n X. {yi θi − b(θi )} +. n X. c0 (yi , φ),. i=1. i=1. onde c0 (yi , φ) = dc(yi , φ)/dφ. Para obtenção da informação de Fisher para φ, calcula-se: P ∂ 2 L/∂φ2 = ni=1 c00 (yi , φ), onde c00 (yi , φ) = d2 c(yi , φ)/dφ2 . Portanto, a informação de Fisher para o parâmetro φ, é dada por K(φ) = −. n X. E{c00 (Yi , φ)}.. i=1. 2.5 Estimação dos parâmetros 2.5.1 Estimação de β A obtenção da estimativa de máxima verossimilhança de β através do processo iterativo de Newton-Raphson é determinada pela expansão da função escore Uβ em torno de um valor inicial β (0) , em que U (β) ∼ = U (β (0) ) + U 0 (β (0) )(β − β (0) ), onde U 0 (β) será a derivada primeira de U (β) em relação a β. Dessa forma, seguindo o método acima, chega-se ao processo interativo que é dado por (m). β (m+1) = β (m) + {(−U 0 β)−1 }(m) Uβ ,. com m = 0, 1, . . . ..

(20) Capítulo 2. Fundamentação Teórica. 18. Uma vez que a matriz −U 0 (β) pode não ser positiva definida, substituindo a matriz −U 0 (β) pelo correspondente valor esperado do método escore de Fisher, poderá ser mais adequada. Com isso, a equação do processo iterativo será:. β (m+1) = β (m) + K −1 (β (m) )U (β (m) ),. com m = 0, 1, . . . .. Substituindo as equações acima, chegaremos ao processo iterativo de mínimos quadrados ponderados β (m+1) = (X T W (m) X)−1 X T W (m) z (m) ,. (2.6). com m = 0, 1, · · · , z = η + W −1/2 V −1/2 (y − µ). A quantidade z desempenha o papel de uma variável dependente modificada, enquanto W é uma matriz de pesos que muda a cada passo do processo iterativo.. 2.5.2 Estimação de φ Segundo Paula(2013), igualando a função escore U (φ) a zero tem-se n X. n X 1 ˆ ˆ − {yi θ˜i − b(θ˜i )}, c (yi , φ) = D(y; µ) 2 i=1 i=1 0. ˆ mostra o desvio do modelo de interesse. De acordo com o modelo que no qual, D(y; µ) estiver sendo trabalhado é necessário trabalhar coma expressão acima para chegar a um estimador para o parâmetro φ.. 2.6 Testes de Hipóteses De acordo com Paula(2013) apresentamos a seguir as generalizações para MLG’s, com a seguinte situação de hipóteses simples: H0 : β = β 0 contra H1 : β 6= β 0 , onde, β 0 é um vetor p-dimensional conhecido e φ também conhecido. i) Teste da razão de verossimilhanças No caso de hipóteses simples, o teste da razão de verossimilhança é dada por: ˆ − L(β 0 )}. ξRV = 2{L(β) Segundo Paula (2013) essa estatística pode ser expressa, para os MLGs, como a diferença entre duas funções desvio ˆ 0 ) − D(y; µ)}, ˆ ξRV = φ{D(y; µ.

(21) Capítulo 2. Fundamentação Teórica. 19. em que, µˆ0 = g −1 (ηˆ0 ) , ηˆ0 = Xβ 0 . Para o caso normal linear,temos: ξRV = {. n X. n X. i=1. i=1. (yi − µ ˆ0i )2 −. (yi − µ ˆi )2 }/σ 2 .. ii) Teste de Wald O teste de Wald é dado por: ∧. ∧. ∧. ∧. ξW = [β −β 0 ]T V ar−1 (β)[β −β 0 ], ∧. ∧. d β) mostra a matriz de variância-covariância assintótica de (β) estimada onde, var( ∧. ∧. ∧. ∧. em (β). Para os MLGs, V ar(β) = K −1 (β), A estatística de Wald ficará na forma: ∧. ∧. ∧. [ξW = φ[β −β 0 ]T (X T W X)[β −β 0 ]. Particularmente quando p = 1, o teste de Wald é equivalente ao teste usual t2 2. ∧. ξW =. (β −β 0 ) ∧. ∧. V ar(β) d Há um problema com a estatística de Wald, principalmente quando duas formas var diferentes e equivalentes para nβ, podem levar a diferentes valores de ξW .. iii) Teste de escore ∧. O teste de escore é definido quando Uβ (β) = 0 então ∧. ∧. ξSR = φ−1 Uβ (β 0 )T V ar0 (β)Uβ (β 0 ) ∧. ∧. d β) é denotada pela variância assintótica de β que está sendo estimada , sendo que, var( sob H0 . Para os MLGs temos: ∧. ξSR = φ−1 Uβ (β 0 )T (X T W0 X)−1 Uβ (β 0 ), ∧. e aqui W0 é estimado sob H0 . A estatística de escore é conveniente quando a hipótese alternativa é mais complexa do que a hipótese nula. Portanto seria necessário estimarmos os parâmetros sob H1 quando o modelo em H0 for rejeitado. iv) Teste F A estatística F para o caso de hipótese simples é dado por: F =. ˆ {D(y; µˆ0 ) − D(y; µ)}/p , ˆ D(y; µ)/(n − p). onde φ → ∞ e sob H0 temos F ∼ F[p,n−p] . Essa expressão vale também para n → ∞, quando tem-se no denominador da estatística F uma estimativa consistente para φ−1 . A vantagem de se utilizar a estatística F é que o teste não depende do parâmetro de dispersão φ−1 ..

(22) Capítulo 2. Fundamentação Teórica. 20. 2.7 Técnicas de diagnóstico Destacaremos a seguir algumas técnicas de diagnósticos utilizadas para avaliação da qualidade do ajuste de modelos lineares generalizados. 2.7.1 Pontos de alavanca De acordo com Laurente Cook (1992), o objetivo principal de ponto de alavanca é avaliar a influência de yi sobre o seu valor ajustado yˆi . Pode-se representar essa influência pela derivada ∂ yˆi /∂yi . Wei, Hu e Fung (1998) propuseram uma forma geral para obtenção ˆ /∂yT )(n×n) que é utilizada quando a resposta é contínua e que pode ser da matriz (∂ y aplicada em muitas situações de estimação. Para os MLGs quando φ for conhecido, a matriz (∂ yˆ/∂yT ) é dada por: d = GL. ˆ ∂y ¨ )−1 L ¨ }| , = {Dβ (−L ββ βy β ∂yT. T 2 2 T ¨ ¨ onde, Dβ = ∂µ/∂β, L β β = ∂ L(β)/∂β∂β , e Lβ y = ∂ L(β)/∂β∂y . Então, temos: T −1 ¨ Dβ = NX e L βy = φX V N,. ¨ sendo que N = diag{dµ1 /dη1 , · · ·, dµn /dηn }.Substituindo −L ββ por seu valor esperado dado por φ(XT WX), temos aproximadamente T ˆ d = NX(X ˆ ˆ −1 N. ˆ GL WX)−1 XT V. d pode ser escrito da seguinte forma: Assim, GL ii −1 d =w ˆ GL ˆi xTi (XT WX) xi , ii T ¨ em que wi = (dµ1 /dη1 )2 /Vi . Para a ligação canônica, em que −L ββ = φ(X VX) obtemos. d =V ˆ X(XT VX) ˆ −1 XT . GL. Outra descrição bastante usada na classe dos MLGs, mesmo que não coincida com a demonstração acima, exceto no caso de resposta contínua e ligação canônica, é possível detectar os pontos de alavanca fazendo uma analogia entre a solução de máxima ∧. verossimilhança para β e a solução de mínimos quadrados de uma regressão normal linear ∧. ponderada. A demonstração para β obtida na convergência do processo iterativo mostrado em (2.6) é dado da seguinte forma: ˆ = (XT VX) ˆ −1 XT Wˆ ˆ z, β.

(23) Capítulo 2. Fundamentação Teórica. 21 ∧. ˆ −1/2 V ˆ −1/2 (y − µ em que, ˆ z = ηˆ + W ˆ). De acordo com Paula(2013) β pode ser interpretado ˆ 1/2 z ˆ contra as como sendo a solução de mínimos quadrados da regressão linear de W ˆ 1/2 X.Dessa forma, a matriz de projeção da solução de mínimos quadrados colunas de W ˆ dada por: da regressão linear de ˆ z contra X com os pesos de Wé ˆ 1/2 , ˆ =W ˆ 1/2 X(XT VX) ˆ −1 XW H ˆ ii da diagonal principal de H ˆ para detectarmos que recomenda a utilização dos elementos h a presença de pontos de alavanca nesse modelo de regressão normal linear ponderada. d ,isto é, para grandes amostras GL d eH ˆ ii = GL ˆ são iguais. Como Podemos averiguar que h ii ˆ ii depende de µ ˆ ii h ˆii , propomos a detecção de pontos de alavanca por meio do gráfico de h contra os valores ajustados. Hosmer e Lemeshow (1989) evidenciam que o uso da diagonal ˆ tem as interpretações diferentes daquelas do caso normal principal da matriz de projeção H linear.. 2.7.2 Resíduos De acordo com Cordeiro e Lima Neto (2006), no contexto dos MLG’s os resíduos são usados para explorar a adequação do modelo ajustado com respeito a escolha da função de variância, da função de ligação e dos termos do preditor linear. Assim, os resíduos são importantes para indicar a presença de pontos aberrantes, que poderão ser influentes ou não. Segundo Paula (2013) a definição de um resíduo padronizado para os MLGs pode ser feita analogamente à regressão normal linear, em que as propriedades não necessariamente continuam valendo É importante que se tenha outros tipos de resíduo onde suas propriedades sejam conhecidas ou pelo menos estejam mais próximas das propriedades de t∗i . A expressão é dada por: t∗i. = ti. n−p−1 n − p − t2i. !1/2. ,. em que, t∗i segue uma distribuição tn−p−1 . Sendo ti = P que s2 = ni=1 ri2 /(n − p).. ri s(1−hi )1/2. com i = 1, · · ·, n e ainda. O resíduo ordinário da solução de mínimos quadrados da regressão linear ponderada de ˆ z contra X, é dado por: ˆ 1/2 [ˆ ˆ −1/2 (y − µ ˆ] = V r∗ = W z−η ˆ ). ˆ −1 φ−1 , têm-se aproximadamente que V ar(r∗ ) ∼ Assumindo que V ar(z) ∼ = W = −1 ˆ φ (In − H). Assim o resíduo padronizado é definido por: φ−1/2 (yi − µ ˆi ) tSi = q , ˆ ˆ Vi (1 − hii ).

(24) Capítulo 2. Fundamentação Teórica. 22. ˆ ii é i-ésimo elemento da diagonal principal da matriz H,que r∗ = (In − H) ˆ W ˆ 1/2ˆ sendo que,h z, ˆ exerce a função de projeção ortogonal local, como na regressão normal quer dizer, H ˆ não é fixo nem conhecido e z não segue linear, em que W será a identidade. Contudo, η distribuição normal. Consequentemente, as propriedades de t∗i não podem ser mais verificadas para tSi . Williams (1984) aponta por meio de estudos de Monte Carlo, que tSi em geral é assimétrico, até para amostras grandes. Têm sido sugeridos para os MLGs outros resíduos das quais distribuições poderiam estar mais próximas da normalidade. Então o resíduo de Anscombe é definido como: tAi =. φ1/2 {ψ(yi ) − ψ(ˆ µi )} , 1/2 0 Vˆ (ˆ µi )ψ (ˆ µi ). no qual,ψ(·)é uma transformação explorada para normalizar a distribuição de Y . Portanto, essa transformação para MLG’s é dada por: ψ(µ) =. Z µ 0. −1/3. V(t). dt.. Para os principais MLGs o resíduo de Ascombe é apresentado na Tabela 3. Tabela 3 – Resíduo de Ascombe para as principais distribuições.. ψ(µ). Normal µ. Distribuição Poisson Binomial Gama R µ −1/3 3 2/3 −1/3 µ t (1 − t) dt 3µ1/3 0 2. Normal Inversa log µ. Os resíduos mais utilizados em modelos lineares generalizados são definidos a partir dos componentes da função desvio, com a padronização de McCullagh (1987), Davison e Gigli (1989), tem-se: d∗ (yi ; µ ˆi ) φ1/2 d(yi ; µ ˆi ) tDi = q = q ˆ ii ˆ ii 1−h 1−h √ ˆ + (b(θˆi ) − b(θ˜i ))}1/2 , sendo o sinal de d(yi ; µ no qual, d(yi ; µ ˆi ) = ± 2{yi (θ˜i − θ) ˆi ) o mesmo de yi − µ ˆi . Verificou-se através de simulações que a distribuição de tDi está mais próxima da normalidade do que as distribuições dos outros resíduos (Williams 1984). Para os MLGs a distribuição de probabilidades apresenta uma aproximação N (0, 1) d∗ (Yi ; µi ) + ρ3i /6 q. 1 + (14ρ23i − 9ρ4i )/36. onde, ρ3i e ρ4i são os coeficientes de assimetria e curtose de ∂L(ηi )/∂ηi , e d∗ (Yi ; µi ), será o i-ésimo componente associado ao desvio D∗ (y; µ) do parâmetro verdadeiro..

(25) Capítulo 2. Fundamentação Teórica. 23. Definido por Williams (1987), o desvio residual ponderado que pode ser interpretado como uma média ponderada entre tSi e tDi , e é apresentado a seguir ˆ ii )t2 + hii t2 }1/2 . tGi = sinal(yi − µ ˆi ){(1 − h Di Si Williams (1987) verificou através de simulações e para alguns MLGs que tGi apresenta esperança diferente de zero, e variância acima de um, assimetria desprezível e alguma curtose. Pressupondo φ conhecido, o afastamento pela verossimilhança uma vez eliminada a i-ésima observação é compreendido por: ˆ − L(β ˆ (i) )}, LDi = 2{L(β) em que LDi será uma medida de verificação que constata a influência da retirada da i-ésima ˆ observação em β. Se não for possível obter uma forma analítica para Di , é comum valer-se da segunda ˆ Essa expansão acarreta na seguinte expressão: aproximação por série de Taylor em torno β. ˆ T {−L ˆ ˆ ¨ (β)}(β LDi ∼ − β). = (β − β) ββ ˆ pelo correspondente valor esperado β por β, ˆ temos ¨ (β) Substituindo −L ββ ˆ −β ˆ )T (XT WX)( ˆ −β ˆ ). ˆ LDi ∼ β = φ(β (i) (i). (2.7). Assim, consegue-se uma proximidade para LDi quando L(β) for sensivelmente quadrática ˆ em torno de β. Uma vez que geralmente é impossível obtermos uma forma fechada para β (i) ,a aproximação de um passo tem sido empregada (ver, por exemplo, Cook e Weisberg, 1982), que traduz-se em tomarmos a primeira iteração do processo iterativo pelo método escore de Fisher quando o mesmo é iniciado em β. Essa aproximação, posta por Pregibon (1981), é dada por: ˆ1 = β ˆ + {−L ˆ −1 L(i) (β), ˆ ¨ (β)} β (i) ββ e aqui, L(i) (β) é o logaritmo da função de verossimilhança sem a i-ésima observação. ˆ por K(β) ˆ tem-se ¨ (β) Permutando novamente −L ββ √ −1 1 rˆpi wφ ˆ −1 ˆ ˆ ˆ β (i) = β − (XT WX) xi . (2.8) ˆ ii ) (1 − h Assim, substituindo a expressão acima em (2.7), a equação pela distância generalizada de Cook é dada por: LDi.  . . ˆ ii  h ∼ t2 . = ˆ ii )  Si (1 − h.

(26) Capítulo 2. Fundamentação Teórica. 24. A validade da aproximação de um passo tem sido motivo de investigação por pesquisadores. A confirmação é que a mesma em geral subestima o verdadeiro valor de LDi , no entanto basta para chamar a atenção dos pontos influentes.. 2.7.3 Influência local A metodologia de influência local pode ser prontamente estendida para a classe de MLGs. Em particular, se supuser φ conhecido e perturbação de casos em que L(β|δ) = Pn i=1 Li (β) com 0 ≤ δi ≤ 1 portanto a matriz δ assume a forma ∆=. q. ˆ 1/2 D(ˆ φX T W rp),. √ √ em que, D(ˆ rp) = diag{ˆ rp1,..., rˆpn } e rˆp1 = φ(yi − µ ˆ) vˆi é o i-ésimo resíduo de Pearson ¨ ββ por φ(X T W X) tem-se que a curvatura normal estimado. Dessa forma, ao substituir −L na direção unitária l assume a forma ˆ rp)l|. Cl (β) = 2|lT D(ˆ rp)HD(ˆ Para calcular a curvatura normal na direção li da i-ésima observação, então avaliaˆ ii rˆ2 . mos o gráfico de índices de Ci = 2h pi Especialmente, o vetor lmax para avaliarmos a influência local das observações nas estimativas dos parâmetros é o autovetor condizente com o maior autovalor da seguinte matriz n × n ˆ rp). B = D(ˆ rp)HD(ˆ Para se obter lmax , a maneira mais simples é construirmos a matriz B e extrairmos o seu autovetor correspondente ao maior autovalor. Se tem-se interesse em detectar observações influentes na estimativa de um coeficiente particular, associado por exemplo à variável explicativa X1 , o vetor lmax é dado por: v1 − rˆp1 vn − rˆpn T lmax = √ , ..., √ Clmax Clmax em que, v1 , ..., vn são agora obtidos da regressão linear de X1 contra as colunas de X2 com matriz de pesos Vˆ , desta forma V = Vˆ 1/2 X1 − Vˆ 1/2 X2 (X2T Vˆ X2 )−1 X2T Vˆ X1 . Os resultados continuam valendo contanto que para ligação não canônica a matriz observada de Fisher seja substituída pela matriz de informação de Fisher.. 2.7.4 Técnicas gráficas As técnicas gráficas mais recomendadas para os MLGs são:.

(27) Capítulo 2. Fundamentação Teórica. 25. i) Gráficos de tDi contra a ordem das observações, contra os valores ajustados e contra as variáveis explicativas, ou contra o tempo ou alguma ordem onde há suspeita de correlação entre as observações; ii) Gráfico normal de probabilidades para tDi com envelope; iii) Gráfico de zˆi contra ηˆi para verificação da adequação da função de ligação (uma tendência linear indica adequação da ligação); iv) Gráficos de LDi , Ci ou |`max | contra a ordem das observações. Em Williams (1987), os envelopes, no caso de MLGs com distribuições diferentes da normal, são construídos com os resíduos sendo gerados a partir do modelo ajustado..

(28) 26. 3 Material e métodos Os dados utilizados neste trabalho foram de um experimento conduzido em campo, cujas coordenadas são 20o 20’41” S e 51o 24’09” O na Fazenda de Ensino, Pesquisa e Extensão (FEPE), da Faculdade de Engenharia de Ilha Solteira, da Universidade Estadual Paulista (UNESP), localizada no município de Selvíria - MS, no ano agrícola de 2012. O delineamento utilizado foi de blocos casualizados em esquema fatorial de parcelas subdivididas no tempo, com 77 tratamentos e 4 repetições. Os tratamentos foram originados da combinação de 7 táticas de manejo (T1Sementes tratadas com inseticida; T2-Sementes tratadas com inseticida1 + pulverização com a presença de 20% de folíolos com pelo menos um tripes; T3-Sementes tratadas com inseticida1 + pulverização com a presença de 30% de folíolos com pelo menos um tripes; T4-Sementes tratadas com inseticida1 + pulverização com a presença de 40% de folíolos com pelo menos um tripes; T5-Tática do produtor: sementes tratadas com inseticida1 + pulverização a cada 15 dias no período de 30 a 105 dias após emergência das plantas; T6- Pulverização com a presença de 30% de folíolos com pelo menos um tripes e T7-Testemunha - Sem controle do tripes) e 11 períodos de aplicação das táticas que compreendiam período de 10 a 110 dias, espaçados em 10 dias. Durante as amostragens, realizadas a partir dos 10 dias após emergência das plantas, foram coletados, ao acaso, 10 folíolos fechados ou semi-abertos por parcela, do terço superior das plantas, nas três linhas centrais. Os folíolos foram levados para o Laboratório de Entomologia para contagem de adultos e ninfas do tripes do prateamento com auxílio de um microscópio estereoscópio. No decorrer das amostragens, realizadas em campo, utilizou-se uma escala de notas para quantificar os sintomas de injúrias causadas pelos tripes às plantas de amendoim. A escala de notas proposta por Moraes et al. (2005) que recomendam atribuir visualmente às plantas com notas que variam de 1 a 5, caracterizadas de acordo com os sintomas(variável resposta): nota 1-folíolos com ausência de sintomas; nota 2-folíolos com poucas pontuações prateadas, sem deformações; nota 3-folíolos com poucas pontuações prateadas, com início de enrolamento das bordas dos folíolos; nota 4-folíolos com pontuações prateadas generalizadas, com enrolamento das bordas e; nota 5-folíolos com pontuações prateadas generalizadas, com encarquilhamento total desses folíolos. O modelo ajustado aos dados foi o modelo Quase-Poisson, do qual, pressupondo que Y ∼ P (λ) da qual a função de probabilidades é dada por Pr(Y = y) =. e−λ − λy , y = 0, 1, 2, ..... y!.

(29) Capítulo 3. Material e métodos. 27. Pode-se mostrar que quando λ → ∞ √ (y − λ)/ λ→d N (0, 1). De outro modo, para λ grande temos que Y segue aproximadamente uma distribui√ ção normal de média λ e desvio padrão λ. Ainda assim, se queremos aplicar um modelo normal linear para explicar λ, teremos o inconveniente do desvio padrão depender da média, o que inviabiliza o uso de um modelo normal linear homocedástico. Uma maneira de contornarmos esse problema é através da aplicação de uma transformação na resposta Y de maneira a alcançarmos a normalidade e a constância de variância, mesmo que aproximadamente. Assim, se Y é Poisson, segue que quando λ → ∞ tem-se √ √ { Y − E( Y )}→d N (0, 1/4). √ √ Então, quando λ é grande, a variável aleatória 2{ Y − E( Y )} segue aproximadamente uma distribuição N (0, 1). Desta forma, se temos uma amostra aleatória Y1,..., Yn visto que Yi ∼ P (λi ) e queremos explicar λi através de variáveis explicativas, podemos propor para λi grande, o modelo normal linear abaixo q. Yi = XiT β + εi ,. em que, εi ∼ N (0, σ 2 ), i = 1, ..., n. De acordo com Paula (2013) supondo que Yi são variáveis aleatórias independentes distribuídas tais que Yi ∼ P (µi ), i = 1, ..., n com parte sistemática dada por g(µi ) = ni , em que ni = xTi β,xi = (xi1 , ..., xip ) contém valores de variáveis explicativas e β = (β1 , ..., βp )T é um vetor de parâmetros desconhecidos. As ligações mais usadas são logarítmica (g(µi ) = √ logµi ), raiz quadrada (g(µi ) = µi ) e identidade (g(µi ) = µi ). O processo iterativo para estimação de β é dado por: β m+1 = (X T W (m) X)−1 X T W (m) Z (m) , sendo m = 0, 1, ..., variável dependente modificada, Z = η + W −1/2 V −1/2 (y − µ), η = (n1 , ..., nn )T , Y = (y1 , ..., yn )T , µ = (µ1 , ..., µn )T ,V = diag{µ1 , ..., µn } e W = diag{wi , ..., wn } como Wi = (dµ1 /dni )2 /µ1 . Então temos, wi = µi para ligação logarítmica, wi = 4 para ligação raiz quadrada wi = µi −1 para ligação identidade. No caso das unidades experimentais serem observadas em tempos distintos ti , s e for assumido que Yi ∼ P (λi ti ), i = 1, ..., n, a parte sistemática do modelo para ligação logarítmica é dada por logµ1 = log ti + xTi β, onde, logti desempenha papel de offset e isso deve ser informado ao sistema. Outra possibilidade é incluirmos os tempos logti como valores da variável explicativa logti . Nesse.

(30) Capítulo 3. Material e métodos. 28. caso, a parte sistemática assume a forma logµ1 = θ log ti + xTi β O estimador de máxima verossimilhança βb é consistente, eficiente e tem distribuição assintótica dada por: βb − β ∼ Np (0, (X T W X)−1 ) b = (X T W X)−1 . assim, assintoticamente, V ar(β). O modelo Quase-Poisson utiliza como método de estimação dos parâmetros a quase-verossimilhanca. A diferença principal entre os modelos de Poisson e Quase-Poisson é que o primeiro assume que o parâmetro de dispersão é igual a 1, enquanto que o segundo não fixa essa quantidade, permitindo que a mesma seja estimada. Além disso, no modelo Quase-Poisson não é especificado uma distribuição de probabilidade. Com isso, a variância do modelo Quase-Poisson é dada por: V ar(Y ) = φV (µ). sendo φ 6= 1..

(31) 29. 4 Resultados e Discussão. 5. Serão apresentados os principais resultados obtidos a partir da análise realizada com a variável resposta Sintomas, do experimento em blocos ao acaso com 77 tratamentos combinados em um delineamento em parcelas subdividas.. MANEJO 7 4. 1 4 2 5 3. 6. 1. 2. Média dos Sintomas. 3. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Avaliações. Figura 1 – Representação gráfica da interação entre Manejo e Avaliações Na Figura 1, percebe-se que existem fortes evidências da presença de interação entre as avaliações e o manejo adotado no experimento, isto se deve ao fato que, os números de adultos foram maiores nas táticas tratamento de semente e testemunha durante o ciclo da cultura. Quando as plantas foram protegidas pela aplicação de inseticida com nível de 30% de folíolos infestados, com pelo menos 1 tripes e tratamento de sementes mais aplicação de inseticida com nível de 40% de folíolos infestados verificou-se uma redução da população de adultos dos tripes. Nas táticas de manejo, envolvendo tratamento de sementes mais aplicação de inseticida com níveis de 20% e 30% de infestação, e tática do produtor, caracterizada pelo tratamento de sementes mais aplicação de inseticida a cada 15 dias, no período de 30 a 105 dias após emergência das plantas, foram observadas as menores médias de adultos durante o período de 10 a 110 dias. Chagas Filho et al. (2008) indicam a aplicação de inseticida a cada 10 dias, durante o ciclo da cultura, como a melhor tática de controle do tripes do prateamento. Levando-se em consideração a presença da interação, realizou-se uma análise de desvio utilizando o modelo Quase-Poisson, sendo este último mais adequado para descrever os dados em estudo devido aos valores encontrados do desvio residual do modelo e ao.

(32) Capítulo 4. Resultados e Discussão. 30. comparar-se com respectivos graus de liberdade por meio do teste de Qui-quadrado o modelo de Quase-Poisson se ajustou (293 g.l. e 23,44 de desvio residual o que gerou um valor p de 1). Tabela 4 – Análise de desvios do modelo Quase-Poisson com função de ligação logarítmica ajustado para a variável resposta sintomas Blocos Manejo Avaliação Manejo:Avaliação. G.L. Deviance 1 376,60 7 119,40 1 36,59 6 5,98. G.L. Resid. Dev. Resid. F Pr(>F) 307 185,41 4727,61 < 0, 0001∗ 300 66,02 214,12 < 0, 0001∗ 299 29,43 459,33 < 0, 0001∗ 293 23,44 12.52 < 0, 0001∗. Por meio do desvio residual apresentado na Tabela 4, pode-se concluir que existem evidências de que o modelo usado pode ser utilizado para descrever os dados em estudo. Há necessidade, porém, de se utilizar outras técnicas de diagnósticos como complementação e suporte aos resultados encontrados. Tabela 5 – Estimativas dos parâmetros do modelo Quase-Poisson com função de ligação logarítmica ajustado para a variável resposta sintomas Fontes de Variação Estimativas Blocos 0,0048 Manejo 1 0,2298 Manejo 2 0,2726 Manejo 3 0,3340 Manejo 4 0,3958 Manejo 5 0,5887 Manejo 6 0,5772 Manejo 7 0,6905 Avaliação 0,1087 Manejo 2:Avaliação -0,0529 Manejo 3:Avaliação -0,0417 Manejo 4:Avaliação -0,0201 Manejo 5:Avaliação -0,0794 Manejo 6:Avaliação -0,0810 Manejo 7:Avaliação -0,0193. Erro padrão 0,0092 0,0705 0,0754 0,0721 0,0677 0,0683 0,0688 0,0595 0,0087 0,0131 0,0127 0,0121 0,0126 0,0127 0,0113. Valor t 0,52 3,26 3,61 4,64 5,85 8,62 8,39 11,61 12,55 -4,02 -3,29 -1,66 -6,31 -6,40 -1,70. Pr(>|t|) 0,6046 0,0012∗ 0,0004∗ < 0, 0001∗ < 0, 0001∗ < 0, 0001∗ < 0, 0001∗ < 0, 0001∗ < 0, 0001∗ 0,0001∗ 0,0011∗ 0,0976 < 0, 0001∗ < 0, 0001∗ 0,0895. A partir das estimativas dos parâmetros do modelo Quase-Poisson com ligação logarítmica, pode-se afirmar que houve efeito de interação entre o manejo e as avaliações, sendo esta interação negativa, inversamente proporcional aos valores de Sintomas como foi mostrado na Tabela 5. Na Figura 2, apesar da dispersão dos dados nos gráficos de distância de Cook e da Medida h, não se pode afirmar que tenha algum valor discrepante que mereça maior atenção, isto porque no Gráfico de Resíduo Componente do Desvio versus Índice todos os valores ficaram acomodados dentro do limiar de −2 a 2. Apesar de pelo teste Qui-quadrado.

(33) 31. 0.03 0.02. Distância de Cook. 0.01. 0.06 0.02. 0.00. 0.04. Medida h. 0.08. 0.04. 0.10. 0.05. Capítulo 4. Resultados e Discussão. 2. 3. 4. 5. 0. 50. 100. 150. 200. 250. 1.2. 1.4. 300. Índice. 0.5. 1.0. Variavel z. 1 0. 0.0. −1. Resíduo Componente do Desvio. 1.5. 2. Valor Ajustado. 0. 50. 100. 150 Índice. 200. 250. 300. 0.4. 0.6. 0.8. 1.0. 1.6. Preditor Linear. Figura 2 – Gráfico de diagnóstico dos dados ajustados ao modelo Quase-Poisson para a variável sintomas o modelo estar bem ajustado, percebe-se que pelo gráfico do preditor linear versus a variável Z, a relação não é uma reta o que pode indicar uma baixa precisão nas inferências no que tange a valores preditos. Os Modelos Lineares Generalizados com função de ligação logarítmica apresentam a seguinte forma para interpretação dos coeficientes estimados yˆ = exp(0, 0048Bl + 0, 2298M1 + 0, 2726M2 + 0, 3340M3 + 0, 3958M4 + 0, 5887M5 + 0, 5772M6 + 0, 6905M7 + 0, 1087AV − 0, 0529M2 × AV − 0, 0417M3 × AV − 0, 0201M4 × AV − 0, 0794M5 × AV − 0, 0810M6 × AV − 0, 0193M7 × AV ). Desse modelo podemos extrair a seguinte interpretação na qual exp(−0, 0529) = 0, 94 correspondente a uma redução média de (1−0, 94)×100 = 6% nos Sintomas quando se toma como base a interação de avaliação com Manejo 2, assim como exp(−0, 0417) = 0, 95 correspondente a uma redução média de 5% e exp(−0, 0794) = 0, 92 correspondente a uma redução média de 8% e exp(−0, 0810) = 0, 92 correspondente a uma redução média de 8%..

(34) 32. 5 Conclusão Por meio deste trabalho verificou-se a importância da aplicação dos modelos lineares generalizados, pois se constitui de uma técnica bastante confiável para descrever o objeto em estudo. Nas análises realizadas, o modelo que melhor se ajustou aos dados foi Quase-Poisson. Porém, há necessidade de utilizar outras técnicas de diagnósticos como complementação e suporte aos resultados encontrados. Sendo assim, a partir das estimativas dos parâmetros do modelo Quase-Poisson com ligação logarítmica, pode-se afirmar que houve efeito de interação entre o manejo e as avaliações, sendo esta interação negativa, inversamente proporcional aos valores de sintomas..

(35) 33. 6 Referências Bibliográficas CHAGAS FILHO, N. R. Estratégias de manejo integrado em cultivo de amendoim, de hábitos de crescimento ereto e rasteiro, para o controle do tripes Enneothrips flavens Moulton, 1941. 2008 100 f. Tese (Doutorado em Entomologia Agrícola) - Faculdade de Ciências Agrárias e Veterinárias, Universidade Estadual Paulista, Jaboticabal, 2008. COOK, R. D.; WEISBERG, S. Residuals and inuence in regression. Chapman and Hall, London. 1982. CORDEIRO, G.; NETO, E. L. Modelos Paramétricos. Recife: Universidade Federal Rural de Pernambuco, Departamento de Estatística e Informática, 2006. CORDEIRO, G. M.; PAULA, G. A. Improved likelihood ratio statistics for exponential family nonlinear models. Biometrika, p. 76, 93–100, 1989. CORDEIRO, G. M. Modelos lineares generalizados. VII SINAPE, UNICAMP. 1986. DAVISON, A. C.; GIGLI, A. Deviance residuals and normal scores plots. Biometrika, 76,p. 211–221, 1989. DIOLINO NETO, J.; TÁVORA, F. J. A. F.; SILVA, F. P.; SANTOS, M. A.; MELO, F. I. O. Componentes de produção e produtividade do amendoim submetidos a diferentes populações e configurações de plantio. Revista Brasileira de Oleaginosas e Fibrosas, Campina Grande, v. 2, p. 113-122, 1998. FUNDERBURG, J.E.; BRANDENBURG, R.L. Management of insects and other arthropods in peanut. In: Melouk, H.A.; Shokes, F. M. (Eds.) Peanut Health Management. St. Paul: APS PRESS, 51-59) (Plant Health Management Series). 1995. FISHER, R. Two new properties of mathematical likelihood. Philosophical Transactions of the Royal Society A, v. 144, p. 285,307, 1934. HOSMER, D. W.; LEMESHOW, S. Applied Logistic Regression. John Wiley, New York, 1989. JORGENSEN, B. Maximum likelihood estimation and large-sample inference for generalized linear and nonlinear regression models. Biometrika, p. 70, 19–28, 1983. ST. LAURENT, R. T. AND COOK, R. D. Leverage and superleverage in nonlinear regression. J. Amer. Stat. Assoc. 87, 985-990. 1992. LIANG, K. Y.; ZEGER, S. L. Longitudinal data analysis using generalized linear models. Biometrika, p. 73, 13–22, 1986. MCCULLAGH, P. Tensor Methods in Statistics. Chapman and Hall, London, 1987..

(36) Capítulo 6. Referências Bibliográficas. 34. MOIVRE, A. The doctrine of chances: or, a method of calculating the probabilities of events in play. London: Millar. 3.ed., 348 p., 1756. MORAES, A. R. A. ; LOURENÇÃO, A L.; GODOY, I. J.; TEIXEIRA, G. C. Infestation by Enneothrips flavens Moulton and yield of peanut cultivars. Revista Scientia Agricola, Piracicaba, SP, v. 62, n. 5, p. 469-472, 2005. NELDER, J.; WEDDERBURN, R. Generalized Linear Models. Journal of the Royal Statistical Society A, v. 135, p. 370,384, 1972. PAULA, G. A. de. Modelos de Regressão com apoio computacional. São Paulo, 2013. Disponível em: < http : //www.ime.usp.br/ giapaula/texto2 013.pdf >. PREGIBON, D. Logistic regression diagnostics. Annals of Statistics 9, p. 705–724, 1981. WEDDERBURN, R. W. M. Quasi-likelihood functions, generalized linear models and the Gauss-Newton method. Biometrika, p. 61, 439–447, 1974. WEI, B.; HU, Y.; FUNG, W. Generalized leverage and its applications. Scandinavian Journal of Statistics, v. 25, p. 25–37, 1998. WILLIAMS, D. A. Residuals in generalized linear models. In: Proceedings of the 12th. International Biometrics Conference, Tokyo, 1984. WILLIAMS, D. A. Generalized linear model diagnostic using the deviance and single case deletion. Applied Statistics 36, 1987..

(37)

Referências

Documentos relacionados

O relatório encontra-se dividido em 4 secções: a introdução, onde são explicitados os objetivos gerais; o corpo de trabalho, que consiste numa descrição sumária das

libras ou pedagogia com especialização e proficiência em libras 40h 3 Imediato 0821FLET03 FLET Curso de Letras - Língua e Literatura Portuguesa. Estudos literários

Além desta verificação, via SIAPE, o servidor assina Termo de Responsabilidade e Compromisso (anexo do formulário de requerimento) constando que não é custeado

de professores, contudo, os resultados encontrados dão conta de que este aspecto constitui-se em preocupação para gestores de escola e da sede da SEduc/AM, em

Em pesquisa realizada pelo Instituto Brasileiro de Opinião Pública e Estatística (IBOPE), em 2011 o consumo de artigos infantis movimentou cerca de R$26,2 bilhões, sendo que mais

(...) o controle da convencionalidade em sede internacional seria um mecanismo processual que a Corte Interamericana de Direitos Humanos teria para averiguar se o direito

Como já foi dito neste trabalho, a Lei de Improbidade Administrativa passa por uma releitura doutrinária e jurisprudencial, visando delimitar de forma precisa os tipos ímprobos,

Portanto, mesmo percebendo a presença da música em diferentes situações no ambiente de educação infantil, percebe-se que as atividades relacionadas ao fazer musical ainda são