• Nenhum resultado encontrado

Comparação de cinco tipos de snacks

No documento MODELOS DE REGRESSÃO com apoio computacional (páginas 161-167)

2.7 Modelos com resposta normal inversa

2.8.1 Comparação de cinco tipos de snacks

Vamos considerar nesta seção parte dos dados de um experimento desenvol- vido no Departamento de Nutrição da Faculdade de Saúde Pública da USP em que 5 formas diferentes de um novo tipo de snack, com baixo teor de gordura saturada e de ácidos graxos, foram comparados ao longo de 20 se- manas. Neste novo produto a gordura vegetal hidrogenada, responsável pela fixação do aroma do produto, foi substituída, totalmente ou parcialmente, por óleo de canola. As formas são as seguintes: A (22% de gordura, 0% de óleo de canola), B (0% de gordura, 22% de óleo de canola), C (17% de gordura, 5% de óleo de canola), D (11% de gordura, 11% de óleo de canola) e E (5% de gordura, 17% de óleo de canola). O experimento foi conduzido de modo que nas semanas pares 15 embalagens de cada um dos produtos A, B, C, D e E fossem analisadas em laboratório e observadas diversas variáveis (ver Paula, de Moura e Yamaguchi, 2004). Em particular, vamos estudar o comportamento da textura dos produtos através da força necessária para o cisalhamento. Os dados referentes a esta variável estão disponíveis no arquivo snack.dat.

Notamos pela Figura 2.22, em que são apresentados os boxplots da força de cisalhamento para todos os grupos ao longo das 20 semanas, uma tendência crescente até a 14a semana seguida de um decrescimento até a última semana. Verificamos também, para cada semana, que a distribui- ção da força de cisalhamento mostra-se assimétrica à direita sugerindo uma distribuição gama ou normal inversa.

Assim, denotaremos por Yijk a força de cisalhamento referente à k- ésima réplica do i-ésimo grupo na j-ésima semana, para k = 1, . . . , 15, j =

2.8 Aplicações

2, 4, 6, . . . , 20 e i =1(A),2(B),3(C),4(D) e E(5). A fim de compararmos as duas distribuições assimétricas vamos supor que Yijk ∼ G(µij, φ) e Yijk ∼ NI(µij, φ) com parte sistemática dada por

µij = α + βi+ γ1semanaj+ γ2semana2j, (2.6) em que β1 = 0. Portanto α é o efeito da forma A, controlando pela semana, e α + βi (i=2,3,4,5) são os efeitos das demais formas B, C, D e E, respectiva- mente. Estamos supondo a mesma tendência para os cinco tipos de snacks. Alternativamente poderíamos incluir interação entre grupo e semana, possi- bilitando o ajuste de tendências separadas para cada grupo.

40 60 80 100 120 2 4 6 8 10 12 14 16 18 20 Semana Cisalamento

Figura 2.22: Boxplots da força de cisalhamento segundo a semana e para todos os grupos.

Para ajustarmos o modelo (2.6) com resposta normal inversa sem in- teração devemos fazer o seguinte:

2.8 Aplicações

grupo < − factor(grupo) grupo < − C(grupo,treatment) s1 < − semana

s2 < − s1*s1

fit1.snack < − glm(cisalhamento ∼ grupo + s1 + s2, family=inverse.gaussian(link=identity))

summary(fit1.snack).

Abaixo seguem os comandos para o ajuste com interação

fit2.snack < − glm(cisalhamento ∼ grupo + s1 + s2 + s1*grupo +s2*grupo, family=inverse.gaussian(link=identity)) summary(fit2.snack). 40 45 50 55 60 65 70 −2 −1 0 1 2 3 4 Valores Ajustados Residuo de Pearson (a) 40 45 50 55 60 65 70 −2 −1 0 1 2 3 4 Valores Ajustados Residuo de Pearson (b)

Figura 2.23: Gráficos do resíduo de Pearson contra os valores ajustados refe- rentes aos modelos gama (a) e normal inversa (b) ajustados aos dados sobre snacks .

2.8 Aplicações

Este é um exemplo em que há uma ligeira superioridade da distribuição normal inversa em relação à distribuição gama. Embora a função de variância da normal inversa seja cúbica enquanto para a gama temos função de variân- cia quadrática, nem sempre é possível diferenciarmos de forma clara os dois ajustes. Notamos pela Figura 2.23 que o gráfico de resíduos de Pearson con- tra os valores ajustados apresenta uma tendência sistemática crescente sob o modelo gama, que é amenizada sob o modelo com erros normal inversa. Os dois modelos ajustam-se muito bem aos dados como podemos notar pelo valor do desvio do modelo gama D∗(y; ˆµ) = 756, 87 (753 g.l.) com P=0,35 e pelo gráfico normal de probabilidades para o modelo com resposta normal inversa (Figura 2.24).

Na Tabela 2.5 são apresentadas as estimativas sob o modelo com res- posta normal inversa. Todos os efeitos são altamente significativos, em par- ticular o efeito de semana na forma quadrática. Controlando esse efeito, a maior força média de cisalhamento ocorre com o produto sob a forma A (au- sência de óleo de canola) e a menor força média de cisalhamento ocorre com as formas D e E.

Tabela 2.5

Estimativas dos parâmetros referentes ao modelo com resposta normal inversa

ajustado aos dados sobre snacks.

Efeito Estimativa E/E.Padrão

Constante 50,564 26,32 Grupo B -10,916 -6,41 Grupo C -5,459 -3,03 Grupo D -15,357 -9,42 Grupo E -16,596 -10,30 Semana 2,727 8,18 Semana2 -0,091 -5,90 φ 1005 -

2.8 Aplicações

Na Figura 2.25 temos os valores preditos para os 5 grupos ao longo das 20 semanas. A estimativa do parâmetro de dispersão indica que a dis- tribuição da força de cisalhamento em cada grupo, fixando o tempo, é apro- ximadamente normal. Contudo, a variância depende da média. A forma cúbica para a variância mostrou-se ligeiramente superior à forma quadrática. Outras formas para ajustarmos a variância podem ser testadas, como por exemplo, através de modelos de quase-verossimilhança que serão discutidos no Capítulo 5. O paralelismo entre as curvas apresentadas na Figura 2.25 é devido à não inclusão de interação entre semana e grupo. Alternativa- mente, poderíamos incluir uma função para cada grupo, ou então, o efeito semana poderia ser controlado através de funções não paramétricas (ver, por exemplo, Wood, 2006). −3 −2 −1 0 1 2 3 −4 −2 0 2 4 Percentis da N(0,1) Componente do Desvio

Figura 2.24: Gráfico normal de probabilidades referente ao modelo com res- posta normal inversa ajustado aos dados sobre snacks.

2.8 Aplicações Semana Valor Predito 5 10 15 20 40 50 60 70 A B C D E

Figura 2.25: Valores preditos para a força média de cisalhamento para as 5 formas de snacks através do modelo com resposta normal inversa.

Algumas observações foram detectadas como possivelmente influentes, #2 (2a semana, grupoB), #8 (2a semana, grupo B), #10 (2a semana, grupo B), #311 (2asemana, grupo C), #465 (2a semana, grupo D) e #744 (última semana, grupo E) (vide Figura 2.26). Embora os valores preditos para a força de cisalhamento dessas amostras estejam abaixo da média, os valores observados são em geral altos quando comparados com os valores dos grupos e das semanas correspondentes. Também o fato de 5 dessas observações terem ocorrido logo na segunda semana pode ser um indício de alguma dificuldade inicial com o experimento. A eliminação dessas 6 observações do total de 744 observações leva a algumas variações desproporcioanis. Por exemplo, as estimativas dos efeitos dos grupos B e C diminuem por volta de 8%. Todavia, não ocorrem mudanças inferenciais importantes.

2.8 Aplicações 40 45 50 55 60 65 70 0.00 0.05 0.10 0.15 0.20 Valores Ajustados Distancia de Cook 2 8 10 311 465 744

Figura 2.26: Gráfico da distância de Cook contra os valores ajustados re- ferente ao modelo com resposta normal inversa ajustado aos dados sobre snacks.

No documento MODELOS DE REGRESSÃO com apoio computacional (páginas 161-167)

Documentos relacionados