1.10 Aplica¸c˜oes
1.10.5 Compara¸c˜ao de cinco tipos de turbina de avi˜ao
Apresentamos na Tabela 1.12 (vide Lawless 1982, p. 201) os resultados de um experi- mento conduzido para avaliar o desempenho de cinco tipos de turbina de alta velocidade para motores de avi˜ao. Foram considerados dez motores de cada tipo nas an´alises e foi observado para cada um o tempo (em unidades de milh˜oes de ciclos) at´e a perda da velocidade.
Tabela 1.12
Tempo at´e a perda da velocidade de cinco tipos de turbina de avi˜ao.
Tipo de turbina
Tipo I Tipo II Tipo III Tipo IV Tipo V 3,03 3,19 3,46 5,88 6,43 5,53 4,26 5,22 6,74 9,97 5,60 4,47 5,69 6,90 10,39 9,30 4,53 6,54 6,98 13,55 9,92 4,67 9,16 7,21 14,45 12,51 4,69 9,40 8,14 14,72 12,95 5,78 10,19 8,59 16,81 15,21 6,79 10,71 9,80 18,39 16,04 9,37 12,58 12,28 20,84 16,84 12,75 13,41 25,46 21,51
Para inserir os dados acima diretamente no S-Plus e armazen´a-los num arquivo de nome turbina.dat, devemos fazer
1: 3.03 3.19 3.46 5.88 6.43 2: 5.53 4.26 5.22 6.74 9.97 3: 5.60 4.47 5.69 6.90 10.39 4: 9.30 4.53 6.54 6.98 13.55 5: . . .
Denotaremos por Tij o tempo at´e a perda da velocidade para o j-´esimo motor de tipo
i, i = 1, . . . , 5 e j = 1, . . . , 10. Na tabela abaixo s˜ao apresentadas as m´edias, desvios padr˜ao e coeficientes de varia¸c˜ao amostrais para os cinco tipos de turbina e como pode-se notar os coeficientes de varia¸c˜ao variam menos que os desvios padr˜ao. Isso sugere que uma distribui¸c˜ao gama com coeficiente de varia¸c˜ao constante pode ser mais apropriada para explicar o tempo de dura¸c˜ao do que uma distribui¸c˜ao normal com variˆancia constante.
Tipo I Tipo II Tipo III Tipo IV Tipo V M´edia 10,69 6,05 8,64 9,80 14,71 D.Padr˜ao 4,82 2,91 3,29 5,81 4,86 C. Varia¸c˜ao 45,09% 48,10% 38,08% 59,29% 33,04%
Vamos assumir ent˜ao que Tij segue uma distribui¸c˜ao gama de m´edia µie parˆametro de
dispers˜ao φ−1. Para comparar os cinco grupos utilizaremos inicialmente o modelo abaixo
(modelo gama com liga¸c˜ao canˆonica)
µ−1i = µ + βi,
em que β1 = 0. ´E importante observar que os resultados seriam os mesmos se fosse
utilizada qualquer outra liga¸c˜ao.
Para ajustar o modelo no S-Plus precisamos definir antes o fator tipo de turbina e fazer o emparelhamento dos dados com os n´ıveis do mesmo. Os comandos s˜ao apresentados abaixo
fnames < − list(tipo=c(“ I ", “ II ", “ III ", “ IV ", “ V ")) turbina.design < − fac.design(5,fnames,rep=10)
attach(turbina.dat)
turbina.df < − data.frame(tempo, turbina.design) turbina.df
Os boxplots correspondentes aos tempos dos cinco grupos (vide Figura 1.10a) s˜ao obtidos com os comandos
plot.factor(turbina.df)
Os passos para o ajuste do modelo s˜ao dados a seguir tipo < − C(tipo,treatment)
fit.turbina < − glm(tempo ∼ tipo, family=Gamma) summary(fit.turbina) Indice Distancia de Cook 0 10 20 30 40 50 0.0 0.5 1.0 1.5 47 49
(a) Preditor Linear
Residuo Componente do Desvio
6 8 10 12 14 -2 0 2 4 (b) 1 47 49
Figura 1.9: Distˆancia de Cook (a) e componente do desvio contra preditor linear (b) para o exemplo sobre desempenho de turbinas de avi˜ao.
O desvio do modelo foi de D∗(y; ˆµ) = 8, 861 × 5, 804 = 51, 43, com 45 graus de liber-
dade, que leva a P = 0, 236 indicando um ajuste adequado. As estimativas dos parˆametros deram ˆµ = 0, 094 (0, 013), ˆβ2 = 0, 072 (0, 027), ˆβ3 = 0, 022 (0, 021), ˆβ4 = 0, 008 (0, 019) e
ˆ
β5 = −0, 025 (0, 017), indicando para o tipo II um tempo m´edio de sobrevivˆencia signi-
ficativamente menor do que os demais. Para o tipo V notamos um tempo m´edio maior do que os demais enquanto que os outros trˆes tipos apresentam tempos m´edios significa- tivamente n˜ao diferentes. Esses resultados confirmam a an´alise descritiva apresentada na Figura 1.10a. A estimativa de m´axima verossimilhan¸ca (desvio padr˜ao aproximado) do parˆametro de dispers˜ao foi de ˆφ = 5, 804(1, 129)), indicando que as distribui¸c˜oes dos tem- pos de sobrevivˆencia n˜ao devem ser muito assim´etricas. Na Figura 1.9 tem-se o gr´afico da distˆancia de Cook (Figura 1.9a) e o gr´afico do componente do desvio padronizado contra o preditor linear (Figura 1.9b). Nota-se um forte destaque para a observa¸c˜ao #49 que corresponde ao valor 25,46 para o tempo de dura¸c˜ao de um dos motores de tipo IV. Esse valor, como mostra o boxplot correspondente na Figura 1.10 destoa dos demais tempos.
A elimina¸c˜ao da observa¸c˜ao #49 aumenta a significˆancia marginal de β4, embora esse
efeito continue n˜ao significativo a 10%.
O gr´afico normal de probabilidades com envelope para os componentes padronizados do desvio ´e apresentado na Figura 1.10b. Notamos, pelo gr´afico, que n˜ao h´a ind´ıcios de afastamentos s´erios da suposi¸c˜ao de distribui¸c˜ao gama para os tempos de sobrevivˆencia dos motores bem como para a suposi¸c˜ao de homogeneidade de coeficiente de varia¸c˜ao para os cinco grupos. A sequˆencia de comandos para construir o gr´afico normal de probabili- dades com envelopes ´e dada no Apˆendice. ´E assumido que os resultados do ajuste est˜ao guardados no objeto fit.model.
5 10 15 20 25 tempo
I
II
III
IV
V
tipo
(a) Percentis da N(0,1) Componente do Desvio -2 -1 0 1 2 -3 -2 -1 0 1 2 (b)Figura 1.10: Box-plot (a) e gr´afico normal de probabilidades (b) para o exemplo sobre desempenho de turbinas de avi˜ao.
A fim de facilitar as interpreta¸c˜oes dos resultados de um modelo gama ou mesmo fazer compara¸c˜oes com o modelo normal linear, pode-se propor uma liga¸c˜ao identidade ao inv´es de liga¸c˜ao rec´ıproca. No exemplo das turbinas a parte sistem´atica do modelo ficaria dada por
µi = µ + βi,
em que β1 = 0. Para ajustar o modelo no S-Plus deve-se fazer o seguinte:
As estimativas sob essa nova parametriza¸c˜ao ficam dadas por ˆµ = 10, 693 (1, 543), ˆβ2 =
−4, 643 (1, 773), ˆβ3 = −2, 057 (1, 983), ˆβ4 = −0, 895 (2, 093) e ˆβ5 = 4, 013 (2, 623). A
estimativa de φ e o valor da fun¸c˜ao desvio s˜ao os mesmos pela propriedade de invariˆancia do m´etodo de m´axima verossimilhan¸ca.
Indice Alavanca 0 10 20 30 40 0.05 0.10 0.15 0.20 CTNY SD TX NV (a) Indice Distancia de Cook 0 10 20 30 40 0.0 0.1 0.2 0.3 WY (b) Indice Residuo Studentizado 0 10 20 30 40 -4 -2 0 2 4 WY (c) Valores Ajustados Residuo Studentizado 400 500 600 700 -4 -2 0 2 4 WY (d)
Figura 1.11: Gr´aficos de diagn´ostico para o exemplo sobre consumo de combust´ıvel. Podemos tentar avaliar atrav´es de um teste apropriado se os ind´ıcios observados pelas estimativas individuais das m´edias se verificam conjuntamente. Vamos, ent˜ao, tentar agrupar os tipos I, III e IV. As hip´oteses apropriadas s˜ao dadas por H0 : β4 = β3 = 0
contra H1 : β4 6= 0 ou β3 6= 0. Como ˆφ mostrou-se relativamente alto podemos aplicar
a estat´ıstica F dada na Se¸c˜ao 1.7.2. Sob H0 obt´em-se D(y; ˆµ) = 9, 091 para 47 graus
de liberdade e sob a hip´otese alternativa D(y; ˆµ) = 8, 861 para 45 graus de liberdade. A estat´ıstica F fica dada por
F = (9, 091 − 8, 861)/2 8, 861/45
= 0, 584,
que leva a P = 0, 562, ou seja, pela n˜ao rejei¸c˜ao de H0. Mesmo eliminando a observa¸c˜ao
#49 os resultados n˜ao mudam do ponto de vista inferencial. Assim, pode-se concluir que n˜ao existe diferen¸ca significativa entre os tipos I, III e IV, enquanto os tipos II e V aparecem de forma significativa com o menor e maior tempo m´edio de dura¸c˜ao, respectivamente.