Especialização em Engenharia de Processos
e de Sistemas de Produção
Projetos de Experimento e Confiabilidade de Sistemas da
Produção
Prof. Claudio Luis C. Frankenberg
• Conforme foi apresentado anteriormente, o teste na análise de variância assume que as
observações são independentes e
normalmente distribuídas, com a mesma variância para cada tratamento. A validade, dessas suposições, deve ser verificada por meio da análise de resíduos.
• A decomposição da variabilidade na análise de variância é puramente algébrica. Entretanto para realização de testes estatísticos e a obtenção de intervalos de confiança, utilizamos as seguintes hipóteses:
– Os erros são normais e independentes, com média e variância constante; e – As observações são descritas por meio de modelo
• Na prática, precisamos verificar se estas suposições são válidas. Violações nestas suposições são verificadas através dos resíduos.
• O resíduo para a j-ésima observação do nível i é definido por em que é uma estimativa da observação
• em que yij é uma estimativa da observação
Exemplo 17
Algodão Resíduos 15 -2,8 -2,8 5,2 1,2 -0,8 9,8 20 -3,4 1,6 -3,4 2,6 2,6 15,4 25 -3,6 0,4 0,4 1,4 1,4 17,6 30 -2,6 3,4 0,4 -2,6 1,4 21,6 35 -3,8 -0,8 0,2 4,2 0,2 10,8Gráfico dos resíduos
versus ordem de coleta dos dados
GRÁFICO DOS RESÍDUOS CONTRA O TEMPO
• A validade da suposição de independência pode serverificada por meio do gráfico de resíduos contra o tempo (ordem de coleta das observações). Se, neste gráfico, os resíduos (ei) estiverem situados, aproximadamente, em torno de uma faixa horizontal centrada em ei = 0, então será obtida uma indicação
da validade da suposição de independência.
• Por outro lado, configurações especiais, tais como a presença de sequencias de resíduos positivos e negativos, ou padrões de alternância de sinais, podem indicar que as observações não são independentes.
• Um resíduo é definido como:
• Isto é, o resíduo é obtido da diferença entre uma observação e a média do tratamento correspondente.
• Configurações especiais, no gráfico de resíduos, contra a ordem de obtenção dos dados, indicam que as observações não são independentes.
• Note-se que a violação da suposição de independência dos erros eij pode exercer sérios efeitos sobre a validade das inferências realizadas por meio da análise de variância.
• Como esse é um problema difícil de ser corrigido, é importante tentar impedir a sua ocorrência.
• Geralmente, o emprego de uma aleatorização adequada para a coleta dos dados faz com que a condição de independência não seja violada.
Exemplos de gráficos de resíduos contra o tempo, Indicando: (a) validade da suposição de independência. (b) violação da
Influência do R
2na ANOVA
• Uma maneira de verificarmos se o modelo ajustado é adequado é olharmos o resultado do coeficiente de determinação (R2). Este coeficiente mede o quanto a variável resposta é explicada pelo modelo. Quanto maior o valor de R2 melhor!
• Dizemos que, com um valor de R2 acima de
70%, o modelo está explicando bem a variação na variável resposta. A expressão usada para calcular o R2 é dada por:
• A expressão usada para calcular o R2 é dada
por:
• Em uma análise de variância com efeito fixo, estamos interessado em determinar se existe diferença entre os níveis dos fatores.
• Aqui (exemplo), não temos interesse em utilizar o modelo para previsão.
• R2 = 1 – (162,1/636,96) = 0,7469
• Logo R2 > 0,7, o modelo está explicando bem
Análise dos resíduos
• Na sequência, vamos fazer a análise de normalidade, independência e igualdade da variância dos resíduos.
• Grande parte dos problemas que
encontramos na prática, são solucionados, considerando algumas suposições iniciais, tais como, assumir uma função de distribuição para os dados amostrados.
Análise dos resíduos
• Nesse sentido, surge a necessidade de
certificarmos se essas suposições podem, realmente, ser assumidas.
• Em alguns casos, assumir a normalidade dos dados é o primeiro passo que tomamos para simplificar sua análise.
• Para dar suporte a esta suposição, consideramos, o teste Anderson-Darling, o teste Kolmogorov - Smirnov e o teste Shapiro - Wilk.
• Além disso, fazemos o gráfico "papel de probabilidade".
Teste de Normalidade
• Os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal. As principais técnicas discutidas são:
– Papel de Probabilidade
– Teste de Kolmogorov-Smirnov
– Teste de Anderson-Darling
Papel de Probabilidade
• O Papel de Probabilidade é uma técnica gráfica utilizada para verificar a adequação de um determinado modelo estatístico aos dados.
• A técnica é simples de utilizar e pode ser aplicada a inúmeros tipos de modelos estatísticos.
• Considerar o modelo Normal com média μ e variância σ2.
• Se X ~ N(μ,σ2), a transformação
• tem distribuição normal padrão (média zero e variância 1).
• Denotar a distribuição acumulada de Z por Φ. • Se F é a função distribuição acumulada da
distribuição normal com média μ e variância σ2, temos que
• Aplicando a função Φ-1 em ambos os lados,
temos
• de onde obtemos que
• onde Φ-1(F(x)) é o quantil da distribuição
• Como a expressão anterior tem o formato de uma expressão linear, ao fazermos o gráfico entre x e Φ-1(F(x)) devemos esperar um comportamento linear dos pontos, se a distribuição Normal for realmente adequada.
• Com isso, construimos o Papel de Probabilidade a partir das seguintes etapas:
– Considere uma amostra x1, ..., xn;
– Ordene os elementos da amostra, ou seja, x(1) ≤ x(2) ≤ ... ≤ x(n);
– Calcule n valores di = (i-0,3)/(n+0,4), com i = 1, ..., n. A correção de 0,3 no numerador e 0,4 no denominador é necessário para que não tenhamos di = 1, pois neste caso, temos que Φ-1(1) = ∞ .
– Calcule os quantis da distribuição Normal padrão para cada um dos valores di, isto é,
– Faça um gráfico com os pontos – E avalie a normalidade dos dados.
Teste de Anderson-Darling
• O teste Anderson-Darling (STEPHENS, 1974) é usado para testar se uma amostra de dados provém de uma determinada distribuição.
• Trata-se de uma modificação do teste Kolmogorov-Smirnov (KS).
• O Teste KS é de distribuição gratuita, no sentido de que os valores críticos não dependem da distribuição específica para calcular valores críticos.
• Isto tem a vantagem de permitir um exame mais sensível e a desvantagem de que os valores críticos devem ser calculados para cada distribuição.
• O teste Anderson-Darling é definido como: • sendo
• onde F é a distribuição cumulativa dos dados. • As hipóteses do teste são:
– H0: Os dados seguem uma distribuição especificada;
• Os valores críticos para o teste Anderson-Darling, são dependentes da distribuição específica, sendo testada.
• Testar a hipótese de que a distribuição é feita de uma forma específica é rejeitada se a estatística de ensaio, A2 for superior ao valor
Exemplo
• Avaliamos a normalidade dos resíduos através do gráfico "papel de probabilidade" e do teste
de Anderson-Darling. No nosso
caso, tomamos como hipótese nula a normalidade dos resíduos, e utilizamos a estatística de Anderson-Darling para testar esta hipótese. Para o exemplo, como o P-valor é alto (aproximadamente 0,16) não rejeitamos a hipótese de normalidade dos resíduos.
Exemplo
1 -3,8 0,02756 -1,9179 2 -3,6 0,06693 -1,4991 3 -3,4 0,1063 -1,2465 4 -3,4 0,14567 -1,0552 5 -2,8 0,18504 -0,8963 6 -2,8 0,22441 -0,7574 7 -2,6 0,26378 -0,6317 ... .... ... ...Resíduos versus valores ajustados
• Com esse gráfico temos indícios sobre o
comportamento da variância dos
resíduos com relação aos valores ajustados. Uma análise mais detalhada sobre a igualdade da variância pode ser obtida através dos testes de igualdade das variâncias.
Resíduos versus a ordem de coleta
dos dados
• A seguir elaboramos o gráfico dos Resíduos versus a Ordem de Coleta dos dados. Com
esse gráfico obtemos indícios da
independência ou não entre os resíduos.
• Se algum comportamento sistemático for observado no gráfico, temos indícios de que alguma variável "extra" influenciou nos resultados do experimento, fato que viola uma das premissas básicas da ANOVA e compromete nossas conclusões.
ANOVA - Dois Fatores
• A decomposição da variabilidade na análise de variância é puramente algébrica. Entretanto, para realizarmos os testes estatísticos e os intervalos de confiança, utilizamos as seguintes hipóteses:
– Os erros são normais e independentes, com média 0 e variância constante σ2 e
ANOVA - Dois Fatores
• Na prática, precisamos verificar se estas suposições não são absurdas.
• Violações nestas suposições são verificadas através dos resíduos.
• O resíduo para a k-ésima observação do nível i do fator A e nível j do fator B é definido por:
ANOVA - Dois Fatores
• Onde é uma estimativa da observação , obtida por:
Exemplo 18
Tipo de Caixa Redutora
Tipo de eixo
Rolado Cortado Importado
Nacional 1,29 -1,91 0,19 1,19 -1,91 -0,71 -0,51 2,89 -0,51 -1,86 2,24 0,44 -2,66 1,24 1,24 -3,06 2,04 0,34 -0,12 0,98 -0,42 -0,32 0,38 0,28 -1,62 0,28 0,58 Importado -2,03 -0,73 -1,73 -1,43 -0,63 -0,63 6,77 -0,63 1,07 0,07 -0,73 0,07 5,57 -1,33 -1,13 -0,93 -1,93 0,37 1,9 0,4 -1 -0,8 0,3 -0,5 2,2 -1,5 -1
GRÁFICO DE RESÍDUOS CONTRA AS
MÉDIAS DOS TRATAMENTOS
• Para se avaliar a validade da suposição de igualdade de variâncias em todos os níveis do fator, deve-se traçar o gráfico dos resíduos contra as médias dos tratamentos ẍi e analisar a dispersão dos resíduos.
• Se a suposição é válida, essa dispersão não deve depender do valor de ẍi.
Padrões para os gráficos de resíduos contra as médias dos tratamentos: (a) satisfatório, (b) funil, (c) laço duplo
• Se a faixa de dispersão no gráfico de resíduos contra as médias dos tratamentos depender do valor de ẍi , terá sido obtida uma indicação de que a suposição de igualdade de variâncias não é válida.
• A abordagem mais usual, para lidar com situações onde a variação não é constante, consiste em utilizar-se
transformações para estabilizar a variância e, então,
aplicar as técnicas já abordadas, aos dados transformados.
• É importante notar que, nesse caso, as conclusões da análise de variância se aplicam aos dados transformados e devem ser estendidas, com cuidado aos dados originais.
• É importante destacar que, lidar com situações nas quais ocorre a violação das suposições de igualdade de variâncias, muitas vezes é um problema complexo.
• Nem sempre é possível encontrar uma transformação que estabilize a variância. Isso pode ocorrer, por exemplo, quando as observações de tratamentos incluídos no estudo
apresentam uma variabilidade,
significativamente, diferente da variabilidade das demais observações.
• A solução de problemas desse tipo envolve, primeiramente, um entendimento das causas que geraram as diferenças na variabilidade.
• Muitas vezes, essas diferenças podem ser conseqüência da ocorrência de situações anormais no processo que está sendo avaliado.
• Caso isso seja constatado, é recomendável coletar novas observações para os tratamentos correspondentes às medidas com grandes diferenças na variabilidade, se este procedimento for possível de ser realizado.
• Por outro lado, se for uma característica própria do processo, a existência de alguns tratamentos, para os quais as observações apresentam uma variabilidade muito diferente da variabilidade das observações coletadas sob os demais tratamentos, é sugerida a adoção de um outro tipo de modelo que leve esse fato em consideração.
• Na análise de variância com amostras de mesmo tamanho, o teste F será ligeiramente afetado, caso a suposições de igualdade de variâncias seja violada.
GRÁFICO DA PROBABILIDADE
NORMAL
• A validade da suposição de normalidade pode ser verificada por meio de um gráfico de probabilidade normal para os resíduos.
• Neste gráfico, cada resíduo é representado em função de seu valor esperado, o qual é calculado supondo que os resíduos seguem uma distribuição normal.
• É importante destacar que, se a distribuição dos resíduos εij não segue uma distribuição normal, apresentando pequenos desvios em relação a esta distribuição, esse fato não
exerce grandes efeitos sobre o teste F, para os intervalos de confiança para as médias e para o método de Duncan de comparações