Especialização em Engenharia de Processos e de Sistemas de Produção

(1)

Especialização em Engenharia de Processos

e de Sistemas de Produção

Projetos de Experimento e Confiabilidade de Sistemas da

Produção

Prof. Claudio Luis C. Frankenberg

(2)

• Conforme foi apresentado anteriormente, o teste na análise de variância assume que as

observações são independentes e

normalmente distribuídas, com a mesma variância para cada tratamento. A validade, dessas suposições, deve ser verificada por meio da análise de resíduos.

(3)

• A decomposição da variabilidade na análise de variância é puramente algébrica. Entretanto para realização de testes estatísticos e a obtenção de intervalos de confiança, utilizamos as seguintes hipóteses:

– Os erros são normais e independentes, com média e variância constante; e – As observações são descritas por meio de modelo

• Na prática, precisamos verificar se estas suposições são válidas. Violações nestas suposições são verificadas através dos resíduos.

• O resíduo para a j-ésima observação do nível i é definido por em que é uma estimativa da observação

• em que y_ij é uma estimativa da observação

(4)

Exemplo 17

Algodão Resíduos 15 -2,8 -2,8 5,2 1,2 -0,8 9,8 20 -3,4 1,6 -3,4 2,6 2,6 15,4 25 -3,6 0,4 0,4 1,4 1,4 17,6 30 -2,6 3,4 0,4 -2,6 1,4 21,6 35 -3,8 -0,8 0,2 4,2 0,2 10,8

(5)

Gráfico dos resíduos

versus ordem de coleta dos dados

(6)

GRÁFICO DOS RESÍDUOS CONTRA O TEMPO

• A validade da suposição de independência pode ser

verificada por meio do gráfico de resíduos contra o tempo (ordem de coleta das observações). Se, neste gráfico, os resíduos (e_i) estiverem situados, aproximadamente, em torno de uma faixa horizontal centrada em e_i = 0, então será obtida uma indicação

da validade da suposição de independência.

• Por outro lado, configurações especiais, tais como a presença de sequencias de resíduos positivos e negativos, ou padrões de alternância de sinais, podem indicar que as observações não são independentes.

(7)

• Um resíduo é definido como:

• Isto é, o resíduo é obtido da diferença entre uma observação e a média do tratamento correspondente.

• Configurações especiais, no gráfico de resíduos, contra a ordem de obtenção dos dados, indicam que as observações não são independentes.

(8)

• Note-se que a violação da suposição de independência dos erros e_ij pode exercer sérios efeitos sobre a validade das inferências realizadas por meio da análise de variância.

• Como esse é um problema difícil de ser corrigido, é importante tentar impedir a sua ocorrência.

• Geralmente, o emprego de uma aleatorização adequada para a coleta dos dados faz com que a condição de independência não seja violada.

(9)

Exemplos de gráficos de resíduos contra o tempo, Indicando: (a) validade da suposição de independência. (b) violação da

(10)

Influência do R

2

na ANOVA

• Uma maneira de verificarmos se o modelo ajustado é adequado é olharmos o resultado do coeficiente de determinação (R2). Este coeficiente mede o quanto a variável resposta é explicada pelo modelo. Quanto maior o valor de R2_melhor!

• Dizemos que, com um valor de R2_{acima de}

70%, o modelo está explicando bem a variação na variável resposta. A expressão usada para calcular o R2_{é dada por:}

(11)

• A expressão usada para calcular o R2_{é dada}

por:

• Em uma análise de variância com efeito fixo, estamos interessado em determinar se existe diferença entre os níveis dos fatores.

• Aqui (exemplo), não temos interesse em utilizar o modelo para previsão.

(12)

• R2 _{= 1 – (162,1/636,96) = 0,7469}

• Logo R2 _{> 0,7, o modelo está explicando bem}

(13)

Análise dos resíduos

• Na sequência, vamos fazer a análise de normalidade, independência e igualdade da variância dos resíduos.

• Grande parte dos problemas que

encontramos na prática, são solucionados, considerando algumas suposições iniciais, tais como, assumir uma função de distribuição para os dados amostrados.

(14)

Análise dos resíduos

• Nesse sentido, surge a necessidade de

certificarmos se essas suposições podem, realmente, ser assumidas.

• Em alguns casos, assumir a normalidade dos dados é o primeiro passo que tomamos para simplificar sua análise.

• Para dar suporte a esta suposição, consideramos, o teste Anderson-Darling, o teste Kolmogorov - Smirnov e o teste Shapiro - Wilk.

• Além disso, fazemos o gráfico "papel de probabilidade".

(15)

Teste de Normalidade

• Os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal. As principais técnicas discutidas são:

– Papel de Probabilidade

– Teste de Kolmogorov-Smirnov

– Teste de Anderson-Darling

(16)

Papel de Probabilidade

• O Papel de Probabilidade é uma técnica gráfica utilizada para verificar a adequação de um determinado modelo estatístico aos dados.

• A técnica é simples de utilizar e pode ser aplicada a inúmeros tipos de modelos estatísticos.

• Considerar o modelo Normal com média μ e variância σ2.

(17)

• Se X ~ N(μ,σ2_{), a transformação}

• tem distribuição normal padrão (média zero e variância 1).

• Denotar a distribuição acumulada de Z por Φ. • Se F é a função distribuição acumulada da

distribuição normal com média μ e variância σ2, temos que

(18)

• Aplicando a função Φ-1_{em ambos os lados,}

temos

• de onde obtemos que

• onde Φ-1_{(F(x)) é o quantil da distribuição}

(19)

• Como a expressão anterior tem o formato de uma expressão linear, ao fazermos o gráfico entre x e Φ-1(F(x)) devemos esperar um comportamento linear dos pontos, se a distribuição Normal for realmente adequada.

(20)

• Com isso, construimos o Papel de Probabilidade a partir das seguintes etapas:

– Considere uma amostra x₁, ..., x_n;

– Ordene os elementos da amostra, ou seja, x₍₁₎ ≤ x₍₂₎ ≤ ... ≤ x_(n);

– Calcule n valores d_i = (i-0,3)/(n+0,4), com i = 1, ..., n. A correção de 0,3 no numerador e 0,4 no denominador é necessário para que não tenhamos d_i = 1, pois neste caso, temos que Φ-1_{(1) = ∞ .}

(21)

– Calcule os quantis da distribuição Normal padrão para cada um dos valores d_i, isto é,

– Faça um gráfico com os pontos – E avalie a normalidade dos dados.

(22)

Teste de Anderson-Darling

• O teste Anderson-Darling (STEPHENS, 1974) é usado para testar se uma amostra de dados provém de uma determinada distribuição.

• Trata-se de uma modiﬁcação do teste Kolmogorov-Smirnov (KS).

• O Teste KS é de distribuição gratuita, no sentido de que os valores críticos não dependem da distribuição especíﬁca para calcular valores críticos.

• Isto tem a vantagem de permitir um exame mais sensível e a desvantagem de que os valores críticos devem ser calculados para cada distribuição.

(23)

• O teste Anderson-Darling é deﬁnido como: • sendo

• onde F é a distribuição cumulativa dos dados. • As hipóteses do teste são:

– H0: Os dados seguem uma distribuição especiﬁcada;

(24)

• Os valores críticos para o teste Anderson-Darling, são dependentes da distribuição especíﬁca, sendo testada.

• Testar a hipótese de que a distribuição é feita de uma forma especíﬁca é rejeitada se a estatística de ensaio, A2 _{for superior ao valor}

(25)

Exemplo

• Avaliamos a normalidade dos resíduos através do gráfico "papel de probabilidade" e do teste

de Anderson-Darling. No nosso

caso, tomamos como hipótese nula a normalidade dos resíduos, e utilizamos a estatística de Anderson-Darling para testar esta hipótese. Para o exemplo, como o P-valor é alto (aproximadamente 0,16) não rejeitamos a hipótese de normalidade dos resíduos.

(26)

Exemplo

1 -3,8 0,02756 -1,9179 2 -3,6 0,06693 -1,4991 3 -3,4 0,1063 -1,2465 4 -3,4 0,14567 -1,0552 5 -2,8 0,18504 -0,8963 6 -2,8 0,22441 -0,7574 7 -2,6 0,26378 -0,6317 ... .... ... ...

(27)

(28)

Resíduos versus valores ajustados

• Com esse gráfico temos indícios sobre o

comportamento da variância dos

resíduos com relação aos valores ajustados. Uma análise mais detalhada sobre a igualdade da variância pode ser obtida através dos testes de igualdade das variâncias.

(29)

(30)

Resíduos versus a ordem de coleta

dos dados

• A seguir elaboramos o gráfico dos Resíduos versus a Ordem de Coleta dos dados. Com

esse gráfico obtemos indícios da

independência ou não entre os resíduos.

• Se algum comportamento sistemático for observado no gráfico, temos indícios de que alguma variável "extra" influenciou nos resultados do experimento, fato que viola uma das premissas básicas da ANOVA e compromete nossas conclusões.

(31)

(32)

ANOVA - Dois Fatores

• A decomposição da variabilidade na análise de variância é puramente algébrica. Entretanto, para realizarmos os testes estatísticos e os intervalos de confiança, utilizamos as seguintes hipóteses:

– Os erros são normais e independentes, com média 0 e variância constante σ2_e

(33)

ANOVA - Dois Fatores

• Na prática, precisamos verificar se estas suposições não são absurdas.

• Violações nestas suposições são verificadas através dos resíduos.

• O resíduo para a k-ésima observação do nível i do fator A e nível j do fator B é definido por:

(34)

ANOVA - Dois Fatores

• Onde é uma estimativa da observação , obtida por:

(35)

Exemplo 18

Tipo de Caixa Redutora

Tipo de eixo

Rolado Cortado Importado

Nacional 1,29 -1,91 0,19 1,19 -1,91 -0,71 -0,51 2,89 -0,51 -1,86 2,24 0,44 -2,66 1,24 1,24 -3,06 2,04 0,34 -0,12 0,98 -0,42 -0,32 0,38 0,28 -1,62 0,28 0,58 Importado -2,03 -0,73 -1,73 -1,43 -0,63 -0,63 6,77 -0,63 1,07 0,07 -0,73 0,07 5,57 -1,33 -1,13 -0,93 -1,93 0,37 1,9 0,4 -1 -0,8 0,3 -0,5 2,2 -1,5 -1

(36)

(37)

GRÁFICO DE RESÍDUOS CONTRA AS

MÉDIAS DOS TRATAMENTOS

• Para se avaliar a validade da suposição de igualdade de variâncias em todos os níveis do fator, deve-se traçar o gráfico dos resíduos contra as médias dos tratamentos ẍ_i e analisar a dispersão dos resíduos.

• Se a suposição é válida, essa dispersão não deve depender do valor de ẍ_i.

(38)

Padrões para os gráficos de resíduos contra as médias dos tratamentos: (a) satisfatório, (b) funil, (c) laço duplo

(39)

• Se a faixa de dispersão no gráfico de resíduos contra as médias dos tratamentos depender do valor de ẍ_i, terá sido obtida uma indicação de que a suposição de igualdade de variâncias não é válida.

• A abordagem mais usual, para lidar com situações onde a variação não é constante, consiste em utilizar-se

transformações para estabilizar a variância e, então,

aplicar as técnicas já abordadas, aos dados transformados.

• É importante notar que, nesse caso, as conclusões da análise de variância se aplicam aos dados transformados e devem ser estendidas, com cuidado aos dados originais.

(40)

• É importante destacar que, lidar com situações nas quais ocorre a violação das suposições de igualdade de variâncias, muitas vezes é um problema complexo.

• Nem sempre é possível encontrar uma transformação que estabilize a variância. Isso pode ocorrer, por exemplo, quando as observações de tratamentos incluídos no estudo

apresentam uma variabilidade,

significativamente, diferente da variabilidade das demais observações.

(41)

• A solução de problemas desse tipo envolve, primeiramente, um entendimento das causas que geraram as diferenças na variabilidade.

• Muitas vezes, essas diferenças podem ser conseqüência da ocorrência de situações anormais no processo que está sendo avaliado.

• Caso isso seja constatado, é recomendável coletar novas observações para os tratamentos correspondentes às medidas com grandes diferenças na variabilidade, se este procedimento for possível de ser realizado.

(42)

• Por outro lado, se for uma característica própria do processo, a existência de alguns tratamentos, para os quais as observações apresentam uma variabilidade muito diferente da variabilidade das observações coletadas sob os demais tratamentos, é sugerida a adoção de um outro tipo de modelo que leve esse fato em consideração.

(43)

• Na análise de variância com amostras de mesmo tamanho, o teste F será ligeiramente afetado, caso a suposições de igualdade de variâncias seja violada.

(44)

GRÁFICO DA PROBABILIDADE

NORMAL

• A validade da suposição de normalidade pode ser verificada por meio de um gráfico de probabilidade normal para os resíduos.

• Neste gráfico, cada resíduo é representado em função de seu valor esperado, o qual é calculado supondo que os resíduos seguem uma distribuição normal.

(45)

(46)

• É importante destacar que, se a distribuição dos resíduos εij não segue uma distribuição normal, apresentando pequenos desvios em relação a esta distribuição, esse fato não

exerce grandes efeitos sobre o teste F, para os intervalos de confiança para as médias e para o método de Duncan de comparações