Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
P
rof
es
sor
Jorge Luiz A. Ferreira
Métodos Experimentais em
Ciências Mecânicas
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Vamos analisar a seguinte situação:
Introdução
Após ensaiar um lote de lâmpadas incandecente e outro de lampadas fluorecente com o objetivo
de avaliar o tempo de falha, os engenheiros da empresa estão interessados em identificar a
distribuição de probabilidade que melhor representa o comportamento de falha destes
dispositivos.
Tipo de Lâmpada
Incandecente (1)
976
898
1020
1102
1096
1139
825
981
1088
913
Fluorecente (2)
10271
9710
9939
9729
10423
10001
10853
9845
9448
9398
Horas de Uso Até Falhar
Medidas Resumo
Lampada
(1)
(2)
Média
1004
9962
Desvio Padrão
103
449
C.V.
10.3%
4.5%
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Procedimento Heurísticos
*
:
•Comparação
de
Histogramas
(Freqüências);
•Análise Gráfica
• Diagrama Q-Q
• Diagrama P-P
Existem Diversas Técnicas Disponíveis, Dentre as Quais Podem
ser Citadas:
Algumas Técnicas
* Define-se procedimento heurístico como um método de aproximação das soluções dos
problemas, que não segue um percurso claro mas se baseia na intuição e nas circunstâncias.
Testes de Adequação (Aderência)
• Teste de Chi-Quadrados;
• Teste de Kolgorov-Smirnov;
• Teste de Anderson-Darling;
• Teste de Filliben
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Representam-se graficamente, utilizando a mesma escala, a função
densidade de probabilidade que supomos estar correta, e um histograma
dos dados.
Comparação de Histogramas (Freqüências)
Algumas Técnicas Heurísticas
DADOS
3,0
0
2,5
0
2,0
0
1,5
0
1,0
0
,50
0,0
0
-,5
0
-1,0
0
-1,5
0
-2,0
0
-2,5
0
-3,0
0
300
200
100
0
Std. Dev = 1,03
Mean = -,01
N = 2000,00
Existe coincidência entre os Gráficos ?
Dificuldades no uso:
Exige uma Quantidade de
Dados Experimentais Muito
Elevada
(Consistência do Histograma)
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
A construção do gráfico Q-Q baseia-se na hipótese que, após a ordenação
crescente dos dados, a i-ésima observação da amostra, X
i
, pode ser
assumida como uma estimativa do quantil da distribuição, ou seja:
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
Identificação da
Amostra de Lampada
A
B
C
D
E
F
G
H
I
J
Vida [Horas]
976
898
1020 1102 1096 1139
825
981
1088
913
Identificação da
Amostra de Lampada
G
B
J
A
H
C
I
E
D
F
Vida [Horas]
825
898
913
976
981
1020 1088 1096 1102 1139
Freqüência Observada
10%
20%
30%
40%
50%
60%
70%
80%
90% 100%
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Assim, tal estimativa do quantil pode ser usada na comparação da
probabilidade acumulada, Prob(X
i
≥
x),
associada a uma Função de
distribuição de probabilidade específica (modelo), F(X
i
)
, ou seja:
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
( )
1
i
q
i
x
≈
F
−
Q
Onde F
-1
é a função inversa da função de distribuição modelo,
x
qi
é o valor
previsto para quantil associado à i-ésima freqüência acumulada observada
experimentalmente, identificada por Q
i
?
Construção da
F.O. não foi
Justa !!
Identificação da
Amostra de Lampada
G
B
J
A
H
C
I
E
D
F
Vida [Horas]
825
898
913
976
981
1020 1088 1096 1102
1139
Freqüência Observada
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
x
qi
871.1 916.7 949.5 977.6 1004 1030 1058 1091 1136
#NÚM!
∑
Diferença
=
20
,
5
%
Identificação da
Amostra de Lampada
G
B
J
A
H
C
I
E
D
F
Vida [Horas]
825
898
913
976
981
1020 1088 1096 1102
1139
Freqüência Observada
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
x
qi
871.1 916.7 949.5 977.6 1004 1030 1058 1091 1136
#NÚM!
Diferença (%)
5.6% 2.1% 4.0% 0.2% 2.3% 1.0% 2.7% 0.5% 3.1% #NÚM!
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Para corrigir o efeito da observação
amostral
sobre o comportamento da
cauda várias fórmulas diferentes têm sido usados. Tipicamente, para a
determinação dos quantis é utilizada a seguinte fórmula: é i/ (n + 1):
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
1
+
=
N
i
Q
i
onde i é a posição do i-ésimo dado observado após a ordenação da
amostra e n é o tamanho da amostra
Identificação da
Amostra de Lampada
G
B
J
A
H
C
I
E
D
F
Vida [Horas]
825
898
913
976
981
1020 1088 1096 1102
1139
Freqüência Observada
9%
18%
27%
36%
45%
55%
64%
73%
82%
91%
x
qi
865.6 909.7 941.2 967.7
992 1016 1040 1066 1098 1142.04
Identificação da
Amostra de Lampada
G
B
J
A
H
C
I
E
D
F
Vida [Horas]
825
898
913
976
981
1020 1088 1096 1102
1139
Freqüência Observada
9%
18%
27%
36%
45%
55%
64%
73%
82%
91%
x
qi
865.6 909.7 941.2 967.7
992 1016 1040 1066 1098 1142.04
Diferença (%)
4.9% 1.3% 3.1% 0.9% 1.1% 0.4% 4.4% 2.7% 0.4%
0.3%
∑
Diferença
=
19
,
5
%
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Na literatura são citadas outras metodologias para a estimativa do valor do
quantil. As expressões em geral têm a forma (i -
κ
) / (n+1-2·
κ
) para algum
valor de κ na faixa de 0 1/2, que dá um intervalo entre i / (n + 1) e (i
-1/2)/n
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
+
−
+
−
=
365
,
0
3175
,
0
4
,
0
3
,
0
n
i
n
i
Q
i
+
−
+
−
=
25
,
0
375
,
0
3
1
3
1
n
i
n
i
Q
i
+
−
+
−
=
12
,
0
44
,
0
2
,
0
4
,
0
n
i
n
i
Q
i
−
−
−
−
=
1
1
134
,
0
567
,
0
n
i
n
i
Q
i
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Estimativa do Quantil Q para cada fórmula:
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0
2
4
6
8
10
Posição do Dado
Q
u
a
n
ti
l
a
b
c
d
e
f
g
h
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Estimativa do Quantil Q para cada fórmula:
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
800
900
1,000
1,100
1,200
800
900
1000
1100
1200
P
re
v
is
ã
o
Experimento
a
b
c
d
e
f
g
Normal Q-Q Plot of VAR00001
Observed Value
1200
1100
1000
900
800
E
xp
e
ct
e
d
N
or
m
a
l V
a
lu
e
1200
1100
1000
900
800
Normal Q-Q Plot of VAR00001
Observed Value
1200
1100
1000
900
800
E
xp
ec
te
d
N
or
m
al
V
al
ue
1200
1100
1000
900
800
Normal Q-Q Plot of VAR00001
Observed Value
1200
1100
1000
900
800
E
xp
ec
te
d
N
or
m
al
V
al
ue
1200
1100
1000
900
800
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Diferença
Percentual Gerada Por cada Metodologia de Estimativa do
Quantil:
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
0,0%
0,5%
1,0%
1,5%
2,0%
2,5%
3,0%
3,5%
4,0%
4,5%
1
2
3
4
5
6
7
8
9
10
Posição do Dado Experimental
D
if
e
re
n
ç
a
(
%
)
a
b
c
d
e
f
g
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Como Avaliar se os Dados se Ajustam Bem à Função de Distribuição de
Probabilidade Modelo ?
Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil )
Algumas Técnicas Heurísticas
Uma Possibilidade é Usar o Coeficiente de Explicação !!!!
y = 0.9982x
R² = 0.9104
800
850
900
950
1000
1050
1100
1150
1200
800
900
1000
1100
1200
V
a
lo
r
E
s
p
e
ra
d
o
Valor Observado
Média: 1004
Desvio Padrão: 113
y = 0.9982x
R² = 0.9104
800
850
900
950
1000
1050
1100
1150
1200
800
900
1000
1100
1200
V
a
lo
r
E
s
p
e
ra
d
o
Valor Observado
Média: 1000
Desvio Padrão: 200
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Assim, usando o exemplo será possível apresentar os seguintes resultados
Análise Gráfica – Diagrama P-P
( Probabilidade - Probabilidade )
Algumas Técnicas Heurísticas
y = 1.0301x
R² = 0.9625
0.00
0.20
0.40
0.60
0.80
1.00
0.00
0.20
0.40
0.60
0.80
1.00
Q
u
a
n
ti
l
E
s
p
e
ra
d
o
Quantil Observado
Média: 1003,8
Desvio Padrão: 103,5
Identificação da Amostra
de Lampada
G
B
J
A
H
C
I
E
D
F
Vida [Horas]
825
898
913
976
981
1020 1088 1096
1102
1139
Frequencia Observada 6.7% 16.3% 26.0% 35.6% 45.2% 54.8% 64.4% 74.0% 83.7%
93.3%
Q
xi
4.2% 15.3% 19.0% 39.4% 41.3% 56.2% 79.2% 81.3% 82.9%
90.4%
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
A idéia básica na construção do gráfico P-P é similar a que foi proposta
para a construção do gráfico Q-Q. A diferença básica entre ambos é que
no gráfico Q-Q são plotados os quantiles, enquanto no gráfico P-P são
plotadas as freqüências ou probabilidades associadas aos x
i
, ou seja:
Análise Gráfica – Diagrama P-P
( Probabilidade - Probabilidade )
Algumas Técnicas Heurísticas
( )
i
x
i
Q
≈
F x
Onde F é a função de distribuição a ser testada
(modelo),
x
i
é o valor previsto para o i-ésimo
dado experimental, e Q
xi
é o valor previsto pelo
Função de distribuição modelo.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
A idéia é comparar as freqüências observadas com as freqüências
esperadas. Assim, considerando:
Teste de Chi-Quadrados (χ
2
)
Testes de Adequação ou de Aderência
• Uma tabela contendo as K (K>2) classes e as,
respectivas, freqüências O
1
, ..., O
k
(
),
observadas em um processo de amostragem.
• As probabilidades associadas a distribuição modelo,
associadas às k classes, tal que p
1
= p
01
; ... ; p
k
= p
0k
• As freqüências esperadas: E
1
; ...; E
K
, E
k
= N·p
0k
, tal
que:
1, ,
i
k
=
K
O
=
N
∑
⋯
1, ,
k
k
K
E
N
=
=
∑
⋯
k-ésima Classe
O
k
E
k
Karl Pearson
D1895 - †1980
Histograma
Distribuição de
Freqüências
Hipotético
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
A partir destas considerações pode-se admitir duas situações possíveis :
Teste de Chi-Quadrados (χ
2
)
Testes de Adequação ou de Aderência
Tal situação será admitida como Hipótese de Nulidade – H
0
Situação A :
As probabilidades observadas e modelo são estatisticamente iguais, ou
seja:
p
1
= p
01
, p
2
= p
02
, p
K
= p
0K
Já esta situação será admitida como Hipótese Alternativa – H
1
Situação B :
Existe pelo menos em uma das classes a probabilidade observada é
estatisticamente diferente da probabilidade modelo.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Com a intenção de construir uma metodologia
para avaliar se a
admissibilidade da situação 1, será proposta a seguinte estatística:
Teste de Chi-Quadrados (χ
2
)
Testes de Adequação ou de Aderência
Estatística esta, formada pelas realizações O
k
, associadas as k classes e pelos seus
respectivos valores esperados de ocorrência de um evento na k-ésima,
ρ
k
, E
k
= E[
ρ
k
],
os quais, se a hipótese nula for verdadeira, são iguais a Np
k
.
Assim, a estatística χ
2
expressará a soma das diferenças quadráticas entre as
realizações das variáveis aleatórias
ρ
k
e suas respectivas médias populacionais.
(
)
2
(
)
2
2
1
K
k
k
k
k
k
k
k
O
N p
O
E
O
O
χ
=
∑
=
−
⋅
=
−
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Quando N tende para o infinito, a estatística χ
2
, tal como expressa pela
equação anterior, segue uma distribuição de Qui-Quadrado, com ν = (r-1)
graus de liberdade, ou seja:
Teste de Chi-Quadrados (χ
2
)
Testes de Adequação ou de Aderência
(
)
3
2
2
2
0
0
2
2
lim
2
2
2
r
x
x
r
N
x
e
P
x H
dx
r
χ
−
−
−
→∞
⋅
<
=
−
⋅ Γ
∫
Assim, para grandes valores de N, pode-se,
portanto, empregar esse resultado para
testar a hipótese nula H
0
de que as
freqüências relativas esperadas de
ρ
k
sejam dadas por N·p
k
, com p
k
calculadas pela
distribuição de probabilidades proposta.
Um valor elevado da estatística de teste revela grandes diferenças entre as freqüências
observadas e esperadas, sendo um indicador da pouca aderência da distribuição especificada,
sob H
0
, à amostra.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
T
ab
e
la
d
e
χ
2
Teste de Chi-Quadrados (χ
2
)
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Teste de Chi-Quadrados (χ
2
)
Testes de Adequação ou de Aderência
Importante:
• A distribuição limite da estatística de teste não depende de p
k
, contido em H
0
.
• Na prática, o teste de aderência do χ
2
fornece resultados satisfatórios para N >
50 e para N·p
k
≥ 5, com k =1, 2, ... , K.
• Se as probabilidades associadas ao modelo, p
k
, forem calculadas a partir de uma
distribuição de Π parâmetros, estimados pelas observações amostrais, perde-se Π
graus de liberdade adicionais. Em outras palavras, o parâmetro ν, da distribuição da
estatística de teste χ
2
, será ν = (K – Π - 1).
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Considere
um
conjunto
testes
realizados
em
motores
monocilíndricos com um certo tipo de combustível. O número
de detonações foi gravado durante 30 minutos. Dez destes
motores foram testados e os resultados são apresentados a
seguir. Avaliar, a um nível de significância de 95%, se os dados
amostrais podem ser descritos por uma distribuição de
Poisson?
Teste de Chi-Quadrados (χ
2
) - Exemplo
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Núm Médio de Detonação por
Minutos: 0,72
(216/(10*30))
Solução:
Se x representar a ocorrência de
detonações em um intervalo de
tempo, o parâmetro da distribuição,
λ,
será igual a 0,72
Resultados dos Ensaios de Detonação
Número de Detonações
por Minuto
Número de Vezes que o
Evento Ocorreu durante
o Ensaio
Número de Detonações
Durante o Ensaio
0
134
0
1
123
123
2
37
74
3
5
15
4
1
4
5
0
0
6
0
0
Total
300
216
Teste de Chi-Quadrados (χ
2
) - Exemplo
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Implementação do Teste
Teste de Chi-Quadrados (χ
2
) - Exemplo
Testes de Adequação ou de Aderência
( )
!
x
E
N P x
N
e
x
ν
ν
−
=
i
=
i
i
Conclusão: Considerando que χ
2
< χ
2
1-a,n
, a decisão é a de não rejeitar a hipótese de
nulidade, H
0
, ou seja admitir que os dados observados podem ser descritos por uma
distribuição de Poisson com média igual a 0,72
Função Inv.Qui do Excel
χ
2
1−α,ν
5,99
Classes, K
4
Parâmetros Estimados, Π
1
Graus de Liberdade, ν = (K−Π−1)
2
Número de Detonações
por Minuto
Observado na Amostra (O)
Previsto com Base na
Distribuição de Poisson (E)
0
150
145
0,172
1
100
105
0,238
2
36
39
0,231
>3
14
11
0,818
Soma
300
300
1,459
Número de Vezes que o Evento Ocorreu durante o Ensaio
(
)
E
E
O
−
2
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
O
teste
de
aderência
de
Kolmogorov-Smirnov (KS) é um
teste
não
paramétrico,
cuja
estatística de teste tem como
base a diferença máxima entre as
funções
de
probabilidades
acumuladas, empírica e teórica
(modelo), de variáveis aleatórias
contínuas.
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
Kolmogorov, A., N.
D1903 - †1987
Smirnov, V. I.
D1887 - †1974
7.87
7.04
14.99
9.38
9.87
9.87
11.11
14.40
10.14
11.40
6.38
9.43
5.10
12.65
6.95
6.33
7.54
12.34
11.77
10.94
Dados
Amostrais (X)
Ordenar
e Tratar
0.3
0.4
i
i
Q
N
−
=
+
Quantil
Posição
(i)
Dados Amostrais
(X)
P(x<X)
Observado
Modelo
1
5.10
0.048
0.051
2
6.33
0.095
0.110
3
6.38
0.143
0.114
4
6.95
0.190
0.155
5
7.04
0.238
0.162
6
7.54
0.286
0.206
7
7.87
0.333
0.239
8
9.38
0.381
0.418
9
9.43
0.429
0.424
10
9.87
0.476
0.483
11
9.87
0.524
0.483
12
10.14
0.571
0.518
13
10.94
0.619
0.623
14
11.11
0.667
0.644
15
11.40
0.714
0.680
16
11.77
0.762
0.723
17
12.34
0.810
0.782
18
12.65
0.857
0.812
19
14.40
0.905
0.929
20
14.99
0.952
0.952
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
O
teste
de
aderência
de
Kolmogorov-Smirnov (KS) é um
teste
não
paramétrico,
cuja
estatística de teste tem como
base a diferença máxima entre as
funções
de
probabilidades
acumuladas, empírica e teórica
(modelo), de variáveis aleatórias
contínuas.
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
Kolmogorov, A., N.
D1903 - †1987
Smirnov, V. I.
D1887 - †1974
0.000
0.100
0.200
0.300
0.400
0.500
0.600
0.700
0.800
0.900
1.000
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
16.00
D
is
tr
ib
u
iç
ã
o
A
c
u
m
u
la
d
a
Variável Aleatória
Observado
Modelo
D
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Considere que X represente uma variável aleatória contínua, de cuja
população extraiu-se a amostra {X
1
, X
2
, ... , X
N
}. A hipótese nula a ser
testada é H0: P(X < x) =F
X
(x), onde F
X
(x) é suposta conhecida, ou seja, seus
parâmetros não são estimados a partir da amostra. Para implementar o
teste KS, inicialmente, classifique os elementos da amostra {X
1
,X
2
, ... , X
N
}
em ordem crescente, de modo a constituir a seqüência {x
(1)
, x
(2)
, ... , x
(m)
, ...
x
(N)
}, na qual 1 ≤ m ≤ N denota a ordem de classificação. Para cada elemento
x
(m)
, a distribuição empírica F
N
(x
(m)
) é calculada pela proporção de valores
amostrais que não excedam x
(m)
, ou seja, F
N
= Quantil.
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
Kolmogorov, A., N.
D1903 - †1987
Smirnov, V. I.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Em seguida, calcule as probabilidades teóricas, segundo F
X
(x), tendo como
argumento os valores x
(m)
. A estatística do teste KS é dada por
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
Assim, D
N
corresponderá à maior diferença entre as probabilidades
empírica e teórica (central, a direita ou a esquerda).
( )
( )
(
)
( )
( )
(
)
sup
sup
N
X
m
N
m
N
X
m
N
m
D
F
x
F
x
D
F
x
F
x
−
−
+
+
=
−
=
−
( )
N
m
x
F
N
−
m
=
−
1
( )
N
m
x
F
N
+
m
=
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
Se a hipótese de nulidade, H
0
, for verdadeira quando N→∞ , a estatística
D
N
irá tender a zero. Por outro lado, se N é um valor finito, a estatística D
N
deverá ser da ordem de grandeza de
e, portanto, a quantidade
não
irá tender a zero, mesmo para valores muito elevados de N. Smirnov (1948)
determinou a distribuição limite da variável aleatória
, a qual, sob a
premissa de veracidade da hipótese H
0
, é expressa por:
1
N
D
N
i
N
N
D
i
N
(
)
(
)
2
2
2
2
1
8
1
2
lim
k
z
N
x
k
P
N D
z
e
z
π
π
⋅ −
⋅
−
∞
⋅
→∞
=
⋅
⋅
≤
=
⋅
∑
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Testes e Adequação de Dados à Distribuições de Probabilidade Específicas
Universidade de Brasília
Departamento de Engenharia Mecânica
Programa de Pós-graduação em Ciências Mecânicas
Teste de Kolmogorov-Smirnov
Testes de Adequação ou de Aderência
Importante:
A construção da estatística do teste KS parte da premissa que F
X
(x) é
completamente
conhecida
e,
portanto,
que
seus
parâmetros
são
especificados e, portanto, não são estimados a partir da amostra.
Entretanto, quando as estimativas dos parâmetros são obtidas dos
elementos da amostra, simulações de Monte Carlo demonstram que o teste
KS é conservador quanto à magnitude do erro do tipo I, podendo ocorrer
rejeições indevidas da hipótese nula. Com o objetivo de corrigir tal
situação, Crutcher (1975) apresenta novas tabelas de valores críticos da
estatística D
N,α
para amostras de tamanhos variáveis, considerando, sob H
0
,
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.