Compara¸c˜ ao de V´ arias M´ edias:
A An´ alise da Variˆ ancia
Anna Regina Corbo
CEFET/RJ - UnED NI
Aula Te´ orica 4
Objetivo
Identificar diferen¸cas entre as m´ edias populacionais devidas a diferentes tratamentos atuando simultaneamente sobre os elementos da popula¸c˜ ao.
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
M´ etodo da An´ alise da Variˆ ancia
Suponha que:
temos k amostras retiradas de k popula¸ c˜ oes;
todas as amostras com o mesmo tamanho n;
todas as k popula¸ c˜ oes possuem a mesma variˆ ancia σ
2.
⇒ Queremos comparar as m´ edias µ
1, µ
2, · · · , µ
k. Teste de Hip´ oteses:
H
0: µ
1= µ
2= · · · = µ
kH
1: Pelo menos uma das m´ edias populacionais ´ e diferente.
Exemplo - Funcionamento do M´ etodo
Considere trˆ es amostras com cinco elementos cada uma, conforme os dados abaixo:
Amostra 1 64 66 59 65 62 Amostra 2 71 73 66 70 68 Amostra 3 52 57 53 56 53
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
Exemplo - Funcionamento do M´ etodo
Figura: Esquematiza¸ c˜ ao pontual dos dados de cada amostra
Exemplo - Funcionamento do M´ etodo
Para testar a igualdade das m´ edias , realizaremos o teste:
H
0: µ
1= µ
2= µ
3H
1: Nem todas as m´ edias s˜ ao iguais.
As variˆ ancias parecem ser parecidas, por´ em as m´ edias s˜ ao muito diferentes. Logo, claramente, a hip´ otese nula ser´ a rejeitada.
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
Constru¸c˜ ao do M´ etodo
Formalmente, seja x
ij(onde i = 1, 2, · · · , k e j = 1, 2, · · · , n) o j-´ esimo valor da i-´ esima amostra de n elementos e:
T
i= P
nj=1
x
ij= soma dos valores da i-´ esima amostra;
Q
i= P
nj=1
x
ij2= soma dos quadrados dos valores da i-´ esima amostra;
T = P
ki=1
T
i= P
k i=1P
nj=1
x
ij= soma total dos valores;
Q = P
ki=1
Q
i= P
k i=1P
nj=1
x
ij2= soma total dos quadrados;
¯ x
i= T
in = m´ edia da i-´ esima amostra;
¯ ¯ x = T
nk = m´ edia de todos os valores.
Constru¸c˜ ao do M´ etodo
A an´ alise da variˆ ancia baseia-se na premissa que, sendo verdadeira a hip´ otese H
0, existem trˆ es maneiras pelas quais a variˆ ancia σ
2comum a todas as popula¸ c˜ oes, pode ser estimada.
1
Estimativa total
2
Estimativa entre amostras
3
Estimativa residual
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
Constru¸c˜ ao do M´ etodo - Estimativa total s T 2
Esta estimativa sup˜ oe que se H
0´ e verdadeira, ent˜ ao podemos considerar todas as amostras como provenientes de uma mesma popula¸ c˜ ao. Esta estimativa ´ e dada por:
s
T2= P
ki=1
P
nj=1
(x
ij− x) ¯ ¯
2n · k − 1 = Q −
Tnk2nk − 1
Se notarmos o numerador da express˜ ao de soma quadr´ atica total, ou SQ
T, temos que:
s
T2= SQ
Tnk − 1
Constru¸c˜ ao do M´ etodo - Estimativa entre amostras s E 2
Neste caso, se H
0´ e verdadeira, ent˜ ao cada m´ edia amostral ¯ x
idas k amostras ´ e um elemento de uma amostra de tamanho k de uma
´
unica popula¸ c˜ ao. Deste modo, a estimativa da variˆ ancia ´ e dada por:
s
E2= n · P
ki=1
( ¯ x
i− ¯ ¯ x)
2k − 1 =
Pk i=1Ti2
n
−
Tnk2k − 1
Se chamarmos o numerador da estimativa entre amostras de soma quadr´ atica entre amostras, ou SQ
E, ent˜ ao teremos:
s
E2= SQ
Ek − 1
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
Constru¸c˜ ao do M´ etodo - Estimativa residual s R 2
Supondo H
0verdadeira, a variˆ ancia comum σ
2pode ser estimada por cada uma das variˆ ancias amostrais s
i2. Combinando estas k estimativas podemos obter uma estimativa unica para σ
2. Cada amostra individual fornece a estimativa
s
i2= P
nj=1
(x
ij− x ¯
i)
2n − 1 = Q
i−
Tni2n − 1
Constru¸c˜ ao do M´ etodo - Estimativa residual s R 2
Deste modo,
s
R2= P
ki=1
s
i2k =
P
k i=1Qi−T
2 i n
n−1
!
k = Q −
Pk i=1Ti2
n
k (n − 1)
Se chamarmos o numerador de soma quadr´ atica residual, ou SQ
R, temos que:
s
R2= SQ
Rk(n − 1) Note que SQ
T= SQ
E+ SQ
R.
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
Constru¸c˜ ao do M´ etodo - Estat´ıstica do Teste
Uma vez que utilizaremos estimativas para a variˆ ancia na condu¸ c˜ ao do teste de compara¸c˜ ao de v´ arias m´ edias, a hip´ otese ser´ a testada utilizando a estat´ıstica:
F
calc= s
E2s
R2Constru¸c˜ ao do M´ etodo - Tomando a Decis˜ ao
Este teste ´ e um teste F-Snedcor que ser´ a conduzido com k − 1 graus de liberdade no numerador e k (n − 1) no denominador. Ou seja, H
0ser´ a rejeitada se
F
calc> F
α;k−1;k(n−1)⇒ Rejeite H
0.
onde α ´ e o n´ıvel de significˆ ancia do teste, que deve ser sempre unilateral.
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia
Tabela ANOVA
Do inglˆ es, ANalysis Of VAriance:
Fonte de Soma Graus de M´edia Fcalc Fα
Varia¸c˜ao Quadr´atica Liberdade Quadr´atica
Entre amostras SQE= Pk
i=1T2 i
n −Tnk2 k−1 sE2=SQEk−1 F=s E2 s2 R
fα;k−1;k(n−1)
Residual SQR=Q− Pk
i=1T2 i
n k(n−1) sR2=k(n−1)SQR Total SQT =Q−Tnk2 nk−1
An´ alise da Variˆ ancia - Exemplo
Trˆ es chapas de uma liga met´ alica de mesma procedˆ encia foram submetidas a trˆ es diferentes tratamentos t´ ermicos A, B e C. Ap´ os o tratamento, foram tomadas 5 medidas de dureza superficial de cada chapa, obtendo-se os seguintes resultados:
Tratamento Dureza
A 68 74 77 70 71
B 67 65 69 66 67
C 73 77 76 69 80
Existe diferen¸ ca significativa entre os tratamento t´ ermicos aplicados? Utilize α = 5%.
Anna Regina Corbo Compara¸c˜ao de V´arias M´edias: An´alise da Variˆancia