An´ alise da M´ edia
Anna Regina Corbo
CEFET/RJ - UnED NI
Aula Te´ orica 2
Comparar duas condi¸c˜ oes (tratamentos) diferentes para determinar
se cada condi¸ c˜ ao produz um efeito significante na resposta.
Considere duas popula¸c˜ oes independentes:
popula¸ c˜ ao 1: m´ edia µ
1e variˆ ancia σ
21. popula¸ c˜ ao 2 : m´ edia µ
2e variˆ ancia σ
22.
Vamos basear nossa inferˆ encia em duas amostras aleat´ orias de
tamanho n
1e n
2das popula¸c˜ oes 1 e 2, respectivamente.
An´ alise da diferen¸ ca das m´ edias µ
1−µ
2:
1
Com variˆ ancias σ
12e σ
22conhecidas.
2
Com variˆ ancias σ
12e σ
22desconhecidas:
Supondo queσ12=σ22 Supondo queσ126=σ22
conhecidas
Suponha que:
1
X
11, X
12, . . ., X
1n1´ e uma amostra aleat´ oria proveniente da popula¸ c˜ ao 1;
2
X
21, X
22, . . ., X
2n2´ e uma amostra aleat´ oria proveniente da popula¸ c˜ ao 2;
3
As duas popula¸ c˜ oes representadas por X
1e X
2s˜ ao independentes;
4
Ambas as popula¸ c˜ oes s˜ ao normais ou tais que o teorema
central do limite se aplica.
conhecidas
Estimadores e Estat´ıstica
Estimador para a diferen¸ ca de m´ edias:
E [X
1−X
2] = µ
1−µ
2Estimador para a variˆ ancia da diferen¸ ca de m´ edias:
Var [X
1−X
2] = σ
12n
1+ σ
22n
2conhecidas
Estimadores e Estat´ıstica
No caso de uma amostra, tinhamos como distribui¸ c˜ ao de probabilidade da estat´ıstica, a distribui¸ c˜ ao normal padr˜ ao, onde:
Z = X
−µ
rσ
2n
, onde
Z
∼N(0, 1).
De modo an´ alogo, neste caso, teremos:
Z = X
1−X
2−(µ
1−µ
2)
sσ
12n
1+ σ
22n
2, onde
Z
∼N(0, 1).
conhecidas
Teste de hip´oteses
Teste de hip´ oteses para a diferen¸ ca nas m´ edias µ
1−µ
2de duas popula¸ c˜ oes:
H
0: µ
1−µ
2= ∆
0H
1: µ
1−µ
2 6= ∆0Desejamos testar se esta diferen¸ ca ´ e igual ou n˜ ao a um valor
especificado ∆
0. Se quisermos testar a igualdade das duas m´ edias
basta definir ∆
0= 0.
conhecidas
Teste de hip´oteses
Hip´ otese Nula:
H
0: µ
1−µ
2= ∆
0Estat´ıstica do Teste:
Z
calc= X
1−X
2−∆
0s
σ
21n
1+ σ
22n
2conhecidas
Teste de hip´oteses
Hip´ oteses Alternativas H
1: µ
1−µ
26= ∆0H
1: µ
1−µ
2> ∆
0H
1: µ
1−µ
2< ∆
0Crit´ erios de Rejei¸ c˜ ao
z
calc> z
α/2ou z
calc<
−zα/2z
calc> z
αz
calc<
−zαconhecidas
Teste de hip´oteses - Exemplo 1
Um idealizador de produtos est´ a interessado em reduzir o tempo de secagem de uma tinta. Duas formula¸ c˜ oes de tinta s˜ ao testadas:
a formula¸c˜ ao 1 tem uma qu´ımica padr˜ ao e a formula¸ c˜ ao 2 tem um
novo ingrediente, que deve reduzir o tempo de secagem. Da
experiˆ encia, sabe-se que o desvio-padr˜ ao do tempo de secagem ´ e
de 8 minutos e que este dado n˜ ao deve ser alterado pela adi¸ c˜ ao do
novo ingrediente. Dez esp´ ecimes s˜ ao pintados com a formula¸ c˜ ao 1
e outros dez esp´ ecimes s˜ ao pintados com a formula¸ c˜ ao 2. Os
tempos m´ edios de secagem das duas amostras s˜ ao x
1= 121
minutos e x
2= 112 minutos, respectivamente. Quais as
conclus˜ oes que o idealizador de produtos pode tirar sobre a
eficiˆ encia do novo ingrediente, usando α = 0, 05?
conhecidas
Intervalo de confian¸ca
Vimos que se as duas popula¸ c˜ oes forem normais ent˜ ao a vari´ avel
Z = X
1−X
2−(µ
1−µ
2)
sσ
21n
1+ σ
22n
2ter´ a uma distribui¸ c˜ ao normal padr˜ ao. Isso implica que:
P (−z
α/2 6Z
6z
α/2) = 1
−α
conhecidas
Intervalo de confian¸ca
P 0
@X1−X2−zα/2
s σ21 n1
+σ22
n2 6µ1−µ26X1−X2+zα/2
s σ12 n1
+σ22 n2
1 A= 1−α
Ou seja, este ´ e o intervalo de confian¸ca 1
−α para a diferen¸ ca de
m´ edias se X
1e X
2forem as m´ edias de duas amostras aleat´ orias
independentes de tamanhos n
1e n
2, provenientes de popula¸ c˜ oes
com variˆ ancias conhecidas σ
12e σ
22, respectivamente.
conhecidas
Intervalo de confian¸ca - Exemplo 2
Testes de resistˆ encia ` a tens˜ ao foram feitos em duas estruturas contendo dois teores distintos de alum´ınio. Essas estruturas foram usadas na fabrica¸ c˜ ao das asas de um avi˜ ao. Os dados obtidos s˜ ao mostrados na tabela abaixo. Se µ
1e µ
2denotam as resistˆ encias m´ edias para os dois tipos de teores da estrutura, encontre um intervalo de confian¸ ca de 90% para a diferen¸ ca real destas resistˆ encias.
Tipo da Tamanho Resistˆ encia m´ edia Desvio-padr˜ ao Estrutura da amostra da amostra (kg /mm
2) (kg /mm
2)
1 10 87,6 1,0
desconhecidas
Quando o tamanho da amostra ´ e consideravelmente pequeno ou
quando desconhecemos o valor da variˆ ancia populacional σ
2, ao
supor que a popula¸ c˜ ao ´ e normalmente distribu´ıda devemos basear
nossas an´ alises de inferˆ encia na distribui¸c˜ ao t-Student.
desconhecidas
Teste de Hip´oteses
No caso de variˆ ancias desconhecidas, devemos estudar duas
situa¸c˜ oes diferentes: primeiro, se as variˆ ancias em quest˜ ao s˜ ao
iguais, e segundo, caso elas sejam diferentes.
desconhecidas
Teste de Hip´oteses
CASO 1 - Variˆ ancias Iguais: σ
21= σ
22= σ
2Suponha que tenhamos duas popula¸ c˜ oes normais independentes, com m´ edias desconhecidas µ
1e µ
2e variˆ ancias desconhecidas, por´ em iguais, σ
12= σ
22= σ
2. Desejamos testar
H
0: µ
1−µ
2= ∆
0H
1: µ
1−µ
2 6= ∆0desconhecidas
Estimadores do CASO 1 - Variˆancias Iguais
M´ edia: E [X
1−X
2] = µ
1−µ
2Variˆ ancia: Var [X
1−X
2] = σ
12n
1+ σ
22n
2= σ
2n
1+ σ
2n
2= σ
21
n
1+ 1 n
2
Estimador Combinado S
p2:
S
p2= (n
1−1)S
12+ (n
2−1)S
22n
1+ n
2−2
Dizemos que este estimador combinado possui n
1+ n
2−2 graus
desconhecidas
Estat´ıstica de Teste CASO 1 - Variˆancias Iguais
Como
Z = X
1−X
2−(µ
1−µ
2) σ
r
1 n
1+ 1
n
2tem uma distribui¸c˜ao
N
∼(0, 1)
ent˜ ao, trocando σ por S
ptemos o seguinte:
T = X
1−X
2−(µ
1−µ
2) S
pr
1 n
1+ 1
n
2tem uma distribui¸ c˜ ao t, com n
1+ n
2−2 graus de liberdade.
desconhecidas
Teste de Hip´oteses CASO 1 - Variˆancias Iguais
Teste t Combinado para Duas Amostras Hip´ otese Nula:
H
0: µ
1−µ
2= ∆
0Estat´ıstica do Teste:
T
calc= X
1−X
2−∆
0S
p r1
n
1+ 1
n
2desconhecidas
Teste de Hip´oteses CASO 1 - Variˆancias Iguais
Teste t Combinado para Duas Amostras Hip´ oteses Alternativas
H
1: µ
1−µ
26= ∆0H
1: µ
1−µ
2> ∆
0H
1: µ
1−µ
2< ∆
0Crit´ erios de Rejei¸ c˜ ao
t
calc> t
α/2,n1+n2−2ou t
calc<
−tα/2,n1+n2−2t
calc> t
α,n1+n2−2t
calc<
−tα,n1+n2−2desconhecidas
Teste de Hip´oteses CASO 1 - Variˆancias Iguais - Exemplo 3
Vocˆ e ´ e um analista financeiro de uma corretora de a¸ c˜ oes. De acordo com os dados coletados abaixo, h´ a diferen¸ ca de dividendos entre as a¸ c˜ oes negociadas na Bolsa de T´ okio e de NY? Assuma variˆ ancias iguais e α = 5%.
NY T´ oquio N´ umero de A¸ c˜ oes 21 1 25
M´ edia amostral 3,27 2,53
Desvio-padr˜ ao amostral 1,30 1,16
desconhecidas
Teste de Hip´oteses
CASO 2 - Variˆ ancias diferentes: σ
21 6=σ
22Em algumas situa¸ c˜ oes n˜ ao ´ e razo´ avel considerar que as vari´ aveis
desconhecidas σ
21e σ
22sejam iguais.
desconhecidas
Estat´ıstica de teste do CASO 2 - Variˆancias diferentes
Neste caso, se H
0: µ
1−µ
2= ∆
0for verdadeira, ent˜ ao a estat´ıstica
T
calc∗= X
1−X
2−∆
0s
S
12n
1+ S
22n
2´ e distribu´ıda normalmente com t, com graus de liberdade dados aproximadamente por
υ =
S
12n
1+ S
22n
22
2 2 2 2 −
2
desconhecidas
Estat´ıstica de teste do CASO 2 - Variˆancias diferentes - Observa¸c˜oes
Realiza¸c˜ ao do teste igual ao anterior, exceto por:
troque T
calcpor T
calc∗na estat´ıstica do teste;
n
1+ n
2−2 ´ e trocado por υ na determina¸ c˜ ao do grau de
liberdade do teste
desconhecidas
Teste de Hip´oteses do CASO 2 - Variˆancias diferentes - Exemplo 4
Um fabricante de unidades de v´ıdeos est´ a testando dois projetos de microcircuitos para determinar se eles produzem correntes m´ edias equivalentes. A engenharia de desenvolvimento obteve os seguintes dados:
Projeto 1 n
1= 15 x
1= 24, 2 s
12= 10 Projeto 2 n
2= 10 x
2= 23, 9 s
22= 20
Usando α = 10%, desejamos determinar se h´ a qualquer diferen¸ ca
na corrente m´ edia entre os dois projetos, supondo que ambas as
popula¸ c˜ oes sejam normais, embora n˜ ao estejamos dispostos a
desconhecidas
Intervalo de confian¸ca
CASO 1 - Variˆ ancias Iguais: σ
21= σ
22= σ
2A estat´ıstica T , definida por:
T = X
1−X
2−(µ
1−µ
2) S
pr
1 n
1+ 1 n
2tem distribui¸ c˜ ao t-Student, com n
1+ n
2−2 graus de liberdade.
Sendo assim temos, em termos de probabilidade, a express˜ ao:
P (−t
α/2,n1+n2−26T
6t
α/2,n1+n2−2) = 1
−α
desconhecidas
Intervalo de confian¸ca: CASO 1 - Variˆancias Iguais
Substituindo T pela defini¸c˜ ao da estat´ıstica e tomando g = n
1+ n
2−2 graus de liberdade, temos:
P 0 B B B B
@
−tα/2,g6X1−X2−(µ1−µ2) Sp
s 1 n1
+ 1 n2
6tα/2,g 1 C C C C A
= 1−α
P X1−X2−tα/2,g·Sp
s 1 n1
+ 1 n2
6µ1−µ26X1−X2+tα/2,g·Sp
s 1 n1
+ 1 n2
!
= 1−α
Isto ´ e, este ´ e o intervalo de confian¸ ca 1
−α para a diferen¸ ca de
m´ edias se X
1e X
2forem as m´ edias de duas amostras aleat´ orias
desconhecidas
Intervalo de confian¸ca: CASO 2 - Variˆancias diferentes
A estat´ıstica
T
∗= X
1−X
2−(µ
1−µ
2)
sS
12n
1+ S
22n
2´ e distribu´ıda aproximadamente como a distribui¸ c˜ ao t-Student , com υ graus de liberdade. Em termos de probabilidade, obteremos o intervalo de confian¸ ca
P (−t
α/2,υ 6T
∗ 6t
α/2,υ) = 1
−α
desconhecidas
Intervalo de confian¸ca: CASO 2 - Variˆancias diferentes
P 0
@X1−X2−tα/2,υ
s S12 n1
+S22
n2 6µ1−µ26X1−X2+tα/2,υ
s S12 n1
+S22 n2
1 A= 1−α
onde υ ´ e dado aproximadamente por:
υ =
S
12n
1+ S
22n
22
(S
12/n
1)
2n
1+ 1 + (S
22/n
2)
2n
2+ 1
−
2
desconhecidas
Intervalo de confian¸ca: CASO 2 - Variˆancias diferentes - Exemplo 5