Introdu¸c˜ao Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Jonathas Magalh˜aes
jonathas@ic.ufal.br
Introdu¸c˜ao Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Roteiro
1 Introdu¸c˜ao
Inferˆencia Estat´ıstica
2 Distribui¸c˜oes Amostrais
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Introdu¸c˜
ao
Inferˆencia Estat´ıstica
Estudo de t´ecnicas que possibilitam a extrapola¸c˜ao, a um grande conjunto de dados, das informa¸c˜oes e conclus˜oes obtidas a partir de subconjunto de valores, usualmente de dimens˜ao muito menor.
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Exemplos:
Descobrir a altura m´edia dos estudantes da UFAL; Pesquisa de inten¸c˜oes de voto;
Descobrir peso m´edio de determinado fruto numa colheita; Pesquisa de mercado sobre a preferˆencia do consumidor em determinado produto.
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Descobrir a altura m´edia dos estudantes da UFAL.
´
E poss´ıvel entrevistar todos os alunos?
E se conseguirmos dados de 50 alunos, o que poderemos inferir?
Ser´a que essa amostra ´e representativa?
E se a nossa amostra forem os dados das sele¸c˜oes masculina e feminina de basquete e vˆolei?
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Descobrir a altura m´edia dos estudantes da UFAL.
´
E poss´ıvel entrevistar todos os alunos?
E se conseguirmos dados de 50 alunos, o que poderemos inferir?
Ser´a que essa amostra ´e representativa?
E se a nossa amostra forem os dados das sele¸c˜oes masculina e feminina de basquete e vˆolei?
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Descobrir a altura m´edia dos estudantes da UFAL.
´
E poss´ıvel entrevistar todos os alunos?
E se conseguirmos dados de 50 alunos, o que poderemos inferir?
Ser´a que essa amostra ´e representativa?
E se a nossa amostra forem os dados das sele¸c˜oes masculina e feminina de basquete e vˆolei?
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Descobrir a altura m´edia dos estudantes da UFAL.
´
E poss´ıvel entrevistar todos os alunos?
E se conseguirmos dados de 50 alunos, o que poderemos inferir?
Ser´a que essa amostra ´e representativa?
E se a nossa amostra forem os dados das sele¸c˜oes masculina e feminina de basquete e vˆolei?
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Nota¸c˜ao:
Um amostra de tamanho n:
(x1, x2, ..., xn);
M´edia da popula¸c˜ao:
µ; M´edia da amostra:
x; Variˆancia da popula¸c˜ao:
σ2. Variˆancia da amostra:
Introdu¸c˜ao
Distribui¸c˜oes Amostrais Intervalos de Confian¸ca
Inferˆencia Estat´ıstica
Inferˆ
encia Estat´ıstica
Estimadores:
M´edia da amostra:
x = x1+ x2+ ... + xn
n ;
Variˆancia da amostra: s2= 1 n − 1 n X i=1 (xi − x)2.
Introdu¸c˜ao
Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Distribui¸c˜
oes Amostrais
Exemplo 1
Um jogo consiste em lan¸car uma moeda honesta 3 vezes. Para cada lan¸camento, se sair cara vocˆe ganha 1 ponto, caso saia coroa, vocˆe perde um ponto. Podemos modelar essa situa¸c˜ao por meio de uma vari´avel x que, em uma popula¸c˜ao, pode assumir os valores -1 e 1, com probabilidades iguais. Para uma amostra aleat´oria e independente de tamanho 3, vamos determinar as fun¸c˜oes de probabilidade dos estimadores x e s2.
Introdu¸c˜ao
Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Distribui¸c˜
oes Amostrais
Exemplo 1: Probabilidades e valores de x e s2. (x1, x2, x3) probabilidade x s2 (-1,-1,-1) 1/8 -1 0 (-1,-1,1) 1/8 -1/3 4/3 (-1,1,-1) 1/8 -1/3 4/3 (-1,1,1) 1/8 1/3 4/3 (1,-1,-1) 1/8 -1/3 4/3 (1,-1,1) 1/8 1/3 4/3 (1,1,-1) 1/8 1/3 4/3 (1,1,1) 1/8 1 0
Introdu¸c˜ao
Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Distribui¸c˜
oes Amostrais
Exemplo 1: Distribui¸c˜oes dos estimadores x e s2.
x -1 -1/3 1/3 1 pi 1/8 3/8 3/8 1/8 E(x) = −1 ∗ 1/8 + (−1/3) ∗ 1/8 + 1/3 ∗ 1/8 = 0. s2 0 4/3 pi 1/4 3/4 E(s2) = 0 ∗ 1/4 + 4/3 ∗ 3/4 = 1.
Introdu¸c˜ao
Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Distribui¸c˜
oes Amostrais
Dada uma popula¸c˜ao Normal:
x ∼ N(µ, σ2).
Temos que a distribui¸c˜ao da m´edia amostral ´e: x ∼ N(µx, σx2), onde: µx = E (x) = E ( 1 n n X i=1 xi) = 1 nnµ = µ; 1Xn 1 σ2
Introdu¸c˜ao
Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Distribui¸c˜
oes Amostrais
Dada uma popula¸c˜ao Normal com m´edia µ e variˆancia σ2; A m´edia amostral x tamb´em ter´a distribui¸c˜ao Normal com m´edia µ e variˆancia σ2/n.
Notem que `a medida em que o tamanho da amostra cresce, a probabilidade da m´edia amostral estar na vizinhan¸ca da m´edia populacional torna-se maior.
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Teorema Central do Limite
A distribui¸c˜ao amostral das m´edias de amostras de qualquer distribui¸c˜ao tende a ser uma distribui¸c˜ao normal quando o tamanho das amostras cresce;
Temos que: x − µ σ/√n n→∞ −−−→ Z , em que: Z ∼ N(0, 1).
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Intervalos de Confian¸ca
Amostra versus Popula¸c˜ao;
Como obter uma boa estimativa da m´edia populacional se conhecemos apenas uma amostra dessa popula¸c˜ao?
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Intervalos de Confian¸ca
A ideia ´e encontrar dois limites c1 e c2 tal que exista uma alta
probabilidade (1-α) da m´edia da popula¸c˜ao (µ) estar no intervalo [c1, c2];
P[c1 ≤ µ ≤ c2] = 1 − α;
[c1, c2] ´e chamado intervalo de confian¸ca da m´edia da
popula¸c˜ao;
α ´e o n´ıvel de significˆancia; 100(1 − α) ´e o n´ıvel de confian¸ca; (1 − α) ´e o coeficiente de confian¸ca.
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Intervalos de Confian¸ca
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Intervalos de Confian¸ca
Z = σ/x−µ√n; P(−z(1−α)/2≤ Z ≤ z(1−α)/2) = 1 − α P(−z(1−α)/2≤ x − µ σ/√n ≤ z(1−α)/2) = 1 − α P(−z(1−α)/2∗√σ n ≤ x − µ ≤ z(1−α)/2∗ σ √ n) = 1 − α P(x − z(1−α)/2∗√σ n ≤ µ ≤ x + z(1−α)/2∗ σ √ n) = 1 − αIntrodu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Qual N´ıvel de Confian¸ca Utilizar?
Vai depender do dom´ınio que vocˆe est´a estudando; 60% de confian¸ca pode ser muito ou pouco; 95% de confian¸ca pode ser muito ou pouco; Exemplos:
Analisar o efeito de um medicamento; Analisar a precis˜ao de um algoritmo.
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Exerc´ıcio 1
A experiˆencia com trabalhadores de uma certa ind´ustria indica que o tempo necess´ario para que um trabalhador,
aleatoriamente selecionado, realize uma tarefa ´e distribu´ıdo de maneira aproximadamente normal, com desvio padr˜ao de 12 minutos. Uma amostra de 25 trabalhadores forneceu x = 140 min. Determinar os intervalos de confian¸ca de 95% para a m´edia µ da popula¸c˜ao de todos os trabalhadores que fazem aquele determinado servi¸co.
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Resolu¸c˜
ao
Dados: n=25, σ=12, x = 140 e α = 5%; Temos que o desvio padr˜ao amostral ´e igual a s = σ/√n = 12/5 = 2.4;
Consultando a tabela, temos que: z47.5%= 1.96; P(135.296 ≤ µ ≤ 144.704) = 0.95;
Introdu¸c˜ao Distribui¸c˜oes Amostrais
Intervalos de Confian¸ca
Exerc´ıcio 2
Uma amostra aleat´oria de 80 notas de matem´atica de uma popula¸c˜ao com distribui¸c˜ao normal de 5000 notas apresenta m´edia de 5.5 e desvio padr˜ao de 1.25.
a Quais os limites de confian¸ca de 95% para a m´edia das
amostras em rela¸c˜ao `a m´edia das 5000 notas?
b Com que grau de confian¸ca dir´ıamos que a m´edia das notas ´e