• Nenhum resultado encontrado

Introdu¸c˜ao `a probabilidade e estat´ıstica II

N/A
N/A
Protected

Academic year: 2022

Share "Introdu¸c˜ao `a probabilidade e estat´ıstica II"

Copied!
23
0
0

Texto

(1)

Introdu¸c˜ ao ` a probabilidade e estat´ıstica II

Intervalos de confian¸ca para a m´edia amostral

Prof. Alexandre G Patriota Sala: 298A

Email: patriota@ime.usp.br Site: www.ime.usp.br/∼patriota

(2)

Revis˜ ao

I Define-se o problema de interesse e Coleta-se os dados,

I Estat´ıstica descritiva (histogramas, m´edias, variˆancias, quantis, gr´aficos, etc),

I Baseando-se no histograma pode-se propor um modelo estat´ıstico adequado (fun¸c˜oes densidades de probabilidade ou fun¸c˜oes de probabilidade),

I Estima-se os parˆametros do modelo estat´ıstico utilizando algum m´etodo de estima¸c˜ao (m´axima verossimilhan¸ca, m´ınimos quadrados, m´etodos dos momentos).

I Nesta aula veremos como construir estimadores intervalares.

(3)

Caso normal

SejaX1, . . . ,Xn uma amostra aleat´oria deX tal queX ∼N(µ, σ2).

Vimos que:

X¯ e SX2 s˜ao os estimadores de m´axima verossimilhan¸ca paraµ e σ2, respectivamente.

Dizemos que estes s˜ao os estimadores pontuais paraµe σ2. Podemos criar estimadores intervalares. Para isso devemos analisar as distribui¸c˜oes dos estimadores.

(4)

Distribui¸c˜ ao da m´ edia - Caso normal

SejaX1, . . . ,Xn uma amostra aleat´oria deX tal queX ∼N(µ, σ2).

Vimos que:

A m´edia amostral tem distribui¸c˜ao normal EXATA

√n( ¯X −µ)

σ2 ∼N(0,1)

Ou seja, temos a distribui¸c˜ao exata de ¯X (caso em que as vari´aveis X1, . . . ,Xn s˜ao normais)

(5)

Probabilidades da m´ edia amostral

Se os dados tem distribui¸c˜ao normal, ent˜ao ¯X ∼N(µ, σ2/n).

DefinaσX2¯2/n

Podemos calcular ent˜ao probabilidades do tipo P(|X¯ −µ| ≤)

Ou seja, a probabilidade de que a distˆancia da m´edia amostral e a verdadeira m´edia n˜ao exceda . Podemos re-escrever em termos de de desvios-padr˜ao da m´edia amostral ¯X:

P

|X¯ −µ| ≤kσX¯

Ou seja, a probabilidade de que a distˆancia da m´edia amostral e a verdadeira m´edia n˜ao exceda k desvios-padr˜ao de ¯X

(6)

Intervalo de confian¸ca para a m´ edia – Variˆ ancia conhecida

Um intervalo de confian¸ca para a m´edia populacional ´e obtido fixando o valor deγ (coeficiente de confian¸ca) e calculando o valor dek tal que

P

|X¯ −µ| ≤kσX¯

=γ Note que:

P

−kσX¯ ≤X¯ −µ≤kσX¯

P

−k ≤ X¯ −µ σX¯

≤k

=P(−k ≤Z ≤k) =γ

Assim, dadoγ, podemos encontrar o valor dek na tabela normal.

(7)

Intervalo de confian¸ca para a m´ edia – Variˆ ancia conhecida

Note que:

P

−kσX¯ ≤X¯ −µ≤kσX¯

P

X¯ −kσX¯ ≤µ≤X¯ +kσX¯

Assim, o intervalo de confian¸ca (com coeficiente de confian¸caγ) ´e IC(µ, γ%) =

X¯ −kσX¯; ¯X +kσX¯

Note quek depende diretamente de γ, poisP(−k ≤Z ≤k) =γ.

Podemos simplesmente chamar dek =zγ/2.

(8)

Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia conhecida

SeX1, . . . ,Xn ´e uma amostra aleat´oria de X ∼N(µ, σ2), ent˜ao um intervalo de confian¸ca, com coeficiente de confian¸ca γ, para a m´edia populacionalµquando a variˆancia σ2 ´econhecida, ´e dado por

IC(µ, γ%) =

X¯ −zγ/2σX¯; ¯X +zγ/2σX¯

em que

σX¯ = rσ2

n e P(−zγ/2≤Z ≤zγ/2) =γ

(9)

Interpreta¸c˜ ao do IC

Se repetirmos o experimento v´arias vezes e contruirmos intervalos de confian¸caIC(µ, γ%) para cada um destes experimentos, esperamos queγ% destes intervalos de confian¸ca contenham o verdadeiro valor da m´edia populacional.

Na pr´atica fazemos apenas um experimento e portanto teremos apenas um intervalo. Consideramos, ent˜ao, que a verdadeira m´edia est´a contida neste intervalo.

(10)

Interpreta¸c˜ ao gr´ afica

Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.

(11)

Exemplo

Uma m´aquina enche sacos de a¸cucar com um desvio-padr˜ao de 10 gramas. Inicialmente a m´aquina estava regulada para, em m´edia, encher pacotes com 1 quilo.

Suspeita-se que ela se desregulou e desejamos verificar qual o novo valor de m´edia populacional.

Uma amostra de 50 pacotes apresentou m´edia amostral de 987 gramas. Construa um intervalo de 95% de confian¸ca supondo que a variabilidade do processo ´e a mesma.

(12)

Solu¸c˜ ao:

Note queσX¯ = 10n = 10

50 =√ 2

Pela tabela normal: P(−1,96≤Z ≤1,96) = 0,95.

PortantoIC(µ,95%) = [987−1,96√

2; 987 + 1,96√ 2]

IC(µ,95%) = [984,23; 989,77]

Ou seja, o intervalo de confian¸ca de 95% n˜ao cont´em o valor esperado (1000 gramas). Conclu´ımos que a m´aquina est´a desregulada com um grau de 95% de confian¸ca.

(13)

Exerc´ıcio

Assuma queX ∼N(µ,100).

Qual deve ser o tamanho de uma amostra para que a diferen¸ca da m´edia amostral e m´edia populacional, em valor absoluto, seja menor do que 1, com coeficiente de confian¸ca igual a: 95% e 99%

(14)

Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia desconhecida

A teoria desenvolvida nos slides anteriores considerou que a

variˆancia era conhecida. Utilizamos o seguinte fato na deriva¸c˜ao do intervalo de confian¸ca:

√n( ¯X −µ)

σ2 ∼N(0,1)

Precisamos substituirσ2 por algum estimador. Um candidato inicial seriaSX2.

√n( ¯X −µ)

√?

Qual ´e a quantidade que devemos colocar em “?” ?

(15)

Resultados – caso normal

SeX1, . . . ,Xn s˜ao vari´aveis independentes e identicamente distribu´ıdas de acordo comX ∼N(µ, σ2).

Resultado 1: temos que ( ¯X−µ) e

n

X

i=1

(Xi −X¯)2 s˜ao independentes.

Resultado 2: temos que 1 σ2

n

X

i=1

(Xi −X¯)2∼χ2(n−1)

(16)

Distribui¸c˜ ao da variˆ ancia amostral – caso normal

SejaX1, . . . ,Xn uma amostra aleat´oria deX tal queX ∼N(µ, σ2).

O estimador de m´axima verossimilhan¸ca paraσ2 ´e SX2 = 1

n

n

X

i=1

(Xi −X¯)2.

I Utilizando os Resultados 1 e 2, calcule a esperan¸ca, variˆancia, vi´es e erro quadr´atico m´edio deSX2.

I Defina ˜SX2 = n−11 Pn

i=1(Xi−X¯)2. Calcule sua esperan¸ca, variˆancia, vi´es e erro quadr´atico m´edio.

(17)

Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia desconhecida

Note que seZ ∼N(0,1) e Y ∼χ2(k) s˜ao independentes, ent˜ao Z

pY/k ∼t(k)

Temos, portanto,

√n( ¯X −µ) qS˜X2

=

√n( ¯X−µ)

σ2

q˜

SX2 σ2

∼t(n−1)

A constru¸c˜ao do intervalo de confian¸ca quando a variˆancia ´e desconhecida ´e feita de maneira similar ao caso de variˆancias conhecidas.

(18)

Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia desconhecida

SeX1, . . . ,Xn ´e uma amostra aleat´oria de X ∼N(µ, σ2), ent˜ao um intervalo de confian¸ca, com coeficiente deγ% de confian¸ca, para a m´edia populacionalµquando a variˆancia σ2 ´edesconhecida, ´e dado por

IC(µ, γ%) =

X¯ −tγ/2 s

X2

n ; ¯X +tγ/2 s

X2 n

em que

P(−tγ/2 ≤T ≤tγ/2) =γ

eT tem distribui¸c˜ao t-Student comn−1 graus de liberdade.

Quandon >30 podemos aproximar para a distribui¸c˜ao normal.

(19)

Exemplo

Da popula¸c˜aoX ∼N(µ, σ2) retirou-se uma amostra de tamanho 10.

Obteve-se ¯x = 48 e sX2 = 120 (variˆancia amostral com denominadorn−1).

Fa¸ca intervalos de confian¸ca paraµconsiderando os seguintes coeficientes de confian¸ca: 90%, 95% e 99%.

(20)

Intervalos de confian¸ca APROXIMADO para a m´ edia populacional - Caso geral

SejaX a vari´avel populacional de interesse com distribui¸c˜ao qualquer, tal que tenha esperan¸caEθ(X) =µ e a variˆancia exista e seja finita Varθ(X) =σ2 <∞.

Pelo Teorema do Limite Central:

√n( ¯X −µ)

σ2 ≈N(0,1)

Se substituirmosσ2 por um estimador consistente ˆσ2, ent˜ao temos tamb´em que:

√n( ¯X −µ)

√ ˆ

σ2 ≈N(0,1)

quandon´e grande. A aproxima¸c˜ao ´e v´alida tanto para ˆσ2=SX2 quanto para ˆσ2 = ˜SX2.

(21)

Intervalos de confian¸ca APROXIMADO para a m´ edia populacional - Caso geral

SeX1, . . . ,Xn´e uma amostra aleat´oria deX, tal que E(X) =µe Var(X) =σ2 <∞, ent˜ao um intervalo de confian¸ca aproximado, com coeficiente deγ% de confian¸ca, para a m´edia populacionalµ,

´e dado por

IC(µ, γ%)≈

X¯ −zγ/2 rσˆ2

n ; ¯X +zγ/2 rσˆ2

n

em que

P(−zγ/2 ≤Z ≤zγ/2) =γ eZ tem distribui¸c˜ao normal padr˜ao.

(22)

Intervalos de confian¸ca para a propor¸c˜ ao populacional

SeX1, . . . ,Xn´e uma amostra aleat´oria deX ∼Ber(θ),

distribui¸c˜ao de Bernoulli, ent˜ao podemos criar dois intervalos de confian¸ca aproximados:

Otimista:

IC(θ, γ%)≈

X¯ −zγ/2

rX¯(1−X¯)

n ; ¯X +zγ/2

rX¯(1−X¯) n

Conservador (pessimista):

IC(θ, γ%)≈

X¯ −zγ/2 r 1

4n; ¯X +zγ/2 r 1

4n

(23)

Exerc´ıcio

A pesquisa foi realizada entre os dias 08 e 09 de setembro com 2.046 entrevistados em 56 munic´ıpios de S˜ao Paulo. As seguintes frequˆencias foram observadas para os cadidatos `a presidˆencia:

Marina Silva (PSB) 40%

Dilma (PT) 26%

A´ecio Neves (PSDB) 16%

Pastor Everaldo (PSC) 2%

Eduardo Jorge (PV) 1%

Luciana Genro (PSOL) 1%

Outros 1%

Suponha que a amostra obtida ´e aleat´oria. Que tipo de intervalo de confian¸ca deve ser feito, exato ou aproximado?

Construa IC (conservadores e optimistas) com coeficientes de confian¸ca de 95% e 99% para cada caso.

Referências

Documentos relacionados

para cada amostra, calculamos o valor observado, t , da estat´ıstica T ; os novos valores t formam uma nova popula¸ c˜ ao, cuja distribui¸ c˜ ao recebe o nome de distribui¸ c˜

Conduza os testes apropriados e fa¸ ca intervalos de confian¸ ca para a diferen¸ca de m´ edias populacionais... Queremos verificar se as resistˆ encias de dois tipos de vigas de a¸

Trata-se de uma concretiza¸ c˜ ao do IAC quando se obt´ em a amostra (x 1 ,.. , x n ), o intervalo passa a ser num´ erico e a interpreta¸ c˜ ao conveniente ´ e: se obtivermos v´

Os dois cap´ıtulos anteriores apresentaram intervalos de confian¸ ca e testes de hip´ oteses para o parˆ ametro de uma ´ unica popula¸ c˜ ao (a m´ edia µ, a variˆ ancia σ 2 ou

De experiˆ encias anteriores, considera-se que a resistˆ encia ao desmoronamento de tais tijolos ´ e normalmente distribu´ıda com valor m´ edio superior ou igual a 200 kg e

Considere agora a seguinte tabela de frequˆ encia para intervalos de

Caso n˜ ao tenhamos informa¸ c˜ oes suficientes, podemos utilizar informa¸ c˜ oes pessoais para criar uma probabilidade sobre a ocorrˆ encia do evento A..?. Probabilidade condicional

probabilidade m´ınima de pagar o empr´ estimo para que o Lucro seja positivo (usando um juros de 2%)?.. Vari´ avel