• Nenhum resultado encontrado

ME951 - Estatística e Probabilidade I

N/A
N/A
Protected

Academic year: 2022

Share "ME951 - Estatística e Probabilidade I"

Copied!
110
0
0

Texto

(1)

ME951 - Estatística e Probabilidade I

Parte 14

Notas de aula de ME414 produzidas pelos professoresSamara Kiihl,Tatiana BenagliaeBenilton Carvalhomodificadas e

alteradas pela Profa. Larissa Avila Matos

(2)

Fundamentos de Inferência

(3)

Introdução

Um dos principais objetivos da Estatística é tirar conclusões a partir dos dados.

Dados em geral consistem de uma amostra de elementos de uma população de interesse.

O objetivo é usar a amostra e tirar conclusões sobre a população. Quão confiável será utilizar a informação obtida apenas de uma amostra para concluir algo sobre a população?

(4)

Introdução

Um dos principais objetivos da Estatística é tirar conclusões a partir dos dados.

Dados em geral consistem de uma amostra de elementos de uma população de interesse.

O objetivo é usar a amostra e tirar conclusões sobre a população. Quão confiável será utilizar a informação obtida apenas de uma amostra para concluir algo sobre a população?

(5)

Introdução

Um dos principais objetivos da Estatística é tirar conclusões a partir dos dados.

Dados em geral consistem de uma amostra de elementos de uma população de interesse.

O objetivo é usar a amostra e tirar conclusões sobre a população.

Quão confiável será utilizar a informação obtida apenas de uma amostra para concluir algo sobre a população?

(6)

Introdução

Um dos principais objetivos da Estatística é tirar conclusões a partir dos dados.

Dados em geral consistem de uma amostra de elementos de uma população de interesse.

O objetivo é usar a amostra e tirar conclusões sobre a população.

Quão confiável será utilizar a informação obtida apenas de uma amostra para concluir algo sobre a população?

(7)

Inferência Estatística

Variável Aleatória: Característica numérica do resultado de um experimento.

População: todos os elementos ou resultados de um problema que está sendo estudado.

Amostra: qualquer subconjunto da população que contém os elementos que podem ser observados e é onde as quantidades de interesse podem ser medidas.

(8)

Inferência Estatística

Parâmetros: Característica numérica (desconhecida) da distribuição dos elementos da população.

Estimador/Estatística: Função da amostra, construída com a finalidade de representar, ou estimar um parâmetro de interesse na

(9)

Estatística

SejaX1, ..., Xn uma amostra,T =f(X1, ..., Xn) é uma estatística.

X¯n= 1nPn

i=1Xi= n1(X1+...+Xn): a média amostral é uma estatística.

X(1)=min{X1, ..., Xn}. X(n)=max{X1, ..., Xn}.

X(i)é o i-ésimo valor da amostra ordenada.

Note que uma estatística é uma função que em uma determinada amostra assume um valor específico (estimativa).

(10)

Estatística

SejaX1, ..., Xn uma amostra,T =f(X1, ..., Xn) é uma estatística.

X¯n= 1nPn

i=1Xi= 1n(X1+...+Xn): a média amostral é uma estatística.

X(1)=min{X1, ..., Xn}. X(n)=max{X1, ..., Xn}.

X(i)é o i-ésimo valor da amostra ordenada.

Note que uma estatística é uma função que em uma determinada amostra assume um valor específico (estimativa).

(11)

Estatística

SejaX1, ..., Xn uma amostra,T =f(X1, ..., Xn) é uma estatística.

X¯n= 1nPn

i=1Xi= 1n(X1+...+Xn): a média amostral é uma estatística.

X(1)=min{X1, ..., Xn}.

X(n)=max{X1, ..., Xn}.

X(i)é o i-ésimo valor da amostra ordenada.

Note que uma estatística é uma função que em uma determinada amostra assume um valor específico (estimativa).

(12)

Estatística

SejaX1, ..., Xn uma amostra,T =f(X1, ..., Xn) é uma estatística.

X¯n= 1nPn

i=1Xi= 1n(X1+...+Xn): a média amostral é uma estatística.

X(1)=min{X1, ..., Xn}.

X(n)=max{X1, ..., Xn}.

X(i)é o i-ésimo valor da amostra ordenada.

Note que uma estatística é uma função que em uma determinada amostra assume um valor específico (estimativa).

(13)

Estatística

SejaX1, ..., Xn uma amostra,T =f(X1, ..., Xn) é uma estatística.

X¯n= 1nPn

i=1Xi= 1n(X1+...+Xn): a média amostral é uma estatística.

X(1)=min{X1, ..., Xn}.

X(n)=max{X1, ..., Xn}.

X(i)é o i-ésimo valor da amostra ordenada.

Note que uma estatística é uma função que em uma determinada amostra assume um valor específico (estimativa).

(14)

Estatística

SejaX1, ..., Xn uma amostra,T =f(X1, ..., Xn) é uma estatística.

X¯n= 1nPn

i=1Xi= 1n(X1+...+Xn): a média amostral é uma estatística.

X(1)=min{X1, ..., Xn}.

X(n)=max{X1, ..., Xn}.

X(i)é o i-ésimo valor da amostra ordenada.

(15)

Estatística

Para que serve uma estatística? Para “estimar” os valores de uma distribuição, ou características de uma população.

População:

médiaP. variânciaP.

Amostra: médiaA=Pn

i=1 Xi

n “estima” a médiaP. variânciaA=Pn

i=1

(XimédiaA)2

n “estima” a variânciaP

(16)

Estatística

Para que serve uma estatística? Para “estimar” os valores de uma distribuição, ou características de uma população.

População:

médiaP. variânciaP.

Amostra: médiaA=Pn

i=1 Xi

n “estima” a médiaP. variânciaA=Pn

i=1

(XimédiaA)2

n “estima” a variânciaP

(17)

Estatística

Para que serve uma estatística? Para “estimar” os valores de uma distribuição, ou características de uma população.

População:

médiaP. variânciaP.

Amostra:

médiaA=Pn i=1

Xi

n “estima” a médiaP. variânciaA=Pn

i=1

(XimédiaA)2

n “estima” a variânciaP

(18)

Exemplo

Temos interesse em conhecer a média e variância das alturas dos brasileiros adultos. Sabemos que a distribuição das alturas pode ser representada por um modelo normal.

Solução 1: Medir a altura de todos os brasileiros adultos. Solução 2: Selecionar de forma aleatória algumas pessoas

(amostra), analisá-las e inferir propriedades para toda a população.

(19)

Exemplo

Temos interesse em conhecer a média e variância das alturas dos brasileiros adultos. Sabemos que a distribuição das alturas pode ser representada por um modelo normal.

Solução 1: Medir a altura de todos os brasileiros adultos.

Solução 2: Selecionar de forma aleatória algumas pessoas

(amostra), analisá-las e inferir propriedades para toda a população.

(20)

Exemplo

Temos interesse em conhecer a média e variância das alturas dos brasileiros adultos. Sabemos que a distribuição das alturas pode ser representada por um modelo normal.

Solução 1: Medir a altura de todos os brasileiros adultos.

Solução 2: Selecionar de forma aleatória algumas pessoas

(amostra), analisá-las e inferir propriedades para toda a população.

(21)

Exemplo

Temos interesse em conhecer a média e variância das alturas dos brasileiros adultos. Sabemos que a distribuição das alturas pode ser representada por um modelo normal.

Solução 1: Medir a altura de todos os brasileiros adultos.

Solução 2: Selecionar de forma aleatória algumas pessoas

(amostra), analisá-las e inferir propriedades para toda a população.

(22)

Exemplo

Sejaθa proporção de alunos na Unicamp que concorda com a presença da PM no campus.

Inviável perguntar para todos os estudantes: coleta-se uma amostra. Planejamento amostral: obter uma amostra aleatória simples de tamanhon= 100 alunos, sem reposição.

CadaXi,i= 1, ...,100, vai assumir o valor 1 se o alunoiconcorda com presença da PM, e 0 se não.

Estatística: T =X1+...+X100 100.

Uma vez que a coleta foi implementada,T assume um valor, por exemplo, 0.63, que será usado para estimarθ, ou seja, ˆθ= 0.63.

(23)

Exemplo

Sejaθa proporção de alunos na Unicamp que concorda com a presença da PM no campus.

Inviável perguntar para todos os estudantes: coleta-se uma amostra.

Planejamento amostral: obter uma amostra aleatória simples de tamanhon= 100 alunos, sem reposição.

CadaXi,i= 1, ...,100, vai assumir o valor 1 se o alunoiconcorda com presença da PM, e 0 se não.

Estatística: T =X1+...+X100 100.

Uma vez que a coleta foi implementada,T assume um valor, por exemplo, 0.63, que será usado para estimarθ, ou seja, ˆθ= 0.63.

(24)

Exemplo

Sejaθa proporção de alunos na Unicamp que concorda com a presença da PM no campus.

Inviável perguntar para todos os estudantes: coleta-se uma amostra.

Planejamento amostral: obter uma amostra aleatória simples de tamanhon= 100 alunos, sem reposição.

CadaXi,i= 1, ...,100, vai assumir o valor 1 se o alunoiconcorda com presença da PM, e 0 se não.

Estatística: T =X1+...+X100 100.

Uma vez que a coleta foi implementada,T assume um valor, por exemplo, 0.63, que será usado para estimarθ, ou seja, ˆθ= 0.63.

(25)

Exemplo

Sejaθa proporção de alunos na Unicamp que concorda com a presença da PM no campus.

Inviável perguntar para todos os estudantes: coleta-se uma amostra.

Planejamento amostral: obter uma amostra aleatória simples de tamanhon= 100 alunos, sem reposição.

CadaXi,i= 1, ...,100, vai assumir o valor 1 se o alunoiconcorda com presença da PM, e 0 se não.

Estatística: T =X1+...+X100 100.

Uma vez que a coleta foi implementada,T assume um valor, por exemplo, 0.63, que será usado para estimarθ, ou seja, ˆθ= 0.63.

(26)

Exemplo

Sejaθa proporção de alunos na Unicamp que concorda com a presença da PM no campus.

Inviável perguntar para todos os estudantes: coleta-se uma amostra.

Planejamento amostral: obter uma amostra aleatória simples de tamanhon= 100 alunos, sem reposição.

CadaXi,i= 1, ...,100, vai assumir o valor 1 se o alunoiconcorda com presença da PM, e 0 se não.

Estatística: T =X1+...+X100.

Uma vez que a coleta foi implementada,T assume um valor, por exemplo, 0.63, que será usado para estimarθ, ou seja, ˆθ= 0.63.

(27)

Exemplo

Sejaθa proporção de alunos na Unicamp que concorda com a presença da PM no campus.

Inviável perguntar para todos os estudantes: coleta-se uma amostra.

Planejamento amostral: obter uma amostra aleatória simples de tamanhon= 100 alunos, sem reposição.

CadaXi,i= 1, ...,100, vai assumir o valor 1 se o alunoiconcorda com presença da PM, e 0 se não.

Estatística: T =X1+...+X100 100.

Uma vez que a coleta foi implementada,T assume um valor, por exemplo, 0.63, que será usado para estimarθ, ou seja, ˆθ= 0.63.

(28)

Parâmetro

Cada quantidade de interesse (comoθno exemplo anterior) é chamada de parâmetro da população.

Para apresentar uma estimativa de um parâmetro (ˆθ), devemos escolher uma estatística (T).

Note que da maneira que o plano amostral foi executado (amostra aleatória simples), a estatísticaT é uma variável aleatória, visto que cada vez que executarmos o plano amostral poderemos obter resultados diversos.

Portanto, a estatísticaT possui uma distribuição de probabilidade, chamada dedistribuição amostralde T.

(29)

Parâmetro

Cada quantidade de interesse (comoθno exemplo anterior) é chamada de parâmetro da população.

Para apresentar uma estimativa de um parâmetro (ˆθ), devemos escolher uma estatística (T).

Note que da maneira que o plano amostral foi executado (amostra aleatória simples), a estatísticaT é uma variável aleatória, visto que cada vez que executarmos o plano amostral poderemos obter resultados diversos.

Portanto, a estatísticaT possui uma distribuição de probabilidade, chamada dedistribuição amostralde T.

(30)

Parâmetro

Cada quantidade de interesse (comoθno exemplo anterior) é chamada de parâmetro da população.

Para apresentar uma estimativa de um parâmetro (ˆθ), devemos escolher uma estatística (T).

Note que da maneira que o plano amostral foi executado (amostra aleatória simples), a estatísticaT é uma variável aleatória, visto que cada vez que executarmos o plano amostral poderemos obter resultados diversos.

Portanto, a estatísticaT possui uma distribuição de probabilidade, chamada dedistribuição amostralde T.

(31)

Parâmetro

Cada quantidade de interesse (comoθno exemplo anterior) é chamada de parâmetro da população.

Para apresentar uma estimativa de um parâmetro (ˆθ), devemos escolher uma estatística (T).

Note que da maneira que o plano amostral foi executado (amostra aleatória simples), a estatísticaT é uma variável aleatória, visto que cada vez que executarmos o plano amostral poderemos obter resultados diversos.

Portanto, a estatísticaT possui uma distribuição de probabilidade, chamada dedistribuição amostralde T.

(32)

Distribuição Amostral

(33)

Exemplo

Imagine um fenômeno de interesse que possa ser representado por uma v.a. X que assume os valores 1 ou 2 com igual probabilidade.

µ=E(X) = 1×P(X = 1) + 2×P(X= 2)

= 1×1

2+ 2×1 2 = 3

2

σ2=V ar(X) =E[(Xµ)2]

= (1−1.5)2×P(X = 1) + (2−1.5)2×P(X = 2)

=1 4

(34)

Exemplo

Imagine um fenômeno de interesse que possa ser representado por uma v.a. X que assume os valores 1 ou 2 com igual probabilidade.

µ=E(X) = 1×P(X = 1) + 2×P(X= 2)

= 1×1

2+ 2×1 2 = 3

2

σ2=V ar(X) =E[(Xµ)2]

= (1−1.5)2×P(X = 1) + (2−1.5)2×P(X = 2)

=1 4

(35)

Exemplo

Imagine um fenômeno de interesse que possa ser representado por uma v.a. X que assume os valores 1 ou 2 com igual probabilidade.

µ=E(X) = 1×P(X = 1) + 2×P(X= 2)

= 1×1

2+ 2×1 2 = 3

2

σ2=V ar(X) =E[(Xµ)2]

= (1−1.5)2×P(X = 1) + (2−1.5)2×P(X = 2)

=1 4

(36)

Exemplo

Imagine que uma população de interesse tenha distribuição como a de X definida anteriormente.

Imagine também que, embora saibamos que os valores possíveis sejam 1 e 2, não tenhamos conhecimento sobre suas respectivas probabilidades. Isto é, se temosN elementos nessa população, podemos pensar que a característica de interesse de cada elementoisegue uma v.a. Xi em queP(Xi= 1) =P(Xi= 2) = 1/2, mas nós não sabemos disso. Imagine que o interesse sejaµ.

(37)

Exemplo

Imagine que uma população de interesse tenha distribuição como a de X definida anteriormente.

Imagine também que, embora saibamos que os valores possíveis sejam 1 e 2, não tenhamos conhecimento sobre suas respectivas probabilidades.

Isto é, se temosN elementos nessa população, podemos pensar que a característica de interesse de cada elementoisegue uma v.a. Xi em queP(Xi= 1) =P(Xi= 2) = 1/2, mas nós não sabemos disso. Imagine que o interesse sejaµ.

(38)

Exemplo

Imagine que uma população de interesse tenha distribuição como a de X definida anteriormente.

Imagine também que, embora saibamos que os valores possíveis sejam 1 e 2, não tenhamos conhecimento sobre suas respectivas probabilidades.

Isto é, se temosN elementos nessa população, podemos pensar que a característica de interesse de cada elementoisegue uma v.a. Xi em queP(Xi= 1) =P(Xi= 2) = 1/2, mas nós não sabemos disso.

Imagine que o interesse sejaµ.

(39)

Exemplo

Imagine que uma população de interesse tenha distribuição como a de X definida anteriormente.

Imagine também que, embora saibamos que os valores possíveis sejam 1 e 2, não tenhamos conhecimento sobre suas respectivas probabilidades.

Isto é, se temosN elementos nessa população, podemos pensar que a característica de interesse de cada elementoisegue uma v.a. Xi em queP(Xi= 1) =P(Xi= 2) = 1/2, mas nós não sabemos disso.

Imagine que o interesse sejaµ.

(40)

Exemplo

Vamos coletar uma amostra aleatória simples com reposição (AASc) de tamanhon= 2 e calcular a média amostral.

Usaremos esta média amostral para estimarµ.

Quão útil é esta estimativa que se baseia em apenas 2 elementos da população?

Quão precisa?

(41)

Exemplo

Vamos coletar uma amostra aleatória simples com reposição (AASc) de tamanhon= 2 e calcular a média amostral.

Usaremos esta média amostral para estimarµ.

Quão útil é esta estimativa que se baseia em apenas 2 elementos da população?

Quão precisa?

(42)

Exemplo

Vamos coletar uma amostra aleatória simples com reposição (AASc) de tamanhon= 2 e calcular a média amostral.

Usaremos esta média amostral para estimarµ.

Quão útil é esta estimativa que se baseia em apenas 2 elementos da população?

Quão precisa?

(43)

Exemplo

Vamos coletar uma amostra aleatória simples com reposição (AASc) de tamanhon= 2 e calcular a média amostral.

Usaremos esta média amostral para estimarµ.

Quão útil é esta estimativa que se baseia em apenas 2 elementos da população?

Quão precisa?

(44)

Exemplo

Imagine que o alunoA coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

O alunoB coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

As duas médias amostrais serão necessariamente iguais?

A média amostral é uma v.a. e, portanto, tem uma distribuição de probabilidade.

(45)

Exemplo

Imagine que o alunoA coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

O alunoB coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

As duas médias amostrais serão necessariamente iguais?

A média amostral é uma v.a. e, portanto, tem uma distribuição de probabilidade.

(46)

Exemplo

Imagine que o alunoA coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

O alunoB coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

As duas médias amostrais serão necessariamente iguais?

A média amostral é uma v.a. e, portanto, tem uma distribuição de probabilidade.

(47)

Exemplo

Imagine que o alunoA coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

O alunoB coleta umaAASc comn= 2 a partir da população, obtém os dados e calcula ¯x.

As duas médias amostrais serão necessariamente iguais?

A média amostral é uma v.a. e, portanto, tem uma distribuição de probabilidade.

(48)

Exemplo

Todas as combinações possíveis de valores para o primeiro e para o segundo elemento amostrados segundo o planoAASc comn= 2 são:

Possibilidades (X1= 1, X2= 1) (X1= 1, X2= 2)

¯

x 1 1.5

P(X1=i, X2=j) 0.25 0.25 Possibilidades (X1= 2, X2= 1) (X1= 2, X2= 2)

¯

x 1.5 2

P(X =i, X =j) 0.25 0.25

(49)

E( ¯X) = 1×1

4 + 1.5×1

2 + 2×1 4 =3

2

V ar( ¯X) =E

( ¯XE( ¯X))2

= (1−1.5)2×1

4+ (1.5−1.5)21

2+ (2−1.5)21 4 =1

8 Repare que:

E( ¯X) =µ=E(X) e

V ar( ¯X) =σn2 = V ar(X)n .

(50)

E( ¯X) = 1×1

4 + 1.5×1

2 + 2×1 4 =3

2

V ar( ¯X) =E

( ¯XE( ¯X))2

= (1−1.5)2×1

4+ (1.5−1.5)21

2+ (2−1.5)21 4 =1

8

Repare que:

E( ¯X) =µ=E(X) e

V ar( ¯X) =σn2 = V ar(X)n .

(51)

E( ¯X) = 1×1

4 + 1.5×1

2 + 2×1 4 =3

2

V ar( ¯X) =E

( ¯XE( ¯X))2

= (1−1.5)2×1

4+ (1.5−1.5)21

2+ (2−1.5)21 4 =1

8 Repare que:

E( ¯X) =µ=E(X) e

V ar( ¯X) =σn2 = V ar(X)n .

(52)

Exemplo

Distribuição de probabilidade deX (esquerda) e de ¯X (direita):

(53)

Distribuição Amostral

Resultado:

SejaX uma v.a. com médiaµe variânciaσ2.

SejaX1, ..., Xn uma amostra aleatória simples deX. X¯n= X1+...+Xn n.

E X¯n

=µ. V ar X¯n

=σn2.

Ou seja, emboraµseja desconhecido, sabemos que o valor esperado da média amostral éµ. Além disso, conforme o tamanho amostral aumenta, a imprecisão da média amostral para estimarµfica cada vez menor, poisV ar( ¯X) =σ2/n.

(54)

Distribuição Amostral

Resultado:

SejaX uma v.a. com médiaµe variânciaσ2. SejaX1, ..., Xn uma amostra aleatória simples deX.

X¯n= X1+...+Xn n. E X¯n

=µ. V ar X¯n

=σn2.

Ou seja, emboraµseja desconhecido, sabemos que o valor esperado da média amostral éµ. Além disso, conforme o tamanho amostral aumenta, a imprecisão da média amostral para estimarµfica cada vez menor, poisV ar( ¯X) =σ2/n.

(55)

Distribuição Amostral

Resultado:

SejaX uma v.a. com médiaµe variânciaσ2. SejaX1, ..., Xn uma amostra aleatória simples deX. X¯n= X1+...+Xn n.

E X¯n

=µ. V ar X¯n

=σn2.

Ou seja, emboraµseja desconhecido, sabemos que o valor esperado da média amostral éµ. Além disso, conforme o tamanho amostral aumenta, a imprecisão da média amostral para estimarµfica cada vez menor, poisV ar( ¯X) =σ2/n.

(56)

Distribuição Amostral

Resultado:

SejaX uma v.a. com médiaµe variânciaσ2. SejaX1, ..., Xn uma amostra aleatória simples deX. X¯n= X1+...+Xn n.

E X¯n

=µ.

V ar X¯n

=σn2.

Ou seja, emboraµseja desconhecido, sabemos que o valor esperado da média amostral éµ. Além disso, conforme o tamanho amostral aumenta, a imprecisão da média amostral para estimarµfica cada vez menor, poisV ar( ¯X) =σ2/n.

(57)

Distribuição Amostral

Resultado:

SejaX uma v.a. com médiaµe variânciaσ2. SejaX1, ..., Xn uma amostra aleatória simples deX. X¯n= X1+...+Xn n.

E X¯n

=µ.

V ar X¯n

= σn2.

Ou seja, emboraµseja desconhecido, sabemos que o valor esperado da média amostral éµ. Além disso, conforme o tamanho amostral aumenta, a imprecisão da média amostral para estimarµfica cada vez menor, poisV ar( ¯X) =σ2/n.

(58)

Distribuição Amostral

Resultado:

SejaX uma v.a. com médiaµe variânciaσ2. SejaX1, ..., Xn uma amostra aleatória simples deX. X¯n= X1+...+Xn n.

E X¯n

=µ.

V ar X¯n

= σn2.

Ou seja, emboraµseja desconhecido, sabemos que o valor esperado da média amostral éµ. Além disso, conforme o tamanho amostral

(59)

Exemplo

Exemplo: X1, X2, X3 ensaios de Bernoulli(p) independentes.

µ=E(Xi) = 0.3 ⇒ E X¯3

= 0.3.

σ2=V ar(Xi) =p(1p) = 0.3(0.7) = 0.21V ar X¯3

= 0.213 = 0.07

(60)

Exemplo

Exemplo: X1, X2, X3 ensaios de Bernoulli(p) independentes.

µ=E(Xi) = 0.3 ⇒ E X¯3

= 0.3.

σ2=V ar(Xi) =p(1p) = 0.3(0.7) = 0.21V ar X¯3

= 0.213 = 0.07

(61)

Exemplo

Exemplo: X1, X2, X3 ensaios de Bernoulli(p) independentes.

µ=E(Xi) = 0.3 ⇒ E X¯3

= 0.3.

σ2=V ar(Xi) =p(1p) = 0.3(0.7) = 0.21V ar X¯3

= 0.213 = 0.07

(62)

Teorema do Limite Central

(63)

Teorema do Limite Central

Usando o resultado enunciado anteriormente, temos a esperança e a variância da média amostral ¯X: E( ¯X) =µeV ar( ¯X) = σn2.

No entanto, para conhecermos a distribuição de probabilidade de ¯X, como foi feito no exemplo anterior, é preciso conhecer todos os valores possíveis deX e suas respectivas probabilidades.

Mas, se conhecermos tudo isso, não precisamos fazer amostragem nem inferência: saberemos tudo o que desejarmos daquela população! O exemplo anterior foi um caso hipotético apenas para demonstrar como a média amostral ¯X se comporta quando realizamos a amostragem.

Na prática, não teremos informações suficientes para de fato descrevermos a distribuição exata de ¯X.

(64)

Teorema do Limite Central

Usando o resultado enunciado anteriormente, temos a esperança e a variância da média amostral ¯X: E( ¯X) =µeV ar( ¯X) = σn2.

No entanto, para conhecermos a distribuição de probabilidade de ¯X, como foi feito no exemplo anterior, é preciso conhecer todos os valores possíveis deX e suas respectivas probabilidades.

Mas, se conhecermos tudo isso, não precisamos fazer amostragem nem inferência: saberemos tudo o que desejarmos daquela população! O exemplo anterior foi um caso hipotético apenas para demonstrar como a média amostral ¯X se comporta quando realizamos a amostragem.

Na prática, não teremos informações suficientes para de fato descrevermos a distribuição exata de ¯X.

(65)

Teorema do Limite Central

Usando o resultado enunciado anteriormente, temos a esperança e a variância da média amostral ¯X: E( ¯X) =µeV ar( ¯X) = σn2.

No entanto, para conhecermos a distribuição de probabilidade de ¯X, como foi feito no exemplo anterior, é preciso conhecer todos os valores possíveis deX e suas respectivas probabilidades.

Mas, se conhecermos tudo isso, não precisamos fazer amostragem nem inferência: saberemos tudo o que desejarmos daquela população!

O exemplo anterior foi um caso hipotético apenas para demonstrar como a média amostral ¯X se comporta quando realizamos a amostragem.

Na prática, não teremos informações suficientes para de fato descrevermos a distribuição exata de ¯X.

(66)

Teorema do Limite Central

Usando o resultado enunciado anteriormente, temos a esperança e a variância da média amostral ¯X: E( ¯X) =µeV ar( ¯X) = σn2.

No entanto, para conhecermos a distribuição de probabilidade de ¯X, como foi feito no exemplo anterior, é preciso conhecer todos os valores possíveis deX e suas respectivas probabilidades.

Mas, se conhecermos tudo isso, não precisamos fazer amostragem nem inferência: saberemos tudo o que desejarmos daquela população!

O exemplo anterior foi um caso hipotético apenas para demonstrar como a média amostral ¯X se comporta quando realizamos a amostragem.

Na prática, não teremos informações suficientes para de fato descrevermos a distribuição exata de ¯X.

(67)

Teorema do Limite Central

Usando o resultado enunciado anteriormente, temos a esperança e a variância da média amostral ¯X: E( ¯X) =µeV ar( ¯X) = σn2.

No entanto, para conhecermos a distribuição de probabilidade de ¯X, como foi feito no exemplo anterior, é preciso conhecer todos os valores possíveis deX e suas respectivas probabilidades.

Mas, se conhecermos tudo isso, não precisamos fazer amostragem nem inferência: saberemos tudo o que desejarmos daquela população!

O exemplo anterior foi um caso hipotético apenas para demonstrar como a média amostral ¯X se comporta quando realizamos a amostragem.

Na prática, não teremos informações suficientes para de fato descrevermos a distribuição exata de ¯X.

(68)

Teorema Central do Limite (TLC)

Resultado

Para uma amostra aleatória simplesX1, ..., Xn coletada de uma população com médiaµe variânciaσ2, a distribuição amostral de ¯Xn aproxima-se de umadistribuição Normalde médiaµe variância σn2, quandonfor suficientemente grande.

Definimos também:

Z =

X¯nµ σ/

nN(0,1)

(69)

Teorema Central do Limite (TLC)

Resultado

Para uma amostra aleatória simplesX1, ..., Xn coletada de uma população com médiaµe variânciaσ2, a distribuição amostral de ¯Xn aproxima-se de umadistribuição Normalde médiaµe variância σn2, quandonfor suficientemente grande.

Definimos também:

Z =

X¯nµ σ/

nN(0,1)

(70)

Teorema do Limite Central

(71)

Exemplo

SejaX1, ..., Xn uma amostra aleatória de tamanhontal que XExp(2):

fXi(x) = 2e−2x, parax≥0 EntãoE(Xi) =12 eV ar(Xi) =14.

Suponha queXi modela o tempo de vida de um transistor em horas.

Os tempos de vida de 100 transistores são coletados. Desejamos estudar a variável aleatória ¯X100 (média amostral de uma amostra de tamanho 100). Sabemos:

E X¯100

= 1

2 e V ar X¯100

=1/4 100 = 1

400. Pelo TLC, temos que: ¯XnN

1 2, 1

400

(72)

Exemplo

FX¯100(x) =P X¯100x

=P

X¯100−(1/2) (1/2)/√

100 ≤ x−(1/2) (1/2)/√

100

=P(Z≤10(2x−1)) e

P X¯100x

= 1−P X¯100< x

= 1−P

X¯100−(1/2) (1/2)/√

100 ≤ x−(1/2) (1/2)/√

100

(73)

Exemplo

X= resultado obtido no lançamento de um dado honesto.

x 1 2 3 4 5 6

p(x) =P(X =x) 16 16 16 16 16 16

E(X) =16×(1 + 2 + 3 + 4 + 5 + 6) = 216 = 3.5

V ar(X) = 16[(1 + 4 + 9 + 16 + 25 + 36)−16×(21)2] = 352 = 17.5 Xi: resultado doi-ésimo lançamento de um dado honesto. Xi tem distribuição uniforme discreta∀i.

µ=E(Xi) = 3.5 e σ2=V ar(Xi) = 17.5,∀i.

(74)

Exemplo

X= resultado obtido no lançamento de um dado honesto.

x 1 2 3 4 5 6

p(x) =P(X =x) 16 16 16 16 16 16 E(X) =16×(1 + 2 + 3 + 4 + 5 + 6) = 216 = 3.5

V ar(X) = 16[(1 + 4 + 9 + 16 + 25 + 36)−16×(21)2] = 352 = 17.5

Xi: resultado doi-ésimo lançamento de um dado honesto. Xi tem distribuição uniforme discreta∀i.

µ=E(Xi) = 3.5 e σ2=V ar(Xi) = 17.5,∀i.

(75)

Exemplo

X= resultado obtido no lançamento de um dado honesto.

x 1 2 3 4 5 6

p(x) =P(X =x) 16 16 16 16 16 16 E(X) =16×(1 + 2 + 3 + 4 + 5 + 6) = 216 = 3.5

V ar(X) = 16[(1 + 4 + 9 + 16 + 25 + 36)−16×(21)2] = 352 = 17.5 Xi: resultado doi-ésimo lançamento de um dado honesto.

Xi tem distribuição uniforme discreta∀i.

µ=E(Xi) = 3.5 e σ2=V ar(Xi) = 17.5,∀i.

(76)

Exemplo

X= resultado obtido no lançamento de um dado honesto.

x 1 2 3 4 5 6

p(x) =P(X =x) 16 16 16 16 16 16 E(X) =16×(1 + 2 + 3 + 4 + 5 + 6) = 216 = 3.5

V ar(X) = 16[(1 + 4 + 9 + 16 + 25 + 36)−16×(21)2] = 352 = 17.5 Xi: resultado doi-ésimo lançamento de um dado honesto.

Xi tem distribuição uniforme discreta∀i.

µ=E(Xi) = 3.5 e σ2=V ar(Xi) = 17.5,∀i.

(77)

Exemplo

X= resultado obtido no lançamento de um dado honesto.

x 1 2 3 4 5 6

p(x) =P(X =x) 16 16 16 16 16 16 E(X) =16×(1 + 2 + 3 + 4 + 5 + 6) = 216 = 3.5

V ar(X) = 16[(1 + 4 + 9 + 16 + 25 + 36)−16×(21)2] = 352 = 17.5 Xi: resultado doi-ésimo lançamento de um dado honesto.

Xi tem distribuição uniforme discreta∀i.

µ=E(Xi) = 3.5 e σ2=V ar(Xi) = 17.5,∀i.

(78)

Exemplo

Se temos uma amostra aleatória simples de tamanhon:

X1, X2, . . . , Xn, pelo TLC sabemos que a distribuição amostral de ¯Xn

é aproximadamente Normal 3.5,17.5n .

O primeiro histograma a seguir mostra o resultado de 10000 repetições do seguinte experimento: observar o resultado do lançamento de 1 dado. Repare que é muito próximo de uma distribuição uniforme discreta (chance 1/6 para cada resultado).

O segundo histograma mostra o resultado de 10000 repetições do seguinte experimento: observar a média do lançamento de 2 dados (equivalente a observar a média de 2 lançamentos de um dado).

(79)

Exemplo

Se temos uma amostra aleatória simples de tamanhon:

X1, X2, . . . , Xn, pelo TLC sabemos que a distribuição amostral de ¯Xn

é aproximadamente Normal 3.5,17.5n .

O primeiro histograma a seguir mostra o resultado de 10000 repetições do seguinte experimento: observar o resultado do lançamento de 1 dado. Repare que é muito próximo de uma distribuição uniforme discreta (chance 1/6 para cada resultado).

O segundo histograma mostra o resultado de 10000 repetições do seguinte experimento: observar a média do lançamento de 2 dados (equivalente a observar a média de 2 lançamentos de um dado).

(80)

Exemplo

Se temos uma amostra aleatória simples de tamanhon:

X1, X2, . . . , Xn, pelo TLC sabemos que a distribuição amostral de ¯Xn

é aproximadamente Normal 3.5,17.5n .

O primeiro histograma a seguir mostra o resultado de 10000 repetições do seguinte experimento: observar o resultado do lançamento de 1 dado. Repare que é muito próximo de uma distribuição uniforme discreta (chance 1/6 para cada resultado).

O segundo histograma mostra o resultado de 10000 repetições do

(81)

Exemplo

Se temos uma amostra aleatória simples de tamanhon:

X1, X2, . . . , Xn, pelo TLC sabemos que a distribuição amostral de ¯Xn

é aproximadamente Normal 3.5,17.5n .

O primeiro histograma a seguir mostra o resultado de 10000 repetições do seguinte experimento: observar o resultado do lançamento de 1 dado. Repare que é muito próximo de uma distribuição uniforme discreta (chance 1/6 para cada resultado).

O segundo histograma mostra o resultado de 10000 repetições do seguinte experimento: observar a média do lançamento de 2 dados (equivalente a observar a média de 2 lançamentos de um dado).

(82)

Exemplo

1 2 3 4 5 6 Média de 1 dado

0 500 1000 1500

1 2 3 4 5 6 Média de 2 dados

0 500 1000 1500

1 2 3 4 5 6

Média de 3 dados

0 500 1000 1500

Média de 10 dados

1000 1500

Média de 50 dados

1000 1500

Média de 100 dados

1000 1500

(83)

Exemplo

O último histograma mostra o resultado de 10000 repetições do seguinte experimento: observar a média do lançamento de 100 dados (equivalente a observar a média de 100 lançamentos de um dado).

Repare que conforme o número de dados (tamanho amostral) aumenta, a distribuição da média amostral se aproxima da distribuição normal com média 3.5 e variância cada vez menor (17.5/n).

(84)

Exemplo

O último histograma mostra o resultado de 10000 repetições do seguinte experimento: observar a média do lançamento de 100 dados (equivalente a observar a média de 100 lançamentos de um dado).

Repare que conforme o número de dados (tamanho amostral) aumenta, a distribuição da média amostral se aproxima da distribuição normal com média 3.5 e variância cada vez menor (17.5/n).

(85)

Teorema do Limite Central (TLC)

Você pode verificar o comportamento de ¯X para vários tipos de distribuição deX:

https://nishantsbi.shinyapps.io/CLT_Shiny

https://gallery.shinyapps.io/CLT_mean/

(86)

Aproximação da Distribuição Binomial pela

Normal

(87)

Aproximação da Binomial pela Normal

Consideremos uma população em que a proporção de indivíduos portadores de uma certa característica sejap.

Xi =

( 1, se o indivíduo i possui a característica 0, caso contrário

XiBernoulli(p);i= 1,2, ..., n. Se as observações são independentes:

Sn =X1+...+XnBin(n, p).

Após a coleta de uma amostra aleatória simples denindivíduos, podemos considerar:

ˆ

p= Snn (média amostral como estimador da média populacional).

(88)

Aproximação da Binomial pela Normal

Consideremos uma população em que a proporção de indivíduos portadores de uma certa característica sejap.

Xi =

( 1, se o indivíduo i possui a característica 0, caso contrário

XiBernoulli(p);i= 1,2, ..., n.

Se as observações são independentes:

Sn =X1+...+XnBin(n, p).

Após a coleta de uma amostra aleatória simples denindivíduos, podemos considerar:

ˆ

p= Snn (média amostral como estimador da média populacional).

(89)

Aproximação da Binomial pela Normal

Consideremos uma população em que a proporção de indivíduos portadores de uma certa característica sejap.

Xi =

( 1, se o indivíduo i possui a característica 0, caso contrário

XiBernoulli(p);i= 1,2, ..., n.

Se as observações são independentes:

Sn =X1+...+XnBin(n, p).

Após a coleta de uma amostra aleatória simples denindivíduos, podemos considerar:

ˆ

p= Snn (média amostral como estimador da média populacional).

(90)

Aproximação da Binomial pela Normal

Consideremos uma população em que a proporção de indivíduos portadores de uma certa característica sejap.

Xi =

( 1, se o indivíduo i possui a característica 0, caso contrário

XiBernoulli(p);i= 1,2, ..., n.

Se as observações são independentes:

Sn =X1+...+XnBin(n, p).

ˆ

p= Snn (média amostral como estimador da média populacional).

(91)

Aproximação da Binomial pela Normal

Consideremos uma população em que a proporção de indivíduos portadores de uma certa característica sejap.

Xi =

( 1, se o indivíduo i possui a característica 0, caso contrário

XiBernoulli(p);i= 1,2, ..., n.

Se as observações são independentes:

Sn =X1+...+XnBin(n, p).

Após a coleta de uma amostra aleatória simples denindivíduos, podemos considerar:

ˆ

p= Snn (média amostral como estimador da média populacional).

(92)

Aproximação da Binomial pela Normal

Utilizando a distribuição exata (n pequeno):

P

ˆ p= k

n

=P Sn

n =k n

=P(Sn=k) = n k

!

pk(1−p)n−k, parak= 0,1, ..., n.

Utilizando a aproximação para a Normal (n grande): ˆ

pN

p,p(1p) n

(93)

Aproximação da Binomial pela Normal

Utilizando a distribuição exata (n pequeno):

P

ˆ p= k

n

=P Sn

n =k n

=P(Sn=k) = n k

!

pk(1−p)n−k, parak= 0,1, ..., n.

Utilizando a aproximação para a Normal (n grande):

pˆ∼N

p,p(1p) n

(94)

Exemplo

Sepfor a proporção de fumantes no estado de SP,p= 0.2 e tivermos coletado uma amostra aleatória simples de 500 indivíduos:

Xi=

( 1, se o indivíduo i é fumante 0, caso contrário

ˆ p=

P500 i=1Xi 500 . ˆ

pN 0.2,0.2×0.8500

=N(0.2,0.00032)

Pp≤0.25) =P(Z ≤2.795) = Φ (2.795) = 0.9974

(95)

Exemplo

Sepfor a proporção de fumantes no estado de SP,p= 0.2 e tivermos coletado uma amostra aleatória simples de 500 indivíduos:

Xi=

( 1, se o indivíduo i é fumante 0, caso contrário

ˆ p=

P500 i=1Xi 500 .

ˆ

pN 0.2,0.2×0.8500

=N(0.2,0.00032)

Pp≤0.25) =P(Z ≤2.795) = Φ (2.795) = 0.9974

(96)

Exemplo

Sepfor a proporção de fumantes no estado de SP,p= 0.2 e tivermos coletado uma amostra aleatória simples de 500 indivíduos:

Xi=

( 1, se o indivíduo i é fumante 0, caso contrário

ˆ p=

P500 i=1Xi 500 . ˆ

pN 0.2,0.2×0.8500

=N(0.2,0.00032)

Pp≤0.25) =P(Z ≤2.795) = Φ (2.795) = 0.9974

(97)

Exemplo

Sepfor a proporção de fumantes no estado de SP,p= 0.2 e tivermos coletado uma amostra aleatória simples de 500 indivíduos:

Xi=

( 1, se o indivíduo i é fumante 0, caso contrário

ˆ p=

P500 i=1Xi 500 . ˆ

pN 0.2,0.2×0.8500

=N(0.2,0.00032)

Pp≤0.25) =P(Z ≤2.795) = Φ (2.795) = 0.9974

(98)

Aproximação da Binomial pela Normal

ˆ

p= SnnSn =np.ˆ

Quandoné grande o suficiente ˆpN

p,p(1−p)n . Qual a distribuição deSn quando n é grande o suficiente? Sn=X1+...+Xn

ˆ

p= SnnN

p,p(1−p)n

Sn=nˆpN(np, np(1−p))

Portanto: Bin(n, p)N(np, np(1−p)) quando né grande.

(99)

Aproximação da Binomial pela Normal

ˆ

p= SnnSn =np.ˆ

Quandoné grande o suficiente ˆpN

p,p(1−p)n .

Qual a distribuição deSn quando n é grande o suficiente? Sn=X1+...+Xn

ˆ

p= SnnN

p,p(1−p)n

Sn=nˆpN(np, np(1−p))

Portanto: Bin(n, p)N(np, np(1−p)) quando né grande.

(100)

Aproximação da Binomial pela Normal

ˆ

p= SnnSn =np.ˆ

Quandoné grande o suficiente ˆpN

p,p(1−p)n . Qual a distribuição deSn quando n é grande o suficiente?

Sn=X1+...+Xn ˆ

p= SnnN

p,p(1−p)n

Sn=nˆpN(np, np(1−p))

Portanto: Bin(n, p)N(np, np(1−p)) quando né grande.

(101)

Aproximação da Binomial pela Normal

ˆ

p= SnnSn =np.ˆ

Quandoné grande o suficiente ˆpN

p,p(1−p)n . Qual a distribuição deSn quando n é grande o suficiente?

Sn=X1+...+Xn

ˆ

p= SnnN

p,p(1−p)n

Sn=nˆpN(np, np(1−p))

Portanto: Bin(n, p)N(np, np(1−p)) quando né grande.

Referências

Documentos relacionados

Como um exemplo, de características para realizar um plano amostral, utilizaremos o POF (Pesquisa Orçamento Familiar), assim teremos como objetivo as informações

Embora não seja um fenômeno recente, o bullying tem sido amplamente divulgado pelos meios de comunicação nos últimos tempos, alertando pais, professores, crianças e jovens para

Como um estimador é uma variável aleatória cujo valor varia de amostra para amostra, suas propriedades são, de fato, as propriedades da distribuição amostral.. Existem

A prefeitura de São Paulo investiu em usinas termelétricas para gerar energia a partir do metano liberado pelos aterros sanitários.. O aterro Bandeirantes já deixou de lançar

Figura 8 – Isocurvas com valores da Iluminância média para o período da manhã na fachada sudoeste, a primeira para a simulação com brise horizontal e a segunda sem brise

 Para os agentes físicos: ruído, calor, radiações ionizantes, condições hiperbáricas, não ionizantes, vibração, frio, e umidade, sendo os mesmos avaliados

Equipamentos de emergência imediatamente acessíveis, com instruções de utilização. Assegurar-se que os lava- olhos e os chuveiros de segurança estejam próximos ao local de

Figura 7: Execução do programa de instalação de aplicações Escola Secundária Artística de Soares dos Reis 13.. Figura 8: O programa de instalação