Estatística e Probabilidade para as
Ciências Ambientais
Distribuição das médias amostrais e Teorema do Limite Central
Departamento de Ciências do Mar
Curso de Bacharelado Interdisciplinar em Ciências do Mar – BICTMar
Importância da distribuição normal
1. Normalmente estamos interessados em comparar valores
médios.
2. A distribuição normal também tende a resultar da soma de
outras variáveis, caso estas sejam em quantidade razoável.
Muitas variáveis na natureza são o resultado da atuação de
um grande número de outras, daí uma razão para a
preponderância da distribuição normal em muitos
fenômenos que observamos.
3. Muitos métodos estatísticos pressupõem que as variáveis de
interesse tenham uma distribuição normal.
O Teorema do Limite Central
A média de uma variável, calculada a partir de uma amostra,
tenderá a ter distribuição normal quanto maior for o tamanho
amostral, não importa a distribuição original da variável. Isso é
consequência do teorema central do limite.
2 2 2 2 1 ) ( x e x f
Amostra
População estatística
𝜇 = ?
(média Populacional)𝜎 = ?
(desvio padrão Populacional)𝑋 = 𝑖=1 𝑛 𝑋 𝑖 𝑛 Inferência Amostragem Parâmetros populacionais 𝑠 = 𝑖=1 𝑛 𝑋 𝑖 − 𝑋 2 𝑛 − 1 n = 5
Amostra
População estatística
𝜇 =?
(média Populacional)𝜎 =?
(desvio padrão Populacional)𝑋 = 45,93 𝑠 = 65,74 n = 5 Amostragem 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =?
Existem MUITAS outras amostras possíveis
População estatística
𝜇 =?
(média Populacional)𝜎 =?
(desvio padrão Populacional)𝑋 = 45,93 𝑠 = 65,74 n = 5 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? 𝑋 =? 𝑠 =? A b e rt u ra d o b ico Densidade 5 10 15 20 25 30 35 0 50000 100000 150000 P OP UL A ÇÃ O d e m ed ias a m o stra is Histogramas de TODAS as médias amostrais passíveis de obtermos em um experimento
Distribuição das médias amostrais Abertura do bico De nsi da de 5 10 15 20 25 30 35 0 50000 100000 150000
POPULAÇÃO de medias amostrais
O TLC garante que a distribuição de médias amostrais tenderá a
uma distribuição normal à medida que o tamanho amostral n
Distribuição das médias amostrais
Se as variáveis originais tiverem média = µ e desvio padrão = σ
então....
𝜇
𝑥= 𝜇
Abertura do bico De nsi da de 5 10 15 20 25 30 35 0 50000 100000 150000POPULAÇÃO de medias amostrais
𝜎
𝑥=
𝜎
𝑛
0 10 20 30 40 0 .0 0 0 .0 2 0 .0 4 0 .0 6 0 .0 8
Distribuição das MÉDIAS AMOSTRAIS
Distribuição das médias amostrais
𝜇
𝑥
= 𝜇
Erro padrão da média: o
desvio padrão das médias
amostrais
Média das médias amostrais
n
x
20
x
0 10 20 30 40 0 .0 0 0 .0 2 0 .0 4 0 .0 6 0 .0 8Distribuição das MÉDIAS AMOSTRAIS
Distribuição das médias amostrais
𝜇
𝑥
= 𝜇
Erro padrão da média: o
desvio padrão das médias
amostrais
Erro padrão da média: é o
desvio padrão das médias
amostrais
0 10 20 30 40 0 .0 0 0 .0 5 0 .1 0 0 .1 5 0 .2 0Distribuição das MÉDIAS AMOSTRAIS
Distribuição das médias amostrais
Estima a média da população
𝜇
𝑥
= 𝜇
50
Erro padrão da média: é o
desvio padrão das médias
amostrais
0 10 20 30 40 0 .0 1 0 .0 2 0 .0 3 0 .0 4 0 .0 5Distribuição das MÉDIAS AMOSTRAIS
Distribuição das médias amostrais
Estima a média da população
𝜇
𝑥
= 𝜇
5
Para um tamanho amostral
SUFICIENTEMENTE
GRANDE
, o TCL nos garante que a distribuição das
médias amostrais provém de uma distribuição
normal, MESMO que a distribuição das variáveis
originais não seja normal.
Aplicação da distribuição Normal e do TLC
Suponha que o comprimento de Robalos no estuário do Rio Itanhaém tenha
uma distribuição normal 𝒩 40.8,13.4 , ou seja, média 𝜇 = 40,8 𝑐𝑚 e
desvio padrão 𝜎 = 13,4 𝑐𝑚
Qual a probabilidade de capturar
um Robalo de 133 cm? 𝑥 = 133 𝑐𝑚 𝑧 = 𝑥 − 𝜇 𝜎 = 133 − 40,8 13,4 𝑧 = 92,2 13,4 = 6,93
Aplicação da distribuição Normal e do TLC
Qual a probabilidade de capturar
um Robalo de 133 cm? 𝑥 = 133 𝑐𝑚 𝑧 = 𝑥 − 𝜇 𝜎 = 133 − 40,8 13,4 𝑧 = 92,2 13,4 = 6,88
O valor máximo da tabela é z = 3.99!!!
𝑷(𝒙 ≥ 𝟏𝟑𝟑) = 𝑷(𝒛 ≥ 𝟔, 𝟖𝟖)
Suponha que o comprimento de Robalos no estuário do Rio Itanhaém tenha
uma distribuição normal 𝒩 40.8,13.4 , ou seja, média 𝜇 = 40,8 𝑐𝑚 e
desvio padrão 𝜎 = 13,4 𝑐𝑚
Aplicação da distribuição Normal e do TLC
Qual a probabilidade de capturar
um Robalo de 133 cm? 𝑥 = 133 𝑐𝑚 𝑧 = 𝑥 − 𝜇 𝜎 = 133 − 40,8 13,4
O valor máximo da tabela é z = 3.99!!!
Suponha que o comprimento de Robalos no estuário do Rio Itanhaém tenha
uma distribuição normal 𝒩 40.8,13.4 , ou seja, média 𝜇 = 40,8 𝑐𝑚 e
desvio padrão 𝜎 = 13,4 𝑐𝑚 Pescar um Robalo de 133 cm é ALTAMENTE IMPROVÁVEL? 𝑷 𝒙 ≥ 𝟏𝟑𝟑 = 𝟑, 𝟎𝟒 × 𝟏𝟎−𝟏𝟐 𝑧 = 92,2 13,4 = 6,88 𝑷(𝒙 ≥ 𝟏𝟑𝟑) = 𝑷(𝒛 ≥ 𝟔, 𝟖𝟖) 𝑷 𝒙 ≥ 𝟏𝟑𝟑 = 𝟐, 𝟗𝟖 × 𝟏𝟎−𝟏𝟐
Aplicação da distribuição Normal e do TLC
Aplicação da distribuição Normal e do TLC
Qual a probabilidade de encontrar um Robalo igual ou maior que 50 cm, dada uma distribuição do comprimento 𝒩 40.8,13.4 ?
𝑥 = 50 𝑐𝑚 𝑧 = 𝑥 − 𝜇 𝜎 = 9,2 13,4 𝑧 = 9,2 13,4 = 0,68
Aplicação da distribuição Normal e do TLC
Qual a probabilidade de encontrar um Robalo igual ou maior que 50 cm, dada uma distribuição do comprimento 𝒩 40.8,13.4 ?
Aplicação da distribuição Normal e do TLC
Qual a probabilidade de encontrar um Robalo igual ou maior que 50 cm, dada uma distribuição do comprimento 𝒩 40.8,13.4 ?
𝑥 = 50 𝑐𝑚 𝑧 = 𝑥 − 𝜇 𝜎 = 9,2 13,4 𝑧 = 9,2 13,4 = 0,68 𝑷 𝒙 ≥ 𝟓𝟎 = 𝟏 − 𝟎, 𝟕𝟓𝟏𝟕 = 𝟎, 𝟐𝟒𝟖𝟑 𝑷 𝒙 ≥ 𝟔𝟎 =? 𝑷 𝒙 < 𝟑𝟎 =? 𝑷 𝟑𝟎 < 𝒙 < 𝟓𝟎 =?
http://www.agricultura.sp.gov.br/quem-somos/apta-pesquisa
Aplicação da distribuição Normal e do TLC
Suponha que o comprimento de Robalos no estuário do Rio Itanhaém tenha
uma distribuição normal 𝒩 40.8,13.4 , ou seja, média 𝜇 = 40,8 𝑐𝑚 e
desvio padrão 𝜎 = 13,4 𝑐𝑚
Qual a probabilidade de capturar 5 Robalos e obter um comprimento
médio maior ou igual a 50 cm?
𝑧 = 𝜎 𝑥 − 𝜇 𝑛 = 50 − 40,8 13,4 5 𝑧 = 9,2 5,99 = 1,53 𝑥 = 50 𝑐𝑚 𝑷 𝒙 ≥ 𝟓𝟎 =? 𝑛 = 5
Aplicação da distribuição Normal e do TLC
Suponha que o comprimento de Robalos no estuário do Rio Itanhaém tenha
uma distribuição normal 𝒩 40.8,13.4 , ou seja, média 𝜇 = 40,8 𝑐𝑚 e
desvio padrão 𝜎 = 13,4 𝑐𝑚
Qual a probabilidade de capturar 5 Robalos e obter um comprimento
médio maior ou igual a 50 cm?
𝑥 = 50 𝑐𝑚 𝑷 𝒙 ≥ 𝟓𝟎 =? 𝑛 = 5 𝑷 𝒙 ≥ 𝟓𝟎 = 𝟏 − 𝟎, 𝟗𝟑𝟕𝟎 = 𝟎, 𝟎𝟔𝟑 𝑧 = 𝜎 𝑥 − 𝜇 𝑛 = 50 − 40,8 13,4 5 𝑧 = 9,2 5,99 = 1,53
http://www.agricultura.sp.gov.br/quem-somos/apta-pesquisa
Aplicação da distribuição Normal e do TLC
Suponha que o comprimento de Robalos no estuário do Rio Itanhaém tenha
uma distribuição normal 𝒩 40.8,13.4 , ou seja, média 𝜇 = 40,8 𝑐𝑚 e
desvio padrão 𝜎 = 13,4 𝑐𝑚
Qual a probabilidade de capturar 10
Robalos e obter um comprimento médio maior ou igual a 50 cm?
𝑧 = 𝜎 𝑥 − 𝜇 𝑛 = 50 − 40,8 13,4 10 𝑧 = 9,2 4,24 = 2,17 𝑥 = 50 𝑐𝑚 𝑷 𝒙 ≥ 𝟓𝟎 =? 𝑛 = 10 𝑷 𝒙 ≥ 𝟓𝟎 = 𝟏 − 𝟎, 𝟗𝟖𝟓𝟎 ≈ 𝟎, 𝟎𝟏𝟓
Intervalo de confiança
• Suponha que não saibamos o comprimento médio populacional de
Robalos, somente seu desvio padrão 𝜎 = 13,4 𝑐𝑚;
• Capturamos uma amostra de 5 Robalos com os seguintes comprimentos: 𝑥 = {56.90; 42.60; 38.27; 19.21; 59.52} , obtendo uma média amostral de 𝑥 = 43.3 𝑐𝑚.
O que podemos dizer a respeito da média populacional µ?
Amostra
P
opul
aç
ão e
stat
ísti
ca
𝜇 = ?
(média Populacional DESCONHECIDA)𝑋 = 𝑖=1 𝑛 𝑋 𝑖 𝑛 Inferência Amostragem
Intervalo de confiança
De acordo com o TLC a distribuição de médias amostrais segue uma distribuição Normal de probabilidade
-4 -2 0 2 4 0 .0 0 .1 0 .2 0 .3 0 .4 Z F un çã o N orma l d e pro ba bi lid ad e 𝜇
-4 -2 0 2 4 0 .0 0 .1 0 .2 0 .3 0 .4 Z F un çã o N orma l d e Pro ba bi lid ad e Intervalo de confiança 1 − 𝛼 = 0.95 𝑃 𝑥 − 𝑧𝛼𝜎𝑥 < 𝜇 < 𝑥 + 𝑧𝛼𝜎𝑥 = 1 − 𝛼 𝛼 2 = 0.025 𝛼 2 = 0.025
De acordo com o TLC a distribuição de médias amostrais segue uma distribuição Normal de probabilidade
𝛼 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑖𝑛𝑐𝑒𝑟𝑡𝑒𝑧𝑎 𝑒𝑥. 0.05 𝑧𝛼 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑧 𝑛𝑎 𝑡𝑎𝑏𝑒𝑙𝑎
𝜇
𝐼𝐶 = 𝑥 ± 𝑧
𝛼𝜎
𝑥Intervalo de confiança a 95%
• Suponha que não saibamos o comprimento médio populacional de
Robalos, somente seu desvio padrão 𝜎 = 13,4 𝑐𝑚;
• Capturamos uma amostra de 5 Robalos com os seguintes comprimentos: 𝑥 = {56.90; 42.60; 38.27; 19.21; 59.52} , obtendo uma média amostral de 𝑥 = 43.3 𝑐𝑚.
O que podemos dizer a respeito da média populacional µ?
P
opul
aç
ão e
stat
ísti
ca
𝜇 = ?
(média Populacional DESCONHECIDA)𝐼𝐶𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝑥 − 𝑧𝛼𝜎𝑥 𝐼𝐶𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 43.3 − 1.96 ×13.4 5 = 31.55 𝐼𝐶𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝑥 − 𝑧𝛼𝜎𝑥 𝐼𝐶𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 43.3 + 1.96 ×13.4 5 = 55.05 𝑋 = 43,3 𝐼𝐶𝑚á𝑥95% = 55,05 𝐼𝐶𝑚𝑖𝑛95% = 31,55
Intervalo de confiança a 95%
• Suponha que não saibamos o comprimento médio populacional de
Robalos, somente seu desvio padrão 𝜎 = 13,4 𝑐𝑚;
• Capturamos uma amostra de 5 Robalos com os seguintes comprimentos: 𝑥 = {56.90; 42.60; 38.27; 19.21; 59.52} , obtendo uma média amostral de 𝑥 = 43.3 𝑐𝑚.
O que podemos dizer a respeito da média populacional µ?
𝑋 = 43,3 𝐼𝐶𝑚á𝑥95% = 55,05 𝐼𝐶𝑚𝑖𝑛95% = 31,55
Inferência Estatística
Interpretação do intervalo de confiança
Existe uma probabilidade de 95% de que o intervalo entre 31.55 e 55.05 cm contenha o valor da média populacional
Intervalo de confiança
• Suponha que não saibamos o comprimento médio populacional de
Robalos, somente seu desvio padrão 𝜎 = 13,4 𝑐𝑚;
• Capturamos uma amostra de 5 Robalos com os seguintes comprimentos: 𝑥 = {56.90; 42.60; 38.27; 19.21; 59.52} , obtendo uma média amostral de 𝑥 = 43.3 𝑐𝑚.
O que podemos dizer a respeito da média populacional µ?
Calcule agora intervalos de confiança a 90%, 80%, 70%, 60% e 50% Quais as consequências de mudarmos os limites de confiança?
Bases para a fórmula do intervalo de confiança. Seja: 𝛼 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑖𝑛𝑐𝑒𝑟𝑡𝑒𝑧𝑎 𝑒𝑥. 0.05 𝑧𝛼 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑧 𝑛𝑎 𝑡𝑎𝑏𝑒𝑙𝑎