Ana Paula Fernandes | anapaula.fernandes@uftm.edu.br | (34) 99645 1975
Bioestatística
Aula teórica: Distribuição Normal
Cap. 4 - Distribuição Normal ou de Gauss
“Gaussiana"
Muitas variáveis biológicas apresentam uma distribuição equilibrada:
•
Os valores centrais são mais freqüentes•
Os extremos raros (pouco freqüentes)No histograma, o tamanho das colunas depende da amplitude do
intervalo de classe (h), a qual é influenciada pelo tamanho da amostra e pela precisão com que a medida foi feita.
curva de distribuição normal ou curva de Gauss
UTILIDADES DA CURVA NORMAL
Qual a probabilidade de um indivíduo do sexo masculino
apresentar um valor entre 14,5 e 15,5?
E, se o interesse, é saber a probabilidade de ocorrer um nível de hemoglobina entre
14,5 e 15,0, seria necessário refazer a tabela a partir dos dados originais.
14,5 15,5
E a probabilidade de que ocorra uma taxa de hemoglobina menor do que 14,3?
PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL
(1) A curva normal tem a forma de um sino, com caudas assintóticas ao eixo x.
PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL (2) A curva é simétrica em relação à a média ( ).
(3) A média, a mediana e a moda são coincidentes.
μ
PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL
(4) A curva tem dois pontos de inflexão situados à distância
de um desvio padrão ( ) acima e abaixo da média
σ
x
μ
Ponto de inflexão Ponto de inflexãoμ + σ
μ − σ
PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL
(5) A área sob a curva totaliza 1 ou 100%.
x
μ
μ
+
σ
μ
−
σ
Calcular uma determinada área, significa calcular uma probabilidade! 0,5 0,5PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL
(6) Aproximadamente 68% dos valores de situam-se entre
os pontos
μ ± σ
x
x
μ
μ
+
σ
μ
−
σ
PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL
(7) Aproximadamente 95% dos valores de situam-se entre
os pontos
μ ± 2σ
x
x
μ
μ
+
σ
μ
−
σ
μ
+
2σ
μ
−
2σ
PROPRIEDADES OU CARACTERÍSTICAS DA CURVA NORMAL
(8) Aproximadamente 99,7% dos valores de situam-se entre
os pontos
μ ± 3σ
x
x
μ
μ
+
σ
μ
−
σ
μ
+
2σ
μ
−
2σ
μ
+
3σ
μ
−
3σ
68 - 95 - 99•
Se uma variável tem distribuição normal e se suamédia e seu desvio padrão forem conhecidos, não é
mais necessário representar os dados sob a forma de
tabelas ou gráficos para se conhecer a probabilidade de ocorrência de valores de interesse.
EQUAÇÃO DA CURVA NORMAL
(8) A curva normal é determinada pelos PARÂMETROS:
(média e desvio padrão populacional)
Média e desvio padrão
EXEMPLO!
Suponha que a glicemia (nível de glicose no plasma, em jejum) tem distribuição gaussiana, com média igual a 90 mg e desvio padrão 5 mg
na população de pessoas sadias.
90
95
85
μ = 90
σ = 5
Aproximadamente 68% da população de indivíduos possuem valores de glicemia entre 85 e 95 mg. INTERVALO DE CONFIANÇA!EXEMPLO!
Suponha que que a glicemia (nível de glicose no plasma, em jejum) tem distribuição gaussiana, com média igual a 90 mg e desvio padrão 5 mg
na população de pessoas sadias.
90
95
85
μ = 90
σ = 5
Grande parte das pessoas, 95%, possuem valores de glicemia entre 80 e 100 mg.
100
80
EXEMPLO!
Suponha que que a glicemia (nível de glicose no plasma, em jejum) tem distribuição gaussiana, com média igual a 90 mg e desvio padrão 5 mg
na população de pessoas sadias.
90
95
85
μ = 90
σ = 5
Praticamente todos, 99,7%, possuem valores de glicemia entre 75 e 105 mg.100
80
105
EXEMPLO!
Suponha que que a glicemia (nível de glicose no plasma, em jejum) tem distribuição gaussiana, com média igual a 90 mg e desvio padrão 5 mg
na população de pessoas sadias.
90
95
85
μ = 90
σ = 5
Aproximadamente 34% da população de indivíduos possuem valores de glicemia entre 90 e 95 mg.CURVA NORMAL
PADRONIZADA
x
μ μ + σ μ + 2σ μ + 3σ μ − 3σ μ − 2σ μ − σμ
σ
z
0 1 2 3 −3 −2 −1 Qualquer valorμ = 0
σ = 1
CURVA NORMAL
TRANSFORMAÇÃOTransformamos um
valor x em z usando a fórmula:
z =
desvio padrão =
valor
− média
x − μ
σ
x = 500
z = 500 − 500
100
= 0
x = 600
z = 600 − 500
100
= 1
x = 400
z = 400 − 500
100
= − 1
Área ~ probabilidade
TABELA
DA DISTRIBUIÇÃO NORMAL PADRÃO
z=
1,1
5
1a. coluna
0,05
Exemplo
Em uma amostra aleatória de mulheres com idade entre 20 e 34 anos, a média do nível de colesterol total era de 181
miligramas por decilitro com desvio padrão de 37,6
miligramas por decilitro. Suponha que os níveis de colesterol total sejam normalmente distribuídos.
μ = 181
σ = 37,6
181
218,6 143,4Exemplo - pergunta 1
Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha colesterol inferior a 175 miligramas por
decilitro?
μ = 181
σ = 37,6
P(x < 175) = ?
P(x < 175) = ?
x = 175
z = ?
z = 175 − 181
37,6
= − 0,1596
μ = 181
σ = 37,6
z =
desvio padrão =
valor
− média
x − μ
σ
z = − 0,1596
z = − 0,16
0,06
pnorm(-0.16) 0.4364405 pnorm(175, mean=181, sd=37.6) 0.4366081P(x < 175) = P(z < − 0,16) = 0,4364
Exemplo - pergunta 2
Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha colesterol superior a 185 miligramas
por decilitro?
μ = 181
σ = 37,6
P(x > 185) = ?
x
181
185
P(x > 185) = ?
x = 185
z = ?
z = 185 − 181
37,6
= 0,1064
μ = 181
σ = 37,6
z =
desvio padrão =
valor
− média
x − μ
σ
z = 0,1064
z = 0,11
0,01
181 185181 185
P(x > 185) = P(z > 0,11)
P(x > 185) = 1 − 0,5438
P(x > 185) = 0,4562
Exemplo - pergunta 3
Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha colesterol entre 175 e 185 miligramas
por decilitro?
μ = 181
σ = 37,6
P(175 < x < 185) = ?
x
175 185P(x < 175) = P(z < − 0,16) = 0,4364
P(x < 185) = 0,5438
175 185
P(175 < x < 185) = 0,5438 − 0,4364 = 0,1074
No RStudio
Em uma amostra aleatória de mulheres com idade entre 20 e 34 anos, a média do nível de
colesterol total era de 181 miligramas por decilitro com desvio padrão de 37,6
miligramas por decilitro. Suponha que os níveis de colesterol total sejam normalmente
distribuídos.
(1) Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha
colesterol inferior a 175 miligramas por decilitro?
pnorm(175, mean=181, sd=37.6)
(2) Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha
colesterol superior a 185 miligramas por decilitro?
1 - pnorm(185, mean=181, sd=37.6)
(3) Qual é a probabilidade de que uma mulher com idade entre 20 e 34 anos, tenha
colesterol entre 175 e 185 miligramas por decilitro?
Exercício 1
1. Os tempos, por treino, em que um atleta usa um simulador de
escada são normalmente distribuídos, com média de 20 minutos e desvio padrão de 5 minutos. Calcule a probabilidade de que um atleta, selecionado aleatoriamente, utilize um simulador de escada
(a) por menos de 17 minutos, (b) entre 20 e 28 minutos e
Exercício 2
2. O tempo de espera (em dias) para um transplante cardíaco para pessoas com idade entre 35 e 49 anos pode ser aproximado por uma distribuição normal, como pode ser visto na figura.
Calcule a probabilidade de que o tempo de espera para um paciente, selecionado aleatoriamente, seja
(a) menos de 150 dias,
(b) entre 180 e 210 dias e (c) mais de 250 dias.