• Nenhum resultado encontrado

HEP Bioestatística

N/A
N/A
Protected

Academic year: 2021

Share "HEP Bioestatística"

Copied!
30
0
0

Texto

(1)

HEP 57800 – Bioestatística

DATA Aula CONTEÚDO PROGRAMÁTICO

05/03 Terça 1 Níveis de mensuração, variáveis, organização de dados, apresentação tabular 07/03 Quinta 2 Apresentação tabular e gráfica

12/03 Terça 3 Apresentação gráfica; medidas de tendência central e de posição

14/03 Quinta 4 Medidas de tendência central e de posição; medidas de dispersão ou de variabilidade 19/03 Terça 5 Medidas de correlação, noções de regressão linear simples, estimando a equação da reta 21/03 Quinta 6 Medidas de associação

26/03 Terça 7 Consolidação de conteúdo - Exercícios 28/03 Quinta 8 Avaliação 1

09/04 Terça 9 Noções de probabilidade; noções de amostragem; distribuição binomial 09/04 Terça 9 Noções de probabilidade; noções de amostragem; distribuição binomial 11/04 Quinta 10 Distribuição normal, distribuição amostral da média

16/04 Terça 11 Teste de hipóteses de parâmetros populacionais – conceitos; teste de hipóteses de uma proporção populacional

18/04 Quinta 12 Teste de hipóteses de associação

23/04 Terça 13 Teste de hipóteses de uma média populacional

25/04 Quinta 14 Teste de hipóteses de duas médias com amostras independentes e dependentes 30/04 Terça 15 Consolidação de conteúdo – Exercícios

02/06 Quinta 16 Estimação de parâmetros por intervalo de confiança: média e proporção 07/05 Terça 17 Exercícios

(2)

Teste de hipóteses para uma média populacional com variância conhecida

Tomando-se como exemplo os dados de recém-nascidos com Síndrome de Desconforto Idiopático

Grave (SDIG) é possível elaborar a hipótese de que crianças que nascem com esta síndrome

possuem peso médio ao nascer menor do que o peso médio ao nascer de crianças sadias.

A variável de estudo X é peso ao nascer (quantitativa contínua)

A variável de estudo X é peso ao nascer (quantitativa contínua)

Com base em conhecimento prévio (da literatura) sabe-se que a distribuição do peso ao nascer em

crianças sadias segue uma distribuição normal com média 3000 gramas e desvio padrão 500

gramas, ou seja

X ~ N(µX =3000;σX =500)

.

(3)

Teste de hipóteses para uma média populacional com variância populacional conhecida

Pela abordagem de

Neyman e Pearson

Formulação das hipóteses

Sadia SDIG a Sadia SDIG

H

H

µ

<

µ

µ

=

µ

:

:

0

ou

:

3000

3000

:

0

<

µ

=

µ

SDIG a SDIG

H

H

Fixando-se o nível de significância

α=0,05

Supor um tamanho de amostra n=50 recém-nascidos com SDIG

Distribuição de probabilidade

Como as hipóteses envolvem a média populacional, é necessário utilizar a distribuição de probabilidade da média.

Pelo Teorema Central do Limite tem-se que ~ ( ; )

n N

X µXX σX = σX portanto, se H0 for verdade,

e admitindo-se que as crianças com SDIG possuem distribuição do peso ao nascer com mesma 500

(4)

Pode-se utilizar

Z

X

ou

x

obs

para a tomada de decisão.

Região de rejeição e aceitação da hipótese H

0

.

H0 71 , 70 3000 = σ = µ X X

X

Zcrítico=-1,64 z -4 -3 -2 -1 0 1 2 3 4 α=0,05 Aceitação de H0 Rejeição de H0

(5)

Teste de hipóteses para uma média populacional com variância populacional conhecida

Cálculo do peso médio na amostra de crianças com SDIG

Supor que na amostra de 50 crianças, foi observado peso médio ao nascer igual a 2800 gramas

)

2800

(

x

obs

=

.

Cálculo do peso médio observado em número de desvios

padrão:

2

,

83

71

,

70

3000

2800

=

=

σ

µ

=

X X obs obs X

x

Z

Confrontar o valor da estatística do teste com a região de rejeição e aceitação de H

0

Como Z

obs

está à esquerda de Z

crítico

(região de rejeição), decide-se por rejeitar H

0

.

Decisão

Rejeita-se H

0

.

Conclusão

Foi encontrada diferença estatisticamente significante entre os pesos ao nascer de crianças sadias e

(6)

peso médio ao nascer que deixa, no caso deste exemplo, uma área α=0,05 à s ua es querda. O valor de peso médio que limita esta área é denominado

x

critico .

Cálculo de

x

critico

De X x cri tico criti co

x

Z

σ

µ

=

tem-s e

x

critico

=

Z

critico

σ

X

+

µ

X

g

x

x

crit ico

=

1

,

64

70

,

71

+

3000

=

2884

,

04

71 , 70 3000 = σ = µ X X

X

Rejeita-se H0 Aceita-se H0 g xcritico=2884,04

(7)

Teste de hipóteses para uma média populacional com variância populacional conhecida

Regra geral: Rejeita-se H0 se

Zobs>Zcrítico para

H

a

:

µ

SDIG

>

µ

Sadias

Zobs<-Zcrítico para

H

a

:

µ

SDIG

<

µ

Sadias

Zobs>Zcrítico ou Zobs<-Zcrítico para

H

a

:

µ

SDIG

µ

Sadias

Ou Ou

Rejeita-se H0 se

critico

obs

x

x

>

para

H

a

:

µ

SDIG

>

µ

Sadias

critico

obs

x

x

<

para

H

a

:

µ

SDIG

<

µ

Sadias

critico

obs

x

(8)

Supor a situação anterior, só que a variância (desvio padrão) populacional do peso ao nascer de

crianças sadias é desconhecida sendo conhecido somente o peso médio populacional de crianças

sadias (

µ

Sadias

=3000 gramas).

Formulação das hipóteses

3000

:

0

<

µ

=

µ

SDIG

H

3000

:

µ

SDIG

<

a

H

(9)

Teste de hipóteses para uma média populacional com variância populacional desconhecida

Cálculo do tamanho da amostra: supor um tamanho de amostra n=50 recém-nascidos com SDIG

Distribuição de probabilidade

Como as hipóteses envolvem a média populacional, é necessário utilizar a distribuição de probabilidade da média.

Pelo Teorema Central do Limite tem-se que

~

(

;

)

n

N

X

µ

X

=

µ

X

σ

X

=

σ

X .

Admitindo-se que H0 é verdade, resta um problema que é o fato de não se conhecer o valor da

dispersão do peso ao nascer das crianças sadias. Neste caso não é possível utilizar a estatística Z.

Utiliza-se, então, a estatística T onde

n

S

X

S

X

T

X X X X

µ

=

µ

=

sendo

S

X o desvio padrão da

(10)

T segue uma distribuição t de Student, com (n-1) graus de liberdade. Quando o tamanho da amostra é grande, a estatística T tende para uma distribuição normal com média 0 e desvio padrão 1 (

n

T

~

N

(

0

;

1

)

).

A família t de Student

Student

é o pseudônimo de W. S. Gosset que, em 1908, propôs a

distribuição t. Esta distribuição é muito parecida com a distribuição

normal. A família de distribuições t é centrada no zero e possui formato

normal. A família de distribuições t é centrada no zero e possui formato

em sino. A curva não é tão alta quanto a curva da distribuição normal e as

caudas da distribuição t são mais altas que as da distribuição normal. O

parâmetro que determina a altura e largura da distribuição t depende do

tamanho da amostra (n) e é denominado graus de liberdade (gl), denotado

pela letra grega (

ν

) (lê-se ni). A notação da distribuição t é

t

ν

.

(11)

Teste de hipóteses para uma média populacional com variância populacional desconhecida

Curvas t para graus de liberdade (tamanhos de amostra) diferentes.

Quando o número de graus de liberdade da distribuição t aumenta, a

distribuição se aproxima de uma distribuição normal.

(12)
(13)

Teste de hipóteses para uma média populacional com variância populacional desconhecida

Esta família t não descreve o que acontece na natureza mas sim o que

aconteceria se selecionássemos milhares de amostras aleatórias de uma

população normal com média

µ

e fosse calculado

n

s

X

t

=

µ

para cada

amostra.

Calculando o valor de t para 500 amostras de tamanho 6 de uma população

Calculando o valor de t para 500 amostras de tamanho 6 de uma população

com distribuição normal, obtém-se o gráfico a seguir

(14)

Obs:

A tabela da distribuição de Student apresenta um valor de probabilidade

dividido em duas partes iguais.

Para n=50, o número de graus de liberdade (gl) é 49; como não existe este

valor na tabela, deve-se trabalhar com o número de gl mais próximo e

dependendo se o teste é mono ou bicaudal, utiliza-se respectivamente o

valor de p/2 ou p, apresentados na primeira linha da tabela.

Por exemplo:

n=10; teste bicaudal, α=0,05; t

crítico

=-2,262 e t

crítico

= 2,262 (p da tabela =0,05)

n=10; teste monocaudal a esquerda, α=0,05; t

crítico

=-1,833 (p da tabela =

0,10)

(15)

Teste de hipóteses para uma média populacional com variância populacional desconhecida

H0

Região de rejeição e aceitação da hipótese H

0

.

3000 = µX

X

tcrítico= -1,676 t 0 α=0,05 Aceitação de H0 Rejeição de H0

(16)

Cálculo do peso médio na amostra de crianças com SDIG

Supor que na amostra de 50 crianças, foi observado peso médio ao nascer igual a

2800 gramas e desvio padrão igual a 610g

(

x

obs

=

2800

;

s

X

=

610

)

.

Cálculo do peso médio observado em número de desvios

3000

2800 −

µ

x

318

,

2

50

610

3000

2800

=

=

µ

=

X X obs obs

S

x

t

(17)

Teste de hipóteses para uma média populacional com variância populacional desconhecida

Confrontar o valor da estatística do teste com a região de rejeição e aceitação de

H0

Como t

obs

está à esquerda de t

crítico

(região de rejeição), decide-se por rejeitar H

0

.

Decisão

Rejeita-se H

0

.

Conclusão

Conclusão

Foi encontrada diferença estatisticamente significante entre os pesos ao

nascer de crianças sadias e com SDIG para nível de significância

α

=

0

,

05

.

(18)

salgadinhos cujas embalagens especificam 454gramas. Com o propósito de verificar

se a máquina está trabalhando corretamente, selecionou-se 50 pacotes de salgadinhos,

obtendo-se os seguintes valores de peso:

464 450 450

456 452 433 446 446 450 447

442 438 452

447 460 450 453 456 446 433

448 450 439

452 459 454 456 454 452 449

448 450 439

452 459 454 456 454 452 449

463 449 447

466 446 447 450 449 457 464

468 447 433

464 469 457 454 451 453 443

média da amostra,

x

=451,22 gramas e s=8,40 gramas

(19)

O conteúdo de iodo em pacotes de sal é recomendado que seja igual a 590

µ

g

. Determinada indústria, tendo recebido reclamações de que estava vendendo seu produto com teor de iodo abaixo do recomendado, realizou um estudo com dosagem de iodo em 15 amostras de sal. Os resultados das quantidades de iodo são apresentados a seguir. Realize um teste de hipóteses pela abordagem de Neyman e Pearson (nível de significância = 5%) para verificar se a reclamação procedia.

555 590 500 550 620

570 610 530 530 600

610 600 580 533 575

Exercício 1

Em uma pesquisa realizada entre os cadetes da Força Aérea sobre a relação entre saúde em geral e patologias orais, o escore médio de CPO (número de superfícies de dentes cariados, obturados ou extraídos em um indivíduo) foi 27,2. Em 121 cadetes que procuraram os serviços médicos 5 ou mais vezes durante um ano, o CPO médio foi 31,1 com desvio padrão 15,5. Se for assumido que estes 121 cadetes representam a população de cadetes com pior saúde, existe evidência que pior nível de saúde está associado a escore de CPO mais elevado? Tome a decisão utilizando as duas estratégias: a clássica de Neyman e Pearson, com nível de significância de 5%.

(20)

Revisão de conceitos básicos

Distribuição Normal

Medindo-se a altura de muitas mulheres (população), obtém-se o gráfico a seguir.

proporção 140 145 150 155 160 165 170 175 180 0 .05 .1 .15 .2 .25 .3 .35 Altura(cm) 140 145 150 155 160 165 170 175 180

Aos dados pode ser ajustada uma curva teórica

proporção 0 .05 .1 .15 .2 .25 .3 .35

(21)

A curva ajustada aos dados é uma curva teórica (curva de Gauss) que representa a altura de mulheres idosas. Notação: X: altura,

X

~

N

(

µ

=

160

,

σ

=

10

)

.

p rop o rção Al tura (cm) 1 40 1 45 15 0 15 5 16 0 1 65 1 70 17 5 1 80 0 .0 5 .1 .1 5 .2 .2 5 .3 .3 5

A curva tem propriedades conhecidas:

• Soma da área sob a curva é igual a 1 ou 100%;

• Pode-se calcular probabilidade trabalhando-se com a área sob a curva; Sorteia-se uma mulher ao acaso; P(desta mulher ter mais de 160) = 50%;

P(esta mulher tenha mais de 180)= ) ( 2) 10 160 180 ( ) 180 (X > = P Z > − =P Z > P =0,5-0,47725=0,02275 ou 2,3%

(22)

Sortear uma mulher com altura 170 ou mais desta população é uma coisa comum?

O limite para decidir o que é comum é arbitrário. O investigador é que decide, com base no problema que está sendo estudado.

Supor agora uma outra distribuição de altura, por exemplo, entre homens.

proporção .3 .35 Altura (cm) 160 165 170 175 180 185 190 195 200 0 .05 .1 .15 .2 .25 .3 X: altura,

X

~

N

(

m

=

180

,

σ

=

10

)

(23)

Supor que as pessoas da primeira curva tenham uma marca vermelha e as pessoas da segunda curva tenham uma marca azul. Misturam-se todas as pessoas e sorteia-se uma pessoa ao acaso e ela tem altura 180. De qual população seria este indivíduo?

Agora não estamos mais interessados em um indivíduo e sim em vários indivíduos portanto, vamos trabalhar com a altura média.

Supor X: altura,

X

~

N

(

m

=

160

,

σ

=

20

)

.

Toma-se uma amostra de tamanho n=30 desta população e calcula-se a altura média (x =170). Deseja-se saber a probabilidade desta amostra vir de população com altura média maior ou igual a 170.

µ=160 170

X

Pelo Teorema Central do Limite

) 74 , 2 ( ) 160 170 ( ) 160 170 ( ) 170 (X ≥ =P Xm≥ − =P Z ≥ − =P ZP

(24)

µ=0 2,74 µ=0 2,74

ZX

P(Z ≥ 2,74) = 0,5- 0,49693 = 0,0031 ou 0,31%

Sortear uma amostra que apresenta altura média igual a 170 cm ou mais da população que tem altura média 160 cm é uma coisa comum?

Para decidir se a amostra representa uma população com altura média maior e que o resultado não é devido ao acaso, realiza-se o teste de hipóteses.

(25)

Teste de hipóteses para uma média populacional com variância conhecida - Abordagem de Fisher

Situação:

Estudos mostram que crianças sadias possuem peso médio (m) ao nascer igual a 3100 gramas e desvio padrão

σ

=

610

gramas

.

Suspeita-se que crianças que nascem com síndrome de desconforto idiopático grave possuem peso ao nascer abaixo do peso ao nascer da população de crianças sadias.

Proposição (equivalente à H0): Crianças com síndrome vêm de uma população com peso médio =3100

gramas

Realiza-se um estudo em uma amostra de n=50 crianças que nasceram com esta síndrome, onde observou-se peso médio (

x

) igual a 2800 gramas.

observou-se peso médio (

x

) igual a 2800 gramas.

Supondo-se que as crianças da amostra (com síndrome) vêm de uma população com mesma dispersão do peso ao nascer de crianças sadias, teste a hipótese de que crianças com síndrome idiopática grave possuem peso médio ao nascer igual ao peso médio ao nascer de crianças sadias.

Distribuição de probabilidade:

Distribuição do peso médio: segue uma distribuição normal com média m=3100 gramas e desvio

padrão

86

,

27

50

610

=

=

σ

gramas

(26)

2800 µ=3100

X

Cálculo da probabilidade de observar um peso médio ao nascer igual ou menor que 2800 se H0 for

verdade. ) 48 , 3 ( ) 300 ( ) 3100 2800 ( ) 2800 (X ≤ =P Xm ≤ − = P Z ≤ − =P Z ≤ − P ) ( 3,48) 27 , 86 300 ( ) 50 610 3100 2800 ( ) 2800 ( ≤ = − ≤ − = X ≤ − = X ≤ − X Z P Z P m X P X P σ

(27)

Pela distribuição Normal reduzida tem-se que

P

(

Z

3

,

48

)

=

0

,

5

0

,

49975

=

0

,

00025

ou 0,025%

-3, 48 µ = 0

ZX

Pela distribuição Normal reduzida tem-se que

P

(

Z

3

,

48

)

=

0

,

5

0

,

49975

=

0

,

00025

ou 0,025% Os resultados não são compatíveis com uma distribuição que tem peso médio igual a 3100. Possivelmente a amostra vem de uma população com média menor que 3100. Pode-se dizer que crianças com síndrome de desconforto idiopático grave possivelmente possuem peso ao nascer menor do que o peso médio de crianças sadias.

(28)

Supor a mesma situação anterior, só que neste caso somente a média populacional é conhecida. O peso médio de crianças sadias (µ) é igual a 3100 gramas.

H0: Crianças com síndrome de desconforto idiopático grave vêm de uma população com peso médio =

3100 gramas

Seleciona-se uma amostra de 50 crianças com a síndrome e calcula-se o peso médio e o desvio padrão do peso, obtendo-se n=50;

x

=

2800

e s=510

Distribuição de probabilidade: Distribuição de probabilidade:

Distribuição do peso médio ao nascer de crianças sadias: como não se sabe o desvio padrão populacional, este é estimado utilizando-se os dados da amostra.

Neste caso a variável a variável segue uma distribuição t de Student com n-1=50-1=49 graus de liberdade.

)

159

,

4

(

)

12

,

72

300

(

)

50

510

3100

2800

(

)

2800

(

=

=

X

=

X

X

t

P

t

P

S

m

X

P

X

P

(29)

-4,16 µ=0 t

Pela distribuição t de Student com 49 graus de liberdade, tem-se

(

4

,

159

)

<

0

,

05

%

X

t

P

Os resultados não são compatíveis com uma distribuição que tem peso médio igual a 3100. Pode-se dizer que crianças com desconforto idiopático grave provavelmente vêm de uma população com peso médio ao nascer menor do que o peso médio ao nascer de crianças sadias.

(30)

Fisher dizia que antes de dar uma forma matemática a um problema, propondo hipóteses a serem testadas, era necessário um amplo conhecimento dos dados, o que poderia ser realizado com base no valor de p.

Passos necessários para a realização de um teste de hipóteses segundo a abordagem de Fisher.

• Formular a proposição inicial (“hipótese”) que será testada; • Identificar a distribuição de probabilidade;

• Identificar a distribuição de probabilidade;

• Realizar o estudo e observar o resultado da estatística de interesse;

• Calcular o valor de p, ou seja, a probabilidade de ocorrer o valor observado ou um valor mais extremo, sob a curva especificada na proposição inicial;

• Tomar a decisão com base no valor de p.

Referências

Documentos relacionados

 Compreender a importância do domínio das técnicas da escrita para a produção de uma informação de qualidade e saber aplica-las às especificidades dos diferentes géneros

Este trabalho é resultado de uma pesquisa quantitativa sobre a audiência realizada em 1999 envolvendo professores e alunos do Núcleo de Pesquisa de Comunicação da Universidade

6 Consideraremos que a narrativa de Lewis Carroll oscila ficcionalmente entre o maravilhoso e o fantástico, chegando mesmo a sugerir-se com aspectos do estranho,

Antes de sair, ainda procurou ( verbo procurar, no Pretérito Perfeito do Indicativo ) o mapa, mas ele tinha desaparecido ( verbo desaparecer, no Pretérito Mais-Que-Perfeito Composto

a) O polícia disse um palavrão, após ter saído da casa de Adrian. Corrige as falsas.. A mãe também está com gripe. “Quase que não consegui ficar calado quando vi que não

Como eles não são caracteres que possam ser impressos normalmente com a função print(), então utilizamos alguns comandos simples para utilizá-los em modo texto 2.. Outros

A pesquisa que realizou dentro e fora da escola desagrega e analisa as dife- rentes questões da política parental: categorização dos pais por políticas e profissões, racionalidade

Para contemplar las imágenes de reproducción en la pantalla de su televisor, le recomendamos que alimente su videocámara de un tomacorriente de la red utilizando el adaptador