Inferência Estatística

(1)

Inferência Estatística

Profa Alcione Miranda dos Santos

Departamento de Saúde Pública – UFMA Núcleo de Estatística e Informática – HUUFMA

(2)

Inferência Estatística

Inferências a respeito de uma população são feitas,

baseadas em uma amostra.

Inferências a respeito de uma parâmetro (

por ex. a

média populacional

)

são feitas, examinando

(3)

Inferência Estatística

Dois princípios Básicos:

Testes de Hipóteses

Estimação

Estimação Pontual

A média amostral é uma estimativa pontual da média populacional

Estimação por Intervalos

(4)

Teoria da Estimação

Em estatística, muitas vezes desejamos estimar

a proporção com que determinado evento

ocorre. Por exemplo:

Prevalência de diabéticos no munícipio de São

Luís-MA

Prevalência de fumo entre os estudantes de Medicina

da UFMA.

Se desejarmos saber tais prevalências, sem

erro aleatório, teremos que estudar toda a

população dos estudantes.

(5)

Teoria da Estimação

Através da teoria de estimação podemos tomar

uma

amostra aleatória

da população de

interesse e estimarmos, com uma

probabilidade

de erro conhecida

, a verdadeira prevalência

nesta população.

Estimação

é o processo pelo qual, usando-se

um valor amostral (

estatística

) inferimos o valor

populacional (

parâmetro

).

(6)

Teoria da Estimação

Estimador-

é uma estatística destinada a

estimar um parâmetro.

Existem dois tipos de estimação:

Estimação Pontual

(7)

Estimativa Pontual

Quando a partir de uma amostra representativa da população, o pesquisador procura obter um único valor para o parâmetro.

Exemplo: Prevalência de fumo entre os estudantes de Medicina da UFMA.

onde f é a freqüência do evento na amostra e n é o tamanho da amostra

n

f

p

ˆ

=

(8)

Estimativa por Intervalo

Neste caso, calculamos a margem de erro aleatório de uma estimativa e construímos um intervalo.

O intervalo contém o parâmetro com uma probabilidade pré- definida.

Um intervalo de confiança está associado a um grau de confiança que é a uma medida da nossa certeza que o intervalo contém o parâmetro.

Esta maneira de estimar o parâmetro é mais interessante, pois fornece elementos para se discutir a precisão da estimativa.

(9)

Estimativa por Intervalo

O grau de confiança é a probabilidade

_(1-

α)

do intervalo de confiança conter o verdadeiro

valor do parâmetro.

Geralmente, adota-se

α = 1%, 5% ou 10%.

α

é chamado de

nível de significância

.

A escolha do nível de confiança depende da

(10)

Intervalo de Confiança para a

Proporção Populacional

O IC para a proporção populacional é dado por

n

p

z

p

IC

[

π

;

(

1 −

α

)%]

=

ˆ

±

_α _/₂

ˆ

.(

1 −

ˆ

)

Nota:

O intervalo só poderá ser construído quando f ≥ 5 e n ≥ f + 5

(11)

EXEMPLO: Uma droga foi testada em 25 pacientes e apresentou efeitos colaterais em 8 casos. Qual a proporção de ocorrência de efeitos colaterais?

Estimativa pontual:

8/25 = 0,32 ou 32%.

Estimativa por intervalo:

Adotando-se um nível

de significância de 5%, tem-se:

]

53 ,

0 ;

15 ,

0 [

25 )

68 ,

0 )(

32 ,

0 (

96 ,

1

32 ,

0 %]

95 ;

[

π

=

±

=

IC

(12)

COMANDO STATA

O comando usado para construir IC para proporção é

cii n f

com

n = tamanho da amostra

f = freqüência do evento na amostra

Para o exemplo anterior, temos:

cii 25 8

Binomial Exact --Variable | Obs Mean Std. Err. [95% Conf. Interval] ---+---| 25 .32 .0932952 .1494954 .5350007

pˆ

(13)

Intervalo de Confiança para a Média

Populacional

Caso 1:

Grandes Amostras (n ≥ 30)

Caso 2:

Pequenas Amostras (n < 30)

n

s

z

x

IC

[

µ

;

(

1 −

α

)%]

=

±

_α _/₂

n

s

t

x

IC

[

µ

;

(

1 −

α

)%]

=

±

₍_n₋₁_;_α _/₂₎

(14)

Distribuição t Student

A distribuição de

t student

tem um tem um

formato semelhante ao da distribuição normal,

mas a curva é mais larga.

Uma característica importante da distribuição

t

(15)

Tabela t Student

Se uma distribuição t student tem 11 graus de liberdade, encontre o valor de t que faz o a área sombreada ser de 0,025

(16)

]

45 ,

15 ;

55 ,

10 [

15 ,

1 .

1315

,

2

13 %]

95 ;

[

16

6 ,

4

13 %]

95 ;

[

₍₁₅_;₀_,₀₂₅₎

=

±

=

±

=

µ

IC

t

IC

EXEMPLO: Com o intuito de estudar o conteúdo de ácido láctico no sangue de indivíduos com demência precoce, uma amostra de 16 pacientes foi tomada e os resultados foram os seguintes: média = 13 mg/100 ml e desvio padrão = 4,6 mg/100 ml. Estime através de intervalo de confiança a média do teor de ácido láctico no sangue de indivíduos com demência precoce.

(17)

COMANDO STATA

O comando usado para construir IC para média populacional é

cii n me sd

com

n = tamanho da amostra me = média amostral sd = desvio padrão

Para o exemplo anterior temos:

x

IC

. cii 16 13 4.6

Variable | Obs Mean Std. Err. [95% Conf. Interval] ---+---| 16 13 1.15 10.54883 15.45117

n S

(18)

Testes de Hipóteses

Profa Alcione Miranda dos Santos

Departamento de Saúde Pública – UFMA Núcleo de Estatística e Informática – HUUFMA

(19)

Testes de Hipóteses

Algumas vezes existe um particular interesse

em decidir sobre a verdade ou não de uma

hipótese específica.

Por exemplo: Se dois grupos têm a mesma média ou

se o parâmetro populacional tem um valor em particular.

Teste de hipóteses

fornece-nos a estrutura para

(20)

Quando falamos em hipóteses estamos nos referindo à

perguntas sobre a relação entre variáveis, por exemplo:

A variável "doença" está associada à variável "fator de risco"?

Repare que as hipóteses são apenas fundamentais em

estudos analíticos ou experimentais.

Estudos descritivos não necessitam de hipóteses, basta

(21)

Testes de Hipóteses

Hipótese científica:

existe um efeito E.

_{Hipóteses estatísticas:}

_{diferenças, associação,}

estimação pontual

Hipótese nula (H

₀

):

ausência de diferença

Hipótese alternativa (H

_A

):

contrária à H

₀

Testes de hipóteses:

fornecem subsídios para

(22)

Tipos de Erros

Ao tomar uma decisão a favor ou contra uma

hipótese, existem dois tipos de erros que

podemos cometer:

Erro Tipo I

e

Erro Tipo II

Erro Tipo I:

Rejeitar

a hipótese nula quando de

fato ela é

verdadeira

.

Erro Tipo II:

Aceitar

a hipótese nula quando de

(23)

Tipos de Erros

Decisão H_overdadeira H_o falsa

Aceitar a

hipótese Decisão correta(1- α) Erro de tipo IIβ

Rejeitar a

hipótese Erro de tipo Iα

nível de significância

Decisão correta (1-β)

(24)

Testes Bilaterais e Unilaterais

_{Teste bilateral:}

há interesse em identificar diferença

para qualquer direção.

Exemplo: droga altera a PAS

Teste unilateral:

apenas tem sentido diferença em

uma direção.

Exemplo: dieta para redução do nível sérico de colesterol.

(25)

Testes de Hipóteses

Todos os testes de hipóteses têm

suposições;

As suposições devem ser verificadas;

Se alguma suposição é

violada

, então os

(26)

Testes de Hipóteses

Paramétricos:

são baseados nas

características das distribuições teóricas que a

distribuição dos dados segue.

Não-paramétricos:

não fazem suposições

sobre a distribuição dos dados. Têm menos

poder.

(27)

Passos para realizar um Teste de Hipóteses

Passo 1 : Definição da Hipótese

O primeiro passo é o estabelecimento das hipóteses:

Hipótese Nula (

H

₀): É um valor suposto para um parâmetro.Se os resultados da amostra não forem muito diferentes de H₀, ela não poderá ser rejeitada.

Hipótese Alternativa (H_A): É uma hipótese que contraria a hipótese nula, complementar de Ho, Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho.

(28)

Passos para realizar um Teste de Hipóteses

Passo 2: Calcular a estatística do Teste

É o valor calculado a partir da amostra, que será usado na tomada

de decisão. Uma maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste.

Para o caso de testes de médias, a estatística do teste é a variável

padronizada Z: ) n ( ) X ( Zcal

σ

µ

− = Estatística do teste Variabilidade das médias

(29)

Passos para realizar um Teste de Hipóteses

Passo 3: Região Crítica

A região crítica é a região onde H_o é rejeitada. A área da região crítica é igual ao nível de significância (α), que estabelece a probabilidade de rejeitar H_o quando ela é verdadeira.

Por exemplo, se utilizarmos o nível de significância de 5%, a probabilidade de rejeitar H_o quando ela é verdadeira é igual a 5%. Na prática, os valores usuais são: α = 0,01 ou 0,05 ou 0,10.

(30)

Passos para realizar um Teste de Hipóteses

Unilateral à esquerda: H_o: µ = 50 H_A: µ > 50 Unilateral à direita: H_o: µ = 50 H_A: µ <50 Bilateral: H_o: µ = 50 H_A: µ ≠ 50

(31)

Passos para realizar um Teste de Hipóteses

Passo 4. Regra de Decisão:

Se o valor da estatística do teste cair na região crítica, rejeita-se H_o.

Ao rejeitar a hipótese nula existe uma forte evidência de sua falsidade.

Ao contrário, quando aceitamos, dizemos que não houve evidência

(32)

p-valor

Definição: probabilidade de obter o resultado que

obtivemos ou mais estremo, sendo a hipótese nula é verdadeira.

O p- valor é comparado ao nível de significância α pré-determinado.

Se o p- valor for menor ou igual ao nível de significância, rejeitamos H₀.

Note as seguintes interpretações de p-valores:

p > 0,10 Não existe evidência contra H₀ p < 0,10 Fraca evidência contra H₀

p < 0,05 Evidência significativa contra H₀

(33)

Testes de Hipóteses

Estudaremos testes de hipóteses

considerando:

(a) Uma única amostra

(b) Comparação de duas ou mais amostras

Primeiramente, vamos estudar

teste de

(34)

Uma amostra - Variável

quantitativa

Com uma amostra de indivíduos

queremos saber se a média da

respectiva população é um

determinado valor.

(35)

(36)

PASSO 1:

H

₀

: µ

_M

=128

versus

H

_A

: µ

_M

≠128

PASSO 2:

Nível de significância: 5%

PASSO 3:

Estatística do teste:

.

,

n

x

Z

_cal

2

28

1 ,

3

7

60

24

128

135

0

=

−

=

−

=

_σ

µ

(37)

PASSO 4:

Construir a Região de Rejeição (RR)

TESTE BILATERAL

RA

(38)

Portanto, a amostra aleatória sugere que medicamento M aumenta a PAS.

Agora, vamos calcular o p- valor para o teste de hipótese em questão:

Temos que calcular a probabilidade de observarmos um valor igual ou superior a 2,28, isto é,

p-valor: P(Z>2,28) =0,013 (distribuição normal)

Como o teste é bilateral, temos que multiplicar por dois esta probabilidade. Assim, 0,013 x 2 = 0,026

Desde que o p- valor é menor que o nível de significância do teste (α = 5%), rejeita- se a hipótese nula.

(39)

Quando o desvio padrão populacional é

desconhecido, porém n≥30, podemos usar a

distribuição Normal, mas você deve substituir o desvio

padrão populacional pelo desvio padrão amostral.

Quando o n<30 e o desvio padrão populacional é

desconhecido, temos que aplicar o teste t de Student

com a fórmula abaixo:

) 1 ( 0

~

₋

−

=

_n cal

t

n

s

x

t

µ

Suposição do teste: A variável quantitativa é normalmente distribuída na população.

(40)

Exemplo: Teste t

A altura média dos estudantes da UFMA é de 1,70 m. Em uma amostra casual de tamanho 25 foi estimada a média de 1,72 m e desvio padrão da amostra de 0,08 m. Pode-se considerar que a média amostral não difere da média da população?

(41)

Solução:

m

H

a

)

₀

:

µ

=

1 ,

70 H

_A

:

µ

≠

1 ,

70 m

064 ,

2 ;

05 ,

0 )

=

t

_crit_; ₀_,₀₂₅_; ₂₄_g_._l_.

=

b

α

25 ,

1

25

08 ,

0

70 ,

1

72 ,

1 )

=

−

=

−

=

n

s

x

t

c

µ

(42)

Solução no STATA:

ttesti 25 1.72 0.08 1.70

One-sample t test

---| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---+---x | 25 1.72 .016 .08 1.686978 1.753022 ---mean = ---mean(x) t = 1.2500 Ho: mean = 1.70 degrees of freedom = 24

Ha: mean < 1.70 Ha: mean != 1.70 Ha: mean > 1.70 Pr(T < t) = 0.8883 Pr(|T| > |t|) = 0.2234 Pr(T > t) = 0.1117

m

H₀ :µ₀ =1,70 tcal =1,25

contém 1,70m

(43)

Teste de Hipótese para Proporção Populacional

Vejamos agora teste de hipótese para variáveis

qualitativas

.

Por exemplo: prevalência de uma doença.

Para construção de um teste de hipóteses, para esta situação, devemos seguir o mesmo raciocínio anteriormente aplicado para variáveis quantitativas.

(44)

Teste de Hipótese para Proporção Populacional

Estabeleça a hipótese nula e a hipótese alternativa

Exemplo:

H

₀

: π = π

₀ versus

H

_A

: π ≠ π

₀

Calcule a proporção amostral

Calcule a estatística do teste

n

p

z

_cal

)

1 (

ˆ

0 0 0

π

−

=

(45)

Teste de Hipótese para Proporção Populacional

Utilizar a tabela da Distribuição Normal para

determinar o

p-valor

.

Comparar o

p-valor

do teste com o

nível de

significância do teste

.

Nota:

Uma regra geral é que o teste anterior é

válido quando temos ambos e

maiores do que 10.

p

(46)

Exemplo:

Teste de Hipótese para Proporção

Populacional

Em um região afetada por um surto epidêmico, observou- se uma amostra de 2500 indivíduos, tendo-se encontrado 625 contaminados. Teste, ao nível de significância 5%, se a proporção de indivíduos contaminados é significativamente superior a 20%.

(47)

Solução:

20 ,

0 :

)

H

₀

π

=

a

H

_A

:

π

>

0 ,

20

65 ,

1 ;

05 ,

0 )

=

z

₀_,₀₅

=

b

α

25 , 6 2500 ) 75 , 0 1 ( 25 , 0 2 , 0 25 , 0 ) 1 ( ˆ ) 0 0 0 = − − = − − = n p Z c _cal

π

d) Região crítica:

(48)

Solução no STATA:

Não contém 0,2 2 0 0:π , H = prtesti 2500 0.25 0.2v

One-sample test of proportion x: Number of obs = 2500 ---Variable | Mean Std. Err. [95% Conf. Interval] ---+---x | .25 .0086603 .2330262 .2669738 ---p = ---pro---portion(x) z = 6.2500 Ho: p = 0.2

Ha: p < 0.2 Ha: p != 0.2 Ha: p > 0.2 Pr(Z < z) = 1.0000 Pr(|Z| > |z|) = 0.0000 Pr(Z > z) = 0.0000 25 , 6 = cal z p-valor <0,05

(49)

Comparação de Dois grupos

Na pesquisa médica, é muito freqüente

necessitarmos comparar médias ou proporções

de amostras diferentes (por ex.

caso x

controle

).

Se estamos estudando duas amostras, então

(50)

Amostras Independentes

Neste tipo de estudo, temos duas amostras, mas cada indivíduo participa apenas de uma das amostras.

Amostras Pareadas

Num estudo pareado, novamente se tem duas amostras, mas cada observação da primeira amostra é

(51)

Dois grupos independentes (uma observação em cada

unidade

unidade amostralamostral).).

Exemplos

1. Dois produtos

2. Duas drogas terapêuticas 3. Duas marcas comerciais

4. Dois procedimentos cirúrgicos 5. Dois gêneros

(52)

Dois grupos pareados (duas observações em cada unidade

amostral

amostral).).

Exemplos

1. Antes e depois de uma intervenção cirúrgica 2. Lados direito e esquerdo

(53)

Teste t para duas amostras independentes

A variável de interesse é uma

variável

quantitativa

e

normalmente distribuída

.

Exemplo:

Comparar produtos alimentícios

(

um novo

,

outro tradicional

) no ganho de peso

de ratos de laboratório.

Você que saber se na população:

¾ As médias são diferentes?

(54)

Você também precisa saber se, na população:

¾ A variabilidade é a mesma nos dois grupos? ¾ A variabilidade é diferente?

Para verificar se a variabilidade é a mesma

nos dois grupos, utiliza-se o

Teste F.

σ

2 2 2 1 : ≠ A H

σ

2 2 2 1 0 : = H versus

(55)

1o _Caso: Considere a situação em que as duas variâncias

populacionais são desconhecidas, mas é razoável assumir que elas sejam iguais.

Neste caso, utiliza- se o teste t- Student para amostras

independentes. Estatística do teste: ( 2) 2 1 2 1 2 1 ~ 1 1 ₊ + − − = _n _n p cal t x x t

n

s

com

2 )

1 (

)

1 (

2 1 2 2 2 2 1 1 2

−

+

−

+

−

=

n

s

n

s

n

s

_p

(56)

Exemplo:

Duas amostras independentes

com variâncias iguais

Um pesquisador gostaria de testar a hipótese que os homens são mais pesados que as mulheres à idade adulta. Tomou ao acaso uma amostra de 35 alunos, sendo 17 do sexo feminino e 18 do masculino.

Média n Variância

Masculino 76,8 18 334,18

(57)

Solução: F M

H

a

)

₀

:

µ

=

µ

F M

H

b

)

₁

:

µ

>

µ

69 ,

1 ;

05 ,

0 )

=

t

₀_,₀₅ _; ₃₃ _g _._l

=

c

α

645 , 0 04 , 6 9 , 3 338 , 0 86 , 17 9 , 3 17 1 18 1 86 , 17 9 , 72 8 , 76 1 1 ) 2 1 2 1 = = = + − = + − =

n

s

p cal x x t d

(58)

Solução no STATA:

Teste F

Comando: stesti n1 . sd1. n2. sd2

Para o exemplo anterior, temos:

sdtesti 18 . 18.28 17 . 17.41

Variance ratio test

---| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---+---x | 18 . 4.308637 18.28 . . y | 17 . 4.222545 17.41 . . ---+---combined | 35 . . . . . ---ratio = sd(x) / sd(y) f = 1.1024 Ho: ratio = 1 degrees of freedom = 17, 16

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Pr(F < f) = 0.5753 2*Pr(F > f) = 0.8494 Pr(F > f) = 0.4247

(59)

Solução no STATA:

Teste t-student para variâncias iguais

Comando: ttesti n1 me1 sd1 n2 me2 sd2

ttesti 18 76.8 18.28 17 72.9 17.41

Two-sample t test with equal variances

---| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---+---x | 18 76.8 4.308637 18.28 67.70957 85.89043 y | 17 72.9 4.222545 17.41 63.9486 81.8514 ---+---combined | 35 74.90571 2.993466 17.70959 68.82226 80.98917 ---+---diff | 3.9 6.041423 -8.391367 16.19137 ---diff = mean(x) - mean(y) t = 0.6455 Ho: diff = 0 degrees of freedom = 33

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.7385 Pr(|T| > |t|) = 0.5230 Pr(T > t) = 0.2615

(60)

2

o

Caso:

Agora, considere a situação em que as duas

variâncias populacionais são desconhecidas e

desiguais.

Neste caso, deve- se utilizar o teste t student com

variâncias desiguais.

A estatística do teste é dada por

v cal

t

n

s

n

s

x

t

~

2 2 2 1 2 1 2 1

+

−

=

2 1 1 ₂ 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 − + ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + + ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ + = n n S n n S n S n S ν com

(61)

Teste de Hipóteses para Duas Médias Populacionais

Agora, vamos considerar amostras pareadas.

A variável de interesse é quantitativa e normalmente

distribuída.

Novamente, o interesse é testar a hipótese nula de que as duas médias das populações são iguais.

As hipóteses a serem testadas são

(62)

Em vez de considerarmos os dois conjuntos de observações como amostras distintas, focalizamos a diferença de medições dentro de cada par.

Amostra 1 Amostra 2 x₁₁ x₂₁ x₃₁ x₄₁ . x_n1 x₁₂ x₂₂ x₃₂ x₄₂ . x_n2

(63)

Usamos esses dados para criar novo conjunto de observações que representam as diferenças dentro de cada par:

d

₁₌

x

₁₁

-x

₁₂

d

₂₌

x

₂₁

-x

₂₂

d

₃₌

x

₃₁

-x

₃₂

d

_n=

x

_n1

-x

_n2

(64)

A partir dessas diferenças calculamos a média e o desvio padrão Estatística do teste: n d d n i i

∑

= = 1 1 ) ( 1 − − =

∑

= n d d s n i i d ) 1 (

~

₋

=

_n d cal

t

n

s

d

t

(65)

Teste de Hipóteses para Duas Proporções

Populacionais

Primeiramente, vamos considerar amostras independentes. O interesse é comparar dois grupos através do resultado

observado em uma variável dicotômica.

O problema de comparação das proporções populacionais nos dois grupos é formulado através das hipóteses:

(66)

Teste Qui Quadrado

É um teste muito usado na área médica que se

destina a comparar proporções.

Utiliza-se o

teste qui-quadrado

quando deseja-se

verificar se a freqüência com que um determinado

acontecimento observado em uma amostra se

desvia significativamente ou não da freqüência

com que ele é esperado.

(67)

Teste Qui Quadrado

Grupo

Ocorrência

SIM

do Evento

NÃO

Total

I

a

b

a + b = n

₁

II

c

d

c + d = n

₂

Total

a + c = m

₁

b + d = m

₂

n

₁

+ n

₂

= n

(68)

Exemplo

Os dados a seguir são referentes ao sexo e condição de sobrevivência de uma amostra de recém- nascidos com síndrome de desconforto idiopático grave.

Sexo sobrevivente Não

sobrevivente Total Feminino Masculino Total 10 17 27 7 16 23 17 33 50

(69)

Exemplo

Cálculos necessários para a construção do teste qui-quadrado:

i O_i E_i O_i- E_i (O_i- E_i)2 _(O i- Ei)2 E_i 1 2 3 4 Total 10 17 7 16 50 9,18 17,82 7,82 15,18 50 0,82 -0,82 -0,82 0,82 0 0,6724 0,6724 0,6724 0,6724 2,6896 0,07 0,04 0,08 0,04 0,23

O valor da estatística do teste é 0,23. Como este valor é maior do que 3,84, valor obtido da distribuição qui-quadrado, para um nível de de significância de 5%, não rejeitamos a hipótese nula, ou seja, os meninos não sobrevivem mais do que as meninas.

(70)

Restrições ao Uso do Teste Qui-Quadrado

Quando 20 ≤ n ≤ 40, utilizar o teste qui-quadrado se nenhuma

freqüência esperada seja inferior a 5. Em caso contrário, utilizar o Teste Exato de Fisher.

Quando n < 20, utilizar o Teste Exato de Fisher.

Quando n > 40, utilizar o teste qui-quadrado.

Quando o número de categorias for maior do que 2, não mais

que 20% das categorias devem ter freqüências menores que 5 e nenhuma categoria deve ter freqüência menor que 1.

Inferência Estatística

Inferência Estatística

Inferência Estatística

Inferências a respeito de uma população são feitas,

baseadas em uma amostra.

Inferências a respeito de uma parâmetro (

por ex. a

média populacional

)

são feitas, examinando

Inferência Estatística



Dois princípios Básicos:

Teoria da Estimação

Em estatística, muitas vezes desejamos estimar

a proporção com que determinado evento

ocorre. Por exemplo:

Se desejarmos saber tais prevalências, sem

erro aleatório, teremos que estudar toda a

população dos estudantes.

Teoria da Estimação

Através da teoria de estimação podemos tomar

uma

amostra aleatória

da população de

interesse e estimarmos, com uma

probabilidade

de erro conhecida

, a verdadeira prevalência

nesta população.

Estimação

é o processo pelo qual, usando-se

um valor amostral (

estatística

) inferimos o valor

populacional (

parâmetro

).

Teoria da Estimação

Estimador-

é uma estatística destinada a

estimar um parâmetro.

Existem dois tipos de estimação:

Estimação Pontual

Estimativa Pontual

n

f

p

ˆ

=

Estimativa por Intervalo

Estimativa por Intervalo

O grau de confiança é a probabilidade

(1-

α)

do intervalo de confiança conter o verdadeiro

valor do parâmetro.

Geralmente, adota-se

α = 1%, 5% ou 10%.

α

é chamado de

nível de significância

.

A escolha do nível de confiança depende da

Intervalo de Confiança para a

Proporção Populacional

O IC para a proporção populacional é dado por

n

p

p

z

p

IC

[

π

;

(

1

−

α

_(1-