Modelos de Probabilidade e Inferencia Estatística

(1)

Modelos de Probabilidade e Inferencia Estatística

Ulisses U. dos Anjos

Departamento de Estatística Universidade Federal da Paraíba

(2)

Sumário

1 Objetivos e Bibliografia

2 Introdução

3 Conceitos de Probabilidade

Propriedades de uma medida de probabilidade Probabilidade Condicional

Testes Diagnósticos

4 Variável Aleatória

Distribuições de Probabilidade para Variáveis Aleatórias Discretas

Distribuições de Probabilidade para Variáveis Aleatórias Contínuas

5 Conceitos básicos de amostragem

Tipos de estudos Tipos de Amostragem

Principais planos de amostragem probabilística

6 Distrbuições Amostrais Média Proporção Variância 7 Intervalo de Confiança Média Proporção Variância 8 Teste de Hipótese Visão Geral

Componentes de um Teste de Hipótese Testes Paramétricos

Teste para Média Teste para Variância Teste para Proporção

(3)

Objetivos

Revisar, aprofundar e ampliar os conceitos de probabilidade e inferência estatística dos mestrandos, visando sua utilização nas dissertações e servindo como base para outras disciplinas do programa.

(4)

Bibliografia

DANIEL, w. w. Biostatics: A Foundation for Analysis in the Health Sciences. 9o Ed.. Wiley, 2009.

TRIOLA, M. F. Introdução à Estatística. Livros Técnicos e Científicos Editora, 2005.

ARANGO, H. G. Bioestatística: teórica e computacional. 2a

edição. Rio de Janeiro: Guanabara Koogan, 2005.

(5)

Objetivo da Probabilidade

Fornecer o arcabouço teórico para o estudo dos fenômenos ou experimentos aleatórios.

Criar modelos teóricos que reproduzam de maneira razoável a distribuição de freqüências dos fenômenos ou experimentos aleatórios. Tais modelos são chamados modelos probabilísticos.

(6)

Experimento aleatório

Definição: Um experimento que pode fornecer diferentes

resultados, muito embora seja repetido toda vez da mesma maneira, é chamado experimento aleatório.

Característica de um experimento aleatório:

Imprevisibilidade: o resultado do experimento não pode ser conhecido a priori, mesmo se repetido sobre iguais condições;

(7)

Espaço amostral e evento

Espaço amostral: é o conjunto de todos os resutados de um

experimento aleatório. Notação: Ω

Evento: É um subconjunto do espaço amostral;

Os subconjuntos de Ω serão denotados por letras latinas maiúsculas (A,B,C,. . . );

Diz-se que "‘ocorre o evento A"’ quando o resultado do experimento aleatório for um elemento de A;

O espaço amostral Ω e o conjunto vazio ∅ também são eventos, em que Ω é o evento certo e ∅ é o evento impossível.

(8)

Operações básicas entre conjuntos

A ∪ B =ω ∈ Ω : ω ∈ A ou ω ∈ B ou ω ∈ A, ω ∈ B , é a

união de A e B;

Exemplo

Suponha que iremos sortear de uma lista de casais que se casaram há 30 anos atrás e verificar quais deles estão vivos. Considere os seguintes eventos: A =A mulher estar viva e B =O homem estar vivo. Então o evento pelo menos um estar vivo é dado por A ∪ B

A ∩ B =ω ∈ Ω : ω ∈ A, ω ∈ B , é a intersecção de A e B;

(9)

Operações básicas entre conjuntos

Exemplo

Considerando o exemplo anterior, então o evento ambos estarem vivos é dado por A ∩ B.

Ac ₌_{ω ∈ Ω : ω /}_{∈ A , deste modo segue que A}c _{= Ω − A é}

o complementar de A, do mesmo modo Bc = Ω − B é o

complementar de B;

Exemplo

Considerando o exemplo anterior, então o evento o homem estar vivo pode ser representado por Ac, logo nesse caso específico B = Ac e A = Bc.

A − B =ω ∈ Ω : ω ∈ A, ω /∈ B , deste modo segue que

A − B = A ∩ Bc _{é a diferença entre A e B;}

Exemplo

Considerando o exemplo anterior, então o evento apenas a mulher estar viva é dado por A − B. Do mesmo modo, o evento apenas o

(10)

Operações básicas entre conjuntos

A∆B =ω ∈ Ω : ω ∈ A, ω /∈ B ou ω /∈ A, ω ∈ B , deste

modo segue que A∆B = (A ∩ Bc_{) ∪ (A}c_{∩ B) é a diferença}

simétrica entre A e B;

Exemplo

Considerando o exemplo anterior, então o evento somente o homem ou a mulher estar vivo pode ser representado por A∆B.

A e B são disjuntos(mutuamente exclusivos) se e somente se A ∩ B = ∅;

Exemplo

Considerando o exemplo anterior, então os eventos A e B não são disjuntos pois ambos podem estar vivos.

(11)

Partição de um evento

Seja A um subconjunto de Ω. Então A1, . . . , An formam uma

partição de A se e somente se Ai ∩ Aj = ∅ para todo i 6= j e ∪n

i =1Ai = A.

Deste modo, se A = Ω então A1, . . . , An formam uma partição

de Ω se e somente se Ai ∩ Aj = ∅ para todo i 6= j e ∪n

(12)

Leis de De Morgan

Sejam A1, . . . , An tal que Ai ⊂ Ω para todo i, então: (i) (∪n_{i =1}Ai)c = ∩ni =1Aci.

Interpretação: o complementar da ocorrência de pelo menos

um dos eventos é a não ocorrência de todos os eventos; (ii) (∩n_{i =1}Ai)c = ∪n_{i =1}Ac_i.

Interpretação: o complementar da ocorrência de todos os

eventos é a não ocorrência de pelo menos um dos eventos.

(13)

Função indicadora

Seja A ⊂ Ω, então IA(ω) = ( 1 se ω ∈ A 0 se ω /∈ A

(14)

σ-Álgebra

Uma classe F de subconjuntos de Ω é denominada uma σ-álgebra se ela satisfaz:

(F1) Ω ∈ F ;

(F2) Se A ∈ F então Ac ∈ A;

(F3) Se Ai ∈ F para todo i ≥ 1 entãoS∞i =1Ai ∈ F ;

(15)

Definição Clássica de Probabilidade

Seja (Ω, F ) um espaço finito de eventos equiprováveis. Assim, para todo A ∈ F tem-se que,

P(A) = #A

#Ω

em que # é o número de elementos do conjunto.

Exemplo

Considere o experimento aleatório de lançar duas moedas. Nesse caso o espaço amostral é dado por

Ω =(c, c), (c, r ), (r , c), (r , r ) . Seja A=Obtenção de faces iguais. Portanto, A =(c, c), (r , r ) . Deste modo,

(16)

Definição frequentista de Probabilidade

Seja Ω um espaço amostral de um experimento aleatório. Seja n

repetições independentes de um experimento aleatório e nA o

número de ocorrências do evento A ⊂ Ω. Então, a probabilidade de A é dada por, P(A) = lim n→∞ nA n = p Observação

A lei dos grandes números garante a convergência sobre certas condições do limite acima, em que 0 ≤ p ≤ 1.

(17)

Definição axiomática de Probabilidade

Seja (Ω, F ) um espaço mensurável. Então uma função P : F → [0, 1] é uma probabilidade se,

(P1) P(Ω) = 1;

(P2) Para todo A ∈ F tem-se P(A) ≥ 0;

(P3) P é σ-aditiva, isto é, se A1, A2, . . . , são dois a dois disjuntos então, P ∞ [ n=1 An ! = ∞ X n=1 P(An). em que S∞_n=1An = A1∪ A2∪· · ·. Observação

Note que de um modo geral a medida de probabilidade P não precisa assinalar uma probabilidade para todo evento em Ω, mas apenas para os eventos em F . A trinca (Ω, ∈ F , P) é denominado

(18)

Propriedades

Seja (Ω, F , P), então para todo A ∈ F e B ∈ F , tem-se que:

P(Ac_{) = 1 − P(A);}

P(∅) = 0;

P é uma função não decrescente, isto é, para todo A, B ∈ F tal que A ⊆ B tem-se que P(A) ≤ P(B);

Para todo A, B ∈ F tal que A ⊆ B tem-se que P(B − A) = P(B) − P(A);

Para todo A, B ∈ F arbitrários tem-se que:

P(A − B) = P(A) − P(A ∩ B) e P(B − A) = P(B) − P(A ∩ B).

(19)

Propriedades

Para todo A ∈ F tem-se que 0 ≤ P(A) ≤ 1; Para todo A, B ∈ F arbitrários tem-se que:

(20)

ARANGO, Exemplo 5.5, P. 144

Considere os dados abaixo que mostram 15 indivíduos classificados quanto às variáveis obesidade e sedentarismo.

Indivíduo 1 2 3 4 5 6 7 8 9 10 Obesidade n n s n s s n n n s Sedentarismo s n s s n s n s s s Indivíduo 11 12 13 14 15 Obesidade n n s n n Sedentarismo n n s n s

(21)

ARANGO, Exemplo 5.5, P. 144

Considere os seguintes eventos: A=indivíduo obeso e B= indivíduo sedentário. Supondo que essa amostra e representativa da

população de estudo, calcule(estime) a probabilidade de:

O indivíduo ser obeso;Tabela

O indivíduo ser sedentário;Tabela

O indivíduo ser obeso e sedentário;Tabela

O indivíduo ser obeso ou sedentário;Tabela

(22)

Problema

Seja (Ω, F , P) o espaço de probabilidade para um determinado experimento aleatório. Suponha que tenhamos a priori alguma informação a respeito do resultado do experimento aleatório. No exemplo anterior, suponha que um indivíduo é sorteado

aleatoriamente e que recebemos a informação que o indíviduo é obeso. Nessas condições qual a probabilidade do indívíduo ser

sedentário? Tabela

(23)

Definição

Seja (Ω, F , P) um espaço de probabilidade. Seja B ∈ F um evento tal que P(B) > 0. Então a probabilidade condicional, dado o evento B, é uma função denotada por P(.|B) e definida para todo A ∈ F como segue,

P(A|B) = P(A ∩ B)

P(B) . (1)

em que P(A|B) é chamada a probabilidade condicional de A dado B.

(24)

Testes Diagnósticos

São testes que tem como objetivo identificar um evento de interesse.

Medidas para avaliar um teste: Sensibilidade(s), Especificidade(e), Valor Preditivo Positivo(VPP), Valor Preditivo Negativo(VPN), Falso Positivo(FP) e Falso Negativo(FN).

(25)

Avaliação do Teste

Resultado do Teste

Positivo Negativo

Ocorrência do Evento Sim a b

Não c d

Consideremos os seguintes eventos: D+=Ocorrência do evento de interesse; D−=Não ocorrência do evento de interesse; T+=Teste positivo;

(26)

Sensibilidade e Especificidade

Sensibilidade(s): É a probabilidade do teste dar positivo dado que ocorreu o evento de interesse, isto é,

s = P(T+|D+) =

P(T+∩ D+)

P(D+) =

a a + b Especificidade(e): É a probabilidade do teste dar negativo dado que não ocorreu o evento de interesse, isto é,

s = P(T−|D−) = P(T−∩ D−)

P(D−) =

d c + d

(27)

Sensibilidade e Especificidade

Valor Preditivo Positivo(VPP): É a probabilidade do evento de interesse ocorrer dado que o teste deu positivo, isto é,

VPP = P(D+|T+) =

P(T+∩ D+)

P(T+) =

p × s

p × s + (1 − p) × (1 − e)

em que p = P(D+) é a prevalência do evento de interesse;

Valor Preditivo Negativo(VPN): É a probabilidade do evento de interesse não ocorrer dado que o teste deu negativo, isto é,

VPN = P(D−|T−) =

P(T−∩ D−)

P(T−) =

(1 − p) × e p × (1 − s) + (1 − p) × e

(28)

Regra do Produto

Sejam A e B eventos em F tal que,

P(A) > 0 e P(B) > 0 então,

P(A ∩ B) = P(A)P(B|A) = P(B)P(A|B).

Exemplo

Considerando o Exemplo 5.5, ARANGO, calcule a probabilidade do indivíduo ser obeso e sedentário utilizando a regra do produto.

Tabela

(29)

Probabilidade Total

Sejam {Ai, i = 1, . . . , n} uma partição de Ω com P(Ai) > 0 para todo i = 1, . . . , n. Então, para todo B ∈ F tem-se que,

P(B) = n X i =1 P(Ai)P(B|Ai). Exemplo

Considerando o Exemplo 5.5, ARANGO, calcule a probabilidade do B =indivíduo ser obeso, considerando a partição A =o indivíduo é sedentário e Ac =o indivíduo não é sedentário.Tabela

(30)

Teorema de Bayes

Seja {Ai, i = 1, . . . , n} uma partição de Ω com P(Ai) > 0 para todo i = 1, . . . , n. Então, para todo B ∈ F para o qual P(B) > 0 tem-se que, P(Aj|B) = P(Aj)P(B|Aj) Pn i =1P(Ai)P(B|Ai) Exemplo

Considerando o Exemplo 5.5, ARANGO, calcule a probabilidade do indivíduo não ser sedentário dado que B =indivíduo é obeso,

considerando a partição A =o indivíduo é sedentário e Ac _=o

indivíduo não é sedentário.Tabela

(31)

Definição

É uma função X : Ω → R que associa a cada elemento do espaço amostral um valor na reta(um valor numérico). Assim, para cada ω ∈ Ω tem-se que X (ω) = x ∈ R.

Observação

A função X deve ser unívoca, isto é, para cada ω ∈ Ω deve haver apenas um X (ω) associado. Entretanto, diferentes valores de ω podem levar a um mesmo valor de X .

(32)

Variável Aleatória: Exemplo

Exemplo

Considere o procedimento de selecionar uma amostra de uma população U de tamanho N. Considere a variável X=altura, assim por exemplo, X (ω1) = 1, 79, X (ω17) = 1, 98 em que ω1 e ω17são o primeiro e o décimo sétimo elemento da amostra.

(33)

Tipos de Variáveis Aleatórias

Discreta: Uma variável aleatória X é discreta se o número de valores que X possa assumir for enumerável. Ex: Altura, peso, etc.

Contínua: Uma variável aleatória X é contínua se o número de valores que X possa assumir for não enumerável. Ex: número de filhos, faixa etária, etc.

(34)

Variável Aleatória: Distribuição de Probabilidade

A distribuição de probabilidade de uma variável aleatória X discreta é uma função que atribui probabilidade a cada um dos valores xi de X , isto é,

PX(xi) = P(X = xi) = P({ω ∈ Ω : X (ω) = xi}) para todo i ∈ {1, 2, . . . , n}, n ∈ N e e satisfaz as condições: (i) 0 ≤ P(X = xi) ≤ 1 e (ii)Pn_{i =1}P(X = xi) = 1. Esta função é denominada Função de Probabilidade ou Função Massa de Probabilidade(fmp);

A distribuição de probabilidade de uma variável aleatória X contínua é dada por,

f (x) = dF (x) dx

para todo x ∈ R e satisfaz as condições: (i) f (x) ≥ 0 para todo x ∈ R; e (ii)R∞

−∞f (x)dx = 1. Esta função é denominada

Função Densdidade de Probabilidade(fdp).

(35)

Variável Aleatória: Função de Distribuição

Seja X uma variável aleatória, então sua função de distribuição é definida como,

F (x) = P(X ≤ x).

F é também conhecida como função de distribuição acumulada de X . Caso discreto: F (x) =P xi≤xPX(xi) = P xi≤xP(X = xi) Caso Contínuo: F (x) =Rx −∞f (t)dt

(36)

Independência de Variáveis Aleatórias

Sejam X1, . . . , Xn, n variáveis aleatórias. Então X1, . . . , Xn são independentes se: F (x1, . . . , xn) = n Y i =1 Fi(xi)

em que F é a função de distribuição acumulada conjunta de X1, . . . , Xne Fi é a função de distribuição acumulada de Xi.

(37)

Valor Esperado de uma Variável Aleatória

O valor esperado de variável aleatória X , denotado por E (X ) ou µ, é para o caso em que X é discreta,

µ = E (X ) = X

x ∈ΩX

xP(x)

e para o caso em que X é contínua µ = E (X ) =

Z ∞

−∞

(38)

Propriedades

Seja c ∈ R uma constante, então E (c) = c;

Seja h uma função uma função mensurável, então para Y = h(X ) tem-se: se X for uma variável aleatória discreta,

E (Y ) = X

x ∈ΩX

h(x)P(x)

e, se X for uma variável aleatória for contínua então, E (Y ) =

Z ∞

−∞

h(x)f (x)dx. Sejam X1, . . . , Xn n variáveis aleatória então

E n X i =1 Xi ! = n X i =1 E (Xi).

(39)

Variância de uma Variável Aleatória

A variância da variável aleatória X , denotado por Var (X ) ou σ2 é Var (X ) = E (X − E (X ))2 = E (X2_{) −}_{E (X )}2 . Se X for discreta, Var (X ) = X x ∈ΩX x2P(X = x) −   X x ∈ΩX xP(X = x)   2 e se X for contínua Var (X ) = Z ∞ −∞ x2f (x)dx − Z ∞ −∞ xf (x)dx 2 .

(40)

Propriedades

Var (c) = 0;

Var (X ± c) = Var (X ); Var (cX ) = c2Var (X );

Sejam X1, . . . , Xn n variáveis aleatória independentes, então,

Var n X i =1 Xi ! = Var (X1) + · · · + Var (Xn)

(41)

Distribuição Binomial

Seja A um evento de interesse. Então uma variável aleatória X que conta o número de vezes que o evento A ocorre em n repetições independentes de um experimento de Bernoulli(um experimento que só possui dois resultados possíveis), possui função de probabilidade,

P(X = x) =    n x px _{× (1 − p)}n−x _{se x = {0, 1, 2, . . . , n}} 0 caso contrário Em que p = P(A).

(42)

Distribuição Binomial

Diz-se que tal variável possui distribuição Binomial com parâmetros n e p e denota-se por:

X ∼ bin(n, p)

Tem-se para essa variável que µ = E (X ) = p e σ2 _{= Var (X ) = np.}

(43)

Exemplo

A taxa de imunização de uma vacina é 80%. Se um grupo de 20 pessoas são vacinadas,

(a) Qual a probabilidade que 15 fiquem imunizadas?

(44)

Distribuição de Poisson

Seja X uma variável aleatória que conta o número de ocorrência de um determinado evento A por unidade (tempo, comprimento, área, volume, etc), então a função de probabilidade de X é dada por,

P(x) =

(_e−λ_λx

x ! se x = {0, 1, . . . , }

0 caso contrário

Esta função é chamada de distribuição de Poisson. Notação: X ∼ P(λ)

Tem-se para essa variável que µ = E (X ) = σ2 _{= Var (X ) = λ.}

(45)

Distribuição Normal

Dizemos que uma v.a. X tem distribuição normal com média µ e variância σ2 se sua função densidade de probabilidade é dada por

f (x) = √ 1 2πσ2exp −(x − µ) 2 2σ2

para todo x ∈ R, em que E (X ) = µ e Var (X ) = σ2_{. Notação:}

(46)

Distribuição Normal: Características

Moda = mediana = média;

A função tem dois pontos de inflexão, um em x = µ − σ e outro em x = µ + σ, em que σ é o desvio padrão de X ; A curva é simétrica em torno de x = µ, isto implica que dado um a ∈ R tem-se que f (µ − a) = f (µ + a), logo

F (µ − a) = PX(X ≤ µ − a) = PX(X ≥ µ + a) = 1 − F (µ + a)

se µ = 0 então F (−a) = 1 − F (a).

(47)

Distribuição Normal

Problema: Dificuldade no cálculo de PX. Existem tabelas apenas

para X ∼ N(0, 1).

Solução: Fazendo a transformação,

Z = X − µ σ ⇒ Z ∼ N(0, 1) Assim, P(X ≤ x) = P(Z ≤ z) = P Z ≤ x − µ σ

(48)

Distribuição t-Student “Padrão”

Dizemos que uma v.a. X tem distribuição t com ν graus de liberdade se sua função densidade de probabilidade é dada por

f (x) = √1 νπ Γ ν+1₂ Γ ν₂ 1 + x 2 ν −ν+1₂

para todo x ∈ R. Notação: X ∼ tν. Tem-se ainda que E (X ) = 0

para ν > 1 e

Var (X ) = ν

ν − 2 para ν > 2.

(49)

Distribuição t-Student: Características

Moda = mediana = média = 0;

A curva é simétrica em torno do 0, isto implica que dado um a ∈ R tem-se que f (−a) = f (+a), logo P(≤ −a) = P(≥ a);

quando os graus de liberdade aumentam a distribuição tν se

(50)

Distribuição Qui-quadrado

Dizemos que uma v.a. X tem distribuição Qui-quadrado com ν graus de liberdade se sua função densidade de probabilidade é dada por f (x) = 1 Γ ν₂ 2ν2 xν2−1e− x 2

para todo x ≥ 0. Notação: X ∼ χν. Tem-se ainda que E (X ) = ν

e Var (X ) = 2ν.

(51)

Distribuição F

Dizemos que uma v.a. X tem distribuição F com ν1 e ν2 graus de

liberdade se sua função densidade de probabilidade é dada por

f (x) = Γ ν1+ν2 2 Γ ν1 2 Γ ν2 2 ν1 ν2 ν1₂ _xν1−2 2 1 + ν1 ν2x ν1+ν2₂

para todo x ≥ 0. Notação: X ∼ Fν1,ν2. Tem-se ainda que

E (X ) = ν2

(52)

Objetivo

Amostragem é o procedimento utilizado na obtenção da amostra, que deve ser de tal forma que a amostra obtida seja representativa da população de interesse.

Exemplo

Quando alguém está adoçando uma xícara de café ele primeiro coloca um pouco de açucar, mistura bem e depois prova(coleta uma amostra) para verificar se precisa ou não mais açucar. Note que, o processo de mexer bem antes de provar é um

procedimento(plano) amostral intuítivo.

(53)

População ou População alvo

É o conjunto de todos os seres, objetos ou informações que estão sob investigação.

Notação: Um população de tamanho N será denotada por

U e

= (1, . . . , N).

Exemplo

Um grupo de pesquisadores desejam analisar a influência de fatores sociodemográficos, físicos e mentais sobre a mobilidade de idosos, pessoas com 60 anos ou mais, residentes no município de Santa Cruz, Rio Grande do Norte. Neste caso a população são todas as pessoas com 60 anos ou mais residentes no município de Santa Cruz.

(54)

População de estudo

É o conjunto de todos os seres, objetos ou informações que podem ser incluídas no estudo. Teoricamente, o mesmo que a população alvo, porém muitas vezes diferente.

Exemplo

No Exemplo anterior suponha que a pesquisa tenha sido realizada durante um determinado mês do ano, e que neste mês

possívelmente algumas das pessoas desta população poderiam não estar na cidade e deste modo não poderiam ser incluídas na pesquisa. Deste modo, neste caso, a população alvo é diferente da população de estudo.

(55)

Amostra

É o conjunto dos elementos selecionados de uma população.

Notação: Uma amostra de tamanho n será denotada por

s e

= k1, . . . , kn para ki ∈ U e .

(56)

Unidade amostral

São os elementos alvo da pesquisa. Podem ser pessoas,

animais,objetos, domicílios, empresas, etc. Deve ser definida no início da investigação de acordo com o interesse do estudo. É muito importante que a unidade elementar seja claramente definida, para que o processo de coleta e análise tenha sempre um significado preciso e uniforme.

(57)

Variáveis

É uma característica qualitativa ou quantitativa que observamos em cada unidade amostral. Ex.: altura, sexo, peso, idade, classe social, etc.

Notação: As variáveis são usualmente denotadas pelas letras

maiúsculas X , Y , Z , W . Em um população U

e

= (1, . . . , N), o conjunto de valores que essas variáveis assumem são denotadas por

x e

= (x1, x2, . . . , xN); Em uma amostra s

e

= k1, . . . , kn, os valores que essas variáveis podem assumir são denotadas por

X e

= (X1, X2, . . . , Xn) em que cada Xi pode assumir qualquer valor xu, para u ∈ U e xu∈ x.

(58)

Parâmetro

Uma medida numérica que descreve alguma característica de uma população.

Exemplo

Peso médio ao nascer de crianças na cidade de João Pessoa, proporção de mulheres com câncer de mama na Paraíba. Notação: Utiliza-se usualmente letras gregas,µ, σ2_{, τ para se} denotar parâmetros. Entretanto, existem exceções, por exemplo, para o parâmetro proporção utiliza-se p.

(59)

Estimador

É qualquer função dos elementos X1, . . . , Xn da amostra X e

, que assume valores em Θ(espaço paramétrico), em que Θ é o conjunto de todos os valores que o parâmetro θ pode assumir.

Notação: Usualmente utiliza-seµ,_b bσ 2_,

b

p para se denotar parâmetros. Entretanto, existem exceções, por exemplo, para o parâmetro µ utiliza-se X .

Exemplo

Seja X e

= (X1, X2, . . . , Xn) uma amostra, então um estimador para a média populacional µ para essa amostra é dada por:

X = X1+ . . . + Xn

(60)

Estimativa

É o valor observado de um estimador após a amostra ser coletada.

Exemplo

Considere a seguinte amostra da variável X , X e

= (5, 3, 4, 2, 6), então

X = 5 + 3 + 4 + 2 + 6

5 = 4.

(61)

Cadastro amostral

Lista das unidades da população de pesquisa de onde a amostra será extraída. Nem sempre aplicável.

(62)

Tipos de estudos: Estudos Observacionais

Se caracterizam pela não intervenção do pesquisador sobre os dados do estudo. Dessa maneira, nos estudos observacionais observamos e medimos características específicas, mas não tentamos modificar os elementos objeto do estudo.

Exemplo

Em uma pesquisa na qual se quer estudar algum aspecto de um grupo de alcoólatras, não há a possibilidade de induzir um grupo a tornar-se alcoólatra, então o estudo é observacional e inclui o grupo que já era alcoólatra e um grupo de não alcoólatras como grupo controle.

(63)

Tipos de estudos: Estudos Experimentais

Nos estudos experimentais, o pesquisador designa os indivíduos da amostra aos grupos por processo aleatório, aplicamos um

tratamento diferente a cada grupo e observamos seu efeito nos elementos da amostra.

Exemplo

No artigo “Impacto da multimistura no estado nutricional de pré-escolares matriculados em creches. Rev. Nutr. [online]. 2006, vol.19, n.2, pp. 169-176.”, coletou-se uma amostra de 135 crianças na faixa etária de um a seis anos. As crianças foram divididas aleatóriamente em três grupos: intervenção 1 (GI1 n=48), intervenção 2 (GI2 n=45) e controle (GC n=42), recebendo 5g e 10g de multimistura e placebo, respectivamente. O estado nutricional das crianças em estudo foi avaliado antes e após a

(64)

Tipos de Amostragem: Amostragem Probabilística

É o procedimento pelo qual se utilizam mecanismos aleatórios de seleção dos elementos de uma amostra, atribuindo a cada elemento uma probabilidade de pertencer a amostra.

(65)

Tipos de Amostragem: Amostragem não Probabilística

É o procedimento pelo qual se utiliza alguma mecanismo aleatório de seleção, mas sem conhecer a probabilidade de cada elemento fazer parte da amostra ou não se utilizam mecanismos aleatórios de seleção dos elementos de uma amostra, tais como: amostras intencionais, nas quais os elementos são escolhidos com o auxílio de especialistas; amostras de voluntários, onde as pessoas é que se apresentam para participar do estudo.

Observação

A grande vantagem da amostra probabilística é medir a precisão da amostra obtida, baseando-se apenas no resultado contido na própria amostra.

(66)

Amostragem aleatória(AA)

Procedimento pelo qual cada elemento da população tem a mesma chance(probabilidade) de ser selecionada.

(67)

Amostragem aleatória simples(AAS)

Procedimento pelo qual uma amostra de tamanho n é selecionada de tal forma que cada amostra possível de tamanho n tem a mesma chance(probabilidade) de ser selecionada. Esse plano amostral subdivide-se ainda em dois outros: Amostragem aleatória simples com reposição(AASCR) e Amostragem aleatória simples sem reposição(AASSR).

(68)

Amostragem sistemática

É realizada quando os elementos da população estão ordenados e a seleção dos elementos da amostra é feita periodicamente ou sistematicamente.

(69)

Amostragem estratificada

Esse procedimento consiste em dividir a população em

sub-populações (estratos). Estratos são divisões de acordo com algum critério, por exemplo: sexo, faixa etária, estado civil, assim dentro de cada estrato teremos uma maior homogeneidade. Dessa forma, para uma população com N unidades amostrais e d estratos com tamanhos N1, . . . , Nd, tem-se quePdi =1Ni = N, portanto teremos os seguinte coeficiente de proporcionalidade ci = N_Ni. Deste modo, para uma amostra de tamanho n devemos selecionar

(70)

Amostragem por conglomerado

Neste procedimento cada unidade amostral é um grupo (conglomerado) de elementos. Conglomerados são partes

representativas da população, por exemplo, dividimos um bairro em quarteirões. Assim cada quarteirão é uma unidade amostral. Deste modo, selecionamos uma AAS dos quarteirões para depois

proceder-se o levantamento dos dados de todos os elementos do Conglomerado.

(71)

Erros de amostragem

Erro amostral(E). é a diferença entre o resultado amostral e

o verdadeiro resultado da população. Tais erros resultam das flutuações amostrais devidas ao acaso.

Erro não amostral. ocorre quando os dados amostrais são

coletados ou registrados incorretamente. Exemplos de erros não amostrais: seleção de uma amostra por conveniência, uso de um instrumento de medida defeituoso, digitação incorreta dos dados, etc.

(72)

Amostra Aleatória

Uma amostra aleatória de tamanho n de uma variável aleatória X com função distribuição F , é um vetor X

e

= (X1, X2, . . . , Xn) em

que as componentes Xi são independentes e possuem distribuição

F .

(73)

Estatística

É qualquer função dos elementos X1, . . . , Xn da amostra X e

cuja distribuição de probabilidade não depende de parâmetros desconhecidos.

(74)

Distribuição Amostral: Definição

A Distribuição de todos os valores possíveis que podem ser assumidos por uma estatística, calculados a partir de amostras de mesmo tamanho selecioanadas aleatóriamente de uma mesma popualção, é chamada de Distribuição Amostral da estatística.

(75)

Distribuição Amostral: Objetivos

Permitir responder questões probabilisticas sobre estatisticas amostrais;

fornecer a teoria necessária para fazer válidos os procedimentos da inferência estatística.

(76)

Distribuição Amostral da Média: Exemplo 5.3.1-Daniel

Suponha que temos uma população de cinco crianças que são pacientes em um centro comunitário de saúde mental e a variável de interesse é a idade delas, assim,

x e = (6, 8, 10, 12, 14). A média populacional é, µ = 6 + 8 + 10 + 12 + 14 5 = 10

(77)

Distribuição Amostral da Média: Exemplo 5.3.1-Daniel

e a variância populacional,

σ2 = (6 − 10)

2_{+ (8 − 10)}2_{+ · · · + (14 − 10)}2

5 = 8

Desejamos obter a distribuição amostral da média, baseado em amostras de tamanho 2, selecionadas dessa populaçao com reposição.

(78)

Distribuição Amostral da Média: Exemplo 5.3.1-Daniel

6 8 10 12 14 6 (6,6) (6,8) (6,10) (6,12) (6,14) X 6 7 8 9 10 8 (8,6) (8,8) (8,10) (8,12) (8,14) X 7 8 9 10 11 10 (10,6) (10,8) (10,10) (10,12) (10,14) X 8 9 10 11 11 12 (12,6) (12,8) (12,10) (12,12) (12,14) X 9 10 11 12 13 14 (14,6) (14,8) (14,10) (14,12) (14,14) X 10 11 12 13 14

Table: Todas as posíveis amostras de tamanho 2 da população com reposição Ulisses U. dos Anjos Modelos de Probabilidade e Inferencia Estatística

(79)

Distribuição Amostral da Média: Amostras com reposição

X 6 7 8 9 10 11 12 13 14

Frequência 1 2 3 4 5 4 3 2 1

Freq. Rel(Prob.) ₂₅1 ₂₅2 ₂₅3 ₂₅4 ₂₅5 ₂₅4 ₂₅3 ₂₅2 ₂₅1

Distribuição Amostral da Média para n=2

6 7 8 9 10 11 12 13 14 0 1 2 3 4 5

(80)

Distribuição Amostral da Média: Amostras com reposição

Deste modo, tem-se que o valor esperado de X é

E (X ) = 14 X x =6 xP(X = x) = 6× 1 25+7× 2 25+· · ·+13× 2 25+14× 1 25 = 10 e a variancia de X é Var (X ) = 14 X x =6 x − E (X )2P(X = x) = (6 − 10)2× 1 25 + · · · + (14 − 10) 2_× 1 25 = 4.

(81)

Distribuição Amostral da Média: Amostras com reposição

Agora note que

E (X ) = µ e Var (X ) = 4 = 8 2 = σ2 n em que n é o tamanho da amostra.

(82)

Distribuição Amostral da Média: Amostras sem reposição

X 7 8 9 10 11 12 13

Frequência 2 2 4 4 4 2 2

Freq. Rel(Prob.) ₂₀2 ₂₀2 ₂₀4 ₂₀4 ₂₀4 ₂₀2 ₂₀2

Distribuição Amostral da Média para n=2, sem reposição

7 8 9 10 11 12 13 0 1 2 3 4

(83)

Distribuição Amostral da Média: Amostras sem reposição

Deste modo, tem-se que o valor esperado de X é

E (X ) = 13 X x =7 xP(X = x) = 7 × 2 20 + · · · + 13 × 2 20 = 10 e a variancia de X é Var (X ) = 13 X x =7 x − E (X )2P(X = x) = (7 − 10)2× 2 20 + · · · + (13 − 10) 2_× 2 20 = 3.

(84)

Distribuição Amostral da Média: Amostras sem reposição

Agora note que

E (X ) = µ e Var (X ) = 3 = 8 2× 5 − 2 5 − 1 = σ2 n × N − n N − 1

em que n é o tamanho da amostra e N é o tamanho da populacão.

(85)

Distribuição Amostral da Média

Seja X1, . . . , Xn uma amostra aleatória da variável X ∼ N(µ, σ2₎ então, X ∼ N µ;σ 2 n .

(86)

Teorema Central do Limite

Seja {Xn, n ≥ 1} uma seqüência de variáveis aleatórias independentes e identicamente distribuídas, com média µ e variancia σ2 < ∞. Então, para Sn=Pni =1Xn, tem-se

Sn− E (Sn) pVar (Sn) = Sn− nµ σ√n d −→ N(0, 1)

(87)

Distribuição Amostral da Média

Seja X1, . . . , Xn uma amostra aleatória da variável X , com média µ

e variância σ2_{< ∞. Então pelo Teorema Central do Limite(TCL)}

segue que a distribuição da média amostral será aproximadamente normal com média µ e variância σ_n2, isto é,

X ∼ Na µ;σ 2 n .

(88)

Exemplo

Suponha que em uma certa população, o tamanho do crânio é uma variável aleatória com distribuição aproximadamente normal com média 185,6 mm e desvio padrão 12,7 mm. Qual é a probabilidade que em uma amostra aleatória de tamanho 10 desta população a média amostral seja maior que 190 mm?

P X > 190 = P Z > 190 − 185, 6_12,7 √

10 !

= P(Z > 1, 1) = 1 − Φ(1, 1) = 0, 1357.

(89)

Distribuição Amostral da Diferença de Médias

Sejam X11, . . . , X1n1 e X21, . . . , X2n2 amostras das variáveis

aleatórias X1 ∼ N(µ1, σ21) e X2∼ N(µ2, σ22) então, X1− X2∼ N µ1− µ2; σ₁2 n1 + σ 2 2 n2 ;

Se as populações não forem normais então pelo TCL segue que, X1− X2 a ∼ N µ1− µ2;σ 2 1 n1 +σ 2 2 n2 ;

(90)

Distribuição Amostral da Diferença de Médias - Exemplo

5.4.2-Daniel

Suponha que o tempo médio de visita domiciliar realizado por enfermeiras dos PSF’s, considerando um certo tipo de paciente foi estimado em 45 minutos com um desvio padrão de 15 minutos e para um segundo tipo de paciente o tempo médio de visita

domiciliar foi estimado em 30 minutos com um desvio padrão de 20 minutos. Se uma enfermeira visitar aleatoriamente 35 pacientes do primeiro tipo e 40 do segundo tipo, qual a probabilidade que o tempo de visita médio entre os dois grupos de pacientes seja superior a 20 minutos?

(91)

Exemplo 5.4.2-Daniel - Solução

Tem-se que, X1− X2∼ N 45 − 30;15 2 35 + 202 40 Logo, P(X1− X2 > 20) = P  Z > _q20 − 15 152 35 + 202 40  

(92)

Distribuição Amostral da Proporção

Seja uma amostra aleatória (X1, . . . , Xn) em que Xi ∼ ber (p). Um estimador para o parâmetro p é dado por,

b

p = X1+ · · · + Xn

n .

Logo, do Teorema Central do Limite, segue que, para n grande,_bp

terá distribuição aproximadamente normal com média p e variância p(1−p)

n .

Observação

A aproximação será boa se n × min(p, 1 − p) > 5.

(93)

Exemplo

Suponha que em uma determinada população de mulheres grávidas no seu terceiro mês, 90% tiveram algum cuidado pré-natal. Se uma amostra aleatória de 200 mulheres dessa população é selecionada, qual a probabilidade que a proporção amostral das mulheres que tiveram algum cuidado pré-natal seja no máximo 0,85?

P(_bp ≤ 0, 85) = P  Z ≤ 0, 85 − 0, 90q 0,9×0,1 200  = P(Z ≤ −2, 36)

(94)

Distribuição Amostral da diferença da Proporção

Seja X11, . . . , X1n1 e X21, . . . , X2n2, amostras das variáveis

aleatórias X1 ∼ ber (p1) e X2∼ ber (p2), os estimadores para os parâmetros p1 e p2 são dados por,

b p1= X11+ · · · + X1n1 n1 e _bp2 = X21+ · · · + X2n2 n2 . Logo, do Teorema Central do Limite, segue que, para n grande, bp1−bp2 terá distribuição aproximadamente normal com média µ b p1−bp2 = p1− p2 e variância σ 2 b p1−bp2 = p1(1−p1) n1 + p2(1−p2) n2 .

(95)

Distribuição Amostral da Variância

Seja X1, . . . , Xn uma amostra aleatória da variável X ∼ N(µ, σ2), então,

(n − 1)S2

σ2 ∼ χ

2 n−1

(96)

Exemplo

Vinte e quatro animais com deficiencia de vitamina D foram dividos em dois grupos de mesmo tamanho. O grupo 1 foi recebeu uma dieta que fornecia vitamina D enquanto que o grupo dois não tinha em sua dieta vitamina D. Ao final do período do experimento foram determinados os níveis de cálcio sérico obtendo os seguintes

resultados:

Grupo X (mg/100ml) S

1 11,1 1,5

2 7,8 2.0

Assuma que as populações são normais e as variancias são iguais a σ2 = 2, 56. Verifique se e razoável que as variancias σ₁2 e σ2₂ sejam iguais a 2,56.

(97)

Exemplo

Visto que, 11 × Si σ2 i ∼ χ2₁₁ então, como s₁2 = 1, 52< 2, 56 então P S₁2 ≤ 1, 52 = P χ2₁₁≤ 11 × 1, 5 2 2, 56 = P(χ2₁₁≤ 9, 667969) = 0, 4395 e como s2 2 = 22 > 2, 56 então P S₂2≥ 22 = P χ2₁₁≥ 11 × 4 2, 56 = P(χ2₁₁≥ 17, 1875) = 0, 1025

(98)

Distribuição Amostral da razão de Variâncias

Sejam X11, . . . , X1n1 e X21, . . . , X2n2 amostras das variáveis

aleatórias X1 ∼ N(µ1, σ21) e X2∼ N(µ2, σ22) então, U = (n1− 1)S 2 1 σ₁2 ∼ χ 2 n1−1 e V = (n2− 1)S2 2 σ₂2 ∼ χ 2 n2−1 logo, U n1−1 V n2−1 = S2 1 σ2 1 S2 2 σ2 2 ∼ F_n₁−1,n1−1 Observação

É usual fazer a razão da maior variância sobre a menor, entretanto veremos adiante no exemplo que não faz diferença.

(99)

Exemplo

Vinte e quatro animais com deficiencia de vitamina D foram dividos em dois grupos de mesmo tamanho. O grupo 1 foi recebeu uma dieta que fornecia vitamina D enquanto que o grupo dois não tinha em sua dieta vitamina D. Ao final do período do experimento foram determinados os níveis de cálcio sérico obtendo os seguintes

resultados:

Grupo X (mg/100ml) S

1 11,1 1,5

2 7,8 2.0

Assuma que as populações são normais. Verifique se é razoável que as variancias sejam iguais?

(100)

Exemplo

Visto que, S2 1 σ2 S2 2 σ2 = S 2 1 S2 2 ∼ F12−1,12−1

então, como S₁2 = 1.52 < 22 = S₂2, isto é, tem-se que P F11,11≤ 1.52 22 = 0, 1771

ou, suponha agora que S2

1 = 22> 1.52 = S22, assim P F11,11≥ 22 1, 52 = 0, 1771

(101)

Intervalo de Confiança

Um intervalo de confiança é um intervalo de valores utilizado para estimar o verdadeiro valor de um parâmetro populacional (θ).

Definição

Seja X = (X1, . . . , Xn) uma amostra aleatória da variável X ∼ F e c1(X) e c2(X) estatísticas tais que,

P(c1(X) < θ < c2(X)) = 1 − α, 0 < α < 1

Então o intervalo aleatório c1(X), c2(X) chama-se Intervalo de

(102)

Intervalo de Confiança

De um modo geral, estamos interessados em encontrar um intervalo da forma bθ − E ; bθ + E, em que θ é o estimador de um parâmetrob de interesse θ e E é a margem de erro ou erro de precisão.

Todo intervalo de confiança está associado a um nível de confiança 100(1 − α)% que é a probabilidade de que o intervalo contenha o verdadeiro valor do parâmetro, isto é,

Pbθ − E < θ < bθ + E

= 1 − α, 0 < α < 1 Logo, α será a probabilidade de que o intervalo não contenha o verdadeiro valor do parâmetro.

(103)

Intervalo de Confiança

Em cada caso há o interesse de se construir um uma região de estimação ótima, isto é, fixado um nível de confiança, desejamos encontrar um intervalo que tenha a menor amplitude possível. Observando um grande número de amostras de tamanho n e seus correspondentes intervalos espera-se que em média uma proporção 100(1 − α)% desses intervalos contenham o verdadeiro valor do parâmetro.

Notação: IC θ ; (1 − α)% = c1(X) , c2(X)

(104)

Intervalo de Confiança para a Média - Caso 1 - Variância

conhecida

Suposições:

1 X = (X_{1, . . . , Xn) uma amostra iid(independente e}

identicamente distribuída);

2 população com distribuição normal com média µ e Variância

σ2 conhecida; ou uma amostra grande n ≥ 30 com Variância

σ2 conhecida ou não, aí nesse caso substitui-se σ2 por S2. Nessas condições, segue que,

X − µ σ √ n

∼ N(0, 1)

(105)

Intervalo de Confiança para a Média - Caso 1 - Variância

conhecida

Deste modo, a margem de erro é dada por,

E = zα 2 σ √ n logo, IC µ ; (1 − α)% = X − zα 2 σ √ n; X + zα2 σ √ n

(106)

Intervalo de Confiança para a Média - Caso 2 - Variância

Desconhecida

Suposições:

σ2 desconhecida; Nessas condições, segue que,

X − µ S √ n

∼ tn−1

(107)

Intervalo de Confiança para a Média - Caso 2 - Variância

Desconhecida

Deste modo, a margem de erro é dada por, E = t(n−1 ,α 2) S √ n logo, IC µ ; (1 − α)% = X − t(n−1 ,α₂) S √ n; X + t(n−1 ,α2) S √ n

(108)

Intervalo de Confiança para a diferença de Médias Caso 1

-Variâncias conhecidas

Suposições:

1 X₁ _{= (X11, . . . , X1n}

1) e X2 = (X21, . . . , X2n2) amostras

iid(independente e identicamente distribuída) provenientes de populações independentes;

2 populações com distribuição normal, com médias µ₁ e µ₂ e

Variâncias σ2

1 e σ22 conhecidas; ou amostras grandes n ≥ 30 com Variâncias conhecidas ou não.

Nessas condições, segue que,

(X1− X2) − (µ1− µ2) q σ2 1 n1 + σ2 2 n2 ∼ N (0, 1) ;

(109)

Intervalo de Confiança para a diferença de Médias Caso 1

-Variâncias conhecidas

E = zα 2 s σ2₁ n1 +σ 2 2 n2

Logo, o intervalo de confiança IC µ1− µ2; (1 − α)% é dado por,  (X1− X2) − zα 2 s σ2 1 n1 +σ 2 2 n2 , (X1− X2) + zα 2 s σ2 1 n1 +σ 2 2 n2  

(110)

Intervalo de Confiança para a diferença de Médias Caso 2

-Variâncias desconhecidas e iguais

Suposições:

1 X₁ = (X₁₁, . . . , X_1n

1) e X2 = (X21, . . . , X2n2) amostras

Variâncias σ₁2 e σ₂2 desconhecidas e iguais.

(111)

Intervalo de Confiança para a diferença de Médias Caso 2

-Variâncias desconhecidas e iguais

(X1− X2) − (µ1− µ2) q S2 p n1 + S2 p n2 ∼ tn1+n2−2 em que, S_p2 = (n1− 1)S 2 1 + (n2− 1)S22 n1+ n2− 2

(112)

Intervalo de Confiança para a diferença de Médias Caso 2

-Variâncias desconhecidas e iguais

A margem de erro é dada por,

E = tn1+n2−2,α₂ s S2 p n1 +S 2 p n2 logo, IC µ1− µ2; (1 − α)% = (X1− X2) − E , (X1− X2) + E

(113)

Intervalo de Confiança para a diferença de Médias Caso 3

-Variâncias desconhecidas e diferentes

Quando não é possivel concluir que as variancias são iguais então, (X1− X2) − (µ1− µ2) q S2 1 n1 + S2 2 n2

não tem distribuição tn1+n2−2. A solução proposta por Cochran

consiste em calcular, t0α 2 = w1tn1−1,α₂ + w2tn2−1,α₂ w1+ w2 em que wi = Si2 ni .

(114)

Intervalo de Confiança para a diferença de Médias Caso 3

-Variâncias desconhecidas e diferentes

E = t0α 2 s S2 1 n1 + S 2 2 n2

Assim, o intervalo de confiança IC µ1− µ2; (1 − α)% é dado por,  (X1− X2) − t 0 α 2 s S2 1 n1 + S 2 2 n2 , (X1− X2) + t 0 α 2 s S2 1 n1 +S 2 2 n2  

(115)

Intervalo de Confiança para a Proporção

Seja uma amostra aleatória (X1, . . . , Xn) de Xi ∼ ber (p). Então, pelo TCL segue que a margem de erro aproximada é dada por,

E = zα 2 r b p(1 −_bp) n Logo, IC p ; (1 − α)% = _bp − zα 2 r b p(1 −_bp) n ;bp + zα₂ r b p(1 −_bp) n !

(116)

Intervalo de Confiança para a diferença de Proporções

Seja X11, . . . , X1n1 e X21, . . . , X2n2, amostras das variáveis

aleatórias X1 ∼ ber (p1) e X2∼ ber (p2), então pelo Teorema Central do Limite, segue que, para n grande, a margem de erro aproximada é dada por,

E = zα 2 s b p1(1 −bp1) n1 +bp2(1 −bp2) n2 logo, IC p1− p2; (1 − α)% = ((bp1−pb2) − E ; (bp1−bp2) + E )

(117)

Intervalo de Confiança para a Variância

Suposições: Suposições:

σ2.

Nessas condições segue que, (n − 1)S2

σ2 ∼ χ

2 n−1

(118)

Intervalo de Confiança para a Variância

Logo, χ2_n−1,α 2 < (n − 1)S2 σ2 < χ 2 n−1,1−α₂ portanto, (n − 1)S2 χ2_n−1,α 2 > σ2> (n − 1)S 2 χ2_n−1,1−α 2

Assim, um IC σ2_{; (1 − α) é dado por,}

(n − 1)S2 χ2_n−1,1−α 2 , (n − 1)S 2 χ2_n−1,α 2 !

(119)

Intervalo de Confiança para a razão de Variâncias

Suposições:

1 X₁ = (X₁₁, . . . , X_1n

1) e X2 = (X21, . . . , X2n2) amostras

Variâncias σ2 1 e σ22.

(120)

Intervalo de Confiança para a razão de Variâncias

S2 1 σ21 S2 2 σ2 2 ∼ Fn1−1,n1−1 logo, IC σ 2 1 σ2 2 ; (1 − α) =   S12 S2 2 F_n₁−1,n2−1,1−α₂ , S12 S2 2 F_n₁−1,n2−1,α₂  

(121)

Motivação

Um Jornal na Cidade St. Paul, Mineápolis, o Star Tribune

patrocinou uma pesquisa destinada a revelar as opiniões sobre o uso de câmeras fotográficas para flagrar os motoristas que passam o sinal vermelho e depois são notificados pelo correio sobre a infração cometida. Os pesquisadores entrevistaram 829 adultos de

Minnesota, e verificaram que 51% se opunham à essa nova legislação que aprovará o uso dessas câmeras.

Baseado nessas informações, podemos concluir que há evidência amostral suficiente para apoiar a afirmativa que a maioria de todos os adultos de Minnesota, isto é, p > 0, 5 são contra a nova

(122)

Visão Geral

O objetivo de um teste de hipótese é fornecer uma

metodologia(procedimento) que nos permita verificar se os dados amostrais trazem evidências que apóiem ou não uma hipótese estatística formulada. Assim sendo, a formulação de um teste de hipótese estatístico inicia-se com a afirmação de uma hipótese estatística.

Definição (Hipótese Estatística)

É usualmente uma conjectura a respeito de um parâmetro populacional.

Para cada situação existem dois tipos de hipótese estatística: a

hipótese nula denotada por H0 e a hipótese alternativa denotada

por H1

(123)

Regra do evento raro

Se sob uma dada suposição, a probabilidade de um evento observado for excepcionalmente pequena, concluímos que a suposição provavel-mente não é verdadeira.

Guiados por esta regra, iremos por a prova as hipóteses estatisticas formuladas e decidir se os dados amostrais podem facilmente ocorrer por acaso ou são altamente improváveis de ocorrer por acaso.

(124)

Teste Paramétrico ou Teste Não Paramétrico

Teste Paramétrico: Exige suposições sobre a distribuição de

probabilidade das variáveis de interesse.

Teste Não Paramétrico: Não exige suposições sobre a

distribuição de probabilidade das variáveis de interesse. Por este motivo são em geral chamados de testes livres de distribuição.

Principal vantagem do teste Não Paramétrico: Podem ser

aplicados a uma maior variedade de situações, pois possuem suposições mais fracas que os testes Paramétricos;

Principal desvantagem do teste Não Paramétrico: São menos

eficientes que os testes Paramétricos, pois para uma dada situação em que as suposições do teste Paramétrico são satisfeitas, um teste Não Paramétrico equivalente precisaria de uma amostra maior para ter um erro tipo I e tipo II equivalentes ao do método Paramétrico.

(125)

Hipótese Nula e Alternativa

Hipótese Média Proporção Variância

Nula(H0) µ1= µ2 p1 = p2 σ12= σ22 Alternativa(H1) µ16= µ2 p1 6= p2 σ₁26= σ₂2 Nula(H0) µ1≤ µ2 p1 ≤ p2 σ12≤ σ22 Alternativa(H1) µ1> µ2 p1 > p2 σ12> σ12 Nula(H0) µ1≥ µ2 p1 ≥ p2 σ12≥ σ22 Alternativa(H1) µ1< µ2 p1 < p2 σ12< σ12

(126)

Resultados em um Teste de Hipótese

Em um teste de hipótese, existem apenas quatro resultados possíveis:

H0 é verdadeira H0 é falsa

Rejeitar H0 Erro tipo I Decisão correta

Não Rejeitar H0 Decisão correta Erro tipo II

(127)

Estatística do Teste

É um valor calculado a partir dos dados amostrais e é usada para se tomar a decisão sobre a rejeição da hipótese nula.

Note que como seu valor depende da amostra, então pode-se concluir que ela é uma variável aleatória, logo possui distribuição de probabilidade.

Será essa distribuição de probabilidade que utilizaremos para tomar a decisão de rejeitar ou não a hipótese H0.

(128)

Nível de significância e Beta do Teste

Nível de significância: É a probabilidade de se cometer o erro

tipo I, é denotado por α, isto é,

P(Erro tipo I) = α = P(Rejeitar H0|H0 é verdadeira).

Beta do Teste: É a probabilidade de não rejeitar H0 quando ela é

falsa, isto é,

β = P(Erro tipo II) = P(Não Rejeitar H0|H0 é falsa)

(129)

Poder do teste e p-valor

Poder do teste: É a probabilidade de rejeitar H0 quando ela é

falsa, esta probabilidade é o complentar da probabilidade de se cometer o erro tipo II, isto é,

Poder do Teste = 1 − P(Não Rejeitar H0|H0 é falsa) = P(Rejeitar H0|H0 é falsa).

Nível descritivo ou p-valor do teste: É a probabilidade de

ocorrer valores da Estatística do teste, mais extremos que o valor observado, sob a hipótese que H0 é verdadeira.

(130)

Cálculo do p-valor

Seja X = (X1, . . . , Xn) uma amostra aleatória de tamanho n, T (X) uma estatística que possui uma distribuição de probabilidade P e T (x) o valor da estatística dado os valores observados

x = (x1, . . . , xn. Uma maneira prática de se determinar o evento que se deseja calcular, para o caso de duas amostras, é o seguinte: Seja bθ1 e bθ2 os estimadores dos parâmetros θ1 e θ2, então:

1 Se b_θ1_{> b}_θ2 tem-se que p-valor = PT (X) > T (x) H0 é verdadeira ; 2 Se bθ1< bθ2 tem-se que p-valor = PT (X) < T (x) H0 é verdadeira

(131)

Cálculo do p-valor - Exemplo

Exemplo 1: Considere que T (X) ∼ N(0, 1), bθ1 < bθ2 e

T (x) = −1, 25 então da tabela da distribuição Normal tem-se que: p-valor = PT (X) < −1, 25= 0, 1056;

Exemplo 2: Considere que T (X) ∼ t11, bθ1 > bθ2 e T (x) = 1, 363 então da tabela da distribuição t tem-se que:

p-valor = PT (X) > 1, 363= 0, 10; Exemplo 3: Considere que T (X) ∼ F7, 10, bθ1> bθ2 e

T (x) = 3, 9498 então da tabela da distribuição F tem-se que: p-valor = PT (X) > 3, 9498= 0, 025.

(132)

Região Crítica para Estatística com distribuição Normal

É o conjunto de valores da Estatística do teste para o qual a hipótese deve ser rejeitada, também chamada de região de rejeição. A região crítica dependerá da hipótese alternativa e da distribuição de probabilidade de cada Estatística.

Distribuição de probabilidade da Estatística: Z ∼ N(0, 1)

Hipótese Região Crítica

H1: θ1 6= θ2 −∞, −zα 2 i ∪hzα 2, ∞ H1: θ1 > θ2 [zα, ∞) H1: θ1 < θ2 (−∞, −zα]

(133)

Região Crítica para Estatística com distribuição t

Distribuição de probabilidade da Estatística: T ∼ tν

H1 : θ16= θ2 −∞, −t_ν,α 2 i ∪ht_ν,α 2, ∞ H1 : θ1> θ2 [tν,α, ∞) H1 : θ1< θ2 (−∞, −tν,α]

(134)

Região Crítica para Estatística com distribuição χ

2

Distribuição de probabilidade da Estatística: χ2 ∼ χ2_ν

H1: θ1 6= θ2 0, χ2 ν,α₂ i ∪hχ2_ν,α 2, ∞ H1: θ1 > θ2 χ2ν,α, ∞ H1: θ1 < θ2 0, χ2_ν,α

(135)

Região Crítica para Estatística com distribuição F

Distribuição de probabilidade da Estatística: F ∼ Fν1,ν2

H1: θ1 6= θ2 0, F_ν₁_,ν₂_,α 2 i ∪hF_ν₁_,ν₂_,α 2, ∞ H1: θ1 > θ2 [Fν1,ν2,α, ∞) H1: θ1 < θ2 (0, Fν1,ν2,α]

(136)

Critério de Decisão

Seja X = (X1, . . . , Xn) uma amostra aleatória de tamanho n e T (X) uma estatística, então o critério de decisão é:

1 Utilizando a Região Crítica: Se T (X) ∈ RC rejeita-se a

hipótese H0, caso contrário não rejeita-se a hipótese H0;

2 Utilizando p-valor: Se p-valor≤ α rejeita-se a hipótese H₀,

caso contrário não rejeita-se a hipótese H0. Esta é a regra do evento raro.

(137)

Comparação de Médias - Duas populações independentes

Estatística do Teste: Estatística: Z = _qX1− X2 σ21 n1 + σ22 n2 ∼ N(0, 1)

Suposição: Populações Normais e Variâncias Conhecidas

Estatística: Z = qX1− X2 S2 1 n1 + S2 2 n2 ∼ N(0, 1)

(138)

Exemplo

Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição Normal:

Amostra 1 Amostra 2

n1= 8 n2 = 7

X1= 104 X2 = 106

σ1 = 8, 4 σ2= 7, 6

Qual o valor da Estatística do Teste? E o p-valor?

(139)

Exemplo

Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição desconhecida:

Amostra 1 Amostra 2

n1= 80 n2 = 70

X1= 104 X2 = 106

S1 = 8, 4 S2= 7, 6

(140)

Componentes de um Teste de Hipótese: Estatística do Teste

Comparação de Médias - Duas populações independentes

Estatística: T = _qX1− X2 S2 p n1 + S2 p n2 ∼ tn1+n2−2 em que, S_p2 = (n1− 1)S 2 1 + (n2− 1)S22 n1+ n2− 2

Suposição: Populações Normais e Variâncias Desconhecidas e

iguais

(141)

Teste de Hipótese para comparação de Médias

Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição Normal e variâncias desconhecidas e iguais:

Amostra 1 Amostra 2

n1= 8 n2 = 7

X1= 104 X2 = 106

S1 = 8, 4 S2= 7, 6

(142)

Comparação de Médias - Duas populações independentes

Estatística: T0 = qX1− X2 S2 1 n1 + S2 2 n2 Distribuição Desconhecida

Suposição: Populações Normais e Variâncias Desconhecidas e

diferentes

O problema dessa estatística é o desconhecimento de sua distribuição. Várias metodologias foram propostas para se determinar o p-valor e os quantis dessa estatística.

(143)

Comparação de Médias - Duas populações independentes

Cochran and Cox (1957) propôs uma metodologia para calcular aproximadamente o valor crítico da estatística,

t_α0 = tn1−1,α S2 1 n1 + tn2−1,α S2 2 n2 S2 1 n1 + S2 2 n2 (2)

Note que desta maneira o valor crítico é uma valor entre tn1−1,α e

tn2−1,α. A maneira mais simples de se determinar o p-valor e os

quantis dessa estatística é assumir que T0 ∼ t_min(n₁−1, n2−1), isto é,

considerar a pior situação. Nessas condições a hipótese H0 precisará de mais evidencias para ser rejeitada que a condição proposta por Cochran and Cox (1957).

(144)

Teste de Hipótese para comparação de Médias

Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição Normal e variâncias desconhecidas e diferentes:

Amostra 1 Amostra 2

n1= 8 n2 = 7

X1= 104 X2 = 106

S1 = 8, 4 S2= 7, 6

Qual o valor da Estatística do Teste?

(145)

Comparação de Médias - Duas populações dependentes

Este teste é conhecido também como teste para amostras

emparelhadas. Estatística: T = _SD D √ n ∼ t_n−1 em que, Di = X1i − X2i; D = Pn i =1Di n e S 2 D = Pn i =1(Di − D)2 n − 1

Suposição: Populações normais. Se essa suposição não for

verdadeira, mas a amostra for maior que 30 então a estatística será a Z ∼ N(0, 1).

(146)

Teste de Hipótese para comparação de Médias

Considere os seguintes resultados, referentes a duas amostras aleatórias emparelhadas, de populações com distribuição Normal:

Amostra 1 Amostra 2 Di = X1i − X2i 6,0 5,4 0,60 5,0 5,2 -0,20 7,0 6,5 0,50 6,2 5,9 0,30 6,0 6,0 0,00 6,4 5,8 0,60

(147)

Teste de Hipótese para comparação de Médias

Assim, calculando as estimativas dos parâmetros, D = 0, 60 + (−0, 20) + . . . + 0, 60 6 = 1, 8 6 = 0, 30 S_D2 = (0, 60 − 0, 30) 2_{+ . . . + (0, 60 − 0, 30)}2 5 − 1 = 0, 56 5 = 0, 112 logo, SD = √ 0, 112 = 0, 335

(148)

Componentes de um Teste de Hipótese: Estatística do Teste

Comparação de Variâncias - Duas populações independentes

Suposição: Populações normais.

Estatística: F = S 2 1 S2 2 ∼ Fn1−1,n2−1 Exemplo

Considere as seguintes informações: n1 = 8, n2 = 7, S1 = 8, 4 e S2= 7, 6. Sendo assim, a estatística do teste é dada por,

F = 8, 4

7, 6 ≈ 1, 11

(149)

Comparação de proporções - Duas populações independentes

Suposição: Amostras grandes. Nesse caso,

n1× p1(1 − p1) ≥ 5 e n2× p2(1 − p2) ≥ 5

Como p1 e p2 não são conhecidos utilizar suas estimativasbp1 e bp2.

Estatística: Z = bp1−bp2 q p(1−p) n1 + p(1−p) n2 ∼ N(0, 1) em que, b p1= x1 n1 ,bp1 = x2 n2 e p = x1+ x2 n1+ n2

(150)

Comparação de proporções - Duas populações independentes

Considere os seguintes resultados, referentes a duas amostras aleatórias: Deseja-se testar a hipótese que motoristas negros são parados pela polícia em proporção maior que motoristas brancos. Assim, realizou-se um experimento em que 1.600 motoristas foram selecionados, 200 negros e 1400 brancos, as seguintes informações foram coletadas:

n1 = 200, x1 = 24; n2 = 1400, x2 = 147 Qual o valor da Estatística do Teste?