Modelos de Probabilidade e Inferencia Estatística
Ulisses U. dos AnjosDepartamento de Estatística Universidade Federal da Paraíba
Sumário
1 Objetivos e Bibliografia
2 Introdução
3 Conceitos de Probabilidade
Propriedades de uma medida de probabilidade Probabilidade Condicional
Testes Diagnósticos
4 Variável Aleatória
Distribuições de Probabilidade para Variáveis Aleatórias Discretas
Distribuições de Probabilidade para Variáveis Aleatórias Contínuas
5 Conceitos básicos de amostragem
Tipos de estudos Tipos de Amostragem
Principais planos de amostragem probabilística
6 Distrbuições Amostrais Média Proporção Variância 7 Intervalo de Confiança Média Proporção Variância 8 Teste de Hipótese Visão Geral
Componentes de um Teste de Hipótese Testes Paramétricos
Teste para Média Teste para Variância Teste para Proporção
Objetivos
Revisar, aprofundar e ampliar os conceitos de probabilidade e inferência estatística dos mestrandos, visando sua utilização nas dissertações e servindo como base para outras disciplinas do programa.
Bibliografia
DANIEL, w. w. Biostatics: A Foundation for Analysis in the Health Sciences. 9o Ed.. Wiley, 2009.
TRIOLA, M. F. Introdução à Estatística. Livros Técnicos e Científicos Editora, 2005.
ARANGO, H. G. Bioestatística: teórica e computacional. 2a
edição. Rio de Janeiro: Guanabara Koogan, 2005.
Objetivo da Probabilidade
Fornecer o arcabouço teórico para o estudo dos fenômenos ou experimentos aleatórios.
Criar modelos teóricos que reproduzam de maneira razoável a distribuição de freqüências dos fenômenos ou experimentos aleatórios. Tais modelos são chamados modelos probabilísticos.
Experimento aleatório
Definição: Um experimento que pode fornecer diferentes
resultados, muito embora seja repetido toda vez da mesma maneira, é chamado experimento aleatório.
Característica de um experimento aleatório:
Imprevisibilidade: o resultado do experimento não pode ser conhecido a priori, mesmo se repetido sobre iguais condições;
Espaço amostral e evento
Espaço amostral: é o conjunto de todos os resutados de um
experimento aleatório. Notação: Ω
Evento: É um subconjunto do espaço amostral;
Os subconjuntos de Ω serão denotados por letras latinas maiúsculas (A,B,C,. . . );
Diz-se que "‘ocorre o evento A"’ quando o resultado do experimento aleatório for um elemento de A;
O espaço amostral Ω e o conjunto vazio ∅ também são eventos, em que Ω é o evento certo e ∅ é o evento impossível.
Operações básicas entre conjuntos
A ∪ B =ω ∈ Ω : ω ∈ A ou ω ∈ B ou ω ∈ A, ω ∈ B , é a
união de A e B;
Exemplo
Suponha que iremos sortear de uma lista de casais que se casaram há 30 anos atrás e verificar quais deles estão vivos. Considere os seguintes eventos: A =A mulher estar viva e B =O homem estar vivo. Então o evento pelo menos um estar vivo é dado por A ∪ B
A ∩ B =ω ∈ Ω : ω ∈ A, ω ∈ B , é a intersecção de A e B;
Operações básicas entre conjuntos
Exemplo
Considerando o exemplo anterior, então o evento ambos estarem vivos é dado por A ∩ B.
Ac =ω ∈ Ω : ω /∈ A , deste modo segue que Ac = Ω − A é
o complementar de A, do mesmo modo Bc = Ω − B é o
complementar de B;
Exemplo
Considerando o exemplo anterior, então o evento o homem estar vivo pode ser representado por Ac, logo nesse caso específico B = Ac e A = Bc.
A − B =ω ∈ Ω : ω ∈ A, ω /∈ B , deste modo segue que
A − B = A ∩ Bc é a diferença entre A e B;
Exemplo
Considerando o exemplo anterior, então o evento apenas a mulher estar viva é dado por A − B. Do mesmo modo, o evento apenas o
Operações básicas entre conjuntos
A∆B =ω ∈ Ω : ω ∈ A, ω /∈ B ou ω /∈ A, ω ∈ B , deste
modo segue que A∆B = (A ∩ Bc) ∪ (Ac∩ B) é a diferença
simétrica entre A e B;
Exemplo
Considerando o exemplo anterior, então o evento somente o homem ou a mulher estar vivo pode ser representado por A∆B.
A e B são disjuntos(mutuamente exclusivos) se e somente se A ∩ B = ∅;
Exemplo
Considerando o exemplo anterior, então os eventos A e B não são disjuntos pois ambos podem estar vivos.
Partição de um evento
Seja A um subconjunto de Ω. Então A1, . . . , An formam uma
partição de A se e somente se Ai ∩ Aj = ∅ para todo i 6= j e ∪n
i =1Ai = A.
Deste modo, se A = Ω então A1, . . . , An formam uma partição
de Ω se e somente se Ai ∩ Aj = ∅ para todo i 6= j e ∪n
Leis de De Morgan
Sejam A1, . . . , An tal que Ai ⊂ Ω para todo i, então: (i) (∪ni =1Ai)c = ∩ni =1Aci.
Interpretação: o complementar da ocorrência de pelo menos
um dos eventos é a não ocorrência de todos os eventos; (ii) (∩ni =1Ai)c = ∪ni =1Aci.
Interpretação: o complementar da ocorrência de todos os
eventos é a não ocorrência de pelo menos um dos eventos.
Função indicadora
Seja A ⊂ Ω, então IA(ω) = ( 1 se ω ∈ A 0 se ω /∈ Aσ-Álgebra
Uma classe F de subconjuntos de Ω é denominada uma σ-álgebra se ela satisfaz:
(F1) Ω ∈ F ;
(F2) Se A ∈ F então Ac ∈ A;
(F3) Se Ai ∈ F para todo i ≥ 1 entãoS∞i =1Ai ∈ F ;
Definição Clássica de Probabilidade
Seja (Ω, F ) um espaço finito de eventos equiprováveis. Assim, para todo A ∈ F tem-se que,
P(A) = #A
#Ω
em que # é o número de elementos do conjunto.
Exemplo
Considere o experimento aleatório de lançar duas moedas. Nesse caso o espaço amostral é dado por
Ω =(c, c), (c, r ), (r , c), (r , r ) . Seja A=Obtenção de faces iguais. Portanto, A =(c, c), (r , r ) . Deste modo,
Definição frequentista de Probabilidade
Seja Ω um espaço amostral de um experimento aleatório. Seja n
repetições independentes de um experimento aleatório e nA o
número de ocorrências do evento A ⊂ Ω. Então, a probabilidade de A é dada por, P(A) = lim n→∞ nA n = p Observação
A lei dos grandes números garante a convergência sobre certas condições do limite acima, em que 0 ≤ p ≤ 1.
Definição axiomática de Probabilidade
Seja (Ω, F ) um espaço mensurável. Então uma função P : F → [0, 1] é uma probabilidade se,
(P1) P(Ω) = 1;
(P2) Para todo A ∈ F tem-se P(A) ≥ 0;
(P3) P é σ-aditiva, isto é, se A1, A2, . . . , são dois a dois disjuntos então, P ∞ [ n=1 An ! = ∞ X n=1 P(An). em que S∞n=1An = A1∪ A2∪· · ·. Observação
Note que de um modo geral a medida de probabilidade P não precisa assinalar uma probabilidade para todo evento em Ω, mas apenas para os eventos em F . A trinca (Ω, ∈ F , P) é denominado
Propriedades
Seja (Ω, F , P), então para todo A ∈ F e B ∈ F , tem-se que:
P(Ac) = 1 − P(A);
P(∅) = 0;
P é uma função não decrescente, isto é, para todo A, B ∈ F tal que A ⊆ B tem-se que P(A) ≤ P(B);
Para todo A, B ∈ F tal que A ⊆ B tem-se que P(B − A) = P(B) − P(A);
Para todo A, B ∈ F arbitrários tem-se que:
P(A − B) = P(A) − P(A ∩ B) e P(B − A) = P(B) − P(A ∩ B).
Propriedades
Para todo A ∈ F tem-se que 0 ≤ P(A) ≤ 1; Para todo A, B ∈ F arbitrários tem-se que:
ARANGO, Exemplo 5.5, P. 144
Considere os dados abaixo que mostram 15 indivíduos classificados quanto às variáveis obesidade e sedentarismo.
Indivíduo 1 2 3 4 5 6 7 8 9 10 Obesidade n n s n s s n n n s Sedentarismo s n s s n s n s s s Indivíduo 11 12 13 14 15 Obesidade n n s n n Sedentarismo n n s n s
ARANGO, Exemplo 5.5, P. 144
Considere os seguintes eventos: A=indivíduo obeso e B= indivíduo sedentário. Supondo que essa amostra e representativa da
população de estudo, calcule(estime) a probabilidade de:
O indivíduo ser obeso;Tabela
O indivíduo ser sedentário;Tabela
O indivíduo ser obeso e sedentário;Tabela
O indivíduo ser obeso ou sedentário;Tabela
Problema
Seja (Ω, F , P) o espaço de probabilidade para um determinado experimento aleatório. Suponha que tenhamos a priori alguma informação a respeito do resultado do experimento aleatório. No exemplo anterior, suponha que um indivíduo é sorteado
aleatoriamente e que recebemos a informação que o indíviduo é obeso. Nessas condições qual a probabilidade do indívíduo ser
sedentário? Tabela
Definição
Seja (Ω, F , P) um espaço de probabilidade. Seja B ∈ F um evento tal que P(B) > 0. Então a probabilidade condicional, dado o evento B, é uma função denotada por P(.|B) e definida para todo A ∈ F como segue,
P(A|B) = P(A ∩ B)
P(B) . (1)
em que P(A|B) é chamada a probabilidade condicional de A dado B.
Testes Diagnósticos
São testes que tem como objetivo identificar um evento de interesse.
Medidas para avaliar um teste: Sensibilidade(s), Especificidade(e), Valor Preditivo Positivo(VPP), Valor Preditivo Negativo(VPN), Falso Positivo(FP) e Falso Negativo(FN).
Avaliação do Teste
Resultado do Teste
Positivo Negativo
Ocorrência do Evento Sim a b
Não c d
Consideremos os seguintes eventos: D+=Ocorrência do evento de interesse; D−=Não ocorrência do evento de interesse; T+=Teste positivo;
Sensibilidade e Especificidade
Sensibilidade(s): É a probabilidade do teste dar positivo dado que ocorreu o evento de interesse, isto é,
s = P(T+|D+) =
P(T+∩ D+)
P(D+) =
a a + b Especificidade(e): É a probabilidade do teste dar negativo dado que não ocorreu o evento de interesse, isto é,
s = P(T−|D−) = P(T−∩ D−)
P(D−) =
d c + d
Sensibilidade e Especificidade
Valor Preditivo Positivo(VPP): É a probabilidade do evento de interesse ocorrer dado que o teste deu positivo, isto é,
VPP = P(D+|T+) =
P(T+∩ D+)
P(T+) =
p × s
p × s + (1 − p) × (1 − e)
em que p = P(D+) é a prevalência do evento de interesse;
Valor Preditivo Negativo(VPN): É a probabilidade do evento de interesse não ocorrer dado que o teste deu negativo, isto é,
VPN = P(D−|T−) =
P(T−∩ D−)
P(T−) =
(1 − p) × e p × (1 − s) + (1 − p) × e
Regra do Produto
Sejam A e B eventos em F tal que,
P(A) > 0 e P(B) > 0 então,
P(A ∩ B) = P(A)P(B|A) = P(B)P(A|B).
Exemplo
Considerando o Exemplo 5.5, ARANGO, calcule a probabilidade do indivíduo ser obeso e sedentário utilizando a regra do produto.
Tabela
Probabilidade Total
Sejam {Ai, i = 1, . . . , n} uma partição de Ω com P(Ai) > 0 para todo i = 1, . . . , n. Então, para todo B ∈ F tem-se que,
P(B) = n X i =1 P(Ai)P(B|Ai). Exemplo
Considerando o Exemplo 5.5, ARANGO, calcule a probabilidade do B =indivíduo ser obeso, considerando a partição A =o indivíduo é sedentário e Ac =o indivíduo não é sedentário.Tabela
Teorema de Bayes
Seja {Ai, i = 1, . . . , n} uma partição de Ω com P(Ai) > 0 para todo i = 1, . . . , n. Então, para todo B ∈ F para o qual P(B) > 0 tem-se que, P(Aj|B) = P(Aj)P(B|Aj) Pn i =1P(Ai)P(B|Ai) Exemplo
Considerando o Exemplo 5.5, ARANGO, calcule a probabilidade do indivíduo não ser sedentário dado que B =indivíduo é obeso,
considerando a partição A =o indivíduo é sedentário e Ac =o
indivíduo não é sedentário.Tabela
Definição
É uma função X : Ω → R que associa a cada elemento do espaço amostral um valor na reta(um valor numérico). Assim, para cada ω ∈ Ω tem-se que X (ω) = x ∈ R.
Observação
A função X deve ser unívoca, isto é, para cada ω ∈ Ω deve haver apenas um X (ω) associado. Entretanto, diferentes valores de ω podem levar a um mesmo valor de X .
Variável Aleatória: Exemplo
Exemplo
Considere o procedimento de selecionar uma amostra de uma população U de tamanho N. Considere a variável X=altura, assim por exemplo, X (ω1) = 1, 79, X (ω17) = 1, 98 em que ω1 e ω17são o primeiro e o décimo sétimo elemento da amostra.
Tipos de Variáveis Aleatórias
Discreta: Uma variável aleatória X é discreta se o número de valores que X possa assumir for enumerável. Ex: Altura, peso, etc.
Contínua: Uma variável aleatória X é contínua se o número de valores que X possa assumir for não enumerável. Ex: número de filhos, faixa etária, etc.
Variável Aleatória: Distribuição de Probabilidade
A distribuição de probabilidade de uma variável aleatória X discreta é uma função que atribui probabilidade a cada um dos valores xi de X , isto é,PX(xi) = P(X = xi) = P({ω ∈ Ω : X (ω) = xi}) para todo i ∈ {1, 2, . . . , n}, n ∈ N e e satisfaz as condições: (i) 0 ≤ P(X = xi) ≤ 1 e (ii)Pni =1P(X = xi) = 1. Esta função é denominada Função de Probabilidade ou Função Massa de Probabilidade(fmp);
A distribuição de probabilidade de uma variável aleatória X contínua é dada por,
f (x) = dF (x) dx
para todo x ∈ R e satisfaz as condições: (i) f (x) ≥ 0 para todo x ∈ R; e (ii)R∞
−∞f (x)dx = 1. Esta função é denominada
Função Densdidade de Probabilidade(fdp).
Variável Aleatória: Função de Distribuição
Seja X uma variável aleatória, então sua função de distribuição é definida como,
F (x) = P(X ≤ x).
F é também conhecida como função de distribuição acumulada de X . Caso discreto: F (x) =P xi≤xPX(xi) = P xi≤xP(X = xi) Caso Contínuo: F (x) =Rx −∞f (t)dt
Independência de Variáveis Aleatórias
Sejam X1, . . . , Xn, n variáveis aleatórias. Então X1, . . . , Xn são independentes se: F (x1, . . . , xn) = n Y i =1 Fi(xi)
em que F é a função de distribuição acumulada conjunta de X1, . . . , Xne Fi é a função de distribuição acumulada de Xi.
Valor Esperado de uma Variável Aleatória
O valor esperado de variável aleatória X , denotado por E (X ) ou µ, é para o caso em que X é discreta,
µ = E (X ) = X
x ∈ΩX
xP(x)
e para o caso em que X é contínua µ = E (X ) =
Z ∞
−∞
Propriedades
Seja c ∈ R uma constante, então E (c) = c;
Seja h uma função uma função mensurável, então para Y = h(X ) tem-se: se X for uma variável aleatória discreta,
E (Y ) = X
x ∈ΩX
h(x)P(x)
e, se X for uma variável aleatória for contínua então, E (Y ) =
Z ∞
−∞
h(x)f (x)dx. Sejam X1, . . . , Xn n variáveis aleatória então
E n X i =1 Xi ! = n X i =1 E (Xi).
Variância de uma Variável Aleatória
A variância da variável aleatória X , denotado por Var (X ) ou σ2 é Var (X ) = E (X − E (X ))2 = E (X2) −E (X )2 . Se X for discreta, Var (X ) = X x ∈ΩX x2P(X = x) − X x ∈ΩX xP(X = x) 2 e se X for contínua Var (X ) = Z ∞ −∞ x2f (x)dx − Z ∞ −∞ xf (x)dx 2 .
Propriedades
Var (c) = 0;
Var (X ± c) = Var (X ); Var (cX ) = c2Var (X );
Sejam X1, . . . , Xn n variáveis aleatória independentes, então,
Var n X i =1 Xi ! = Var (X1) + · · · + Var (Xn)
Distribuição Binomial
Seja A um evento de interesse. Então uma variável aleatória X que conta o número de vezes que o evento A ocorre em n repetições independentes de um experimento de Bernoulli(um experimento que só possui dois resultados possíveis), possui função de probabilidade,
P(X = x) = n x px × (1 − p)n−x se x = {0, 1, 2, . . . , n} 0 caso contrário Em que p = P(A).
Distribuição Binomial
Diz-se que tal variável possui distribuição Binomial com parâmetros n e p e denota-se por:
X ∼ bin(n, p)
Tem-se para essa variável que µ = E (X ) = p e σ2 = Var (X ) = np.
Exemplo
A taxa de imunização de uma vacina é 80%. Se um grupo de 20 pessoas são vacinadas,
(a) Qual a probabilidade que 15 fiquem imunizadas?
Distribuição de Poisson
Seja X uma variável aleatória que conta o número de ocorrência de um determinado evento A por unidade (tempo, comprimento, área, volume, etc), então a função de probabilidade de X é dada por,
P(x) =
(e−λλx
x ! se x = {0, 1, . . . , }
0 caso contrário
Esta função é chamada de distribuição de Poisson. Notação: X ∼ P(λ)
Tem-se para essa variável que µ = E (X ) = σ2 = Var (X ) = λ.
Distribuição Normal
Dizemos que uma v.a. X tem distribuição normal com média µ e variância σ2 se sua função densidade de probabilidade é dada por
f (x) = √ 1 2πσ2exp −(x − µ) 2 2σ2
para todo x ∈ R, em que E (X ) = µ e Var (X ) = σ2. Notação:
Distribuição Normal: Características
Moda = mediana = média;
A função tem dois pontos de inflexão, um em x = µ − σ e outro em x = µ + σ, em que σ é o desvio padrão de X ; A curva é simétrica em torno de x = µ, isto implica que dado um a ∈ R tem-se que f (µ − a) = f (µ + a), logo
F (µ − a) = PX(X ≤ µ − a) = PX(X ≥ µ + a) = 1 − F (µ + a)
se µ = 0 então F (−a) = 1 − F (a).
Distribuição Normal
Problema: Dificuldade no cálculo de PX. Existem tabelas apenas
para X ∼ N(0, 1).
Solução: Fazendo a transformação,
Z = X − µ σ ⇒ Z ∼ N(0, 1) Assim, P(X ≤ x) = P(Z ≤ z) = P Z ≤ x − µ σ
Distribuição t-Student “Padrão”
Dizemos que uma v.a. X tem distribuição t com ν graus de liberdade se sua função densidade de probabilidade é dada por
f (x) = √1 νπ Γ ν+12 Γ ν2 1 + x 2 ν −ν+12
para todo x ∈ R. Notação: X ∼ tν. Tem-se ainda que E (X ) = 0
para ν > 1 e
Var (X ) = ν
ν − 2 para ν > 2.
Distribuição t-Student: Características
Moda = mediana = média = 0;
A curva é simétrica em torno do 0, isto implica que dado um a ∈ R tem-se que f (−a) = f (+a), logo P(≤ −a) = P(≥ a);
quando os graus de liberdade aumentam a distribuição tν se
Distribuição Qui-quadrado
Dizemos que uma v.a. X tem distribuição Qui-quadrado com ν graus de liberdade se sua função densidade de probabilidade é dada por f (x) = 1 Γ ν2 2ν2 xν2−1e− x 2
para todo x ≥ 0. Notação: X ∼ χν. Tem-se ainda que E (X ) = ν
e Var (X ) = 2ν.
Distribuição F
Dizemos que uma v.a. X tem distribuição F com ν1 e ν2 graus de
liberdade se sua função densidade de probabilidade é dada por
f (x) = Γ ν1+ν2 2 Γ ν1 2 Γ ν2 2 ν1 ν2 ν12 xν1−2 2 1 + ν1 ν2x ν1+ν22
para todo x ≥ 0. Notação: X ∼ Fν1,ν2. Tem-se ainda que
E (X ) = ν2
Objetivo
Amostragem é o procedimento utilizado na obtenção da amostra, que deve ser de tal forma que a amostra obtida seja representativa da população de interesse.
Exemplo
Quando alguém está adoçando uma xícara de café ele primeiro coloca um pouco de açucar, mistura bem e depois prova(coleta uma amostra) para verificar se precisa ou não mais açucar. Note que, o processo de mexer bem antes de provar é um
procedimento(plano) amostral intuítivo.
População ou População alvo
É o conjunto de todos os seres, objetos ou informações que estão sob investigação.
Notação: Um população de tamanho N será denotada por
U e
= (1, . . . , N).
Exemplo
Um grupo de pesquisadores desejam analisar a influência de fatores sociodemográficos, físicos e mentais sobre a mobilidade de idosos, pessoas com 60 anos ou mais, residentes no município de Santa Cruz, Rio Grande do Norte. Neste caso a população são todas as pessoas com 60 anos ou mais residentes no município de Santa Cruz.
População de estudo
É o conjunto de todos os seres, objetos ou informações que podem ser incluídas no estudo. Teoricamente, o mesmo que a população alvo, porém muitas vezes diferente.
Exemplo
No Exemplo anterior suponha que a pesquisa tenha sido realizada durante um determinado mês do ano, e que neste mês
possívelmente algumas das pessoas desta população poderiam não estar na cidade e deste modo não poderiam ser incluídas na pesquisa. Deste modo, neste caso, a população alvo é diferente da população de estudo.
Amostra
É o conjunto dos elementos selecionados de uma população.
Notação: Uma amostra de tamanho n será denotada por
s e
= k1, . . . , kn para ki ∈ U e .
Unidade amostral
São os elementos alvo da pesquisa. Podem ser pessoas,
animais,objetos, domicílios, empresas, etc. Deve ser definida no início da investigação de acordo com o interesse do estudo. É muito importante que a unidade elementar seja claramente definida, para que o processo de coleta e análise tenha sempre um significado preciso e uniforme.
Variáveis
É uma característica qualitativa ou quantitativa que observamos em cada unidade amostral. Ex.: altura, sexo, peso, idade, classe social, etc.
Notação: As variáveis são usualmente denotadas pelas letras
maiúsculas X , Y , Z , W . Em um população U
e
= (1, . . . , N), o conjunto de valores que essas variáveis assumem são denotadas por
x e
= (x1, x2, . . . , xN); Em uma amostra s
e
= k1, . . . , kn, os valores que essas variáveis podem assumir são denotadas por
X e
= (X1, X2, . . . , Xn) em que cada Xi pode assumir qualquer valor xu, para u ∈ U e xu∈ x.
Parâmetro
Uma medida numérica que descreve alguma característica de uma população.
Exemplo
Peso médio ao nascer de crianças na cidade de João Pessoa, proporção de mulheres com câncer de mama na Paraíba. Notação: Utiliza-se usualmente letras gregas,µ, σ2, τ para se denotar parâmetros. Entretanto, existem exceções, por exemplo, para o parâmetro proporção utiliza-se p.
Estimador
É qualquer função dos elementos X1, . . . , Xn da amostra X e
, que assume valores em Θ(espaço paramétrico), em que Θ é o conjunto de todos os valores que o parâmetro θ pode assumir.
Notação: Usualmente utiliza-seµ,b bσ 2,
b
p para se denotar parâmetros. Entretanto, existem exceções, por exemplo, para o parâmetro µ utiliza-se X .
Exemplo
Seja X e
= (X1, X2, . . . , Xn) uma amostra, então um estimador para a média populacional µ para essa amostra é dada por:
X = X1+ . . . + Xn
Estimativa
É o valor observado de um estimador após a amostra ser coletada.
Exemplo
Considere a seguinte amostra da variável X , X e
= (5, 3, 4, 2, 6), então
X = 5 + 3 + 4 + 2 + 6
5 = 4.
Cadastro amostral
Lista das unidades da população de pesquisa de onde a amostra será extraída. Nem sempre aplicável.
Tipos de estudos: Estudos Observacionais
Se caracterizam pela não intervenção do pesquisador sobre os dados do estudo. Dessa maneira, nos estudos observacionais observamos e medimos características específicas, mas não tentamos modificar os elementos objeto do estudo.
Exemplo
Em uma pesquisa na qual se quer estudar algum aspecto de um grupo de alcoólatras, não há a possibilidade de induzir um grupo a tornar-se alcoólatra, então o estudo é observacional e inclui o grupo que já era alcoólatra e um grupo de não alcoólatras como grupo controle.
Tipos de estudos: Estudos Experimentais
Nos estudos experimentais, o pesquisador designa os indivíduos da amostra aos grupos por processo aleatório, aplicamos um
tratamento diferente a cada grupo e observamos seu efeito nos elementos da amostra.
Exemplo
No artigo “Impacto da multimistura no estado nutricional de pré-escolares matriculados em creches. Rev. Nutr. [online]. 2006, vol.19, n.2, pp. 169-176.”, coletou-se uma amostra de 135 crianças na faixa etária de um a seis anos. As crianças foram divididas aleatóriamente em três grupos: intervenção 1 (GI1 n=48), intervenção 2 (GI2 n=45) e controle (GC n=42), recebendo 5g e 10g de multimistura e placebo, respectivamente. O estado nutricional das crianças em estudo foi avaliado antes e após a
Tipos de Amostragem: Amostragem Probabilística
É o procedimento pelo qual se utilizam mecanismos aleatórios de seleção dos elementos de uma amostra, atribuindo a cada elemento uma probabilidade de pertencer a amostra.
Tipos de Amostragem: Amostragem não Probabilística
É o procedimento pelo qual se utiliza alguma mecanismo aleatório de seleção, mas sem conhecer a probabilidade de cada elemento fazer parte da amostra ou não se utilizam mecanismos aleatórios de seleção dos elementos de uma amostra, tais como: amostras intencionais, nas quais os elementos são escolhidos com o auxílio de especialistas; amostras de voluntários, onde as pessoas é que se apresentam para participar do estudo.Observação
A grande vantagem da amostra probabilística é medir a precisão da amostra obtida, baseando-se apenas no resultado contido na própria amostra.
Amostragem aleatória(AA)
Procedimento pelo qual cada elemento da população tem a mesma chance(probabilidade) de ser selecionada.
Amostragem aleatória simples(AAS)
Procedimento pelo qual uma amostra de tamanho n é selecionada de tal forma que cada amostra possível de tamanho n tem a mesma chance(probabilidade) de ser selecionada. Esse plano amostral subdivide-se ainda em dois outros: Amostragem aleatória simples com reposição(AASCR) e Amostragem aleatória simples sem reposição(AASSR).
Amostragem sistemática
É realizada quando os elementos da população estão ordenados e a seleção dos elementos da amostra é feita periodicamente ou sistematicamente.
Amostragem estratificada
Esse procedimento consiste em dividir a população em
sub-populações (estratos). Estratos são divisões de acordo com algum critério, por exemplo: sexo, faixa etária, estado civil, assim dentro de cada estrato teremos uma maior homogeneidade. Dessa forma, para uma população com N unidades amostrais e d estratos com tamanhos N1, . . . , Nd, tem-se quePdi =1Ni = N, portanto teremos os seguinte coeficiente de proporcionalidade ci = NNi. Deste modo, para uma amostra de tamanho n devemos selecionar
Amostragem por conglomerado
Neste procedimento cada unidade amostral é um grupo (conglomerado) de elementos. Conglomerados são partes
representativas da população, por exemplo, dividimos um bairro em quarteirões. Assim cada quarteirão é uma unidade amostral. Deste modo, selecionamos uma AAS dos quarteirões para depois
proceder-se o levantamento dos dados de todos os elementos do Conglomerado.
Erros de amostragem
Erro amostral(E). é a diferença entre o resultado amostral e
o verdadeiro resultado da população. Tais erros resultam das flutuações amostrais devidas ao acaso.
Erro não amostral. ocorre quando os dados amostrais são
coletados ou registrados incorretamente. Exemplos de erros não amostrais: seleção de uma amostra por conveniência, uso de um instrumento de medida defeituoso, digitação incorreta dos dados, etc.
Amostra Aleatória
Uma amostra aleatória de tamanho n de uma variável aleatória X com função distribuição F , é um vetor X
e
= (X1, X2, . . . , Xn) em
que as componentes Xi são independentes e possuem distribuição
F .
Estatística
É qualquer função dos elementos X1, . . . , Xn da amostra X e
cuja distribuição de probabilidade não depende de parâmetros desconhecidos.
Distribuição Amostral: Definição
A Distribuição de todos os valores possíveis que podem ser assumidos por uma estatística, calculados a partir de amostras de mesmo tamanho selecioanadas aleatóriamente de uma mesma popualção, é chamada de Distribuição Amostral da estatística.
Distribuição Amostral: Objetivos
Permitir responder questões probabilisticas sobre estatisticas amostrais;
fornecer a teoria necessária para fazer válidos os procedimentos da inferência estatística.
Distribuição Amostral da Média: Exemplo 5.3.1-Daniel
Suponha que temos uma população de cinco crianças que são pacientes em um centro comunitário de saúde mental e a variável de interesse é a idade delas, assim,x e = (6, 8, 10, 12, 14). A média populacional é, µ = 6 + 8 + 10 + 12 + 14 5 = 10
Distribuição Amostral da Média: Exemplo 5.3.1-Daniel
e a variância populacional,
σ2 = (6 − 10)
2+ (8 − 10)2+ · · · + (14 − 10)2
5 = 8
Desejamos obter a distribuição amostral da média, baseado em amostras de tamanho 2, selecionadas dessa populaçao com reposição.
Distribuição Amostral da Média: Exemplo 5.3.1-Daniel
6 8 10 12 14 6 (6,6) (6,8) (6,10) (6,12) (6,14) X 6 7 8 9 10 8 (8,6) (8,8) (8,10) (8,12) (8,14) X 7 8 9 10 11 10 (10,6) (10,8) (10,10) (10,12) (10,14) X 8 9 10 11 11 12 (12,6) (12,8) (12,10) (12,12) (12,14) X 9 10 11 12 13 14 (14,6) (14,8) (14,10) (14,12) (14,14) X 10 11 12 13 14Table: Todas as posíveis amostras de tamanho 2 da população com reposição Ulisses U. dos Anjos Modelos de Probabilidade e Inferencia Estatística
Distribuição Amostral da Média: Amostras com reposição
X 6 7 8 9 10 11 12 13 14
Frequência 1 2 3 4 5 4 3 2 1
Freq. Rel(Prob.) 251 252 253 254 255 254 253 252 251
Distribuição Amostral da Média para n=2
6 7 8 9 10 11 12 13 14 0 1 2 3 4 5
Distribuição Amostral da Média: Amostras com reposição
Deste modo, tem-se que o valor esperado de X éE (X ) = 14 X x =6 xP(X = x) = 6× 1 25+7× 2 25+· · ·+13× 2 25+14× 1 25 = 10 e a variancia de X é Var (X ) = 14 X x =6 x − E (X )2P(X = x) = (6 − 10)2× 1 25 + · · · + (14 − 10) 2× 1 25 = 4.
Distribuição Amostral da Média: Amostras com reposição
Agora note que
E (X ) = µ e Var (X ) = 4 = 8 2 = σ2 n em que n é o tamanho da amostra.
Distribuição Amostral da Média: Amostras sem reposição
X 7 8 9 10 11 12 13
Frequência 2 2 4 4 4 2 2
Freq. Rel(Prob.) 202 202 204 204 204 202 202
Distribuição Amostral da Média para n=2, sem reposição
7 8 9 10 11 12 13 0 1 2 3 4
Distribuição Amostral da Média: Amostras sem reposição
Deste modo, tem-se que o valor esperado de X éE (X ) = 13 X x =7 xP(X = x) = 7 × 2 20 + · · · + 13 × 2 20 = 10 e a variancia de X é Var (X ) = 13 X x =7 x − E (X )2P(X = x) = (7 − 10)2× 2 20 + · · · + (13 − 10) 2× 2 20 = 3.
Distribuição Amostral da Média: Amostras sem reposição
Agora note que
E (X ) = µ e Var (X ) = 3 = 8 2× 5 − 2 5 − 1 = σ2 n × N − n N − 1
em que n é o tamanho da amostra e N é o tamanho da populacão.
Distribuição Amostral da Média
Seja X1, . . . , Xn uma amostra aleatória da variável X ∼ N(µ, σ2) então, X ∼ N µ;σ 2 n .
Teorema Central do Limite
Seja {Xn, n ≥ 1} uma seqüência de variáveis aleatórias independentes e identicamente distribuídas, com média µ e variancia σ2 < ∞. Então, para Sn=Pni =1Xn, tem-se
Sn− E (Sn) pVar (Sn) = Sn− nµ σ√n d −→ N(0, 1)
Distribuição Amostral da Média
Seja X1, . . . , Xn uma amostra aleatória da variável X , com média µ
e variância σ2< ∞. Então pelo Teorema Central do Limite(TCL)
segue que a distribuição da média amostral será aproximadamente normal com média µ e variância σn2, isto é,
X ∼ Na µ;σ 2 n .
Exemplo
Suponha que em uma certa população, o tamanho do crânio é uma variável aleatória com distribuição aproximadamente normal com média 185,6 mm e desvio padrão 12,7 mm. Qual é a probabilidade que em uma amostra aleatória de tamanho 10 desta população a média amostral seja maior que 190 mm?
P X > 190 = P Z > 190 − 185, 612,7 √
10 !
= P(Z > 1, 1) = 1 − Φ(1, 1) = 0, 1357.
Distribuição Amostral da Diferença de Médias
Sejam X11, . . . , X1n1 e X21, . . . , X2n2 amostras das variáveisaleatórias X1 ∼ N(µ1, σ21) e X2∼ N(µ2, σ22) então, X1− X2∼ N µ1− µ2; σ12 n1 + σ 2 2 n2 ;
Se as populações não forem normais então pelo TCL segue que, X1− X2 a ∼ N µ1− µ2;σ 2 1 n1 +σ 2 2 n2 ;
Distribuição Amostral da Diferença de Médias - Exemplo
5.4.2-Daniel
Suponha que o tempo médio de visita domiciliar realizado por enfermeiras dos PSF’s, considerando um certo tipo de paciente foi estimado em 45 minutos com um desvio padrão de 15 minutos e para um segundo tipo de paciente o tempo médio de visita
domiciliar foi estimado em 30 minutos com um desvio padrão de 20 minutos. Se uma enfermeira visitar aleatoriamente 35 pacientes do primeiro tipo e 40 do segundo tipo, qual a probabilidade que o tempo de visita médio entre os dois grupos de pacientes seja superior a 20 minutos?
Exemplo 5.4.2-Daniel - Solução
Tem-se que, X1− X2∼ N 45 − 30;15 2 35 + 202 40 Logo, P(X1− X2 > 20) = P Z > q20 − 15 152 35 + 202 40 Distribuição Amostral da Proporção
Seja uma amostra aleatória (X1, . . . , Xn) em que Xi ∼ ber (p). Um estimador para o parâmetro p é dado por,
b
p = X1+ · · · + Xn
n .
Logo, do Teorema Central do Limite, segue que, para n grande,bp
terá distribuição aproximadamente normal com média p e variância p(1−p)
n .
Observação
A aproximação será boa se n × min(p, 1 − p) > 5.
Exemplo
Suponha que em uma determinada população de mulheres grávidas no seu terceiro mês, 90% tiveram algum cuidado pré-natal. Se uma amostra aleatória de 200 mulheres dessa população é selecionada, qual a probabilidade que a proporção amostral das mulheres que tiveram algum cuidado pré-natal seja no máximo 0,85?
P(bp ≤ 0, 85) = P Z ≤ 0, 85 − 0, 90q 0,9×0,1 200 = P(Z ≤ −2, 36)
Distribuição Amostral da diferença da Proporção
Seja X11, . . . , X1n1 e X21, . . . , X2n2, amostras das variáveis
aleatórias X1 ∼ ber (p1) e X2∼ ber (p2), os estimadores para os parâmetros p1 e p2 são dados por,
b p1= X11+ · · · + X1n1 n1 e bp2 = X21+ · · · + X2n2 n2 . Logo, do Teorema Central do Limite, segue que, para n grande, bp1−bp2 terá distribuição aproximadamente normal com média µ b p1−bp2 = p1− p2 e variância σ 2 b p1−bp2 = p1(1−p1) n1 + p2(1−p2) n2 .
Distribuição Amostral da Variância
Seja X1, . . . , Xn uma amostra aleatória da variável X ∼ N(µ, σ2), então,
(n − 1)S2
σ2 ∼ χ
2 n−1
Exemplo
Vinte e quatro animais com deficiencia de vitamina D foram dividos em dois grupos de mesmo tamanho. O grupo 1 foi recebeu uma dieta que fornecia vitamina D enquanto que o grupo dois não tinha em sua dieta vitamina D. Ao final do período do experimento foram determinados os níveis de cálcio sérico obtendo os seguintes
resultados:
Grupo X (mg/100ml) S
1 11,1 1,5
2 7,8 2.0
Assuma que as populações são normais e as variancias são iguais a σ2 = 2, 56. Verifique se e razoável que as variancias σ12 e σ22 sejam iguais a 2,56.
Exemplo
Visto que, 11 × Si σ2 i ∼ χ211 então, como s12 = 1, 52< 2, 56 então P S12 ≤ 1, 52 = P χ211≤ 11 × 1, 5 2 2, 56 = P(χ211≤ 9, 667969) = 0, 4395 e como s2 2 = 22 > 2, 56 então P S22≥ 22 = P χ211≥ 11 × 4 2, 56 = P(χ211≥ 17, 1875) = 0, 1025Distribuição Amostral da razão de Variâncias
Sejam X11, . . . , X1n1 e X21, . . . , X2n2 amostras das variáveisaleatórias X1 ∼ N(µ1, σ21) e X2∼ N(µ2, σ22) então, U = (n1− 1)S 2 1 σ12 ∼ χ 2 n1−1 e V = (n2− 1)S2 2 σ22 ∼ χ 2 n2−1 logo, U n1−1 V n2−1 = S2 1 σ2 1 S2 2 σ2 2 ∼ Fn1−1,n1−1 Observação
É usual fazer a razão da maior variância sobre a menor, entretanto veremos adiante no exemplo que não faz diferença.
Exemplo
Vinte e quatro animais com deficiencia de vitamina D foram dividos em dois grupos de mesmo tamanho. O grupo 1 foi recebeu uma dieta que fornecia vitamina D enquanto que o grupo dois não tinha em sua dieta vitamina D. Ao final do período do experimento foram determinados os níveis de cálcio sérico obtendo os seguintes
resultados:
Grupo X (mg/100ml) S
1 11,1 1,5
2 7,8 2.0
Assuma que as populações são normais. Verifique se é razoável que as variancias sejam iguais?
Exemplo
Visto que, S2 1 σ2 S2 2 σ2 = S 2 1 S2 2 ∼ F12−1,12−1então, como S12 = 1.52 < 22 = S22, isto é, tem-se que P F11,11≤ 1.52 22 = 0, 1771
ou, suponha agora que S2
1 = 22> 1.52 = S22, assim P F11,11≥ 22 1, 52 = 0, 1771
Intervalo de Confiança
Um intervalo de confiança é um intervalo de valores utilizado para estimar o verdadeiro valor de um parâmetro populacional (θ).
Definição
Seja X = (X1, . . . , Xn) uma amostra aleatória da variável X ∼ F e c1(X) e c2(X) estatísticas tais que,
P(c1(X) < θ < c2(X)) = 1 − α, 0 < α < 1
Então o intervalo aleatório c1(X), c2(X) chama-se Intervalo de
Intervalo de Confiança
De um modo geral, estamos interessados em encontrar um intervalo da forma bθ − E ; bθ + E, em que θ é o estimador de um parâmetrob de interesse θ e E é a margem de erro ou erro de precisão.
Todo intervalo de confiança está associado a um nível de confiança 100(1 − α)% que é a probabilidade de que o intervalo contenha o verdadeiro valor do parâmetro, isto é,
Pbθ − E < θ < bθ + E
= 1 − α, 0 < α < 1 Logo, α será a probabilidade de que o intervalo não contenha o verdadeiro valor do parâmetro.
Intervalo de Confiança
Em cada caso há o interesse de se construir um uma região de estimação ótima, isto é, fixado um nível de confiança, desejamos encontrar um intervalo que tenha a menor amplitude possível. Observando um grande número de amostras de tamanho n e seus correspondentes intervalos espera-se que em média uma proporção 100(1 − α)% desses intervalos contenham o verdadeiro valor do parâmetro.
Notação: IC θ ; (1 − α)% = c1(X) , c2(X)
Intervalo de Confiança para a Média - Caso 1 - Variância
conhecida
Suposições:
1 X = (X1, . . . , Xn) uma amostra iid(independente e
identicamente distribuída);
2 população com distribuição normal com média µ e Variância
σ2 conhecida; ou uma amostra grande n ≥ 30 com Variância
σ2 conhecida ou não, aí nesse caso substitui-se σ2 por S2. Nessas condições, segue que,
X − µ σ √ n
∼ N(0, 1)
Intervalo de Confiança para a Média - Caso 1 - Variância
conhecida
Deste modo, a margem de erro é dada por,
E = zα 2 σ √ n logo, IC µ ; (1 − α)% = X − zα 2 σ √ n; X + zα2 σ √ n
Intervalo de Confiança para a Média - Caso 2 - Variância
Desconhecida
Suposições:
1 X = (X1, . . . , Xn) uma amostra iid(independente e
identicamente distribuída);
2 população com distribuição normal com média µ e Variância
σ2 desconhecida; Nessas condições, segue que,
X − µ S √ n
∼ tn−1
Intervalo de Confiança para a Média - Caso 2 - Variância
Desconhecida
Deste modo, a margem de erro é dada por, E = t(n−1 ,α 2) S √ n logo, IC µ ; (1 − α)% = X − t(n−1 ,α2) S √ n; X + t(n−1 ,α2) S √ n
Intervalo de Confiança para a diferença de Médias Caso 1
-Variâncias conhecidas
Suposições:
1 X1 = (X11, . . . , X1n
1) e X2 = (X21, . . . , X2n2) amostras
iid(independente e identicamente distribuída) provenientes de populações independentes;
2 populações com distribuição normal, com médias µ1 e µ2 e
Variâncias σ2
1 e σ22 conhecidas; ou amostras grandes n ≥ 30 com Variâncias conhecidas ou não.
Nessas condições, segue que,
(X1− X2) − (µ1− µ2) q σ2 1 n1 + σ2 2 n2 ∼ N (0, 1) ;
Intervalo de Confiança para a diferença de Médias Caso 1
-Variâncias conhecidas
Deste modo, a margem de erro é dada por,
E = zα 2 s σ21 n1 +σ 2 2 n2
Logo, o intervalo de confiança IC µ1− µ2; (1 − α)% é dado por, (X1− X2) − zα 2 s σ2 1 n1 +σ 2 2 n2 , (X1− X2) + zα 2 s σ2 1 n1 +σ 2 2 n2
Intervalo de Confiança para a diferença de Médias Caso 2
-Variâncias desconhecidas e iguais
Suposições:
1 X1 = (X11, . . . , X1n
1) e X2 = (X21, . . . , X2n2) amostras
iid(independente e identicamente distribuída) provenientes de populações independentes;
2 populações com distribuição normal, com médias µ1 e µ2 e
Variâncias σ12 e σ22 desconhecidas e iguais.
Intervalo de Confiança para a diferença de Médias Caso 2
-Variâncias desconhecidas e iguais
Nessas condições, segue que,
(X1− X2) − (µ1− µ2) q S2 p n1 + S2 p n2 ∼ tn1+n2−2 em que, Sp2 = (n1− 1)S 2 1 + (n2− 1)S22 n1+ n2− 2
Intervalo de Confiança para a diferença de Médias Caso 2
-Variâncias desconhecidas e iguais
A margem de erro é dada por,
E = tn1+n2−2,α2 s S2 p n1 +S 2 p n2 logo, IC µ1− µ2; (1 − α)% = (X1− X2) − E , (X1− X2) + E
Intervalo de Confiança para a diferença de Médias Caso 3
-Variâncias desconhecidas e diferentes
Quando não é possivel concluir que as variancias são iguais então, (X1− X2) − (µ1− µ2) q S2 1 n1 + S2 2 n2
não tem distribuição tn1+n2−2. A solução proposta por Cochran
consiste em calcular, t0α 2 = w1tn1−1,α2 + w2tn2−1,α2 w1+ w2 em que wi = Si2 ni .
Intervalo de Confiança para a diferença de Médias Caso 3
-Variâncias desconhecidas e diferentes
Deste modo, a margem de erro é dada por,
E = t0α 2 s S2 1 n1 + S 2 2 n2
Assim, o intervalo de confiança IC µ1− µ2; (1 − α)% é dado por, (X1− X2) − t 0 α 2 s S2 1 n1 + S 2 2 n2 , (X1− X2) + t 0 α 2 s S2 1 n1 +S 2 2 n2
Intervalo de Confiança para a Proporção
Seja uma amostra aleatória (X1, . . . , Xn) de Xi ∼ ber (p). Então, pelo TCL segue que a margem de erro aproximada é dada por,
E = zα 2 r b p(1 −bp) n Logo, IC p ; (1 − α)% = bp − zα 2 r b p(1 −bp) n ;bp + zα2 r b p(1 −bp) n !
Intervalo de Confiança para a diferença de Proporções
Seja X11, . . . , X1n1 e X21, . . . , X2n2, amostras das variáveisaleatórias X1 ∼ ber (p1) e X2∼ ber (p2), então pelo Teorema Central do Limite, segue que, para n grande, a margem de erro aproximada é dada por,
E = zα 2 s b p1(1 −bp1) n1 +bp2(1 −bp2) n2 logo, IC p1− p2; (1 − α)% = ((bp1−pb2) − E ; (bp1−bp2) + E )
Intervalo de Confiança para a Variância
Suposições: Suposições:1 X = (X1, . . . , Xn) uma amostra iid(independente e
identicamente distribuída);
2 população com distribuição normal com média µ e Variância
σ2.
Nessas condições segue que, (n − 1)S2
σ2 ∼ χ
2 n−1
Intervalo de Confiança para a Variância
Logo, χ2n−1,α 2 < (n − 1)S2 σ2 < χ 2 n−1,1−α2 portanto, (n − 1)S2 χ2n−1,α 2 > σ2> (n − 1)S 2 χ2n−1,1−α 2Assim, um IC σ2; (1 − α) é dado por,
(n − 1)S2 χ2n−1,1−α 2 , (n − 1)S 2 χ2n−1,α 2 !
Intervalo de Confiança para a razão de Variâncias
Suposições:
1 X1 = (X11, . . . , X1n
1) e X2 = (X21, . . . , X2n2) amostras
iid(independente e identicamente distribuída) provenientes de populações independentes;
2 populações com distribuição normal, com médias µ1 e µ2 e
Variâncias σ2 1 e σ22.
Intervalo de Confiança para a razão de Variâncias
Nessas condições, segue que,S2 1 σ21 S2 2 σ2 2 ∼ Fn1−1,n1−1 logo, IC σ 2 1 σ2 2 ; (1 − α) = S12 S2 2 Fn1−1,n2−1,1−α2 , S12 S2 2 Fn1−1,n2−1,α2
Motivação
Um Jornal na Cidade St. Paul, Mineápolis, o Star Tribune
patrocinou uma pesquisa destinada a revelar as opiniões sobre o uso de câmeras fotográficas para flagrar os motoristas que passam o sinal vermelho e depois são notificados pelo correio sobre a infração cometida. Os pesquisadores entrevistaram 829 adultos de
Minnesota, e verificaram que 51% se opunham à essa nova legislação que aprovará o uso dessas câmeras.
Baseado nessas informações, podemos concluir que há evidência amostral suficiente para apoiar a afirmativa que a maioria de todos os adultos de Minnesota, isto é, p > 0, 5 são contra a nova
Visão Geral
O objetivo de um teste de hipótese é fornecer uma
metodologia(procedimento) que nos permita verificar se os dados amostrais trazem evidências que apóiem ou não uma hipótese estatística formulada. Assim sendo, a formulação de um teste de hipótese estatístico inicia-se com a afirmação de uma hipótese estatística.
Definição (Hipótese Estatística)
É usualmente uma conjectura a respeito de um parâmetro populacional.
Para cada situação existem dois tipos de hipótese estatística: a
hipótese nula denotada por H0 e a hipótese alternativa denotada
por H1
Regra do evento raro
Se sob uma dada suposição, a probabilidade de um evento observado for excepcionalmente pequena, concluímos que a suposição provavel-mente não é verdadeira.
Guiados por esta regra, iremos por a prova as hipóteses estatisticas formuladas e decidir se os dados amostrais podem facilmente ocorrer por acaso ou são altamente improváveis de ocorrer por acaso.
Teste Paramétrico ou Teste Não Paramétrico
Teste Paramétrico: Exige suposições sobre a distribuição de
probabilidade das variáveis de interesse.
Teste Não Paramétrico: Não exige suposições sobre a
distribuição de probabilidade das variáveis de interesse. Por este motivo são em geral chamados de testes livres de distribuição.
Principal vantagem do teste Não Paramétrico: Podem ser
aplicados a uma maior variedade de situações, pois possuem suposições mais fracas que os testes Paramétricos;
Principal desvantagem do teste Não Paramétrico: São menos
eficientes que os testes Paramétricos, pois para uma dada situação em que as suposições do teste Paramétrico são satisfeitas, um teste Não Paramétrico equivalente precisaria de uma amostra maior para ter um erro tipo I e tipo II equivalentes ao do método Paramétrico.
Hipótese Nula e Alternativa
Hipótese Média Proporção Variância
Nula(H0) µ1= µ2 p1 = p2 σ12= σ22 Alternativa(H1) µ16= µ2 p1 6= p2 σ126= σ22 Nula(H0) µ1≤ µ2 p1 ≤ p2 σ12≤ σ22 Alternativa(H1) µ1> µ2 p1 > p2 σ12> σ12 Nula(H0) µ1≥ µ2 p1 ≥ p2 σ12≥ σ22 Alternativa(H1) µ1< µ2 p1 < p2 σ12< σ12
Resultados em um Teste de Hipótese
Em um teste de hipótese, existem apenas quatro resultados possíveis:
H0 é verdadeira H0 é falsa
Rejeitar H0 Erro tipo I Decisão correta
Não Rejeitar H0 Decisão correta Erro tipo II
Estatística do Teste
É um valor calculado a partir dos dados amostrais e é usada para se tomar a decisão sobre a rejeição da hipótese nula.
Note que como seu valor depende da amostra, então pode-se concluir que ela é uma variável aleatória, logo possui distribuição de probabilidade.
Será essa distribuição de probabilidade que utilizaremos para tomar a decisão de rejeitar ou não a hipótese H0.
Nível de significância e Beta do Teste
Nível de significância: É a probabilidade de se cometer o erro
tipo I, é denotado por α, isto é,
P(Erro tipo I) = α = P(Rejeitar H0|H0 é verdadeira).
Beta do Teste: É a probabilidade de não rejeitar H0 quando ela é
falsa, isto é,
β = P(Erro tipo II) = P(Não Rejeitar H0|H0 é falsa)
Poder do teste e p-valor
Poder do teste: É a probabilidade de rejeitar H0 quando ela é
falsa, esta probabilidade é o complentar da probabilidade de se cometer o erro tipo II, isto é,
Poder do Teste = 1 − P(Não Rejeitar H0|H0 é falsa) = P(Rejeitar H0|H0 é falsa).
Nível descritivo ou p-valor do teste: É a probabilidade de
ocorrer valores da Estatística do teste, mais extremos que o valor observado, sob a hipótese que H0 é verdadeira.
Cálculo do p-valor
Seja X = (X1, . . . , Xn) uma amostra aleatória de tamanho n, T (X) uma estatística que possui uma distribuição de probabilidade P e T (x) o valor da estatística dado os valores observados
x = (x1, . . . , xn. Uma maneira prática de se determinar o evento que se deseja calcular, para o caso de duas amostras, é o seguinte: Seja bθ1 e bθ2 os estimadores dos parâmetros θ1 e θ2, então:
1 Se bθ1> bθ2 tem-se que p-valor = PT (X) > T (x) H0 é verdadeira ; 2 Se bθ1< bθ2 tem-se que p-valor = PT (X) < T (x) H0 é verdadeira
Cálculo do p-valor - Exemplo
Exemplo 1: Considere que T (X) ∼ N(0, 1), bθ1 < bθ2 e
T (x) = −1, 25 então da tabela da distribuição Normal tem-se que: p-valor = PT (X) < −1, 25= 0, 1056;
Exemplo 2: Considere que T (X) ∼ t11, bθ1 > bθ2 e T (x) = 1, 363 então da tabela da distribuição t tem-se que:
p-valor = PT (X) > 1, 363= 0, 10; Exemplo 3: Considere que T (X) ∼ F7, 10, bθ1> bθ2 e
T (x) = 3, 9498 então da tabela da distribuição F tem-se que: p-valor = PT (X) > 3, 9498= 0, 025.
Região Crítica para Estatística com distribuição Normal
É o conjunto de valores da Estatística do teste para o qual a hipótese deve ser rejeitada, também chamada de região de rejeição. A região crítica dependerá da hipótese alternativa e da distribuição de probabilidade de cada Estatística.Distribuição de probabilidade da Estatística: Z ∼ N(0, 1)
Hipótese Região Crítica
H1: θ1 6= θ2 −∞, −zα 2 i ∪hzα 2, ∞ H1: θ1 > θ2 [zα, ∞) H1: θ1 < θ2 (−∞, −zα]
Região Crítica para Estatística com distribuição t
Distribuição de probabilidade da Estatística: T ∼ tν
Hipótese Região Crítica
H1 : θ16= θ2 −∞, −tν,α 2 i ∪htν,α 2, ∞ H1 : θ1> θ2 [tν,α, ∞) H1 : θ1< θ2 (−∞, −tν,α]
Região Crítica para Estatística com distribuição χ
2Distribuição de probabilidade da Estatística: χ2 ∼ χ2ν
Hipótese Região Crítica
H1: θ1 6= θ2 0, χ2 ν,α2 i ∪hχ2ν,α 2, ∞ H1: θ1 > θ2 χ2ν,α, ∞ H1: θ1 < θ2 0, χ2ν,α
Região Crítica para Estatística com distribuição F
Distribuição de probabilidade da Estatística: F ∼ Fν1,ν2
Hipótese Região Crítica
H1: θ1 6= θ2 0, Fν1,ν2,α 2 i ∪hFν1,ν2,α 2, ∞ H1: θ1 > θ2 [Fν1,ν2,α, ∞) H1: θ1 < θ2 (0, Fν1,ν2,α]
Critério de Decisão
Seja X = (X1, . . . , Xn) uma amostra aleatória de tamanho n e T (X) uma estatística, então o critério de decisão é:
1 Utilizando a Região Crítica: Se T (X) ∈ RC rejeita-se a
hipótese H0, caso contrário não rejeita-se a hipótese H0;
2 Utilizando p-valor: Se p-valor≤ α rejeita-se a hipótese H0,
caso contrário não rejeita-se a hipótese H0. Esta é a regra do evento raro.
Comparação de Médias - Duas populações independentes
Estatística do Teste: Estatística: Z = qX1− X2 σ21 n1 + σ22 n2 ∼ N(0, 1)Suposição: Populações Normais e Variâncias Conhecidas
Estatística: Z = qX1− X2 S2 1 n1 + S2 2 n2 ∼ N(0, 1)
Exemplo
Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição Normal:
Amostra 1 Amostra 2
n1= 8 n2 = 7
X1= 104 X2 = 106
σ1 = 8, 4 σ2= 7, 6
Qual o valor da Estatística do Teste? E o p-valor?
Exemplo
Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição desconhecida:
Amostra 1 Amostra 2
n1= 80 n2 = 70
X1= 104 X2 = 106
S1 = 8, 4 S2= 7, 6
Componentes de um Teste de Hipótese: Estatística do Teste
Comparação de Médias - Duas populações independentes
Estatística: T = qX1− X2 S2 p n1 + S2 p n2 ∼ tn1+n2−2 em que, Sp2 = (n1− 1)S 2 1 + (n2− 1)S22 n1+ n2− 2
Suposição: Populações Normais e Variâncias Desconhecidas e
iguais
Teste de Hipótese para comparação de Médias
Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição Normal e variâncias desconhecidas e iguais:
Amostra 1 Amostra 2
n1= 8 n2 = 7
X1= 104 X2 = 106
S1 = 8, 4 S2= 7, 6
Comparação de Médias - Duas populações independentes
Estatística: T0 = qX1− X2 S2 1 n1 + S2 2 n2 Distribuição DesconhecidaSuposição: Populações Normais e Variâncias Desconhecidas e
diferentes
O problema dessa estatística é o desconhecimento de sua distribuição. Várias metodologias foram propostas para se determinar o p-valor e os quantis dessa estatística.
Comparação de Médias - Duas populações independentes
Cochran and Cox (1957) propôs uma metodologia para calcular aproximadamente o valor crítico da estatística,tα0 = tn1−1,α S2 1 n1 + tn2−1,α S2 2 n2 S2 1 n1 + S2 2 n2 (2)
Note que desta maneira o valor crítico é uma valor entre tn1−1,α e
tn2−1,α. A maneira mais simples de se determinar o p-valor e os
quantis dessa estatística é assumir que T0 ∼ tmin(n1−1, n2−1), isto é,
considerar a pior situação. Nessas condições a hipótese H0 precisará de mais evidencias para ser rejeitada que a condição proposta por Cochran and Cox (1957).
Teste de Hipótese para comparação de Médias
Considere os seguintes resultados, referentes a duas amostras aleatórias independentes, de populações com distribuição Normal e variâncias desconhecidas e diferentes:
Amostra 1 Amostra 2
n1= 8 n2 = 7
X1= 104 X2 = 106
S1 = 8, 4 S2= 7, 6
Qual o valor da Estatística do Teste?
Comparação de Médias - Duas populações dependentes
Este teste é conhecido também como teste para amostrasemparelhadas. Estatística: T = SD D √ n ∼ tn−1 em que, Di = X1i − X2i; D = Pn i =1Di n e S 2 D = Pn i =1(Di − D)2 n − 1
Suposição: Populações normais. Se essa suposição não for
verdadeira, mas a amostra for maior que 30 então a estatística será a Z ∼ N(0, 1).
Teste de Hipótese para comparação de Médias
Considere os seguintes resultados, referentes a duas amostras aleatórias emparelhadas, de populações com distribuição Normal:Amostra 1 Amostra 2 Di = X1i − X2i 6,0 5,4 0,60 5,0 5,2 -0,20 7,0 6,5 0,50 6,2 5,9 0,30 6,0 6,0 0,00 6,4 5,8 0,60
Teste de Hipótese para comparação de Médias
Assim, calculando as estimativas dos parâmetros, D = 0, 60 + (−0, 20) + . . . + 0, 60 6 = 1, 8 6 = 0, 30 SD2 = (0, 60 − 0, 30) 2+ . . . + (0, 60 − 0, 30)2 5 − 1 = 0, 56 5 = 0, 112 logo, SD = √ 0, 112 = 0, 335
Componentes de um Teste de Hipótese: Estatística do Teste
Comparação de Variâncias - Duas populações independentes
Suposição: Populações normais.
Estatística: F = S 2 1 S2 2 ∼ Fn1−1,n2−1 Exemplo
Considere as seguintes informações: n1 = 8, n2 = 7, S1 = 8, 4 e S2= 7, 6. Sendo assim, a estatística do teste é dada por,
F = 8, 4
7, 6 ≈ 1, 11
Comparação de proporções - Duas populações independentes
Suposição: Amostras grandes. Nesse caso,
n1× p1(1 − p1) ≥ 5 e n2× p2(1 − p2) ≥ 5
Como p1 e p2 não são conhecidos utilizar suas estimativasbp1 e bp2.
Estatística: Z = bp1−bp2 q p(1−p) n1 + p(1−p) n2 ∼ N(0, 1) em que, b p1= x1 n1 ,bp1 = x2 n2 e p = x1+ x2 n1+ n2
Comparação de proporções - Duas populações independentes
Considere os seguintes resultados, referentes a duas amostras aleatórias: Deseja-se testar a hipótese que motoristas negros são parados pela polícia em proporção maior que motoristas brancos. Assim, realizou-se um experimento em que 1.600 motoristas foram selecionados, 200 negros e 1400 brancos, as seguintes informações foram coletadas:
n1 = 200, x1 = 24; n2 = 1400, x2 = 147 Qual o valor da Estatística do Teste?