• Nenhum resultado encontrado

ÍNDICE 5. INFERÊNCIA ESTATÍSTICA...75

N/A
N/A
Protected

Academic year: 2021

Share "ÍNDICE 5. INFERÊNCIA ESTATÍSTICA...75"

Copied!
16
0
0

Texto

(1)

5. INFERÊNCIA ESTATÍSTICA...75

5.1.INTRODUÇÃO...75

5.2.INTERVALOS DE CONFIANÇA...76

5.3.TESTES DE HIPÓTESES...77

5.4.ALGUMAS DISTRIBUIÇÕES...81

5.4.1 Distribuição t de Student...81

5.4.2 Distribuição do Qui-quadrado...82

5.4.3 Distribuição F de Snedecor...82

5.5ESCOLHA DA ESTATÍSTICA ADEQUADA AO TESTE...83

5.5.1 Teste para o valor médio de uma população...83

5.5.2 Teste para a proporção de uma população...84

5.5.3 Teste para a variância de uma população...84

5.5.4 Teste para a diferença de valores médios de duas populações...84

5.5.5 Teste para a diferença de proporções de duas populações....86

5.5.6 Teste para o quociente de variâncias de duas populações...86

5.6 ERROS ASSOCIADOS A UM TESTE DE HIPÓTESES...87

5.7 TESTE DE AJUSTAMENTO DO QUI-QUADRADO...87

(2)

5

5. Inferência Estatística

5.1. Introdução

A estatística descritiva engloba uma série de técnicas e procedimentos com o objectivo de estudar e analisar as características que descrevem um conjunto de dados (amostra). Um objectivo mais ambicioso é o de com base nesse estudo conseguirmos generalizar e tirarmos conclusões sobre as características que constituem o conjunto do qual provém as observações que analisámos (população). A inferência estatística engloba um conjunto de técnicas e procedimentos que nos permitem então generalizar a informação contida numa amostra para a população da qual aquela provém (ver figura seguinte).

Técnicas de amostragem

INFERÊNCIA ESTATÍSTICA

AMOSTRA Características

conhecidas POPULAÇÃO Características Desconhecidas

??????

ESTATÍSTICA DESCRITIVA

(3)

5.2. Intervalos de confiança

Uma das técnicas da inferência estatística é a construção de intervalos de confiança para os parâmetros de uma certa população: valor esperado, variância ou proporção. Com base numa estimativa destes parâmetros (calculada através de estatísticas sobre uma amostra aleatória) pretende-se obter um intervalo de valores dentro do qual se encontra o “verdadeiro” valor do parâmetro em estudo.

Associado aos intervalos está a medida de confiança que neles depositamos (um valor entre 0% e 100%) que corresponde à probabilidade de o parâmetro se encontrar dentro do intervalo.

Suponhamos que temos uma certa população relativamente à qual estamos interessados em analisar uma certa característica cujos valores são dados pela variável aleatória X . Suponhamos ainda que esta variável aleatória segue uma distribuição normal com valor médio, µ, desconhecido e desvio padrão, σ , conhecido. Uma amostra aleatória é composta por n observações desta variável aleatória.

Podemos então dizer que (X1,X2,...,Xn) com XiN(µ,σ) e independentes entre si, definem todas as amostras aleatórias que é possível retirar da população (relativamente à variável aleatória ). X

A estatística média amostral, X , é definida em função das amostras aleatórias:

n X X

n

i i

= =1 .

Com base no estudo efectuado em 4.3.3 podemos concluir que

N n

X µ, σ . Dado que P(1.96Z 1.96)=0.95 sendo Z uma variável aleatória tal que

podemos concluir que:

) 1 , 0 ( N Z

95 . 0 96 . 1 96

.

1 =

n

P Xσ µ

(1)

Através de algumas operações algébricas temos que:

95 . 0 96

. 1 96

.

1 ⎟⎟=

⎜⎜

+

n X

n X

P σ µ σ

(2)

o que nos permite afirmar que temos 95% de confiança de que o valor médio da população, µ (que é desconhecido) se encontra algures no intervalo

⎥⎦

⎢⎣ +

X n

X σn σ

96 . 1 , 96 .

1 . Podemos generalizar esta fórmula e obter o

(4)

intervalo de confiança a para o valor médio de uma população com distribuição normal e desvio padrão conhecido (com

% C

) 100

0<C< dado por :

⎥⎦

⎢⎣ + n z X n z

X σ σ

, (3)

onde z é o valor tal que P(zZ z)=C% com ZN(0,1) :

Em secções seguintes iremos ver os intervalos de confiança para outros parâmetros da população e também para o valor médio quando os pressupostos agora exigidos não são verificados.

5.3. Testes de hipóteses

Um teste de hipóteses é um procedimento da inferência estatística utilizado para testar uma certa hipótese que se levanta sobre as características de uma dada população. Uma hipótese pode ser definida neste contexto como uma conjectura acerca de uma ou mais populações. De uma forma simplista o procedimento consiste em com base numa amostra aleatória da população, constatar se os valores observados estão ou não de acordo com as hipóteses levantadas. Um teste de hipóteses pode ser decomposto em quatro fases:

1º Definição das hipóteses.

Um teste de hipóteses tem sempre duas hipóteses em confronto uma com a outra.

Uma vez especificada a hipótese que se pretende testar, que designamos por hipótese alternativa ( H ) define-se a hipótese complementar de H , que designamos por hipótese nula e representamos por: H . A estratégia seguida num teste de hipóteses consiste em tentar suportar a validade de H conseguindo-se mostrar que com uma elevada probabilidade é falsa. Se, pelo contrário, os dados amostrais não nos permitirem rejeitar , a hipótese H não será reforçada pelo teste. Em relação à formulação das hipóteses, é importante notar os pontos seguintes:

1 1

0

1

H0

H0 1

(5)

a. A hipótese alternativa contém sempre uma desigualdade (que se traduz pelos sinais > ou <) ou uma não igualdade (sinal ), mas nunca uma igualdade (sinal =).

b. A hipótese nula é considerada verdadeira ao longo do procedimento do teste até ao momento em que haja evidência estatística clara apontando em sentido contrário. Neste caso (quando rejeitarmos ) aceita-se como válida a hipótese alternativa (visto que as hipóteses são complementares).

H0

c. A hipótese nula contém sempre uma igualdade. Quando na hipótese nula faz sentido figurar o sinal ou o sinal o teste é efectuado considerando apenas a situação em que mais se aproxima de , ou seja supondo que é verdadeira a afirmação de que corresponde à igualdade.

H0 H1

H0

d. Quando a hipótese alternativa contiver uma desigualdade (sinal > ou <) o teste diz-se unilateral (à direita para o sinal de >, à esquerda para o sinal de <). Quando envolver uma não igualdade o teste diz-se bilateral.

H1

2º Identificação da Estatística de Teste e caracterização da sua distribuição amostral.

A estatística (valor calculado com base numa amostra aleatória) que é utilizada para ver a plausibilidade da hipótese nula designa-se por estatística de teste, sendo representada por ET . A estatística de teste a utilizar depende assim do(s) parâmetro(s) em estudo, do conhecimento que tenhamos sobre a população e de outros factores tal como a dimensão da amostra que estamos a utilizar. Para que a estatística de teste possa cumprir a sua função é necessário conhecer a sua distribuição amostral sob a suposição de que a hipótese nula é verdadeira.

Escolhida a estatística de teste e identificada a sua distribuição amostral o valor de é então calculado com base na amostra e caso dê uma valor “estranho” é porque é razoável admitir que é verdadeira rejeitando assim a suposição da veracidade de . A definição do conceito de valor “estranho” é feita a seguir.

ET

H1

H0

3º Definição da regra de decisão.

De modo a podermos tomar a decisão de rejeitarmos ou não a hipótese nula temos de construir uma regra de decisão que nos permita optar por uma daquelas duas opções. Esta regra de decisão vai basear-se no valor observado de e caso este pertença a um conjunto de valores considerados “estranhos” (no sentido do que seria de esperar caso fosse mesmo verdadeira) decidimos rejeitar (sendo levados a aceitar ).

ET

H0 H0

H1

(6)

Este conjunto de valores “estranhos” para o que seria de esperar caso fosse verdadeira, chama-se Região de Rejeição e define, tipicamente, valores extremos da distribuição amostral da estatística de teste. A compreensão da região de rejeição é melhor conseguida através da realização do exemplo que apresentamos mais à frente.

H0

4º Cálculo da estatística de teste e tomada de decisão.

A fase final de um teste de hipótese consiste em calcular o valor observado de e caso este pertença à região de rejeição rejeitar a hipótese nula (aceitando a hipótese alternativa). Caso contrário, o teste de hipóteses não nos apresenta razões suficientes que nos levem a aceitar como verdadeira (situação em que não rejeitamos ).

ET

H1

H0

Exemplo 5.1:

Consideremos a população de um determinado país e a variável idade dos elementos dessa população. De estudos passados sabemos que a idade de uma pessoa escolhida ao acaso de entre toda a população do país segue uma distribuição normal de valor médio 40 anos e desvio padrão 10 anos. No entanto, diversos estudos têm referido a hipótese de que a população está mais envelhecida. Para testar esta hipótese recolheu-se uma amostra aleatória de 100 pessoas que apresentou uma média de idades de 45 anos.

Hipótese a testar: a população do País está mais velha (µ >40).

Amostra aleatória de 100 elementos que nos forneceu X =45.

O problema passa por saber até que ponto podemos considerar o valor amostral (X =45) suficientemente maior que o valor que se acredita para o parâmetro (µ =40) de modo a rejeitarmos este valor e passarmos a aceitar que a população está mais velha.

Teste de hipóteses

1º Definição das hipóteses.

40 :

40

: 1

0 µ= vs H µ>

H

2º Identificação da Estatística de Teste e caracterização da sua distribuição amostral.

Estando nós a testar o parâmetro valor médio (µ) e sendo a nossa população normalmente distribuída com desvio padrão conhecido (σ =10 ) podemos utilizar a estatística de teste:

(7)

n ET Xσµ

=

que sob as hipóteses atrás definidas tem uma distribuição N(0,1). 3º Definição da regra de decisão.

Como a hipótese a testar (H1:u>40) é de maior (teste unilateral à direita) somos levados a rejeitar a hipótese nula quando a estatística de teste apresentar valores elevados. O problema agora coloca-se em saber a partir de que valor é que a estatística de teste é considerada elevada.

Se a hipótese nula (H0:u=40) for verdadeira a estatística de teste, ET, segue uma distribuição normal padronizada. A região assinalada na figura seguinte corresponde a valores de ET que, se H0 for verdadeira, ocorrem com baixa probabilidade (são valores extremos). Deste modo, tais valores são mais plausíveis se a hipótese alternativa (H1:u>40) for verdadeira.

A região assinalada corresponderá à região de rejeição, desde que seja adoptada a seguinte regra de decisão:

1. se o valor calculado para a estatística de teste pertencer à região de rejeição, isto é se ET >vc , então a hipótese nula será rejeitada (vc designa-se habitualmente por valor crítico).

2. se a estatística de teste não se situar dentro da região de rejeição, então a hipótese nula não será rejeitada e apenas podemos dizer que não encontrámos razões suficientes que nos levem a aceitar H1 como verdadeira.

A probabilidade α, de no caso de H0 ser verdadeira, a ET pertencer à região de rejeição designa-se por nível de significância do teste. O nível de significância do teste representa, então, a probabilidade (ou o risco) de se incorrer no erro de rejeitar H0 quando esta hipótese é de facto verdadeira. Esse erro é o que se designa por erro de tipo I.

(8)

No nosso exemplo e com um nível de significância de 5% obtemos o valor critico de 1.645. Temos então como região de rejeição:

{

: 1.645

}

.R= ET ET >

R

4º Cálculo da estatística de teste e tomada de decisão.

Com base nos valores observados na amostra vamos calcular o valor da estatística de teste:

5 100 10

40

45 =

=

= n ET Xσ µ

Com base neste valor vamos tomar a nossa decisão:

= RR

ET 5 . rejeitar H0.

Conclusão: Temos razões para acreditar que a população do país envelheceu.

5.4. Algumas distribuições

5.4.1 Distribuição t de Student

Diz-se que a variável aleatória X tem distribuição t de Student com n graus de liberdade e escreve-se X t(n) quando a sua f.d.p. tem a forma:

2 1 2

1 2 2

1 )

(

+

⎟⎟

⎜⎜

+

Γ

Γ⎛ +

=

n

n x n n

n x

f

π com

+∞

<

<

x e n>0 (4)

sendo Γ =+∞ para .

0

) 1

(w xw e xdx w>0 Propriedades

1. É uma função simétrica em relação ao eixo x=0. 2. Se X t(n) então demonstra-se que:

2 2 se

) (

0 ) (

>

=

= n n X n Var

X E

(9)

3. O seu aspecto gráfico depende do parâmetro n mas assemelha-se ao da normal.

5.4.2 Distribuição do Qui-quadrado

Diz-se que a variável aleatória tem distribuição do Qui-quadrado com n graus de liberdade e escreve-se quando a sua f.d.p. tem a forma:

X )

2( n X χ

0 , 0 .

2 2 ) 1

( 2 2 1

2

>

>

Γ

= e x n x

n x

f

n x

n (5)

Propriedades

1. É uma função positiva e não simétrica.

2. Se X χ2(n) então demonstra-se que:

n X Var

n X E

2 ) (

) (

=

=

3. O seu aspecto gráfico depende do parâmetro n. Na figura abaixo temos alguns exemplos:

5.4.3 Distribuição F de Snedecor

Diz-se que a variável aleatória tem distribuição F de Snedecor com e graus de liberdade e escreve-se quando a sua f.d.p. tem a forma:

X m n

) , (m n F X

0 2 1

2 ) 2 (

2 2

2

2 >

⎛ +

Γ

Γ

Γ⎛ +

= +

x n x

m x n

m n m

n m x

f m n

m m

com m,n>0 (6)

Propriedades

(10)

1. É uma função positiva e não simétrica.

2. Se X F(m,n), então demonstra-se que:

4 ) se

4 ( ) 2 (

) 2 (

) 2 (

2 2 se

) (

2 2

>

= +

>

=

n n n

m

n m X n

Var n n X n E

3. O seu aspecto gráfico depende dos parâmetros m e n. Na figura abaixo temos alguns exemplos:

4. Se a variável aleatória X F(m,n) então 1 ( , ) m n X F 5.5 Escolha da estatística adequada ao teste

5.5.1 Teste para o valor médio de uma população 1º) População normal com σ conhecido

) 1 , 0 ( N n ET = Xσµ

(7)

Intervalo de confiança para µ: ⎢⎣ + ⎥⎦ z n n X

z

X σ σ

, .

2º) População normal com σ desconhecido e amostra pequena (n<30)

) 1 ' (

= t n

n s ET X µ

(8)

Intervalo de confiança para µ: ⎥⎦

⎢⎣ + n t s n X t s

X '

' ,

.

(11)

3º) População normal ou não com σdesconhecido e amostra grande (n30)

) 1 , 0

' N(

n s ET X

D

= µ

(9)

Intervalo de confiança para µ: ⎥⎦

⎢⎣ + n z s n X

z s

X '

' ,

Nota: Se a população não é conhecida ou é não normal mas a distribuição é aproximadamente normal.

30 n

5.5.2 Teste para a proporção de uma população 1º) Amostra grande (n30)

) 1 , 0 (

*

N n pq

p ET p

D

= (10)

Intervalo de confiança para : p

+

n q z p n p

q z p p

*

*

*

*

*

* , .

5.5.3 Teste para a variância de uma população 1º) População normal

) 1 ' (

) 1

( 2

2 2 2

2 =

= n s ns n

ET χ

σ

σ (11)

Intervalo de confiança para σ2:

2 inf

2 2

sup

2 ( 1) '

' , ) 1 (

χ χ

s n s

n .

5.5.4 Teste para a diferença de valores médios de duas populações.

1º) Amostras independentes, populações normais, σ1e σ2conhecidos

) 1 , 0 ) (

( ) (

2 2 2 1

2 1

2 1 2

1 N

n n X

ET X

+

=

σ σ

µ

µ (12)

Intervalo de confiança paraµ1µ2:

(12)

+ + +

2 2 2 1

2 1 2

1 2

2 2 1

2 1 2

1 ) ,( )

( X X z n n

n z n

X

X σ σ σ σ

2º) Amostras independentes, populações normais, σ1 e σ2 desconhecidos, amostras pequenas (n1<30n2 <30) e sabe-se que σ1 =σ2

) 2 (

1 1

) (

) (

2 1

2 1 2

2 1 2

1 +

⎟⎟

⎜⎜

+

= t n n

n s n

X ET X

p

µ

µ (13)

com 2

' ) 1 ( ' ) 1 (

2 1

2 2 2 2 1 2 1

+ +

+

=

n n

s n s sp n

Intervalo de confiança para µ1µ2:

⎟⎟

⎜⎜

+

+

⎟⎟

⎜⎜

+

2 1 2 2

1 2 1 2 2

1

1 ) 1

( 1 , ) 1

( X X t s n n

n s n

t X

X p p

3º) Amostras independentes, populações normais, σ1 e σ2 desconhecidos, amostras pequenas (n1<30n2 <30) e sabe-se que σ1σ2

) ( '

'

) (

) (

2 2 2 1 2 1

2 1 2

1 t m

n s n s X

ET X

+

= µ µ

(14)

com

1 ' 1 '

' '

2 2 2 2

1 1 2 1

2

2 2 2 1

2 1

+

⎟⎟

⎜⎜

+

=

n n s n

n s

n s n s

m .

Intervalo de confiança para µ1µ2:

+ + +

2 2 2 1

2 1 2

1 2 2 2 1 2 1 2

1

' ) '

( ' , ) '

( n

s n t s X n X

s n t s X X

4º) Amostras independentes, populações normais ou não, σ1e σ2 desconhecidos e amostras grandes (n130n2 30)

(13)

) 1 , 0 ( '

'

) (

) (

2 2 2 1 2 1

2 1 2

1 N

n s n s X ET X

D

+

= µ µ

(15)

Intervalo de confiança para µ1µ2:

+ + +

2 2 2 1 2 1 2

1 2 2 2 1

2 1 2

1

' ) '

( ' , ) '

( n

s n z s X n X

s n z s X X

5º) Amostras dependentes/emparelhadas (D= X1X2), amostras pequenas

) 1

' (

= t n

n s ET D

D

µD

(16)

Intervalo de confiança para µD: ⎥⎦

⎢⎣ +

n t s n D t s

D D 'D

' ,

Nota: Se n30 a distribuição é aproximadamente normal.

5.5.5 Teste para a diferença de proporções de duas populações.

1º) Amostras grandes

) 1 , 0 ) ( (

) (

2 2 2 1

1 1

2 1

* 2

*

1 N

n q p n

q p

p p p ET p

D

+

= (17)

Intervalo de confiança para p1 p2 :

+ +

2

* 2

* 2 1

* 1

*

* 1 2

* 1 2

* 2

* 2 1

* 1

*

* 1 2

*

1 ,

n q p n

q z p p n p

q p n

q z p p p

5.5.6 Teste para o quociente de variâncias de duas populações 1º) Populações normais

(14)

) 1 , 1 ' (

' '

'

2 2 1

2 2 1

2 1 2 2

2 2 2 2

2 1 2 1

=

= F n n

s s s

s

ET σ

σ σ

σ (18)

Intervalo de confiança para 2

2 2

σ1

σ :

sup 2 2 2 1 inf 2 2 2

1 1

' , ' 1 ' '

F s s F s

s .

5.6 Erros associados a um teste de hipóteses

Quando realizamos um teste de hipóteses tomamos uma de duas decisões:

rejeitar ou não rejeitar . Quando tomamos uma destas decisões podemos cometer um de dois erros:

H0 H0

rejeitar H0 e H0 ser a hipótese verdadeira e não rejeitar H0 e H0 ser a hipótese falsa. O primeiro chama-se erro tipo I e o segundo erro tipo II.

Decisão Situação real

baseada na amostra H0 é verdadeira H0 é falsa Não rejeitar H0 Decisão correcta Erro tipo II

Rejeitar H0 Erro tipo I Decisão correcta

A probabilidade de cometermos o erro tipo I é o nível de significância do teste.

Quando definimos à partida o nível de significância do teste estamos assim a quantificar a probabilidade que deixamos para a hipótese de cometermos este tipo de erro. Este valor nunca pode ser zero (as distribuições amostrais tomam valores tipicamente até . Por outro lado, demonstra-se que quando diminuímos a probabilidade de erro tipo I (

+ α) a probabilidade de cometermos o erro de tipo II (β) aumenta.

Define-se como potência de um teste à probabilidade de não cometermos o erro de tipo II ((1β).

5.7 Teste de ajustamento do Qui-quadrado

Um teste de ajustamento, (chamado por vezes de teste da bondade do ajustamento) pretende saber se uma dada amostra pode ser considerada como proveniente de uma população, com distribuição caracterizada por uma dada função (densidade) de probabilidade teórica.

(15)

Dada uma amostra aleatória , retirada de uma população X , e uma certa função (densidade) de probabilidade , o teste de ajustamento tem as seguintes hipóteses:

) ,..., ,

(X1 X2 Xn

)

0(x f

H0: a função (densidade) de probabilidade de é X f0(x) H1: a função (densidade) de probabilidade de não é X f0(x)

A ideia básica do teste do qui-quadrado é a seguinte: construa-se k classes , de valores assumidos por X , de forma a que estas classes constituam uma partição desses valores. Tome-se a amostra ( e calculem-se as frequências absolutas observadas , de cada classe . Assim,

Ak

A A1, 2,...,

) ,..., , 2

1 X Xn

X

oi Ai

oi = número de elementos da amostra que pertencem a (frequências observadas).

Ai

Considere-se a distribuição teórica definida em e calcule-se a probabilidade de cada classe .

H0

pi Ai

) (19)

i

i P X A

p = (

Assim, o número de elementos da amostra que deveriam estar em seria .

Ai i

i n p

e =

ei= número de elementos da amostra pertencentes a quando é verdadeira (frequências esperadas).

Ai H0

Se a hipótese nula for de facto verdadeira, a diferença entre cada valor observado e o respectivo valor esperado não deve ser muito grande. O problema agora coloca-se em saber o que é um valor grande ou um valor pequeno.

Temos de garantir que:

- as diferenças consideradas sejam positivas;

- as diferenças sejam ponderadas;

- a distribuição da estatística de teste utilizada seja conhecida.

Kearl Pearson apresentou a seguinte estatística:

( )

= = k

i i

i i

e e ET o

1

2

(20)

que, sendo verdadeira a hipótese nula, tem distribuição do qui-quadrado com graus de liberdade, onde é o número de parâmetros que foi

1

m

k m

(16)

necessário estimar (utilizando a amostra) de modo que a distribuição da o definida por H0 ficasse tota ente definida.

populaçã lm

Referências

Documentos relacionados

1-Categoria ELITE COMPETIDOR, NÃO será permitido o uso de apoio externo de qualquer espécie, MUITO MENOS AUXÍLIO DE QUALQUER OUTRO PARTICIPANTE DA PROVA, exceto

4. O Grupo de Orientação deverá reunir em todos os momentos de avaliação para definição de estratégias e organização do trabalho de acompanhamento a desenvolver com os alunos;

A Universidade Federal da Paraíba, doravante denominada UFPB, neste ato representada pela Pró-Reitoria de Graduação- PRG, por meio da Coordenação de Programas e Projetos

conjunto de valores razoavelmente compat´ıveis com a amostra decidir entre dois valores o mais compat´ıvel com a amostra decidir se a amostra ´ e compat´ıvel com certo valor θ 0

LEG: Laborat´ orio de Estat´ıstica e Geoinforma¸ c˜ ao Universidade Federal do Paran´ a. 30 de julho

OBS: Considerar tempo em horas truncadas é quantitativa discreta porém tempo é uma medida não enumerável e é uma variável quantitativa contínua.. (c) Grau

Neste caso, não se trata de um comércio competitivo (que é típico de zonas onde mercadorias similares, mas produzidas por produtores diversos, disputam o mesmo mercado): os

Sobre à duração foram avaliados como temporário para as águas superficiais e, permanente, para os outros dois itens.. Todos os três itens foram qualificados como,