• Nenhum resultado encontrado

Os parâmetros mais frequentemente

No documento Estatística e Probabilidades (páginas 162-171)

investigados

através dos testes

de hipóteses

são: a média, o

desvio-padrão, no

caso de variáveis

quantitativas e

a proporção, no

caso de variáveis

categóricas.)

a distribuição t para avaliar a probabilidade em questão. Como no presente exemplo temos uma amostra de tamanho igual a 36, podemos trabalhar com a distribuição normal padronizada. Nomeamos o valor obtido da estatística de teste, que é calculada de acordo com a fórmula abaixo:

Z = - μ

Essa fórmula permite que a média amostral obtida passe de

qualquer escala (em gramas, no presente exemplo) para número de desvio-padrão. Isso possibilita traçar comparações com os valores de probabilidade da distribuição normal padronizada (em que a unidade de medida é a quantidade de desvio-padrão). Sem esse procedimento, essa comparação seria pouco viável. A fórmula é composta dos seguintes itens:

Z: Escore da distribuição normal padronizada : Média obtida através da amostra

μ: Valor da média populacional a ser testada

σx: Valor do desvio-padrão da distribuição das médias amostrais. σx

σx = σ √n

Caso não se conheça o desvio-padrão populacional σ (situação muito comum), podemos utilizar o desvio-padrão obtido através da amostra:

sx = s √n

Dessa forma, a estatística de teste passa a ser:

Z = - μ s/√n

Com os dados do problema, temos então:

Z = 502 - 500 = 4,0

O número obtido significa que 502 gramas encontram-se a 4,0 desvios-padrão de distância da média populacional de 500 gramas. Mas esse valor é perto ou longe da média populacional?

• Quando Z = 0, pode-se afirmar que a média amostral é exatamente igual ao valor hipotético da média populacional.

• Quando Z = 1, a probabilidade do valor da média amostral ter sido obtido devido à flutuação amostral é de aproximadamente 34%, pois 68% dos dados encontram-se a até um desvio-padrão de distância da média, conforme a figura 35.

3/√36

FIGURA 35 - Área da distribuição normal padronizada de acordo com o número de desvios-padrão.

Fonte: TRIOLA, 2013, p. 88.

• Quando Z = 2, a probabilidade do valor da média amostral ter sido obtido devido à flutuação amostral é de

aproximadamente 5%, pois 95% dos dados encontram-se a até um desvio-padrão de distância da média4.

• Quando Z = 3, a probabilidade do valor da média amostral ter sido obtido devido à flutuação amostral é de aproximadamente 0,2%, pois 99,8% dos dados encontram-se a até um desvio-padrão de distância da média.

Utilizando o mesmo raciocínio, com o valor de Z = 4,0, depreende-se que a probabilidade do valor da média amostral ter sido obtida devido à flutuação amostral seja bem menor que 0,2%. Dessa forma, o valor de Z = 4 significa que os 502 gramas obtidos pela amostra apresentam uma grande distância dos 500 gramas propostos na hipótese nula (a distância de 2 gramas corresponde a 4 desvios-padrão). O fato dos valores serem tidos como distantes implica na

rejeição da hipótese nula. Para definir quais valores do escore Z são considerados altos, utiliza-se o desenho da distribuição normal padronizada, conforme o 3º passo.

Os valores acima podem ser obtidos através de um software

estatístico, ou pela tabela Z.

3ª etapa: Obtenção da região de rejeição

Para tomar a decisão de rejeitar ou não a hipótese nula, podemos utilizar o diagrama da figura 36:

4 - Observe pela Figura 35 que 34% + 13,5% = 47,5%. Ao multiplicarmos esse valor por dois, obtemos os 95%.

FIGURA 36 - Regiões de rejeição da hipótese nula

Fonte: Elaborado pelo autor.

A figura 36 representa a distribuição normal padronizada. A área em vermelho refere-se à região de rejeição da hipótese nula. Valores menores que - 1,96 padrão ou maiores que + 1,96 desvios-padrão são considerados demasiadamente afastados quando consideramos uma significância de 5% para o teste bilateral (ou seja, podemos considerar que tais valores sejam pontos de corte). Dessa forma, cada uma das áreas em vermelho representa 2,5% dos dados. A área total abaixo dos dados (soma da área verde com a área vermelha) representa 100% dos dados.

Quando o valor da estatística de teste encontra-se na região em vermelho, consideramos pouco provável que a média amostral (ou outra estatística) tenha sido resultado das flutuações amostrais. Os valores críticos (- 1,96 e 1,96) foram obtidos pelo percentil 97,5 da tabela da distribuição normal padronizada. Podem ser calculados também através de softwares estatísticos. A figura 37 indica de onde os dados foram obtidos.

Devemos procurar na tabela o valor do nível de significância dividido por 2, ou seja α⁄2, pois o teste é bilateral, o que implica em duas regiões de rejeição (as caudas direita e esquerda da distribuição, conforme a figura 37). Observe que a combinação da linha com a coluna gera o valor do escore Z = 1,96. O número 1,96 foi obtido

através da combinação da coluna e linha formados pelo valor 0,0250 referente à área da cauda direita (ou esquerda) da distribuição normal padronizada.

FIGURA 37 - Distribuição normal padrão

4ª etapa: Conclusão

Com base nos valores obtidos pela estatística de teste e pela região de rejeição, tomamos uma decisão em relação à hipótese nula. No caso em questão, a decisão é rejeitá-la, pois o valor 4 desvios-padrão (relativo aos 2 gramas de distância entre a média amostral e a média populacional proposta na hipótese nula) pode ser considerado muito longe da média, uma vez que se encontra na parte vermelha do diagrama. A estatística de teste no valor de 4,00 é maior do que o valor crítico de + 1,96 (número obtido na tabela da Figura 37, que serve de referência para rejeição ou não rejeição da hipótese nula).

Exemplo 13

Um processo foi delineado para fabricar bancadas de tamanho igual a 120 centímetros. Para verificar se o processo encontra-se sob controle, um especialista coletou uma amostra de 64 peças. Foi obtida uma média amostral = 120,2 centímetros, com desvio-padrão s = 1,6 centímetros. Teste a hipótese de que o processo encontra-se sob controle, ou seja, que a média populacional μ seja igual a 120 centímetros. Use significância de 10%.

1ª etapa: Estabeleça as hipóteses de interesse

H0 : μ = 120 centímetros

H1 : μ ≠ 120 centímetros

2ª etapa: Obtenção da estatística de teste

Z = - μ s/√n

Com os dados do problema, temos então: Z = 120,2 - 120,0 = 1,0

3ª etapa: Obtenção da região de rejeição

1,6/√64

FIGURA 38 - Regiões de rejeição da hipótese nula.

Fonte: Elaborado pelo autor.

O valor crítico de 1,645 positivo (ou negativo) foi obtido pela combinação da linha e coluna relativas à área igual a 0,050 (0,100 dividido por 2)5 da tabela da distribuição normal padrão da figura 38.

5 - O valor 0,10 refere-se aos 10% escolhidos como nível de significância pelo pesquisador. Tal valor consiste na probabilidade de rejeitar a hipótese nula, dado que ela é verdadeira, ou seja, probabilidade de tomar uma decisão equivocada em relação à hipótese.

FIGURA 39 - Distribuição normal padrão

4ª etapa: Conclusão

Como o valor de Z = 1,00 obtido pela estatística de teste não supera a valor crítico de 1,645, ou seja, não pertence à região crítica, não rejeitamos a hipótese nula. Não podemos descartar a hipótese de que a média seja 120 centímetros. Portanto, há indícios de que o processo encontra-se sob controle.

Testes de hipóteses para amostras

No documento Estatística e Probabilidades (páginas 162-171)

Documentos relacionados