• Nenhum resultado encontrado

Aula 14 - Testes de Hipóteses

N/A
N/A
Protected

Academic year: 2021

Share "Aula 14 - Testes de Hipóteses"

Copied!
27
0
0

Texto

(1)

Testes de Hip´oteses

Jonathas Magalh˜aes

jonathas@ic.ufal.br

(2)

Roteiro

1 Introdu¸c˜ao

2 Definindo Hip´oteses

3 Testes Estat´ısticos

Caracter´ısticas dos Dados P-valor

N´ıvel de Significˆancia Teste t de Student

(3)

Introdu¸c˜

ao

Desenvolver e formalizar hip´oteses;

Decidir sobre o teste estat´ıstico mais apropriado; Realizar o teste;

(4)

Definindo Hip´

oteses

Exemplos:

A m´edia de aceita¸c˜ao do produto A ´e 90%;

Em m´edia, o combust´ıvel X ´e menos poluente que o combust´ıvel Y;

Hip´otese nula (H0) – o teste avalia evidˆencias contra hip´otese;

Hip´otese alternativa (HA ou H1) – ´e o que supomos e

(5)

Definindo Hip´

oteses

Exemplos:

H0: µX = µY HA : µX 6= µY;

H0: µX ≤ µY HA : µX > µY;

H0: µX ≥ µY HA : µX < µY;

A hip´otese nula e alternativa s˜ao complementares e

(6)

Testes Estat´ısticos

Diversos tipos de testes existem;

A escolha do teste depende das caracter´ısticas dos dados

Tipo do dado; Normalidade; Paridade; Etc.

(7)

Testando a Normalidade – Shapiro-Wilk

Um dos testes mais utilizados para medir a normalidade ´e o Shapiro-Wilk;

Muito adequado para amostras pequenas e m´edias; Hip´oteses do teste:

H0– A amostra ´e origin´aria de uma popula¸c˜ao que tem

distribui¸c˜ao normal;

HA – A amostra n˜ao ´e origin´aria de uma popula¸c˜ao que tem

(8)

Testando a Normalidade – Shapiro-Wilk

1 O teste Shapiro-Wilk Retorna uma estat´ıstica W e o p-valor;

2 Significado do p-valor:

Se p-valor ≤ α ent˜ao a amostra ´e origin´aria de uma popula¸c˜ao que n˜ao ´e normal;

Se p-valor > α ent˜ao a amostra ´e origin´aria de uma popula¸c˜ao normal.

3 No R:

(9)

Compara¸c˜

oes Pareadas e N˜

ao Pareadas

Compara¸c˜ao Pareada:

Existe uma correspondˆencia um-a-um entre os dados dos dois grupos;

Exemplo:

Comparar a press˜ao arterial de um paciente antes e ap´os tomar algum medicamento;

Compara¸c˜ao n˜ao Pareada:

O n´umero de casos ´e igual mas n˜ao h´a correspondˆencia entre os testes, ou;

O n´umero de casos pode ser diferente. Exemplo:

(10)

Testes Estat´ısticos

Um teste estat´ıstico retorna dois resultados poss´ıveis:

Rejeitar a hip´otese nula – Encontrar significˆancia ou resultado significante naquilo que estamos investigando;

N˜ao rejeitar a hip´otese nula – Indica que n˜ao encontramos no estudo espec´ıfico evidˆencias para rejeit´a-la.

P-valor (p-value)

Um n´umero no intervalo [0,1] que indica um n´ıvel de probabilidade.

(11)

Sobre o p-valor

Probabilidade da estat´ıstica computada no teste ser obtida

assumindo que a hip´otese nula ´e verdadeira;

Quanto menor o p-valor maior a evidˆencia contra a hip´otese

nula;

Comparamos o p-valor com o n´ıvel de significˆancia (α) que

desejamos ser capazes de encontrar com o teste

(12)

N´ıvel de Significˆ

ancia

Fixar em um valor e tornar o resultado do teste um valor bin´ario:

p-valor ≤ α? Rejeita H0;

p-valor > α? Aceita H0.

Outros autores sugerem estabelecer n´ıveis de rejei¸c˜ao para o

(13)

Teste de Hip´

otese – Algoritmo

1 Formular hip´oteses nula (H0) e alternativa (HA);

2 Realizar o experimento e coletar os dados;

3 Escolher o teste estat´ıstico adequado e definir o ´ındice de

significˆancia (α);

4 Computar a estat´ıstica e identificar o p-valor;

(14)

Qual Teste Escolher?

Comparar uma amostra a um valor hipot´etico

Dados normais

Teste t de Student;

Dados n˜ao normais

Teste Wilcoxon rank sum.

Comparar duas amostras

Dados normais (pareadas ou n˜ao)

Teste t de Student;

Dados n˜ao normais (pareados)

Teste Wilcoxon rank sum.

(15)

Teste t de Student

A popula¸c˜ao de onde vem a amostra deve ser normal;

Usado para comparar m´edias.

Deve-se definir as hip´oteses nula e alternativa;

Para avaliar m´edia de 1 ou dois grupos/aternativas.

Computa-se uma estat´ıstica t, que representa uma m´edia padronizada ou uma diferen¸ca m´edia entre dois grupos;

Se H0 for aceita, essa estat´ıstica obedece uma certa

distribui¸c˜ao t de Student

(16)

Teste t de Student – Exemplo 1

A turma de Engenharia Qu´ımica obteve as seguintes notas em C´alculo 2: [6, 7.6, 4, 1, 2, 5.7, 8, 9, 3.4, 9.2, 4, 8, 7, 5, 9]

a D´a para afirmar estatisticamente que a m´edia da turma foi

maior que 5?

b D´a para afirmar estatisticamente que a m´edia da turma foi

(17)

Teste t de Student – Exemplo 1

Vamos verificar se os dados s˜ao normais;

Aplicando-se o teste Shapiro-Wilk :

> quimica = c (6 , 7.6 , 4 , 1 , 2 , 5.7 , 8 , 9 , 3.4 , 9.2 , 4 , 8 , 7 , > shapiro . test ( quimica )

Shapiro - Wilk normality test data : quimica

W = 0.937 , p - value = 0.3467

Como p-value> α ent˜ao H0 ´e aceita, logo:

(18)

Teste t de Student – Exemplo 1

Como os dados s˜ao normais, ent˜ao podemos aplicar o teste t;

Hip´oteses para a letra a:

HA – A m´edia da turma ´e maior que 5;

(19)

Teste t de Student – Exemplo 1

Aplicando-se o teste t de Student:

> t . test ( quimica , mu =5 , alternative = " greater " ) One Sample t - test

data : quimica

t = 1.3665 , df = 14 , p - value = 0.09666

alternative hypothesis : true mean is greater than 5 95 percent confidence interval :

4.732278 Inf sample estimates : mean of x

5.926667

(20)

Teste t de Student – Exemplo 1

Hip´oteses para a letra b:

HA – A m´edia da turma ´e maior que 4;

(21)

Teste t de Student – Exemplo 1

Aplicando-se o teste t de Student:

> t . test ( quimica , mu =4 , alternative = " greater " ) One Sample t - test

data : quimica

t = 2.8412 , df = 14 , p - value = 0.006538

alternative hypothesis : true mean is greater than 4 95 percent confidence interval :

4.732278 Inf sample estimates : mean of x

5.926667

(22)

Teste t de Student – Exemplo 2

A turma de Engenharia Qu´ımica obteve as seguintes notas em C´alculo 2: [6, 7.6, 4, 1, 2, 5.7, 8, 9, 3.4, 9.2, 4, 8, 7, 5, 9] enquanto que a turma de Engenharia Civil obteve as seguintes notas: [5, 8, 2, 1, 0, 2.4, 3.1, 7, 7.3, 3, 1, 4, 9, 8.6, 8].

D´a para afirmar estatisticamente que a turma de Engenharia

(23)

Teste t de Student – Exemplo 2

Vamos verificar se os dados s˜ao normais;

Verificaremos s´o os dados de Civil, pois j´a fizemos este procedimento para Qu´ımica.

Aplicando-se o teste Shapiro-Wilk :

> civil = c (5 , 8 , 2 , 1 , 0 , 2.4 , 3.1 , 7 , 7.3 , 3 , 1 , 4 , 9 , 8.6 > shapiro . test ( civil )

Shapiro - Wilk normality test data : civil

W = 0.9122 , p - value = 0.1463

Como p-value> α ent˜ao H0 ´e aceita, logo:

(24)

Teste t de Student – Exemplo 2

Como ambos os dados s˜ao normais, ent˜ao podemos aplicar o

teste t; Hip´oteses:

HA – A m´edia da turma de Qu´ımica ´e maior que a m´edia da

turma de Civil;

H0– A m´edia da turma de Qu´ımica ´e menor ou igual a m´edia

(25)

Teste t de Student – Exemplo 2

Aplicando-se o teste t de Student:

> t . test ( quimica , civil , alternative = " greater " ) Welch Two Sample t - test

data : quimica and civil

t = 1.2366 , df = 27.233 , p - value = 0.1134

alternative hypothesis : true difference in means is greater 95 percent confidence interval :

-0.4901241 Inf

sample estimates : mean of x mean of y

5.926667 4.626667

(26)

Teste t de Student – Exemplo 2

A hip´otese nula de que “A m´edia da turma de Qu´ımica ´e

menor ou igual a m´edia da turma de Civil.”;

Podemos verificar se existe diferen¸ca entre as m´edias.

Definindo hip´oteses:

HA – A m´edia da turma de Qu´ımica ´e diferente da m´edia da

turma de Civil;

H0– A m´edia da turma de Qu´ımica ´e igual a m´edia da turma

(27)

Teste t de Student – Exemplo 2

Aplicando-se o teste t de Student:

> t . test ( quimica , civil )

Welch Two Sample t - test data : quimica and civil

t = 1.2366 , df = 27.233 , p - value = 0.2268

alternative hypothesis : true difference in means is not equa 95 percent confidence interval :

-0.8562275 3.4562275 sample estimates : mean of x mean of y

5.926667 4.626667

Referências

Documentos relacionados

A abordagem para o teste não é simétrica com relação às hipóteses nula e alternativa, pois consideramos somente testes com a propriedade de que a probabilidade de rejeitar

O CEA participa, desde 2007, no projeto &#34;Engenharia no Verão&#34; integrado nas atividades promovidas pelo Centro de Ciência Viva da Agência Nacional para a Cultura Científica e

Sabemos que os livros tendem a ser muito padronizados, pois não só as temáticas, como é compreensível, são muito similares, mas o olhar dos autores, no geral oriundos da

Presentation of Poster / Painel no(a) XV Colóquio Brasileiro de Dinâmica Orbital,

• Com isso, o fluxo de produto na Ásia está se alterando e, em alguns anos, poderemos ter a China influindo tanto no mercado de arroz como o que já ocorre no mercado da soja...

O coeficiente estimado da vari´ avel Def ault jt−1 , estatisticamente signifi- cante a 5% e que testa (H1), n˜ ao permite rejeitar a hip´ otese de que devedores com menor qualidade

Portanto, rejeitamos a hip´ otese de que as m´ edias de comprimentos populacionais sejam iguais, em favor na hip´ otese de que a m´ edia populacional da praia mansa ´ e maior que a

Portanto, em um teste com n´ıvel de significˆ ancia de 0.01 n˜ ao h´ a evidˆ encias suficientes para rejeitar a hip´ otese de que as salinidades m´ edias dos dois oceanos s˜