• Nenhum resultado encontrado

UNIVERSIDADE FEDERAL DA PARAÍBA

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE FEDERAL DA PARAÍBA"

Copied!
18
0
0

Texto

(1)

UNIVERSIDADE FEDERAL

DA PARAÍBA

Modelos de Probabilidade e Inferência Estatística

Departamento de Estatística

Luiz Medeiros

(2)

Estimação dos parâmetros e diagnóstico do modelo

Estimativas da média geral e dos efeitos dos tratamentos:

.. i. i ..

y

y

τˆ

y

µ

=

=

)

y

τˆ

µˆ

µˆ

=

+

=

Estimativa pontual de µ

i

: dado µ

i

= µ+ τ

i

, temos:

i. i

i

µˆ

τˆ

y

µˆ

=

+

=

Verificar se as pressuposições básicas do modelo são válidas.

Isso é realizado através de uma análise de resíduos. Define-se

o resíduo da ij-ésima observação como:

ij ij ij

y

e

=

modelo.

pelo

preditos

valores

y

τˆ

µˆ

onde

ij

=

+

i

=

i.

(3)

T

ESTES NÃO

-

PLANEJADOS PARA

COMPARAÇÃO DE MÉDIAS



Se o teste realizado na ANOVA é significante, a única certeza

é a de que existe no mínimo um par de médias diferente, mas

não se sabe quantas e, pior ainda, quais.



Para se determinar qual(is) o(s) par(es) de médias diferentes

após a realização da ANOVA, é realizado o que se denomina

teste não-planejado, teste a posteriori ou teste pos hoc. Os

teste não-planejado, teste a posteriori ou teste pos hoc. Os

mais conhecidas são:

• Teste de Scheffé – Para comparações múltiplas

• Teste de Bonferroni – Comparar médias duas a duas (Dados balanceados eou

não balanceados)

• Teste de Tukey (HSD) – Comparar médias duas a duas • Teste de Duncan – Comparar médias duas a duas

• Teste de Dunnet – Quando se quer comparar as médias do tratamento

(4)

T

ESTE DE

T

UKEY

(HSD)

 É um dos testes de comparação de média mais utilizado, por ser

bastante rigoroso e de fácil aplicação;

 É um teste exato em que, para a família de todas as comparações

duas a duas, a taxa de erro da família dos testes é exatamente α (e o intervalo de confiança é exatamente 1-α). Métodos de comparações múltiplas exatos são raros;

múltiplas exatos são raros;

 Não permite comparar grupos de tratamentos entre si;

 É utilizado para testar toda e qualquer diferença entre duas médias

de tratamento;

 É aplicado quando o teste “F” para tratamentos da ANOVA (análise

(5)

T

ESTE DE

T

UKEY

(HSD)

DADOS BALANCEADOS

 O teste de Tukey tem como base a DMS (diferença mínima significativa). Para dados

balanceados é calculado da seguinte forma:

Em que n é o número de réplicas do tratamento (nível), qα é um valor tabelado (Tabela do Teste de Tukey) e QMErro é o quadrado médio do erro.

n QMErro g N g q DMS = α ( , − )

(Tabela do Teste de Tukey) e QMErro é o quadrado médio do erro.

 Rejeita-se a igualdade da média de dois tratamentos (i e l) se:

 Um intervalo de confiança de 100(1-α)% para a diferença entre todos os pares de

médias é dado por:

.

. .

y

TSD

y

i

l

>

n QMErro g N g q y yi.l. ± α ( , − )

(6)
(7)

Exemplo - O experimento de absorbância

Tabela da análise de variância dos valores de absorbância. Causas de variação Soma de quadrados Graus de liberdade Quadrados médios Fcalc Entre solventes 0,5413 4 0,1353 212,806 (P<0,0001) Erro 0,0127 20 0,0006 F =4,43 Erro 0,0127 20 0,0006 Total 0,5540 24 F(0,01;4;20)=4,43

Rejeita-se H0, e concluímos que as médias de tratamentos diferem entre si; os solventes afetam significativamente as médias de absorbância.

(8)

Comparações entre Pares de Médias

.

,

os

todos

para

,

µ

µ

:

H

0

i

=

l

i

l

Número de comparações: g(g-1)/2.

Devem ser realizadas após o teste F da análise de

variância rejeitar a hipótese nula

(9)

Teste de Tukey

Exemplo: Dados de absorbância. O valor da Diferença Mínima Significativa é:

0479 , 0 5 00064 , 0 23 , 4 ) 20 ; 5 ( 05 , 0 = = = n QMErro q DMS > = − = − < = − = − 3 1 2 1 (0,0479) DMS 0,0897 0,4496 0,5393 y (0,0479) DMS 0,0276 0,5669 0,5393 y y y = − = − = − = − = − = − > = − = − > = − = − > = − = − 5 4 5 3 4 3 5 2 4 2 3 2 5 1 4 1 3 1 y y y y y y (0,0479) DMS 0,3425 0,1968 0,5393 y (0,0479) DMS 0,0685 0,6078 0,5393 y (0,0479) DMS 0,0897 0,4496 0,5393 y y y y y y y y y y

(10)

E70 = 0,6363 A

EAW = 0,5669 A B E50 = 0,5393 B MAW = 0,4496 C

M1M = 0,1968 D

Médias seguidas de mesma letra, em uma mesma coluna, não Médias seguidas de mesma letra, em uma mesma coluna, não apresentam diferenças significantes, ao nível de significância de 5%, pelo teste de Tukey.

Conclusão: pelo teste de Tukey, ao nível de significância de 5%, as médias

dos tratamentos E50 e EAW, assim como as médias dos tratamentos EAW e E70 não apresentam diferenças significantes. As médias dos tratamentos E50 e E70 apresentam diferença significante. As médias dos tratamentos MAW e M1M apresentam diferença significativa de todos os tratamentos.

(11)

EXEMPLO: 3 GRUPOS DE CRIANÇAS RECEBERAM DIFERENTES NÍVIES DE MOTIVAÇÃO PARA A MATEMÁTICA. DEPOIS SE FEZ UM EXAME. HÁ DIFERENÇAS SIGNIFICATIVAS ENTRE OS 3 NÍVEIS DE MOTIVAÇÃO (BAIXA, MÉDIA E ALTA)?

Grupo 1 Grupo 2 Grupo 3

4 16 12 144 1 1 5 25 8 64 3 9 4 16 10 100 4 16 4 16 10 100 4 16 3 9 5 25 6 36 6 36 7 49 8 64 10 100 9 81 5 25 1 1 14 196 3 9 8 64 9 81 2 4 5 25 4 16 2 4 X1 X12 X 2 X22 X3 X32 Média = 5,11 Média = 8,67 Média = 3,78

(12)

Tabela da análise de variância dos níveis de motivação. Causas de variação Soma de quadrados Graus de liberdade Quadrados médios Fcalc Entre solventes 114,96 2 57,48 7,82 Erro 176,45 24 7,35

F

tab (g-1; N-g; 1-α)

= F

tab (2; 24; 0,05)

= 3,403

Concluindo, F

calc

> F

tab

, portanto, rejeita-se H

0

.

(13)



Conclui-se, através do teste, que pelo menos uma média

se difere das demais.



Em quais tratamentos ocorreram essa diferença?



Utilize o teste de Tukey (α=0,05) para encontrar as



Utilize o teste de Tukey (α=0,05) para encontrar as

(14)
(15)

E

XEMPLO

1

InsectSprays # ver o banco de dados

boxplot(count ~ spray, data = InsectSprays, col = "lightgray") # gerar o boxplot entre count e spray

anava <- aov(count~spray,data=InsectSprays) # gerar a anova

summary(anava) # resultado da anova

ep = as.vector(rstandard(anava)) # resíduo padronizado

shapiro.test(ep) # teste de normalidade

library(lmtest) # biblioteca para utilizar o teste dwtest

dwtest(anava) # teste de independência - Durbin Watson

(16)

E

XEMPLO

2

ex2 <- read.csv("banco1.txt",header=T,dec=".",sep="") ## ler o banco attach(ex2)

names (ex2)

boxplot(nm ~ trat, data = ex2, col = "red") # gerar o boxplot entre count e spray anava <- aov(nm~trat,data=ex2) # gerar a anova

summary(anava) # resultado da anova ep = as.vector(rstandard(anava)) shapiro.test(ep) # teste de normalidade

dwtest(anava) # teste de independência - Durbin Watson

bartlett.test(nm ~ trat, data = ex2) # teste de homocedasticidade

Tukey <- TukeyHSD(anava,wich="trat", ordered = F,conf.level = 0.95) # gerar o teste de Tukey Tukey # resultado do teste

(17)

E

XEMPLO

3

x <- rchisq(10, df = 9) y<- rgamma(10, 10, 2) z<- rbeta(10, 1, 2) vr<-c(x,y,z) tr<-c(rep(1,10),rep(2,10),rep(3,10)) ex3<-cbind(vr,tr)

ex3 # ver o banco de dados ex3 # ver o banco de dados

boxplot(vr ~ tr, col = "red") # gerar o boxplot

anava <- aov(vr~tr) # gerar a anova

summary(anava) # resultado da anova

ep = as.vector(rstandard(anava))

shapiro.test(ep) # teste de normalidade

dwtest(anava) # teste de independência - Durbin Watson

(18)

E

XEMPLO

4

x <- rnorm(20, 5, 1) y<- rnorm(20, 15, 1) z<- rnorm(20, 25, 1) vr<-c(x,y,z) tr<-c(rep(1,20),rep(2,20),rep(3,20)) ex4<-cbind(vr,tr)

boxplot(vr ~ tr, col = "red") # gerar o boxplot anava <- aov(vr~tr) # gerar a anova

summary(anava) # resultado da anova ep = as.vector(rstandard(anava)) shapiro.test(ep) # teste de normalidade

dwtest(anava) # teste de independência - Durbin Watson bartlett.test(vr ~ tr) # teste de homocedasticidade

Tukey <- TukeyHSD(anava,wich="trat", ordered = F,conf.level = 0.95) # gerar o teste de Tukey Tukey # resultado do teste

Referências

Documentos relacionados

Na Região Sul, os três estados que a compõem aumentaram a quantidade produzida; enquanto na Região Sudeste o aumento foi comandado pelo Estado de Minas Gerais, dado que São Paulo

O discurso jurídico dos operadores do direito, revestido de poder, dominação e principalmente falta de conhecimentos específicos sobre o abuso sexual de crianças

Em 2008 foram iniciadas na Faculdade de Educação Física e Desportos (FAEFID) as obras para a reestruturação de seu espaço físico. Foram investidos 16 milhões

intitulado “O Plano de Desenvolvimento da Educação: razões, princípios e programas” (BRASIL, 2007d), o PDE tem a intenção de “ser mais do que a tradução..

No Brasil, a falta de uma fiscalização mais rigorosa é uma das razões que possibilitam que certas empresas utilizem os estágios como forma de dispor de uma mão-de-obra qualificada,

Dessa forma, diante das questões apontadas no segundo capítulo, com os entraves enfrentados pela Gerência de Pós-compra da UFJF, como a falta de aplicação de

Passando-se a análise da impugnação apresentada pela empresa TELEFÔNICA BRASIL S/A, a mesma, em síntese, alega a impossibilidade de garantia de velocidade que

BUSCA ANO A utilização do ICA- AtoM como plataforma de acesso, difusão e descrição dos documentos arquivísticos de instituições públicas Eliseu dos Santos Lima; Daniel