MEM CAP4

(1)

4.1 TESTES SIMULTÂNEOS EM VÁRIAS VARIÁVEIS

Se as unidades estão em dois ou mais grupos, então uma diferença de médias para cada variável pode ser realizada.

Problema: uso repetido de testes de significância, com cada um deles tendo uma certa probabilidade de levar a uma conclusão errada (α)

A probabilidade de falsamente encontrar pelo menos uma diferença significante acumula com o número de testes aplicados, de modo que ela pode se tornar inaceitavelmente grande.

Existem testes de hipóteses globais para vetores de médias, para testar se as médias de todas as variáveis são as mesmas versus que as médias diferem para pelo menos uma variável.

4.2 COMPARAÇÃO DE VALORES MÉDIOS PARA DUAS AMOSTRAS: O CASO UNIVARIADO

Considere a v.a. X “comprimento total” sobre as medidas do corpo de 49 pardocas (n1=21

sobreviventes e n2=28 não sobreviventes), Tabela.1.1

Questão: A média desta variável foi a mesma para sobreviventes e não-sobreviventes? Abordagem: Teste t, sob a suposição de que X é normalmente distribuída em todas as amostras, com variância interna comum, a estatística:

t=(xˉ1-xˉ2){s√(1/n1+1/n2)} 4.2

em que xˉ1 e xˉ2 são as médias para duas populações diferentes e s é a estimativa combinada, tem distribuição t-Student com n1+n2-2 graus de liberdade. Aqui,

sj2=Σi(xij-xˉj)2/(nj-1) 4.1

e

s2={(n1-1)s12+(n2-1)s22}/(n1+n2-2) 4.3

- Teste robusto para suposição de normalidade e homogeneidade de variância (s12/s22 є[0,4;

2,5] e

Teste t modificado de Welch (1951): Assumindo normalidade, mas variâncias desiguais, a estatística:

t=(xˉ1-xˉ2)/{√(s12/n1+s22/n2)} 4.4

tem distribuição t com v=(w1=w2)2/{w12/(n1-1)+w22/(n2-1)} 4.5

Obs.: em caso de não normalidade e de variâncias desiguais, não é confiável testar uma diferença nas médias populacionais Manly e Francis (2002).

4.3 COMPARAÇÃO DE VALORES MÉDIOS PARA DUAS AMOSTRAS: O CASO MULTIVARIADO

Questão: Será que os grupos S e NS diferem entre si em média, considerando todas as variáveis simultaneamente?

(2)

Solução: Teste T2 de Hotteling, que é uma generalização (quadrado) da t-Student univariada.

T2=n1n2(xˉ1-xˉ2)TC-1(xˉ1-xˉ2)/(n1+n2) 4.7

em que xˉk é um vetor de médias p×1 sobre p variáveis X1, X2,...,Xp:

xˉk =

C={(n1-1)C1+(n2-1)C2}/(n1+n2-2)} 4.6

sendo C1 e C2 matrizes de variâncias e covariâncias amostrais.

Um valor significativamente grande para essa estatística é evidência de que os dois vetores de médias populacionais são diferentes.

Estatística transformada:

F=(n1+n2-p-1)T2/{(n1+n2-2)p} 4.8

segue uma distribuição F com p e (n1+n2-p-1) graus de liberdades. A estatística T2 é uma forma quadrática:

T2={(n1n2)/(n1+n2)}ΣipΣkp(xˉ1i-xˉ2i)cik(xˉ1k-xˉ2k) 4.9

a qual pode ser bem mais simples de calcular. Aqui, xˉji é a média da variável Xi na j-ésima

amostra (grupo) e cik é o elemento na i-ésima linha e k-ésima coluna da matriz inversa C-1. PRESSUPOSIÇÕES: As duas amostras são provenientes de distribuições normais multivariadas com matrizes de covariâncias iguais, particularmente com tamanhos amostrais iguais (Carter et. Al. 1979).

- Teste robusto para suposição de normalidade multivariada e homogeneidade de matrizes de variância e covariância, particularmente com tamanhos de amostras iguais.

Obs.: em caso de heterogeneidade de matrizes de variâncias e covariância e se os tamanhos amostrais também são muito diferentes, um teste modificado (Yao, 1965) pode ser usado, mas ainda é apoiado na suposição de normalidade multivariada.

EXEMPLO 4.1 TESTANDO VALORES MÉDIOS PARA AS PARDOCAS DE BUMPUS Teste t univariado para S e NS, segunda a variável X1 “comprimento” total. :

Dados: com n1=21, xˉ1=158,43 e s12=11,05; com n2=28, xˉ2=157,38 e s22=15,07. Assim, a

variância combinada fica:

s2=(20×11,05+27×15,07)/47=13,36 e a estatística t é:

t=(157,38-158,43)/√({13,36(1/21+1/28)}=-0,99

Com n1+n2-2=47 gl, este valor t não é significativamente diferente de zero ao nível de 5%, de forma que não há evidência de uma diferença na média populacional entre S e NS com

x1

x2

... xp

(3)

relação a X1, comprimento total dos pássaros. A Tabela 4.1 pg 52 resume os resultados para

cada uma das seis variáveis.

Teste T2 multivariado para S e NS:

xˉ1 = e C1 =

xˉ1 = e C2=

Matriz de covariâncias combinada amostral:

C=(20C1+27C2)/47=

O elemento na segunda linha e terceira coluna é:

(20×1,910+27×3,398)/47=2,765 C-1= T2={(21×28)/(21+28)}[(157,381-158,429) ×0,2061×(157,381-158,429) -(157,318-158,429) ×0,0694×(241,000-241,571)+... +(20,810-20,839) ×1,8068×(20,810-20,839)] =2,824

que se converte numa estatística

F=(21+28-5-1) ×2,824/{(21+28-2) ×5}=0,517 157,381 241,000 31,433 18,500 20,810 11,048 9,100 1,557 0,870 1,286 17,500 1,910 1,310 0,880 0,531 0,189 0,240 0,176 0,133 (Sim.) 0,575 157,381 241,000 31,433 18,500 20,810 15,069 17,190 2,243 1,746 2,931 32,550 3,398 2,950 4,066 0,728 0,470 0,559 0,434 0,506 (Sim.) 1,321 13,358 13,748 1,951 1,373 2,231 26,146 2,765 2,252 2,710 0,645 0,350 0,423 0,324 0,347 (Sim.) 1,004 0,2061 -0,0694 -0,2395 0,0785 -0,1969 0,1234 -0,0376 -0,5517 0,0277 4,2219 -3,2624 -0,0181 11,4610 -1,2720 1,8068

(4)

Com 5 e 48 gl. Esse valor não é significativamente grande e, portanto não há evidência de uma diferença nas médias populacionais de S e NS, considerando as cinco variáveis conjuntamente.

4.4 TESTES MULTIVARIADOS VERSUS TESTES UNIVARIADOS

Se p testes independentes (univariados) são aplicados, cada teste sendo realizado incorretamente à um erro tipo I (α=0,05), a probabilidade conjunta de todos os testes é exageradamente grande! Para corrigir esse erro, o ajuste de Bonferroni deve ser aplicado: α/p, para cada teste, garantindo assim no geral α como probabilidade do erro tipo 1

O uso de teste multivariado tal como T2 deHotelling usando o nível de significância de 5% dá uma probabilidade de 0,05 de um erro tipo I, para qualquer número de variáveis envolvidas, desde que as suposições do teste sejam válidas.

4.5 COMPARAÇÃO DE VARIACÃO PARA DUAS AMOSTRAS: O CASO UNIVARIADO

Tradicionalmente, é conhecido o teste F=s12/s22, que é comparado com pontos percentuais

da distribuição F com (n1-1) e (n2-1) gl. Um valor da razão maior do que 1 é então

evidência de que as amostras são de duas populações com variâncias diferentes.

PROBLEMA: O teste F é bastante sensível à suposição de normalidade e um resultado significativo desse teste pode ser devido à isso e não ao de variâncias desiguais. Portanto, nunca deve ser usado um teste F para comparar variâncias.

ALTERNATIVAS ROBUSTAS: Teste de Levene (1960);

4.6 COMPARAÇÃO DE VARIACÃO PARA DUAS AMOSTRAS: O CASO MULTIVARIADO

Teste M de Box (Seção 4.8)

- Sensível à suposição de que as amostras são provenientes de distribuições normais multivariadas → resultado significante pode ser devido à não normalidade e não à heterogeneidade de matrizes de covariâncias

Teste de vetores de médias pode ser feito usando um teste T2 Teste de Van Valen (1978)

dij=√{Σkp(xijk-xˉjk)2} 4.10

em que xijk é o valor da variável Xk para o i-ésimo indivíduo na amostra j e xˉjk é a média

da mesma variável na amostra. As médias amostrais dos valores dij são comparadas por um

teste t.

Obs.: Amostra mais variável terá médias de dij mais alta.

Assegurando o mesmo peso às variáveis:

dij=√{Σkp(xijk-Mjk)2} 4.11

em que Mjk é a mediana para a variável Xk na j-ésima amostra.

(5)

-Limitação: Se X1 e X2 são mais variáveis na amostra 1 e X3 e X4 o são na amostra 2, o

efeito de variâncias diferentes tenderia a ser cancelado e o teste daria não significante.Não consistência de mudanças no nível de variação.

Exemplo 4.2 TESTANDO VARIAÇÃO PARA PARDOCAS QUESTÃO: São os NS mais variáveis do que os S? (teste unilateral) Teste de Levene univariado:

Para X1, “Comprimento total”. Os dados originais são transformados em desvios das

medianas amostrais.

Dados para sobreviventes: n1=21, Mediana =157mm, xˉ1=2,57, s12=4,26,

Dados para não-sobreviventes: n1=28, Mediana =159mm, xˉ1=3,29, s12=4,21,

Variância combinada =4,231 (Eq. 4.3)

Estatística t=(2,57-3,29)/{4,231(1/21+1/28)}1/2=-1,21ns (com 47gl, α=0,05) (Eq.4.2) Tabela 4.2.1 Valores t (Eq.4.2) para as outras variáveis:

Variável Valor t (α=0,05)

Comprimento total -1,21ns

Extensão alar -1,8 ns

Comprimento do bico e cabeça -0,81 ns Comprimento do úmero -1,91* Quilha do esterno -1,40 ns

Teste de Van Valen

Tabela 4.2 Desvios absolutos das medianas amostrais para os dados de Bumpus e valores d da Equação 4.11 Comprimento Total X1 Extensão Alar X2 Bico e cabeça X3 Comprimento do úmero X4 Quilha do esterno X5 d 0,28 1,00 0,25 0,00 0,10 1,07 ... ... ... ... ... ... 1,38 1,20 1,02 0,54 0,20 2,17

Procedimento de cálculo (sobreviventes):

1) Dados originais foram padronizados para média zero (0) e variância um (1), para todos os 49 pássaros: Para X1, (156-157,98)/3,617=-0,55

2) Cálculo do comprimento transformado mediano: -0,27

3) Desvio absoluto da mediana para o primeiro sobrevivente = |-0,55-(-0,27)|=0,28 Dados de d para sobreviventes: dˉ =1,760, sd2=0,411

Dados de d para não-sobreviventes: dˉ =2,265, sd2=1,133

Valor t=-1,92* (Eq. 4.2), indicando maior variação para NS do que para S. T2 de Hotteling = T2=4,25 → F=0,87ns com 5 e 43 gl (Eq. 4.8)

Resumo: Levene deu não significativo e Van Valen deu significativo! Explicação:

(6)

- O teste de Levene não é direcional. Ele não leva em consideração a expectativa de que os S serão menos variáveis do que os NS.

- O teste de Van Valen é especificamente para menos variação na amostra 1 do que para a 2, o que ocorre nesse caso para todas as variáveis

4.7 COMPARAÇÃO DE MÉDIAS PARA VÁRIAS AMOSTRAS

Caso univariado: usa-se uma generalização do teste t que é o teste F na conhecida ANOVA.

Caso Multivariado: Tabela 4.4.1 MANOVA

Fonte de Variação SQPC gl

Dentro de Amostras/grupos/tratamentos W m-1

Entre amostras ou Resíduo B n-m

Total T n-1

Tabela 4.4 Estatísticas de testes usadas para comparar vetores de médias amostrais com testes F aproximados para evidências de que valores populacionais não são constantes

Nota: Assume-se que há p variáveis em m amostras, com a j-ésima de tamanho nj e n=Σnj

Teste Lambda de Wilks: Λ=|W |/|T| ou Λ=∏ip1/(1+ λi)

4.12 em que:

|W| é o determinante da matriz das somas de quadrados e produtos cruzados (SQPC) dentro da amostra (é uma medida de variabilidade generalizada)

|T| é o determinante da matriz das somas de quadrados e produtos cruzados totais O elemento na linha r e coluna c de T é:

trc=ΣjmΣinj(xijr-xˉr)(xijc-xˉc) 4.13

e o elemento na linha r e coluna c de W é:

wrc=ΣjmΣinj(xijr-xˉjr)(xijc-xˉjc) 4.14

xijk : é o valor da variável Xk para o i-ésimo indivíduo e a j-ésima amostra;

xˉjk: a média da variável Xk na mesma amostra;

xˉk: é a média global de Xk para todos os dados tomados juntos.

Teste Estatística F gl1 gl2 Comentários

Lambda de Wilks Λ {(1-Λ)/ Λ1/t }(gl2/gl1) p(m-1) wt-( gl1/2)+1 w=n-1{(p+m)/2} t=[(gl12-4)/{p2+m-1)2-5}]1/2 Se gl1=2, faça t=1 Maior raiz de Roy

λ1 (gl2/gl1)λ1 d n-m-d-1 O nível de significância obtido

é um limite inferior d=max(p,m-1) Traço de Pillai V= Σipλi/(1+λi) (n-m-p+s)V/{d(s-V)} sd s(n-m-p+s) s=min(p,m-1)=n° de λi ‘s posit. Traço de Lawley- Hotelling

U=Σipλi gl2U/(s gl1) s(2A+s+1) 2(sB+1) A=(|m-p-1)/2

(7)

Obs.: Valores pequeno de Λ indica que a variação dentro das amostras é baixa em comparação com a variação total, evidenciando que as amostras não vêm de populações com o mesmo vetor de médias.

Obs.: λ1≥ λ2≥ ...≥ λp≥0 são os autovalores de W-1B, em que B=T-W.

Teste de Roy: a base para usar esta estatística é o fato de que se a combinação linear das variáveis X1 à Xp que maximiza a razão entre a soma dos quadrados entre amostras e a

soma de quadrados dentro de amostra é encontrada, então essa razão máxima é igual a λ1.

-Em alguns pacotes computacionais, θi= λi/(1- λi)

Obs.:

- Em geral os quatro testes mostram níveis de significância semelhantes

- Suposições: A distribuição das p variáveis é normal multivariada e há homogeneidade das matrizes de covariâncias para as m populações das quais as amostras foram retiradas. - São robustas quando n1≈n2≈...≈nm.

- Traço de Pillai pode ser mais robusta em casos em que as suposições não estão satisfeitas, (Seber, 1984, p. 442)

4.8 COMPARAÇÃO DA VARIAÇÃO PARA VÁRIAS AMOSTRAS O teste de Box:

M={∏im|Ci|(ni-1)/2}/|C|(n-m)/2 4.18

ni: é o tamanho da i-ésima amostra

Ci: é a matriz de covariâncias amostral para a i-ésima amostra

C=Σim(ni-1)Ci/(n=m): é a matriz de covariâncias combinada

Teste F=-2bloge(M) 4.19

Com v1=p(p+1)(m-1)/2 e v2=(v1+2)/(c2-c12) graus de liberdades.

b=(1-c1-v1/v2)/v1

em que

c1=(2p2+3p-1){Σim1/(ni-1)-1/(n-m)}/{6(p+1)(m-1)}

e

c2=(p-1)(p+2){Σim1/(ni-1)2-1/(n-m)2}/{6(m-1)}

Obs.: A aproximação F da Eq. 4.19 é válida somente se c2>c12, caso contrário, a

alternativa:

F={2b1v2loge(M)}/{v1+2b1loge(M)} 4.20

em que

b1=(1-c1-2/v2)/v2

Este é testado com um F com v1 e v2 gl, para ver se é significativamente grande.

Propriedades do teste de Box:

- é sensível a desvios da normalidade das variáveis. Alternativas → desvios absolutos da mediana amostral para os dados em m amostras.

Obs.: Para dados transformados, os testes anteriores devem ser aplicados e um resultado significante indica as matrizes de covariâncias não são constantes para as m populações.

(8)

Obs.: Alternativamente, as variáveis podem ser padronizadas para ter variâncias unitárias e os valores d podem ser calculados usando a Eq. 4.11. Uma MANOVA é então aplicada aos valores d.

4.3 COMPARAÇÃO DE AMOSTRAS DE CRÂNIOS EGÍPCIOS

Com os dados da Tabela 1.2 para p=4, m=5 temos da Eq. 4.13, a matriz de SQPC total:

T =

|T|=7,306×1013.

Da Eq. 4.14 temos a matriz de SQPC dentro de amostra:

W =

|W|=4,848×1013.

A estatística lambda de Wilks é: Λ=|W|/|T|=0,6636

Da Tabela 4.4 com p=4, m=5 e n=150 temos: gl1=p(m-1)=16; w=n-1-(p+m)/2=150-1-(4+5)/2=144,5 t=[(gl12-4)/{p2+(m-1)2-5}]1/2=[(162-4)/{42+(5-1)2-5}]1/2=3,055 gl2=wt-( gl1/2)+1=144,5×3,055-16/2+1=434,5 A estatística F é: F={(1-Λ)/ Λ1/t}(gl2/gl1)={(1-0,66361/3,055)/0,66361/3,055}(434,5/16)=3,90**

Com 16 e 434,5 gl (p<0,001). Há clara evidência que o vetor de valores médios das quatro variáveis mudou com o tempo.

Teste de Roy: O maior autovalor de W-1B é λ1=0,4251

gl2= n-m-d-1=150-5-4-1=140 F=(gl2/gl1)λ1=(140/16)0,4251=14,88** Com 4 e 140 gl, (p<0,001) Teste de Pillai: V=0,3533 F=(n-m-p+s)V/{d(s-V)}=3,51** Com sd=16 e s(n-m-p+s)=580 gl, (p<0,001). Teste de Lawley-Hotelling: U=0,4818,

s=4, A=-0,5, B=70, gl1=s(2A+s+1)=16, gl2=2(sB+1)=562 F= gl2U/(s gl1)=(562×0,4818)/(4×16)=4,23** (p<0,001) 3563,89 (Sim.) -222,81 3635,17 -615,16 1046,28 4309,27 426,73 346,47 -16,40 1533,33 3061,07 (Sim.) 5,33 3405,27 11,47 754,00 3505,97 291,30 412,53 164,33 1472,13

(9)

Teste de Box:

Da Eq. 4.18, M=2,869×10-11, com b=0,0235, temos F=-2 b loge(M)=1,14ns,

com v1=40 e v2=46,379 gl, (p=0,25)

Conclusão: Os vetores de valores médios mudaram, mas a variação não, considerando as variáveis conjuntamente!

Exercício, página 67:

O exemplo 1.4 se refere à comparação entre cães pré-históricos da Tailândia e seis grupos de animais relacionados em termos das principais medidas de mandíbula. A Tabela 4.5 mostra alguns dados adicionais para comparação desses grupos que fazem parte de dados mais extensivos discutidos no artigo de Higham et al. (1980).

1. Teste por diferenças significantes entre as cinco espécies em temos dos valores médios e da variação nas nove variáveis. Teste ambos, para diferenças globais e para diferenças entre os cães pré-históricos tailandeses e cada um dos outros grupos isoladamente. Quais

conclusões você obtém com relação à similaridade entre cães pré-históricos tailandeses e os outros grupos?

2. Há evidências de diferenças entre os tamanhos de machos e fêmeas da mesma espécie para os primeiros quatro grupos?

3. Usando um método gráfico apropriado, compare as distribuições das nove variáveis para os cães tailandeses pré-históricos e modernos.