Mediana multivariada - REVISÃO DE LITERATURA

2 REVISÃO DE LITERATURA

2.4 Mediana multivariada

Considerando-se a variável aleatória X, contínua, define-se a mediana Md como o lugar geométrico tal que Pr(X < Md) = 0,5. No caso discreto com N valores xi

(i=1,...,N) equiprováveis, são utilizadas as estatísticas de ordem x(i). Assim, para N

ímpar, a mediana é bem estabelecida, sendo dada pelo valor de ordem (N+1)/2, ou seja,

x([N+1/2]). Quando o número de valores é par, convencionou-se que a mediana é o ponto

médio entre os valores de ordem N/2 e (N+2)/2, ou seja, Md = [x(N/2) + x([N+2]/2)]/2.

Entretanto, qualquer valor entre x(N/2) e x([N+2]/2 pode ser considerado como o ponto

mediano de um conjunto com N dados (N par).

No caso multivariado, a definição de uma medida de posição multivariada não é tão simples como no caso univariado. Os trabalhos iniciais focalizando a análise de dados multivariados através de métodos não-paramétricos indicam a utilização de uma medida mediana equivalente, em sua forma, à média multivariada, ou seja, um vetor de valores constituído pelas medianas das variáveis individuais. Assim,

considerando p variáveis com medianas individuais dadas por Mdk (k=1,...,p), o vetor de

medianas, denominado mediana componentwise ou simplesmente mediana multivariada, é dado Medc = (Md1, Md2,..., Mdp).

Essa mediana multivariada, formada pelo vetor composto das medianas individuais, pode não ser adequada devido ao fato de não ser invariante ou afim invariante sob rotação. Assim, considerando que o vetor de medianas das variáveis tomadas isoladamente não reflete o valor mediano para o caso multivariado, têm-se buscado formas alternativas de definir uma mediana multivariada. Dentre elas merecem destaque a mediancenter ou centro-mediano (Gower, 1974) e a mediana de Oja (Oja, 1983).

Dados n pontos com p coordenadas Pi(xi1, xi2, ..., xip), i=1,2,...n,

referentes aos eixos retangulares, Gower (1974) definiu o centro-mediano como sendo o ponto M(m1, m2, ...,mp) tal que ∑_in₌₁∆(PiM) seja mínimo, sendo ∆(Pi M) é a distância

entre Pi e M. Como se está trabalhando com distâncias, o centro-mediano é afetado por

mudanças de escala e recomenda-se a padronização das variáveis antes da sua utilização. O centro-mediano difere do centróide (ponto médio multivariado) pois este minimiza a distância quadrática, ou seja, minimiza ∑n_i₌₁∆2(P_iM).

O centro-mediano é único para mais de uma dimensão e se θi é o ângulo

entre MPi, tem-se que ∑_in₌₁cosθi =0, ou seja, M é invariante para qualquer localização

dos pontos Pi sobre os raios MPi. Em uma dimensão tem-se que

0 m x sinal n 1 i i n 1 i i =∑ − =

∑ ₌ cosθ ₌ ( ) , ou seja, o número de sinais positivos é igual ao número de sinais negativos em relação ao ponto mediano e recai-se na mediana tradicional em uma dimensão. Gower (1974) apresenta um algoritmo interativo para a obtenção do centro-mediano, baseado na interpretação mecânica de que M está em equilíbrio sob forças unitárias nas direções MPi tomando como estimativa inicial do

centro mediano o ponto M0 (centróide).

Brown (1983) investiga as propriedades assintóticas do centro-mediano, cujas equações de estimativas têm um aspecto angular. O autor utiliza o centro-mediano

no desenvolvimento de testes angulares, análogos aos testes de sinais em uma direção, possibilitando testar tanto a mudança de locação numa direção fixa, como globalmente em qualquer das duas direções sendo análogos aos testes uni e bilaterais da locação univariada. Apresenta ainda um teste angular para k amostras.

Oja (1983) apresenta uma generalização dos conceitos de medidas de locação, escala, simetria e curtose para o caso multivariado baseados no volume obtido a partir de um simplex de dimensão p. Dados x1 = (x11,...,x1p)', ..., xp+1 = (xp+1,1,...,xp+1,p)',

pontos no espaço Rp que determinam um simplex p-dimensional, o volume deste simplex é dado por ∆(x1,...,xk+1) = abs[1/k! (det A)] sendo A uma matriz cujas colunas

são formadas pelos vetores xi(i=1,..,k) com o acréscimo do primeiro elemento igual a 1.

Se k = 1 (caso univariado), ∆(x1,x2) é a distância entre os pontos x1e x2 em R e no caso

bivariado (k = 2) ∆(x1,x2, x3) é a área do triângulo determinado por x1, x2 e x3 em R2. Seja

X1,...,Xkuma amostra aleatória de tamanho k da população P e sejam as funções µα: ℑ →

ℜk , 0 < α < ∞ então

{[

(

)]

}

{[

(

)]

}

µ α α ∆ µ µ ∆ X₁,...,X_k, (P) inf E X₁,...,X_k, E k ℜ ∈ = define

uma classe de medidas de locação, onde ℑ uma classe de distribuições de probabilidade. As funções µα são medidas de locação nos modelos simétricos e se o valor µα(P) (α>1)

existe, ele é único. Como casos especiais são consideradas uma generalização da média µ2(P) e uma nova generalização da mediana µ1(P). Seja x1 ,..,xn uma amostra observada

da população P, estimativas naturais µˆ de _α µα(P) são dadas por

(

)

[

]

{

[

(

)]

}

µ α α

∆

µ

∆

µ

µˆ

x

,...x

,ˆ

inf

X

₁

,...,X

,

k i 1 i

∑

=

0<α<∞, sendo a soma

sobre 1 ≤ i1 < ... < ik ≤ n. A estimativa µˆ₂é um vetor de médias amostrais e µˆ₁a

mediana amostral. No caso da mediana (α = 1), tem-se algumas vezes um ponto e outras vezes um conjunto convexo no qual a mediana pode ser selecionada. Assim, a mediana de Oja (1983), também denominada mediana espacial, é definida como o ponto M ou os pontos que minimizam a soma dos volumes dos simplexes formados por k pontos e o ponto M.

A partir da mediana de Oja, muitos trabalhos foram publicados discutindo testes e propriedades. Testes de sinais bivariados e testes multivariados para uma amostra são apresentados por Oja & Nyblom (1989) e Hettmansperger et al. (1997), respectivamente. Métodos multivariados para os postos e sinais espaciais, para uma e duas amostras, são discutidos por Möttönen & Oja (1995). A eficiência de testes multivariados utilizando a mediana de Oja é discutida em Möttönen et al. (1998). Testes multivariados não-paramétricos para blocos aleatorizados completos são apresentados em Möttönen et al. (2003). Choi & Marden (2002) discutem testes para efeitos principais e interações num esquema fatorial 2x2 para um delineamento em blocos casualizados.

Plachky & Rukhin (1999), Visuri et al. (2000), Nadar et al. (2003), Ollila et al. (2003) apresentam estimativas para a matriz de covariâncias baseadas em postos ou sinais.

Com o intuito de obter valores medianos invariantes sob rotação e transformações afins, e ainda simples de serem obtidas computacionalmente, Chakraborty & Chaudhuri (1996) e Chakraborty et al. (1998) discutem técnicas de transformação e retransformação sobre a mediana de Oja, que são aplicadas por Randles (2000), num teste multivariado de sinais. Ainda buscando um estimador para a mediana multivariada, Hettmansperger & Randles (2002) propõem a utilização de um caso especial de estimador simples de ser calculado, mas que, não possui as propriedades desejáveis de existência e unicidade, apesar de serem invariantes.

No documento Antonio Carlos Pontes D 2005 (páginas 39-42)