2 REVISÃO DE LITERATURA
2.4 Mediana multivariada
Considerando-se a variável aleatória X, contínua, define-se a mediana Md como o lugar geométrico tal que Pr(X < Md) = 0,5. No caso discreto com N valores xi
(i=1,...,N) equiprováveis, são utilizadas as estatísticas de ordem x(i). Assim, para N
ímpar, a mediana é bem estabelecida, sendo dada pelo valor de ordem (N+1)/2, ou seja,
x([N+1/2]). Quando o número de valores é par, convencionou-se que a mediana é o ponto
médio entre os valores de ordem N/2 e (N+2)/2, ou seja, Md = [x(N/2) + x([N+2]/2)]/2.
Entretanto, qualquer valor entre x(N/2) e x([N+2]/2 pode ser considerado como o ponto
mediano de um conjunto com N dados (N par).
No caso multivariado, a definição de uma medida de posição multivariada não é tão simples como no caso univariado. Os trabalhos iniciais focalizando a análise de dados multivariados através de métodos não-paramétricos indicam a utilização de uma medida mediana equivalente, em sua forma, à média multivariada, ou seja, um vetor de valores constituído pelas medianas das variáveis individuais. Assim,
considerando p variáveis com medianas individuais dadas por Mdk (k=1,...,p), o vetor de
medianas, denominado mediana componentwise ou simplesmente mediana multivariada, é dado Medc = (Md1, Md2,..., Mdp).
Essa mediana multivariada, formada pelo vetor composto das medianas individuais, pode não ser adequada devido ao fato de não ser invariante ou afim invariante sob rotação. Assim, considerando que o vetor de medianas das variáveis tomadas isoladamente não reflete o valor mediano para o caso multivariado, têm-se buscado formas alternativas de definir uma mediana multivariada. Dentre elas merecem destaque a mediancenter ou centro-mediano (Gower, 1974) e a mediana de Oja (Oja, 1983).
Dados n pontos com p coordenadas Pi(xi1, xi2, ..., xip), i=1,2,...n,
referentes aos eixos retangulares, Gower (1974) definiu o centro-mediano como sendo o ponto M(m1, m2, ...,mp) tal que ∑in=1∆(PiM) seja mínimo, sendo ∆(Pi M) é a distância
entre Pi e M. Como se está trabalhando com distâncias, o centro-mediano é afetado por
mudanças de escala e recomenda-se a padronização das variáveis antes da sua utilização. O centro-mediano difere do centróide (ponto médio multivariado) pois este minimiza a distância quadrática, ou seja, minimiza ∑ni=1∆2(PiM).
O centro-mediano é único para mais de uma dimensão e se θi é o ângulo
entre MPi, tem-se que ∑in=1cosθi =0, ou seja, M é invariante para qualquer localização
dos pontos Pi sobre os raios MPi. Em uma dimensão tem-se que
0 m x sinal n 1 i i n 1 i i =∑ − =
∑ = cosθ = ( ) , ou seja, o número de sinais positivos é igual ao número de sinais negativos em relação ao ponto mediano e recai-se na mediana tradicional em uma dimensão. Gower (1974) apresenta um algoritmo interativo para a obtenção do centro-mediano, baseado na interpretação mecânica de que M está em equilíbrio sob forças unitárias nas direções MPi tomando como estimativa inicial do
centro mediano o ponto M0 (centróide).
Brown (1983) investiga as propriedades assintóticas do centro-mediano, cujas equações de estimativas têm um aspecto angular. O autor utiliza o centro-mediano
no desenvolvimento de testes angulares, análogos aos testes de sinais em uma direção, possibilitando testar tanto a mudança de locação numa direção fixa, como globalmente em qualquer das duas direções sendo análogos aos testes uni e bilaterais da locação univariada. Apresenta ainda um teste angular para k amostras.
Oja (1983) apresenta uma generalização dos conceitos de medidas de locação, escala, simetria e curtose para o caso multivariado baseados no volume obtido a partir de um simplex de dimensão p. Dados x1 = (x11,...,x1p)', ..., xp+1 = (xp+1,1,...,xp+1,p)',
pontos no espaço Rp que determinam um simplex p-dimensional, o volume deste simplex é dado por ∆(x1,...,xk+1) = abs[1/k! (det A)] sendo A uma matriz cujas colunas
são formadas pelos vetores xi(i=1,..,k) com o acréscimo do primeiro elemento igual a 1.
Se k = 1 (caso univariado), ∆(x1,x2) é a distância entre os pontos x1e x2 em R e no caso
bivariado (k = 2) ∆(x1,x2, x3) é a área do triângulo determinado por x1, x2 e x3 em R2. Seja
X1,...,Xkuma amostra aleatória de tamanho k da população P e sejam as funções µα: ℑ →
ℜk , 0 < α < ∞ então
{[
(
)]
}
{[
(
)]
α}
µ α α ∆ µ µ ∆ X1,...,Xk, (P) inf E X1,...,Xk, E k ℜ ∈ = defineuma classe de medidas de locação, onde ℑ uma classe de distribuições de probabilidade. As funções µα são medidas de locação nos modelos simétricos e se o valor µα(P) (α>1)
existe, ele é único. Como casos especiais são consideradas uma generalização da média µ2(P) e uma nova generalização da mediana µ1(P). Seja x1 ,..,xn uma amostra observada
da população P, estimativas naturais µˆ de α µα(P) são dadas por
(
)
[
]
{
[
(
)]
α}
µ α α∆
µ
∆
µ
µˆ
x
,...x
,ˆ
inf
X
1,...,X
k,
k i 1 i∑
∑
=
=
0<α<∞, sendo a somasobre 1 ≤ i1 < ... < ik ≤ n. A estimativa µˆ2é um vetor de médias amostrais e µˆ1a
mediana amostral. No caso da mediana (α = 1), tem-se algumas vezes um ponto e outras vezes um conjunto convexo no qual a mediana pode ser selecionada. Assim, a mediana de Oja (1983), também denominada mediana espacial, é definida como o ponto M ou os pontos que minimizam a soma dos volumes dos simplexes formados por k pontos e o ponto M.
A partir da mediana de Oja, muitos trabalhos foram publicados discutindo testes e propriedades. Testes de sinais bivariados e testes multivariados para uma amostra são apresentados por Oja & Nyblom (1989) e Hettmansperger et al. (1997), respectivamente. Métodos multivariados para os postos e sinais espaciais, para uma e duas amostras, são discutidos por Möttönen & Oja (1995). A eficiência de testes multivariados utilizando a mediana de Oja é discutida em Möttönen et al. (1998). Testes multivariados não-paramétricos para blocos aleatorizados completos são apresentados em Möttönen et al. (2003). Choi & Marden (2002) discutem testes para efeitos principais e interações num esquema fatorial 2x2 para um delineamento em blocos casualizados.
Plachky & Rukhin (1999), Visuri et al. (2000), Nadar et al. (2003), Ollila et al. (2003) apresentam estimativas para a matriz de covariâncias baseadas em postos ou sinais.
Com o intuito de obter valores medianos invariantes sob rotação e transformações afins, e ainda simples de serem obtidas computacionalmente, Chakraborty & Chaudhuri (1996) e Chakraborty et al. (1998) discutem técnicas de transformação e retransformação sobre a mediana de Oja, que são aplicadas por Randles (2000), num teste multivariado de sinais. Ainda buscando um estimador para a mediana multivariada, Hettmansperger & Randles (2002) propõem a utilização de um caso especial de estimador simples de ser calculado, mas que, não possui as propriedades desejáveis de existência e unicidade, apesar de serem invariantes.