• Nenhum resultado encontrado

MEM CAP11

N/A
N/A
Protected

Academic year: 2021

Share "MEM CAP11"

Copied!
7
0
0

Texto

(1)

11.1 CONSTRUINDO UM MAPA DE UMA MATRIZ DE DISTÂNCIAS

Objetivo: construir um diagrama que mostre as relações entre um certo número de objetos, a partir de uma tabela de distâncias entre objetos.

Tipos:

- Uma dimensão – os objetos caem em uma reta - Duas dimensões – os objetos caem em um plano - Três dimensões – os objetos caem no espaço

- Mais altas dimensões – não são possíveis por simples representação geométrica Tabela 11.1 Distâncias euclidianas entre os objetos mostrados na Figura 11.1

A B C D

A 0,0 B 6 0,0 C 6 9,5 0,0 D 2,5 7,8 3,5 0,0

Figura 11.1 Quatro objetos em duas dimensões B A

D

C

Figura 11.2 Uma imagem espelhada dos objetos na Figura 11.1 para os quais as distâncias entre os objetos são as mesmas

B A

D

(2)

Obs.: Se mais de três objetos estão envolvidos, então eles não se encontram sobre um plano. A matriz de distâncias conterá implicitamente esta informação

Tabela Uma tabela de distâncias entre quatro objetos em três dimensões A B C D A 0 B 1 0 C √2 1 0 D √2 1 √2 0

Problema: Com dados reais não é conhecido o número de dimensões necessárias para uma representação. Então é preciso experimentar várias dimensões.

Utilidade do EM: quando a relação subjacente ente objetos não é conhecida, mas a matriz de distâncias pode ser estimada.

Exemplo: Em psicologia, sujeitos podem ser capazes de verificar quão similares ou diferentes são pares individuais de objetos, sem serem capazes de extrair uma percepção global das relações entre objetos. O EM pode fornecer esta percepção!

11.2 PROCEDIMENTO PARA ESCALONAMENTO MULTIDIMENSIONAL

- Inicia-se com uma matriz de distâncias entre n objetos, sendo δij a distância do objeto i ao objeto j

- O número de dimensões para o mapeamento dos objetos é fixado por uma solução particular em t (1 ou mais).

1. Uma configuração inicial é estabelecida para os n objetos em t dimensões, i.e., coordenadas (x1, x2,..., xt), são assumidas para cada objeto em um espaço t-dimensional. 2. As distâncias euclidianas entre os objetos são calculadas para a configuração assumida. Seja dij a distância entre o objeto i e o objeto j para esta configuração.

3. Uma regressão (linear, polinomial ou monótona) de dij em δij (dados de entrada) é feita. dij=α+βδij+εij

em que εij é um erro de regressão e α e β são constantes.

Obs.: Regressão monótona assume que se δij cresce, então dij ou cresce ou permanece constante, mas nenhuma relação exata entre δij e dij é assumida.

Disparidades: são as distâncias ajustadas da equação de regressão (d^ij=α+βδij, assumindo regressão linear)

Interpretação: As disparidades d^ij são as distâncias dos dados δij, escalonadas para emparelhar com as distâncias de configuração dij tão próxima quanto possível.

4. A qualidade de ajuste entre dij e d^ij é medida por uma estatística adequada. Ex.: Fórmula stress de Kruskal:

STRESS 1={Σ(dij- d^ij/ Σ d^ij2}1/2 11.1 é uma medida do quanto a configuração espacial de pontos tem que ser forçada para obter os dados de distâncias δij.

(3)

5. As coordenadas (x1, x2,..., xt) de cada objeto são alteradas levemente de tal forma que o stress é reduzido.

- Os passos de 2 a 5 são repetidos até que indicação de que o stress não pode ser mais reduzido.

Resultado da análise: Coordenadas dos n objetos em t dimensões, que servem desenhar um mapa que mostra como os objetos estão relacionados.

- t=1, 2 ou 3 é o ideal, pois um representação gráfica dos n objetos é então direta, mas nem sempre possível

- Guia rústico de Kruskal e Wish (1978, p.56) para valores de STRESS:

Reduzir o número de dimensões até que STRESS 1 exceda 0,1 ou aumentando quando já é menor do que 0,05, é questionável.

- É pouco importante aumentar o número de dimensões t se isto leva a um pequeno decréscimo no stress.

Escalonamento métrico: as distâncias de configuração dij e as distâncias dos dados δij são relacionadas por uma equação de regressão linear ou polinomial.

Escalonamento não-métrico: usa regressão monótona, em que somente a ordem das distâncias de dados é importante (é mais flexível e uma melhor representação de baixa dimensão é em geral obtida)

Exemplo 11.1 DISTÂNCIAS RODOVIÁRIAS ENTRE CIDADES DA NOVA ZELÂNDIA

Situação: Temos um mapa de distâncias rodoviárias, e queremos reproduzir com elas, o mapa de distâncias geográficas.

??????

Figura 11.3 A Ilha Sul da nova Zelândia, com as principais rodovias entre 13 cidades indicadas pelas linhas tracejadas

Considerações:

- Se as distâncias rodoviárias fossem proporcionais às distâncias geográficas, seria possível reconstituir o verdadeiro mapa exatamente, usando uma análise bidimensional.

- As distâncias rodoviárias são em alguns casos muito maiores do que as distâncias geográficas.

- Tudo que se pode esperar é uma reconstituição bastante aproximada do verdadeiro mapa da Figura 11.3 que são mostradas na Tabela 11.3

Tabela 11.3 Distâncias (δij) rodoviárias principais em milhas entre 13 cidades na Ilha Sul da Nova Zelândia A B1 B2 C D F G I M N Q T1 T2 A 0 B1 100 0 B2 485 478 0 C 284 276 201 0

(4)

D 126 50 427 226 0 F 233 493 327 247 354 0 G 347 402 214 158 352 114 0 I 138 89 567 365 139 380 493 0 M 248 213 691 489 263 416 555 174 0 N 563 537 73 267 493 300 187 632 756 0 Q 56 156 494 305 192 228 341 118 178 572 0 T1 173 138 615 414 188 366 480 99 75 681 117 0 T2 197 177 300 99 127 313 225 266 377 366 230 315 0

Nota: A: Alexandra; B1: Balclutha; B2:Blenheim; C: Christchurch; D: Dunedin; F: Franz Josef; G: Greymouth; I: Invercargill; M: Milford; N: Nelson; Q: Queenstown; T1:Te Anau; T2: Timaru

- Regressão monótona foi assumida entre as distâncias do mapa dij e as distâncias rodoviárias δij. Isto é algumas vezes chamado de escalonamento multidimensional não-métrico clássico.

- O valor final do stress foi 0,041, Eq. 11.1.

Tabela 11.4 Coordenadas produzidas (matriz X n×t) por escalonamento multidimensional aplicado às distâncias entre cidades na Ilha Sul da Nova Zelândia

Cidade Dimensãoa 1 2 Nova 2 Alexandra 0,11 0,07 -0,07 Balclutha 0,19 -0,08 0,08 Blenheim -0,38 -0,16 0,16 Christchurch -0,15 -0,11 0,11 Dunedin 0,13 -0,10 0,10 Franz Josef -0,18 0,20 -0,20 Greymouth -0,27 0,06 -0,06 Invercargill 0,26 -0,01 0,01 Milford 0,36 0,13 -0,13 Nelson -0,45 -0,08 0,08 Queenstown 0,13 0,12 -0,12 Te Anau 0,28 0,08 -0,08 Timaru -0,03 -0,13 0,13 a

Dimensão 2 é a que foi produzida pelo programa computacional NCSS (Hintze, 2001). Os sinais deste eixo foram revertidos para nova dimensão 2 para combinar com as localizações geográficas das cidades reais.

Obs.:

- A nova dimensão é tão satisfatória quanto a original

- Sinal mantido, gera uma representação gráfica das cidades como uma imagem espelhada. ????????

Figura 11.4 Mapa produzido por um escalonamento multidimensional usando as distâncias entre cidades da Nova Zelândia mostradas na Tabela 11.3

(5)

- Comparando a Figura 11.4 com a Figura 11.3 indica que o escalonamento multidimensional teve bastante sucesso na reconstituição do mapa real.

- Exceto para Milford, pois esta cidade somente pode ser alcançada por rodovia através de Te Anau. O mapa produzido por EM tornou Milford mais próxima de Te Anau. Na realidade, Milford é mais próxima de Queenstown do que de Te Anau.

Exemplo 11.2 O COMPORTAMENTO DE VOTAÇÃO DE PARLAMENTARES

Tabela 11.5 Distância entre 15 parlamentares de Nova Jersey na Casa de Representantes dos EUA

Hunt Sandman How

ard Thompso Fre li ngh F or sythe W idnall R oe He lst oski R odino Mi nish R inaldo Mar az it i Da niels P att ern Hunt (R) 0 Sandman (R) 8 0 Howard (D) 15 17 0 Thompson (D) 15 12 9 0 Frelinghuysen(R) 10 13 16 14 0 Forsythe (R) 9 13 12 12 8 0 Widnall (R) 7 12 15 13 9 7 0 Roe (D) 15 16 5 10 13 12 17 0 Helstoski (D) 16 17 5 8 14 11 16 4 0 Rodino (D) 14 15 6 8 12 10 15 5 3 0 Minish (D) 15 16 5 8 12 9 14 5 2 1 0 Rinaldo (R) 16 17 4 6 12 10 15 3 1 2 1 0 Maraziti (R) 7 13 11 15 10 6 10 12 13 11 12 12 0 Daniels (D) 11 12 10 10 11 6 11 7 7 4 5 6 9 0 Pattern (D) 13 16 7 7 11 10 13 6 5 6 5 4 13 9 0 Nota: Os números mostrados são o número de vezes que o parlamentar votou diferentemente em 19 propostas de leis ambientais (R= Partido Republicano, D=Partido Democrata)

Fonte: Romesburg, H.C. (1984), Cluster Analysis for researchers, Lifetime Learning Publications, Belmont, CA

Leitura:

- Os deputados Hunt e Sandman discordaram 8 de 19 vezes e são do mesmo partido (R) - Os deputados (Rinaldo (R) e Helstoski (D)), (Rinaldo (R) e Minish (D)) e (Minish (D)e Rodino (D)) discordaram apenas em 1 de 19 vezes.

- Os deputados (Howard (D) e Sandman (R)), (Helstoski (D) e Sandman (R) ), (Rinaldo (R) e Sandman (R)), (Roe (D) e Widnall (R)) foram os que mais discordaram, 17 em 19 vezes. Resultados:

- Escalonamento multidimensional métrico clássico: Valores do stress para o modelo dij=βδij + εij.

Número de dimensões

(6)

stress 0,237 0,130 0,081

- Escalonamento multidimensional não-métrico clássico (assumindo-se regressão monótona):

Número de dimensões

2 3 4

stress 0,113 0,066 0,044 Interpretação:

- Valores de stress distintamente mais baixos, portanto essa análise é melhor!

- A solução tridimensional (t=3) tem pouco mais stress do que a quatro dimensional.

Tabela 11.6 Coordenadas de 15 parlamentares obtidas de um escalonamento multidimensional não-métrico tridimensional baseadas no comportamento de votação

Parlamentares Dimensão 1 2 3 Hunt (R) 0,33 0,00 0,09 Sandman (R) 0,26 0,26 0,18 Howard (D) -0,21 0,05 0,11 Thompson (D) -0,12 0,22 -0,03 Frelinghuysen(R) 0,20 -0,06 -0,24 Forsythe (R) 0,13 -0,13 -0,06 Widnall (R) 0,33 0,00 -0,11 Roe (D) -0,21 -0,05 0,09 Helstoski (D) -0,22 0,02 -0,01 Rodino (D) -0,16 -0,07 0,00 Minish (D) -0,16 -0,03 -0,02 Rinaldo (R) -0,18 0,01 -0,01 Maraziti (R) 0,19 -0,20 0,10 Daniels (D) -0,02 -0,09 0,03 Pattern (D) -0,16 0,05 -0,12 ????????

Figura 11.5 Representações de parlamentares contra as três dimensões obtidas de um escalonamento multidimensional

Leitura:

- A dimensão 1 reflete grandes diferenças entre os partidos, pois D caem do lado esquerdo e R caem do lado direito exceto Rinaldo.

- A dimensão 2 reflete aproximadamente a votação de Sandman e Thompson, os quais tem os mais altos escores, versus a votação de Maraziti e Forsythe que têm os dois mais baixos escores.

- Explicação em termos de abstenções: Sandman absteve-se de nove votos e Thompson de seis. Os indivíduos com escores baixos na dimensão 2 votaram todo ou quase todo o tempo. - A dimensão 3 reflete certos aspectos de diferenças em padrões de votação, porém não mostra nenhuma interpretação simples ou óbvia.

(7)

Figura 11.6 As distâncias de dados originais d^ij entre os parlamentares representados graficamente contra as distâncias obtidas para a configuração ajustada dij.

- Indica quão bem o modelo tridimensional ajusta os dados

- Há um domínio de distâncias de configuração associado a cada uma das distâncias de dados discretos (Ex.; distância de dados de 5 corresponde a distância de configuração em torno de 0,10 a 0,16)

EXERCÍCIO:

Considere os dados da Tabela 1.5 sobre a porcentagem de pessoas empregadas em diferentes indústrias em 26 países da Europa. Destes dados construa uma matriz de distâncias euclidiana entre os países usando a Eq. 5.1 Implemente um escalonamentos multidimensional não-métrico usando esta matriz para determinar quantas dimensões são necessárias para representar os países de uma maneira que reflita diferenças entre seus padrões de emprego.

Referências

Documentos relacionados

O método do passivo (conforme o conceito descrito na IAS 12 - “Liability Method”, equivalente ao CPC 32 - Tributos sobre o Lucro) de contabilização de imposto

[r]

Esta relação já foi estudada para algumas pragas e culturas, como mosca-branca, ácaros e predadores em algodão (WILSON et al., 1983), mas em relação ao pulgão em algodoeiro

Nos tempos atuais, ao nos referirmos à profissão docente, ao ser professor, o que pensamos Uma profissão indesejada por muitos, social e economicamente desvalorizada Podemos dizer que

Jesus aproveita para ensinar aos seus discípulos, que somos todos nós, que as riquezas servem para serem partilhadas com os mais necessitados, que para Deus o que conta é

O Superior Tribunal de Justiça, nos REsp 1.643.051/MS e REsp 1.675.874/MS (TEMA 983-STJ), julgados segundo o rito dos recursos repetitivos, assentou que “nos casos

• Se existir um mercado activo para o output produzido por um activo ou grupos de activos, esse activo ou grupo de activos deve ser identificado como uma unidade geradora de

Buscando responder essa problemática, essa pesquisa tem como objetivo geral identificar a conformidade dos Balanços Patrimoniais divulgados pelos trintas maiores