• Nenhum resultado encontrado

Técnicas de Visualização de Informação

2 FUNDAMENTAÇÃO TÉORICA

2.4 VISUALIZAÇÃO DE INFORMAÇÃO

2.4.2 Técnicas de Visualização de Informação

As técnicas de visualização de informação podem ser utilizadas como mecanismos que auxiliam a compreensão dos resultados da mineração de dados.

A seguir são descritas as técnicas de visualizações de informação selecionadas. Antes, porém, são feitos alguns comentários relativos ao conceito de foco/contexto e de técnicas de interação (RUSSO; GROS; ABEL, 1999; NASCIMENTO; FERREIRA, 2005).

O conceito foco\contexto apresenta uma visão geral dos dados a serem visualizados, mas destacando uma região de interesse (foco) através de uma ampliação. Exemplos de técnica que utilizam estes conceitos: Fish-eye e Browser Hiperbólico.

o Fish-eye - consiste numa representação de uma lente que aumenta os objetos que estão próximos, enquanto mostra os objetos circundantes com menos detalhes.

o Browser Hiperbólico – utilizado nas técnicas de visualização que representam árvores, auxiliando a exploração das hierarquias.

As técnicas de interação têm o intuito de facilitar o processo de compreensão dos dados, auxiliando o usuário na exploração e criando outras possibilidades de visualização. A Figura 2.6 apresenta um modelo de visualização de informação que permite a inserção do humano na transformação dos dados, no mapeamento visual e na transformação das visões.

As técnicas de interação que podem ser utilizadas em técnicas de visualização são as seguintes:

• Projeção interativa: redefine as projeções dinâmicas geradas a partir de um conjunto multidimensional.

• Filtragem interativa: o usuário filtra a porção de dados mais interessante e efetua comparações entre as mesmas.

• Zoom interativo: possibilidade de expandir ou diminuir os elementos de visualização.

• Distorção interativa: é a deformação dos elementos visuais de maneira que as propriedades visuais não sejam perdidas.

Concluindo, a visualização de informação, além de transmitir conhecimentos, tem um grande potencial para receber comandos, tais como, por exemplo: controlar a quantidade de dados na tela, alterar a representação da visualização e ajustar escalas.

Keim e Kriegel (1996) descrevem técnicas de visualização de informação multidimensional agrupando-as nas categorias de técnicas geométricas, iconográficas, hierárquicas e orientadas a pixel. No entanto, neste trabalho foram utilizadas somente as visualizações pertencentes às técnicas de visualização de informação geométricas e iconográficas, que se demonstrou adequada para projeção do resultado do algoritmo de agrupamento. Essas técnicas são descritas a seguir.

a) Técnicas de Projeções Geométricas

As visualizações existentes nessa técnica tentam gerar projeções bidimensional e tridimensional em base de dados multidimensionais, com intuito de revelar informações de interesse. Dentre estas técnicas encontram-se: matriz de dispersão, gráfico de dispersão de dados em três dimensões (Scatter plot 3D) e coordenadas paralelas.

Matriz de Dispersão

Esta visualização é a mais antiga, popular e muito utilizada para representação de dados de alta dimensionalidade em uma representação bidimensional (SHIMABUKURU, 2004;

NASCIMENTO; FERREIRA, 2005).

A matriz de dispersão permite a visualização do relacionamento entre os atributos. Para isto, esta visualização projeta os atributos aos pares formando células associadas a dois atributos que são mapeados pelo eixo x (linha horizontal) e eixo y (linha vertical), conforme é ilustrado na Figura 2.7, que foi gerada com auxílio da linguagem R (ferramenta discutida mais adiante).

Para a projeção da visualização da matriz de dispersão são necessárias n(n-1)/2 células para representar uma base de dados com “n” atributos.

Figura 2.7: Exemplo de matriz de dispersão - (linguagem R)

Gráfico de Dispersão de Dados 3D - (Scatter Plot 3d)

Esta visualização consiste em projetar registros de uma base de dados representados por pontos num plano e os atributos representados por eixos. sendo a posição dos pontos dependente dos eixos que formam as dimensões da visualização (KOSARA; SAHLING;

HAUSER, 2004).

Gráfico de dispersão de dados é uma visualização popular e muito conhecida utilizada para mapear dados multidimensionais utilizando coordenadas (FEKETE; PLAISANT, 2002). Esta visualização em três dimensões projeta, num espaço tridimensional, o relacionamento de três atributos da base de dados, representado pelas coordenadas X, Y e Z, conforme ilustrado na Figura 2.8. Um dos intuitos desta visualização é revelar os dados de maneira experimental a fim de determinar os pontos de concordância (KOSARA; SAHLING; HAUSER, 2004). Este método gráfico é muito eficiente para determinar se existe uma relação, padrão ou tendência entre variáveis.

Esta visualização permite a inserção de propriedades visuais (cor, tamanho, forma, orientação e etc...), aumentando desta forma o número de atributos que podem ser representados.

Figura 2.8: Eixos da visualização de dispersão de dados 3D - os registros são representados pelas esferas.

Coordenadas Paralelas

A visualização de Coordenadas Paralelas, proposta por Inselberg e Dimsdale (1990), consiste em mapear um espaço n-dimensional em uma estrutura bidimensional que utiliza n eixos eqüidistantes denominados coordenadas (BENDIX; KOSARA; HAUSER, 2005;

NASCIMENTO; FERREIRA, 2005). Os eixos verticais representam as dimensões ou atributos de dados. Uma linha representa cada item de dado conectado aos eixos com os seus respectivos valores, permitindo a visão de padrões, conforme ilustrado na Figura 2.9. Os eixos verticais são padronizados em uma escala que varia do menor ao maior valor do atributo.

Para representar uma base de dados com x atributos, x = (x1 ,x2 ,...,xn ), necessita-se a mesma quantidade de coordenadas, isto é, a representação de x1 na coordenada 1, x2 na coordenada 2 e assim por diante até a representação de xn na coordenada n.

Uma vantagem desta visualização de informação é a representação de todos os atributos em uma mesma visualização, permitindo fazer interpretações visuais entre os atributos, exemplo:

a visualização da Figura 2.9 permite observar que a maioria das pessoas relacionadas tem aproximadamente 30 anos, sendo a maior parte delas do sexo feminino, residentes na zona 7 e que obtiveram notas próximas a 10,0.

Ana Maria João

Ricardo Paula

Kátia Carla Flavia

Nome Idade Sexo Bairro Nota

20 30 40 50 60 Acima

F M

Zona 5

Aeroporto Centro

Zona 7

0 2,5 5,0 7,5 10,

Figura 2.9: Exemplo de Coordenadas Paralelas com dados fictícios.

b) Técnicas Iconográficas

Estas técnicas trabalham com objetos geométricos com aparência paramétrica que podem ser mapeados a atributos de uma base de dados (ESTIVALET; FREITAS, 2000). A idéia é mostrar as características essenciais de um domínio de dados, por meio de ícones.

Elas também são utilizadas para representações multidimensionais e podem ser compostas por atributos geométricos (forma, tamanho e orientação) e atributos de aparência (cor e textura), que podem ser associados aos itens de dados em análise.

Algumas das visualizações classificadas como técnicas iconográficas são: Faces de Chernoff, Star Glyphs e Figura de Arestas (Stick Figure).

Faces de Chernoff

Um dos primeiros trabalhos utilizando uma técnica baseada em ícones foi realizado por Chernoff (1973). Este autor observou que o ser humano tem sensibilidade a uma grande variedade de expressões faciais. Assim, ele sugeriu que ícones pudessem ser representados por faces, associando suas propriedades (tais como as formas da boca, cabelo e olhos) com atributo de dados. Este tipo de visualização é denominado Faces de Chernoff.

A Figura 2.10 mostra um exemplo de representação de Faces de Chernoff, que representam uma base de dados contendo notas dos alunos de uma escola. São exemplos do mapeamento de propriedades do ícone com os atributos da base de dados:

• cores das faces associadas ao sexo (azul-masculino ou rosa-feminino);

• a curva da boca representando a situação (aprovado e reprovado);

• a quantidade de cabelos representando o valor das notas.

Figura 2.10: Exemplo de Faces de Chernoff

Fonte: adaptado de (NASCIMENTO; FERREIRA , 2005, p. 1268).

Star Glyphs

Star Glyphs é uma visualização que combina coordenadas paralelas com ícones (LEE;

REILLY; BUTAVICIUS, 2003). Esta visualização consiste na representação de p ≥ 2 atributos projetados em duas dimensões. Um círculo é construído para servir como referência e do seu centro são projetadas linhas que representam os p atributos que emanam como raios formando uma estrela, como é ilustrado na Figura 2.11. Para uma melhor observação, os raios são conectados com uma linha. O tamanho do raio representa o valor do atributo.

(JOHNSON; WICHNER, 1982; NASCIMENTO; FERREIRA, 2005).

A Figura 2.12 ilustra a visualização “Star Glyphs” representando a quantidade de atividades acadêmicas de um grupo de professores. Cada estrela representa um professor, sendo os raios as diferentes atividades acadêmicas que ele realiza. A extensão do raio ilustra a quantidade da atividade. Por meio desta visualização é possível verificar quais professores têm um maior ou menor destaque, ou seja, realizam maior número ou menor número de atividades.

Figura 2.11: Exemplo de um ícone da visualização Star Glyphs.

Figura 2.12: Exemplo da visualização de dados utilizando Star Glyphs.

Fonte: Nascimento e Ferreira (2005, p. 1301).

Figura de Arestas (Stick Figure)

Consiste em segmentos de linhas denominados ramos que possuem três parâmetros: ângulo, intensidade e comprimento. Estes parâmetros podem ser utilizados para representar os atributos de dados. As ligações dos ramos formam um ícone. A Figura 2.13 ilustra um exemplo de ícone da visualização Figura de Arestas.

Documentos relacionados