FACULDADE DE TECNOLOGIA
MESTRADO EM TECNOLOGIA
Gabriel Augusto Duarte
Visualização de Mapas Conceituais Estendidos utilizando grafos
orientados a força e restrições de posicionamento de vértices
Visualização de Mapas Conceituais Estendidos
utilizando grafos orientados a força e restrições
de posicionamento de vértices
Dissertação apresentada ao Programa de Pós-Graduação da Faculdade de Tecnologia da Universidade Estadual de Campinas, como requisito para a obtenção do título de Mestre em
Tecnologia.
Área de Concentração: Tecnologia e Inovação
Orientador: Profª. Drª. Gisele Busichia Baioco Co-orientador: Prof. Dr. Celmar Guimarães da Silva
ESTE EXEMPLAR CORRESPONDE À VERSÃO FINAL DA
DISSERTAÇÃO DEFENDIDA PELO ALUNO GABRIEL AUGUSTO DUARTE, E ORIENTADA PELA PROFª. GISELE BUSICHIA BAIOCO
Ficha catalográfica
Universidade Estadual de Campinas Biblioteca da Faculdade de Tecnologia
Felipe de Souza Bueno - CRB 8/8577
Duarte, Gabriel Augusto,
D85v DuaVisualização de mapas conceituais estendidos utilizando grafos orientados a força e restrições de posicionamento de vértices / Gabriel Augusto Duarte. – Limeira, SP : [s.n.], 2018.
DuaOrientador: Gisele Busichia Baioco. DuaCoorientador: Celmar Guimarães da Silva.
DuaDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade de Tecnologia.
Dua1. Representação do conhecimento (Teoria da informação). 2. Visualização de informação. 3. Algoritmos em grafos. I. Baioco, Gisele Busichia, 1970-. II. Silva, Celmar Guimarães da, 1978-. III. Universidade Estadual de Campinas. Faculdade de Tecnologia. IV. Título.
Informações para Biblioteca Digital
Título em outro idioma: Extended concept maps visualization through force oriented
graphs and position constraint vertices
Palavras-chave em inglês:
Knowledge representation (Information theory) Information visualization
Graph algorithms
Área de concentração: Tecnologia e Inovação Titulação: Mestre em Tecnologia
Banca examinadora:
Gisele Busichia Baioco [Orientador] Baioco, Gisele Busichia
Antonio Carlos Zambon Luís Sérgio Paço Lopes
Data de defesa: 20-02-2018
Abaixo se apresentam os membros da comissão julgadora da sessão pública de defesa de dissertação para o Título de Mestre em Tecnologia na área de concentração de Tecnologia e Inovação, a que submeteu o aluno Gabriel Augusto Duarte em 20 de fevereiro de 2018 na Faculdade de Tecnologia - FT/ UNICAMP, em Limeira/SP.
Prof. (a). Dr (a) Gisele Busichia Baioco
Presidente da Comissão Julgadora
Prof. Dr. Antonio Carlos Zambon
Faculdade de Tecnologia - FT/ UNICAMP
Prof. Dr. Luís Sérgio Paço Lopes
Academia da Força Aérea - AFA
A Ata da defesa com as respectivas assinaturas dos membros encontra-se no processo de vida acadêmica da aluna na Universidade.
O mercado atual, globalizado e interconectado, exige das organizações um compartilhamento ágil do conhecimento, a fim de manter sua vantagem competitiva em meio a uma concorrência crescente. Porém, o processo cognitivo no qual se compartilha o conhecimento é complexo, e se faz necessária, portanto, a utilização de ferramentas e técnicas que o facilitem. Esta pesquisa apresenta um método de visualização para Mapas Conceituais Estendidos, sendo esse um modelo utilizado para representação, compartilhamento e análise do conhecimento. Uma vez em que o modelo pode ser interpretado como um grafo inscrito em uma matriz, técnicas da Visualização de Informação, em especial técnicas de visualização de grafos, como orientação a força e restrição de posicionamento, se mostram úteis no cumprimento da tarefa proposta. Para possibilitar a aplicação da visualização em ambiente computacional, este trabalho tem como produto o software BLUE KMS, que implementa o algoritmo para a visualização dos Mapas Conceituais Estendidos.
Palavras-chave: representação do conhecimento; visualização de informação; algoritmos em grafos.
Nowadays, the Market is global and interconnected, demanding an agile share of knowledge to keep the competitive advantages in a growing corporative competition. However, the cognitive process of knowledge sharing is complex. It’s necessary to use techniques and tools that make it easier. This research presents a visualization method for Extended Concept Maps. This model is used to represent, share and analyze the knowledge. Once in which this model can be interpreted as a graph over a matrix, Information Visualization techniques, especially graph visualization techniques, such as force-based techniques and constraint positioning, seem to be useful to accomplish this job. To apply the proposed visualization on computational environment, this research has as product the BLUE KMS software, that implements an algorithm to ECM visualization.
Keywords: knowledge representation; information visualization; algorithm on graphs.
Primeiramente a Deus, que nos permitiu chegar até aqui.
Aos meus pais, Elso Francisco Duarte e Marli Claudia Ribeiro Duarte, por terem me incentivado sempre a estudar, dando a base necessária para que isso pudesse acontecer.
A minha esposa, Daiany Suellen Baungartner, pela constante motivação; e pela compreensão nos momentos que minha atenção era exclusiva a este trabalho.
A minha orientadora Drª. Gisele Busichia Baioco, e aos professores Dr. Antonio Carlos Zambon e Dr. Celmar Guimarães da Silva, pela enorme dedicação para com a minha pesquisa, pela paciência com meus deslizes e falta de tempo, e por não ter permitido que eu desistisse mesmo diante das maiores dificuldades.
Aos meus companheiros de trabalho Diego Henrique Magrin e Felipe Antônio Ferraz não só pelo apoio técnico, mas principalmente pela amizade e companheirismo que tanto contribuíram para meu crescimento acadêmico.
“Se vi mais longe, foi por estar sobre ombros de gigantes.”
FIGURA 2.1 – MAPA CONCEITUAL CÍCLICO ... 20
FIGURA 2.2 – MATRIZ SWOT... 21
FIGURA 2.3 – MAPA CONCEITUAL ESTENDIDO ... 25
FIGURA 3.1 – PROCESSO DE VISUALIZAÇÃO ... 32
FIGURA 3.2 – GRÁFICO DE BARRAS ... 33
FIGURA 3.3 – SÍMBOLOS INDICATIVOS ... 33
FIGURA 3.4 – PERCEPÇÃO DE CORES ... 34
FIGURA 3.5 – VARIÁVEIS RETINAIS ... 34
FIGURA 4.1 – GRAFO SIMPLES ... 40
FIGURA 4.2 – GRAFO DE ORDEM 3 ... 40
FIGURA 4.3 – MATRIZES DE INCIDÊNCIA E ADJACÊNCIA ... 41
FIGURA 4.4 – CAMINHO ... 42
FIGURA 4.5 – CICLO ... 42
FIGURA 4.6 – DÍGRAFO ... 43
FIGURA 4.7 – CONVENÇÕES DE LAYOUT ... 47
FIGURA 4.8 – RESTRIÇÃO DE ALINHAMENTO NAS ARESTAS ... 49
FIGURA 4.9 – TOPOLOGIA-FORMA-MÉTRICA ... 51
FIGURA 4.10 – ABORDAGEM HIERÁRQUICA ... 53
FIGURA 4.11 – ABORDAGEM DE VISIBILIDADE ... 54
FIGURA 4.12 – ABORDAGEM DE AMPLIAÇÃO... 55
FIGURA 4.13 – ABORDAGEM ORIENTADA A FORÇA... 57
FIGURA 4.14 – ABORDAGEM “DIVIDIR E CONQUISTAR” COM DESENHO RADIAL ... 59
FIGURA 4.15 – GRAFO COM RESTRIÇÕES DE POSICIONAMENTO ... 63
FIGURA 4.16 – GROUP-IN-A-BOX LAYOUT ... 64
FIGURA 5.1 – VISUALIZAÇÃO DO MAPA CONCEITUAL ESTENDIDO ... 73
FIGURA 5.2 – ECM COM RÓTULOS OCULTOS ... 74
FIGURA 5.3 – ECM COM MATRIZ DINÂMICA ... 75
FIGURA 5.4 – ECM SEM MATRIZ DE ATRIBUTOS ... 75
FIGURA 5.5 – ECM SEM MATRIZ DE ATRIBUTOS COM GRANDE QUANTIDADE DE VÉRTICES ... 76
FIGURA 6.3 - DESTAQUE DAS RELAÇÕES DE UM CONCEITO ... 83
FIGURA 6.4 - REPRESENTAÇÃO COMO “GALÁXIA” ... 84
FIGURA 6.5 - REPRESENTAÇÃO DAS ALTERAÇÕES NO SISTEMA ... 85
LISTA DE FIGURAS ... x SUMÁRIO ... xii 1 Introdução ... 14 1.1 Hipótese da pesquisa ... 15 1.2 Objetivo ... 15 1.3 Organização do trabalho ... 15
2 Mapas conceituais estendidos ... 17
2.1 Representação do conhecimento ... 17
2.2 Mapas conceituais ... 19
2.3 Matrizes de atributos ... 20
2.4 Mapas conceituais estendidos... 22
2.4.1 Delimitação do conhecimento representado ... 23
2.4.2 Identificação das proposições secundárias ... 23
2.4.3 Atributos de controlabilidade ... 23
2.4.4 Representação visual ... 24
2.5 Considerações do capítulo ... 26
3 Visualização de Informação... 27
3.1 Introdução a Visualização de Informação ... 27
3.2 Tipos de dados ... 28
3.3 Processo de visualização ... 30
3.4 Mapeamento visual de dados ... 32
3.5 Interação ... 35
3.6 Avaliação de representações visuais ... 37
3.7 Considerações do capítulo ... 38
4 Visualização de grafos ... 39
4.1 Teoria dos grafos ... 39
4.1.1 Matrizes de incidência e adjacência ... 41
4.1.2 Caminhos e ciclos ... 41
4.1.3 Dígrafos ... 42
4.2 Problemas na visualização de grafos ... 44
4.3 Paradigmas do desenho de grafos ... 45
4.3.1 Convenções de layout ... 46
4.3.2 Convenções estéticas ... 47
4.3.3 Restrições ... 48
4.4 Precedência de padrões estéticos ... 50
4.4.1 Topologia-forma-métrica ... 50
4.4.2 Abordagem hierárquica ... 52
4.4.3 Abordagem de visibilidade ... 53
4.4.4 Abordagem de ampliação ... 55
4.4.5 Abordagem orientada a força ... 56
4.4.6 Abordagem “Dividir e conquistar”... 58
4.5 Técnicas para visualização de grafos ... 59
4.5.1 Algoritmos orientados a força ... 60
4.5.2 Vértices com restrições de posicionamento ... 63
5 Visualização de Mapas Conceituais Estendidos ... 66
5.1 Requisitos do processo de visualização ... 66
5.2 Mapeamento visual ... 68
5.3 Algoritmo de visualização ... 71
5.4 Visualização dos Mapas Conceituais Estendidos ... 72
5.5 Considerações do capítulo ... 77
6 Estudo de caso ... 78
6.1 Primeiro cenário de avaliação ... 78
6.2 Segundo cenário de avaliação ... 87
6.3 Outros cenários de avaliação ... 91
6.4 Considerações do capítulo ... 91
7 Conclusão ... 92
7.1 Considerações gerais ... 92
7.2 Trabalhos futuros ... 93
1 INTRODUÇÃO
Tradicionalmente, o compartilhamento do conhecimento corporativo ocorre por meio de vários métodos, como interações face-a-face, tutoria, treinamento e desenvolvimento de equipes. Porém, para o mercado atual, globalizado e virtualmente conectado, tais métodos de compartilhamento se demonstram lentos e pouco efetivos. Dessa maneira, as organizações foram compelidas a organizar e produzir sistemas informatizados projetados especificamente para a facilitar a codificação, coleção, integração e disseminação do conhecimento organizacional, dando origem aos sistemas de gerenciamento do conhecimento (Knowledge Management Systems - KMS) (ALAVI; LEIDNER, 1999).
Uma vez armazenado e estruturado, o conhecimento ainda demanda um segundo processo complexo para que seu receptor possa utilizá-lo. É necessário que o conhecimento seja recebido e absorvido pelo destino. O objetivo da representação do conhecimento é facilitar esse processo, e recursos visuais permitem que atalhos sejam tomados no processo cognitivo (CARD; MACKINLAY; SHNEIDERMAN, 1999). Técnicas que permitam utilizar, de maneira apropriada, os recursos visuais são pesquisadas e elaboradas pela área da Visualização de Informação (MAZZA, 2009).
O modelo de representação do conhecimento chamado Mapas Conceituais Estendidos (ZAMBON et al., 2016a) tem por objetivo unir técnicas conceituadas da área da gestão estratégica, permitindo que o conhecimento corporativo possa ser representado, analisado e compreendido como sistema complexo. Entretanto, até então o modelo não havia incorporado nenhuma técnica que ampliasse sua capacidade cognitiva, como as técnicas da Visualização de Informação.
Este trabalho propôs a aplicação de técnicas da Visualização de Informação, principalmente técnicas da visualização de grafos, como orientação a força e restrições no posicionamento de vértices, verificando a utilidade das técnicas na visualização de Mapas Conceituais Estendidos. A aplicação em ambiente computacional se deu com o desenvolvimento do software BLUE KMS (ZAMBON et al., 2016b), permitindo a elicitação, armazenamento e representação do conhecimento utilizando Mapas Conceituais Estendidos.
1.1
Hipótese da pesquisa
A presente pesquisa teve como hipótese: “É possível propor novas representações visuais para Mapas Conceituais Estendidos, utilizando técnicas da Visualização de Informação, de maneira a melhor evidenciar características relevantes do modelo, em diferentes cenários de análise?”
1.2
Objetivo
Este trabalho teve por objetivo principal testar a hipótese de que as técnicas de Visualização de Informação, especialmente as técnicas de visualização de grafos, são úteis para a representação do modelo conhecido como Mapas Conceituais Estendidos. Em especial, este trabalho focou-se no uso de grafos orientados a força, com e sem restrições de posicionamento.
Foram objetivos secundários, necessários ao cumprimento do objetivo principal, a definição de requisitos para a visualização, definição das restrições necessárias, definição das interações e mapeamento visual. Da mesma maneira, foi necessária a implementação de algoritmo para realização do processo de visualização em ambiente computacional, originando o software BLUE KMS (ZAMBON et al., 2016b).
1.3
Organização do trabalho
Esta dissertação está organizada na seguinte estrutura:
• O Capítulo 2 aborda a necessidade da socialização e compartilhamento do conhecimento para que as organizações mantenham a competitividade na realidade do mercado contemporâneo. São descritos os mapas conceituais e matrizes de atributos como ferramentas já conceituadas na área da gestão estratégia, para então apresentar os Mapas Conceituais Estendidos, modelo que une as vantagens analíticas dessas duas ferramentas, e que representa a base para este trabalho.
• O Capítulo 3 aborda a área de Visualização de Informação, seus conceitos, técnicas e ferramentas que permitem ampliar a capacidade humana de análise, compreensão e aprendizado sobre um conjunto de dados, por meio de recursos visuais.
• O Capítulo 4 apresenta técnicas da Visualização de Informação voltadas aos grafos, uma vez que os mapas conceituais, componentes dos Mapas Conceituais Estendidos, têm sua representação visual baseada nessa estrutura.
• O Capítulo 5 descreve a representação visual criada neste trabalho, composta pelos requisitos para visualização, restrições, interações e mapeamento visual dos Mapas Conceituais Estendidos. Em seguida, o capítulo apresenta o algoritmo de visualização, o software desenvolvido e os resultados visuais gerados.
• O Capítulo 6 apresenta o caso de estudo utilizado para avaliação do algoritmo proposto no Capítulo 5.
• O Capítulo 7 apresenta as considerações finais da pesquisa, conclusões que puderam ser realizadas e propostas de trabalhos futuros.
2 MAPAS CONCEITUAIS ESTENDIDOS
O conhecimento corporativo é composto pela união do conhecimento individual de cada um dos agentes envolvidos nas tarefas organizacionais, sejam eles colaboradores, gestores ou participantes externos. Porém, o processo de construção do conhecimento coletivo e compartilhado é complexo e demanda estratégias para socializar um recurso que é altamente endógeno e subjetivo. O presente capítulo realiza uma breve contextualização sobre a dificuldade da externalização desse conhecimento, apresentando técnicas conhecidas, como matrizes de atributos e mapas conceituais, para redução dessa complexidade. Por fim, é apresentada a abordagem dos Mapas Conceituais Estendidos (Extended Concept Maps - ECM) (ZAMBON et al., 2016a), sendo essa o ponto de partida deste trabalho.
2.1
Representação do conhecimento
Organizações corporativas foram inicialmente concebidas a partir do trabalho coletivo e, nos dias atuais, tal modelo ainda é utilizado para adquirir vantagens competitivas sustentáveis. Sob a ótica sistêmica, um fluxo de recursos compatível com as mudanças do mercado torna duradouras as vantagens competitivas adquiridas. Para atingir esse ponto de maturidade organizacional é necessário alinhar questões funcionais, informacionais e tecnológicas (ANUNCIAÇÃO; ZORRINHO, 2006).
Tais condições sistêmicas também definem as diversas competências que os gestores devem possuir no ambiente contingencial (ROUBY; THOMAS, 2009). Competências que são construídas endogenamente pelos indivíduos por meio de processos individuais de aprendizado, onde o acúmulo de conceitos, teorias e ideias constrói a base do conhecimento. Dessa maneira, é possível dizer que o conhecimento é o resultado de uma atividade intelectual individual de obtenção e processamento de dados externos. Inteligência é a capacidade de aplicação do conhecimento a fim de atingir os objetivos desejados. Em suma, o conhecimento está relacionado ao indivíduo, sendo um recurso interno utilizado para produzir mudanças externas, no ambiente coletivo (ANUNCIAÇÃO; ZORRINHO, 2006).
Sendo as corporações ambientes de trabalho coletivo, faz-se necessária a construção do conhecimento em grupo. Para externalizar o conhecimento, as corporações promovem a socialização e troca de informações entre seus colaboradores. Porém, a tarefa de
compartilhar um recurso tácito e individual demonstra-se complexa e se torna um problema a ser resolvido (NONAKA; TAKEUCHI, 1996).
A fim de organizar o conhecimento individual e construir o conhecimento coletivo, é necessário representá-lo. A representação do conhecimento se baseia em métodos sistemáticos e formais para explicitar conceitos que pertençam somente ao individuo e são relevantes na construção da inteligência corporativa. De acordo com a Teoria da Codificação Dual (PAIVIO, 1991), a estrutura cognitiva humana relaciona imagens e palavras de maneira independente, armazenando esses componentes sob diferentes codificações internas. Quando se imagina um carro, por exemplo, a mente humana normalmente busca a representação fonética da palavra “carro”, associando a palavra a imagens de carros. Considerando que o conhecimento é dividido em dois subsistemas: imagético e verbal, a externalização do conhecimento por meio de representações torna-se mais eficiente quando une a capacidade de associação desses dois componentes (TAVARES, 2007).
A partir da década de 1970, o planejamento estratégico das organizações deixou de ser puramente numérico e racional, passando a utilizar abordagens cognitivas (MACHADO-DA-SILVA; FONSECA; FERNANDES, 1999; MINTZBERG, 1987). Considerando essa nova realidade, as limitações cognitivas dos gestores se tornaram um fator a ser trabalhado. De acordo com a teoria da racionalidade limitada (SIMON, 1991), devido a incapacidade dos gestores em conhecer todas as variáveis de tempo, recursos e interesses, as decisões tomadas podem ser satisfatórias, mas nunca ótimas.
A Abordagem Proposicional (MITCHELL; BOYLE, 2010) enfatiza a semântica, considerando que o conhecimento é organizado em proposições inter-relacionadas, compondo um domínio contextualizado e global (BADDELEY, 1974). Dessa abordagem surge um esquema interpretativo, definido por mapas conceituais (DUVAL et al., 2012). Mapas conceituais são diagramas formados por conceitos ligados por ações, associando elementos gráficos a palavras, como predito na Teoria da Codificação Dual (PAIVIO, 1991).
Outra estratégia amplamente utilizada por gestores para transcender os limites cognitivos é a utilização de matrizes de atributos. Uma matriz de atributos considera que os componentes dos processos decisórios podem ser reduzidos a critérios ou atributos. Esses atributos são previamente definidos por analistas, que os categorizam em uma ordem que
facilite a tomada de decisão. Matrizes de atributos, assim como mapas conceituais, são instrumentos analíticos utilizados pelas organizações para minimizar restrições na formulação de hipóteses e facilitar a elaboração das soluções de problemas. Matrizes ampliam o acesso a elementos semânticos, reduzindo os efeitos dos limites cognitivos.
2.2
Mapas conceituais
Mapas conceituais são diagramas nos quais conceitos são relacionados. Conceitos são pequenas frases que contêm um substantivo compondo o núcleo de seu significado. Esses conceitos são interligados por relações de causa e efeito representadas por verbos ou sintagmas verbais (NOVAK, 2010). Cada relacionamento representa uma proposição (p) e, a união das proposições em um contexto, dão sentido a uma proposição principal (P).
A representação de alguns eventos só é possível utilizando feedbacks (retroalimentação), processos não lineares em sistemas dinâmicos. Tais processos são necessários para explicar como um conceito A pode influenciar e modificar um conceito B e, em um momento futuro, como o conceito B irá influenciar o conceito A, direta ou indiretamente. Um mapa conceitual cíclico, ou diagrama de feedbacks (SENGE, 2014), é o meio para representar uma relação entre conceito-causa e conceito-efeito, que gera os ciclos de retroalimentação. No âmbito da física, os mapas conceituais cíclicos assemelham-se a redes de transferência de energia, que geram valor adicional, fluindo do conceito-causa para o conceito-efeito pela relação entre eles. Em virtude disso, observa-se a proximidade com as ideias de auto-organização e dinâmica não-linear (D’OTTAVIANO; BRESCIANI FILHO, 2000).
A Figura 2.1 exemplifica um mapa conceitual cíclico contendo quatro proposições. Cada proposição p é composta por um conceito-causa Cc, um conceito-efeito Ce, e uma relação de causa e efeito, simbolizada por um verbo V. Um exemplo de proposição pode ser dado por: “Avanços em inovação (Cc) encorajam (V) o entusiasmo da equipe de inovação (Ce)”. A influência entre conceitos pode acontecer de duas maneiras: o conceito-causa reforçando (+) ou balanceando (-) o comportamento do conceito-efeito. Uma relação de reforço demonstra um comportamento de expansão, no qual o conceito-causa influencia o conceito-efeito ampliando sua ação no sistema. Por sua vez, uma relação de balanceamento
demonstra o oposto, significando que a influência do conceito-causa reduz a ação do conceito-efeito (STERMAN, 2001).
Figura 2.1 – Mapa conceitual cíclico
Fonte: Desenvolvido pelo autor
De acordo com a Abordagem dos Sistemas Abertos (BERTALANFFY, 1968), sistemas podem ser modificados por influências externas, do mesmo modo que seus componentes podem influenciar o meio externo. Como mapas conceituais representam segmentos de sistemas reais, consequentemente podem ser utilizados para análise de partes delimitadas a um domínio específico.
2.3
Matrizes de atributos
Matrizes de atributos são instrumentos analíticos utilizados para categorizar e comparar conceitos que representem diferentes segmentos da situação analisada. A matriz SWOT (HELMS; NIXON, 2010) é uma matriz de atributos amplamente utilizada no gerenciamento estratégico (SLACK, 1987; THOMPSON; BANK, 2010). Em sua representação original, a matriz apresenta quatro células, significando forças (strengths - S),
fraquezas (weaknesses - W), oportunidades (opportunities - O) e ameaças (threats - T), respectivamente. As atividades avaliadas são posicionadas em cada uma dessas células.
A Figura 2.2 apresenta um exemplo da matriz SWOT na qual é possível observar dois atributos divididos em colunas (estimulam ou inibem o crescimento) e dois atributos divididos em linhas (atributos internos ou externos da organização).
Figura 2.2 – Matriz SWOT
Fonte: Desenvolvido pelo autor
De acordo com a situação analisada, conceitos são distribuídos na matriz SWOT, sendo caracterizados em relação aos atributos da matriz. Na matriz não há qualquer relação entre os conceitos ou noções de causa e efeito, como ocorre nos mapas conceituais.
Mapas conceituais oferecem ao analista uma maior capacidade de mapear e compreender os fenômenos que ocorrem no cenário analisado, enquanto matrizes de atributos são eficientes para separar componentes analíticos em segmentos, permitindo a avaliação de mudanças no ambiente interno, geradas tanto próprio ambiente interno quanto externo, conforme a Abordagem dos Sistemas Abertos (BERTALANFFY, 1968).
2.4
Mapas conceituais estendidos
Nomeia-se Mapa Conceitual Estendido (Extended Concept Map - ECM) o conjunto de regras baseadas na abordagem proposicional, unindo mapas conceituais e matrizes de atributos (ZAMBON et al., 2016a). Tais regras respeitam os seguintes axiomas:
• A representação do conhecimento é contextualizada em um domínio específico que engloba um ou mais problemas a serem solucionados;
• A representação possui proposições inter-relacionadas, compostas por conceitos, e verbos que unem esses conceitos em relações de causa e efeito;
• A posição dos conceitos no diagrama representa o nível de controle do agente sobre o conceito, sendo agente o detentor do conhecimento, e dos conceitos sobre o domínio;
• Conceitos possuem significado intrínseco e contextualizado no domínio que estão inseridos.
A representação do conhecimento utilizando ECM segue os seguintes passos:
a. Declaração da proposição inicial P representando o problema a ser analisado, de acordo com o domínio que o engloba (Seção 2.4.1).
b. Identificação das proposições secundárias (p), causa (Cc), conceitos-efeito (Ce) e suas relações de causa e conceitos-efeito (V) (Seção 2.4.2).
c. Definição da controlabilidade que os agentes possuem sobre os conceitos e da controlabilidade dos conceitos sobre P (Seção 2.4.3).
2.4.1 Delimitação do conhecimento representado
O conhecimento possui um senso contextualizado, e sua representação está associada a uma questão problemática que deve ser abordada, aprendida ou resolvida. Dessa maneira, inicialmente o agente declara uma proposição principal P para delimitar o cenário a ser analisado. Isso se faz necessário para que o agente esteja mentalmente focado no cenário abordado e possa recuperar com clareza as características da situação analisada.
Tais características são representadas pelas proposições secundárias (p) que compõem o modelo e são indispensáveis para a compreensão da situação. Dessa maneira, é essencial que as proposições p façam referencia a P, para que se obtenha uma representação top-down.
2.4.2 Identificação das proposições secundárias
Proposições secundárias p são compostas por conceitos Cc e Ce, relacionados por proposições de causa e efeito, cujo núcleo é composto por um verbo V. Para uma análise apropriada, todos os conceitos devem fazer parte de ao menos um relacionamento, mas nunca de todos, o que representaria uma estrutura de causa e efeito inviável ou até mesmo impossível.
Quando todas as proposições p estão interconectadas, a estrutura gerada é idêntica à de um mapa conceitual cíclico. Em razão disso, atributos de balanceamento (-) e reforço (+) também são adicionados às proposições, tal como apresentado na Seção 2.2.
2.4.3 Atributos de controlabilidade
Conceitos representam algo pertencente ao domínio, seja concreto ou abstrato, e são responsáveis pelas mudanças nos sistemas. Tais mudanças ocorrem de duas maneiras: pela influência do agente sobre o conceito ou pela influência do conceito sobre P.
O agente pode causar as mudanças desejadas no sistema se puder controlar um conceito cuja influência atinja elementos que deseja modificar. Se um agente possui controle sobre um conceito, esse conceito é dito controlável (CT) pelo agente. Por outro lado, se um conceito não pode ser controlado diretamente pelo agente, tal conceito é não-controlável (NC)
pelo agente. Ambas as situações exprimem certeza, positiva ou negativa, sobre o nível de controle do agente. Existe ainda a situação de penumbra (PN) que caracteriza a falta de certeza sobre o controle do agente em relação a determinado conceito. Todo conceito presente no ECM deve possuir o atributo que define sua situação acerca do controle do agente. Tal atributo é nomeado formalmente por “controlabilidade do agente”.
Outro atributo presente nos conceitos do ECM define a capacidade de um conceito em influenciar mudanças em P, em outras palavras, a capacidade do conceito em influenciar o meio no qual está inserido. Todas as relações de causa e efeito podem mudar a situação de P, seja direta ou indiretamente. Se um conceito produz mudanças diretas em P, então esse conceito é tido como controlável (CT) em relação ao domínio. De maneira contrária, se um conceito não pode influenciar P diretamente, tal conceito é dado como não-controlável (NC) em relação ao domínio. Se a capacidade de influência de um conceito sobre P é desconhecida, é caracterizada a situação de penumbra (PN) em relação ao domínio. Formalmente, o atributo que caracteriza a influência de P sobre o domínio é chamado “controlabilidade no domínio”.
2.4.4 Representação visual
A representação visual básica de um ECM, ou seja, a representação ainda sem o auxílio de técnicas de Visualização de Informação, cuja aplicação são o motivo da presente pesquisa, é feita por meio dos seguintes componentes:
• Proposição inicial: no ECM, a proposição inicial P é apresentada em forma textual, inscrita em um quadro posicionado na área superior do diagrama. A posição de destaque se deve a maneira de leitura do diagrama, que se inicia sempre pela proposição inicial, com o objetivo de contextualizar o analista acerca do domínio em questão.
• Atributos de controlabilidade: abaixo da proposição inicial encontra-se a matriz de atributos, de tamanho 3 × 3, onde os conceitos serão inseridos. As colunas da matriz representam os atributos de “controlabilidade no domínio”, podendo ser NC, PN, CT, em uma leitura da esquerda para a direita. Enquanto as linhas representam a “controlabilidade do agente”, podendo ser CT, PN, NC, em uma leitura realizada de
cima para baixo. A situação de penumbra total (PN, PN) está propositalmente situada ao centro do diagrama, por se tratar do ponto de maior incerteza, devendo ser, portanto, o primeiro foco de atenção do analista.
• Conceitos: uma vez representada a matriz de atributos, os conceitos devem ser inseridos nas células que descrevam sua situação de controlabilidade. Para tal, esses conceitos são apresentados como círculos que possuem rótulos textuais.
• Relações de causa e efeito: relações de causa e efeito são representadas no ECM por meio de setas que partem do conceito-causa com destino ao conceito-efeito. Essas setas devem ser curvas, representando a não linearidade do raciocínio sistêmico. No final das setas, devem ser apresentados os sinais de reforço (+) ou balanceamento (-) indicando a natureza da relação de causa e efeito.
A Figura 2.3 apresenta um exemplo da representação visual básica do ECM, na qual quatro conceitos se relacionam.
Figura 2.3 – Mapa Conceitual Estendido
Na Figura 2.3, o conceito A possui a configuração de controlabilidade (CT, PN), o conceito B controlabilidade (PN, CT), o conceito C controlabilidade (NC, NC), e o conceito D controlabilidade (PN, PN). É possível notar a influência de A sobre B, B sobre C e C sobre A, gerando um ciclo de influências de reforço o qual, se não houverem interferências por parte do agente, tende ao infinito. Existe também a influência de A sobre D, em uma relação de balanceamento. Como não é certa a influência do agente sobre o conceito D, caso fosse necessária uma ação sobre esse conceito, seria necessária que fosse feita sobre o conceito A, controlável pelo agente. Se o objetivo for o aumento do efeito de D sobre o sistema, é necessário reduzir o comportamento de A, se for necessário reduzir o efeito de D, basta ampliar o comportamento de A.
2.5
Considerações do capítulo
Este capítulo apresentou conceitos sobre representação do conhecimento, mapas conceituais, matrizes de atributos, introduzindo conceitos do ECM. Como visto, a representação básica desse modelo não utiliza técnicas de visualização para ampliar sua capacidade cognitiva, sendo necessário buscar tais técnicas na área da Visualização de Informação. Como meio para a obtenção do embasamento teórico necessário, o próximo capítulo aborda justamente essa área.
3 VISUALIZAÇÃO DE INFORMAÇÃO
Cognição é a aquisição e utilização de conhecimento (CARD; MACKINLAY; SHNEIDERMAN, 1999). A atividade cognitiva cria modelos mentais sobre o conjunto de informações recebido através dos sentidos humanos. Modelos mentais são representações mentais sobre uma situação real, ou como definido na psicologia cognitiva, uma “codificação interna” do cérebro descrevendo as características do mundo real (MAZZA, 2009).
Porém, a atividade cognitiva não ocorre sempre da mesma maneira, com a mesma facilidade para todos os tipos de informações recebidas. A capacidade cognitiva pode ser ampliada quando recursos visuais são utilizados (CARD; MACKINLAY; SHNEIDERMAN, 1999). A área de Visualização de Informação tem por objetivo pesquisar métodos e ferramentas que organizam e apresentam dados de maneira visual ampliando, portanto, a cognição (MAZZA, 2009). Esses métodos e ferramentas estão descritos no presente capítulo.
3.1
Introdução a Visualização de Informação
O termo visualização pode ser utilizado para definir a atividade cognitiva realizada por meio da visão, na qual se interpreta uma imagem. Na Visualização de Informação, o termo visualização também se refere a representação visual de algo.
A visualização consegue expandir a capacidade de processamento de dados acessando diretamente os recursos do sistema visual humano. São fatores que colaboram para que a visualização facilite a cognição: (1) Aumento da capacidade de memorização da informação apresentada; (2) Redução da necessidade de busca das informações relevantes em meio a um conjunto grande de dados; (3) Facilidade de detecção de padrões; (4) Facilidade de realizar inferências perceptivas; (5) Utilização de mecanismos de atenção da percepção humana para monitorar pontos relevantes da informação; (6) Tradução da informação para meios comuns a compreensão humana (CARD; MACKINLAY; SHNEIDERMAN, 1999).
O termo Visualização de Informação surgiu em meados da década de 1980, para identificação da disciplina que pesquisa a criação de artefatos visuais destinados a ampliar a cognição acerca da informação. A necessidade de tal pesquisa se intensificou desde o início da globalização econômica e de comunicação, quando houve um crescimento exponencial da
quantidade de dados armazenados, considerando que esse aumento de dados não significou necessariamente um crescimento imediato na quantidade de informação (MAZZA, 2009). A necessidade de se processar dados para que se tornem informação denuncia a diferença entre esses conceitos, sendo necessário defini-los.
Dados são fatos conhecidos que possuem um significado próprio e podem, de alguma maneira, ser armazenados. Nomes, endereços e telefones são dados sobre pessoas que podem estar registrados em uma agenda, por exemplo. Quando isolados, os dados não são suficientes para se estabelecer o processo comunicativo, no qual a origem envia a informação e o destino compreende. É necessário que os dados sejam processados, organizados e apresentados de maneira adequada para que se tornem úteis para a compreensão da situação que representam. O resultado desse processo de transformação dos dados (cognição) é a informação. A sucessiva obtenção de informações que permite compreender uma situação é chamada de conhecimento. Pode-se citar, como exemplo, o aluno que recebe diariamente as informações de seu professor e se torna capaz de resolver um problema da matemática. Diz-se, portanto, que o aluno adquiriu conhecimento (ELMASRI; NAVATHE, 2003) (MAZZA, 2009).
3.2
Tipos de dados
Qualquer método de representação visual se inicia por um conjunto de dados. Tais dados podem ser classificados dependendo do tipo a que pertencem, e de acordo com os atributos que possuem, e a escolha do método de representação depende dessa classificação. KERREN, EBERT e MEYER (2006) propõe duas possíveis taxonomias para a classificação dos dados:
Classificação dos dados por atributos:
• Escala nominal: escala na qual não existe relação de ordem entre os dados, como nomes, endereços e telefones. É possível apenas afirmar que existe igualdade ou diferença entre os dados.
• Escala ordinal: escala na qual há uma relação de ordem estabelecida entre os dados. É possível dizer que o elemento A é maior ou menor que B graças a sua característica ordinal.
• Escala intervalar: estendendo a escala ordinal, na escala intervalar os dados são ordenados e igualmente espaçados, sendo conhecida a diferença existente entre os valores. Exemplo: pessoas divididas em grupos de 1,60m, 1,70m e 1,80m, ou seja, grupos com intervalos de 10cm.
• Escala racional ou quantitativa: estendendo a escala intervalar, na escala racional considera-se o zero absoluto como referência. Valores monetários são um exemplo para a escala racional.
Classificação de dados no contexto da Visualização de Informação:
• Dados lineares ou de primeira dimensão: dados que podem ser organizados de maneira sequencial, como listas de nomes, códigos-fonte de softwares e textos em geral.
• Dados planares ou de segunda dimensão: dados que podem ser apresentados espacialmente em um plano de duas dimensões, como o eixo cartesiano. Dados geográficos estão inclusos nessa categoria.
• Dados de terceira dimensão: representam os objetos do mundo real, como moléculas, pessoas ou construções. Esses objetos possuem volume e devem, portanto, ser representados em três dimensões.
• Dados temporais: dados que podem ser apresentados em linhas de tempo, uma vez que possuem ordem cronológica. A diferença dos dados dessa categoria para os dados lineares está no fato de possuírem um início e fim.
• Dados multidimensionais ou multivariados: dados relacionais ou estatísticos, como os armazenados em bancos de dados. Cada elemento pode possuir n características em um espaço n-dimensional. Exemplo: Uma pessoa possui nome, endereço e telefone. O endereço, por sua vez, possui logradouro, número, bairro e cidade, e o telefone possui código da localidade e número.
• Dados hierárquicos: dados cujos elementos possuem relação de hierarquia ou filiação entre si. Todos os elementos, exceto a raiz, possuem um elemento pai. Os elementos e as relações podem possuir múltiplos atributos.
• Redes complexas e grafos: representam os dados cujas relações não são somente hierárquicas. As ligações entre os elementos são arbitrárias, podendo representar estruturas relacionais complexas. Devido a importância dessa categoria para a presente pesquisa, ela está melhor abordada no Capítulo 4.
3.3
Processo de visualização
O objetivo principal da Visualização de Informação é criar representações visuais que sejam úteis e simples de se utilizar. Embora não exista um procedimento único para essa tarefa, podem ser utilizadas algumas abordagens, como a proposta por MAZZA (2009):
• Definição do problema: identificação do objetivo principal na análise dos dados. Questões como “Por que a representação visual é necessária?” ou “O que é preciso comunicar por meio da visualização?” devem ser respondidas antes da criação da representação, pois influenciam na sua estrutura.
• Exame da natureza dos dados: é necessário conhecer os tipos de dados que se deseja representar. Estruturas que representam bem dados quantitativos podem não ser tão adequadas para representar dados qualitativos, por exemplo. A Seção 3.4 descreve como essa escolha deve ser realizada.
• Verificação do número de dimensões: o número de dimensões ou atributos dos dados é um fator decisivo na escolha da estrutura visual. Atributos podem ser dependentes, quando variam de acordo com o comportamento dos atributos independentes, ou independentes, cujo comportamento não varia acompanhando outros atributos. Conjuntos de dados podem ser univariados, bivariados, trivariados ou multivariados, de acordo com a quantidade de atributos dependentes.
• Análise da estrutura dos dados: conforme visto na Seção 3.2, dados podem ser lineares, planares, complexos, etc. Essa classificação também influencia na escolha das estruturas visuais, conforme descrito na Seção 3.4.
• Análise dos tipos de interação: determinadas representações visuais podem ser estáticas, e não necessitam de interação para cumprir o papel de comunicação da informação. Em outros casos é possível, ou até mesmo necessário, permitir a manipulação da estrutura, variando sob demanda a informação revelada. A interação em representações visuais está melhor abordada na Seção 3.5.
De maneira complementar, KERREN, EBERT e MEYER (2006) propõem algumas perguntas a serem respondidas:
• Quem irá utilizar a visualização?
• Quais são os dados que serão visualizados? O que esses dados representam?
• Quais tarefas serão realizadas mediante análise dos dados?
• Quais são os insights (percepções) que a visualização deve facilitar?
Uma vez realizadas análises e definições sobre a representação, para criação de artefatos visuais que auxiliem na interpretação dos dados, é preciso transcorrer uma sucessão de estágios, descritos por MAZZA (2009):
• Obtenção dos dados brutos: coleta dos dados originais os quais se deseja representar. Esses dados são coletados do ambiente que se deseja analisar e geralmente não estão em uma estrutura que possa ser utilizada diretamente como entrada para a visualização.
• Processamento e transformações: processamento prévio dos dados, a fim de tornar sua estrutura adequada a visualização. Nesse processamento podem ser aplicados filtros, eliminando dados desnecessários ou irrelevantes; podem ser realizados cálculos,
objetivando adicionar sumarizações e dados estatísticos; bem como podem ser adicionados outros atributos, como meta-dados, para facilitar o processo de visualização.
• Mapeamento visual: definição das estruturas visuais utilizadas na representação dos dados. Essa escolha de estruturas depende dos tipos de dados representados, conforme descrito na Seção 3.4.
• Geração da representação visual: exibição do resultado final do processo de visualização. Nesse processo é exibido o resultado da aplicação do mapeamento visual sobre os dados processados e transformados.
A Figura 3.1 exibe um diagrama sobre o processo de visualização que se inicia nos dados brutos e é finalizado na visualização. Os estágios desse processo estão separados em duas áreas: obtenção e processamento de dados, e visualização. Em sistemas interativos esse processo pode se tornar um ciclo, sendo repetido a cada interação do usuário.
Figura 3.1 – Processo de visualização
Fonte: Desenvolvido pelo autor
3.4
Mapeamento visual de dados
Sabendo-se que as representações visuais auxiliam a interpretar os dados, é necessário conhecer os fatores que contribuem para que isso ocorra. Segundo LARKIN e SIMON (1987) apud MAZZA (2009) alguns desses fatores são:
• Localização: na representação visual, os elementos são posicionados no espaço físico. Isso permite realizar inferências diretas sobre a relação entre eles. No gráfico de barras
da Figura 3.2, o maior valor pode ser facilmente localizado antes mesmo da leitura do rótulo textual, graças a facilidade em identificar a barra de maior comprimento.
Figura 3.2 – Gráfico de barras
Fonte: Desenvolvido pelo autor
• Redução de rótulos: esta propriedade está ligada a capacidade humana de reconhecimento de elementos visuais sem que seja necessária a descrição textual dos mesmos. Como pode ser observado na Figura 3.3, é possível identificar o significado de cada um dos elementos (telefone, kit de emergência, carrinho de compras), sem que haja qualquer descrição textual.
Figura 3.3 – Símbolos indicativos
Fonte: Desenvolvido pelo autor
• Ampliação perceptual: o ser humano consegue, por meio da percepção visual, detectar naturalmente características que diferenciem elementos. Na Figura 3.4, embora existam dezenas de círculos, encontrar qual circulo diverge dos outros é um processo mentalmente simples e instantâneo, graças a sua cor.
Figura 3.4 – Percepção de cores
Fonte: Desenvolvido pelo autor
O aumento na capacidade cognitiva ocorre graças a características gráficas específicas das representações visuais. Segundo BERTIN (1983) apud KERREN, EBERT e MEYER (2006), esse fenômeno ocorre por meio de sete possíveis variáveis: posição, forma, orientação, cor, textura, valor e tamanho. Tais variáveis são conhecidas como variáveis retinais ou propriedades gráficas na literatura. A Figura 3.5 apresenta exemplos de cada uma dessas variáveis.
Figura 3.5 – Variáveis retinais
Fonte: Desenvolvido pelo autor
Considerando a percepção visual humana, as variáveis retinais não se comportam da mesma maneira. Algumas delas são mais efetivas que outras para representar valores quantitativos, enquanto outras são mais adequadas a valores qualitativos (MAZZA, 2009). De acordo com o tipo de dado que se deseja representar, é possível escolher uma propriedade gráfica que mais se adeque a sua representação, como pode ser visto no Quadro 3.1. No
quadro, cada uma das propriedades gráficas está relacionada a uma classe de dados, com 1 para a menos adequada e 3 a mais adequada a representação.
Quadro 3.1 – Propriedades gráficas em relação aos tipos de dados
Escala nominal Escala ordinal/intervalar Escala racional
Posição 3 3 3 Tamanho 1 3 3 Forma 3 2 1 Valor 1 3 3 Cor 3 2 1 Orientação 3 1 1 Textura 3 1 1
Fonte: (KERREN; EBERT; MEYER, 2006)
O processo de mapeamento visual se encerra na definição da propriedade gráfica que irá representar cada um dos atributos do conjunto de dados destacados na visualização.
3.5
Interação
Humanos podem utilizar uma combinação de diversos meios de comunicação para se expressar. Em um diálogo se utiliza, concomitantemente, a fala, expressões faciais e gestos para transmitir uma informação. A área da Interação Humano-Computador (IHC) pesquisa maneiras de utilizar a capacidade humana de comunicação para interação com as máquinas (KERREN; EBERT; MEYER, 2006).
A interação é fundamental em diversas técnicas da Visualização de Informação. Em uma representação em três dimensões por exemplo, é necessário girar a imagem para que seja possível revelar objetos que não estejam em primeiro plano. Ferramentas de interatividade permitem modificar os dados, alterar o mapeamento visual e manipular a visualização gerada, facilitando a exploração dos dados e revelando fatores que não poderiam estar explícitos em representações estáticas. Em suma, todas as técnicas de interação sobre representações visuais têm um objetivo em comum: prover maneiras de acesso ao conjunto geral dos dados e, ao mesmo tempo, permitir ao usuário obter detalhes específicos que julgue relevante a análise (MAZZA, 2009).
Para que sejam interpretadas da maneira desejada, as interações devem ser realizadas em intervalos determinados de tempo, sendo esses divididos em três grupos: 0,1 segundo, 1 segundo, 10 segundos (CARD; MACKINLAY; SHNEIDERMAN, 1999).
• Aproximadamente 0,1 segundo: estímulos que ocorram com intervalos de 0,1 segundo ou menos são fundidos em uma única percepção. Duas imagens similares vistas com um intervalo de 0,1 segundo são interpretadas como movimento, e animações deixam de funcionar quando a transição entre seus quadros ultrapassa esse tempo. Dessa maneira, ações dos usuários devem resultar em efeitos que ocorram em até 0,1 segundo para que sejam interpretadas como reações, e não eventos isolados.
• Aproximadamente 1 segundo: tempo médio de reação para ações não esperadas. Eventos que ocorram em um tempo menor que 1 segundo são muito rápidos para que o usuário responda, se não estiver esperando ativamente que aconteçam. Um motorista demora aproximadamente 0,7 segundo para reagir e frear um automóvel após um evento inesperado em seu caminho. O dialogo humano também consiste em blocos de aproximadamente 1 segundo, e quando um há uma pausa por um tempo maior que esse, o ouvinte é compelido a dizer a interjeição “ã-hã”, demonstrando que o canal de comunicação ainda está aberto. Graças a essa percepção, eventos demorados devem exibir sinais de atividade, como as barras de carregamento, para que o usuário seja informado que o sistema, algoritmo ou representação ainda está ativo.
• Aproximadamente 10 segundos: tempo médio de uma interação, podendo variar de 5 a 30 segundos, sendo considerado o tempo da menor unidade do trabalho cognitivo. É interessante que o usuário seja informado do início e término das interações nesse tempo, facilitando compreender as alterações que ocorrem por meio delas.
As respostas dos sistemas computacionais, utilizados para gerar as representações visuais, devem ser ajustadas para que ocorram no tempo correspondente ao resultado que se deseja obter. Um exemplo são as animações sobre a transformação de dados, que não devem ser muito rápidas: apenas exibir o início e fim de uma representação pode fazer com que o usuário não reconheça quais objetos do estado inicial originaram os objetos do estado final (CARD; MACKINLAY; SHNEIDERMAN, 1999).
3.6
Avaliação de representações visuais
A avaliação de representações visuais tem o objetivo de garantir que a representação atenda os requisitos propostos no seu planejamento de maneira satisfatória. A escolha dos critérios de avaliação depende do tipo de representação e da quantidade dedicada de recursos, sendo essa muitas vezes limitada (MAZZA, 2009).
Tradicionalmente, sistemas são avaliados em termos de desempenho. Sistemas que utilizam representações visuais possuem necessidades que muitas vezes sobrepõe a necessidade por desempenho, como a usabilidade ou satisfação do usuário (KERREN; EBERT; MEYER, 2006).
A avaliação de sistemas que realizem representações visuais é complexa, como em todos os sistemas que envolvam interação direta com seres humanos. Dois usuários diferentes que utilizem o mesmo sistema podem realizar julgamentos distintos, dependendo da sua experiência, conhecimento, habilidades cognitivas e perceptivas.
Devido a semelhança dos objetivos de avaliação e dos sistemas avaliados, a Visualização de Informação utiliza técnicas da área de Interação Humano-Computador para avaliar sistemas que realizem representações visuais. Essas técnicas podem ser divididas em dois grupos: avaliações analíticas e avaliações empíricas.
Métodos analíticos: métodos que se originam em modelos psicológicos da interação entre humanos e máquinas, geralmente baseados em estudos comportamentais e cognitivos. Essas avaliações verificam se os sistemas são compatíveis com determinadas heurísticas, as quais são definidas nos princípios da usabilidade e acessibilidade de interfaces gráficas. Avaliadores utilizam os sistemas e julgam se são compatíveis com as heurísticas.
Métodos empíricos: métodos que utilizam protótipos funcionais em experimentos feitos junto aos usuários finais. Dependendo do tipo das representações visuais, esses experimentos podem coletar dados quantitativos por meio do próprio sistema, ou qualitativos, utilizando entrevistas, questionários ou observações diretas.
Uma avaliação correta pode revelar potenciais problemas e indicar quais ações devem ser realizadas para aumentar a qualidade das representações visuais (MAZZA, 2009).
3.7
Considerações do capítulo
Este capítulo apresentou os princípios básicos da Visualização de Informação, tipos de dados, processo de criação de representações visuais, interação e avaliação. O capítulo seguinte irá abordar os grafos, componentes centrais na representação visual do ECM, descrevendo sua teoria e apresentando metodologias e técnicas da Visualização de Informação para sua representação.
4 VISUALIZAÇÃO DE GRAFOS
Como visto no Capítulo 2, o ECM é representado utilizando mapas conceituais sobre matrizes de atributos, sendo que a representação dos mapas conceituais é feita como na representação de grafos.
Grafos são utilizados para abstrair as mais variadas situações do mundo real, para que essas situações possam ser melhor analisadas e compreendidas. Porém, para que os grafos cumpram seu papel, faz-se necessário que suas representações sejam fáceis de ler e entender.
O presente capítulo realiza uma introdução sobre a teoria dos grafos, abordando definições e conceitos fundamentais para a compreensão deste trabalho. Em seguida são descritos problemas recorrentes na representação de grafos, convenções e abordagens para que a visualização dos grafos atinja um nível satisfatório de clareza e legibilidade, bem como técnicas que implementem essas abordagens.
O objetivo deste capítulo é a formação de um arcabouço teórico suficiente para que sejam aplicadas as técnicas corretas de visualização de grafos sobre o ECM, expandido ao máximo sua capacidade cognitiva.
4.1
Teoria dos grafos
A exemplo dos mapas conceituais, diversas situações do mundo real podem ser descritas por meio de diagramas contendo um conjunto de pontos e linhas conectando esses pontos. Podem ser representadas pessoas por meio dos pontos, utilizando as linhas para demonstrar a relação amizade entre essas pessoas. Podem ser representadas também as páginas da internet e seus links, ou ainda localizações em um mapa, no qual as linhas são os caminhos possíveis entre essas localizações. A abstração matemática dessas situações é chamada grafo (BONDY; MURTY, 1976).
Um grafo é um par G = (V, E), sendo V o conjunto de vértices (nós ou pontos), e E o conjunto de arestas (linhas). Todo elemento de E deve satisfazer E ⊆ [V]2, ou seja, E
Embora não haja uma forma única de desenho, a maneira mais usual de se representar visualmente um grafo é utilizar pontos ou círculos para simbolizar os vértices e linhas para simbolizar as arestas. A posição desses elementos no plano, em geral, não possui significado (BONDY; MURTY, 1976). A Figura 4.1 representa um grafo simples G, onde V = {a, b, c, d, e} e E = {w, x, y, z}, sendo w = (a, b), x = (b, c), y = (c, d) e z = (d, e).
Figura 4.1 – Grafo simples
Fonte: Desenvolvido pelo autor
O número de vértices em um grafo define sua ordem, sendo representada por |G|. Por sua vez, o número de arestas é representado por ||G||. Grafos podem ser finitos ou infinitos, dependendo de sua ordem. A menos que esteja explícito, todo grafo é considerado finito. Um grafo vazio ou nulo G = {∅, ∅} também pode ser representado por G = ∅, sendo admitido apenas por conveniência matemática. A Figura 4.2 representa um grafo G, tal que |G| = 3, ou seja, V possui 3 elementos. E ||G|| = 2, significando que E possui 2 elementos.
Figura 4.2 – Grafo de ordem 3
Fonte: Desenvolvido pelo autor
Um vértice v é incidente a uma aresta e se v ∈ e. Logo, dois vértices são adjacentes se forem incidentes a uma mesma aresta, e dois vértices distintos, que sejam adjacentes, são ditos vizinhos. O conjunto de vértices vizinhos de um vértice v em um grafo é simbolizado por NG(v). Se todos os vértices de G forem adjacentes, G é um grafo completo. Um conjunto de vértices ou arestas é dito independente se nenhum elemento desse conjunto for adjacente (BONDY; MURTY, 1976) (DIESTEL, 2000).
4.1.1 Matrizes de incidência e adjacência
Embora a representação visual seja uma maneira conveniente de representação dos grafos, essa não é uma estrutura amigável para se aplicar métodos matemáticos ou para se armazenar em ambiente computacional. Para esse propósito são consideradas duas matrizes: matriz de incidência e matriz de adjacência (BONDY; MURTY, 1976). A Figura 4.3 exibe as matrizes de incidência e adjacência de um grafo G, onde V = {a, b, c, d} e E = {v, w, x, y, z}, sendo v = (a, c), w = (a, b), x = (a, d), y = (c, d) e z = (b, d).
Figura 4.3 – Matrizes de incidência e adjacência
Fonte: Desenvolvido pelo autor
Considerando um grafo G, com um conjunto de vértices V e um conjunto de arestas E. A matriz de incidência de G é a matriz MG de tamanho n × m, tal que MG := (mve),
onde mve corresponde ao número de vezes (0, 1 ou 2) que um vértice v e uma aresta e são
incidentes. Por sua vez, a matriz de adjacência de G é a matriz AG de tamanho n × m, tal que
AG := (auv), onde auv corresponde ao número de arestas que interligam os vértices u e v.
4.1.2 Caminhos e ciclos
Um caminho é um grafo não nulo P = (V, E), onde V = {v0, v1, …, vn} e E =
{v0v1, v1v2, …, vn-1vn}, no qual os elementos vi são sempre distintos (DIESTEL, 2000). Em
outras palavras, um caminho é grafo simples no qual os vértices podem ser organizados em uma sequencia linear na qual dois vértices são adjacentes se forem consecutivos, e não adjacentes em caso contrário (BONDY; MURTY, 1976). Os vértices v0 e vn são chamados
terminais e possuem grau 1, e os vértices de v1 até vn-1 são chamados internos e possuem grau
comprimento n é denotado Pn, ou n-caminho (DIESTEL, 2000). A Figura 4.4 apresenta um
caminho que pode ser descrito por P3 = ab, bc, cd.
Figura 4.4 – Caminho
Fonte: Desenvolvido pelo autor
Dado um caminho P = v0, …, vn, que tenha n ≥ 3, um grafo C := P + xnx0 é
chamado ciclo. Da mesma maneira que em um caminho, o comprimento de um ciclo é dado pela quantidade de arestas e um ciclo de comprimento n é denotado Cn, ou ainda n-ciclo. Um
ciclo é também um grafo regular de grau 2 (DIESTEL, 2000). A Figura 4.5 apresenta um grafo 4-ciclo, C4 = ab, bc, cd, da.
Figura 4.5 – Ciclo
Fonte: Desenvolvido pelo autor
Um grafo 3-ciclo é denominado triângulo, um grafo 4-ciclo quadrilátero e 5-ciclo pentágono.
4.1.3 Dígrafos
Existem algumas ocasiões nas quais a natureza simétrica das arestas dos grafos não provê a estrutura necessária para a representação da situação desejada (CHARTRAND; LESNIAK; ZHANG, 2010). A ligação entre as páginas da internet é um exemplo, uma vez que uma página A (origem) pode se ligar uma página B (destino) em uma ligação de sentido único. Caso haja a necessidade de retorno da página B para a página A, é necessária outra ligação, independente da primeira.
Representar um caso como tal por meio de grafo não é suficiente, sendo necessário aplicar sentido ou orientação a cada uma das arestas. Grafos no qual as arestas possuam orientação são chamados grafos direcionados, ou simplesmente dígrafos (BONDY; MURTY, 1976). Um dígrafo D, possuindo um conjunto de vértices V = {a, b, c, d} e um conjunto de arestas direcionadas E = {(a,b), (b,c), (c,d), (d,c)} está presente na Figura 4.6.
Figura 4.6 – Dígrafo
Fonte: Desenvolvido pelo autor
Formalmente, um dígrafo D consiste em um conjunto, finito e não vazio, de vértices, e um conjunto de pares de vértices distintos, vazio ou não, pertencentes a D, chamados arcos ou arestas direcionadas. Para um par de vértices u e v, um arco (u, v) pode ser denotada como u → v, ou ainda v ← u. Assim como nos grafos, o conjuntos de vértices de D pode ser denotado V(D), ou simplesmente V, e o conjunto de arestas E(D), ou apenas E (CHARTRAND; LESNIAK; ZHANG, 2010). Na Figura 4.6, a direção das arestas é representada por setas e é possível perceber, observando c → d e d → c, que duas arestas podem ligar o mesmo par de vértices em direções opostas.
Sendo uma aresta (u, v) pertencente a D, diz-se que o vértice u é adjacente a v, e v é adjacente a u. Para um vértice v, o grau de saída de v é dado pela quantidade de arestas em D que partem de v. Por sua vez, o grau de entrada é dado pela quantidade de arestas que terminam em v. Da mesma maneira, a vizinhança de saída N+(v) do vértice v é composta pelo
conjunto de vértices adjacentes a partir de v, e a vizinhança de entrada N-(v) é composta pelo
4.2
Problemas na visualização de grafos
Grafos são uma alternativa eficiente para a representação de dados que possuam características relacionais. Sua desvantagem, porém, consiste no fato de não serem naturalmente escaláveis. A medida que crescem os números de vértices e arestas, o grafo se torna complexo, e sem a utilização de técnicas que auxiliem a representação, pode se tornar ilegível (MAZZA, 2009).
Grafos que possuam milhares de vértices podem inutilizar algoritmos que normalmente geram boas representações para centenas de vértices. A partir de um certo limite, nenhum algoritmo irá garantir os critérios estéticos, simplesmente porque não haverá espaço disponível para exibição dos elementos do grafo. Fica evidente, portanto, que a primeira necessidade no processo de visualização é a adequação do tamanho do grafo (HERMAN; MELANÇON; MARSHALL, 2000).
Algumas estratégias, descritas por MAZZA (2009), podem ser adotadas para melhorar a representação do grafo:
• Utilizar novos arranjos geométricos (layout) como meio de ampliar a legibilidade do grafo.
• Reduzir a quantidade de elementos representados, ocultando alguns menos relevantes para a análise desejada.
• Utilizar interatividade por meio de software, permitindo que a representação do grafo possa ser explorada sob demanda pelo usuário.
De maneira geral, exibir um grafo de muitos elementos sem o devido tratamento, pode servir para a compreensão do contexto geral, mas dificilmente irá auxiliar a compreender todos os detalhes da situação analisada (HERMAN; MELANÇON; MARSHALL, 2000). A sequência do presente trabalho apresenta alternativas para a representação de grafos, para que problemas de visualização não aconteçam, ou ao menos sejam minimizados.
4.3
Paradigmas do desenho de grafos
Compreende-se por paradigmas no desenho de grafos algumas convenções que proveem um padrão mínimo de qualidade na visualização dos grafos. Essas convenções estão divididas na presente seção em duas categorias, convenções de layout, apresentando opções no desenho dos vértices e arestas, e convenções estéticas, sendo essas características gráficas que atribuem legibilidade aos grafos. Como alguns grafos possuem restrições em sua representação, a definição de restrição e alguns exemplos de restrições também estão presentes.
Diversos padrões são utilizados para a representação visual de grafos, e na grande maioria desses padrões, os vértices são representados por círculos ou pontos, e as arestas por linhas que conectem esses pontos. Porém, o padrão utilizado muda de acordo com a sua aplicação. Na matemática, prefere-se, em geral, representar as arestas sempre por linhas retas. Em circuitos ou projetos de bancos de dados, por exemplo, encontram-se mais frequentemente desenhos ortogonais, nos quais as arestas consistem em conjuntos de segmentos horizontais e verticais. A utilidade de um padrão de representação depende da sua legibilidade, ou seja, na sua capacidade de transportar o significado do grafo de maneira rápida e clara (DI BATTISTA et al., 1999).
Para se desenhar um grafo é necessário antes conhecer suas características. É preciso saber se o grafo é direcionado ou não, se possui poucos vértices ou se é planar, podendo ser desenhados no plano sem que suas arestas se cruzem, ou seja, é necessário conhecer a classe a qual esse grafo pertence. O tamanho de um grafo é um fator chave na visualização do mesmo. Um grande número de vértices e arestas pode comprometer o desempenho ou mesmo atingir o limite de visualização da plataforma onde o grafo é exibido. Mesmo que seja possível apresentar todos os elementos, pode ser impossível distinguir entre vértices e arestas (HERMAN; MELANÇON; MARSHALL, 2000).
Graças a grande variedade de classes de grafos, algoritmos para o desenho de grafos tendem a funcionar bem para classes específicas, já que diferentes classes de grafos carecem de ter diferentes características ressaltadas. Grafos acíclicos, por exemplo, devem ter suas arestas desenhadas preferencialmente na mesma direção, destacando a ausência de ciclos (DI BATTISTA et al., 1999).