• Nenhum resultado encontrado

Landscapes, Superf´ıcies, e Mapas Geogr´ aficos

3.3 Exemplos de Visualiza¸c˜ ao

3.3.3 Landscapes, Superf´ıcies, e Mapas Geogr´ aficos

A cartografia ´e a ´area de estudo dentro da geografia que estuda meios eficientes de apresentar informa¸c˜oes geogr´aficas atrav´es de mapas. V´arios cart´ografos tˆem percebido que visualiza¸c˜ao de informa¸c˜ao utiliza muitos princ´ıpios cartogr´aficos de elabora¸c˜ao de mapas para poder representar dados n˜ao-geogr´aficos (Fabrikant and Buttenfield, 2001, Skupin, 2000, Skupin and Fabrikant, 2003). De acordo com Skupin (2000):

O valor de um mapa deriva em grande parte do casamento bem sucedido en- tre componentes est´eticos e ´uteis. ´E atrav´es de um processo conhecido como design de mapas que dados geogr´aficos brutos s˜ao transformados em repre- senta¸c˜oes visuais que s˜ao atraentes e ´uteis. Enquanto isso envolve um grau de subjetividade, h´a uma s´erie de princ´ıpios de design de mapas amplamente aceita. Muitos desses princ´ıpios s˜ao tamb´em utilizados para a visualiza¸c˜ao de informa¸c˜ao n˜ao geogr´afica. Um bom exemplo disso ´e o uso de vari´aveis gr´aficas para codificar vari´aveis de dados quantitativos ou qualitativos. Por exemplo, o tamanho ´e uma vari´avel gr´afica cuja utiliza¸c˜ao deve ser restringida a dados quantitativos, enquanto que varia¸c˜oes de s´ımbolos ou formas podem ser usadas para codificar dados qualitativos.

Ao emprego desses princ´ıpios cartogr´aficos para apresentar dados n˜ao-geogr´aficos, da- mos o nome de met´aforas geogr´aficas, met´aforas espaciais ou espacializa¸c˜ao (Fabrikant and Buttenfield, 2001). Outros exemplos de princ´ıpios muito usados em cartografia e her- dados em visualiza¸c˜ao s˜ao a Primeira Lei da Geografia de Tobler, que diz “Todas as coisas

CAP´ITULO 3. VISUALIZAC¸ ˜AO 55

(a) Janela de configura¸c˜ao do pipeline de visualiza¸c˜ao.

(b) Janela de visualiza¸c˜ao e intera¸c˜ao com os dados projetados.

Figura 3.10: Visualiza¸c˜ao de resumos de conferˆencias com a exibi¸c˜ao simultˆanea de cinco n´ıveis de grupos em GIS (Skupin, 2004).

est˜ao relacionadas entre si, mas aquelas mais pr´oximas entre si est˜ao mais relacionadas do que aquelas mais distantes entre si” e o conceito de escala longe e perto, ou seja, “objetos em uma cena que est˜ao mais perto do espectador s˜ao percebidos com mais detalhes do que objetos mais longe” (Fabrikant and Buttenfield, 2001). A seguir, apresentamos trabalhos que usam met´aforas geogr´aficas/espaciais para apresentar dados n˜ao geogr´aficos.

Skupin (2004) criou uma visualiza¸c˜ao utilizando o conceito de mapas geogr´aficos para visualizar uma cole¸c˜ao de 2220 resumos de conferˆencias. ´E montada uma hierarquia das principais palavras que expressam a ideia de cada resumo, de modo que as palavras mais gerais fiquem no topo da hierarquia e conforme as palavras se tornam mais espec´ıficas, a hierarquia vai descendo. A analogia com mapas geogr´aficos ´e que da hierarquia mais alta para a mais baixa, as regi˜oes v˜ao se agrupando como se fossem pa´ıses, estados e cidades, respectivamente. A metodologia consiste em aplicar uma t´ecnica de SOM seguida de uma t´ecnica de agrupamento para agrupar os itens. A visualiza¸c˜ao ´e produzida usando um Sistema de Informa¸c˜oe Geogr´aficas (SIG), que s˜ao sistemas de software que trabalham com dados essencialmente geogr´aficos. A Figura 3.10 apresenta o resultado desse trabalho. Jianu and Laidlaw (2013) escreveram um resumo de v´arios trabalhos que consistem em visualiza¸c˜oes pr´e-computadas, preparadas por especialista de dom´ınio, acompanhadas por intera¸c˜oes intuitivas, e dispon´ıveis via Web atrav´es da API de mapas Google Maps. Tamb´em s˜ao discutidas as oportunidades e fraquezas que essa abordagem de visualiza¸c˜ao traz. Embora n˜ao seja adequada para an´alise de dados muito complexos em tempo real,

CAP´ITULO 3. VISUALIZAC¸ ˜AO 57

pois todas as visualiza¸c˜oes dos dados j´a devem ter sido geradas por um especialista, essa abordagem ´e particularmente ´util em disseminar a publica¸c˜ao de dados j´a tradicionais. Outra vantagem ´e que essa abordagem ´e de f´acil acesso e com pouca sobrecarga de apren- dizagem, por ser baseada exclusivamente na Web, com recursos f´aceis de se usar e j´a conhecidos, como Google Maps.

Um exemplo de visualiza¸c˜ao apresentado por Jianu and Laidlaw (2013) ´e o Mapa de genes, em que os genes s˜ao colocados de modo que a sua proximidade ´e proporcional `

a similaridade dos seus perfis de express˜ao gˆenica sobre m´ultiplas condi¸c˜oes biol´ogicas. O mapa tem v´arios n´ıveis de zoom, cada um com uma representa¸c˜ao potencialmente diferente. Por exemplo, os genes s˜ao desenhados como glifos em zoom aproximado e como pontos em zoom distante. Foi utilizada a t´ecnica de proje¸c˜ao HiPP (Paulovich and Minghim, 2008) para dividir os genes em v´arios grupos, o que permite uma visualiza¸c˜ao multiescala. A cada n´ıvel de zoom, os genes s˜ao exibidos dentro de diferentes grupos. Para cada grupo ´e calculada a m´edia e o desvio padr˜ao do perfil de express˜ao dos genes, estes sendo exibidos como um glifo amarelo sobre o mapa. Outras intera¸c˜oes dispon´ıveis s˜ao janelas pop-up que ligam a fontes de dados adicionais e cria¸c˜ao de um heatmap ao selecionar um conjunto de genes. A Figura 3.11 ilustra a visualiza¸c˜ao proposta com alguns de seus recursos. Na imagem superior, um heatmap ´e criado ao selecionar um grupo de genes. Nas imagens inferiores, os genes s˜ao exibidos como pontos (`a esquerda) e aumentando o zoom, s˜ao exibidos como glifos (`a direita).

O trabalho de Chalmers (1993) foi um dos primeiros trabalhos a tratar sobre a in- fluˆencia e os princ´ıpios de visualiza¸c˜oes landscape, uma forma de representa¸c˜ao 2,1D, no sentido que a terceira dimens˜ao ´e usada n˜ao para representar a distˆancia entre os dados, como em uma proje¸c˜ao 3D, mas para representar alguma caracter´ıstica sobre os dados, como densidade da regi˜ao em que eles se encontram. Nesse trabalho, foi proposto o sis- tema Bead, que constr´oi um mapa landscape de um corpus cujos documentos similares se encontram pr´oximos uns dos outros. Esse artigo destaca a importˆancia de ferramentas de explora¸c˜ao adaptativa em um conjunto de textos, orientada graficamente, e n˜ao apenas atrav´es da abordagem “recupera¸c˜ao” de documentos atrav´es de consultas em bancos de dados. O objetivo de Bead, ent˜ao, ´e representar um corpus de documentos de modo que ajude com tarefas que dependam das rela¸c˜oes de todo o conjunto de documentos, bem como das propriedades de membros individuais, por meio de intera¸c˜oes de explora¸c˜ao adaptativa em um modelo de representa¸c˜ao landscape do corpus.

Chalmers (1993), ent˜ao, sugere que, apesar da espacializa¸c˜ao 3D de pontos ter pro- blemas de usabilidade, como oclus˜ao e cenas complexas, a abstra¸c˜ao de uma paisagem (landscape) e a met´afora espacial fazem o mapa ser mais f´acil de memorizar, talvez por ser mais semelhante ao nosso mundo cotidiano: “Dada nossa vida na superf´ıcie terrestre, a nossa experiˆencia ´e de um mundo com maior extens˜ao horizontal que vertical, pode- se at´e chamar nosso mundo cotidiano como 2,1 dimensional. Portanto, sugerimos um afastamento de estruturas fortemente 3D em dire¸c˜ao a estruturas parecidas com mapas (2D) ou com landscapes (2,1D)” Chalmers (1993). Esse trabalho tamb´em conclui que embora texturas e sombreamentos mais realistas podem tornar o landscape mais natural, essas cores e texturas podem ser melhor colocadas como conte´udo informativo, ao inv´es de compor o landscape. E tamb´em conclui que h´a um certo perigo em adicionar muitos

Figura 3.11: Visualiza¸c˜ao de genes com sua express˜ao gˆenica no Google Maps (Jianu and Laidlaw, 2013).

CAP´ITULO 3. VISUALIZAC¸ ˜AO 59

detalhes `a visualiza¸c˜ao, uma vez que isso pode produzir uma confus˜ao visual, distraindo o usu´ario e obscurecendo a informa¸c˜ao.

Segundo Wise et al. (1995), o olho humano tem sensibilidade ao comprimento de onda e de contraste muito altas, capazes de construir imagens complexas. Grande parte desse processo ocorre em paralelo no n´ıvel da retina e por isso ´e relativamente f´acil, expcecionalmente r´apido e n˜ao aumenta a carga de trabalho cognitiva. A interpreta¸c˜ao das imagens no c´erebro se d´a por processos de constru¸c˜ao paralelos distribu´ıdos espacialmente em uma topografia que corresponde ao mundo f´ısico real. Wise et al. (1995) concluem ent˜ao que podemos usar os mesmos mecanismos de percep¸c˜ao espacial que operam no mundo real para representar um mundo sint´etico, se sinais an´alogos estiverem devidamente presentes e integrados. Dessa forma, a limita¸c˜ao de entender grandes quantidades de informa¸c˜ao pode ser superada se os dados forem “espacializados” de uma maneira que se aproveite dos poderes comuns de percep¸c˜ao.

Pensando nisso, Wise et al. (1995) propuseram um software, chamado IN-SPIRE1, ou Spatial Paradigm for Information Retrieval and Exploration, para facilitar a explora¸c˜ao de grandes conjuntos de documentos (cerca de 20000 documentos), composto principalmente de duas visualiza¸c˜oes, Galaxy e ThemeView.

A visualiza¸c˜ao Galaxy se assemelha a um conjunto de “estrelas” de um c´eu noturno, na qual cada estrela representa um documento. O processo consiste basicamente em agrupar os documentos no espa¸co multidimensional e selecionar os centr´oides que representar˜ao cada grupo de documentos, projetar primeiramente os centr´oides no plano 2D, usando alguma t´ecnica de proje¸c˜ao multidimensional, como Principal Component Analysis (Jol- liffe, 2002), e depois projetar cada documento dentro de seu pr´oprio grupo. Em adi¸c˜ao aos modos b´asicos de explora¸c˜ao dos dados, como sele¸c˜ao e pesquisa de documentos, v´arias ferramentas sofisticadas tamb´em foram implementadas. Por exemplo, uma barra desli- zante do tempo. Se cada documento possuir uma estampa de tempo, conforme o usu´ario vai deslizando a barra temporal, mais documentos v˜ao sendo exibidos de acordo com sua estampa de tempo. A Figura 3.12a mostra um exemplo da visualiza¸c˜ao Galaxy.

A visualiza¸c˜ao ThemeView exibe um landscape do conjunto de dados baseado nos temas, ou palavras-chave. Eleva¸c˜oes descrevem a for¸ca de determinado tema, enquanto que outras caracter´ısticas no mapa, como vales, picos, depress˜oes e intervalos representam inter-rela¸c˜oes detalhadas entre os documentos e seus temas. Em uma primeira observa¸c˜ao, ´e poss´ıvel obter um resumo tem´atico de todo o corpus. Atrav´es de diferentes n´ıveis de es- cala, podemos ter informa¸c˜oes resumidas sobre todo o conjunto de documentos, sobre um grupo de documentos, sobre alguns documentos individuais, ou at´e mesmo sobre alguns componentes de um documentos, como um par´agrafo. Com essa visualiza¸c˜ao, podemos, por exemplo, analisar e entender como diferentes temas se relacionam. A Figura 3.12b mostra um exemplo da visualiza¸c˜ao ThemeView.

O software InfoSky (Andrews et al., 2002) ´e um “sistema que permite aos usu´arios explorar interativamente grandes cole¸c˜oes de documentos hierarquicamente estruturadas. Semelhante a um telesc´opio do mundo real, InfoSky emprega uma representa¸c˜ao gr´afica planar com diferentes n´ıveis de zoom. Documentos de conte´udo similar s˜ao colocados

1Antes, apenas SPIRE, agora, uma marca registrada chamada IN-SPIRE. Dispon´ıvel pelo Pacific Northwest National Laboratory (http://in-spire.pnnl.gov/), acessado em 01/09/2014.

(a) Visualiza¸c˜ao Galaxy.

(b) Visualiza¸c˜ao ThemeView.

CAP´ITULO 3. VISUALIZAC¸ ˜AO 61

Figura 3.13: Software de visualiza¸c˜ao InfoSky.

pr´oximos uns dos outros e exibidos como estrelas, enquanto grupos de documentos em um determinado n´ıvel na hierarquia s˜ao visualizados como pol´ıgonos do diagrama de Voronoi com pesos”. O pol´ıgono de cada grupo ´e calculado com base no centr´oide do grupo e sua ´area ´e definida de acordo com o n´umero de documentos presentes no grupo. Cada estrela ´e posicionada no plano usando o algoritmo force-directed placement (Fruchterman and Reingold, 1991). A Figura 3.13 mostra um exemplo da visualiza¸c˜ao Infosky. O painel `

a esquerda da janela exibe a hierarquia dos grupos de documentos dentro de pastas. Ao selecionar um grupo, essa regi˜ao ´e ampliada, mostrando mais detalhes sobre o grupo e a pasta a que o grupo pertence expande seu conte´udo. Podemos ir ampliando at´e chegar ao ´ultimo n´ıvel da hierarquia, mostrando apenas as estrelas e os documentos que elas representam no painel `a esquerda.

Mais exemplos de sistemas que usam landscape para representar os dados s˜ao o VxIn- sight (Boyack et al., 2002) e o ThemeScape (Thomson Innovation, 2014). Um exemplo da visualiza¸c˜ao gerada pelo ThemeScape ´e mostrado na Figura 3.14.

Tory realizou dois estudos (Tory et al., 2007, 2009) comparando proje¸c˜oes de pontos no plano, com o uso de landscape 2D e com o uso de landscape 3D, a fim de comparar qual desses 3 tipos de visualiza¸c˜oes apresenta melhores resultados para determinadas tarefas. Landscape 2D ´e quando ao inv´es de usar a terceira dimens˜ao como altura para representar alguma caracter´ıstica dos dados, como densidade, adota-se uma escala de cores, chamada de curva de n´ıvel ou linhas de contorno. Para a coloriza¸c˜ao, seja dos pontos ou do landscape, tamb´em ´e avaliado se ´e melhor usar uma escala de cores ou uma escala de cinza. Apesar de alguns autores, como Chalmers (1993), reivindicarem que abordagens landscape s˜ao mais f´aceis de serem memorizadas por parecerem com o nosso cotidiano, faltam mais testes emp´ıricos para afirmar se essa hip´otese ´e verdadeira e para quais casos

Figura 3.14: Software de visualiza¸c˜ao ThemeScape.

a abordagem landscape ´e melhor recomendada que simplesmente pontos no plano (Tory et al., 2009).

Em Tory et al. (2007), foi avaliado qual dos 3 tipos de visualiza¸c˜ao ´e melhor (tanto em velocidade como em precis˜ao) para estimar o n´umero de pontos (numerosidade) de uma cor espec´ıfica dentro de uma ´area espacial. Os resultados mostraram que apenas a proje¸c˜ao dos pontos no plano foi substancialmente mais efetiva que as abordagens lands- cape. Comparando as duas abordagens landscape, a abordagem 2D se mostrou melhor que a 3D, portanto, pouco ou nenhum benef´ıcio foi encontrado usando redundˆancia de informa¸c˜ao, ou seja, empregando-se cor e altura ou escala de cinza e altura para repre- sentar o landscape. Para a coloriza¸c˜ao, a escala de cores se mostrou melhor que a escala de cinza tanto para a representa¸c˜ao apenas por pontos como para os landscapes.

Em Tory et al. (2009), s˜ao realizados testes de mem´oria visual para responder as seguintes perguntas: Qual abordagem ´e melhor para memorizar, landscape ou pontos? Para landscape, usar redundantemente cor e altura para codificar os dados melhora a mem´oria em compara¸c˜ao a usar somente cor? A resposta para essas perguntas ´e que a melhor abordagem ´e a que usa apenas pontos no plano, assim como em Tory et al. (2007). Quanto aos dois tipos de landscape, para tarefas relacionadas `a mem´oria, por exemplo, tarefas que envolvem bastante compara¸c˜ao mental e entendimento das diferen¸cas em alto n´ıvel entre v´arias visualiza¸c˜oes, a abordagem 3D mostrou melhores resultados.

Tory et al. (2009) conclu´ıram que, de acordo com o seu trabalho e citando tamb´em Tory et al. (2007) e Fabrikant (2000), a abordagem baseada apenas em pontos se mostrou igual ou superior que landscape para a maioria das opera¸c˜oes mentais que foram estudadas, com uma poss´ıvel exce¸c˜ao para julgamento de densidade. Landscapes 3D que usam apenas a altura, sem usar uma escala de cor correspondente `a altura se mostraram, de longe, os

CAP´ITULO 3. VISUALIZAC¸ ˜AO 63

menos efetivos (Tory et al., 2007). Portanto, a menos que haja alguma raz˜ao para usar landscape, deve-se preferir usar pontos no plano (Tory et al., 2009).

Cap´ıtulo

4

Metodologia

Neste cap´ıtulo apresentamos as ferramentas utilizadas e os trabalhos realizados neste mestrado. Desenvolvemos trˆes t´ecnicas de agrupamento:

• No Seed Growing, o usu´ario escolhe alguns pontos como sementes. Ent˜ao, a regi˜ao de cada ponto-semente vai crescendo at´e que todos os demais pontos sejam inclu´ıdos em alguma regi˜ao.

• No Voronoi Clustering, o usu´ario escolhe um valor e todas as c´elulas Voronoi vizinhas que tˆem distˆancia menor ou igual a esse valor s˜ao inseridas no mesmo grupo. • No Segmentation, pontos vizinhos que tˆem um atributo em comum, escolhido pelo

usu´ario, s˜ao inseridos no mesmo grupo.

Tamb´em implementamos sub-clustering, ou agrupamento em n´ıveis, no qual cada grupo pode ser dividido em novos grupos. Para cada grupo e subgrupo criados, adi- cionamos a op¸c˜ao de extrair os t´opicos mais relevantes, possibilitando uma visualiza¸c˜ao multi-escala. Implementamos duas t´ecnicas de heatmap, uma por densidade, na qual os pontos recebem um valor proporcional `a densidade no seu local, e outra por frequˆencia dos termos, na qual um ponto recebe um valor proporcional `a quantidade dos termos in- formados pelo usu´ario. Tamb´em geramos uma superf´ıcie 3D, usando a terceira dimens˜ao para mapear algum atributo dos dados. De acordo com o atributo escolhido pelo usu´ario a superf´ıcie muda dinamicamente possibilitando uma vizualiza¸c˜ao mais interativa. Para dar mais subs´ıdios `a explora¸c˜ao dos dados adicionamos explora¸c˜ao de landscape com tex- tura, que ´e capaz de dar uma vis˜ao geral do conjunto e ajuda a conduzir o usu´ario na explora¸c˜ao.

A Figura 4.1 ilustra a metodologia aplicada em nosso projeto. Como podemos obser- var, a metodologia segue o pipeline proposto por Card et al. (1999). As se¸c˜oes seguintes explicam cada passo da metodologia proposta.

4.1

Materiais

O nosso trabalho foi desenvolvido usando o VisPipeline, descrito na Se¸c˜ao 3.3.2, e foi inclu´ıdo na ferramenta.

CAP´ITULO 4. METODOLOGIA 65

Figura 4.1: Exemplo de agrupamentos em n´ıveis.

Outros programas usados no projeto foram: SOMPAK 3.1 (Kohonen et al., 1996) para proje¸c˜ao dos dados usando a t´ecnica Self-Organizing Map (SOM) (Kohonen et al., 2001); pacote de programas MCL (van Dongen, 2000) para agrupamento dos dados usando a t´ecnica MCL; para gerar as arestas do diagrama de Voronoi usamos o pacote Simple Vo- ronoi (Humphreys, 2010), que usa o algoritmo de Fortune (1986). Para gerar a superf´ıcie 3D usamos o framework Jzy3d (Pernollet, 2009).

O trabalho foi desenvolvido usando um computador com Windows 7/64 bits, proces- sador Intel Core i5 com 2,4 GHz e mem´oria RAM de 4 GB.