• Nenhum resultado encontrado

Visualiza¸c˜ ao e Minera¸c˜ ao de Dados

5.1 Visualiza¸c˜ ao de Dados

As representa¸c˜oes visuais proporcionam o mais poderoso canal de comunica¸c˜ao entre o ser humano e o computador: cerca de 20 bilh˜oes de neurˆonios respons´aveis em analisar informa¸c˜oes visuais proveem um mecanismo de reconhecimento de padr˜oes que ´e funda- mental na maioria das atividades cognitivas do ser humano. Mais informa¸c˜ao pode ser adquirida atrav´es da vis˜ao do que atrav´es da combina¸c˜ao de todos os outros sentidos (WARE, 2012).

Pode-se encontrar duas defini¸c˜oes interessantes sobre o termo “visualiza¸c˜ao” em um dicion´ario (VISUALIZACAO, 2009). A primeira ´e “transforma¸c˜ao de conceitos abstratos em imagens reais ou mentalmente vis´ıveis”, e, a segunda, “convers˜ao de n´umeros ou dados para um formato gr´afico, que pode ser mais facilmente entendido”. Tais defini¸c˜oes s˜ao compar´aveis `a evolu¸c˜ao do termo visualiza¸c˜ao, apresentada por Ware (2012), a qual parte de constru¸c˜ao de uma imagem visual na mente, at´e a representa¸c˜ao gr´afica de conceitos ou dados, tornando-se assim um aliado externo que suporta processos de tomada de decis˜ao. Voltando `as duas defini¸c˜oes do dicion´ario, percebe-se que a primeira est´a relacionada `a maneira com que o ser humano percebe e sintetiza as informa¸c˜oes apresentadas visual- mente. Esta rela¸c˜ao ´e objeto de pesquisas relacionadas `a percep¸c˜ao e cogni¸c˜ao humana. J´a a segunda defini¸c˜ao est´a relacionada `a visualiza¸c˜ao da informa¸c˜ao seguindo-se alguma re- presenta¸c˜ao: por exemplo, um gr´afico de barras. Para constru¸c˜ao do mencionado gr´afico, sugere-se, ent˜ao, que as informa¸c˜oes de interesse estejam armazenadas seguindo-se uma representa¸c˜ao bruta ou simplificada que carece de transforma¸c˜oes para ser representada visualmente. Esta representa¸c˜ao bruta pode ser, por exemplo, uma planilha com gastos mensais ao longo de um ano. Uma das grandes vantagens da visualiza¸c˜ao de dados ´e a possibilidade de se interpretar a totalidade destes dados rapidamente, desde que sejam bem representados. Outras vantagens podem ser destacadas, como a maior habilidade para lidar com grandes volumes de dados, facilidade na identifica¸c˜ao de novos padr˜oes e suporte `a forma¸c˜ao de novas hip´oteses (WARE, 2012).

O processo de visualiza¸c˜ao de dados pode ser dividido em componentes conforme apre- senta a Figura 25. O componente base envolve a obten¸c˜ao e armazenamento dos dados. Em seguida, aparecem as transforma¸c˜oes nos dados: s˜ao realizados pr´e-processamentos a fim de se obter maior manuseabilidade. No componente seguinte aparece a representa¸c˜ao visual dos dados, processo que se d´a atrav´es de algoritmos computacionais que produzir˜ao uma imagem na tela. Por fim, o ´ultimo componente ´e caracterizado pelo sistema cognitivo e perceptual do analista da informa¸c˜ao, neste caso, de um ser humano (WARE, 2012).

Observa-se um fluxo interativo entre os componentes, e a intera¸c˜ao do ser humano com todos eles. Na aquisi¸c˜ao dos dados, o usu´ario pode optar pela escolha dos dados de interesse em um subconjunto maior. No pr´e-processamento, o qual precede a visualiza¸c˜ao, o usu´ario pode optar por transforma¸c˜oes sobre os dados - por exemplo, pode limitar valores em um certo intervalo. Por fim, o usu´ario pode manipular a visualiza¸c˜ao em si, por exemplo, atrav´es de intera¸c˜oes com o mouse. Observa-se tamb´em a presen¸ca de dois ambientes: f´ısico e social. A interpreta¸c˜ao de informa¸c˜oes pelo ser humano est´a associada

Figura 25: Processo de Visualiza¸c˜ao. Adaptado de Ware (2012, p. 4).

a in´umeros fatores, que podem variar desde aos aspectos cognitivos - inerentes ao ser humano -, at´e os aspectos sociais e de cultura regional. Desta forma, a representa¸c˜ao visual dos dados deve estar adequada `as caracter´ısticas de seu p´ublico alvo - presentes no ambiente social destacado na Figura 25. J´a o ambiente f´ısico est´a relacionado `a fonte dos dados em si (WARE, 2012).

No contexto geral de sistemas computacionais, onde figuram as interfaces homem- m´aquina, existem met´aforas que est˜ao associadas a assimila¸c˜oes “autom´aticas” ou “invis´ı- veis”. Por exemplo, na grande maioria dos sistemas computacionais, os termos “recortar” e “colar” remetem `a movimenta¸c˜ao de arquivos entre diret´orios. Estes termos s˜ao met´a- foras, que, quando utilizadas permitem que o utilizador assimile informa¸c˜oes que lhe s˜ao familiares e concretas para estruturar conceitos mais abstratos. No caso citado, “recortar e colar” s˜ao atividades de f´acil assimila¸c˜ao, pois, teoricamente, fazem parte do cotidiano natural do utilizador. Desta forma, a met´afora ´e utilizada para representar o conceito mais abstrato (ROCHA; BARANAUSKAS, 2003). Outro exemplo de met´afora ser´a apre- sentado adiante na Subse¸c˜ao 5.3, onde explora-se a met´afora de um calend´ario para a representa¸c˜ao de informa¸c˜oes.

Alguns fatores que caracterizam a interface de apresenta¸c˜ao da informa¸c˜ao de forma visual ao ser humano s˜ao como met´aforas de interface impl´ıcitas. Embora pare¸cam peque- nos detalhes, estudos revelam que a apresenta¸c˜ao da informa¸c˜ao influencia diretamente no processo de percep¸c˜ao e cogni¸c˜ao humana (KEHRER, 2007; KEIM et al., 2008b).

Desta forma, estes detalhes – uma vez compreendidos e modelados – podem resultar em resultados mais eficientes no processo de tomada de decis˜ao.

Em grandiosas quantidades de dados, tomar alguma decis˜ao sem uma representa¸c˜ao alternativa dos dados torna-se muito dif´ıcil. De uma forma geral, pode-se afirmar que extrair informa¸c˜oes relevantes e analis´a-las – a fim de fundamentar e confirmar hip´oteses – s˜ao alguns dos processos que se tornam mais ´ageis e eficientes quando estas informa¸c˜oes s˜ao apresentadas em um esquema visual e interativo, alcan¸cando o poder de comunica¸c˜ao visual do ser humano.

Este eixo compreendido pela comunica¸c˜ao visual do ser humano e pela representa¸c˜ao da informa¸c˜ao est´a relacionado ao conceito de Visual Analytics (Anal´ıtica Visual), que tem como objetivo principal permitir ao ser humano interagir fortemente com a informa¸c˜ao, obtendo assim as melhores conclus˜oes para o sucesso no processo de tomada de decis˜ao.

5.1.1

O conceito de Visual Analytics

Em contextos semelhantes ao que apresentamos neste Projeto (grandes quantidades de dados), a aplica¸c˜ao de m´etodos relacionados `a Visual Analytics (ou Anal´ıtica Visual) ´e indicada. Segundo Keim et al. (2008b), a Anal´ıtica Visual combina t´ecnicas de an´alise de dados com visualiza¸c˜ao interativa para se obter entendimento, racioc´ınio e decis˜oes eficazes sobre uma base de dados muito grande e com dados complexos. Um dos pontos fortes da Anal´ıtica Visual est´a na combina¸c˜ao dos pontos fortes das m´aquinas com os pontos fortes dos humanos, isto ´e, o poder de processamento das m´aquinas est´a aliado `a capacidade de perceber, relacionar e concluir do ser humano.

A Figura 26 apresenta o escopo da Anal´ıtica Visual, onde a visualiza¸c˜ao ´e combi- nada a fatores humanos e a an´alise de dados. ´E poss´ıvel verificar que a Anal´ıtica Visual compreende v´arias especificidades, como a an´alise geoespacial, estat´ıstica e cient´ıfica.

Keim et al. (2008a) apresentam um ciclo do processo Anal´ıtico-Visual, o qual pode ser observado na Figura 27. Este ciclo envolve a intera¸c˜ao de trˆes entidades: dados, visualiza¸c˜ao (representa¸c˜ao visual) e usu´ario. Para uma an´alise inicial dos dados, emprega- se a visualiza¸c˜ao, gerando-se uma imagem. A imagem incrementa a percep¸c˜ao do usu´ario, permitindo ao mesmo a obten¸c˜ao de um novo entendimento que auxilia na constru¸c˜ao do conhecimento sobre os dados. O conhecimento permite a formula¸c˜ao de novas hip´oteses, as quais podem ser melhor estudadas (explora¸c˜ao e an´alise). A partir da´ı, pode-se restringir o dom´ınio de interesse no conjunto de dados para an´alises espec´ıficas, reiniciando-se o

Figura 26: Escopo da Anal´ıtica Visual. Adaptado de Keim et al. (2008b, p. 4).

ciclo na an´alise inicial deste subconjunto de dados.

Figura 27: Ciclo do Processo Anal´ıtico-Visual. Traduzido de Keim et al. (2008a, p. 165).

Diversas abordagens tˆem sido introduzidas nos ´ultimos anos, as quais proveem gr´aficos mais efetivos para visualiza¸c˜ao de grandes volumes de dados, tanto em quantidade de dados, como em n´umero de parˆametros. No contexto de dados orientados ao tempo - escopo deste projeto - a visualiza¸c˜ao de s´eries temporais possibilita a observa¸c˜ao de v´arios aspectos, tais como (MacEACHREN, 1995; MULLER; SCHUMANN, 2003):

• Existˆencia: um fenˆomeno ocorreu em certo per´ıodo?

• Localiza¸c˜ao temporal: Quando um fenˆomeno ocorre? Existe um comportamento sistem´atico?

• Intervalo temporal: Quanto tempo dura certo fenˆomeno? • Textura temporal: Com que frequˆencia ocorre?

• Taxa de varia¸c˜ao: Como o fenˆomeno tem variado ao longo do tempo? • Sequencialidade: Em que ordem acontecem?

• Associa¸c˜ao: Existem fenˆomenos associados?

O processo da Anal´ıtica Visual contribui para a busca das respostas para estas cate- gorias de quest˜oes, possibilitando ao analista, pela interatividade, uma participa¸c˜ao mais ativa no processo de explora¸c˜ao e an´alise dos dados.