Visualiza¸c˜ ao e Minera¸c˜ ao de Dados
6.1 Da Infraestrutura de Monitoramento para a In fraestrutura de An´ alise
6.1.1 Recursos Implementados: Visualiza¸c˜ ao e Minera¸ c˜ ao
Para muitos atributos de monitoramento, como o ´ındice S4, existem limiares emp´ıricos propostos por diversos autores. De maneira similar ocorre para o ˆangulo de eleva¸c˜ao dos sat´elites, onde valores m´ınimos de aceita¸c˜ao, como 10o
ou 15o
, s˜ao comumente aplicados a fim de eliminar poss´ıveis efeitos de multicaminho do sinal.
Shneiderman (2001) destaca a necessidade de deixar o usu´ario decidir sobre o que procura. Com esta caracter´ıstica, ele pode obter seus resultados com mais eficiˆencia, j´a que poder´a imergir nos dados e testar suas pr´oprias hip´oteses. No entanto, deve-se respeitar os limites do usu´ario: opera¸c˜oes muito complexas ou de dif´ıcil entendimento podem fazer com que os mesmos evitem execut´a-las.
Com base nestes aspectos, foram desenvolvidos m´odulos de visualiza¸c˜ao nos quais os sat´elites e os hor´arios mais afetados pela cintila¸c˜ao ionosf´erica podem ser identificados
atrav´es da visualiza¸c˜ao dos ´ındices providos pelo receptor. Uma das principais caracter´ıs- ticas ´e a possibilidade de filtrar atributos atrav´es da aplica¸c˜ao de operadores booleanos em campos desejados do banco de dados. Desta forma, o usu´ario pode valer-se da inte- ratividade que integra o ciclo de Anal´ıtica Visual (apresentado na Figura 27 - Subse¸c˜ao 5.1.1), generalizando e especificando os dados de interesse ao seu pr´oprio crit´erio.
Na abordagem proposta, o usu´ario usufrui de interfaces onde especifica limiares para a forma¸c˜ao do conjunto de dados. Desta forma pode especificar a seu crit´erio os limites para a detec¸c˜ao de outliers, bem como extrair subconjuntos `a partir da rela¸c˜ao de quaisquer atributos. Por exemplo, ´e poss´ıvel extrair apenas dados de sat´elites GPS cujo ˆangulo de eleva¸c˜ao seja superior a 15o
e cujo ´ındice S4 seja superior ao ´ındice Sigma-fi. Para o processo de minera¸c˜ao, o usu´ario pode optar ainda por parˆametros que definem a t´ecnica SAX, como o tamanho da janela deslizante e o passo entre janelas.
A Figura 43 apresenta uma das interfaces baseada em filtros. O usu´ario pode escolher um per´ıodo de interesse – como meses, semanas ou dias –, uma ou mais esta¸c˜oes, constela- ¸c˜oes ou sat´elites espec´ıficos, e aplicar um ou mais filtros Booleanos. S˜ao disponibilizadas tamb´em op¸c˜oes para a sa´ıda gr´afica desejada, como gr´afico de dispers˜ao, mapas e grids. No exemplo, s˜ao apresentadas as op¸c˜oes de configura¸c˜ao para os gr´aficos de dispers˜ao, as quais incluem disposi¸c˜ao do eixo temporal, r´otulos, cores e tamanho da imagem.
Figura 43: Exemplo de interface baseada em filtros da ISMR Query Tool.
Atrav´es dos gr´aficos de dispers˜ao ´e poss´ıvel encontrar rapidamente um subconjunto de interesse caracterizado por algum fenˆomeno espec´ıfico, como os picos di´arios de cintila¸c˜ao caracterizados por altos valores de ´ındice S4.
Um exemplo ´e apresentado em trˆes etapas na Figura 44. Em (a), apresenta-se os valores do ´ındice S4 para todos os sat´elites GPS rastreados pela esta¸c˜ao PRU2 no mˆes de Setembro de 2012. Foi aplicado um filtro para ˆangulos de eleva¸c˜ao superiores a 15o
(b), a consulta foi restringida para um per´ıodo aproximado de dez dias. Nesta consulta, foi utilizada a op¸c˜ao de identifica¸c˜ao por cores, a qual permite encontrar os sat´elites mais afetados no per´ıodo; cada sat´elite ´e identificado univocamente pelo seu PRN. Observa-se que cada sat´elite pode ser afetado de maneira distinta, j´a que os sinais percorrem caminhos independentes, se propagando por diferentes regi˜oes na ionosfera. Por fim, em (c), s˜ao comparados os ´ındices S4 e Sigma-fi para apenas trˆes sat´elites que apresentaram altos picos – os quais foram identificados em (b).
Mais uma possibilidade ´e a compara¸c˜ao de ´ındices observados por diferentes esta¸c˜oes, a qual ´e apresentada na Figura 45. S˜ao comparados os valores obtidos para o ´ındice S4 de esta¸c˜oes pr´oximas entre si. Em (a), compara-se as esta¸c˜oes PRU1 e PRU2, as quais distam aproximadamente 300 m entre si. Em (b), compara-se esta¸c˜oes SJCE e SJCU, as quais distam aproximadamente 10 km entre si. ´E poss´ıvel notar que, de uma forma geral, os ´ındices s˜ao coincidentes, mas h´a discrepˆancias significativas que podem ser objeto de investiga¸c˜oes mais detalhadas.
Figura 45: Compara¸c˜oes de ´ındices observados por diferentes esta¸c˜oes.
Outra op¸c˜ao ´e a identifica¸c˜ao dos hor´arios mais afetados do dia. Nesta op¸c˜ao, os valores de tempo s˜ao identificados em fun¸c˜ao das horas e minutos, e ´e poss´ıvel notar os per´ıodos do dia em que as cintila¸c˜oes s˜ao mais frequentes. Esta op¸c˜ao ´e apresentada na Figura 46. Foi escolhido o mˆes de mar¸co de 2013; em (a), s˜ao apresentados os resultados da esta¸c˜ao POAL; j´a em (b), s˜ao apresentados os resultados da esta¸c˜ao SJCU. ´E poss´ıvel
observar, al´em da maior incidˆencia de cintila¸c˜ao em SJCU, h´a uma pequena diferen¸ca no comportamento dos ´ındices entre as duas esta¸c˜oes. Em Porto Alegre/RS, observa-se que os hor´arios de alto ´ındice S4 est˜ao compreendidos em um intervalo mais restrito – entre 0h e 4h (UTC – ou 21h e 01h no tempo local) – se comparados a S˜ao Jos´e dos Campos, onde os valores mais altos foram observados aproximadamente entre 23h e 05h (UTC – ou 20h e 02h no tempo local).
Figura 46: Identifica¸c˜ao dos hor´arios mais afetados pela cintila¸c˜ao em Mar¸co/2013.
A Figura 47 apresenta um exemplo de visualiza¸c˜ao baseada em grids (ou pixel-based ), onde o ´ındice S4 est´a sendo representado para todos os sat´elites GPS em um per´ıodo de trˆes horas de dados de uma esta¸c˜ao. Cada linha representa um sat´elite, e as colunas mant´em o tempo sequencialmente; a cor das c´elulas ´e utilizada para representar os valores mapeados; valores ausentes s˜ao representados por c´elulas em preto. Atrav´es da intera¸c˜ao
com o mouse, ´e poss´ıvel detalhar as c´elulas, observando ainda o ˆangulo de eleva¸c˜ao dos sat´elites e o valor do atributo representado. Os grids permitem a visualiza¸c˜ao sem que haja sobreposi¸c˜ao entre os valores dos diferentes sat´elites. Outro aspecto positivo ´e a possibilidade de identificar a disponibilidade de sat´elites ao longo do tempo em uma esta¸c˜ao.
Figura 47: Visualiza¸c˜ao do ´ındice S4 baseada em grids.
A Figura 48 apresenta outra modalidade de representa¸c˜ao baseada em grids. No exemplo, s˜ao apresentadas as m´edias do ´ındice S4 obtidas a cada hora para um per´ıodo de 2 meses de dados da esta¸c˜ao SJCI (Janeiro e Fevereiro de 2012). As linhas representam as horas do dia, enquanto as colunas representam os dias. ´E poss´ıvel observar os per´ıodos mais afetados sem que haja sobreposi¸c˜ao de informa¸c˜ao; tamb´em ´e poss´ıvel identificar rapidamente as perdas de dados (c´elulas em cinza).
O m´odulo de visualiza¸c˜ao em mapas permite avaliar os ´ındices atrav´es dos pierce points projetados sobre o mapa do territ´orio brasileiro. Uma descri¸c˜ao conceitual sobre a determina¸c˜ao do pierce point – ou ponto ionosf´erico – ´e apresentada em Rezende et al. (2007). Na abordagem implementada, s˜ao utilizadas cores para mapeamento dos atributos a serem visualizados, onde o usu´ario pode optar pela delimita¸c˜ao da escala. Os pierce points podem ser projetados diretamente no mapa, sendo sobrepostos nas coordenadas do mesmo, ou ainda pode-se recorrer `a fun¸c˜oes de agrega¸c˜ao, onde valores s˜ao agregados nas posi¸c˜oes de um grid bidimensional. Foram implementadas as seguintes fun¸c˜oes: m´edia, desvio-padr˜ao, m´ınimo, m´aximo e rela¸c˜ao limiar/quantidade (quantidade de pierce points com valor superior ou inferior que o limiar definido pelo usu´ario). O usu´ario tamb´em pode especificar a resolu¸c˜ao do grid em graus decimais.
Figura 48: Visualiza¸c˜ao da m´edia do ´ındice S4 para cada dia e hora do dia (UTC) em um per´ıodo de dois meses para uma ´unica esta¸c˜ao.
resolu¸c˜ao de 1o
e uma m´ascara de eleva¸c˜ao de 20o
, apresenta-se a quantidade de pierce- points com S4 superior a 0.3 no mˆes de dezembro de 2013 para a esta¸c˜ao PALM. ´E poss´ıvel notar a menor frequˆencia de ocorrˆencia de cintila¸c˜ao no entorno do equador geomagn´etico (linha verde pontilhada), conforme as evidˆencias te´oricas destacadas na Se¸c˜ao 3.4.
Figura 49: Representa¸c˜ao com pierce-points.
Atrav´es de uma interface espec´ıfica de sele¸c˜ao de dados, o usu´ario tem a possibilidade de visualizar at´e centenas de atributos simultaneamente atrav´es dos horizon-charts. Os atributos compartilham o eixo temporal de um dia, ou seja, os dados s˜ao visualizados
em fun¸c˜ao do hor´ario do dia. Desta forma, ao representar-se as informa¸c˜oes de um dia inteiro, tem-se um eixo temporal composto por 1440 pixels de largura (com cada pixel representando um minuto do dia).
A Figura 50 apresenta um exemplo. S˜ao apresentados seis atributos para dois sat´elites, resultando-se em doze linhas. Observa-se tamb´em a intera¸c˜ao com o mouse: uma barra vertical destaca os valores obtidos em cada atributo, permitindo a conferˆencia do exato valor observado para cada s´erie temporal representada.
Figura 50: Visualiza¸c˜ao de seis atributos para dois sat´elites atrav´es dos horizon-charts.
Na Figura 51 apresenta-se um exemplo de aplica¸c˜ao da vis˜ao de calend´ario. O ca- lend´ario apresenta a m´edia di´aria do ´ındice S4 para a esta¸c˜ao SJCE no ano de 2013. Rapidamente pode-se identificar os dias mais afetados em todo o per´ıodo.
Figura 51: Exemplo de vis˜ao de calend´ario.
sobre a representa¸c˜ao visual implementada.
Tal t´ecnica foi aplicada sobre o ´ındice S4 de todos os sat´elites GPS rastreados na primeira quinzena de Dezembro/2013 pela esta¸c˜ao PRU1, utilizando-se uma m´ascara de eleva¸c˜ao de 20o
. Foi adotada uma janela de dura¸c˜ao de 15 minutos; o passo entre janelas consecutivas foi definido em 5 minutos. Adotou-se os limiares definidos em International Telecommunication Union (2012) para o ´ındice S4. Desta forma, a aplica¸c˜ao do algoritmo permite a caracteriza¸c˜ao de cintila¸c˜oes fracas, moderadas e fortes (de acordo com os limiares definidos) e que tenham dura¸c˜ao m´ınima de 15 minutos.
No exemplo apresentado na Figura 52, s˜ao apresentados os resultados para todos os sat´elites, os quais s˜ao ordenados pelo tempo de rastreio (definido pela quantidade de janelas consideradas). Os resultados s˜ao sumarizados em gr´aficos de barra verticais e seg- mentos de barra horizontais e interativos, nos quais as larguras dos segmentos representa a dura¸c˜ao dos picos, e as cores s˜ao utilizadas para detalhar a intensidade dos mesmos. No in´ıcio de cada linha, a identifica¸c˜ao do sat´elite ´e apresentada, e, ao t´ermino, o valor do parˆametro escolhido para ordena¸c˜ao dos resultados ´e apresentado.
Figura 52: Visualiza¸c˜ao dos resultados da t´ecnica SAX.
Outras op¸c˜oes de ordena¸c˜ao dispon´ıveis s˜ao a quantidade absoluta ou relativa de picos por categoria. Na Figura 53, apresenta-se uma extra¸c˜ao obtida `a partir da intera¸c˜ao com os mesmos resultados da figura anterior. Optou-se agora pela ordena¸c˜ao dos resultados de acordo com a quantidade de picos de cintila¸c˜ao forte (classe c). Apresenta-se a intera¸c˜ao do mouse com um segmento, bem como a sumariza¸c˜ao dos resultados obtidos para o sat´elite.
Destaca-se que nesta visualiza¸c˜ao optou-se por n˜ao compatibilizar o eixo temporal dos sat´elites, uma vez que o per´ıodo de tempo em que cada sat´elite ´e rastreado pelo receptor acarretaria em lacunas na representa¸c˜ao visual. Na visualiza¸c˜ao implementada, estas lacunas s˜ao suprimidas.
Tamb´em ´e poss´ıvel identificar os picos mais significativos observados em cada sat´elite ao longo do tempo.
Figura 53: Intera¸c˜ao com os resultados da t´ecnica SAX.
6.1.1.1 S´ıntese dos Recursos de Minera¸c˜ao e Visualiza¸c˜ao Implementados A Tabela 1 apresenta uma s´ıntese dos recursos implementados, sumarizando as prin- cipais caracter´ısticas e potencialidades de cada t´ecnica.
Tabela 1: S´ıntese dos Recursos T´ecnica Caracter´ısticas e Potencialidades Gr´aficos de Dispers˜ao Identifica¸c˜ao da ocorrˆencia de cintila¸c˜oes
Identifica¸c˜ao dos picos mais significativos Identifica¸c˜ao de hor´arios mais afetados Identifica¸c˜ao de sat´elites mais afetados
Identifica¸c˜ao da repetibilidade ao longo do tempo Visualiza¸c˜ao simultˆanea de dois parˆametros Grids Visualiza¸c˜ao de parˆametros sem sobreposi¸c˜ao
Identifica¸c˜ao de perdas de dados Compara¸c˜ao entre sat´elites
Mapas de Pierce Points An´alise da cobertura espacial da rede Repetibilidade espacial ao longo do tempo Varia¸c˜ao espacial ao longo do tempo Verifica¸c˜ao da geometria dos sat´elites
Horizon Charts Compara¸c˜oes entre m´ultiplos atributos de diferentes sat´elites Visualiza¸c˜ao simultˆanea de dezenas de parˆametros
Varia¸c˜ao di´aria de atributos ao longo do tempo Compara¸c˜ao de atributos em diferentes esta¸c˜oes Calendar View Vis˜ao geral sobre o comportamento ao longo do ano
Compara¸c˜ao entre esta¸c˜oes na escala de um ano Identifica¸c˜ao da disponibilidade de dados
SAX Classifica¸c˜ao de s´eries temporais de atributos (limiares) Redu¸c˜ao de dimensionalidade
Dura¸c˜ao de eventos (pelo tamanho da janela deslizante) Compara¸c˜oes entre sat´elites em longo per´ıodo de tempo