FASE II: AN ´ ALISE E QUANTIFICAC ¸ ˜ AO DOS ARTIGOS

3 ESTADO DA ARTE

3.2 FASE II: AN ´ ALISE E QUANTIFICAC ¸ ˜ AO DOS ARTIGOS

Para filtrar trabalhos diretamente relacionados com o assunto abordado na revisão sistemática, foi realizada uma avalia¸cão dos artigos para definir quais seriam inclu´ıdos ou não na revisão. Nessa filtragem, optou-se por incluir trabalhos que definem claramente os critérios internos, externos ou relativos utilizados na valida¸cão de agrupamento de séries temporais. Por outro lado, a exclusão de artigos foi realizada sempre que os trabalhos não apresentassem um processo valida¸cão de agrupamento satisfatório. Além disso, foram descartados trabalhos que não realizaram uma apresenta¸cão clara de utiliza¸cão de valida¸cão e quando havia trabalhos redundantes.

Portanto, a Fase I apresenta as condi¸cões iniciais de sele¸cão de artigos para revisão sistemática. A próxima fase consiste na análise dos artigos selecionados nesta primeira fase.

3.2 FASE II: AN ÁLISE E QUANTIFICAÇ ÃO DOS ARTIGOS

Através da consulta realizada nos repositórios apresentados, foram encontrados um total de 54 artigos, cuja distribui¸cão em cada repositório está apresentado na Tabela 3.1. Após a coleta, a inclusão ou exclusão dos artigos encontrados foi realizada pela leitura dos t´ıtulos e dos resumos. Como resultado, grande parte dos artigos foram exclu´ıdos por se tratarem de trabalhos redundantes ou não apresentarem um estudo detalhado sobre o uso de ´ındices de valida¸cão no contexto de séries temporais. Portanto, depois da remo¸cão desse artigos restaram apenas 10 artigos que estão diretamente relacionados ao assunto apresentado neste trabalho.

Tabela 3.1 Número de artigos encontrados pela Revisão Sistemática.

Reposit´orio N´umero de artigos

ACM 1 IEEE 13 Scopus 40 Total 54 Inclus˜ao 10 Exclus˜ao 44

Visando responder a questão secundária QS.5, analisou-se a frequência de publica¸cão destes artigos por ano, a fim de encontrar trabalhos mais recentes e que correspondam ao assunto abordado neste projeto de mestrado. Conforme pode ser observado na Tabela 3.2, nota-se que artigos têm sido publicados sobre esse tema com regularidade desde 2001, apesar da baixa quantidade.

No primeiro artigo analisado, Fadili et al. (2001) apresentam uma estratégia explo- ratória orientada a dados baseada em Unsupervised Fuzzy Clustering Analysis (UFCA), validando sua estratégia ao analisar dados de fMRI (ressonância magnética funcional1). Neste contexto, os autores adaptam e aplicam o algoritmo Fuzzy C-Means (FCM) aos dados no dom´ınio do tempo e um novo ´ındice de valida¸cão de agrupamento é introduzido e

20 ESTADO DA ARTE

Tabela 3.2 N´umero de artigos publicados por ano.

Ano Frequˆencia

2001 1 2004 1 2007 1 2011 1 2015 1 2016 2 2017 2 2018 1

validado comparando com os ´ındices CS, S e fuzzy. Tais ´ındices têm por finalidade minimi- zar a variância intra-cluster e maximizar a variância inter-cluster. De maneira resumida, o trabalho propõe um novo ´ındice de valida¸cão, denominado SCF, que tira vantagem dos três ´ındices citados anteriormente, levando em considera¸cão a compacta¸cão, separa¸cão, união e interseçcão dos grupos obtidos. Os resultados demonstram a vantagem do ´ındice proposto (SCF) e sua eficácia para valida¸cão de dados no dom´ınio do tempo.

O trabalho publicado por Himberg, Hyvärinen e Esposito (2004) apresenta experimentos utilizando algoritmo hierárquico sobre dados de fMRI e dados de magnetoence- falografia (MEG). O trabalho proposto baseia-se na execu¸cão do algoritmo Independent Component Analysis (ICA), um modelo estat´ıstico de propósito geral amplamente utilizado na análise de dados de imagem cerebral. Sendo assim, os autores desenvolvem um pacote chamado Icasso, com foco na implementa¸cão de um conjunto abrangente de métodos suportados para análise e visualiza¸cão exploratória dos dados. Em uma das fa- ses deste trabalho, após a aplica¸cão do algoritmo ICA, o usuário explora o agrupamento, iniciando uma aplica¸cão de visualiza¸cão interativa. Assim, o mesmo examina a qualidade dos grupos. Posteriormente, é poss´ıvel visualizar a matriz de similaridade entre todas as instâncias e sua parti¸cão final obtida em um único gráfico, produzido a partir do método de liga¸cão average-link. Neste pacote é introduzido um ´ındice de qualidade de grupo, Iq,

que reflete sua compacta¸cão e seu isolamento. Esse ´ındice é computado pela diferen¸ca entre as similaridades médias intra-cluster e intercluster. Além desses ´ındices, os autores analisam os ´ındices Dunn-like e R-index (IR). Entretanto, a conclusão do trabalho é

que, muitas vezes, os ´ındices produzem resultados diferentes dependendo do caráter dos dados utilizados, sem indica¸cão clara de superioridade geral. Logo, com base nos experimentos realizados, o trabalho não sugere nenhum ´ındice vencedor definitivo. Por outro lado, recomenda-se que a sele¸cão final do número de grupos deve ser feito pelo usuário, o qual pode explorar, de forma interativa, os resultados produzidos por diferentes n´ıveis de dendrograma.

No trabalho de Meyer-Bäse et al. (2007) são aplicados algoritmos de agrupamento, tais como Kohonen’s self-organizing map, Minimal free energy vector quantizer e ”Neural gas”network em séries temporais de imagens biomédicas em aplica¸cões para: (i) análise de dados de fMRI para mapeamento do cérebro humano; (ii) ressonância magnética de contraste dinâmica para o diagnóstico de doen¸ca cerebrovascular; e (iii) ressonância

3.2 FASE II: AN ÁLISE E QUANTIFICAÇ ÃO DOS ARTIGOS 21

magnética de mama para a segmenta¸cão de lesões suspeitas de pacientes com câncer de mama. Para a valida¸cão dos agrupamentos obtidos são utilizados três ´ındices: (i) Kim; (ii) Calinski Harabasz (CH); e (iii) intraclass. Apesar dos estudo experimental, os autores afirmam que não é poss´ıvel determinar qual o melhor ´ındice para validar agrupamento em séries temporais de imagens biomédicas.

Maji e Paul (2011) aplicam o algoritmo Rough-fuzzy C-Means (RFCM) a fim de descobrir grupos de genes co-expressos a partir de dados de microarray, que é uma análise importante em genômica funcional. Uma compara¸cão entre RFCM e outros algoritmos de agrupamento foi realizada considerando cinco conjuntos de dados de séries temporais de microarray de levedura. Os resultados obtidos foram validados com os ´ındices Davies- Bouldin e Silhouette. Com base nos resultados quantitativos desses ´ındices, estimou-se que o algoritmo RFCM produz melhor resultado de agrupamento do que os algoritmos convencionais.

Salgado, Ferreira e Vieira (2017) demonstram em seu trabalho as vantagens do algoritmo Mixed Fuzzy Clustering (MFC) ao avaliar séries temporais de dados médicos que descrevem a evolu¸cão de uma variável fisiológica. O calculo da distância entre as séries foi realizado usando Dynamic Time Warping (DTW). A performance dos algoritmos comparados foi avaliada usando medidas de valida¸cão de agrupamento, mostrando que o algoritmo proposto supera o Fuzzy C-Means. A valida¸cão foi realizada com os ´ındices interno de valida¸cão Xie-Beni (XB) e Dunn, os quais são comumente utilizados no agrupamento fuzzy, e com os ´ındices de valida¸cão externa Rand e precisão. Em geral, o algoritmo MFC identifica grupos mais compactos do que o FCM, conforme expresso pelo ´ındice XB, em cada conjunto de dados testado. Nesse trabalho, os autores observam que tipos diferentes de ´ındices são usados para resolver diferentes tipos de problemas e a sele¸cão do melhor ´ındice depende do tipo de dados, da técnica de agrupamento e, em ´

ultima an´alise, do objetivo do estudo.

Das e Padhy (2017) combinam os algoritmos Unsupervised Extreme Learning Machine (US-ELM ) e Support Vector Machine (SVR), propondo um modelo h´ıbrido chamado USELM-SVR. O algoritmo é comparado com os algoritmos SOM e k-means utilizando dados de séries temporais da área financeira. Os dados de entrada são normalizados e inseridos nos métodos de ´ındice interno de valida¸cão para cálculo do número ótimo de clusters. Assim, o algoritmo USELM-SVR executa os dados de entrada com base no número ideal de clusters. Os ´ındices considerados nos experimentos foram: Silhou- ette, em que é prefer´ıvel valor de ´ındice alto; Davies-Bouldin, prefer´ıvel valor de ´ındice baixo; Calinski-Harabasz, prefer´ıvel valor de ´ındice alto; Krzanowski-Lai, prefer´ıvel valor de ´ındice alto; weighted inter-intra, prefer´ıvel valor de ´ındice alto e homogeneity, prefer´ıvel valor de ´ındice alto. Os valores dos ´ındices foram calculados para número de grupos vari- ando de 2 a 6. Os resultados mostram que os melhores valores para os ´ındices Silhouette, Davies-Bouldin, weighted inter-intra e homogeneity foram obtidos usando 5 grupos. Os ´ındices Calinski-Harabasz e Krzanowski-Lai sugerem 2 grupos. Por fim, foi utilizado 5

grupos, sugerido pela maioria dos ´ındices.

Homenda e Jastrzebska (2017) apresentam uma abordagem para modelagem de s´eries temporais, sint´eticas e reais, com Fuzzy Cognitive Maps. A pesquisa teve como objetivo introduzir meios algor´ıtmicos para avaliar o Fuzzy Cognitive Map antes da fase

22 ESTADO DA ARTE

de treinamento. Assim, foi colocado como hipótese a aplica¸cão de ´ındices de valida¸cão para contribui¸cão do agrupamento e para avaliar vários modelos de FCM. Para validar esta abordagem, foi conduzido um conjunto de experimentos utilizando cinco ´ındices de valida¸cão: (i) Calinski-Harabasz ; (ii) generalized Dunn index(GDI); (iii) PBM ; (iv) Si- lhouette; e (v) Wemmert-Gancarski. Os resultados mostram que Fuzzy Cognitive Maps projetado usando o ´ındice Calinski-Harabasz tem qualidade superior e, após o treinamento, verifica-se a qualidade numérica de precisão do algoritmo sendo superior aos demais algoritmos utilizados nos experimentos.

Fahiman et al. (2017) desenvolvem dois novos algoritmos que são heur´ısticas deri- vadas do Fuzzy C-Means: Fuzzy c-Shapes plus (FCS+) e Fuzzy c-Shapes double plus (FCS ++). Experimentos emp´ıricos com 48 dados reais de séries temporais demonstram que os algoritmos propostos superam algoritmos convencionais em termos de precisão e eficiência. Para comprovar isto, são utilizados 4 ´ındices externos de valida¸cão: (i) Rand ; (ii) Adjusted Rand ; (iii) Variation of Information; e (iii) Normalized Mutual Information . Cada ´ındice foi avaliado dez vezes por diferentes execu¸cões do FCS+ e FCS++. Todos os quatro ´ındices indicam que o FCS++ tem um desempenho ligeiramente superior ao FCS+, que, por sua vez, é ligeiramente superior ao k-Shape, também utilizado como teste de compara¸cão.

Dai et al. (2018) exploram o agrupamento de séries temporais de sinal de eletro- encefalografia (multi-trial EEG) e propõe uma nova abordagem baseada em centróide. Chamado de MTEEGC, este algoritmo realiza o agrupamento de dados EEG multi-trial de alta qualidade com rela¸cão à compacta¸cão intra-cluster, bem como a dispersão entre grupos. Ao mesmo tempo, também demonstra a superioridade na precisão de agrupamento quando comparado com mais de 10 algoritmos de agrupamento de séries temporais através de experimentos usando critérios de valida¸cão de agrupamento em 5 conjuntos de dados EEG multi-trial reais. Foram aplicados seis critérios para analisar o novo método, incluindo três medidas de qualidade de agrupamento: (i) compacta¸cão intra-cluster (SIn);

(ii) dispers˜ao inter-cluster (SBe); (iii) raz˜ao integrada (γ = SBeSIn−1); e (iv) as medidas de

precis˜ao de agrupamento Rand (RI), F-score e Fleiss’ kappa(k). Os resultados mostram que MTEEGC n˜ao alcan¸ca os melhores resultados de SIn e SBe para todos os 5 conjuntos

de dados, mas obt´em a maior raz˜ao integrada (γ) quando considera SIn e SBe. Como o

MTEEGC tem como objetivo produzir grupos de alta qualidade de forma que os testes de EEG no mesmo grupo sejam altamente compactos, enquanto aqueles em grupos diferentes sejam altamente separados. De maneira geral, o algoritmo garante maior compacta¸cão intra-cluster ou maior dispersão inter-cluster, mas não necessarimente de maneira simul- tanea. Do mesmo modo, quando avaliadas as medidas de precisão, MTEEGC não fornece uma boa precisão, mas possui uma eficiência competitiva. Como consequência, MTEEGC alcan¸ca a maior qualidade e precisão para agrupamento de dados EEG multi-trial quando comparado aos demais 10 algoritmos de agrupamento de séries temporais.

De maneira diferente como tem sido abordado nos trabalhos citados anteriormente, Ding, Noshad e Tarokh (2015) propõem um processo autoregressivo variante no tempo (TVAR) para descrever séries temporais não-estacionárias e modelá-las como uma mistura de múltiplos processos autorregressivos (AR) estáveis. Para isto, desenvolve uma nova técnica baseada no ´ındice interno de valida¸cão, gap statistic, para aprender o número

3.2 FASE II: AN ÁLISE E QUANTIFICAÇ ÃO DOS ARTIGOS 23

apropriado de filtros AR necessários para modelar séries temporais. O algoritmo funciona da seguinte maneira: primeiramente, a técnica gera F filtros estáveis aleatoriamente uniformes com um determinado tamanho L; em seguida, supõe-se que 1, ..., Mmax é o

conjunto candidato do número de modos; então, uma matriz é produzida cujos elementos são distâncias entre pares de filtros amostrados; por fim, executa-se o algoritmo k-medoid. A partir destas etapas, um curva de referência é gerada com a rela¸cão entre a dispersão (log(WM)) e o número de filtros AR (M ) entre 1 e 6. Em seguida, calcula-se a curva

emp´ırica dado uma nova medida de distˆancia, chamada MSPE (Mean Squared Prediction Error ), para M = 1, 2, ..., Mmax, usando o dado observado, o modelo postulado (mistura

de AR) e o modelo de abordagem adequada (algoritmo EM). Por fim, o número de misturas AR que corresponde ao maior gap entre as duas curvas é selecionado. Os resultados das simula¸cões demonstram bom desempenho da técnica proposta.

De acordo com os trabalhos discutidos nesta se¸cão, ´ındices são as principais ferra- mentas utilizadas para analisar a qualidade do agrupamento, conforme esperado, o que responde a pergunta QS.2. Diante disso, a Tabela 3.3 resume a utiliza¸cão destes ´ındices, respondendo a pergunta QS.4.

Tabela 3.3 Índices mais utilizados na valida¸cão de agrupamento de séries temporais.

´_Indice _Quantidade Dunn 3 Calisnski Harabasz 3 Silhuette 3 Rand 3 Davies-Bouldin 2 Silhuette 1 Weinmert-Gancarski 1 PBM 1 homogeneity 1 weighted inter-intra 1 Krzanowski-Lai 1 Xie-Beni 1 Intraclass 1 Kim 1 R 1 SCF 1 Variation of Information 1 Normalized Mutual Information 1

F-score 1

Fleiss’ Kappa 1

Gap Statistic 1

Por fim, é importante destacar que tais ´ındices são aplicados aos mais diferentes tipos de aplica¸cões (QS.1), demonstrando sua relevância ao analisar agrupamentos em dados temporais (QS.3).

24 ESTADO DA ARTE

No documento MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA E ESTATÍSTICA PGCOMP - Programa de Pós-Graduação em Ciência da Computação (páginas 46-51)