• Nenhum resultado encontrado

2 Mineração de Séries Temporais

4.4 Considerações finais

Neste capítulo foram apresentados os procedimentos e os resultados para a avaliação da acurácia das medidas de distância envolvendo 4 visões de análise, sendo análise geral por horário, por canal de cor, por espécie e por canal de cor, espécie e hora. Além dessas visões de análise, foi apresentada a análise de correlação entre as medidas de distância.

Na visão geral por horário, identificou-se que a medida de distância ERP apresentou o melhor percentual médio de acerto e que as 17 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade avaliada.

Na visão por canal de cor Red, identificou-se que a medida de distância DTW apresentou o melhor percentual médio de acerto e que para as séries referentes às 17 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade.

Na visão por canal de cor Green, identificou-se que a medida de distância LCSS apresentou o melhor percentual médio de acerto e que para as séries referentes às 6 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade.

Na visão por canal de cor Blue, identificou-se que a medida de distância ERP apresentou o melhor percentual médio de acerto e que para as séries referentes às 17 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade.

Na visão por espécie Aspidosperma tomentosum, identificou-se que a medida de distância LCSS apresentou o melhor percentual médio de acerto e que para as séries referentes às 17 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade.

Na visão por espécie Miconia rubiginosa, identificou-se que a medida de distância L1 apresentou o melhor percentual médio de acerto e que para as séries referentes às 18 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade.

Na visão por espécie Pouteria ramiflora, identificou-se que a medida de distância ZNCC apresentou o melhor percentual médio de acerto e que para as séries referentes às 7 horas apresentou o melhor percentual médio de acerto, independente da medida de similaridade.

Na análise de correlação, observou-se que as medidas de distância L1, L2 e ERP possuem comportamentos parecidos.

Os resultados apresentados em todas as visões de análise indicam que os percentuais mais altos de acerto acontecem nas primeiras horas do dia e no final da tarde.

Os indicadores mostram também que a medida de distância ERP apresentou os melhores resultados e a medida ZNCC apresentou os piores resultados, conforme observado na Tabela 15.

44 Tabela 15 – Visão geral dos resultados

Cor Espécie Hora L1 L2 DTW ZNCC LCSS EDR ERP

Geral Geral 17 (+) 10 (-) - + Geral 17 (+) 13 (-) + - Aspidosperma Tomentosum 17 (+) 18 (-) - - + Miconia Rubiginosa 17 (+) 13 (-) - + Pouteria Ramiflora 18 (+) 14 (-) + - Geral 6 (+) 10 (-) - + Aspidosperma Tomentosum 6 (+) 10 (-) - + Miconia Rubiginosa 18 (+) 7 (-) + - Pouteria Ramiflora 7 (+) 10 (-) + - Geral 17 (+) 15 (-) - + Aspidosperma Tomentosum 6 (+) 15 (-) - + Miconia Rubiginosa 13 (+) 6 (-) + - Pouteria Ramiflora 7 (+) 11 (-) - - + - Geral Aspidosperma Tomentosum 17 (+) 15 (-) - + Miconia Rubiginosa 18 (+) 8 (-) + - Pouteria Ramiflora 7 (+) 14 (-) + - Red Green Blue

45

5 Conclusões

Esse trabalho de mestrado se concentrou na investigação de medidas de distância para a classificação de séries temporais em arquivos contendo características de imagens de vegetação, nas quais pretendeu identificar a partir dos dados analisados informações relevantes para a área de fenologia.

A medida de distância ERP apresentou os melhores percentuais de acerto, por outro lado, a medida ZNCC apresentou os piores percentuais de acerto.

Na análise de correlação, observou-se que as medidas de distância L1, L2 e ERP apresentaram resultados parecidos.

No trabalho preliminar em que os rótulos desconhecidos são considerados no cálculo de similaridade pelas medidas de distância, o percentual de acurácia se apresenta mais baixo. Esse percentual baixo de acurácia pode ter acontecido dado a grande quantidade de indivíduos de espécies desconhecidas, devido a diversidade de vegetação do cerrado.

A Figura 14 mostra o gráfico representado por hora e percentual de acerto para as medidas L1, L2 e ZNCC.

46

5.1 Contribuições do Trabalho

A contribuição do trabalho está na realização da análise de eficácia de medidas de distância em dados da área de fenologia de plantas. Ressaltando que não há trabalhos semelhantes publicados.

5.2 Trabalhos Futuros

Como proposta de possíveis trabalhos futuros, poderíamos citar:

 A inclusão dos resultados obtidos com as medidas de similaridade no banco de dados do e-phenology;

 Analisar outras espécies de planta;

 Analisar os indivíduos de espécies desconhecidas;

 Analisar as medidas de similaridade sob a ótica de grupos funcionais Decídua (perdem as folhas no outono, renovando na primavera), Semidecidua (não perdem totalmente as folhas durante o ano) e sempre verde. Esses grupos funcionais foram propostos por (Almeida et al., 2012).

5.3 Considerações finais

Este trabalho teve resultados esperados, pois analisou a eficácia das medidas de distância para a classificação de séries temporais associadas ao comportamento fenológico de plantas.

A pesquisa em fenologia pode se beneficiar com os resultados obtidos neste trabalho no sentido de buscar identificar se existem semelhanças entre as espécies de plantas avaliadas e quais os fatores que favorecem essas semelhanças em determinados horários do dia em que estas espécies foram registradas pela câmera digital.

47

Referências Bibliográficas

ALBERTI, L. F.; MORELLATO, L. P. C. Influência da abertura de trilhas antrópicas e clareiras naturais na fenologia reprodutiva de Gymnanthes concolor ( Spreng .) Müll . Arg . ( Euphorbiaceae ). Revista Brasileira de Botânica, v. 31, n. 1, p. 53-59, 2008.

ALMEIDA, J., DOS SANTOS, J.A.; ALBERTON, B.; TORRES, R. da S.; MORELLATO, L.P.C., Remote phenology: Applying machine learning to detect phenological patterns in a Cerrado Savanna. IEEE International Conference on eScience, p.1-8, 2012.

ALMEIDA, J.; DOS SANTOS, J.; ALBERTON, B.; TORRES, R. da S.; MORELLATO, L. P. C. Applying machine learning based on multiscale classifiers to detect remote phenology patterns in Cerrado savanna trees. Ecological Informatics, jul. 2013.

ANDRIENKO, G.; ANDRIENKO, N.; MLADENOV, M.; MOCK, M.; POELITZ, C. Extracting Events from Spatial Time Series. IEEE 14th International Conference on Information Visualisation, p. 48-53, 2010.

BATISTA, G. E. A. P. A.; WANG, X.; KEOGH, E. J. A Complexity-Invariant Distance Measure for Time Series. 11th SIAM International Conference on Data Mining, p. 699- 710, 2011.

BERNDT, D. and CLIFFORD, J. Using Dynamic Time Warping to Find Patterns in Time Series. AAAI Workshop on Knowledge Discovery in Databases, p. 359-370, 1994.

BROCKWELL, P. J.; DAVIS, R. A. Introduction to Time Series and Forecasting, 2nd Edition, Springer Texts in Statistics, 1997

CASTRO, E. R.; GALETTI, M.; MORELLATO, L. P. C. Reproductive phenology of Euterpe edulis (Arecaceae) along a gradient in the Atlantic rainforest of Brazil. Australian Journal of Botany, v. 55, n. 7, p. 725-735, 2007.

CHAMBERS, L. E.; ALTWEGG, R.; BARBRAUD, et al. Phenological changes in the southern hemisphere. PloS one, v. 8, n. 10, jan 2013.

CHAOVALITWONGSE, W. A.; FAN, Y.J.; SACHDEO, R. C.. On the Time Series K - Nearest Neighbor Classification of Abnormal Brain Activity. IEEE Transactions on Systems, v. 37, n. 6, p. 1005-1016, 2007.

CHEN, L.; NG, R. On The Marriage of Lp-norms and Edit Distance. p. 792-803, VLDB, 2004.

CHEN, L.; OZSU, M. T.; ORIA, V. Robust and Fast Similarity Search for Moving Object Trajectories. SIGMOD Conference , p. 491-502, 2005.

48 COUTO Jr, A. F.; CARVALHO Jr; O. A. de; et al.. Tratamento de Ruídos e Caracterização de Fisionomias do Cerrado Uitlizando Séries Temporais do Sensor Modis. Revista Árvore, v.35, n.3, Edição Especial, p. 699-705, 2011.

DING, H.; TRAJCEVSKI, G.; SCHEUERMANN, P.; WANG, X.; KEOGH, E. Querying and Mining of Time Series Data : Experimental Comparison of Representations and Distance Measures. VLDB, v. 1, n. 212, 2008.

ESLING, P.; AGON, C.; RECHERCHE, I. DE. Time-Series Data Mining. ACM Computing Surveys, v. 45, n. 1, 2012.

FALOUTSOS, C.; RANGANATHAN, M.; MANOLOPOULOS, Y. Fast Subsequence Matching in Time-Series Databases. ACM SIGMOD International Conference on Management of Data, v. 23, n. 2, p. 419-429, 1994.

FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery in Databases. Artificial Intelligence Magazine, v. 17, n. 3, 1996.

FERREIRA, M. R. P.; SANTOS, L. F. D.; TRAINA, A. J. M.; DIAS, I.; CHBEIR, R.; TRAINA Jr., C. Algebraic Properties to Optimize kNN Queries. Journal of Information and Data Management, v. 2, n. 3, 2011.

GUYON , D.; GUILLOT, M.; VITASSE, Y.; CARDOT, H.; HAGOLLE; O.; DELZON, S. AND WIGNERON, J.-P. Remote Sensing of Environment Monitoring elevation variations in leaf phenology of deciduous broadleaf forests from Spot/Vegetation time-series. Elsevier, Remote Sensing of Environment, 2010.

HAN, J.; KAMBER, M. Data Mining – Concepts and Techniques. Morgan Kaufmann Publishers, 2001.

HUDSON, I. L. ; KIM, S. W. AND KEATLEY, M. R. Climatic influences on the flowering phenology of four Eucalypts : a GAMLSS approach. 18th World IMACS/MODSIM Congress, July, p. 2611-2617, 2009.

KASHYAP, S.; KARRAS, P. Scalable k NN Search on Vertically Stored Time Series ∗ Categories and Subject Descriptors. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, v. 1, p. 1334-1342, 2011.

KEOGH, E. Exact Indexing of Dynamic Time Warping. VLDB Conference. 2002. MACKUTE-VARONECKIENE, A.; ZILINSKAS, A.; VARONECKAS, A. Multidimensional Scaling: Multi-Objective Optimization Approach. ACM CompSysTech, p. 1-6, 2009.

MARIOTE, L. E.; MEDEIROS, C. B.; TORRES, R. da S.; BUENO, L. M. TIDES - a new descriptor for time series oscillation behavior. Geoinformatica, Ed. Springer, p. 75- 109, 2011.

49 MARTIN J. and CROWLEY J. L. Experimental comparison of correlation techniques, Int. Conf. on Intelligent Autonomous Systems, 1995.

MCCLOY, K. R. Development and Evaluation of Phenological Change Indices Derived from Time Series of Image Data. Remote Sensing, p. 2442-2473, 2010.

MEZER, A.; YOVEL, Y.; PASTERNACK, O.; GORNE, T. and ASSAF, Y. Cluster analysis of resting-state fmri time series. Neuroimage, v. 45, n. 4, p. 1117–1125, 2009.

MONARD, M. C. A Study of the Behavior of Several Methods for Balancing Machine Learning Training Data. ACM SIGKDD, v. 6, n. 1, 2004.

MORELLATO, E. P. C.; TORRES, R. da S.

http://www.recod.ic.unicamp.br/ephenology/index.php?id=2. Acessado em 30/06/2012. MORELLATO, L. P. C.; CAMARGO, M. G. G. and GRESSLER, E. Chapter 6 A Review of Plant Phenology in South and Central America, Springer. 2013.

MUEEN, A.; NATH, S. and LIU, J. Fast Approximate Correlation for Massive Time- series Data. SIGMOD 2010, v. 1, p. 171-182, 2010.

OLIVEIRA, P. C. de. Séries Temporais : Analisar o Passado , Predizer o Futuro. Analysis, p. 3-6, 2007.

OTRANTO, E. Identifying financial time series with similar dynamic conditional correlation. Computational Statistics & Data Analysis 54, 115, 2010.

PINTO, A. M.; MORELLATO, L. P. C.; BARBOSA, A. P. Willd ( Fabaceae ) em duas áreas de floresta na Amazônia Central. ACTA AMAZONICA, v. 38, n. 4, p. 643-650, 2000.

RATHCKE, B.;LACEY, E. P. Phenological patterns of terrestrial plants, Annual Review of Ecology and Systematics, n.16, p. 179–214, 1985.

RICHARDSON, A. D.; JENKINS, J. P.; BRASWELL, B. H.; HOLLINGER, D. Y.; OLLINGER, S. V. and SMITH, M-L. . Use of digital webcam images to track spring green-up in a deciduous broadleaf forest. Oecologia, v. 152, n. 2, p. 323-34, 2007.

ROMANI, L. A. S.; AVILA, A. M. H.; ZULLO Jr., J.; TRAINA Jr., C. and TRAINA, A. J. M. Mining Relevant and Extreme Patterns on Climate Time Series with CLIPSMiner. America, v. 1, n. 2, p. 245-260, 2010.

SANTOS, J. A. dos; FARIA, F. A.; TORRES, R. da S.; ROCHA, A.; GOSSELIN, P-H.; PHILIPP-FOLIGUET, S. and FALCÃO, A. Descriptor Correlation Analysis for Remote Sensing Image Multi-Scale Classification, 21st International Conference on Pattern Recognition (ICPR), p. 3078-3081, 2012.

SCHWARTZ, M.D.Phenology: An Integrative Environmental Science. Kluwer Academic Publishers, 2003.

50 SCHNEIDER, T.; O’GORMAN, P. A.; LEVINE, X. Water vapor and the dynamics of climate changes. Reviews of Geophysics. v. 48, n. 3, p. 1-23, 2009.

SHANMUGANATHAN, S.; SALLIS, P. and NARAYANAN, A. Modelling the seasonal climate effects on grapevine yield at different spatial and unconventional temporal scales. International Congress on Environmental Modeling and Software, 2010.

TAN, P; STEINBACH, M. and KUMAR, V. Introduction to Data Mining. Addison Wesley, 2005.

UENO, K.; LEE, D. Anytime Classification Using the Nearest Neighbor Algorithm with Applications to Stream Mining. Sixth IEEE International Conference on Data Mining, 2006.

UOTILA, P; LYNCH, A. H.; CASSANO, J. J. and CULLATHER, R. I. Changes in Antarctic net precipitation in the 21st century based on Intergovernmental Panel on Climate Change (IPCC) model scenarios. Journal of Geophysical Research, v. 12, n. 10, 2007.

VLACHOS, M.; KOLLIOS, G.; GUNOPULOS, D. Discovering similar multidimensional trajectories. 18th International Conference on Data Engineering, p. 673-684, 2002.

WEI, L.-L. Mining Regression-Classes in Fuzzy Point Data Sets. Sixth International Conference on Fuzzy Systems and Knowledge Discovery, p. 562-566, 2009.

YI, B. K. Yi AND FALOUTSOS, C. Fast Time Sequence Indexing for Arbitrary Lp Norms. VLDB. 2000.

ZHANG, M.; FAN, J.; ZHU, X.; LI, G. and ZHANG, Y.. Monitoring winter-wheat phenology in North China using time-series. Agriculture, v. 7472, p. 1-6, 2009.

ZHAO, J.; ZHANG, Y.; TAN, Z.; SONG, Q.; LIANG, N.; YU, L. and ZHAO, J. Ecological Informatics Using digital cameras for comparative phenological monitoring in an evergreen broad-leaved forest and a seasonal rain forest. Ecological Informatics, v. 10, p. 65–72, 2012.

Documentos relacionados