• Nenhum resultado encontrado

representa¸c˜ao de uma base de dados complexos em um espa¸co m´etrico requer um conhecimento espec´ıfico das caracter´ısticas que podem ser extra´ıdas, que s˜ao diferentes entre os v´arios tipos de dados complexos (imagens, ´audio, grafos, etc). Pensando na implementa¸c˜ao dos conjuntos de similaridade em SGBDs, um m´etodo geral para extra¸c˜ao de caracter´ısticas se mostra mais interessante. Uma possibilidade para tal m´etodo seria utilizar Redes Neurais Convolucionais (CNNs), que possuem a capacidade de extrair automaticamente caracter´ısticas dos dados de entrada para realizarem classifica¸c˜ao de dados. Embora as caracter´ısticas extra´ıdas por esse m´etodo n˜ao possuam um significado f´ısico, elas tem mostrado grande efic´acia em pesquisas recentes como reconhecimento em imagem de planta¸c˜oes em fazendas inteligentes (JIANG et al., 2020) e na detec¸c˜ao de Covid-19 em radiografias de t´orax extraindo caracter´ısticas das imagens com CNNs (MOSTAFIZ et al., 2020). Com isso em mente, sugere-se pesquisar um m´etodo que possa extrair caracter´ısticas de diferentes tipos de dados complexos utilizando CNNs para permitir a implementa¸c˜ao de extratores gen´ericos de conjuntos de similaridade em SGBDs.

32

7 CONCLUS ˜AO

A teoria que suporta os conjuntos de similaridade foi expandida para rela¸c˜oes n˜ao sim´etricas: a busca por kNN e o m´etodo h´ıbrido. Foram definidos novos operadores matem´aticos, novos conceitos de extra¸c˜ao e de grafos de similaridade. Um novo algoritmo de extra¸c˜ao de conjuntos de similaridade, denominado Asymmetric Distinct, foi desenvolvido levando em considera¸c˜ao a base te´orica desenvolvida. Este novo algoritmo foi avaliado em dois experimentos, mostrando ser est´avel e escal´avel. Com a base te´orica mais s´olida e um algoritmo robusto, foi poss´ıvel propor novos objetivos de pesquisa para a aplica¸c˜ao do recente conceito de conjuntos de similaridade. Considera-se que todos os objetivos do trabalho foram alcan¸cados e que a contribui¸c˜ao na ´area de pesquisa foi significativa.

33

Referˆencias

BARAB´aSI, A.-L.; ALBERT, R. Emergence of scaling in random networks. Science, v. 286, p. 509–512, 1999. Dispon´ıvel em: <https://science.sciencemag.org/content/286/5439/509>.

Citado na p´agina 31.

BARIONI, M. et al. In: Simp´osio Brasileiro de Bancos de Dados. ˆUberlˆandia, MG, Brasil:

Anais do 20°Simp´osio Brasileiro de Bancos de Dado, 2005. p. 130–144. Citado na p´agina 1.

BARIONI, M. et al. Seamlessly integrating similarity queries in sql. Software: Practice and Experience, v. 39, p. 355 – 384, 03 2009. Citado na p´agina 1.

BENEDETTI, F. et al. Computing inter-document similarity with context semantic analysis.

Information Systems, v. 80, p. 136 – 147, 2019. ISSN 0306-4379. Dispon´ıvel em: <http:

//www.sciencedirect.com/science/article/pii/S0306437917301503>. Citado na p´agina1.

COSTA, L. da F. et al. Characterization of complex networks: A survey of measurements.

Advances in Physics, v. 56, p. 167–242, 01 2007. Citado 2 vezes nas p´aginas 24e 31.

ERD˝oS, P.; R´eNYI, A. On random graphs. Publ. Math, v. 6, p. 290–297, 1959. Dispon´ıvel em:

<http://snap.stanford.edu/class/cs224w-readings/erdos59random.pdf>. Citado na p´agina 24.

GENDREAU, M.; POTVIN, J.-Y. Handbook of Metaheuristics. 2nd. ed. [S.l.]: Springer Publishing Company, Incorporated, 2010. ISBN 1441916636. Citado na p´agina30.

GIANNAKOPOULOS, T. pyaudioanalysis: An open-source python library for audio signal analysis. PloS one, Public Library of Science, v. 10, n. 12, 2015. Citado na p´agina 26.

GIANNAKOPOULOS, T.; PIKRAKIS, A. Introduction to Audio Analysis: A MATLAB Approach. The Boulevard, Langford Lane, Kidlington, Oxford OX5 1GB, UK: Elsevier, 2014.

Citado 5 vezes nas p´aginas 11, 12,13,14 e15.

GIRVAN, M.; NEWMAN, M. E. J. Community structure in social and biological networks.

Proceedings of the National Academy of Science of the United States of America, v. 99, p. 7821–7826, 2002. Dispon´ıvel em: <https://www.pnas.org/content/99/12/7821>.

Citado na p´agina 31.

GODDARD, W.; HENNING, M. A. Independent domination in graphs: A survey and recent results. Discrete Mathematics, v. 313, n. 7, p. 839–854, 2013. ISSN 0012-365X. Dispon´ıvel

em: <https://www.sciencedirect.com/science/article/pii/S0012365X13000083>. Citado na

p´agina 22.

HAGBERG, A. A.; SCHULT, D. A.; SWART, P. J. Exploring network structure, dynamics, and function using networkx. In: VAROQUAUX, G.; VAUGHT, T.; MILLMAN, J. (Ed.).

Proceedings of the 7th Python in Science Conference. Pasadena, CA USA: [s.n.], 2008.

p. 11 – 15. Citado na p´agina 24.

JIANG, H. et al. Cnn feature based graph convolutional network for weed and crop recog-nition in smart farming. Computers and Electronics in Agriculture, v. 174, p. 105450, 2020. ISSN 0168-1699. Dispon´ıvel em: <https://www.sciencedirect.com/science/article/pii/

S0168169919321349>. Citado na p´agina 30.

Referˆencias 34

KIM, T. et al. Similarity query support in big data management systems.Information Systems, v. 88, p. 101455, 2020. ISSN 0306-4379. Dispon´ıvel em: <http://www.sciencedirect.com/

science/article/pii/S0306437919305071>. Citado na p´agina 2.

LEVENSHTEIN, V. I. Binary codes capable of correcting spurious insertions and deletions of ones. Problems of Information Transmission, Kluwer Academic Publishers, v. 1, p. 8–17, 1965. Citado na p´agina1.

LIATSIS, P. et al. Proposal and study of statistical features for string similarity computation and classification. International Journal of Data Mining, Modelling and Management, v. 12, p. 277, 01 2020. Citado na p´agina1.

LIMA, E. L. Espa¸cos M´etricos. 3. ed. Rio de Janeiro: IMPA, 1993. Citado na p´agina 5.

MOSTAFIZ, R. et al. Covid-19 detection in chest x-ray through random forest classifier using a hybridization of deep cnn and dwt optimized features. Journal of King Saud University - Computer and Information Sciences, 2020. ISSN 1319-1578. Dispon´ıvel em: <https:

//www.sciencedirect.com/science/article/pii/S1319157820306182>. Citado na p´agina30.

POLA, I. et al. Similarity sets: A new concept of sets to seamlessly handle similarity in database management systems. Information Systems, v. 52, p. 130 – 148, 2015. ISSN 0306-4379.

Special Issue on Selected Papers from SISAP 2013. Dispon´ıvel em: <http://www.sciencedirect.

com/science/article/pii/S0306437915000216>. Citado 11 vezes nas p´aginas 2,3,5,6,7,8,9, 10,21,22 e 25.

TZANETAKIS, G.; COOK, P. Musical genre classification of audio signals.IEEE Transactions on Speech and Audio Processing, v. 10, p. 293 – 302, 08 2002. Citado na p´agina26.

WATTS, D.; STROGATZ, S. Collective dynamics of ‘small-world’ networks. Nature, v. 393, p.

440–442, 1998. Dispon´ıvel em:<https://www.nature.com/articles/30918>. Citado na p´agina 31.

ZEZULA, P. et al. Similarity Search - The Metric Space Approach. New York: Springer, 2006. Citado 4 vezes nas p´aginas 1, 2,5 e 6.

ZIGHED, D. A. et al. Mining Complex Data. Heidelberg: Springer, 2009. Citado na p´agina 1.

Documentos relacionados