• Nenhum resultado encontrado

O presente trabalho abre espaço para diversos trabalhos futuros que podem ser abordados. Dentre estes destam-se: a realização de um estudo de técnicas de otimização de arquitetura de redes neurais convolucionais profundas e uma análise dos resultados na classificação de sequências biológicas; a exploração mais aprofundada de instâncias do TERL com arquiteturas recentes da literatura, bem como um estudo abordando ajustes nas arquiteturas MobileNet e ResNet-50 utilizadas neste trabalho; a análise do desempenho da abordagem proposta utilizando a arquitetura LSTM e outras arquiteturas aplicadas em séries temporais; a modelagem e análise de diferentes arquiteturas para melhorar o desempenho obtido na classificação de outros tipos sequências biológicas.

Outro possível trabalho futuro é o estudo da aplicação de técnicas de detecção de objetos por meio de redes neurais convolucionais para tratar o problema da identificação de sequências em genomas e de identificação de elementos em sequências biológicas (e.g. domínios proteicos), visto que atualmente na literatura métodos baseados em alinhamento e alinhamento múltiplo de sequências (e.g. BLAST) são os mais utilizados e os mesmos são computacionalmente custosos e não eficientes.

Referências

ABADI, M. et al. TensorFlow: Large-Scale Machine Learning on Heterogeneous Systems. 2015. Software available from tensorflow.org. Citado na página 44.

ABRUSÁN, G. et al. Teclass:a tool for automated classification of unknown eukaryotic transposable elements. Bioinformatics, v. 25, n. 10, p. 1329–1330, 2009. Citado 3 vezes nas páginas 17, 36e 37.

BONIDIA, R. P. et al. Feature extraction of long non-coding rnas: A fourier and numerical mapping approach. In: NYSTRÖM, I.; HEREDIA, Y. H.; NÚÑEZ, V. M. (Ed.). Progress in

Pattern Recognition, Image Analysis, Computer Vision, and Applications. Cham: Springer

International Publishing, 2019. p. 469–479. Citado 2 vezes nas páginas 103 e 104.

BRITTEN, R. J.; KOHNE, D. E. Repeated sequences in dna. Science, American Association for the Advancement of Science, v. 161, n. 3841, p. 529–540, 1968. Citado na página 26. CHUONG, E. B.; ELDE, N. C.; FESCHOTTE, C. Regulatory activities of transposable elements: from conflicts to benefits. Nature Reviews Genetics, Nature Publishing Group, v. 18, p. 71–86, 2016. Citado 6 vezes nas páginas 15, 17, 24,26, 27e 28.

CONNOR, J. T.; MARTIN, R. D.; ATLAS, L. E. Recurrent neural networks and robust time series prediction. IEEE Transactions on Neural Networks, v. 5, n. 2, p. 240–254, 1994. Citado na página 35.

COPETTI, D. et al. Rite database: a resource database for genus-wide rice genomics and evolutionary biology. BMC genomics, BioMed Central, v. 16, n. 1, p. 538–547, 2015. Citado na página 50.

COWLEY, L. A. et al. Transposon insertion sequencing elucidates novel gene involvement in susceptibility and resistance to phages t4 and t7 in escherichia coli o157. mBio, American Society for Microbiology, v. 9, n. 4, p. 1–15, 2018. Citado na página 17.

CRUZ, M. H. P. da et al. Classification of transposable elements by convolutional neural networks. In: RUTKOWSKI, L. et al. (Ed.). Artificial Intelligence and Soft Computing. Cham: Springer International Publishing, 2019. p. 157–168. Citado na página 17.

DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern Classification. 2. ed. New York: Wiley, 2001. Citado na página 32.

EDGAR, R. C.; MYERS, E. W. Piler: identification and classification of genomic repeats.

Bioinformatics, v. 21, n. suppl 1, p. i152–i158, 2005. Citado na página 17.

FEDOROFF, N.; WESSLER, S.; SHURE, M. Isolation of the transposable maize controlling elements ac and ds. Cell, Elsevier, v. 35, n. 1, p. 235–242, 1983. Citado na página 20. FESCHOTTE, C. et al. Exploring repetitive dna landscapes using repclass, a tool that automates the classification of transposable elements in eukaryotic genomes. Genome Biol

Evol, Oxford University Press, v. 1, p. 205–220, 2009. Citado 5 vezes nas páginas 15, 17,36,

GERDES, P. et al. Transposable elements in the mammalian embryo: pioneers surviving through stealth and service. Genome Biol, BioMed Central, London, v. 17, p. 100–116, 2016. Citado 2 vezes nas páginas 15e 27.

GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A. Deep Learning. [S.l.]: MIT Press, 2016. Citado 5 vezes nas páginas 16,28, 32, 33e 34.

GOODWIN, T. J. D.; BUTLER, M. I.; POULTER, R. T. M. Cryptons: a group of tyrosine-recombinase-encoding dna transposons from pathogenic fungi. Microbiology, v. 149, n. 11, p. 3099–3109, 2003. Citado na página 25.

GRIFFITHS A. J. F. WESSLER, S. R.; CARROLL, S. B.; DOEBLEY, J. Introduction to

genetic analysis. [S.l.]: Eleventh edition. New York, NY : W.H. Freeman & Company, 2015

c

2015, 2015. Citado 3 vezes nas páginas21, 22e 24.

HAYKIN, S. S. Neural networks and learning machines. Third. Upper Saddle River, NJ: Pearson Education, 2009. Citado 2 vezes nas páginas 16e 30.

HE, K. et al. Deep Residual Learning for Image Recognition. 2015. Citado 3 vezes nas páginas 35, 48e 101.

HE, K. et al. Identity Mappings in Deep Residual Networks. 2016. Citado na página 35. HOCHREITER, S.; SCHMIDHUBER, J. Long short-term memory. Neural Computation, v. 9, n. 8, p. 1735–1780, 1997. Citado 2 vezes nas páginas 35e 48.

HOEDE, C. et al. Pastec: An automatic transposable element classification tool. PLOS

ONE, Public Library of Science, v. 9, n. 5, p. 1–6, 2014. Citado 6 vezes nas páginas 17, 36,

38, 62, 68 e72.

HORNIK, K.; STINCHCOMBE, M.; WHITE, H. Multilayer feedforward networks are universal approximators. Neural Networks, v. 2, n. 5, p. 359–366, 1989. Citado na página31. HOWARD, A. G. et al. MobileNets: Efficient Convolutional Neural Networks for Mobile

Vision Applications. 2017. Citado 3 vezes nas páginas 34, 35 e48.

IBARRA-LACLETTE, E. et al. Architecture and evolution of a minute plant genome.

Nature, The Author(s) SN -, v. 498, p. 94 EP –, 2013. Citado na página16.

JURKA, J. et al. Repbase update, a database of eukaryotic repetitive elements. Cytogenetic

and genome research, Karger Publishers, v. 110, n. 1-4, p. 462–467, 2005. Citado 2 vezes

nas páginas 36e 50.

KANG, Y.-J. et al. CPC2: a fast and accurate coding potential calculator based on sequence intrinsic features. Nucleic Acids Research, v. 45, n. W1, p. W12–W16, 2017. Citado na página 102.

KELLEY, D. R.; SNOEK, J.; RINN, J. L. Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks. Genome Research, v. 26, n. 7, p. 990–999, 2016. Citado na página 16.

KRISHNAN, P. et al. Transposable element insertions shape gene regulation and melanin production in a fungal pathogen of wheat. BMC Biology, v. 16, n. 1, p. 78–95, 2018. Citado na página 17.

LECUN, Y.; BENGIO, Y.; HINTON, G. Deep learning. Nature, Nature Publishing Group, v. 521, p. 436–444, 2015. Citado na página16.

LECUN, Y. et al. Gradient-based learning applied to document recognition. Proceedings of

the IEEE, IEEE, v. 86, n. 11, p. 2278–2324, 1998. Citado na página34.

LI, S.-F. et al. Dptedb, an integrative database of transposable elements in dioecious plants.

Database, Oxford University Press, v. 2016, p. 1–10, 2016. Citado na página 50.

LI, Z.-W. et al. Transposable elements contribute to the adaptation of arabidopsis thaliana.

Genome Biology and Evolution, v. 10, n. 8, p. 2140–2150, 2018. Citado na página 17. LIN, Z.; LANCHANTIN, J.; QI, Y. Must-cnn: A multilayer shift-and-stitch deep

convolutional architecture for sequence-based protein structure prediction. In: . [S.l.: s.n.], 2016. Citado na página 16.

LONG, D. et al. The maize transposable element system ac/ds as a mutagen in arabidopsis: identification of an albino mutation induced by ds insertion. Proceedings of the National

Academy of Sciences, National Acad Sciences, v. 90, n. 21, p. 10370–10374, 1993. Citado na

página 20.

MATSON, J. S. Random transposon mutagenesis of vibrio cholerae. In: Vibrio Cholerae:

Methods and Protocols. New York, NY: Springer New York, 2018. p. 39–44. Citado na

página 17.

MCCLINTOCK, B. The origin and behavior of mutable loci in maize. Proceedings of the

National Academy of Sciences, National Academy of Sciences, v. 36, n. 6, p. 344–355, 1950.

Citado 4 vezes nas páginas 15,19, 20e 21.

NEUMANN, P.; POŽÁRKOVÁ, D.; MACAS, J. Highly abundant pea ltr retrotransposon ogre is constitutively transcribed and partially spliced. Plant Molecular Biology, v. 53, n. 3, p. 399–410, 2003. Citado na página 24.

PATTERSON, D. W. Artificial neural networks: theory and applications. [S.l.]: Prentice Hall PTR, 1998. Citado na página29.

SCHIETGAT, L. et al. A machine learning based framework to identify and classify long terminal repeat retrotransposons. PLOS Computational Biology, Public Library of Science, v. 14, p. 1–21, 2018. Citado 3 vezes nas páginas 17, 36 e37.

SCHNABLE, P. S. et al. The b73 maize genome: Complexity, diversity, and dynamics.

Science, American Association for the Advancement of Science, v. 326, n. 5956, p. 1112–1115,

2009. Citado na página 16.

SERRATO-CAPUCHINA, A.; MATUTE, D. R. The role of transposable elements in speciation. Genes, v. 9, n. 5, p. 254–282, 2018. Citado na página 17.

SHI, X. et al. Convolutional lstm network: A machine learning approach for precipitation nowcasting. In: CORTES, C. et al. (Ed.). Advances in Neural Information Processing

Systems 28. [S.l.]: Curran Associates, Inc., 2015. p. 802–810. Citado na página 36.

SILVER, D. et al. Mastering the game of go with deep neural networks and tree search.

SILVER, D. et al. Mastering the game of go without human knowledge. Nature, Macmillan Publishers Limited, v. 550, p. 354–359, 2017. Citado na página 32.

SPANNAGL, M. et al. Pgsb plantsdb: updates to the database framework for comparative plant genome research. Nucleic Acids Res, Oxford University Press, v. 44, n. D1, p. D1141–D1147, 2016. Citado na página 50.

SUNG-IL, K. N.-S. L. Transposable elements and genome size variations in plants. Genomics

Inform, v. 12, n. 3, p. 87–97, 2014. Citado na página 16.

TEMPEL, S.; POLLET, N.; TAHI, F. ncrnaclassifier: a tool for detection and classification of transposable element sequences in rna hairpins. BMC Bioinformatics, BioMed Central, v. 13, p. 246–258, 2012. Citado na página 17.

WEIL, C. F.; KUNZE, R. Transposition of maize ac/ds transposable elements in the yeast saccharomyces cerevisiae. Nature genetics, v. 26, n. 2, p. 187–190, 2000. Citado na página

20.

WICKER, T.; MATTHEWS, D. E.; KELLER, B. Trep: a database for triticeae repetitive elements. Trends in Plant Science, Elsevier, v. 7, n. 12, p. 561–562, 2002. Citado na página

50.

WICKER, T. et al. A unified classification system for eukaryotic transposable elements.

Nature Reviews Genetics, Nature Publishing Group, v. 8, p. 973–982, 2007. Citado 8 vezes

nas páginas 7,15, 16, 21,23, 24, 25e 36.

Xu Min et al. Deepenhancer: Predicting enhancers by convolutional neural networks. In:

2016 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). [S.l.: s.n.],

2016. p. 637–644. Citado na página16.

YI, F. et al. Sptedb: a database for transposable elements in salicaceous plants. Database, Oxford University Press, v. 2018, p. 1–8, 2018. Citado na página 50.

ZURADA, J. M. Introduction to artificial neural systems. [S.l.]: West publishing company St. Paul, 1992. v. 8. Citado na página 29.