• Nenhum resultado encontrado

Foi observado, durante os experimentos, que os resultados não foram satisfatórios para classes de tráfego que apresentaram poucas instâncias para treinamento, ou seja, devido ao alto grau de desbalanceamento das bases de dados, embora os resultados para o mo- delo proposto tenham sido superiores às ferramentas DPI analisadas e a um conjunto de algoritmos de aprendizagem de máquina. Como trabalho futuro, algoritmos de aprendi- zagem de máquina que auxiliem no tratamento do desbalanceamento das bases podem ser utilizados, ou até mesmo fazer uso de bases de dados mais balanceadas para treina- mento. O tratamento de bases desbalanceadas é uma subárea bastante vasta na área de aprendizagem de máquina.

O comportamento de tráfegos de redes mudam com o tempo, exigindo que o modelo seja retreinado periodicamente para aprender novas aplicações ou se adaptar às mudanças de comportamento para as classes já conhecidas pelo modelo. Como trabalho futuro, o modelo híbrido pode ser estendido para utilizar técnicas de aprendizagem de máquina que utilizam treinamento incremental, para que não seja necessário retreinar o modelo

periodicamente, uma vez que o aprendizado é feito de forma online. Além disso, como a rotulação de tráfego de redes é uma tarefa custosa, a utilização de algoritmos de aprendi- zagem semi-supervisionada pode auxiliar o processo de treinamento, uma vez que reduz consideravelmente a quantidade obrigatória de instâncias rotuladas (i.e., a maior parte do conjunto de dados pode estar sem os rótulos), sem degradar o desempenho do modelo.

Outro importante trabalho futuro a ser realizado é o de obter traces completos (sem a restrição do descarte de fluxos menores que 1 segundo) e mais recentes de um grande backbone (e.g., da Rede Nacional de Ensino e Pesquisa), através de medição passiva, uma vez que uma limitação do nosso trabalho foi o uso de medição ativa, e realizar experimentos com outros trabalhos de aprendizagem de máquina para classificação de tráfegos de redes, além de ferramentas DPI, com as métricas utilizadas neste trabalho (incluindo resultados de tempo de classificação).

REFERÊNCIAS

ALPAYDIN, E. Introduction to Machine Learning. 2nd. ed. [S.l.]: The MIT Press, 2010. ISBN 026201243X, 9780262012430.

ALSHAMMARI, R.; ZINCIR-HEYWOOD, A. N. Identification of VoIP encrypted traffic using a machine learning approach. J. King. Saud. Univ. - Computer and Information Sciences, v. 27, n. 1, p. 77–92, 1 2015. ISSN 13191578.

BACQUET, C.; ZINCIR-HEYWOOD, A. N.; HEYWOOD, M. I. An Investigation of Multi-objective Genetic Algorithms for Encrypted Traffic Identification. In: Computational Intelligence in Security for Information Systems - CISIS’09. [S.l.]: Springer, 2009. (Advances in Intelligent and Soft Computing, v. 63), p. 93–100. ISBN 978-3-642-04090-0.

BACQUET, C.; ZINCIR-HEYWOOD, A. N.; HEYWOOD, M. I. Genetic optimization and hierarchical clustering applied to encrypted traffic identification. In: 2011 IEEE Symposium on Computational Intelligence in Cyber Security (CICS). [S.l.]: IEEE, 2011. p. 194–201. ISBN 978-1-4244-9905-2.

BENGIO, Y. Learning Deep Architectures for AI. Found. Trends Mach. Learn., Now Publishers Inc., Hanover, MA, USA, v. 2, n. 1, p. 1–127, jan 2009. ISSN 1935-8237. BENGIO, Y.; LAMBLIN, P.; POPOVICI, D.; LAROCHELLE, H. Greedy Layer-wise Training of Deep Networks. In: Proceedings of the 19th International Conference on Neural Information Processing Systems. Cambridge, MA, USA: MIT Press, 2006. (NIPS’06), p. 153–160.

BENMESSAHEL, I.; XIE, K.; CHELLAL, M. A new evolutionary neural networks based on intrusion detection systems using multiverse optimization. Applied Intelligence, p. 1–13, 2017. ISSN 1573-7497.

BESNERAIS, J. L.; LANFRANCHI, V.; HECQUET, M.; BROCHET, P. Multiobjective Optimization of Induction Machines Including Mixed Variables and Noise Minimization. IEEE Transactions on Magnetics, v. 44, n. 6, p. 1102–1105, 6 2008. ISSN 00189464. BISWAS, A. R.; GIAFFREDA, R. IoT and Cloud Convergence: Opportunities and Challenges. 2014 IEEE World Forum on Internet of Things (WF-IoT), p. 375–376, 2014. BOUTABA, R.; SALAHUDDIN, M. A.; LIMAM, N.; AYOUBI, S.; SHAHRIAR, N.; ESTRADA-SOLANO, F.; CAICEDO, O. M. A comprehensive survey on machine learning for networking : evolution , applications and research opportunities. Journal of Internet Services and Applications, Journal of Internet Services and Applications, v. 9, p. 16, 2018.

BUJLOW, T.; BALACHANDRAN, K.; RIAZ, T.; PEDERSEN, J. M. Volunteer-based system for classification of traffic in computer networks. In: 19th Telecommunications Forum, TELFOR 2011 - Proceedings of Papers. [S.l.]: IEEE, 2011. p. 210–213. ISBN 9781457714986.

BUJLOW, T.; CARELA-ESPAÑOL, V.; BARLET-ROS, P. Comparison of Deep Packet Inspection ( DPI ) Tools for Traffic Classification. [S.l.], 2013.

BUJLOW, T.; CARELA-ESPAÑOL, V.; BARLET-ROS, P. Independent comparison of popular DPI tools for traffic classification. Computer Networks, v. 76, p. 75–89, 1 2015. ISSN 13891286.

CALLADO, A.; KAMIENSKI, C.; SZABO, G.; GERO, B.; KELNER, J.; FERNANDES, S.; SADOK, D. A Survey on Internet Traffic Identification. IEEE Communications Surveys & Tutorials, v. 11, n. 3, p. 37–52, 2009. ISSN 1553-877X.

CALLADO, A.; KELNER, J.; SADOK, D.; KAMIENSKI, C. A.; FERNANDES, S. Better network traffic identification through the independent combination of techniques. Journal of Network and Computer Applications, v. 33, n. 4, p. 433–446, 7 2010.

CARELA-ESPAÑOL, V.; BUJLOW, T.; BARLET-ROS, P. Is Our Ground-Truth for Traffic Classification Reliable? In: Passive and Active Measurement. [S.l.]: Springer International Publishing, 2014. p. 98–108. ISBN 978-3-319-04918-2.

CATALUNYA. Traffic Classification at the Universitat Politècnica de Catalunya (UPC). 2013. Disponível online: <http://www.cba.upc.edu/monitoring/traffic-classification> (acessado em 29 de Dezembro de 2019).

CHENG, Y. R. Evolutionary Game Theoretic Multi-Objective Optimization Algorithms and Their Applications. 159 p. Tese (Doutorado) — University of Massachusetts Boston, 2017.

CISCO. Cisco Visual Networking Index Forecast. 2019. Disponível online: <https://www. cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/ white-paper-c11-741490.html> (acessado em 28 de Maio de 2019).

DAINOTTI, A.; PESCAPE, A.; CLAFFY, K. Issues and future directions in traffic classification. IEEE Network: The Magazine of Global Internetworking, v. 26, n. 1, p. 35–40, 1 2012. ISSN 0890-8044.

DIRO, A. A.; CHILAMKURTI, N. Distributed attack detection scheme using deep learning approach for Internet of Things. Future Generation Computer Systems, Elsevier B.V., v. 82, p. 761–768, 2018. ISSN 0167739X.

DIVAKARAN, D. M.; SU, L.; LIAU, Y. S.; VRIZLYNN, V. L. SLIC: Self-Learning Intelligent Classifier for network traffic. Computer Networks, v. 91, p. 283–297, 11 2015. ISSN 13891286.

DUAN, L.; XIE, M.; BAI, T.; WANG, J. A new support vector data description method for machinery fault diagnosis with unbalanced datasets. Expert Systems with Applications, Elsevier Ltd, v. 64, p. 239–246, 2016. ISSN 09574174.

ERTAM, F.; AVCı, E. A new approach for internet traffic classification: GA-WK-ELM. Measurement, v. 95, p. 135–142, 1 2017.

FADLULLAH, Z. M.; TANG, F.; MAO, B.; KATO, N.; AKASHI, O.; INOUE, T.; MIZUTANI, K. State-of-the-Art Deep Learning: Evolving Machine Intelligence Toward Tomorrow’s Intelligent Network Traffic Control Systems. IEEE Communications Surveys Tutorials, v. 19, n. 4, p. 2432–2455, 2017. ISSN 1553-877X.

FAHAD, A.; TARI, Z.; KHALIL, I.; ALMALAWI, A.; ZOMAYA, A. Y. An optimal and stable feature selection approach for traffic classification based on multi-criterion fusion. Future Generation Computer Systems, v. 36, p. 156–169, 7 2014. ISSN 0167739X.

FAYYAD, U. M.; IRANI, K. B. Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning. In: 13th International Joint Conference on Uncertainly in Artificial Intelligence (IJCAI93). [S.l.: s.n.], 1993. p. 1022–1029.

FORMAN, G.; SCHOLZ, M. Apples-to-apples in Cross-validation Studies: Pitfalls in Classifier Performance Measurement. SIGKDD Explor. Newsl., ACM, New York, NY, USA, v. 12, n. 1, p. 49–57, nov 2010. ISSN 1931-0145.

FRANK, E.; WITTEN, I. H. Generating accurate rule sets without global optimization. In: ICML. [S.l.: s.n.], 1998.

FREUND, Y.; SCHAPIRE, R. A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, v. 55, n. 1, p. 119–139, 1997. Cited By 6806.

FREUND, Y.; SCHAPIRE, R. E. Experiments with a new boosting algorithm. In: Proceedings of the Thirteenth International Conference on International Conference on Machine Learning. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 1996. (ICML’96), p. 148–156. ISBN 1-55860-419-7.

GAMULTIOBJ. MATLAB’s Multi-objective Genetic Algorithms Function. 2019. Disponível online: <https://www.mathworks.com/help/gads/gamultiobj-algorithm. html> (acessado em 26 de Maio de 2019).

GÓMEZ, S. E.; MARTÍNEZ, B. C.; SÁNCHEZ-ESGUEVILLAS, A. J.; Hernández Callejo, L. Ensemble network traffic classification: Algorithm comparison and novel ensemble scheme proposal. Computer Networks, v. 127, p. 68–80, 2017. ISSN 13891286. GRINGOLI, F.; SALGARELLI, L.; DUSI, M.; CASCARANO, N.; RISSO, F.; CLAFFY, k. c. GT: picking up the truth from the ground for internet traffic. ACM SIGCOMM Computer Communication Review, ACM, v. 39, n. 5, p. 12, 10 2009.

GUO, L.; MATTA, I. The war between mice and elephants. Proceedings Ninth International Conference on Network Protocols. ICNP 2001, p. 180–188, 2001. HAJJAR, A.; KHALIFE, J.; DÍAZ-VERDEJO, J. Network traffic application identification based on message size analysis. Journal of Network and Computer Applications, v. 58, p. 130–143, 10 2015. ISSN 10848045.

HE, H.; GARCIA, E. A. Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering, v. 21, n. 9, p. 1263–1284, 9 2009. ISSN 10414347. HINTON, G. E.; OSINDERO, S.; TEH, Y.-W. A Fast Learning Algorithm for Deep Belief Nets. Neural Computation, v. 18, n. 7, p. 1527–1554, 2006.

HOANG, D. T.; KANG, H. J. A survey on Deep Learning based bearing fault diagnosis. Neurocomputing, Elsevier B.V., 2018. ISSN 18728286.

HOLLAND, J. H. Adaptation in natural and artificial systems : an introductory analysis with applications to biology, control, and artificial intelligence. [S.l.]: MIT Press, 1975. 183 p.

HOZ, E. D. L.; HOZ, E. D. L.; ORTIZ, A.; ORTEGA, J.; MARTÍNEZ-ÁLVAREZ, A. Feature selection by multi-objective optimisation: Application to network anomaly detection by hierarchical self-organising maps. Knowledge-Based Systems, v. 71, p. 322–338, 11 2014. ISSN 09507051.

HU, L.; ZHANG, L. Real-time internet traffic identification based on decision tree. In: World Automation Congress. [S.l.]: IEEE, 2012. p. 1–3. ISBN 978-1-4673-4497-5. ISSN 2154-4824.

HUANG, G.-B.; ZHU, Q.-Y.; SIEW, C.-K. Extreme learning machine: Theory and applications. Neurocomputing, v. 70, n. 1-3, p. 489–501, 12 2006. ISSN 09252312.

HUANG, N. F.; JAI, G. Y.; CHAO, H. C.; TZANG, Y. J.; CHANG, H. Y. Application traffic classification at the early stage by characterizing application rounds. Information Sciences, v. 232, p. 130–142, 5 2013. ISSN 00200255.

HUANG, S.-Y.; HUANG, Y.-N. Network traffic anomaly detection based on growing hierarchical SOM. In: 2013 43rd Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN). [S.l.]: IEEE, 2013. p. 1–2. ISBN 978-1-4673-6472-0.

IJAZ, S.; HASHMI, F. A.; ASGHAR, S.; ALAM, M. Vector Based Genetic Algorithm to optimize predictive analysis in network security. Applied Intelligence, Applied Intelligence, p. 1–11, 2017. ISSN 15737497.

JACOBS, R. A.; JORDAN, M. I.; NOWLAN, S. J.; HINTON, G. E. Adaptive Mixtures of Local Experts. Neural Computation, MIT Press, v. 3, n. 1, p. 79–87, 2 1991.

KHALIFE, J.; HAJJAR, A.; DÍAZ-VERDEJO, J. E. A multilevel taxonomy and requirements for an optimal traffic-classification model. International Journal of Network Management, v. 24, n. 2, p. 101–120, 2014.

KOHONEN, T. The Self-Organizing Map. Proceedings of the IEEE, v. 78, n. 9, p. 1464–1480, 1990. ISSN 15582256.

KONAK, A.; COIT, D. W.; SMITH, A. E. Multi-objective optimization using genetic algorithms: A tutorial. Reliability Engineering & System Safety, v. 91, n. 9, p. 992–1007, 9 2006.

LI, D.; HU, G.; WANG, Y.; PAN, Z. Network traffic classification via non-convex multi-task feature learning. Neurocomputing, v. 152, p. 322–332, 3 2015.

LICHODZIJEWSKI, P.; HEYWOOD, M. I. Managing team-based problem solving with symbiotic bid-based genetic programming. In: Proceedings of the 10th Annual Conference on Genetic and Evolutionary Computation. New York, NY, USA: ACM, 2008. (GECCO ’08), p. 363–370. ISBN 978-1-60558-130-9.

LIN, G.-z.; XIN, Y.; NIU, X.-x.; JIANG, H.-b. Network traffic classification based on semi-supervised clustering. The Journal of China Universities of Posts and Telecommunications, v. 17, p. 84–88, 12 2010.

LIU, Z.; WANG, R.; JAPKOWICZ, N.; CAI, Y.; TANG, D.; CAI, X. Mobile app traffic flow feature extraction and selection for improving classification robustness. Journal of Network and Computer Applications, v. 125, n. February 2018, p. 190–208, 2018. ISSN 10848045.

LIU, Z.; WANG, R.; TAO, M.; CAI, X. A class-oriented feature selection approach for multi-class imbalanced network traffic datasets based on local and global metrics fusion. Neurocomputing, v. 168, p. 365–381, 6 2015. ISSN 09252312.

MARKOV, Z.; RUSSELL, I. An introduction to the weka data mining system. In: Proceedings of the 11th Annual SIGCSE Conference on Innovation and Technology in Computer Science Education. New York, NY, USA: ACM, 2006. (ITICSE ’06), p. 367–368. ISBN 1-59593-055-8.

MEGYESI, P.; SZABÓ, G.; MOLNÁR, S. User behavior based traffic emulator: A framework for generating test data for DPI tools. Computer Networks, v. 92, p. 41–54, 12 2015.

MEIDAN, Y.; BOHADANA, M.; SHABTAI, A.; GUARNIZO, J. D.; OCHOA, M.; Ole Tippenhauer, N.; ELOVICI, Y. ProfilIoT: A Machine Learning Approach for IoT Device Identification Based on Network Traffic Analysis. SAC 2017: The 32nd ACM Symposium On Applied Computing, p. 506–509, 2017.

MICHALEWICZ, Z. Genetic Algorithms + Data Structures = Evolution Programs (3rd Ed.). Berlin, Heidelberg: Springer-Verlag, 1996. ISBN 3-540-60676-9.

MITCHELL, T. M. Machine Learning. [S.l.]: McGraw-Hill, Inc., 1997. ISBN 0070428077, 9780070428072.

NAMDEV, N.; AGRAWAL, S.; SILKARI, S. Recent Advancement in Machine Learning Based Internet Traffic Classification. Procedia Computer Science, v. 60, p. 784–791, 2015. NASCIMENTO, Z.; SADOK, D. MODC: A Pareto-Optimal Optimization Approach for Network Traffic Classification Based on the Divide and Conquer Strategy. Information, v. 9, n. 9, p. 233, 2018. ISSN 2078-2489.

NASCIMENTO, Z.; SADOK, D.; FERNANDES, S. A Hybrid Model for Network Traffic Identification Based on Association Rules and Self-Organizing Maps (SOM). In: ICNS 2013, The Ninth International Conference on Networking and Services. [S.l.: s.n.], 2013. p. 213–219. ISBN 978-1-61208-256-1.

NASCIMENTO, Z.; SADOK, D.; FERNANDES, S. Comparative study of a Hybrid Model for network traffic identification and its optimization using Firefly Algorithm. In: 2013 IEEE Symposium on Computers and Communications (ISCC). [S.l.]: IEEE, 2013. p. 000862–000867. ISBN 978-1-4799-3755-4.

NASCIMENTO, Z.; SADOK, D.; FERNANDES, S.; KELNER, J. Multi-objective optimization of a hybrid model for network traffic classification by combining machine learning techniques. In: 2014 International Joint Conference on Neural Networks (IJCNN). [S.l.]: IEEE, 2014. p. 2116–2122. ISBN 978-1-4799-1484-5.

OSTASZEWSKI, M.; BOUVRY, P.; SEREDYNSKI, F. Multiobjective classification with moGEP: an application in the network traffic domain. In: Proc. of the 11th Annual conference on Genetic and evolutionary computation - GECCO ’09. [S.l.]: ACM Press, 2009. p. 635–642. ISBN 9781605583259.

PENG, L.; YANG, B.; CHEN, Y. Effective packet number for early stage internet traffic identification. Neurocomputing, v. 156, p. 252–267, 5 2015.

PENG, L.; ZHANG, H.; CHEN, Y.; YANG, B. Imbalanced traffic identification using an imbalanced data gravitation-based classification model. Comp. Comm., v. 102, p. 177–189, 5 2017.

QUINLAN, J. Improved use of continuous attributes in c4.5. Journal of Artificial Intelligence Research, v. 4, p. 77–90, 1996. Cited By 1104.

RAUBER, A.; MERKL, D.; DITTENBACH, M. The growing hierarchical self-organizing map: exploratory analysis of high-dimensional data. IEEE Transactions on Neural Networks, v. 13, n. 6, p. 1331–1341, 11 2002.

RIZZI, A.; IACOVAZZI, A.; BAIOCCHI, A.; COLABRESE, S. A low complexity real-time Internet traffic flows neuro-fuzzy classifier. Computer Networks, v. 91, p. 752–771, 11 2015.

ROJAS, R. Neural Networks: A Systematic Introduction. Berlin, Heidelberg: Springer-Verlag, 1996. ISBN 3-540-60505-3.

RUMELHART, D. E.; HINTON, G. E.; WILLIAMS, R. J. Learning representations by back-propagating errors. Nature, Nature Publishing Group, v. 323, p. 533, oct 1986. SCHMIDT, B.; AL-FUQAHA, A.; GUPTA, A.; KOUNTANIS, D. Optimizing an artificial immune system algorithm in support of flow-Based internet traffic classification. Applied Soft Computing, v. 54, p. 1–22, 5 2017.

SHI, H.; LI, H.; ZHANG, D.; CHENG, C.; WU, W. Efficient and robust feature extraction and selection for traffic classification. Computer Networks, v. 119, p. 1–16, 6 2017. ISSN 13891286.

SHI, H.; LI, H.; ZHANG, D.; CHENG, C.; CAO, X. An efficient feature generation approach based on deep learning and feature selection techniques for traffic classification. Computer Networks, Elsevier B.V., v. 132, p. 81–98, 2018. ISSN 13891286.

SINGH, H. Performance analysis of unsupervised machine learning techniques for network traffic classification. In: International Conference on Advanced Computing and Communication Technologies, ACCT. [S.l.]: IEEE, 2015. p. 401–404. ISBN 9781479984886. ISSN 23270659.

SINGH, K.; AGRAWAL, S. Performance Evaluation of Five Machine Learning Algorithms and Three Feature Selection Algorithms for IP Traffic Classification. IJCA Special Issue on Evolution in Networks and Computer Communications, n. 1, p. 25–32, 2011.

SINGH, R.; KUMAR, H.; SINGLA, R. K. An intrusion detection system using network traffic profiling and online sequential extreme learning machine. Expert Syst. App., v. 42, n. 22, p. 8609–8624, 2015. ISSN 0957-4174.

SOKOLOVA, K.; PEREZ, C.; LEMERCIER, M. Android application classification and anomaly detection with graph-based permission patterns. Decision Support Systems, v. 93, p. 62–76, 2017. ISSN 01679236.

SOYSAL, M.; SCHMIDT, E. G. Machine learning algorithms for accurate flow-based network traffic classification: Evaluation and comparison. Performance Evaluation, v. 67, n. 6, p. 451–467, 6 2010. ISSN 01665316.

SUN, G.; DONG, H.; LI, D.; XIAO, F. NTCA: a high-performance network traffic classification architecture. International Journal of Future Gen. Communication and Networking, SERSC, v. 6, n. 5, p. 11–20, 2013.

TSIROPOULOU, E. E.; PARUCHURI, S. T.; BARAS, J. S. Interest, energy and physical-aware coalition formation and resource allocation in smart IoT applications. 2017 51st Annual Conference on Information Sciences and Systems, CISS 2017, 2017. VAPNIK, V.; GOLOWICH, S. E.; SMOLA, A. J. Support vector method for function approximation, regression estimation and signal processing. In: MOZER, M. C.; JORDAN, M. I.; PETSCHE, T. (Ed.). Advances in Neural Information Processing Systems 9. [S.l.]: MIT Press, 1997. p. 281–287.

VARTOUNI, A. M.; KASHI, S. S.; TESHNEHLAB, M. An anomaly detection method to detect web attacks using Stacked Auto-Encoder. 2018 6th Iranian Joint Congress on Fuzzy and Intelligent Systems, CFIS 2018, IEEE, v. 2018-Janua, p. 131–134, 2018. WANG, R.-y.; LIU, Z.; ZHANG, L. Method of data cleaning for network traffic classification. The Journal of China Universities of Posts and Telecommunications, v. 21, n. 3, p. 35–45, 6 2014. ISSN 10058885.

WANG, Y.; KE, W.; TAO, X. A feature selection method for large-scale network traffic classification based on Spark. Information (Switzerland), v. 7, n. 1, p. 1–11, 2016. ISSN 20782489.

WANG, Y.; YAO, H.; ZHAO, S. Auto-encoder based dimensionality reduction. Neurocomputing, v. 184, p. 232–242, 2016. ISSN 0925-2312.

ZHANG, J.; CHEN, C.; XIANG, Y.; ZHOU, W.; VASILAKOS, A. V. An Effective Network Traffic Classification Method with Unknown Flow Detection. IEEE Transactions on Network and Service Management, v. 10, n. 2, p. 133–147, 6 2013.

ZHANG, J.; XIANG, Y.; ZHOU, W.; WANG, Y. Unsupervised traffic classification using flow statistical properties and {IP} packet payload. Journal of Computer and System Sciences, v. 79, n. 5, p. 573–585, 2013. ISSN 0022-0000.

ZHANG, Q.; YANG, L. T.; CHEN, Z.; LI, P. A survey on deep learning for big data. Information Fusion, Elsevier, v. 42, n. October 2017, p. 146–157, 2018. ISSN 15662535. ZHOU, W.; DONG, L.; BIC, L.; ZHOU, M.; CHEN, L. Internet traffic classification using feed-forward neural network. In: 2011 International Conference on Computational Problem-Solving (ICCP). Chengdu, China: IEEE, 2011. p. 641–646. ISBN 978-1-4577- 0603-5.

APÊNDICE A – ATRIBUTOS EXTRAÍDOS A PARTIR DE ESTATÍSTICAS DOS FLUXOS

Tabela 23 – Atributos gerados e utilizados como entrada para a fase de seleção de carac- terísticas.

Campo Descrição

Proto Protocolo da camada de transporte sTtl Valor de TTL: fonte -> destino dTtl Valor de TTL: destino -> fonte

TotPkts Total de pacotes

SrcPkts Número de pacotes: fonte -> destino DstPkts Número de pacotes: destino -> fonte

TotBytes Total em bytes

SrcBytes Total de bytes: fonte -> destino DstBytes Total de bytes: destino -> fonte

TotAppBytes Total de bytes da aplicação

SAppBytes Total de bytes da aplicação: fonte -> destino DAppBytes Total de bytes da aplicação: destino -> fonte

Load Bits por segundo

SrcLoad Bits por segundo: fonte

DstLoad Bits por segundo: destino

Loss Número de pacotes retransmitidos ou descartados SrcLoss Número de pacotes retransmitidos ou descartados da fonte DstLoss Número de pacotes retransmitidos ou descartados do destino pLoss Porcentagem de pacotes retransmitidos ou descartados SrcGap Bytes perdidos durante fluxo de dados da fonte

DstGap Bytes perdidos durante fluxo de dados do destino

Rate Pacotes por segundo

SrcRate Pacotes por segundo da fonte

DstRate Pacotes por segundo do destino SIntPkt Tempo de chegada entre pacotes na fonte SIntPktAct Tempo de chegada entre pacotes ativos na fonte SIntPktIdl Tempo de chegada entre pacotes ociosos na fonte DIntPkt Tempo de chegada entre pacotes no destino DIntPktAct Tempo de chegada entre pacotes ativos no destino DIntPktIdl Tempo de chegada entre pacotes ociosos no destino

TcpRtt Soma entre SYN-ACK e ACK

SynAck Diferença de tempo entre SYN e SYN-ACK AckDat Diferença de tempo entre SYN-ACK e ACK sMaxPktSz Tamanho máximo de um pacote transmitido pela fonte dMaxPktSz Tamanho máximo de um pacote transmitido pelo destino sMinPktSz Tamanho mínimo de um pacote transmitido pela fonte dMinPktSz Tamanho mínimo de um pacote transmitido pelo destino

Dur Duração total do fluxo

RunTime Duração total de fluxos ativos agregados Mean Média da duração de fluxos agregados Sum Soma da duração de fluxos agregados Min Duração mínima de fluxos agregados Max Duração máxima de fluxos agregados

APÊNDICE B – RESULTADOS DE 𝑅𝐹 , 𝑅𝑀 𝐹 E 𝐴𝐺𝐹 DAS VARIAÇÕES DO MODELO HÍBRIDO PROPOSTO E MELHOR SOFTWARE DPI PARA O

CONJUNTO DE DADOS 𝐶𝐷2

As tabelas presentes neste apêndice apresentam os resultados de Recall em Fluxos (𝑅𝐹 ) do modelo híbrido proposto (e suas variações), além dos resultados obtidos do melhor software DPI dentre sete softwares, obtidos de (BUJLOW; CARELA-ESPAÑOL; BARLET- ROS, 2015), para o conjunto de dados 𝐶𝐷2. A penúltima e última linha de cada tabela

contêm os resultados de Recall Médio em Fluxos (𝑅𝑀 𝐹 ) e Acurácia Global em Fluxos (𝐴𝐺𝐹 ), respectivamente, de cada classificador. Os resultados de 𝐴𝐺𝐹 do PACE não foram disponibilizados por Bujlow, Carela-Español e Barlet-Ros (2015).

Tabela 24 – Comparações de 𝑅𝐹 entre o PACE e as variações do modelo híbrido proposto para o conjunto de dados 𝐶𝐷2 (protocolos), além dos resultados de 𝑅𝑀 𝐹 e

𝐴𝐺𝐹 .

Protocolo PACE MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

DNS 99,95 96,75 95,63 99,59 99,51

HTTP 70,92 65,97 65,28 84,72 90,28

ICMP 100,00 94,63 89,76 94,63 100,00

IMAP-STARTTLS 100,00 65,71 77,14 65,71 40,00

IMAP-TLS 0,00 82,52 86,41 80,58 72,82

NETBIOS name service 99,96 99,31 98,88 99,77 99,73 NETBIOS session service 100,00 90,91 72,73 90,91 81,82 SAMBA session service 100,00 99,66 99,84 99,91 99,93

NTP 100,00 99,61 85,16 99,94 99,97 POP3-PLAIN 100,00 50,00 57,69 53,85 53,85 POP3-TLS 0,00 79,21 86,14 73,27 81,19 RTMP 0,00 66,79 72,50 80,00 82,50 SMTP-PLAIN 100,00 77,61 73,13 79,10 82,09 SMTL-TLS 0,00 73,08 73,08 65,38 65,38 SOCKSv5 78,26 90,66 95,33 95,23 96,11 SSH 93,98 94,60 97,64 99,44 99,70 Webdav 3,51 50,88 54,39 66,67 80,70 RMF 67,45 81,05 81,22 84,04 83,86 AGF - 97,73 94,52 99,56 99,65

Tabela 25 – Comparações de 𝑅𝐹 entre o PACE e as variações do modelo híbrido proposto para o conjunto de dados 𝐶𝐷2 (aplicações), além dos resultados de 𝑅𝑀 𝐹 e

𝐴𝐺𝐹 .

Aplicação PACE MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

4Shared 27,08 76,39 67,36 77,08 77,78

America’s Army 0,00 92,57 87,43 93,71 91,43

BitTorrent clients (encrypted) 78,68 78,76 78,76 85,70 82,47 BitTorrent clients (non-encrypted) 99,87 87,15 87,73 88,82 89,34

Dropbox 94,62 60,22 66,67 59,14 61,29

eDonkey clients (obfuscated) 36,06 58,67 50,11 62,48 66,37 eDonkey clients (non-obfuscated) 16,50 32,25 40,98 39,84 46,84

Freenet 79,26 45,93 77,04 37,04 61,48

FTP clients (active) 5,56 45,24 41,27 42,06 65,08 FTP clients (passive) 4,92 49,18 45,08 56,56 57,38

iTunes 77,45 59,57 59,15 64,26 57,02

League of legends 0,00 30,43 34,78 17,39 43,48

Pando Media Booster 99,45 92,02 94,93 95,69 94,88

PPLive 88,21 75,76 82,91 86,82 82,72

PPStream 79,32 67,05 69,68 75,81 80,72

RDP clients 99,69 98,94 99,40 99,64 99,43

Skype (all) 83,51 68,47 82,38 84,89 86,74

Skype (audio) 100,00 14,29 0,00 28,57 14,29

Skype (file transfer) 0,00 0,00 0,00 0,00 16,67

Skype (video) 0,00 14,29 42,86 14,29 57,14 Sopcast 66,27 57,08 63,68 67,92 66,51 Spotify 37,64 29,78 24,16 38,20 37,08 Steam 55,19 79,17 80,91 88,22 90,29 TOR 85,95 50,27 61,08 62,70 56,76 World of warcraft 27,27 22,73 13,64 13,64 18,18 RMF 53,70 55,41 58,65 59,22 64,05 AGF - 86,63 87,36 89,46 89,35

Tabela 26 – Comparações de 𝑅𝐹 entre o PACE e as variações do modelo híbrido proposto para o conjunto de dados 𝐶𝐷2 (web services), além dos resultados de 𝑅𝑀 𝐹

e 𝐴𝐺𝐹 .

Web service PACE MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

4Shared 84,69 63,27 72,45 66,33 - Amazon 58,97 36,54 37,71 33,55 - Apple 0,84 39,20 43,82 57,86 - Ask 0,00 79,53 90,64 88,30 - Bing 0,00 55,92 58,99 61,84 - Blogspot 3,83 50,64 57,02 51,49 -

Tabela 26 – Continuação da página anterior

Web service PACE MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

CNN 0,00 56,68 57,09 58,30 - Craigslist 0,00 88,83 86,59 77,65 - Cyworld 0,00 64,16 63,25 61,75 - Doubleclick 0,00 50,83 55,00 57,32 - eBay 67,97 43,77 41,28 54,09 - Facebook 80,79 35,83 44,76 47,48 - Go.com 0,00 36,12 37,61 36,72 - Google 10,79 35,85 42,00 50,04 - Instagram 88,89 22,22 22,22 11,11 - Justin.tv 0,00 52,58 65,78 72,79 - LinkedIn 77,42 45,16 40,32 29,03 - Mediafire 30,30 86,65 89,62 84,96 - MSN 0,00 40,95 42,56 42,13 - Myspace 100,00 50,00 0,00 50,00 - Pinterest 0,00 41,80 37,04 32,80 - Putlocker 0,00 46,60 55,34 46,60 - QQ.com 32,14 74,37 79,02 75,03 - Taobao 0,00 50,39 49,35 57,36 -

The huffington post 0,00 23,94 38,03 29,58 -

Tumblr 0,00 43,92 45,16 48,14 - Twitter 71,18 38,40 47,01 51,93 - Vimeo 0,00 53,44 54,20 45,80 - Vk.com 0,00 80,47 81,63 86,59 - Wikipedia 0,00 58,95 68,40 74,52 - Windows live 96,15 53,85 38,46 30,77 - Wordpress 0,00 42,60 34,32 34,91 - Yahoo 54,70 65,14 74,98 78,80 - YouTube 81,97 35,52 46,76 47,36 - RMF 27,67 51,30 52,89 53,91 - AGF - 52,24 60,29 64,18 -

APÊNDICE C – RESULTADOS DE RECALL EM BYTES (𝑅𝐵) E ACURÁCIA GLOBAL EM BYTES (𝐴𝐺𝐵) DAS VARIAÇÕES DO MODELO HÍBRIDO

PROPOSTO PARA O CONJUNTO DE DADOS 𝐶𝐷2

As tabelas presentes neste apêndice apresentam os resultados de Recall em Bytes (RB) do modelo híbrido proposto (e suas variações) para o conjunto de dados 𝐶𝐷2. A última

linha de cada tabela contém os resultados de Acurácia Global em Bytes (𝐴𝐺𝐵) de cada classificador.

Tabela 27 – Resultados de 𝑅𝐵 por classe e 𝐴𝐺𝐵 das variações do modelo híbrido proposto para o conjunto de dados 𝐶𝐷2 (protocolos).

Protocolo MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

DNS 96,17 94,57 99,38 99,37

HTTP 6,78 5,30 12,23 25,96

ICMP 90,93 81,16 90,10 100,00

IMAP-STARTTLS 68,65 68,94 56,72 34,15

IMAP-TLS 48,09 49,25 8,17 3,50

NETBIOS name service 99,27 98,61 99,72 99,71

NETBIOS session service 54,71 43,77 54,71 49,24 SAMBA session service 98,71 98,85 99,37 99,32

NTP 99,62 85,17 99,96 99,98 POP3-PLAIN 14,96 4,51 3,35 4,38 POP3-TLS 62,03 67,28 42,93 53,16 RTMP 68,12 71,59 71,85 84,82 SMTP-PLAIN 65,50 72,21 99,58 99,67 SMTL-TLS 41,40 34,84 37,86 79,93 SOCKSv5 13,93 23,69 33,21 25,41 SSH 86,45 88,55 89,36 91,80 Webdav 2,27 3,06 3,84 77,52 AGB 77,01 78,63 78,68 85,14

Tabela 28 – Resultados de 𝑅𝐵 por classe e 𝐴𝐺𝐵 das variações do modelo híbrido proposto para o conjunto de dados 𝐶𝐷2 (aplicações).

Aplicação MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

4Shared 32,88 2,99 34,42 33,76

America’s Army 51,54 97,99 92,66 86,31

BitTorrent clients (encrypted) 56,47 58,76 65,75 65,07 BitTorrent clients (non-encrypted) 73,44 72,05 78,26 78,38

Dropbox 24,95 33,11 18,13 34,93

Tabela 28 – Continuação da página anterior

Aplicação MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

eDonkey clients (obfuscated) 48,45 48,29 50,20 61,63 eDonkey clients (non-obfuscated) 27,90 33,50 15,34 27,88

Freenet 19,69 83,62 4,49 53,82

FTP clients (active) 43,73 41,00 43,34 63,04 FTP clients (passive) 57,81 62,12 69,18 77,60

iTunes 64,20 78,17 87,12 80,59

League of legends 5,21 0,89 0,61 76,86

Pando Media Booster 92,17 95,14 95,88 94,98

PPLive 57,30 84,75 86,08 81,99

PPStream 49,76 72,40 65,19 83,57

RDP clients 99,52 99,94 99,96 99,96

Skype (all) 41,07 55,84 59,15 59,87

Skype (audio) 1,41 1,41 4,74 1,41

Skype (file transfer) 0,00 0,00 0,00 0,00

Skype (video) 36,16 79,73 26,45 98,36 Sopcast 18,28 29,94 47,15 52,57 Spotify 18,87 6,98 38,18 31,35 Steam 49,21 28,66 62,21 52,95 TOR 37,97 48,91 52,75 40,33 World of warcraft 42,00 27,54 14,41 36,93 AGB 95,66 96,07 96,79 97,16

Tabela 29 – Resultados de 𝑅𝐵 por classe e 𝐴𝐺𝐵 das variações do modelo híbrido proposto para o conjunto de dados 𝐶𝐷2 (web services).

Web service MODC𝐹 𝑆 MMODC𝐹 𝑆 MODC𝐴𝐸 MMODC𝐴𝐸

Documentos relacionados