• Nenhum resultado encontrado

7.3 Processo de Seleção de Atributos

7.3.3 Avaliação de Atributos

A seleção de atributos dos fluxos de rede é fundamental para a classificação do protocolo. Nesta etapa, foram utilizadas duas ferramentas: WEKA e KEEL.

A partir do arquivo de saída gerado pela ferramenta CicFlowMeter, o arquivo foi convertido para o formato .arff, utilizado pelo WEKA. Essa conversão requer a inclusão de um cabeçalho com informações sobre os campos, atributos, e uma indicação de rótulo, referente à categoria de tupla de atributos de cada linha.

Os atributos não numéricos, atributos de identificação de endereço IP, portas de comunicação e protocolo da camada de transporte foram removidos para permitir o uso do WEKA. Esses atributos não foram utilizados no processo de classificação e, portanto, um total de 38 atributos foram utilizados na análise com os algoritmos dispo- níveis na ferramenta. A Figura 19 mostra os procedimentos aplicados nas ferramentas WEKA e KEEL para selecionar os atributos mais relevantes para classificar o tráfego destreaming de vídeo.

Figura 19 – Procedimentos para a Avaliação de Atributos

Na ferramenta WEKA foi usado o algoritmo de seleção de atributos CfsSubsetEval

(Correlation-based Feature Subset Selection) (HALL; SMITH, 1999). Este algoritmo foi utilizado para selecionar os atributos mais relevantes para a classificação do tráfego de rede, pois obteve melhores resultados nos trabalhos encontrados em na literatura (GNANAMBAL et al., 2018), (SHAFIQ; YU; WANG, 2017) e (MATHUR; RAHEJA; AH- LAWAT, 2018), e nos experimentos realizados nesta Tese. No WEKA, o algoritmo de seleção de atributos CfsSubsetEval foi utilizado com três métodos de buscaBestFirst, Evolutionary SearcheGreedyStepwis.

Para realizar uma análise comparativa com os resultados obtidos do algoritmoCfs- SubsetEval foram usados os algoritmos de seleção de atributos InfoGainAttributeEval eChiSquareAttributeEval (HALL, 1998), ambos com o método de avaliaçãoRanker.

Na Tabela 9 são apresentados os resultados da seleção dos atributos para cada avaliador utilizado, com os respectivos métodos de busca. Foram selecionados os atributos que obtiveram maior índice de pontuação em cada um dos avaliadores. Não foram considerados os atributos relacionados aos valores mínimos e aos valores máxi- mos, por exemplo, atributos tais comoPacket Length Min(Tamanho Mínimo de Pacote) ePacket Length Max (Tamanho Máximo de Pacote).

Tabela 9 – Resultados do Avaliadores na Ferramenta WEKA

Avaliador Método de Busca

Atributos

CfsSubsetEval BestFirst Bwd_Packet_Length_Std, Bwd_Header_Length, Packet_Length_Std, Bwd_Bytes/Bulk_Avg CfsSubsetEval Evolutionary

Search

Bwd_Packet_Length_Mean, Fwd_IAT_Std,

Fwd_Header_Length, Bwd_Header_Length,Packet_Length_Std, Packet_Length_Variance, Down/Up_Ratio,Average_Packet_Size,

Bwd_Segment_Size_Avg, Bwd_Bulk_Rate_Avg CfsSubsetEval Greedy

Stepwise

Bwd_Packet_Length_Std, Bwd_Header_Length, Packet_Length_Std, Bwd_Bytes/Bulk_Avg InfoGainAttibuteEval Ranker

Fwd_Header_Length,Packet_Length_Std,

Packet_Length_Variance,Average_Packet_Size,Packet_Length_Mean, Down/Up_Ratio, Bwd_Segment_Size_Avg,Bwd_Packet_Length_Mean ChiSquareAttributeEval Ranker

Fwd_Header_Length, Packet_Length_Std,

Packet_Length_Variance,Average_Packet_Size,Packet_Length_Mean, Down/Up_Ratio, Bwd_Segment_Size_Avg,Bwd_Packet_Length_Mean,

Fwd_IAT_Std, Fwd_Act_Data_Pkts,Bwd_Packet_Length_Std

Os resultados dos avaliadores apresentaram repetições de atributos nos diversos métodos aplicados. Deve-se notar que em todos os algoritmos houve seleção de atributos relacionados aos tamanhos dos pacotes, em destaque na Tabela 9. Esta constatação indicou que atributos desta natureza seriam importantes no processo de classificação.

Com base nesses resultados, um especialista em rede realizou a análise dos atri- butos. A escolha dos atributos foi baseada em valores médios, desvio padrão ou para alguns casos particulares, os valores totais. Em relação aos valores máximos e mí- nimos, os mesmos possuem muita variação. A inconsistência de tempo e valores extremos ocorrem devido à variação dos recursos da rede que podem causar atrasos variáveis nas entregas de pacotes e retransmissões/perdas de pacotes.

Outra técnica utilizada foi a filtragem baseada na ferramenta KEEL. Aplicou-se essa abordagem para validar os atributos mais relevantes para a construção das regras.

Inicialmente, foram utilizados 38 atributos extraídos dos fluxos de rede listados na Ta- bela 10. Os 38 atributos foram escolhidos a partir do não uso de atributos com valores mínimos, máximos, valores específicos para protocolos e para valores zerados. Os valores mínimos e máximos não se mostraram confiáveis devido a não representarem valores de atributos independentes aos dados gerados nos testes realizados com os algoritmos de seleção de atributos e de classificação.

Tabela 10 – Atributos Aplicados nos Algoritmos de Classificação

Atributo Descrição

Active_Mean AVG do tempo que um fluxo esteve ativo antes de ser tornar inativo Active_Std STD do tempo no qual um fluxo esteve ativo antes de ser tornar inativo Average_Packet_Size AVG do tamanho de pacotes

Bwd_Bulk_Rate_Avg AVG do número médio de rajadas em direção de BWD Bwd_BytesBulk_Avg AVG de bytes em rajadas em direção de BWD Bwd_Header_Length Total de bytes usados pelos cabeçalhos no sentido de BWD

Bwd_IAT_Mean AVG do tempo entre dois pacotes enviados em direção de BWD Bwd_IAT_Std STD entre dois pacotes enviados em direção de BWD Bwd_IAT_Total Tempo total entre dois pacotes enviados em direção de BWD Bwd_PacketBulk_Avg AVG do número de pacotes em rajadas em direção de BWD Bwd_Packet_Length_Mean AVG do tamanho de pacote em direção de BWD

Bwd_Packet_Length_Std STD do tamanho de PKT em direção de BWD Bwd_Packets/s Número de PKT por segundo no sentido de BWD Bwd_Segment_Size_Avg AVG do tamanho de PKT em direção de BWD

DownUp_Ratio Razão entre BWD e FWD

Flow_Bytes/s Número de bytes do fluxo por segundo Flow_Duration Duração do fluxo em microssegundos Flow_IAT_Mean AVG do tempo entre dois PKT enviados em um fluxo

Flow_IAT_Std STD entre dois PKT enviados em um fluxo Flow_Packets/s Número de PKT do fluxo por segundo Fwd_Act_Data_Pkts Contagem de PKT TCP sem carga em FWD Fwd_Header_Length Total de bytes usados pelos cabeçalhos no sentido de FWD

Fwd_IAT_Mean AVG do tempo entre dois PKT enviados em direção de FWD Fwd_IAT_Std STD entre dois PKT enviados em direção de FWD Fwd_IAT_Total Tempo total entre dois PKT enviados em direção de FWD Fwd_Packet_Length_Mean AVG do tamanho de PKT em direção de FWD

Fwd_Packet_Length_Std STD de tamanho de PKT em direção de FWD Fwd_Packetss Número de PKT por segundo no sentido de FWD Fwd_Segment_Size_Avg AVG do tamanho de PKT em direção de FWD

Idle_Mean AVG do tempo que um fluxo esteve inativo antes de ser tornar ativo Idle_Std STD do tempo no qual um fluxo esteve inativo antes de ser tornar ativo

Packet_Length_Mean AVG do tamanho de PKT

Packet_Length_Std STD de tamanho de pacote

Packet_Length_Variance VAR de tamanho de pacote

Total_Bwd_packets Total PKTs em BWD

Total_Fwd_Packet Total PKTs em FWD

Total_Length_of_Bwd_Packet Volume total de PKT em BWD Total_Length_of_Fwd_Packet Volume total de PKT em FWD

Legenda: Desvio Padrão (STD), Média (AVG), Pacotes (PKT), Direção deDownload(BWD), Direção deUpload(FWD), Variância (VAR)

Dos resultados dos experimentos realizados com os algoritmos CHIRW, FARCHD, FURIA e IVTURS, B, foram extraídas regras com confiança maior que 0,8 para as streaming de vídeo nos formatos VoD e Live, e também extraídos os atributos com

maior quantidade de participação significativa nas composições das regras resultantes das execuções dos algoritmos de classificação.

Foi realizado um processo de filtragem com o uso de scripts em Python para ex- trair os atributos mais usados nas regras de cada algoritmo. Assim, foram obtidos 14 atributos da primeira rodada de filtragem.

Na segunda rodada de filtragem, o processo foi refeito gerando 11 atributos com maior ocorrência na composição das regras mais confiáveis, com valores acima de 0,8. A Tabela 11 contém os 11 atributos resultantes dos processos de filtragem e dos resultados processados nas ferramentas WEKA e KEEL.

Tabela 11 – Atributos Selecionados

Atributo Descrição

Fwd Packet Length Mean Tamanho médio de pacote em direção de upload Fwd Packet Length Std Desvio padrão de tamanho de pacote em direção de upload Bwd Packet Length Mean Tamanho médio de pacote em direção de download

Bwd Packet Length Std Desvio padrão de tamanho de pacote em direção de download Flow IAT Mean Tempo médio entre dois pacotes enviados em um fluxo

Flow IAT Std Desvio padrão entre dois pacotes enviados em um fluxo Fwd IAT Mean Tempo médio entre dois pacotes enviados em direção de upload

Fwd IAT Std Desvio padrão entre dois pacotes enviados em direção de upload Bwd IAT Mean Tempo médio entre dois pacotes enviados em direção de download Packet Length Mean Tamanho médio de pacote

Packet Length Std Desvio padrão de tamanho de pacote