• Nenhum resultado encontrado

Modelo de tráfego para fluxos UDP

N/A
N/A
Protected

Academic year: 2021

Share "Modelo de tráfego para fluxos UDP"

Copied!
20
0
0

Texto

(1)

Modelo de tr´afego para fluxos UDP

Larissa O. Ostrowsky1, Nelson Luis S. da Fonseca1, C´esar Augusto Viana Melo1

1

Instituto de Computac¸˜ao – Universidade Estadual de Campinas (UNICAMP) Caixa Postal 6.176 – 13.084-971 – Campinas, SP – Brazil

{larissa.ostrowsky, nfonseca, cavneto}@ic.unicamp.br

Abstract. The UDP protocol does not implement any congestion control

mech-anism which can lead to unfair use of the available bandwidth when sharing it with TCP flows. Therefore, accurate traffic models for UDP flows are in need. This paper introduces a new traffic model for UDP flows and evaluate it via trace driven simulation. Real networks traces were used in the validation process. Results indicate that the proposed hierarchical model is adequate to represent UDP flows.

Resumo. O protocolo UDP n˜ao reage a situac¸˜oes de congestionamento da rede,

podendo provocar a inanic¸˜ao por banda passante dos fluxos gerados pelo pro-tocolo TCP. Assim, ´e essencial a adoc¸˜ao de modelos de tr´afego UDP precisos no dimensionamento dos mecanismos de controle de tr´afego. Neste artigo, um modelo de tr´afego para fluxo UDP ´e proposto e avaliado atrav´es de simulac¸˜ao com trac¸os de dados reais. Mostra-se que este modelo hier´arquico ´e adequado para a representac¸˜ao de fluxos UDP.

1. Introduc¸˜ao

Uma caracter´ıstica importante do tr´afego gerado pelo protocolo Internet Protocol (IP) ´e a existˆencia de padr˜oes “scaling”, que impacta significantemente o desempenho dos mecanismos de controle de tr´afego e que, por isto vem sendo foco de atenc¸˜ao de di-versas pesquisas [Park and Willinger 2000]. Evidˆencias da existˆencia da natureza frac-tal em longas escalas de tempo do tr´afego IP, bem como a presenc¸a de padr˜oes di-vergentes em pequenas escalas de tempo foram identificadas h´a quase uma d´ecada [Erramilli et al. 2001][Feldmann et al. 1998][Feldmann et al. 1999]. Em pequenas es-calas de tempo, o tr´afego IP ´e altamente vari´avel e a variabilidade difere das existentes em longas escalas de tempo, o que pode ser modelado precisamente por modelos multifractais [Feldmann et al. 1998][Feldmann et al. 1999].

O protocolo Transmission Control Protocol (TCP), dominante na Internet, ´e apropriado para aplicac¸˜oes que necessitam entrega confi´avel dos dados. O TCP pos-sui um mecanismo de controle de congestionamento que leva o compartilhamento da banda passante de forma equitativa entre as conex˜oes. Tal mecanismo ´e impr´oprio para aplicac¸˜oes com requisitos de tempo real, devido `a introduc¸˜ao de retardos e lim-itantes na taxa de transmiss˜ao. O aumento progressivo do uso de aplicac¸˜oes mul-tim´ıdia, que utilizam como protocolo de transporte o protocolo UDP, pode levar a reduc¸˜oes dr´asticas das taxas de transmiss˜ao das conex˜oes e injustic¸as no uso da banda passante por fluxos TCP, dado que os fluxos UDP n˜ao est˜ao sujeitos a mecanismos que reduzem a taxa de transmiss˜ao na ocorrˆencia de congestionamento. Evidˆencias

(2)

experimentais recentes apontam que o crescente uso do protocolo UDP altera consid-eravelmente a natureza “scaling” do tr´afego IP. Apesar de existirem diversos mode-los para tr´afego TCP [Altman et al. 2000][Barakat 2001][Andersen and Nielsen 1998], pouca atenc¸˜ao tem sido dada a modelagem de tr´afego UDP. Em [Hollot et al. 2003] foi apontada a necessidade preemente de modelos precisos para tr´afego UDP para que mecan-ismos de controle de tr´afego, tais como Gerenciamento Ativo de Filas (Active Queue Management) possam ser melhor avaliados.

Modelos de tr´afego que utilizam estruturas repetitivas ou hier´arquicas para gerar tr´afego pseudo-fractal est˜ao dispon´ıveis na literatura [Gong et al. 2005][Robert and Boudec 1997]. Estes modelos exploram uma estru-tura bem definida para gerar explosividade em diferentes escalas de tempo. No entanto, estes modelos n˜ao s˜ao facilmente generaliz´aveis para o caso de tr´afego multifracal, dado que em pequenas escalas de tempo a explosividade do tr´afego difere significativamente da explosividade em escalas de tempo maiores, o que n˜ao ocorre em fluxos monofractais. O presente artigo prop˜oe um modelo de tr´afego para fluxos UDP. Este ´e desen-volvido a partir da caracterizac¸˜ao das distribuic¸˜oes de trac¸os reais coletados na Internet. A abordagem utilizada para se derivar o modelo ´e essencialmente experimental, ou seja, ao inv´es de se construir um modelo a partir das regras de funcionamento do protocolo, o modelo ´e derivado a partir da caracterizac¸˜ao das diversas distribuic¸˜oes estat´ısticas iden-tificadas em trac¸os de tr´afego real. Neste artigo, ´e proposto um modelo hier´arquico com seis estados. Optou-se pela derivac¸˜ao do modelo a partir da caracterizac¸˜ao de trac¸os reais, pois estes levam a conclus˜oes mais realistas em estudos de controle de tr´afego em redes. N˜ao ´e de conhecimento dos autores a existˆencia de modelos de tr´afego UDP baseados em trac¸os reais.

A validac¸˜ao do modelo proposto foi realizada atrav´es da comparac¸˜ao dos resulta-dos obtiresulta-dos em simulac¸˜oes da dinˆamica de uma fila alimentada por trac¸os reais de fluxo UDP e de uma fila alimentada por seus respectivos trac¸os sint´eticos gerados pelo mod-elo. O modelo proposto foi comparado com outros modelos com diferentes n´umeros de estados. Mostra-se que um n´umero de estados igual a seis leva a uma avaliac¸˜ao satisfato-riamente precisa do tamanho da fila e da probabilidade de perda, que ´e uma das principais m´etricas de interesse em diferentes estudos de mecanismos de controle de tr´afego. Al´em da comparac¸˜ao mencionada, mostra-se que o tr´afego gerado pelo modelo com seis esta-dos reproduz com relativa precis˜ao as correlac¸˜oes do tr´afego UDP atrav´es da analise do diagrama A-V. Os resultados obtidos nos experimentos realizados indicam que o modelo proposto pode ser utilizado em estudos que englobam tr´afego UDP, produzindo resultados precisos com uma pequena margem de erros.

O restante deste artigo est´a organizado da seguinte forma: a Sec¸˜ao 2 descreve a obtenc¸˜ao e an´alise dos trac¸os selecionados para o estudo. A Sec¸˜ao 3 apresenta a an´alise da existˆencia de multifractalidade no tr´afego UDP. A Sec¸˜ao 4 mostra o processo de mod-elagem do fluxo UDP adotado, a metodologia utilizada, a an´alise das distribuic¸˜oes dos trac¸os reais e a validac¸˜ao do modelo proposto. A Sec¸˜ao 5 apresenta as conclus˜oes.

2. Descric¸˜ao dos trac¸os utilizados

Para propor um modelo realista de tr´afego para fontes UDP, analisou-se o tr´afego cole-tado em redes operacionais. Para tanto, foram utilizados trac¸os de dados reais obtidos do

(3)

Arquivo contendo trac¸o Hor´ario da coleta Quantidade pacotes IP Quant. pacotes UDP Local

BWY-1069762448-1.tsh 25-Nov-2003 04:49 1186822 208076 Columbia University BWY-1069224416-1.tsh 18-Nov-2003 23:43 2025369 346129 Columbia University COS-1069211539-1.tsh 18-Nov-2003 19:50 1733491 149996 Colorado State Univ. MEM-1069179750-1.tsh 18-Nov-2003 17:29 358145 18475 University of Memphis BWY-1069127950-1.tsh 17-Nov-2003 20:39 2408114 395447 Columbia University COS-1069116895-1.tsh 17-Nov-2003 17:33 790717 57722 Colorado State Univ. COS-1068122223-1.tsh 06-Nov-2003 04:58 1479932 133677 Colorado State Univ. BWY-1067990742-1.tsh 04-Nov-2003 16:33 2159408 338999 Columbia University COS-1067981073-1.tsh 04-Nov-2003 14:45 2374287 130002 Colorado State Univ. APN-1067980536-1.tsh 04-Nov-2003 14:03 3028991 189898 APAN at STARTAP

Tabela 1. Tabela com informac¸ ˜oes dos trac¸os escolhidos

projeto de pesquisa PMA (The NLANR Passive Measurement and Analysis Project), que disponibiliza em seu WEB site dezenas de trac¸os por dia, provenientes de 12 pontos de coleta em diversas partes do mundo [NLANR 2005]. Para garantir a generalidade do es-tudo, foram escolhidas cinco datas, dez hor´arios e quatro sites aleatoriamente (Tabela 1). Os trac¸os brutos foram processados com a Ferramenta CAIDA Coralreef [Coralreef 2005] e com programas em C++ desenvolvidos pelos autores, permitindo a extrac¸˜ao do hor´ario de chegada (com precis˜ao em microsegundos), protocolo IP e tamanho (em bytes) de cada pacote do trac¸o. O fluxo UDP e o fluxo TCP de cada trac¸o IP selecionado para este estudo foram isolados e constitu´ıram dois novos trac¸os.

Deve-se observar que a percentagem t´ıpica do volume de tr´afego UDP nos trac¸os analisados ´e de 20%. Apenas 10% do tr´afego total corresponde ao protocolo HTTP. Os 70% restantes correspodem a aplicac¸˜oes que utilizam TCP, sendo que a maioria utiliza portas altas (not well known). Tal constatac¸˜ao evidencia a constante mudanc¸a do tr´afego da Internet que no passado era majoritariamente HTTP.

Todos os trac¸os da Tabela (Tabela 1) foram analisados, mas os autores optaram por mostrar neste artigo resultados obtidos com o trac¸o BWY-1069762448. Os autores acreditam que reproduzir os resultados obtidos com os demais trac¸os seria repetitivo e levaria a um texto desnecessariamente cansativo, n˜ao alterando as conclus˜oes e resultados descritos ao longo do artigo. No entanto, para evidenciar que o estudo descrito aqui foi realizado para todos os trac¸os mencionados, gr´aficos de probabilidade de perda s˜ao mostrados para os trac¸os BWY-1069762448 e BWY-1069224416.

3. Multifratalidade do tr´afego UDP

Estudos anteriores mostraram que o tr´afego da Internet possui natureza multi-fractal [Feldmann et al. 1998][Feldmann et al. 1999]. Para verificar se os trac¸os da Tabela 1 apresentam multifractalidade, ferramentas baseadas em wavelets [Veitch and Abry 2005][Abry and Veitch 1998], que fornecem estimadores e intervalos de confianc¸a precisos para o espectro multifractal, foram utilizadas para a an´alise do padr˜ao scaling e da multifractalidade.

A Figura 1 apresenta os diagramas obtidos na an´alise de todos os pacotes IP do trac¸o BWY-1069762448. Foram utilizados momentos de q iguais a 0.5, 1, 2, 3, 4 e 5. Separou-se os datagramas contendo segmentos TCP dos datagramas contendo segmentos UDP, formando assim, dois novos trac¸os. A Figura 2(a) mostra o diagrama da an´alise do fluxo TCP e a Figura 2(b) o diagrama da an´alise do fluxo UDP.

(4)

0 2 4 0 0.5 1 1.5 Multiscale Diagram: (j 1,j2) = (1, 3) q ζq 0 2 4 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55

Linear Multiscale Diagram: h

q=ζq / q

q hq

Figura 1. DM e DML do trac¸o BWY-1069762448 para o tr ´afego agregado IP.

0 2 4 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Multiscale Diagram: (j 1,j2) = (1, 3) q ζq 0 2 4 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55

Linear Multiscale Diagram: h

q=ζq / q q h q (a) 0 2 4 0 0.5 1 1.5 Multiscale Diagram: (j 1,j2) = (1, 3) q ζq 0 2 4 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6

Linear Multiscale Diagram: h

q=ζq / q

q h

q

(b)

Figura 2. DM e DML do trac¸o BWY-1069762448 para o fluxo TCP (a) e para o fluxo UDP (b).

nos Diagramas Multiscale Lineares evidenciam a natureza multifractal dos trˆes tr´afegos (IP, TCP e UDP). O resultado foi semelhante para todos os outros trac¸os analisados. Nota-se que apesar do tr´afego UDP repreNota-sentar 17.5% do tr´afego IP neste trac¸o, o diagrama DML do tr´afego UDP possui forma semelhante ao diagrama do tr´afego IP, especialmente at´e q = 3.

Os gr´aficos da parte superior da Figura 3 mostram os trac¸os brutos do tr´afego IP, TCP e UDP do trac¸o BWY-1069762448, respectivamente. A func¸˜ao de H¨older do tr´afego IP, TCP e UDP do mesmo trac¸o foi computada de acordo com o procedimento descrito em [Cavanaugh et al. 2003] e ´e apresentada nos gr´aficos da parte inferior da Figura 3. A natureza altamente vari´avel do valor da func¸˜ao de H¨older ´e uma evidˆencia adicional da natureza multifractal deste trac¸o.

4. Modelo de tr´afego UDP

O estudo para derivar um modelo de tr´afego UDP consistiu em isolar o fluxo UDP do fluxo TCP nos trac¸os IP e a partir destes novos trac¸os caracterizar a distribuic¸˜ao do tempo

(5)

0 2 4 6 x 104 0 0.5 1 1.5 2 2.5 3 3.5x 10 4 tempo (x1ms)

Quantidade de tráfego (bytes)

0 2 4 6 x 104 0 0.5 1 1.5 2 2.5 3 3.5x 10 4 tempo (x1ms)

Quantidade de tráfego (bytes)

0 2 4 6 x 104 0 0.5 1 1.5 2 2.5 3 3.5x 10 4 tempo (x1ms)

Quantidade de tráfego (bytes)

0 1 2 3 4 5 6 x 104 0 0.2 0.4 0.6 0.8 1 tempo (x1ms)

Valor de Hölder estimado

0 2 4 6 x 104 0 0.2 0.4 0.6 0.8 1 tempo (x1ms)

Valor de Hölder estimado

0 2 4 6 x 104 0 0.2 0.4 0.6 0.8 1 tempo (x1ms)

Valor de Hölder estimado

IP IP TCP TCP UDP UDP

Traço bruto − BWY−1069762448

Função de Hölder − BWY−1069762448

Figura 3. Trac¸o bruto e func¸ ˜ao de H ¨older do trac¸o BWY-1069762448 (IP, TCP, UDP).

entre chegadas e a distribuic¸˜ao do tamanho de pacotes, atrav´es da an´alise estat´ıstica dos dados.

4.1. Metodologia utilizada

A metolologia utilizada para derivar o modelo de tr´afego UDP engloba os seguintes pas-sos:

1. Separac¸˜ao dos pacotes UDP dos trac¸os IP selecionados;

2. Avaliac¸˜ao da distribuic¸˜ao mais adequada para a diferenc¸a de tempo entre as chegadas dos pacotes;

3. Avaliac¸˜ao da distribuic¸˜ao mais adequada para os tamanhos dos pacotes;

4. Derivac¸˜ao do modelo a partir das distribuic¸˜oes e respcetivos valores das es-tat´ısticas identificadas nos trac¸os reais;

5. Gerac¸˜ao de trac¸o sint´etico a partir do modelo proposto;

6. Verificac¸˜ao da validade do tr´afego gerado sinteticamente a partir da simulac¸˜ao de um sistema de filas. A simulac¸˜ao consiste em reproduzir dois sistemas de filas: um cuja entrada ´e o trac¸o real e outro cuja entrada ´e o trac¸o gerado sinteticamente. As demais caracter´ısticas dos dois sistemas de filas s˜ao idˆenticas. A validac¸˜ao do modelo ´e realizada atrav´es da comparac¸˜ao da semelhanc¸a da dinˆamica dos dois sistemas de filas.

4.2. Derivac¸˜ao do modelo com seis estados

Para a verificac¸˜ao das distribuic¸˜oes que melhor representam os tamanhos dos pacotes e dos tempos entre chegadas dos mesmos, utilizou-se o software estat´ıstico SAS e o soft-ware Matlab.

(6)

Foram realizados no software SAS e no software Matlab, testes de hip´otese de Kolmogorov-Smirnov com n´ıvel de significˆancia igual a 0.01 para diversas distribuic¸˜oes, dentre elas: Beta, Exponencial, Gama, Lognormal, Normal, Weibull e Pareto.

A distribuic¸˜ao que representa os tamanhos dos pacotes apresentou uma carac-ter´ıstica bimodal, como pode ser observado na Figura 4. A caraccarac-ter´ıstica bimodal deve-se ao fato dos pacotes do tr´afego UDP pertencerem a diferentes aplicac¸˜oes. Algumas destas aplicac¸˜oes geram pacotes pequenos e outras pacotes grandes. Apesar do resultado dos testes de hip´otese apontar que a curva de melhor ajuste para a distribuic¸˜ao dos tamanhos dos pacotes ´e a da distribuic¸˜ao Beta, nenhuma das distribuic¸˜oes unimodais investigadas obteve aceitac¸˜ao da hip´otese nos testes de hip´otese. O eixo vertical representa a quan-tidade de pacotes cujo tamanho est´a representado no eixo horizontal. Como pode ser percebido na Figura 4, os dois picos da distribuic¸˜ao bimodal encontram-se ao redor dos tamanhos de pacotes 120 bytes e 1320 bytes.

Figura 4. Distribuic¸ ˜ao dos tamanhos dos pacotes UDP (trac¸o BWY-1069762448). Dada a caracter´ıstica bimodal da distribuic¸˜ao dos tamanhos de pacotes e con-siderando que tais distribuic¸˜oes s˜ao de dif´ıcil caracterizac¸˜ao e uso, criou-se inicialmente dois estados, onde cada estado representa uma das duas regi˜oes da distribuic¸˜ao dos taman-hos de pacotes.

Nestes dois estados, considerou-se o estado um para os pacotes com tamanho menor que 750 bytes, e o estado dois para os pacotes com tamanho maior que 750 bytes. A divis˜ao foi feita em 750 bytes por ser aproximadamente a m´edia dos tamanhos dos pacotes e por permitir que cada estado pudesse ser caracterizado por uma distribuic¸˜ao unimodal distinta.

Realizando novamente os testes de hip´otese das distribuic¸˜oes para os trac¸os obti-dos a partir da separac¸˜ao do trac¸o original em trac¸os contendo pacotes com tamanhos menores e tamanhos maiores que 750 bytes, obteve-se que a distribuic¸˜ao que mais se adequa aos tamanhos dos pacotes ´e a distribuic¸˜ao Beta, tanto para o estado um (Figura 5) quanto para o estado dois (Figura 6), por´em com diferentes valores dos parˆametros estat´ısticos.

(7)

Figura 5. Teste de hip ´otese da distribuic¸ ˜ao Beta para tamanhos de pacotes UDP menores que 750 bytes - estado um (trac¸o BWY-1069762448).

Foram calculadas as diferenc¸as de tempo entre as chegadas dos pacotes em cada um destes dois estados separadamente. Atrav´es dos testes de hip´otese, verificou-se que as distribuic¸˜oes que melhor descrevem as diferenc¸as de tempo entre as chegadas suces-sivas do estado um (Figura 7) e do estado dois (Figura 8) s˜ao as distribuic¸˜oes Weibull e Exponencial.

Os tempos de permanˆencia em cada estado foram tamb´em caracterizados. Foram calculadas as durac¸˜oes em que chegam continuamente apenas pacotes com tamanho at´e 750 bytes, e as durac¸˜oes em que chegam continuamente apenas pacotes com tamanho maior que 750 bytes. Foi verificada a existˆencia de duas regi˜oes distintas na an´alise dos gr´aficos da Figura 9 e 10 que apresentam as distribuic¸˜oes dos tempos de permanˆencia nos estados um e dois respectivamente. Pode-se observar na Figura 9, que representa os tem-pos de permanˆencia no estado um, que para pequenos temtem-pos de permanˆencia, ou seja, tempos de permanˆencia menores que aproximadamente 0.00128 segundos, a distribuic¸˜ao pode ser representada por uma distribuic¸˜ao Uniforme, enquanto que para valores maiores a distribuic¸˜ao pode ser caracterizada tanto pela Exponencial quanto pela Weibull. A mesma observac¸˜ao ´e v´alida para os tempos de permanˆencia no estado dois (Figura 10), por´em o valor de corte para este estado ´e aproximadamente 0.00075 segundos. Testes estat´ısticos confirmam as hip´oteses de distribuic¸˜ao Uniforme e de distribuic¸˜ao Exponen-cial e Weibull, respectivamente, para regi˜ao com pequenos tempos de permanˆencia e para regi˜ao com valores maiores. Quatro estados adicionais foram inseridos no modelo, cada um representando uma destas regi˜oes. Deve-se observar que a quebra da distribuic¸˜ao do tempo de permanˆencia nos estados em duas regi˜oes foi motivada pela constatac¸˜ao de que a adoc¸˜ao de uma ´unica distribuic¸˜ao leva a resultados imprecisos. Em outras palavras, em uma etapa anterior a quebra da distribuic¸˜ao do tempo de permanˆencia em duas regi˜oes, adotou-se uma ´unica distribuic¸˜ao (Exponencial/Weibull) e o modelo resultante n˜ao foi capaz de gerar resultados precisos.

(8)

Figura 6. Teste de hip ´otese da distribuic¸ ˜ao Beta para tamanhos de pacotes UDP maiores que 750 bytes - estado dois (trac¸o BWY-1069762448).

com tamanho menor que 750 bytes e o estado dois os pacotes com tamanho maior que 750 bytes. Os estados trˆes e quatro representam os tempos de permanˆencia no estado um que s˜ao menores e maiores que 0.00128 segundos respectivamente. Finalmente, os estados

cinco e seis representam tempos de permanˆencia no estado dois que s˜ao, respectivamente,

menores e maiores que 0.00075 segundos.

4.3. Gerador de tr´afego para o modelo com seis estados

Tendo sido caracterizadas as distribuic¸˜oes dos tamanhos dos pacotes, dos tempos en-tre chegadas e das permanˆencias em cada estado, desenvolveu-se um gerador de trac¸os sint´eticos para o tr´afego UDP. Para tanto, os parˆametros estat´ısticos de cada distribuic¸˜ao e de cada trac¸o foram obtidos a partir dos trac¸os reais. Os procedimentos Exprnd, Weibrnd e Betarnd, embutidos no Matlab, foram utilizados na gerac¸˜ao de amostras aleat´orias de acordo com as func¸˜oes de distribuic¸˜ao escolhidas e com os parˆametros estimados acima.

Foi desenvolvido no Matlab uma func¸˜ao com o objetivo de gerar trac¸os sint´eticos semelhantes aos trac¸os reais coletados. Como as distribuic¸˜oes Weibull e Exponencial se ajustaram satisfatoriamente nos testes de hip´otese para as diferenc¸as de tempo entre as chegadas e para os tempos de permanˆencia nos estados um e dois, foram gerados trac¸os com ambas distribuic¸˜oes para poder comparar qual distribuic¸˜ao leva a modelos mais pre-cisos.

4.4. Modelos com dois estados e modelo com dez estados

Ao longo do estudo que culminou na adoc¸˜ao de um modelo com seis estados, outros mo-delos foram testados. Momo-delos estes que diferem pelo n´umero de estados adotados. Obvi-amente, busca-se o modelo mais preciso que tenha o menor n´umero de estados poss´ıveis. A seguir s˜ao descritos dois modelos estudados, um com dois estados e o outro com dez estados. O fato do n´umero de estados crescer em intervalos de quatro em quatro deve-se ao fato de se “quebrar” em duas regi˜oes as poss´ıveis distribuic¸˜oes envolvidas (tempo de permanˆencia, tamanho de pacote e tempo entre chegadas).

(9)

Figura 7. Teste de hip ´otese da distribuic¸ ˜ao Weibull e Exponencial para as diferenc¸as de tempo entre as chegadas dos pacotes do estado um (trac¸o BWY-1069762448).

O novo modelo com dois estados possui somente o estado um contendo os pacotes com tamanhos menores que 750 bytes e o estado dois contendo os pacotes com tamanhos maiores que 750 bytes. A distribuic¸˜ao dos tempos de permanˆencia nos estados foi descrita somente pela distribuic¸˜ao Exponencial/Weibull. A distribuic¸˜ao que descreve os diferenc¸as entre chegadas dos pacotes nos estados um e dois permanece a mesma.

Um modelo com dez estados foi tamb´em desenvolvido. Este modelo possui os mesmos estados que foram definidos no modelo com seis estados, adicionado de mais quatro estados que caracterizam as diferenc¸as de tempo entre as chegadas dos pacotes de maneira diferente do modelo com seis e dois estados. Pode-se observar na Figura 7, que para pequenos intervalos entre chegadas, intervalos menores que aproximadamente 0.00027 segundos, as diferenc¸as de tempo entre chegadas podem ser representadas por uma distribuic¸˜ao Uniforme, enquanto que as diferenc¸as maiores entre as chegadas s˜ao melhor caracterizadas pela distribuic¸˜ao Exponencial/Weibull. A mesma observac¸˜ao ´e v´alida para o tempo entre chegadas do estado dois (Figura 8), por´em com valor de corte igual a aproximadamente 0.00015 segundos. Testes estat´ısticos confirmam as hip´oteses de distribuic¸˜ao Uniforme e da distribuic¸˜ao Exponencial/Weibull. Logo, os estados sete e oito representam as diferenc¸as de tempo entre chegadas dos pacotes do estado um que s˜ao menores e maiores que 0.00027 segundos respectivamente, e os estados nove e dez representam as diferenc¸as de tempo entre chegadas dos pacotes do estado dois que s˜ao menores e maiores que 0.00015 segundos respectivamente.

4.5. Validac¸˜ao dos modelos

Para a validac¸˜ao dos modelos, foi implementado um programa em C++ que simula o funcionamento de uma fila alimentada por um fluxo de dados. Em um sistema com buffer infinito, o programa verifica a cada intervalo de tamanho fixo, a quantidade de bytes que chegam e subtrai deste valor a quantidade de bytes servidos no intervalo, resultando no incremento do tamanho da fila de espera no intervalo. Em um sistema com buffer finito o tamanho da fila de espera tem um limite, e a quantidade dos bytes recebidos mais a

(10)

Figura 8. Teste de hip ´otese da distribuic¸ ˜ao Weibull e Exponencial para as diferenc¸as de tempo entre as chegadas dos pacotes do estado dois (trac¸o BWY-1069762448).

quantidade dos bytes na fila que excedem o tamanho do buffer mais a quantidade de bytes servidos no intervalo corresponde a perda no intervalo. A sa´ıda do simulador ´e o tamanho m´edio da fila de espera para um sistema com buffer infinito, e a probabilidade de perda para filas com tamanhos finitos. Alimenta-se o simulador ora com trac¸o real ora com trac¸o sint´etico, por´em o n´umero de pacotes ´e sempre o mesmo, seja o trac¸o sint´etico ou real. Os pacotes do processo de chegada foram agregados em intervalos fixos de 0.001 segundo.

Em uma primeira etapa foi feita a simulac¸˜ao para os trac¸os reais e para seus respec-tivos trac¸os sint´eticos utilizando uma fila com buffer infinito. Os resultados obtidos nas simulac¸˜oes foram semelhantes tanto para os trac¸os sint´eticos que usaram a distribuic¸˜ao Exponencial para a gerac¸˜ao das diferenc¸as de tempo entre as chegadas e para os tem-pos de permanˆencia nos estados um e dois, quanto para os trac¸os sint´eticos que usaram a distribuic¸˜ao Weibull para a gerac¸˜ao das mesmas distribuic¸˜oes. Dada a caracter´ıstica

mem-oryless da distribuic¸˜ao Exponencial, preferiu-se adotar um modelo com esta distribuic¸˜ao.

Nas Figuras 12 e 13 as curvas correspondem aos tamanhos m´edios da fila de espera das simulac¸˜oes quando o sistema de filas ´e alimentado pelo tr´afego real e pelos trac¸os sint´eticos gerados pelos modelos com dois, seis e dez estados do trac¸o BWY-1069762448 e do trac¸o real BWY-1069224416, respectivamente, com valores de utilizac¸˜ao variando entre 0.02 e 0.8. Note que, para a variar os valores de utilizac¸˜ao, a taxa m´edia de servic¸o utilizada na simulac¸˜ao foi a obtida atrav´es da divis˜ao da taxa m´edia de chegada pelo valor de utilizac¸˜ao desejado. Os tamanhos m´edios das filas quando se utiliza o trac¸o sint´etico gerado pelo modelo com dois estados s˜ao bem menores que os tamanhos m´edios das filas de espera quando se utiliza o trac¸o real. Isto acontece porque o modelo com dois estados n˜ao reproduz com precis˜ao a distribuic¸˜ao dos tempos de permanˆencia nos estados um e

dois, e as rajadas de pacotes s˜ao menores no tr´afego sint´etico do que no tr´afego real. As

filas produzidas quando se usam os modelos com seis e dez estados s˜ao maiores que as produzidas quando se usa o trac¸o real. Isto se deve ao fato dos modelos hier´arquicos com seis e dez estados reproduzirem mais fielmente os momentos de ordem superior dos

(11)

Figura 9. Teste de hip ´otese da distribuic¸ ˜ao Weibull e Exponencial para os tempos de perman ˆencia no estado um (trac¸o BWY-1069762448).

trac¸os reais, o que n˜ao ´e poss´ıvel com o modelo de dois estados. Em situac¸˜oes de carga intensa, quando s˜ao usados os trac¸os sint´eticos gerados pelos modelos com seis e dez estados a freq¨uˆencia de rajadas ´e maior do que quando ´e usado o trac¸o real, fazendo com que os tamanhos das filas sejam maiores, dado que estes modelos reproduzem melhor as dependˆencias de longa durac¸˜ao. A curva dos tamanhos m´edios da fila de espera do trac¸o sint´etico gerado pelo modelo com seis estados ´e mais pr´oxima da curva do trac¸o real, mostrando que o modelo com seis estados al´em de ser menos complexo que o modelo com dez estados ´e tamb´em mais preciso.

Para avaliac¸˜ao da probabilidade de perda, variou-se o tamanho do buffer de 10+2 at´e 10+5

bytes. As Figuras 14, 15 e 16 mostram as perdas nas simulac¸˜oes do trac¸o BWY-1069762448 real e dos trac¸os sint´eticos correspondentes, para n´ıveis de utilizac¸˜ao iguais a 0.5, 0.7 e 0.9 respectivamente. Para tamanhos de buffers pequenos, as correlac¸˜oes de or-dem superior s˜ao filtradas, e conseq¨uentemente o modelo com dois estados ´e mais preciso. No entanto, quando se aumenta o tamanho do buffer um maior n´umero de correlac¸˜oes n˜ao s˜ao filtradas e o modelo com dois estados torna-se bastante impreciso. Considerando o modelo com dois estados, as probabilidades de perda geradas com trac¸os sint´eticos s˜ao menores do que as do trac¸o real, o que ´e indesej´avel para provis˜ao de Qualidade de Servic¸o. Na realidade, o modelo com dois estados subestima a probabilidade de perda. J´a a probabilidade de perda produzida pelo uso dos trac¸os sint´eticos gerados pelos mod-elos com seis e dez estados superestima a real, o que ´e desejado pois, assim, assegura-se que os requisitos de Qualidade de Servic¸o ser˜ao garantidos. Al´em disto, a discrepˆancia entre as probabilidades de perda ´e menor que uma ordem de grandeza, o que n˜ao leva a um grande desperd´ıcio de banda de recursos na alocac¸˜ao de banda passante. Em outras palavras, qualquer modelo aproximado gera imprecis˜oes; o que se deve avaliar ´e a con-seq¨uˆencia destas imprecis˜oes. No caso espec´ıfico do modelo com seis estados, o erro ´e menor que uma ordem de grandeza, o que n˜ao leva a desperd´ıdios significativos de banda passante. Por outro lado, o modelo deve superestimar a probabilidade de perda, pois caso contr´ario n˜ao pode ser utilizado para se garantir Qualidade de Servic¸o. Al´em disso, o

(12)

Figura 10. Teste de hip ´otese da distribuic¸ ˜ao Weibull e Exponencial para os tem-pos de perman ˆencia no estado dois (trac¸o BWY-1069762448).

Figura 11. Diagrama dos seis estados.

modelo com seis estados mostrou-se mais que preciso que o modelo com dez estados para as probabilidades de perda dos pacotes.

As Figuras 14 a 19 mostram as probabilidades de perdas para os trac¸os BWY-1069762448 e BWY-1069224416. Fica claro a melhor precis˜ao do modelo com seis estados quando comparado aos modelos com dois e com dez estados.

(13)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 utilização

tamanho médio da fila (bytes)

Traço BWY− 1069762448

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 12. Tamanhos m ´edios das filas de espera das simulac¸ ˜oes do trac¸o real e dos trac¸os sint ´eticos gerados pelo modelo com dois, seis e dez estados do trac¸o BWY-1069762448, variando o valor de utilizac¸ ˜ao.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 0.5 1 1.5 2 2.5 3x 10 4 utilização

tamanho médio da fila (bytes)

Traço BWY−1069224416

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 13. Tamanhos m ´edios das filas de espera das simulac¸ ˜oes do trac¸o real e dos trac¸os sint ´eticos gerados pelo modelo com dois, seis e dez estados do trac¸o BWY-1069224416, variando o valor de utilizac¸ ˜ao.

(14)

102 103 104 105 10−5 10−4 10−3 10−2 10−1 100

Traço BWY− 1069762448, Utilização = 0.5

tamanho do buffer (bytes)

probabilidade de perda

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 14. Gr ´aficos das perdas das simulac¸ ˜oes do trac¸o BWY-1069762448 e dos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez esta-dos, com utilizac¸ ˜ao igual a 0.5

102 103 104 105 10−5 10−4 10−3 10−2 10−1 100

Traço BWY− 1069762448, Utilização = 0.7

tamanho do buffer (bytes)

probabilidade de perda

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 15. Gr ´aficos das perdas das simulac¸ ˜oes do trac¸o BWY-1069762448 e dos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez esta-dos, com utilizac¸ ˜ao igual a 0.7

(15)

102 103 104 105 10−2

10−1 100

Traço BWY− 1069762448, Utilização = 0.9

tamanho do buffer (bytes)

probabilidade de perda

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 16. Gr ´aficos das perdas das simulac¸ ˜oes do trac¸o BWY-1069762448 e dos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez esta-dos, com utilizac¸ ˜ao igual a 0.9

102 103 104 105 10−4 10−3 10−2 10−1 100

tamanho do buffer (bytes)

probabilidade de perda

Traço BWY−1069224416, Utilização = 0.5

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 17. Gr ´aficos das perdas das simulac¸ ˜oes do trac¸o BWY-1069224416 e dos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez esta-dos, com utilizac¸ ˜ao igual a 0.5

(16)

102 103 104 105 10−5 10−4 10−3 10−2 10−1 100

tamanho do buffer (bytes)

probabilidade de perda

Traço BWY−1069224416, Utilização = 0.7

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 18. Gr ´aficos das perdas das simulac¸ ˜oes do trac¸o BWY-1069224416 e dos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez esta-dos, com utilizac¸ ˜ao igual a 0.7

102 103 104 105

10−3 10−2 10−1 100

tamanho do buffer (bytes)

probabilidade de perda

Traço BWY−1069224416, Utilização = 0.9

traço real

traço sintético, 2 estados traço sintético, 6 estados traço sintético, 10 estados

Figura 19. Gr ´aficos das perdas das simulac¸ ˜oes do trac¸o BWY-1069224416 e dos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez esta-dos, com utilizac¸ ˜ao igual a 0.9

(17)

Foram calculadas as m´edias e variˆancias das quantidades de bytes que chegam a cada segundo nos trac¸os estudados. A Figura 20 cont´em o Boxplot destes valores para o trac¸o real BWY-1069762448 e para os trac¸os sint´eticos gerados pelos modelos com dois, seis e dez estados. As m´edias do trac¸o gerado pelo modelo com seis estados n˜ao apresentam diferenc¸as estatisticamente significantes com n´ıvel de significˆancia de 5% quando comparadas `as m´edias do trac¸o real (teste t-student, estat´ıstica do teste 1.84, p-valor 0.067, 171 graus de liberdade). Quando comparadas as m´edias do trac¸o gerado pelo modelo com dez estados com as m´edias do trac¸o real, o teste t-student aceita a hip´otese tamb´em (estat´ıstica do teste 1.30, p-valor 0.195, 181 graus de liberdade), ao contr´ario do teste realizado para o trac¸o gerado pelo modelo com dois estados, onde o teste t-student rejeita a hip´otese (estat´ıstica do teste -5.97, p-valor 0.000, 162 graus de liberdade).

Figura 20. Boxplot das quantidades de bytes que chegam a cada segundo no trac¸o real BWY-1069762448 e nos respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez estados

Simulac¸˜oes foram realizadas utilizando o Network Simulator 2 (NS-2). Foi ado-tada uma topologia simples: dois n´os entre um roteador, onde o primeiro n´o ´e alimentado pelo trac¸o real ou pelo trac¸o sint´etico. As simulac¸˜oes foram feitas utilizando a fila RED e foram avaliadas sob condic¸˜oes de tr´afego variadas, com valores de utilizac¸˜ao iguais a 0.5, 0.7 e 0.9. As filas foram configuradas com tamanho entre 10 e 600 pacotes, sendo o tamanho m´edio do pacote UDP no trac¸o BWY-1069762448 igual a 366 bytes. Os parˆametros utilizados para RED foram: limiar m´ınimo (thresh) = 1 pacote; limiar m´aximo (maxthresh) = tamanho m´aximo da fila em pacotes; probabilidade m´axima de descarte antecipado (linterm) = 1; peso do tamanho instantˆaneo no tamanho m´edio da fila (q weight) = 0.002. O motivo de incluir RED na comparac¸˜ao ´e sua popularidade a adoc¸˜ao como padr˜ao. No entanto, a sua caracter´ıstica de descartar antecipadamente os pacotes de forma indiscriminada produz consideravel taxa de perda de pacotes. A Figura 21 ap-resenta as perdas obtidas nas simulac¸˜oes que tiveram a fila alimentada com o trac¸o real BWY-1069762448 e com os trac¸os sint´eticos gerados pelos modelos com dois, seis e dez

(18)

Quantidade de pacotes Tempo de gerac¸˜ao usando modelo com seis estados

105 9.9060 s

106 95.0150 s

107 891.0620 s

108 9042.6520 s

Tabela 2. Tabela com tempos de gerac¸ ˜ao para diferentes tamanhos de trac¸os

estados. Os resultados foram condizentes com as simulac¸˜oes feitas em C++, mostrando novamente que o modelo com seis estados ´e o mais preciso dos trˆes modelos e reproduz bem as perdas das simulac¸˜oes do trac¸o real.

0 100 200 300 400 500 600 0 0.05 0.1 0.15 0.2 0.25

tamanho do buffer (pacotes)

probabilidade de perda

Simulação da perda no software NS para o traço BWY−1069762448 traço real, Util = 0.5 traço real, Util = 0.7 traço real, Util = 0.9 traço sint 2 est., Util = 0.5 traço sint 2 est., Util = 0.7 traço sint 2 est., Util = 0.9 traço sint 6 est., Util = 0.5 traço sint 6 est., Util = 0.7 traço sint 6 est., Util = 0.9 traço sint 10 est., Util = 0.5 traço sint 10 est., Util = 0.7 traço sint 10 est., Util = 0.9 Utilização 0.9

Utilização 0.7

Utilização 0.5

Figura 21. Gr ´afico da perda das simulac¸ ˜oes feitas no NS para o trac¸o real BWY-1069762448 e os respectivos trac¸os sint ´eticos gerados pelos modelos com dois, seis e dez estados

Para verificar o padr˜ao de multifractalidade nos trac¸os sint´eticos, plotou-se os di-agramas Multiscale e Multiscale Linear para o trac¸o real e para os trac¸os sint´eticos. Os gr´aficos da Figura 22(a) mostram novamente os diagramas obtidos da func¸˜ao Mdestimate para o trac¸o real BWY-1069762448 de fluxo UDP. J´a os gr´aficos da Figura 22(b) mostram os diagramas obtidos da func¸˜ao Mdestimate para o trac¸o sint´etico BWY-1069762448 ge-rado pelo modelo com seis estados. A n˜ao-linearidade de zeta q nos Diagramas Mul-tiscale bem como a n˜ao-horizontalidade dos Diagramas MulMul-tiscale Linear evidenciam a natureza multifractal do trac¸o sint´etico gerado pelo modelo.

Para se acessar o desempenho deste modelo, mediu-se o tempo necess´ario para produzir trac¸os de tamanhos diversos (Tabela 2), utilizando um computador com proces-sador AMD Athlon XP 2500, com clock de 1.84 GHz e tamanho de mem´oria 1,00 Gb de RAM. Os tempos para produc¸˜ao dos trac¸os ´e perfeitamente razo´avel para adoc¸˜ao destes geradores em experimentos de simulac¸˜ao.

(19)

0 2 4 0 0.5 1 1.5 Multiscale Diagram: (j 1,j2) = (1, 3) q ζq 0 2 4 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6

Linear Multiscale Diagram: h

q=ζq / q q h q (a) 0 2 4 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Multiscale Diagram: (j 1,j2) = (1, 3) q ζq 0 2 4 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55

Linear Multiscale Diagram: h

q=ζq / q

q h

q

(b)

Figura 22. DM e DML do trac¸o BWY-1069762448 para o fluxo UDP(a) e para o fluxo UDP gerado pelo modelo com seis estados(b).

5. Conclus˜oes

O crescente uso do protocolo UDP pelas emergentes aplicac¸˜oes que necessitam requisitos de tempo real demanda a necessidade de se entender melhor o impacto do tr´afego UDP no dimensionamento e no controle de tr´afego da rede, dado que este tipo de tr´afego n˜ao reage `a situac¸˜oes de congestionamento.

Foram propostos, neste artigo, novos modelos de tr´afego a partir de verificac¸˜oes experimentais das distribuic¸˜oes estat´ısticas dos fluxos de dados UDP. O modelo hier´arquico com seis estados superestima a probabilidade de perda dentro de limites razo´aveis o que indica a sua adequabilidade para o dimensionamento de recursos da rede e provisionamento de Qualidade de Servic¸o. Al´em disto, o tempo para a gerac¸˜ao de trac¸os sint´eticos a partir do modelo hier´arquico com seis estados justifica a sua utilizac¸˜ao em experimentos de simulac¸˜ao.

Referˆencias

Abry, P. and Veitch, D. (1998). Wavelets for the analysis, estimation and synthesis of scaling data. Trans. Info. Theory, 44(1):2–15.

Altman, E., Avrachenkov, K., and Barakat, C. (2000). A stochastic model of tcp/ip with stationary random. ACM SIGCOMM, pages 231–242.

Andersen, A. T. and Nielsen, B. F. (1998). A markovian approach for modeling packet traffic with long-range dependence. IEEE journal on selectedareas in communications, 16(5):719–732.

Barakat, C. (2001). Tcp modeling and validation. IEEE Network, 15(3):38–47.

Cavanaugh, J. E., Y.Wang, and J.W.Davis (2003). Stochastic processes: Modeling and simulation. In Handbook of Statistics, chapter self-similar processes and their wavelet analysis. Elsevier Science.

Coralreef (2005). Caida measurement and analysis tools.

(20)

Erramilli, A., Narayan, O., and Saniee, I. (2001). Multi-scaling models of tcp/ip and subframe vbr video traffic. Journal of Communications and Networks, pages 383–395. Feldmann, A., Gilbert, A., Huang, P., and Wilinger, W. (1999). Dynamics of ip traffic: A study of the role of variability and the impact of control. Proceedings of the 1999

ACM SIGCOMM Conference, pages 301–313.

Feldmann, A., Gilbert, A., Williamson, W., and Kurtz, T. (1998). The changing na-ture of network traffic: Scaling phenomena. ACM Computer Communication Review, 28(2):5–26.

Gong, W., Liu, Y., Misra, V., and Towsley, D. (2005). Self-similarity and long range dependence on the internet: A second look at the evidence, origins and implications.

Computer Networks, 48(3):379–399.

Hollot, C. V., Liu, Y., Misra, V., and Towsley, D. (2003). Unresponsive flows and aqm performance. Proceedings of INFOCOM 2003.

NLANR (2005). Internet traces at nlanr. http://pma.nlanr.net/Traces.

Park, K. and Willinger, W. (2000). Self-similar network traffic and performance evalua-tion. Wiley Interscience.

Robert, S. and Boudec, J. Y. L. (1997). New models for pseudo self-similar traffic.

Per-formance Evaluation, 30:57–68.

Veitch, D. and Abry, P. (2005). Matlab code for the estimation of scaling exponents. http://www.cubinlab.ee.mu.oz.au/∼darryl/secondorder code.html.

Referências

Documentos relacionados

A determinação da variação dimensional de barras de argamassa, conforme a NBR 13.583, foi utilizada para avaliar o potencial de mitigação do material ligante composto por cimento CP

•  A simplificação e desburocratização da transmissão entre vivos, de prédios rusticos nas zonas rurais, implica repensar a necessidade ou utilidade do

Para aguçar seu intelecto, para tomar-se mais observador, para aperfeiçoar-se no poder de concentração de espí­ rito, para obrigar-se â atençOo, para desenvolver o espírito

albopictus representa um vetor potencial para diversas arboviroses, sendo de suma importância o seu controle, já que muitas destas doenças podem ser consi- deradas emergentes

Os alunos que concluam com aproveitamento este curso, ficam habilitados com o 9.º ano de escolaridade e certificação profissional, podem prosseguir estudos em cursos vocacionais

regulamentares ou regimentais do cargo, no caso de cargo técnico ou científico. 279 - Para os efeitos deste Capítulo, a expressão “cargo” compreende os cargos, funções ou empregos

Trata-se de um relato de pesquisa e experiência prática, de natureza descritiva, sobre a vivência em um projeto de extensão universitário multidisciplinar realizado na

A solução da estrutura urbana é caracterizada pela existência de uma Alameda Central, que se configura como uma “espinha dorsal” de orientação Norte/Sul,