Predição adaptativa do expoente de Hölder para tráfego multifractal de redes

(1)

Predição adaptativa do expoente de Hölder para tráfego

multifractal de redes

Christian Jorge, Flávio Henrique Teles Vieira, Lee Luan Ling

Depto de Comunicações, FEEC, UNICAMP, 13083-970, Campinas, SP

E-mail: christian@fee.unicamp.br, flavio@decom.fee.unicamp.br, lee@decom.fee.unicamp.br

1. Introdução

As redes de computadores atuais integram uma grande quantidade de serviços multimídia, com requerimentos de qualidade de serviço e características estatísticas próprias. Como conseqüência, há uma maior dificuldade no gerenciamento dos recursos disponíveis e no controle do congestionamento da rede.

Caso o controle dinâmico seja preventivo, costuma-se antecipar as condições do tráfego por meio de um preditor e alocar recursos aos fluxos com antecedência, tentando evitar o congestionamento.

Idealmente, um preditor em tempo real deve ser simples (referente à eficiência computacional), utilizar uma quantidade mínima de informação armazenada, considerar um intervalo de predição suficiente para compensar possíveis atrasos e tempo de processamento de informações e ser preciso também o suficiente para garantir a qualidade de serviço requerida pelas conexões, com uso eficiente dos recursos [9].

Atingir tais requisitos é uma tarefa árdua, senão impossível em alguns casos. Isto porque a predictabilidade do tráfego de redes depende de fatores como: passo da predição, escala de tempo utilizada, nível de agregação e características estatísticas do tráfego e histórico de informação disponível [12], [11]. Em estudos recentes do tráfego Internet, foram demonstradas as características auto-similares, não estacionárias e de dependência de longo prazo de alguns tipos de tráfego [10], [1]. Isto já é suficiente para tornar sua predição algo desafiador.

Nas escalas de tempo menores ou iguais a 100 ms, em geral, o tráfego Internet é constituído por leis de escalas mais complexas do que supunham os modelos auto-similares e é mais conveniente caracterizá-lo por meio da abordagem multifractal [3]. Nesse contexto, insere-se o expoente de Hölder pontual como um indicador local da regularidade. Este expoente indica a intensidade das rajadas do tráfego e pode ser caracterizado via transformada wavelet, devido à invariância à dilatação e translação no tempo, de processos auto-similares e multifractais.

Como alternativa ao controle dinâmico de tráfego, a

predição dos expoentes de Hölder de amostras de tráfego Internet pode ser usada para alocação de recursos, de forma a levar em conta o tempo de processamento dos protocolos de rede. Neste artigo propomos primeiramente a estimação dos expoentes de Hölder em janelas de tempo, demonstrando a viabilidade de fazê-lo com menos amostras. Em seqüência, propomos um preditor adaptativo baseado no Filtro de Kalman, com ruídos calculados adaptativamente e utilizando o algoritmo NLMS (Normalized Least Mean Squares).

2. Caracterização Wavelet da

Regularidade Local

2.1 Análise Wavelet

A transformada wavelet é um excelente método para análise do comportamento local de funções [2]. Ela atua por meio de um produto-convolução da função a ser analisada, com a wavelet-mãe ψ(x), em uma escala

a e transladada a um ponto b, gerando o coeficiente

wavelet da,b dado por:

∫

∞ ∞ − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = dx a b x x f a dab ( )ψ 1 , (1)

com a,b∈R e a > 0 . O uso do fator a-1 é justificado para obtermos

1 1

, ψ

ψab = , onde || . ||1 é a norma 1. Essa transformada pode ser interpretada como um operador diferencial multi-escala de ordem N devido à propriedade dos momentos de desvanescimento (vanishing moments) da wavelet, que satisfazem [8]:

∫

₍ ₎ =₀, para i=0, ..., N-1. (2) ∞ ∞ − dx x xiψ

2.2 Expoente de Hölder Pontual

O expoente de Hölder pontual é capaz de descrever o grau de uma singularidade, o que é interessante para a caracterização das rajadas de dados em redes de

(2)

computadores.

Definição ( Expoente de Hölder pontual ) : Seja α um número real e K uma constante, ambos estritamente

positivos, e . A função é

se existe um polinômio P

R

x₀∈ f:R→R Cα(x₀) n , de grau n<α tal que : | f(x)−P_n(x−x₀)|<K|x−x₀|α (3)

O expoente de Hölder pontual h da função f em x0 será definido como:

h=sup{α >0|f ∈Cα(x₀)} (4)

Note que o polinômio Pn pode ser encontrado mesmo que o desenvolvimento em série de Taylor de f ao redor de x0 não exista.

2.3 Tipos de Singularidades

Existem diversas funções com um mesmo expoente de Hölder num determinado ponto, mas com comportamentos completamente distintos ao redor desse mesmo ponto. Isso é devido ao tipo de singularidade que a função possui. Aqui podemos destacar dois tipos [8]:

Singularidades não-oscilantes (cusps)

Em geral são do tipo e são

regulares o suficiente para que, dada uma função f com expoente de Hölder no ponto x

h

h x x x

f ( )=| − 0 |

0, sua derivada possua expoente de Hölder h-1e sua integral possua expoente de Hölder h+1, no ponto x0.

Singularidades oscilantes (chirps)

Para funções do tipo ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = _β β | | 1 | | ) ( 0 0 , x x sen x x x g h h , que oscilam

infinitamente ao redor de x , a regra da integral, apresentada para singularidades não-oscilantes, não procede. Essas funções sempre terão seus expoentes de Hölder h em x , independente de

0

β

, mas sua integral

possuirá expoente de Hölder pontual igual a (h+1+β) em x , devido a efeitos de cancelamento que levam a uma suavidade maior que as singularidades não-oscilantes.

0

Assim, uma completa descrição do comportamento local de uma função pode ser obtida com a informação do Hölder pontual em conjunto com o expoente de oscilaçãoβ .

2.4 Decaimento dos Coeficientes Wavelets

Conforme relatado em [8], [15], o expoente de Hölder de uma função no ponto x0, pode ser aproximado usando |da,b|~ah, com os coeficientes

wavelets máximos absolutos imersos num

cone do tipo Z b b a d |∈ | , Ka x x− |≤

| 0 . Porém, esse tipo de análise

só é condizente com singularidades não-oscilantes. No tráfego de redes, devido à alta irregularidade presente, devemos levar em consideração também as singularidades oscilantes. Nesse caso, os coeficientes wavelets máximos absolutos estão imersos num cone parabólico mais largo que o citado anteriormente, cuja equação é dada por x−x 1+β≤Ka.

0|

|

Dessa forma, para uma caracterização correta do comportamento local de uma função, devemos levar em consideração não apenas a amplitude dos coeficientes wavelets, mas também sua localização no tempo. Assim, utilizamos a seguinte desigualdade [6]:

h (5)

b

a K a x x

d | ( | |)

| , ≤ + − 0

Com base nisso, Seuret et al. [13] propuseram um algoritmo para estimação dos expoentes de Hölder pontuais tanto para singularidades oscilantes quanto não-oscilantes, que será apresentado na seção 3.1.

3. Estimação do Expoente de

Hölder Pontual

3.1 Estimação do Expoente de Hölder

Pontual para Tráfego Internet

Nosso objetivo é, a partir de medidas da intensidade do tráfego em uma rede, calcular a regularidade local deste em instantes de tempo determinados. Como esse conjunto de amostras é finito, o uso de uma transformada wavelet discreta, mas não-dizimada(redundante) é recomendada para a obtenção de estimações mais estáveis. As amostras serão referenciadas como k e as escalas como 2j, com um j pequeno significando uma escala menor e um j grande uma escala maior, e k,j∈N.

A estimação do expoente de Hölder pontual para cada amostra k0 se dá inicialmente construindo-se uma “nuvem” de pontos (xj(k),yj(k)) onde:

x(j,k)₌log₂(2j₊|k₋k₀|) (6) y(j,k)=log2(|dj,k |) (7) O expoente de Hölder de k0 corresponderá ao coeficiente angular da reta que se encaixa tão

(3)

precisamente quanto possível no topo dessa “nuvem” [13]. Para diminuir o número de pontos, usamos a restrição 3≤_x(_j,_k)≤log₂(2n)−2, sendo 2n_{o número} de amostras utilizadas. Isto nos permite considerar os coeficientes wavelets máximos absolutos numa extensão suficiente de expoentes de oscilação β .

Nas simulações, foram utilizadas 214 amostras das séries de tráfego Internet dec1-pkt.TCP e lbl5-pkt.TCPP

1

, agregadas na escala de tempo de 100 ms. A wavelet utilizada foi a Morlet e consideramos somente as escalas 2j com 1≤ j≤12,j∈N, para evitar o fenômeno da periodização em escalas maiores, que tendenciam os resultados.

Figura1: Esquerda: amostras de tráfego da série lbl5; Direita: Expoentes de Hölder pontuais referentes às amostras citadas

Por meio da Figura 1, podemos verificar a predominância de expoentes de Hölder pontuais menores que 0,5 e a diminuição do valor deste expoente em instantes de tempo onde há aumento acentuado do tráfego. Isso demonstra a intensa irregularidade do tráfego e o caráter de rajadas (burstiness) em pequenas escalas de tempo.

3.2 Expoente de Hölder Pontual em

Janelas de Tempo

Até aqui, consideramos a estimação do expoente de Hölder pontual de cada amostra, levando-se em consideração todo o conjunto de amostras disponíveis do tráfego. Propõe-se nesse trabalho verificar o erro obtido com a diminuição do número de amostras de tráfego para a estimação de cada um destes expoentes. A justificativa é diminuir a quantidade de informação processada. Para isso, limitamos a estimação do expoente de Hölder pontual de cada amostra, à sua respectiva janela de tempo, ou seja, para a estimação do expoente da amostra de uma janela, usamos amostras apenas desta janela. As janelas são seqüenciais e cada amostra pertence somente à uma única janela. Três tamanhos de janelas foram consideradas: janela 11 (2048 instantes de tempo), janela 12 (4096 instantes de tempo) e janela 13 (8192

instantes de tempo). Como referência para comparação, consideramos o expoente de Hölder pontual de cada amostra, estimado utilizando-se todas as 16384 (214) instantes de tempo disponíveis, conforme a seção anterior.

As amostras de tráfego e a wavelet utilizadas para análise são as mesmas usadas anteriormente, porém sua escala máxima é 2j-2, sendo 2j o tamanho da janela amostral.

Como medida de desempenho da estimação, consideramos o erro quadrático médio normalizado (EQMN), definido a seguir:

ref h jan ref h h E EQMN 2 2_] ) [( σ − = (8)

onde hjan é o expoente de Hölder pontual estimado via janelamento e href é o expoente de Hölder pontual

usado como referência e é a variância dos

expoentes de Hölder pontuais de referência.

ref

h

2 σ

Janela 11 Janela 12 Janela 13 série dec1 série lbl5 0,4899 0,5423 0,2483 0,4332 0,0426 0,2116

Tabela 1: Erro Quadrático Médio Normalizado Conforme a tabela 1 e a figura 2, verifica-se que há um gradual aumento da imprecisão na estimação do expoente de Hölder pontual em relação à referência, com a diminuição do tamanho da janela. Em contrapartida, a estimação se dá de maneira mais rápida, devido à diminuição da quantidade de coeficientes wavelets relativos à janela.

Figura 2: Expoentes de Hölder pontuais de amostras da série

dec1, estimados com três tamanhos diferentes de janelamento.

4. Predição do Expoente de Hölder

Pontual

(4)

Visto que o expoente de Hölder pontual nos serve como um indicador do grau das rajadas do tráfego Internet e que pode ser estimado usando uma menor quantidade de pontos via janelamento, nossa proposta é antecipar as condições do tráfego à um passo, de tamanho igual à escala de tempo utilizada. Isto é feito por meio da predição do próximo expoente de Hölder pontual da série de tráfego.

Como é possível ver por meio da figura 3, a função de autocorrelação da série de expoentes de Hölder nos mostra que tais expoentes possuem decaimento mais rápido do que a função de autocorrelação do tráfego que os originam. Isto indica a possibilidade de uso de técnicas clássicas de séries temporais [7].

Figura 3: Esquerda: decaimento da função de autocorrelação dos expoentes de Hölder e da série dec1. Direita: decaimento da função de autocorrelação dos expoentes de Hölder e da série lbl5.

4.1 Proposta: Filtro de Kalman com

ruídos adaptativos

O filtro de Kalman é um estimador recursivo linear que utiliza o conceito de espaço de estados e é ótimo quanto à minimização do erro quadrático médio (EQM) [5]. Como os expoentes de Hölder pontuais do tráfego possuem características temporais e estatísticas desconhecidas, utilizamos uma versão adaptativa desse filtro, descrita pelas equações:

w(k+1)=w(k)+ξ(k) (9) h(k)=uT(k)w(k)+η(k) (10) onde w(k) é o vetor nx1 de coeficientes do filtro, h(k) é o expoente de Hölder pontual estimado, u(k) é o vetor regressor formado por h(k-1), h(k-2), ..., h(k-n), sendo

k o instante de tempo e n a ordem do sistema. Os

ruídos _ξ_(k) e η(k) não são estatisticamente conhecidos a priori e em geral são considerados gaussianos com média zero e variância constante. Nossa proposta se baseia em calculá-los adaptativamente.

(k)

Assim, η foi modelado tendo média h(k) e

variância instantâneas, estimadas

recursivamente da seguinte forma [16]: (k) 2 η σ 1 _(k) 1) -(k 1 (k) h k h k k h = − + (11) 2 2 2 ) (k) (k) ( 1 1) -(k 1 (k) h h k k k− ₊ ₋ = η η σ σ ( Consi 12) deramos h(0) e como zero.

(9) ode s a como a at (0) 2 η σ A equação p er visualizad

ualização dos pesos de um filtro NLMS [5]. Dessa forma, consideramos : _(k) _(k) (k) ~ 2u e u (k) μ ξ = (13)

onde 0<μ~<2 é o passo de adaptação, e(k) é o erro de

ão do e

prediç xpoente de Hölder pontual e || . || é a norma euclidiana.

A matriz de covariância nxn de ξ(k) é dada por: ⎤ ⎡σ 2(k) ... 0 0 ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ = (k) ... 0 0 : ... : 0 0 ... (k) : (k) 2 2 2 1 2 n σ σ σξ (14) sendo cada ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

σ

j2(k) , j=1, 2, ..., n, a variância calculada

recursivamente até o instante k conforme (12), para cada elemento j do vetor ξ(k).

O algoritmo recursivo do editor proposto é dado pr e

p las seguintes equações: (k) (k) (k) (k) (k) (k) (k)= K g ₂ η σ + u K u u T (15) K(k+1)=K(k)-g(k)uT(k)K(k)+σ_ξ2(k) (16) e(k)=h(k)−uT(k)w(k) (17) wˆ(k+1)=wˆ(k)+g(k+1)e(k+1) (18) hˆ(k+1)=uT(k+1)w(k+1) on (19) de g(k) é o ganho de Kalman, K(k)é a matriz de covariância dos erros de estimação d oeficientes do filtro, os c ) 1 ( ˆ k+

w é a predição dos coeficientes do filtro, e 1)

(k

ˆ ₊

h redição do expoente de Hölder pontual.

-se como condições iniciais: é a p Supõe wˆ0 ≅0 T (20) K0=w₀w0 (21)

.2 Desempenho de Predição

foi verificada ut

4

A qualidade do preditor proposto

ilizando-se os expoentes de Hölder pontuais estimados na seção 3.2, com janela 12. Como o preditor foi aplicado apenas a um passo adiante, a estratégia para uma predição a um passo mais longo foi

(5)

aumentar a escala de tempo entre amostras das séries utilizadas. Assim, foram utilizadas três escalas de tempo diferentes (50 ms, 100 ms e 200 ms).

Utilizamos o seguinte erro quadrático médio no

rmalizado (EQMN) para avaliação do desempenho de um determinado preditor [14] : ) ) (( ) ) (( 2 2 jan ua jan pred h h E h h E EQMN − − = (22)

on hjan é o expoente de Hölder pontual estimado via

compara o EQM do preditor co

liados como co

de

janelamento, hpred é o expoente de Hölder predito e hua é o expoente de Hölder predito igual ao imediatamente anterior estimado. O EQMN será calculado a partir da metade das amostras preditas, quando o preditor já está suficientemente estável.

Basicamente, o EQMN

m o EQM de outro preditor mais simples, que considera o expoente de Hölder pontual imediatamente anterior, como preditor. O preditor avaliado é considerado aceitável se possuir o EQMN menor que a unidade; caso contrário ele terá desempenho igual ou inferior ao preditor mais simples citado.

Outros dois preditores foram ava

mparação: um filtro de Kalman com ruídos gaussianos com média zero e variância constante (preditor 1) e o NLMS (preditor 2). Consideramos n=8 e μ~_=0,02. 50 ms 100 ms 200 ms Proposto 0 Preditor 1 Preditor 2 ,6743 0,6746 0,6992 0,6356 0,6357 0,6610 0,5730 0,5764 0,5994 Tabela 2: EQMNs usando a série dec1

50 ms 100 ms 200 ms Proposto 0 Preditor 1 Preditor 2 ,6784 0,7020 0,7190 0,7124 0,7311 0,7550 0,5829 0,6004 0,6042 Tabela 3: EQMNs usando a série lbl5

or meio das tabelas 2 e 3, podemos constatar uma m

P

aior eficiência do preditor proposto pelo fato deste possuir EQMNs menores que a unidade e também menores que os EQMNs dos outros dois preditores avaliados. Outra análise que indica a eficiência do preditor proposto é o decaimento do seu erro quadrático de predição em relação ao tempo. Na figura 4, pode-se perceber a queda brusca até próximo de zero deste erro já nas primeiras amostras preditas enquanto os outros dois preditores comparativos possuem uma queda do erro quadrático mais lenta.

Figura 4: Decaimento do erro quadrático do preditor proposto e dos

5. Análise Qualitativa das

, os expoentes de Hölder pontuais preditos

análise

Janela 11 Janela 12 Janela 13

preditores 1 e 2.

Estimativas dos Expoentes de

Nesta seção

Hölder

serão comparados com os expoentes de Hölder de referência (conforme a seção 3.2). Assim pudemos obter resultados mais gerais e conclusivos acerca da eficiência da estimação desses expoentes via janelamento conjuntamente com sua predição.

As amostras de tráfego e o critério de utilizados foram os mesmos da seção 3.2. Apenas houve uma troca do expoentes de Hölder pontuais estimados por meio do janelamento, pelo expoente de Hölder predito. Série dec1 Série lbl5 0,6541 0,5785 0,4714 0,5283 0,3494 0,3374

abela 4: EQMN da predição em relação aos

figura 5 nos mostra visualmente a diferença entre os T

expoentes de Hölder pontuais de referência, na escala de tempo de 100 ms.

A

expoentes de Hölder pontuais de referência, expoentes de Hölder estimados via janela 12 e a predição deste último, para amostras de tráfego dec1 na escala de 100 ms. Por meio da tabela 4, pode-se verificar em todas as séries utilizadas, uma deterioração na qualidade do expoente de Hölder pontual predito, a medida que a janela amostral é diminuída. Esperáva-se tais resultados piores que os demonstrados isoladamente na seção 3.2, pois agora tanto a imprecisão da estimação e da predição dos expoentes de Hölder pontuais levados em conta.

(6)

Figura 5: Expoentes de Hölder de referência (estimado via janela 14), expoentes de Hölder estimados via janela 12 e predição dos

. Conclusões

expoente de Hölder pontual m

cias

eveland, D. Lin e D. Sun, On the gs [2] I

[3] ilbert e W. Willinger, Data

[5] eory”, Englewood

[6] functions

[7] re e U.B. Desai,

[8] nd W. Hwang, Singularity detection

[9]

long-[10] ffic: the failure

1] An empirical

[12]

[13] r exponent

4] e E. Jonckheere, On the

[15] gularity

[16] tion and

Time-expoentes de Hölder estimados via janela 12, na escala de 100 ms.

6

A estimação do

ostrou-se uma alternativa na indicação do grau da regularidade do tráfego. Por meio do janelamento amostral, podemos obtê-la dinamicamente, com o tempo de processamento e precisão dependentes do tamanho da janela amostral.

O preditor proposto, embora simples, mostrou-se ro

[1

busto, trabalhando adaptativamente num ambiente de características pouco conhecidas, como os expoentes de Hölder pontuais, ao custo de poucas amostras passadas, e prevendo eficientemente valores futuros em escalas de tempo distintas.

Como trabalho futuro, pode-se tentar antecipar surtos do tráfego por meio da predição do expoente de Hölder pontual e usar essa informação em um esquema de escalonamento ou controle preventivo dinâmico do tráfego.

Referên

[1

1] J. Cao, W. Cl

[

nonstationarity of Internet traffic, em Proceedin of ACM SIGMETRICS 2001”, pp 102-112, 2001. . Daubechies, “Ten lectures on wavelets”, SIAM, Philadelphia, 1992.

A. Feldmann, A. C. G

networks as cascades: Investigating the multifractal nature of Internet WAN traffic, em “Proceedings of the ACM/SIGCOMM'98”, pp 25-38, Vancouver, B.C., 1998.

S. Haykin, “Adaptive Filter Th

Cliffs, Prentice Hall, New Jersey, 1991.

S. Jaffard, Multifractal formalism for

part I: Results valid for all functions. SIAM J.

Math. Anal., 28(1997) 944-970.

M. Krishna P., Vikram M. Gad

Kalman Filter Based Prediction of Broadband Traffic Burstiness, em “Proceedings of the International Conference on Acoustics, Speech, and Signal Processing”, vol 3, pp. 2137-2140, 2002

S. Mallat a

and processing with wavelets, IEEE Transactions

on Information Theory, 38(1992) 617-643.

S. Östring e H. Sirisena, The influence of range dependence on traffic prediction, em “Proceedings of ICC”, 2001.

V. Paxson, S. Floyd, Wide area tra

of poisson modeling, “IEEE/ACM Transactions on Networking”, 3(1995) 226-244.

Y. Qiao, J. Skicewicz e P. Dinda,

study of the multiscale predictability of network traffic, em “IEEE Proceedings of HPDC”, 2003. A. Sang e S.Q. Li, A predictability analysis of network traffic, em “Proceedings of IEEE INFOCOM 2000”, pp. 342-351, 2000.

S. Seuret e A. Gilbert, Pointwise Holde

estimation in data network traffic, em “International teletraffic congress workshop”, Monterey, CA, 2000.

K. Shah, S. Bohacek

predictability of data network traffic, em “Proceedings of the 2003 American Control Conference”, Vol.2, pp.1619-1624, 2003.

Struzik. Z. R., Determining local sin

strengths and their spectra with the wavelet transform. Fractals, 8 163-179.

Young, P., “Recursive Estima

Series Analysis”, Springer-Verlag, New York, 1984.