Predição adaptativa do expoente de Hölder para tráfego
multifractal de redes
Christian Jorge, Flávio Henrique Teles Vieira, Lee Luan Ling
Depto de Comunicações, FEEC, UNICAMP, 13083-970, Campinas, SP
E-mail: christian@fee.unicamp.br, flavio@decom.fee.unicamp.br, lee@decom.fee.unicamp.br
1. Introdução
As redes de computadores atuais integram uma grande quantidade de serviços multimídia, com requerimentos de qualidade de serviço e características estatísticas próprias. Como conseqüência, há uma maior dificuldade no gerenciamento dos recursos disponíveis e no controle do congestionamento da rede.
Caso o controle dinâmico seja preventivo, costuma-se antecipar as condições do tráfego por meio de um preditor e alocar recursos aos fluxos com antecedência, tentando evitar o congestionamento.
Idealmente, um preditor em tempo real deve ser simples (referente à eficiência computacional), utilizar uma quantidade mínima de informação armazenada, considerar um intervalo de predição suficiente para compensar possíveis atrasos e tempo de processamento de informações e ser preciso também o suficiente para garantir a qualidade de serviço requerida pelas conexões, com uso eficiente dos recursos [9].
Atingir tais requisitos é uma tarefa árdua, senão impossível em alguns casos. Isto porque a predictabilidade do tráfego de redes depende de fatores como: passo da predição, escala de tempo utilizada, nível de agregação e características estatísticas do tráfego e histórico de informação disponível [12], [11]. Em estudos recentes do tráfego Internet, foram demonstradas as características auto-similares, não estacionárias e de dependência de longo prazo de alguns tipos de tráfego [10], [1]. Isto já é suficiente para tornar sua predição algo desafiador.
Nas escalas de tempo menores ou iguais a 100 ms, em geral, o tráfego Internet é constituído por leis de escalas mais complexas do que supunham os modelos auto-similares e é mais conveniente caracterizá-lo por meio da abordagem multifractal [3]. Nesse contexto, insere-se o expoente de Hölder pontual como um indicador local da regularidade. Este expoente indica a intensidade das rajadas do tráfego e pode ser caracterizado via transformada wavelet, devido à invariância à dilatação e translação no tempo, de processos auto-similares e multifractais.
Como alternativa ao controle dinâmico de tráfego, a
predição dos expoentes de Hölder de amostras de tráfego Internet pode ser usada para alocação de recursos, de forma a levar em conta o tempo de processamento dos protocolos de rede. Neste artigo propomos primeiramente a estimação dos expoentes de Hölder em janelas de tempo, demonstrando a viabilidade de fazê-lo com menos amostras. Em seqüência, propomos um preditor adaptativo baseado no Filtro de Kalman, com ruídos calculados adaptativamente e utilizando o algoritmo NLMS (Normalized Least Mean Squares).
2. Caracterização Wavelet da
Regularidade Local
2.1 Análise Wavelet
A transformada wavelet é um excelente método para análise do comportamento local de funções [2]. Ela atua por meio de um produto-convolução da função a ser analisada, com a wavelet-mãe ψ(x), em uma escala
a e transladada a um ponto b, gerando o coeficiente
wavelet da,b dado por:
∫
∞ ∞ − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = dx a b x x f a dab ( )ψ 1 , (1)com a,b∈R e a > 0 . O uso do fator a-1 é justificado para obtermos
1 1
, ψ
ψab = , onde || . ||1 é a norma 1. Essa transformada pode ser interpretada como um operador diferencial multi-escala de ordem N devido à propriedade dos momentos de desvanescimento (vanishing moments) da wavelet, que satisfazem [8]:
∫
( ) =0, para i=0, ..., N-1. (2) ∞ ∞ − dx x xiψ2.2 Expoente de Hölder Pontual
O expoente de Hölder pontual é capaz de descrever o grau de uma singularidade, o que é interessante para a caracterização das rajadas de dados em redes de
computadores.
Definição ( Expoente de Hölder pontual ) : Seja α um número real e K uma constante, ambos estritamente
positivos, e . A função é
se existe um polinômio P
R
x0∈ f:R→R Cα(x0) n , de grau n<α tal que : | f(x)−Pn(x−x0)|<K|x−x0|α (3)
O expoente de Hölder pontual h da função f em x0 será definido como:
h=sup{α >0|f ∈Cα(x0)} (4)
Note que o polinômio Pn pode ser encontrado mesmo que o desenvolvimento em série de Taylor de f ao redor de x0 não exista.
2.3 Tipos de Singularidades
Existem diversas funções com um mesmo expoente de Hölder num determinado ponto, mas com comportamentos completamente distintos ao redor desse mesmo ponto. Isso é devido ao tipo de singularidade que a função possui. Aqui podemos destacar dois tipos [8]:
Singularidades não-oscilantes (cusps)
Em geral são do tipo e são
regulares o suficiente para que, dada uma função f com expoente de Hölder no ponto x
h
h x x x
f ( )=| − 0 |
0, sua derivada possua expoente de Hölder h-1e sua integral possua expoente de Hölder h+1, no ponto x0.
Singularidades oscilantes (chirps)
Para funções do tipo ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = β β | | 1 | | ) ( 0 0 , x x sen x x x g h h , que oscilam
infinitamente ao redor de x , a regra da integral, apresentada para singularidades não-oscilantes, não procede. Essas funções sempre terão seus expoentes de Hölder h em x , independente de
0
0
β
, mas sua integralpossuirá expoente de Hölder pontual igual a (h+1+β) em x , devido a efeitos de cancelamento que levam a uma suavidade maior que as singularidades não-oscilantes.
0
Assim, uma completa descrição do comportamento local de uma função pode ser obtida com a informação do Hölder pontual em conjunto com o expoente de oscilaçãoβ .
2.4 Decaimento dos Coeficientes Wavelets
Conforme relatado em [8], [15], o expoente de Hölder de uma função no ponto x0, pode ser aproximado usando |da,b|~ah, com os coeficientes
wavelets máximos absolutos imersos num
cone do tipo Z b b a d |∈ | , Ka x x− |≤
| 0 . Porém, esse tipo de análise
só é condizente com singularidades não-oscilantes. No tráfego de redes, devido à alta irregularidade presente, devemos levar em consideração também as singularidades oscilantes. Nesse caso, os coeficientes wavelets máximos absolutos estão imersos num cone parabólico mais largo que o citado anteriormente, cuja equação é dada por x−x 1+β≤Ka.
0|
|
Dessa forma, para uma caracterização correta do comportamento local de uma função, devemos levar em consideração não apenas a amplitude dos coeficientes wavelets, mas também sua localização no tempo. Assim, utilizamos a seguinte desigualdade [6]:
h (5)
b
a K a x x
d | ( | |)
| , ≤ + − 0
Com base nisso, Seuret et al. [13] propuseram um algoritmo para estimação dos expoentes de Hölder pontuais tanto para singularidades oscilantes quanto não-oscilantes, que será apresentado na seção 3.1.
3.
Estimação do Expoente de
Hölder Pontual
3.1 Estimação do Expoente de Hölder
Pontual para Tráfego Internet
Nosso objetivo é, a partir de medidas da intensidade do tráfego em uma rede, calcular a regularidade local deste em instantes de tempo determinados. Como esse conjunto de amostras é finito, o uso de uma transformada wavelet discreta, mas não-dizimada(redundante) é recomendada para a obtenção de estimações mais estáveis. As amostras serão referenciadas como k e as escalas como 2j, com um j pequeno significando uma escala menor e um j grande uma escala maior, e k,j∈N.
A estimação do expoente de Hölder pontual para cada amostra k0 se dá inicialmente construindo-se uma “nuvem” de pontos (xj(k),yj(k)) onde:
x(j,k)=log2(2j+|k−k0|) (6) y(j,k)=log2(|dj,k |) (7) O expoente de Hölder de k0 corresponderá ao coeficiente angular da reta que se encaixa tão
precisamente quanto possível no topo dessa “nuvem” [13]. Para diminuir o número de pontos, usamos a restrição 3≤x(j,k)≤log2(2n)−2, sendo 2n o número de amostras utilizadas. Isto nos permite considerar os coeficientes wavelets máximos absolutos numa extensão suficiente de expoentes de oscilação β .
Nas simulações, foram utilizadas 214 amostras das séries de tráfego Internet dec1-pkt.TCP e lbl5-pkt.TCPP
1
, agregadas na escala de tempo de 100 ms. A wavelet utilizada foi a Morlet e consideramos somente as escalas 2j com 1≤ j≤12,j∈N, para evitar o fenômeno da periodização em escalas maiores, que tendenciam os resultados.
Figura1: Esquerda: amostras de tráfego da série lbl5; Direita: Expoentes de Hölder pontuais referentes às amostras citadas
Por meio da Figura 1, podemos verificar a predominância de expoentes de Hölder pontuais menores que 0,5 e a diminuição do valor deste expoente em instantes de tempo onde há aumento acentuado do tráfego. Isso demonstra a intensa irregularidade do tráfego e o caráter de rajadas (burstiness) em pequenas escalas de tempo.
3.2
Expoente de Hölder Pontual em
Janelas de Tempo
Até aqui, consideramos a estimação do expoente de Hölder pontual de cada amostra, levando-se em consideração todo o conjunto de amostras disponíveis do tráfego. Propõe-se nesse trabalho verificar o erro obtido com a diminuição do número de amostras de tráfego para a estimação de cada um destes expoentes. A justificativa é diminuir a quantidade de informação processada. Para isso, limitamos a estimação do expoente de Hölder pontual de cada amostra, à sua respectiva janela de tempo, ou seja, para a estimação do expoente da amostra de uma janela, usamos amostras apenas desta janela. As janelas são seqüenciais e cada amostra pertence somente à uma única janela. Três tamanhos de janelas foram consideradas: janela 11 (2048 instantes de tempo), janela 12 (4096 instantes de tempo) e janela 13 (8192
instantes de tempo). Como referência para comparação, consideramos o expoente de Hölder pontual de cada amostra, estimado utilizando-se todas as 16384 (214) instantes de tempo disponíveis, conforme a seção anterior.
As amostras de tráfego e a wavelet utilizadas para análise são as mesmas usadas anteriormente, porém sua escala máxima é 2j-2, sendo 2j o tamanho da janela amostral.
Como medida de desempenho da estimação, consideramos o erro quadrático médio normalizado (EQMN), definido a seguir:
ref h jan ref h h E EQMN 2 2] ) [( σ − = (8)
onde hjan é o expoente de Hölder pontual estimado via janelamento e href é o expoente de Hölder pontual
usado como referência e é a variância dos
expoentes de Hölder pontuais de referência.
ref
h
2 σ
Janela 11 Janela 12 Janela 13 série dec1 série lbl5 0,4899 0,5423 0,2483 0,4332 0,0426 0,2116
Tabela 1: Erro Quadrático Médio Normalizado Conforme a tabela 1 e a figura 2, verifica-se que há um gradual aumento da imprecisão na estimação do expoente de Hölder pontual em relação à referência, com a diminuição do tamanho da janela. Em contrapartida, a estimação se dá de maneira mais rápida, devido à diminuição da quantidade de coeficientes wavelets relativos à janela.
Figura 2: Expoentes de Hölder pontuais de amostras da série
dec1, estimados com três tamanhos diferentes de janelamento.
4. Predição do Expoente de Hölder
Pontual
Visto que o expoente de Hölder pontual nos serve como um indicador do grau das rajadas do tráfego Internet e que pode ser estimado usando uma menor quantidade de pontos via janelamento, nossa proposta é antecipar as condições do tráfego à um passo, de tamanho igual à escala de tempo utilizada. Isto é feito por meio da predição do próximo expoente de Hölder pontual da série de tráfego.
Como é possível ver por meio da figura 3, a função de autocorrelação da série de expoentes de Hölder nos mostra que tais expoentes possuem decaimento mais rápido do que a função de autocorrelação do tráfego que os originam. Isto indica a possibilidade de uso de técnicas clássicas de séries temporais [7].
Figura 3: Esquerda: decaimento da função de autocorrelação dos expoentes de Hölder e da série dec1. Direita: decaimento da função de autocorrelação dos expoentes de Hölder e da série lbl5.
4.1 Proposta: Filtro de Kalman com
ruídos adaptativos
O filtro de Kalman é um estimador recursivo linear que utiliza o conceito de espaço de estados e é ótimo quanto à minimização do erro quadrático médio (EQM) [5]. Como os expoentes de Hölder pontuais do tráfego possuem características temporais e estatísticas desconhecidas, utilizamos uma versão adaptativa desse filtro, descrita pelas equações:
w(k+1)=w(k)+ξ(k) (9) h(k)=uT(k)w(k)+η(k) (10) onde w(k) é o vetor nx1 de coeficientes do filtro, h(k) é o expoente de Hölder pontual estimado, u(k) é o vetor regressor formado por h(k-1), h(k-2), ..., h(k-n), sendo
k o instante de tempo e n a ordem do sistema. Os
ruídos ξ(k) e η(k) não são estatisticamente conhecidos a priori e em geral são considerados gaussianos com média zero e variância constante. Nossa proposta se baseia em calculá-los adaptativamente.
(k)
Assim, η foi modelado tendo média h(k) e
variância instantâneas, estimadas
recursivamente da seguinte forma [16]: (k) 2 η σ 1 (k) 1) -(k 1 (k) h k h k k h = − + (11) 2 2 2 ) (k) (k) ( 1 1) -(k 1 (k) h h k k k− + − = η η σ σ ( Consi 12) deramos h(0) e como zero.
(9) ode s a como a at (0) 2 η σ A equação p er visualizad
ualização dos pesos de um filtro NLMS [5]. Dessa forma, consideramos : (k) (k) (k) ~ 2u e u (k) μ ξ = (13)
onde 0<μ~<2 é o passo de adaptação, e(k) é o erro de
ão do e
prediç xpoente de Hölder pontual e || . || é a norma euclidiana.
A matriz de covariância nxn de ξ(k) é dada por: ⎤ ⎡σ 2(k) ... 0 0 ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ = (k) ... 0 0 : ... : 0 0 ... (k) : (k) 2 2 2 1 2 n σ σ σξ (14) sendo cada ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
σ
j2(k) , j=1, 2, ..., n, a variância calculadarecursivamente até o instante k conforme (12), para cada elemento j do vetor ξ(k).
O algoritmo recursivo do editor proposto é dado pr e
p las seguintes equações: (k) (k) (k) (k) (k) (k) (k)= K g 2 η σ + u K u u T (15) K(k+1)=K(k)-g(k)uT(k)K(k)+σξ2(k) (16) e(k)=h(k)−uT(k)w(k) (17) wˆ(k+1)=wˆ(k)+g(k+1)e(k+1) (18) hˆ(k+1)=uT(k+1)w(k+1) on (19) de g(k) é o ganho de Kalman, K(k)é a matriz de covariância dos erros de estimação d oeficientes do filtro, os c ) 1 ( ˆ k+
w é a predição dos coeficientes do filtro, e 1)
(k
ˆ +
h redição do expoente de Hölder pontual.
-se como condições iniciais: é a p Supõe wˆ0 ≅0 T (20) K0=w0w0 (21)
.2 Desempenho de Predição
foi verificada ut4
A qualidade do preditor proposto
ilizando-se os expoentes de Hölder pontuais estimados na seção 3.2, com janela 12. Como o preditor foi aplicado apenas a um passo adiante, a estratégia para uma predição a um passo mais longo foi
aumentar a escala de tempo entre amostras das séries utilizadas. Assim, foram utilizadas três escalas de tempo diferentes (50 ms, 100 ms e 200 ms).
Utilizamos o seguinte erro quadrático médio no
rmalizado (EQMN) para avaliação do desempenho de um determinado preditor [14] : ) ) (( ) ) (( 2 2 jan ua jan pred h h E h h E EQMN − − = (22)
on hjan é o expoente de Hölder pontual estimado via
compara o EQM do preditor co
liados como co
de
janelamento, hpred é o expoente de Hölder predito e hua é o expoente de Hölder predito igual ao imediatamente anterior estimado. O EQMN será calculado a partir da metade das amostras preditas, quando o preditor já está suficientemente estável.
Basicamente, o EQMN
m o EQM de outro preditor mais simples, que considera o expoente de Hölder pontual imediatamente anterior, como preditor. O preditor avaliado é considerado aceitável se possuir o EQMN menor que a unidade; caso contrário ele terá desempenho igual ou inferior ao preditor mais simples citado.
Outros dois preditores foram ava
mparação: um filtro de Kalman com ruídos gaussianos com média zero e variância constante (preditor 1) e o NLMS (preditor 2). Consideramos n=8 e μ~=0,02. 50 ms 100 ms 200 ms Proposto 0 Preditor 1 Preditor 2 ,6743 0,6746 0,6992 0,6356 0,6357 0,6610 0,5730 0,5764 0,5994 Tabela 2: EQMNs usando a série dec1
50 ms 100 ms 200 ms Proposto 0 Preditor 1 Preditor 2 ,6784 0,7020 0,7190 0,7124 0,7311 0,7550 0,5829 0,6004 0,6042 Tabela 3: EQMNs usando a série lbl5
or meio das tabelas 2 e 3, podemos constatar uma m
P
aior eficiência do preditor proposto pelo fato deste possuir EQMNs menores que a unidade e também menores que os EQMNs dos outros dois preditores avaliados. Outra análise que indica a eficiência do preditor proposto é o decaimento do seu erro quadrático de predição em relação ao tempo. Na figura 4, pode-se perceber a queda brusca até próximo de zero deste erro já nas primeiras amostras preditas enquanto os outros dois preditores comparativos possuem uma queda do erro quadrático mais lenta.
Figura 4: Decaimento do erro quadrático do preditor proposto e dos
5.
Análise Qualitativa das
, os expoentes de Hölder pontuais preditos
análise
Janela 11 Janela 12 Janela 13
preditores 1 e 2.
Estimativas dos Expoentes de
Nesta seção
Hölder
serão comparados com os expoentes de Hölder de referência (conforme a seção 3.2). Assim pudemos obter resultados mais gerais e conclusivos acerca da eficiência da estimação desses expoentes via janelamento conjuntamente com sua predição.
As amostras de tráfego e o critério de utilizados foram os mesmos da seção 3.2. Apenas houve uma troca do expoentes de Hölder pontuais estimados por meio do janelamento, pelo expoente de Hölder predito. Série dec1 Série lbl5 0,6541 0,5785 0,4714 0,5283 0,3494 0,3374
abela 4: EQMN da predição em relação aos
figura 5 nos mostra visualmente a diferença entre os T
expoentes de Hölder pontuais de referência, na escala de tempo de 100 ms.
A
expoentes de Hölder pontuais de referência, expoentes de Hölder estimados via janela 12 e a predição deste último, para amostras de tráfego dec1 na escala de 100 ms. Por meio da tabela 4, pode-se verificar em todas as séries utilizadas, uma deterioração na qualidade do expoente de Hölder pontual predito, a medida que a janela amostral é diminuída. Esperáva-se tais resultados piores que os demonstrados isoladamente na seção 3.2, pois agora tanto a imprecisão da estimação e da predição dos expoentes de Hölder pontuais levados em conta.
Figura 5: Expoentes de Hölder de referência (estimado via janela 14), expoentes de Hölder estimados via janela 12 e predição dos
. Conclusões
expoente de Hölder pontual m
cias
eveland, D. Lin e D. Sun, On the gs [2] I
[3] ilbert e W. Willinger, Data
[5] eory”, Englewood
[6] functions
[7] re e U.B. Desai,
[8] nd W. Hwang, Singularity detection
[9]
long-[10] ffic: the failure
1] An empirical
[12]
[13] r exponent
4] e E. Jonckheere, On the
[15] gularity
[16] tion and
Time-expoentes de Hölder estimados via janela 12, na escala de 100 ms.
6
A estimação do
ostrou-se uma alternativa na indicação do grau da regularidade do tráfego. Por meio do janelamento amostral, podemos obtê-la dinamicamente, com o tempo de processamento e precisão dependentes do tamanho da janela amostral.
O preditor proposto, embora simples, mostrou-se ro
[1
busto, trabalhando adaptativamente num ambiente de características pouco conhecidas, como os expoentes de Hölder pontuais, ao custo de poucas amostras passadas, e prevendo eficientemente valores futuros em escalas de tempo distintas.
Como trabalho futuro, pode-se tentar antecipar surtos do tráfego por meio da predição do expoente de Hölder pontual e usar essa informação em um esquema de escalonamento ou controle preventivo dinâmico do tráfego.
Referên
[1
1] J. Cao, W. Cl
[
nonstationarity of Internet traffic, em Proceedin of ACM SIGMETRICS 2001”, pp 102-112, 2001. . Daubechies, “Ten lectures on wavelets”, SIAM, Philadelphia, 1992.
A. Feldmann, A. C. G
networks as cascades: Investigating the multifractal nature of Internet WAN traffic, em “Proceedings of the ACM/SIGCOMM'98”, pp 25-38, Vancouver, B.C., 1998.
S. Haykin, “Adaptive Filter Th
Cliffs, Prentice Hall, New Jersey, 1991.
S. Jaffard, Multifractal formalism for
part I: Results valid for all functions. SIAM J.
Math. Anal., 28(1997) 944-970.
M. Krishna P., Vikram M. Gad
Kalman Filter Based Prediction of Broadband Traffic Burstiness, em “Proceedings of the International Conference on Acoustics, Speech, and Signal Processing”, vol 3, pp. 2137-2140, 2002
S. Mallat a
and processing with wavelets, IEEE Transactions
on Information Theory, 38(1992) 617-643.
S. Östring e H. Sirisena, The influence of range dependence on traffic prediction, em “Proceedings of ICC”, 2001.
V. Paxson, S. Floyd, Wide area tra
of poisson modeling, “IEEE/ACM Transactions on Networking”, 3(1995) 226-244.
Y. Qiao, J. Skicewicz e P. Dinda,
study of the multiscale predictability of network traffic, em “IEEE Proceedings of HPDC”, 2003. A. Sang e S.Q. Li, A predictability analysis of network traffic, em “Proceedings of IEEE INFOCOM 2000”, pp. 342-351, 2000.
S. Seuret e A. Gilbert, Pointwise Holde
estimation in data network traffic, em “International teletraffic congress workshop”, Monterey, CA, 2000.
K. Shah, S. Bohacek
predictability of data network traffic, em “Proceedings of the 2003 American Control Conference”, Vol.2, pp.1619-1624, 2003.
Struzik. Z. R., Determining local sin
strengths and their spectra with the wavelet transform. Fractals, 8 163-179.
Young, P., “Recursive Estima
Series Analysis”, Springer-Verlag, New York, 1984.