Gerac¸˜ao de S´eries Auto-Similares Gaussianas via
Wavelets para Uso em Simulac¸˜oes de Tr´afego
F. L. de Mello, A. B. de Lima, M. Lipas, Membro, IEEE, e J. R. de A. Amazonas
Resumo— Medidas mostraram que o tr´afego das redes possui propriedades fractais, tais como auto-similaridade e mem´oria longa (ou dependˆencia de longa durac¸˜ao). A mem´oria longa ´e caracterizada pela existˆencia de um p ´olo na origem da func¸˜ao densidade espectral (formato 1/fα, 0 < α < 1). Tamb´em foi constatado que o tr´afego pode apresentar dependˆencia de curta durac¸˜ao em algumas escalas temporais. A utilizac¸˜ao de um gerador de tr´afego agregado “realista”, que sintetize s´eries temporais fractais, ´e fundamental para a validac¸ ˜ao de algoritmos de controle de tr´afego. Neste trabalho, a s´ıntese de realizac¸˜oes aproximadas de um tipo de processo aleat´orio auto-similar denominado Ru´ıdo Gaussiano Fracion ´ario ´e feita via transformada wavelet. O m´etodo proposto tamb´em ´e capaz de sintetizar s´eries Gaussianas com espectros mais gen´ericos do que
1/fα, ou seja, s´eries que tamb´em apresentam dependˆencia de curta durac¸˜ao. A gerac¸˜ao ´e feita em dois est´agios. O primeiro gera uma realizac¸˜ao aproximada do Ru´ıdo Gaussiano Fracion´ario via Transformada Wavelet Discreta. O segundo introduz dependˆencia de curta durac¸˜ao por meio de de uma filtragem IIR (Infinite Impulse Response) da sa´ıda do primeiro est´agio. Efetuou-se uma caracterizac¸˜ao detalhada das s´eries resultantes, utilizando-se nas an´alises momentos estat´ısticos de2a¯, 3a¯e4a¯ordens, al´em de testes
estat´ısticos espec´ıficos para s´eries auto-similares. Verificou-se que o estimador de Whittle do parˆametro de HurstH ´e mais robusto do que o do m´etodo do periodograma em s´eries que apresentam, simultaneamente, dependˆencia de curta e de longa durac¸˜ao.
Palavras-chave— Auto-similaridade, dependˆencia de longa durac¸˜ao, dependˆencia de curta durac¸˜ao, mem´oria longa, tr´afego, wavelets.
I. INTRODUC¸ ˜AO
A
T ´E o in´ıcio da d´ecada de 1990, pensava-se que otr´afego das redes1 de pacotes poderia ser modelado pelo
processo aleat´orio de Poisson [1], [2]. Entretanto, medidas em redes locais [3] e de grande ´area [4] mostraram que o teletr´afego possui propriedades fractais, tais como mem´oria longa (Long Range Dependence - LRD) ou persistˆencia e auto-similaridade. A mem´oria longa implica a existˆencia de um p´olo na origem da Densidade Espectral de Potˆencia (DEP). Um objeto matem´atico (conjunto, medida etc.) ´e auto-similar quando apresenta auto-similaridades estruturais em todas (ou pelo menos em uma faixa dinˆamica extensa) as escalas de observac¸˜ao. No caso do teletr´afego, a alternˆancia de per´ıodos de surto e de suavidade (impulsividade ou burstiness) e a
Manuscrito recebido em 30/3/2006 e revisado em 25/5/2006.
Fernando Lemos de Mello, Alexandre Barbosa de Lima, Marcelo Lipas e Jos´e Roberto de Almeida Amazonas s˜ao membros do Laborat´orio de Comunicac¸ ˜oes e Sinais do Departamento de Engenharia de Telecomunicac¸ ˜oes e Controle da Escola Polit´ecnica da Universidade de S˜ao Paulo (LCS-PTC-EPUSP). e-mails:{mello,ablima,lipas,jra}@lcs.poli.usp.br
1Entenda-se “tr´afego” como a s´erie temporal de chegadas de pacotes em um n´o da rede.
LRD s˜ao mantidas em v´arias escalas de tempo, na faixa de ms a min ou h (a auto-similaridade ocorre em um sentido estat´ıstico).
A mem´oria longa pode levar a maiores taxas de perda de pacotes do que as que s˜ao previstas pela teoria cl´assica das filas [3], [5]. S´eries de mem´oria longa tamb´em foram observadas nas ´areas de Climatologia e Hidrologia (d´ecada de 1950) e, mais recentemente, em s´eries de dados econˆomicos e finan-ceiros (d´ecada de 1980) e s´eries de imagens de ressonˆancia magn´etica funcional do c´erebro humano (d´ecada de 1990) [6], [7].
Os artigos [3] e [4] mostraram que n˜ao ´e razo´avel supor que s´eries de teletr´afego possam ser geradas por modelos ARMA (Autoregressive Moving Average) ou Markovianos, cujas autocorrelac¸˜oes decaem exponencialmente para zero com o aumento do lag [8], [9]. Na literatura, os processos LRD
s˜ao tamb´em conhecidos como processos com espectro 1/fα,
0 < α < 1.
Mais recentemente, o estudo emp´ırico de Riedi e V´ehel [10] (vide tamb´em Feldmann et al. [11] e Gilbert et al. [12]) mostrou que o tr´afego TCP/IP ´e um multifractal aleat´orio em escalas refinadas de tempo (at´e centenas de ms) e assintoti-camente auto-similar de segunda ordem em escalas temporais de maior agregac¸˜ao (segundos, minutos etc.). Dito de forma simples, o tr´afego pode ser um multifractal em escalas “mais r´apidas” porque o seu grau de impulsividade, que ´e caracteri-zado pelo parˆametro de Hurst H (conforme ser´a visto na sec¸˜ao II), varia aleatoriamente no tempo.
A implementac¸˜ao de mecanismos preventivos de controle de tr´afego, tais como o Controle de Admiss˜ao de Conex˜oes (CAC) [13] e Controle Dinˆamico de QoS (Quality of
Ser-vice) [14], ´e essencial para o bom funcionamento de uma
rede multisservic¸o. Sem controle, a demanda irrestrita pelos recursos compartilhados (buffers, banda e processadores) pode degradar seriamente o desempenho da rede. O controle do tr´afego ´e necess´ario para proteger a QoS percebida pelos usu´arios e para assegurar a eficiente utilizac¸˜ao dos recursos da rede. Os testes de validac¸˜ao dos algoritmos de controle de tr´afego devem ser realizados com um tr´afego agregado “realista” e bem definido. Deve-se ter a possibilidade de se variar as propriedades do tr´afego utilizado nas simulac¸˜oes.
A transformada wavelet ´e indicada para a an´alise e a s´ıntese
de sinais 1/fα[7], [15], [16] porque:
1) os coeficientes wavelet de um processo 1/fαs˜ao
aproxi-madamente n˜ao correlacionados no plano tempo-escala. Portanto, a modelagem e o processamento desses sinais naquele dom´ınio podem ser realizado de maneira efi-ciente. Mais precisamente, pode-se afirmar que n˜ao h´a
correlac¸˜ao entre coeficientes wavelet de uma mesma escala e que a correlac¸˜ao entre escalas diferentes ´e fraca (neste caso, a correlac¸˜ao ´e maior entre escalas adjacentes [17]).
2) ´e o m´etodo mais eficiente do ponto de vista computa-cional. A complexidade (em termos de operac¸˜oes de adic¸˜ao e multiplicac¸˜ao) associada `a gerac¸˜ao de uma realizac¸˜ao de M amostras ´e O(M ). M´etodos baseados na FFT (Fast Fourier Transform) [18], [19] possuem complexidade O(M log M ). A t´ecnica de gerac¸˜ao no dom´ınio do tempo de Hosking [20], baseada nas
re-curs˜oes de Levinson-Durbin, requer O(M2) operac¸˜oes.
3) oferece a possibilidade de s´ıntese de tr´afego n˜ao-gaussiano.
4) a noc¸˜ao de escala temporal ´e intr´ınseca `a definic¸˜ao da transformada.
Davies e Harte [21] introduziram na literatura estat´ıstica o m´etodo DHM (Davies and Harte Method) de gerac¸˜ao de realizac¸˜oes de processos estacion´arios gaussianos de m´edia nula. O m´etodo assume que a seq¨uˆencia de autocovariˆancia ´e conhecida, como ´e o caso para o Ru´ıdo gaussiano Fracion´ario (Fractional Gaussian Noise - FGN) [22] e para o Ru´ıdo Branco Fracion´ario (Fractionally Differenced Process - FD) [23], [24]. O m´etodo ´e baseado na FFT. Percival [18] publicou outro m´etodo baseado na FFT, denominado Gaussian
Spec-tral Synthesis Method (GSMM). Paxson [19] tamb´em propˆos
um m´etodo de gerac¸˜ao de realizac¸˜oes aproximadas do FGN baseado na FFT, por´em sua estrat´egia foi baseada no artigo de Flandrin [25]. Paxson demonstrou que o seu m´etodo gera s´eries estatisticamente indistingu´ıveis de realizac¸˜oes FGN. Note que os trˆes m´etodos acima compartilham a caracter´ıstica de utilizarem o m´etodo da FFT para gerac¸˜ao de s´eries tem-porais, apresentando, portanto, complexidade O(M log M ), superior `a complexidade do m´etodo proposto nesse trabalho.
De acordo com [26], a energia (variˆancia) dos coeficientes da transformada wavelet do FGN decai exponencialmente com
o aumento da resoluc¸˜ao temporal2. B¨ackar [27] implementou
um gerador de tr´afego fractal baseado nessa propriedade da transformada wavelet de processos LRD, tendo conseguido sintetizar realizac¸˜oes auto-similares gaussianas e do modelo
Wavelet Multifractal (Multifractal Wavelet Model - MWM)
[28]. B¨ackar sugere ter implementado realizac¸˜oes aproximadas do FGN. Esta afirmac¸˜ao n˜ao ´e correta tecnicamente, pois, conforme ser´a explicado na sec¸˜ao III, n˜ao h´a uma prescric¸˜ao no dom´ınio tempo-escala que garanta que a DEP da s´erie gerada seja a do FGN. N˜ao obstante, reconhece-se o fato de que as DEPs obtidas s˜ao bastante similares `as do FGN, podendo-se afirmar, do ponto de vista pr´atico, que as s´eries simulam o FGN.
Entretanto, sabe-se que traces reais de tr´afego tamb´em podem apresentar dependˆencia de curta durac¸˜ao (Short Range
Dependence - SRD) ou mem´oria curta em escalas temporais
“mais r´apidas” (por exemplo, em bins de 10 ms), o que significa dizer que uma parte n˜ao desprez´ıvel da energia do
2Assume-se que as escalas de tempo s˜ao di´adicas. Portanto, aumenta-se a resoluc¸˜ao temporal dividindo-se a escala por um fator de 2, conforme ser´a visto na sec¸˜ao III-A.
sinal pode estar localizada nas regi˜oes de m´edias e altas freq¨uˆencias do espectro [3], [19], [29]. Portanto, o formato
da DEP de teletr´afego pode ser mais gen´erico do que 1/fα.
Os algoritmos de controle de tr´afego tamb´em devem levar em conta a caracter´ıstica SRD do tr´afego; portanto, h´a necessidade de se incorporar SRD ao tr´afego simulado [19]. Observe-se que o gerador proposto por B¨ackar [27] n˜ao pode simular (conforme ser´a explicado no sec¸˜ao III-B) s´eries temporais com estrutura de correlac¸˜ao mista, isto ´e, s´eries que apresentam, simultaneamente, as caracter´ısticas LRD e SRD.
Ma et al. [17] desenvolveram os seguintes modelos gaus-sianos de tr´afego no dom´ınio wavelet, que capturam as carac-ter´ısticas LRD e SRD de um trace de treinamento:
1) general Markov model (modelo Markoviano gene-ralizado), que captura a SRD intra e inter-escalas. 2) independent wavelet model (modelo wavelet
indepen-dente), em que os coeficientes wavelet, em uma deter-minada escala, s˜ao modelados como vari´aveis aleat´orias gaussianas independentes e identicamente distribu´ıdas (i.i.d.). Esse modelo assume que n˜ao h´a correlac¸˜ao entre escalas.
3) low-order Markov wavelet model (modelo wavelet Markoviano de ordem baixa), que captura a correlac¸˜ao entre escalas adjacentes.
A seq¨uˆencia de autocorrelac¸˜ao amostral foi adotada como m´etrica de desempenho dos modelos. Os experimentos de Ma
et al. mostraram que o independent wavelet model (que ´e o
modelo mais simples) ´e capaz de caracterizar as propriedades
LRD e SRD de s´eries Gaussianas3 e que o desempenho
de modelos wavelet Markovianos de ordem baixa ´e apenas marginalmente superior. A utilizac¸˜ao dos modelos wavelet de Ma et al. em geradores de tr´afego possui as seguintes desvantagens:
1) falta de flexibilidade. O algoritmo de gerac¸˜ao de tr´afego n˜ao usa o parˆametro de Hurst H como parˆametro de entrada (na pr´atica, deseja-se que um gerador de tr´afego auto-similar possa simular uma s´erie com um dado valor de H).
2) os modelos wavelet Markoviano e Markoviano gene-ralizado n˜ao s˜ao atraentes do ponto de vista estat´ıstico (h´a dependˆencia intra e inter-escalas).
10estágio: IDWT 20estágio: Filtro IIR Sérieyk Gaussiana LRD Sériexk Gaussiana LRD e SRD
Fig. 1. Diagrama do gerador de s´eries Gaussianas auto-similares LRD e SRD em dois blocos.
Este artigo apresenta um gerador wavelet de s´eries auto-similares Gaussianas com estrutura de correlac¸˜ao mista, que ´e implementado em dois est´agios (vide Fig. 1). O primeiro ´e
3A id´eia b´asica do m´etodo ´e a modelagem da variˆancia dos coeficientes
wavelet (vide curvas do log2 da variˆancia dos coeficientes wavelet versus escala de tempoj associadas a alguns modelos param´etricos LRD e SRD em [17]).
similar ao gerador implementado por B¨ackar e simula um sinal
gaussiano 1/fα a partir da IDWT (Inverse Discrete Wavelet
Transform - Transformada Wavelet Discreta Inversa) de uma
matriz de coeficientes, que ´e gerada assumindo-se que: a) a progress˜ao da variˆancia dos coeficientes wavelet ´e exponen-cial, b) os coeficientes wavelet intra-escala s˜ao i.i.d. e c) n˜ao h´a correlac¸˜ao entre escalas. Os resultados mostram que as DEPs das s´eries simuladas s˜ao bastante similares com as DEPs de
processos 1/fα, tais como o FGN, o PPL (Pure Power Law)
[7] e o Ru´ıdo Branco Fracion´ario [23], [24]4. O segundo
est´agio introduz a SRD via filtragem IIR (Infinite Impulse
Response) da sa´ıda do primeiro est´agio. O esquema proposto
possui as seguintes vantagens: 1) flexibilidade, pois podem-se simular s´eries com parˆametros de Hurst especificados a
priori e com um n´ıvel de SRD arbitr´ario (vide sec¸˜ao III-B)
e 2) eficiˆencia estat´ıstica, porque os coeficientes wavelet s˜ao processos do tipo ru´ıdo branco gaussiano.
Efetuou-se uma an´alise estat´ıstica das s´eries geradas por meio da estimac¸˜ao de DEPs e de seq¨uˆencias de autocorrelac¸˜ao parcial (momentos de segunda ordem), e dos momentos de terceira e de quarta ordens. Tamb´em avaliou-se o desempenho dos estimadores do parˆametro de auto-similaridade pelos m´etodos de Whittle [6] e do periodograma [30] para as s´eries que apresentam dependˆencia de curta e de longa durac¸˜ao. O restante do artigo est´a organizado como descrito abaixo.
A sec¸˜ao II apresenta o FGN, que foi o primeiro modelo auto-similar proposto na literatura e que, at´e hoje, ´e um
dos processos 1/fα mais relevantes. A sec¸˜ao III apresenta
o m´etodo de gerac¸˜ao de realizac¸˜oes auto-similares Gaussianas via IDWT e filtragem IIR. A sec¸˜ao IV apresenta a an´alise es-tat´ıstica das s´eries geradas. Tamb´em avaliou-se o desempenho de dois estimadores do parˆametro H. Finalmente, a sec¸˜ao V apresenta as conclus˜oes e sugest˜oes para trabalhos futuros.
II. RU´IDO GAUSSIANOFRACIONARIO´
Considere um espac¸o de probabilidade de referˆencia (Ω, , P), em que Ω denota o espac¸o amostral de um
expe-rimento aleat´orioH, ´e uma ´algebra de Borel [31, p´ag. 23]
de eventos definidos em Ω e P, P : → R, ´e uma medida
de probabilidade [32, p´ag. 11].
Definic¸˜ao 1 (Processo Estoc ´astico): seja X um
mento de Ω num espac¸o de func¸˜oes temporais. Esse mapea-mento ´e um processo estoc´astico (ou aleat´orio) se, para cada instante de tempo t, o mapeamento ´e uma vari´avel aleat´oria,
ou seja, um evento{ζ : X(t, ζ) ≤ x} ⊂ para qualquer x e
−∞ < t < ∞, em que ζ denota um resultado aleat´orio de H [32, p´ag. 402].
No restante deste artigo, adota-se a notac¸˜ao X(t) (ou Xt)
para um processo estoc´astico X(t, ζ). Desta forma, n˜ao ser´a realizada distinc¸˜ao de notac¸˜ao entre processos estoc´asticos e vari´aveis aleat´orias.
A m´edia μ(t) de X(t) ´e dada por [31, p´ag. 288]:
μ(t) = E{X(t)} =
∞
−∞xf (x; t) dx , (1)
4O Ru´ıdo Branco Fracion´ario ´e um caso particular do modelo ARFIMA(p, d, q), ou seja, corresponde a um ARFIMA(1, d, 0).
em que f (x; t) ´e a func¸˜ao densidade de probabilidade de
primeira ordem de X(t). A autocorrelac¸˜ao RX(t1, t2) de X(t)
´e definida como [31, p´ag. 288]:
RX(t1, t2) = E{X(t1)X(t2)} = = ∞ −∞ ∞ −∞x1x2f (x1, x2 ; t1, t2) dx1dx2, (2)
em que f (x1, x2; t1, t2) corresponde `a func¸˜ao densidade de
segunda ordem de X(t). A autocovariˆancia γX(t1, t2) de X(t)
´e dada pela relac¸˜ao
γX(t1, t2) = RX(t1, t2) − μ(t1)μ(t2) . (3)
Definic¸˜ao 2 (Processo Estacion ´ario em Sentido Amplo):
X(t) ´e estacion´ario em sentido amplo quando [33, p´ag. 171], [34, p´ag. 26],
1) E{X(t)} = μ, ∀ t,
2) γX{t + m, t} = γX(m), ∀ t, m5.
Definic¸˜ao 3 (Processo H-ss): X(t), t ∈ R, ´e auto-similar
com parˆametro 0 < H < 1, ou seja, ´e H-ss (self-similar with
parameter H) se, para qualquer a > 0,
X(t)= ad −HX(at), (4)
em que = denota igualdade entre as distribuic¸˜oes finito-d
dimensionais.
Note-se que, segundo a definic¸˜ao 3, X(t) n˜ao pode ser
estacion´ario devido ao fator a−H (excetuando-se o caso em
que X(t) ´e degenerado, isto ´e, X(t) = 0 , t≥ 0) [6].
Definic¸˜ao 4 (Processo Estacion ´ario de Mem ´oria Longa):
um processo estacion´ario Yt, t∈ Z, possui mem´oria longa, ou
LRD, se existem constantes α e CP, satisfazendo 0 < α < 1
e CP > 0, tais que [7, p´ag. 279]
lim
f →0
PY(f)
CP|f|−α
= 1 , (5)
em que PY(f) denota a DEP de Yte f representa a freq¨uˆencia
normalizada (−1/2 ≤ f ≤ 1/2), em ciclos/amostra.
Portanto, a DEP de processos LRD tende a infinito na freq¨uˆencia zero. Observe que a definic¸˜ao 4 ´e assint´otica, pois o formato da DEP em freq¨uˆencias afastadas da origem n˜ao ´e especificado.
Uma definic¸˜ao alternativa pode ser dada no dom´ınio do
tempo, em termos da autocorrelac¸˜ao RY(m). Yt´e um processo
do tipo 1/fα se a sua autocorrelac¸˜ao RY(m), para valores
suficientemente grandes do lag m, decresce segundo uma func¸˜ao potˆencia (isto ´e, apresenta um decaimento lento para zero, do tipo hiperb´olico):
lim
m→∞
RY(m)
CRm−(1−α) = 1 , (6)
em que CR > 0. Por raz˜oes hist´oricas, ´e mais comum
caracterizar-se a mem´oria longa pelo parˆametro H de Hurst:
H = α + 1
2 ∈ (0, 5 ; 1) . (7)
Quanto maior o valor de H, maior ´e o grau de mem´oria longa do processo.
Um processo H-ss ´e LRD se 1/2 < H < 1. O processo Movimento Browniano (de tempo cont´ınuo) [22] satisfaz a definic¸˜ao 3, sendo auto-similar com H = 1/2 (mas n˜ao ´e LRD). Se o processo de incrementos Y (t) de X(t) (Y (t) =
X(t)− X(t − 1)) ´e estacion´ario, ent˜ao X(t) ´e denominado
H-sssi (H self-similar with stationary increments - auto-similar com incrementos estacion´arios).
Definic¸˜ao 5 (Auto-Similaridade Exata de Segunda Ordem):
seja o processo estacion´ario de incrementos Yt, t∈ Z. Ent˜ao,
Yt ´e um processo exatamente auto-similar de segunda ordem
com parˆametro de Hurst H (1/2 < H < 1) se,
γY(m) =
σY2
2 (|m + 1|2H− 2|m|2H+ |m − 1|2H),
m = . . . ,−1, 0, 1, . . . (8)
Observe-se que auto-similaridade de segunda ordem implica o comportamento LRD, pois 1/2 < H < 1.
O processo estacion´ario FGN Yt, proposto por Mandelbrot
e van Ness em 1968 [22], corresponde `a primeira diferenc¸a (´e o processo de incrementos) de um processo auto-similar
Xt denominado movimento Browniano fracion´ario de tempo
discreto (discrete fractional Brownian motion - DFBM) [6],
Yt= Xt− BXt= Xt− Xt−1= ∇Xt, (9)
em que B denota o operador atraso unit´ario e∇ = (1 − B) ´e
o operador diferenc¸a. A DEP do DFBM ´e dada pela f´ormula [7, p´ag. 280] PX(f) = σY2CH ∞ j=−∞ 1 |f + j|2H+1, (10)
em que σY2 ´e a potˆencia do FGN, CH = Γ(2H+1) sin (πH)2π2H+1 e
0 < H < 1. De acordo com (10), a DEP do DFBM possui um p´olo na origem, pois
PX(f) ∝ |f|1−2H, f → 0 . (11)
O DFBM ´e um processo integrado de ordem 1 (portanto ´e n˜ao estacion´ario), porque a sua primeira diferenc¸a, o FGN, ´e
estacion´aria. Como Yt= ∇Xt, o FGN e o DFBM est˜ao
rela-cionados pela func¸˜ao de transferˆencia (na vari´avel complexa z)
H(z) = Y (z)
X(z) = 1 − z
−1. (12)
A resposta em freq¨uˆencia ´e dada por
H(f ) = H(z)|z=ej2πf = 1 − e−j2πf. (13)
Como a relac¸˜ao entrada/sa´ıda em termos das DEPs ´e igual a [32, p´ag. 351]
PY(f) = |H(f)|2PX(f) , (14)
em que|H(f)|2 ´e dado por,
|H(f)|2= G(f) = 4 sin2(πf) , (15)
ent˜ao,
PY(f) = 4 sin2(πf)PX(f) . (16)
Assim, (10) e (16) mostram que a DEP do FGN ´e
caracte-rizada por somente dois parˆametros: σY2 e H (respons´avel pela
forma do espectro). Al´em disso, ´e importante se ter em mente que o FGN ´e completamente especificado pela sua m´edia e pela sua DEP, pois ´e gaussiano.
Em [19], ´e mostrado que (16) pode ser reescrita na forma:
PY(f) = A(f, H)[|2πf|−2H−1+ B(f, H)] , (17)
em que A(f, H) = 2 sin (πH)Γ(2H + 1)(1− cos (2πf)) e
B(f, H) =∞j=1[(2πj + 2πf)−2H−1+ (2πj − 2πf)−2H−1].
Para pequenos valores de f tem-se que PY(f) ∝ |f|1−2H .
Constata-se que o FGN apresenta seq¨uˆencia de autoco-variˆancia de acordo com (8), portanto trata-se de um processo exatamente auto-similar de segunda ordem quando 1/2 < H < 1. Para H = 1/2 , o FGN reduz-se a um ru´ıdo branco gaussiano. Quando 0 < H < 1/2, o processo ´e SRD.
A Fig. 2 apresenta os gr´aficos das DEPs de um modelo
AR(4) Xt = 2, 7607Xt−1− 3, 8106Xt−2+ 2, 6535Xt−3−
0, 9238Xt−4+ wt (SRD), em que wt ´e uma seq¨uˆencia de
inovac¸˜ao (ru´ıdo branco de potˆencia σ2W), e dos processos 1/fα
FGN(H = 0, 9) e FD(d = 0, 4). Uma vez que (17) da DEP do FGN envolve uma somat´oria infinita, a sua DEP foi desenhada com base na aproximac¸˜ao fornecida por Paxson em [19]. Os
trˆes processos tˆem a mesma potˆencia σ2. Note-se que a DEP
de um processo LRD tem um p´olo na origem e que as DEPs do FGN e do FD est˜ao superpostas na regi˜ao de freq¨uˆencias muito baixas. 0 0.1 0.2 0.3 0.4 0.5 -30 -20 -10 0 10 20 30 40 DEPs de processos SRD e 1/f f Magnitude em dB FD(0,4) AR(4) FGN(0,9)
Fig. 2. DEPs de processos AR(4), FD(0, 4) e FGN(0, 9) de mesma potˆencia.
Processos de integrac¸˜ao fracion´aria como o FD tˆem, por caracter´ıstica, o parˆametro de mem´oria longa d, que est´a relacionada a H por (18),
d = H− 1/2 . (18)
III. S´INTESE DETRAFEGO VIA´ WAVELETS
A. Transformada Wavelet Discreta
Uma wavelet ´e uma func¸˜ao de suporte compacto (durac¸˜ao finita) com m´edia temporal nula. H´a decomposic¸˜oes wavelet em tempo cont´ınuo e em tempo discreto. Este sec¸˜ao introduz
uma das vers˜oes discretas, a DWT (Discrete Wavelet
Trans-form), que ´e a ferramenta b´asica para o estudo de s´eries
temporais via wavelets. O leitor interessado poder´a encontrar, em [15], [35], [36], descric¸˜oes aprofundadas da teoria wavelet. Bases ortonormais constru´ıdas a partir de func¸˜oes wavelet s˜ao utilizadas para descric¸˜ao de sinais no plano tempo-escala (ou tempo-freq¨uˆencia), de maneira an´aloga `a transformada janelada de Fourier. A transformada wavelet ´e uma soluc¸˜ao natural para a an´alise de s´eries temporais auto-similares,
porque a sua aplicac¸˜ao envolve “dilac¸˜oes”6 (expans˜oes) de
bandas espectrais. Portanto, a DWT possui resoluc¸˜ao temporal vari´avel (a transformada janelada de Fourier n˜ao possui esta funcionalidade). Al´em disso, os coeficientes da DWT de
um sinal 1/fα s˜ao praticamente n˜ao-correlacionados (intra e
inter-escalas) [7], [16]. Por esta raz˜ao, as wavelets tˆem sido amplamente empregadas na an´alise e na s´ıntese (simulac¸˜ao) de sinais fractais [37].
Seja uma seq¨uˆencia{Vj}, j ∈ Z, de subespac¸os sucessivos
de aproximac¸˜ao do espac¸o das func¸˜oes de quadrado integr´avel
L2(R) que satisfaz `as seguintes propriedades [15]:
1) . . . V2⊂ V1⊂ V0⊂ V−1 ⊂ V−2⊂ . . .;
2) j∈ZVj= {};
3) j∈ZVj= L2(R);
4) x(t)∈ Vj ⇔ x(2jt)∈ V0, j > 0;
5) Existe uma func¸˜ao φj(t) = 2−j/2φ0(2−jt) em Vj,
denominada func¸ ˜ao de escala, tal que o conjunto
{φj,k, k ∈ Z} ´e uma base ortonormal de Vj, com
φj,k(t) = 2−j/2φ0(2−jt− k) ∀j, k ∈ Z.
A obtenc¸˜ao da func¸˜ao de escala φ0(t) da propriedade 5
depende da fam´ılia wavelet escolhida (Haar, Daubechies etc.) O leitor interessado poder´a encontrar mais detalhes sobre o assunto em [15].
Se a projec¸˜ao sobre Vj de x(t) ´e representada pelos
coefi-cientes de escala uj,k = x(t), φj,k, ent˜ao as propriedades 1
e 3 garantem que limj→−∞kuj,kφj,k(t) = x(t), ∀ x ∈
L2(R). A propriedade 4 implica que o subespac¸o Vj ´e
uma vers˜ao em escala do subespac¸o V0 (multirresoluc¸˜ao). A
base ortonormal mencionada na propriedade 5 ´e obtida por
translac¸˜oes no tempo da func¸˜ao passa-baixas φj.
Considere a seq¨uˆencia de aproximac¸˜oes sucessivas de x,
aproxj(t) = xj(t) =
k
uj,kφj,k(t) . (19)
De acordo com a propriedade 1, tem-se que
xj(t) = xj+1(t) + Δxj+1(t), (20)
em que Δxj+1(t) (dito detalhe de xj(t)) pertence ao
subespac¸o Wj+1, correspondente ao complemento ortogonal
do subespac¸o Vj+17. O detalhe Δxj+1(t) ´e obtido pela
equac¸˜ao Δxj+1(t) = k ψj+1,k(t) ψj+1,k(t), x(t) = dj+1(t) , (21)
6Dilations, em inglˆes. O termo “dilac¸ ˜ao” tem o significado de dilatac¸ ˜ao. 7Al´em disso,W
j+1est´a contido no subespac¸oVj.
em que ψj+1,k(t), x(t) = wj+1,k denotam os coeficientes
wavelet e{ψj+1,k(t)} ´e uma fam´ılia de func¸˜oes wavelets que
gera o subespac¸o Wj+1.
Na pr´atica, um sinal de tr´afego x pode ser capturado em v´arias escalas de tempo, resultando em um conjunto de s´eries
temporais {xj,k}, em que o ´ındice j = 0, 1, 2, . . . , J − 1
est´a associado `as escalas de interesse (j = 0 corresponde `a escala mais r´apida) e k ´e um ´ındice de tempo. A an´alise
de x comec¸a com a s´erie u0(k) = x0,k, φ0,k(t), k =
0, 1, . . . , M − 1. A seq¨uˆencia {u0(k)} ´e decomposta via
filtragem e subamostragem por um fator de 2 (downsampling)
em duas seq¨uˆencias: {u1(k)} e {d1(k)}, cada uma contendo
M/2 pontos. Este processo de filtragem e subamostragem ´e repetido v´arias vezes, obtendo-se as seq¨uˆencias
{{u0(k)}M,{u1(k)}M 2,{u2(k)}M4, . . . ,{uJ−1(k)}2J−1M } (22) e {{w1(k)}M 2,{w2(k)}M4 , . . . ,{wJ−1(k)}2J−1M } . (23)
A reconstruc¸˜ao ou s´ıntese de x ´e implementada via filtragem e sobreamostragem por um fator de 2 (upsampling) das
seq¨uˆencias (22) e (23). Ap´os J iterac¸˜oes, o sinal original x0,k
pode ser reconstru´ıdo por (24)
x0,k= aproxJ−1+ d1+ d2+ · · · + dJ−1. (24)
Diz-se que a func¸˜ao φ(t) determina uma an´alise de multirresoluc¸˜ao (MultiResolution Analysis - MRA) de x de acordo com (24), se a mesma obedece `as seguintes condic¸˜oes:
1) ortonormalidade intra-escala (propriedade 5)
φ(t − m), φ(t − n) = δm,n, (25)
em que δm,n´e o delta de Kronecker (δm,n= 1 se m =
n, δm,n= 0 para m = n). (25) imp˜oe uma condic¸˜ao de
ortonormalidade na escala j = 0. 2) m´edia unit´aria ∞ −∞φ(t) dt = 1 . (26) 3) equac¸˜ao de dilac¸˜ao 1 √ 2φ( t 2) = k hkφ(t− k) , (27)
em que um filtro hk de resposta impulsiva finita (FIR)
´e dado.
Demonstra-se que vale a relac¸˜ao [35] 1 √ 2ψ( t 2) = k gkφ(t− k) , (28)
conhecida como equac¸˜ao wavelet.
Mallat [36] propˆos uma maneira eficiente de implementar a decomposic¸˜ao recursiva de (22) e (23) utilizando-se ban-cos de filtros. A MRA ´e ent˜ao implementada via banban-cos de filtros passa-baixas G(f ) e passa-altas H(f ) (em que
G(f ) = ∞k=−∞gke−j2πfk e H(f ) =∞k=−∞hke−j2πfk)
adequadamente posicionados para separac¸˜ao dos sinais de aproximac¸˜ao e de detalhe. Posteriormente ´e poss´ıvel recons-truir o sinal original pelo mesmo processo de filtragens, de
modo que os filtros de decomposic¸˜ao e de reconstruc¸˜ao for-mam um sistema conhecido como Quadrature Mirror Filters (QMF). O algoritmo de Mallat ´e conhecido como algoritmo da pirˆamide. Ressalta-se que a complexidade desse algoritmo ´e O(M ), ao passo que o c´alculo “direto” da IDWT (que envolve
multiplicac¸˜ao de matrizes) ´e O(M2) [7].
B. Gerac¸˜ao de S´eries Auto-Similares Gaussianas
Kaplan e Kuo [26] mostraram que os coeficientes da DWT (com a base de Haar) do FGN s˜ao pouco correlacionados (intra e inter-escalas) e que a variˆancia desses coeficientes decai exponencialmente com o refinamento da escala, isto ´e,
Var{Wj}
Var{Wj−1}
= 2α. (29)
A Eq. (29) afirma que o FGN ´e caracterizado pela linearidade
do diagrama logscale log2(Var{wj}) versus j dos coeficientes
da an´alise wavelet de suas realizac¸˜oes. Resultados similares tamb´em foram obtidos por Flandrin [25] [38] para o processo FBM de tempo cont´ınuo analisado por meio da transformada
wavelet de tempo cont´ınuo. Wornell [39] [40] demonstrou
que s´eries temporais com espectro “quase” 1/fα podem ser
geradas a partir da IDWT de uma matriz de coeficientes
wavelet n˜ao-correlacionados.
Como (29) garante que o espectro de uma s´erie yt gerada
via algoritmo da pirˆamide seja aproximadamemte 1/fα para
f → 0, ent˜ao yt pode ser modelada como um processo de
integrac¸˜ao fracion´aria FD(d) [30, p´ag. 266]:
(1 − B)d(y
t− μ) = wt, (30)
em que μ denota a m´edia de yt, d ´e o parˆametro fracion´ario
(0 < d < 0, 5 para que ytseja estacion´ario e LRD) e wt ´e um
ru´ıdo branco gaussiano de m´edia nula e potˆencia σ2.
De acordo com Brockwell e Davis [9, p´ag. 349], uma s´erie
xt com estrutura de correlac¸˜ao mista pode ser obtida por
meio da filtragem linear da s´erie yt de (30), ou seja, xt pode
ser interpretada como a sa´ıda de um filtro (processo) linear
ARMA(p, q), cuja entrada ´e yt:
xt+ a1xt−1+ . . . + apxt−p= b0yt+ b1yt−1+ . . . + bqyt−q.
(31) A func¸˜ao de transferˆencia associada `a equac¸˜ao de diferenc¸as (31) ´e dada por
H(z) = B(z) A(z) = b0+ b1z−1+ . . . + bqz−q 1 + a1z−1+ . . . + apz−p , (32) ou H(z) = b0 q k=1(1 − ckz−1) p k=1(1 − dkz−1) . (33)
O filtro digital (33) ´e causal e est´avel se os p p´olos z = dk de
H(z) est˜ao dentro do c´ırculo de raio unit´ario, isto ´e, se|dk| <
1. Portanto, (30) e (31) sugerem que s´eries auto-similares que sejam simultaneamente LRD e SRD podem ser simuladas por meio de um gerador com dois est´agios, como ilustrado na
Fig. 1, em que o primeiro bloco produz a realizac¸˜ao yt(com
espectro 1/fα) via IDWT e a sa´ıda do segundo bloco, o qual
introduz SRD em yt, ´e a s´erie de interesse xt. Neste trabalho, o
segundo est´agio foi implementado por meio de um filtro IIR do
tipo H(z) = 1/A(z), o que garante a invertibilidade do filtro.
A s´erie xt ´e Gaussiana se as seq¨uˆencias dj,k s˜ao realizac¸˜oes
de ru´ıdos do tipo branco e gaussiano de m´edia nula. Observe-se que o gerador de tr´afego de B¨ackar s´o possui o primeiro est´agio.
B¨ackar sugere ter sintetizado “aproximac¸˜oes grosseiras” do FGN. Ressalta-se que o m´etodo de gerac¸˜ao via IDWT
n˜ao garante que o espectro de yt seja igual ao espectro do
FGN (f´ormula (17)), mas t˜ao somente que o comportamento
assint´otico seja o mesmo para f → 0. N˜ao obstante, a an´alise
espectral de v´arias realizac¸˜oes yt(conforme ser´a visto no sec¸˜ao
IV) mostra que a sa´ıda do primeiro est´agio simula, do ponto de vista pr´atico, os processos FGN e FD, conforme ilustrado pela Fig. 2. Essa figura mostra que as DEPs de processos FGN(H)
e FD(H − 1/2) (de mesma potˆencia) est˜ao superpostas nas
baixas freq¨uˆencias.
O procedimento de s´ıntese de uma s´erie xt de m´edia nula
e com M = 2J amostras adotado neste trabalho ´e o seguinte:
1) escolha o valor de H. Gere J − 1 seq¨uˆencias wavelet
{wj(k)} do tipo ru´ıdo branco gaussiano de m´edia nula
que obedec¸am `a condic¸˜ao (29), com Var{WJ−1(k)} =
1. O sinal de aproximac¸˜ao na escala mais lenta deve ser
nulo, ou seja, aproxJ−1(t) = 0.
2) escolha o filtro de escala passa-baixas G(f ) e o filtro
wavelet passa-altas H(f ) que ser˜ao utilizados pelo
al-goritmo da pirˆamide. Este trabalho utilizou os filtros de
Haar: {gk}k∈Z = {. . . , 0, g0 = √ 2 2 , g1 = √ 2 2 , 0, . . .} e {hk}k∈Z= {. . . , 0, h0= − √ 2 2 , h1= √ 2 2 , 0, . . .}.
3) projete um filtro digital causal, est´avel e invers´ıvel. As simulac¸˜oes deste artigo foram realizadas com o seguinte filtro passa-bandas:
H(f ) = 1
1 − 0, 3e−j2πf+ 0, 4e−j4πf . (34)
A Fig. 3 mostra a magnitude da resposta em freq¨uˆencia desse filtro.
4) gere o sinal ytpor meio da reconstruc¸˜ao piramidal.
5) filtre o sinal ytcom o filtro do passo (3) e obtenha uma
realizac¸˜ao xt.
Ressalta-se que o filtro IIR adotado (34) ´e, de certa maneira,
arbitr´ario. ´E v´alido indagar sobre o grau de SRD que deve estar
presente nas simulac¸˜oes de tr´afego. Entretanto, a resposta a essa pergunta n˜ao faz parte do escopo deste artigo. Por´em, note-se que a resposta em freq¨uˆencia adotada procura reforc¸ar
a DEP do ru´ıdo 1/fα nas m´edias freq¨uˆencias, conforme
sugerido, sob um ponto de vista qualitativo, pela DEP do AR(4) (Fig. 2).
IV. ANALISE´ ESTAT´ISTICA
A an´alise estat´ıstica das s´eries foi feita em duas partes: I) efetuou-se uma an´alise comparativa entre as s´eries geradas pelo m´etodo da FFT de Paxson e as do m´etodo wavelet; II) compararam-se as s´eries geradas pelo m´etodo wavelet antes e depois da filtragem. A utilizac¸˜ao do m´etodo de Paxson como
referˆencia ´e justificada pelo fato de que uma realizac¸˜ao xt
´e obtida a partir da transformada inversa discreta de Fourier de uma seq¨uˆencia de coeficientes X(n/M ) no dom´ınio da
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 5 4 3 2 1 0 1 2 3 4 5
Freqüência Normalizada (×π rad/amostra)
Magnitude (dB)
Magnitude da Resposta em Freqüência dB
Fig. 3. Filtro IIR utilizado para enfatizar m´edias freq¨uˆencias.
freq¨uˆencia, 0 ≤ n ≤ M − 1, que tenha DEP igual `a do
FGN. Como a s´erie gerada xt tem a DEP do FGN (por
construc¸˜ao), ent˜ao garante-se que xt simule o FGN, o que
foi confirmado pela an´alise estat´ıstica apresentada no artigo
[19]8. As realizac¸˜oes foram geradas variando-se o parˆametro
H na faixa de 0, 5 a 1, 0 em passos de 0, 05, sendo que para cada valor do parˆametro H foram sintetizadas trˆes realizac¸˜oes (ou seja, 33 realizac¸˜oes por m´etodo).
As seguintes estat´ısticas foram utilizadas:
1) func¸˜ao de autocorrelac¸˜ao ρX(m) (ACF - Autocorrelation
Function);9
2) DEP PX(f);
3) assimetria A(Xt), que representa a concentrac¸˜ao dos
valores em um dos extremos da distribuic¸˜ao;
4) curtose K(Xt), que indica o grau de achatamento de
uma densidade de probabilidade com relac¸˜ao `a normal; 5) H, pelos m´etodos de Whittle e do periodograma; J B,
de Jarque e Bera [41], para teste de normalidade. O estimador da ACF ´e dado por
ˆ ρX,m= 1 M s2X M t=m+1 (Xt− ˆμ)(Xt−m− ˆμ) , (35)
em que M ´e o n´umero de amostras, ˆμ ´e a m´edia amostral e
s2X ´e a variˆancia amostral. Note-se que−1 ≤ ρ ≤ 1.
O estimador ˆPX(f) da DEP ´e obtido pelo m´etodo
n˜ao-param´etrico10 do periodograma [42], com janelamento de
dados (data tapering, para reduc¸˜ao de vazamento de potˆencia)
8Paxson disponibilizou programas em linguagens S e C para gerac¸˜ao de s´eries FGN aproximadas. Este estudo utilizou o c´odigo escrito em S.
9Na literatura de engenharia, o termo func¸˜ao de autocorrelac¸ ˜ao est´a asso-ciado ao momentoRX(m). Na ´area estat´ıstica, a ACF ρX(m) corresponde a RX(m)
σ2 X .
10Os m´etodos param´etricos de an´alise espectral s˜ao baseados em modelos AR, MA e ARMA. Portanto n˜ao devem ser aplicados para estimac¸˜ao da DEP de um ru´ıdo 1/fα.
e suavizac¸˜ao (smoothing, para reduc¸˜ao da variabilidade de ˆ
PX(f)). O periodograma ´e calculado via11
ˆ
PX(f) = 1
M|X(f)|
2. (36)
A assimetria ´e um momento de 3a
¯ ordem e ´e dada por
A(Xt) = E (X t− μ)3 σ3 , (37)
em que μ ´e a m´edia e σ ´e o desvio-padr˜ao de Xt.
O estimador de assimetria ´e definido como ˆ A(Xt) = 1 M s3X M t=1 (Xt− ˆμ)3. (38)
A curtose ´e um momento de 4a
¯ ordem e ´e definida como
K(Xt) = E (X t− μ)4 σ4 . (39)
O estimador da curtose ´e dado pela f´ormula ˆ K(Xt) = 1 M s4X M t=1 (Xt− ˆμ)4. (40)
Observe-se que a distribuic¸˜ao Gaussiana possui A = 0 e K = 3.
O teste de Jarque-Bera ´e baseado nas medidas de assimetria e curtose. A estat´ıstica desse teste ´e definida como
J B = M 6 ˆ A2+( ˆK− 3) 2 4 . (41)
Sob a hip´otese nula (H0) de que os dados sejam normalmente
distribu´ıdos, espera-se que J B ∼ χ2(2) (chi-quadrada com
dois graus de liberdade).
O m´etodo de estimac¸˜ao do parˆametro H de Whittle [30] ´e baseado em uma estimac¸˜ao de m´axima verossimilhanc¸a no dom´ınio da freq¨uˆencia, assumindo-se que a s´erie seja
modelada por um processo FD(d)12. O m´etodo de estimac¸˜ao
de H pelo periodograma baseia-se no fato de que PX(f) ∝
f1−2H para freq¨uˆencias pr´oximas de zero.
Os testes de hip´otese foram avaliados com base na estat´ıstica
p-value [43]. Para um dado n´ıvel de significˆancia α , rejeita-se
H0se p≤ α, ao passo que aceita-se H0se p > α. Deste modo,
quanto menor for o valor do p-value maior ser´a a evidˆencia
emp´ırica de que H0 deve ser rejeitada em favor da hip´otese
alternativa H1.
A. Comparac¸˜ao entre as S´eries Geradas via FFT e Wavelets
O teste de Jarque-Bera rejeitou a normalidade de apenas 2 de 33 realizac¸˜oes geradas pelo m´etodo da FFT a um n´ıvel de significˆancia α = 1%. Para as s´eries geradas pelo m´etodo
wavelet, o teste rejeitou apenas uma das realizac¸˜oes com o
mesmo α. A Tabela I mostra as estimativas de assimetria e de curtose para as s´eries geradas via FFT e wavelets. Portanto,
TABELA I
ESTIMATIVAS DEASSIMETRIA ECURTOSE DAS SERIES GERADAS VIA´ FFT
Ewavelets. H Aˆ Kˆ FFT H → 0, 5 | ˆA| ≤ 0, 05 | ˆK − 3| ≤ 0, 1 H → 1, 0 | ˆA| ≤ 0, 2 | ˆK − 3| ≤ 0, 1 Wavelets H → 0, 5 | ˆA| ≤ 0, 05 | ˆK − 3| ≤ 0, 15 H → 1, 0 | ˆA| ≤ 0, 1 | ˆK − 3| ≤ 0, 15
os testes realizados indicam que as s´eries geradas pelos dois m´etodos tˆem distribuic¸˜ao aproximadamente Gaussiana.
As Figs. 4, 5, 6 e 7 mostram os gr´aficos de ACF e periodograma suavizado para s´eries simuladas via FFT e
wavelets com H = 0, 6 ; 0, 75 e 0, 9. Os periodogramas
Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.FFT.H.60 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.FFT.H.75 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.FFT.H.90
Fig. 4. Autocorrelac¸ ˜ao de algumas s´eries geradas pelo m´etodo da FFT.
mostram que as DEPs das s´eries com H = 0, 75 e 0, 9 de ambos os m´etodos tˆem p´olos na origem, ou seja, que
as s´eries s˜ao 1/fα. J´a para o caso das simulac¸˜oes com
H = 0, 6, observa-se que: a) a variabilidade do periodograma da s´erie gerada via wavelets ´e maior do que a variabilidade do periodograma da s´erie FFT; b) o periodograma da s´erie
wavelet n˜ao indica, de modo claro, se h´a ou n˜ao um p´olo
na origem. A comparac¸˜ao entre os gr´aficos de autocorrelac¸˜ao para H = 0, 75 e 0, 9 mostra que a taxa de decaimento da autocorrelac¸˜ao aumenta com H.
As Figs. 8 e 9 mostram as curvas de H (usado como
parˆametro de modelagem) versus ˆH estimado por meio do
11A definic¸ ˜ao foi dada sem incluir o janelamento e a suavizac¸˜ao, para melhor compreens˜ao da natureza essencial do estimador.
12O m´etodo de Whittle usa o periodograma.
frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 34 36 38 40 Series: fGn.FFT.H.60 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 30 35 40 45 Series: fGn.FFT.H.75 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 25 30 35 40 45 50 Series: fGn.FFT.H.90 Smoothed Periodogram
Fig. 5. Periodograma suavizado de algumas s´eries geradas pelo m´etodo da FFT.
m´etodo de Whittle [6] para os dois m´etodos de gerac¸˜ao. De acordo com Paxson [19], esse ´e um bom m´etodo de estimac¸˜ao de H para s´eries que apresentam LRD.
A Fig. 8 sugere que o m´etodo de gerac¸˜ao via FFT tende a gerar s´eries com H superior ao que ´e usado como entrada do modelo (vi´es positivo), enquanto a Fig. 9 sugere que o m´etodo
wavelet tende a produzir s´eries com H inferior ao da entrada
do modelo (vi´es negativo). A Fig. 8 sugere tamb´em que pode
haver saturac¸˜ao para valores de H ≥ 0, 95 quando se usa o
m´etodo da FFT.
B. Comparac¸˜ao entre as S´eries Geradas pelo M´etodo Wavelet com e sem Filtro IIR
O teste de Jarque-Bera rejeitou a normalidade de apenas trˆes s´eries a um n´ıvel de significˆancia α = 1%. A Tabela II mostra as medidas de assimetria e curtose. Portanto, os testes realizados indicam que as s´eries geradas continuam a apresentar distribuic¸˜ao aproximadamente Gaussiana (como esperado).
TABELA II
ESTIMATIVAS DEASSIMETRIA ECURTOSE DAS SERIES GERADAS VIA´
waveletsAPOS FILTRAGEM´ .
H Aˆ Kˆ
Wavelets H → 0, 5 | ˆA| ≤ 0, 06 | ˆK − 3| ≤ 0, 3 com filtro IIR H → 1, 0 | ˆA| ≤ 0, 06 | ˆK − 3| ≤ 0, 3
As Figs. 10 e 11 mostram os gr´aficos da autocorrelac¸˜ao e periodograma suavizado para s´eries simuladas com H =
Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.H.60 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.H.75 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.H.90
Fig. 6. Autocorrelac¸ ˜ao de algumas s´eries geradas via wavelets.
0, 6; 0, 75 e 0, 9, ap´os filtragem. O periodograma da s´erie gerada com H = 0, 6 n˜ao apresenta p´olo na origem. Por outro lado, o periodograma da s´erie sintetizada com H = 0, 9 mostra, de forma clara, que a s´erie ´e mista, isto ´e, h´a presenc¸a simultˆanea de LRD e SRD (para tal, deve-se comparar esse gr´afico com o periodograma para H = 0, 9 da Fig. 7). O periodograma da s´erie modelada com H = 0, 75 sugere uma situac¸˜ao de transic¸˜ao do comportamento SRD observado no gr´afico com H = 0, 6 para a caracter´ıstica mista da s´erie com H = 0, 9.
Diferentemente do procedimento usado nos dois conjuntos
anteriores de realizac¸˜oes, em que as curvas H versus Hˆ
foram levantadas com base somente no m´etodo de Whittle, as
curvas H versus ˆH relativas `as s´eries filtradas foram obtidas
por dois m´etodos distintos, o de Whittle (Fig. 12) e o do periodograma (Fig. 13) com a finalidade de se avaliarem os desempenhos desses dois estimadores nesta nova situac¸˜ao, qual seja, presenc¸a simultˆanea de LRD e SRD.
A curva obtida pelo m´etodo de Whittle ´e similar `a do caso em que as s´eries foram geradas via wavelets, por´em sem filtragem. Por outro lado, a Fig. 13 mostra que o m´etodo do periodograma tende a subestimar o valor de H, apresen-tando maior variabilidade do que o estimador de Whittle. Sato [44] tamb´em observou a maior variˆancia do estimador via periodograma em sua pesquisa. De acordo com [42], o periodograma ´e um estimador que tem os seguintes problemas: inconsistˆencia, grande variˆancia e vi´es para M finito. Portanto, justifica-se o comportamento observado na Fig. 13.
frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -7 -6 -5 -4 -3 -2 -1 Series: fGn.Haar.H.60 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -14 -10 -8 -6 -4 Series: fGn.Haar.H.75 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -20 -15 -10 -5 Series: fGn.Haar.H.90 Smoothed Periodogram
Fig. 7. Periodograma suavizado de algumas s´eries geradas via wavelets.
V. CONCLUSAO˜
O presente trabalho reproduziu e comparou, com sucesso, os mecanimos de gerac¸˜ao de s´eries temporais apresentados nos trabalhos de Paxson e B¨ackar, que se mostraram eficientes
para s´ıntese de s´eries temporais 1/fα. Demonstrou-se que a
gerac¸˜ao de s´eries auto-similares via algoritmo da pirˆamide n˜ao garante que as realizac¸˜oes obtidas s˜ao FGN, mas apenas que
estas tˆem comportamento 1/fα (o que ´e suficiente quando
se quer gerar teletr´afego LRD). Ressalta-se que o trabalho de B¨ackar n˜ao se utilizou de testes estat´ısticos como o de Whittle ou do periodograma para comprovar que tais s´eries apresentam parˆametro H de acordo com o esperado, o que ´e complementado pelo procedimento de an´alise deste trabalho. Buscou-se, neste estudo, verificar as caracter´ıticas LRD e Gaussianas das s´eries geradas. Observou-se que o estimador do parˆametro H de Whittle ´e mais robusto do que o estimador pelo m´etodo do periodograma quando as s´eries s˜ao LRD (sa´ıda do primeiro est´agio) ou quando apresentam LRD e SRD (in-troduzida por um filtro passa-bandas) simultaneamente. Adi-cionalmente, constatou-se que uma escolha n˜ao cautelosa de um estimador para o parˆametro H pode levar a resultados com demasiada variabilidade, ou ainda vi´es. Tamb´em demonstrou-se que o m´etodo de dois est´agios proposto ´e bastante flex´ıvel e capaz de inserir dependˆencia de curta durac¸˜ao em realizac¸˜oes
de processos do tipo 1/fα.
Em trabalhos futuros, ser´a feita uma an´alise espectral de s´eries reais de teletr´afego (provenientes de diferentes redes de comunicac¸˜oes) com o objetivo de se investigar o n´ıvel de SRD presente nesses traces. Tamb´em ser´a avaliado o desempenho de v´arios estimadores do parˆametro de Hurst em s´eries com
H desejado H estimado 0.5 0.6 0.7 0.8 0.9 1.0 0.5 0.6 0.7 0.8 0.9 1.0 H estimado H ideal
Fig. 8. CurvaH versus ˆH para s´eries geradas via FFT.
H desejado H estimado 0.5 0.6 0.7 0.8 0.9 1.0 0.5 0.6 0.7 0.8 0.9 1.0 H estimado H ideal
Fig. 9. CurvaH versus ˆH para s´eries geradas via wavelets.
estrutura de correlac¸˜ao mista. Diante da relevˆancia do modelo de teletr´afego Multifractal Wavelet Model (MWM), pretende-se implementar espretende-se modelo, avaliar o efeito do est´agio de inserc¸˜ao de dependˆencia de curta durac¸˜ao sobre as realizac¸˜oes do modelo MWM e aplicar o mesmo procedimento de an´alise desenvolvido neste trabalho para avaliac¸˜ao dos resultados.
AGRADECIMENTOS
Os autores agradecem `a Ericsson Telecomunicac¸˜oes por ter financiado a pesquisa do grupo no per´ıodo 2000-2002, por meio do contrato USP-08 LCS/FDTE/Ericsson (Projeto
Wire-less Multimedia Distributed Applications). Tamb´em somos
gratos ao prof. dr. Luiz Antonio Baccal´a (LCS-PTC-EPUSP),
Lag ACF 0 20 40 60 80 100 -0.2 0.2 0.6 1.0 Series : fGn.Haar.IIR2.H.60 Lag ACF 0 20 40 60 80 100 0.0 0.4 0.8 Series : fGn.Haar.IIR2.H.75 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.IIR2.H.90
Fig. 10. Autocorrelac¸ ˜ao de s´eries filtradas.
por ter nos auxiliado com in´umeras cr´ıticas e sugest˜oes, princi-palmente na ´area de processamento de sinais via wavelets, e ao prof. dDr. Pedro Morettin (MAE-IME-USP), pelas discuss˜oes sobre a teoria de s´eries temporais.
REFERENCIASˆ
[1] H. Sato, Teletraffic Technologies in ATM Networks. Artech House, 1994.
[2] M. Schwartz, Broadband Integrated Networks. Prentice Hall, 1996. [3] W. Leland, M. Taqqu, W. Willinger, and D. Wilson, “On the self-similar
nature of ethernet traffic (extended version),” IEEE/ACM Transactions
on Networking, vol. 2, no. 1, pp. 1–15, Feb. 1994.
[4] V. Paxson and S. Floyd, “Wide-area traffic: The failure of Poisson modeling,” IEEE/ACM Transactions on Networking, vol. 3, no. 3, pp. 226–244, June 1995.
[5] A. Erramilli, O. Narayan, and W. Willinger, “Experimental queueing analysis with long-range dependent traffic,” IEEE/ACM Transactions on
Networking, vol. 4, pp. 209–223, April 1996.
[6] J. Beran, Statistics for Long-Memory Processes. Chapman & Hall, 1994.
[7] D. B. Percival and A. T. Walden, Wavelet Methods for Time Series
Analysis. Cambridge University Press, 2000.
[8] G. E. P. Box, G. M. Jenkins, and G. C. Reinsel, Time Series Analysis:
Forecasting and Control, 3rd ed. Prentice Hall, 1994.
[9] P. J. Brockwell and R. A. Davis, Introduction to Time Series and
Forecasting. New York, NY: Springer-Verlag, 1996.
[10] R. Riedi and J. L. V´ehel, “Multifractal properties of TCP traffic: a numerical study, tech. rep. 3129,” INRIA Rocquencourt, France, Tech. Rep., 1997. [Online]. Available: http://www.dsp.rice.edu/∼riedi/ cv publ theme.html
[11] A. Feldmann, A. C. Gilbert, and W. Willinger, “Data networks as cascades: investigating the multifractal nature of Internet WAN traffic,”
Computer Communication review, vol. 28, no. 4, pp. 42–55, 1998.
[12] A. C. Gilbert, W. Willinger, and A. Feldmann, “Scaling analysis of conservative cascades, with applications to network traffic,” IEEE
Transactions on Information Theory, vol. 45, no. 3, pp. 971–991, April
1999, special Issue on “Multiscale Statistical Signal Analysis and its Applications”.
frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -10 -6 -4 -2 0 Series: fGn.Haar.IIR2.H.60 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -18 -14 -10 -6 Series: fGn.Haar.IIR2.H.75 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -25 -20 -15 -10 -5 Series: fGn.Haar.IIR2.H.90 Smoothed Periodogram
Fig. 11. Periodograma suavizado de s´eries filtradas.
[13] A. B. de Lima, “Proposta de uma estrat´egia para controle de admiss˜ao de conex˜oes baseado em medic¸ ˜oes de tr´afego agregado e caracterizac¸ ˜ao de redesIP,” Dissertac¸ ˜ao de Mestrado, Escola Polit´ecnica da USP, S˜ao Paulo, 2002.
[14] C. R. Barra, “Caracterizac¸ ˜ao experimental e por simulac¸ ˜ao e modelagem da qualidade de servic¸o obtida na transmiss˜ao de ´audio e v´ıdeo em tempo real.” Tese de Doutorado, Escola Polit´ecnica da USP, S˜ao Paulo, 2005. [15] I. Daubechies, Ten Lectures on Wavelets. Philadelphia: SIAM, 1992. [16] R. Genc¸ay, F. Selc¸uk, and B. Whitcher, An Introduction to Wavelets and
Other Filtering Methods in Finance and Economics. Academic Press, 2001.
[17] S. Ma and C. Ji, “Modeling heterogeneous network traffic in wavelet domain,” IEEE Transactions on Networking, vol. 9, no. 5, pp. 634–649, Oct. 2001.
[18] D. B. Percival, “Simulating Gaussian random processes with specified spectra,” Computing Science and Statistics, vol. 24, pp. 534–538, 1992. [19] V. Paxson, “Fast, approximate synthesis of fractional Gaussian noise for generating self-similar network traffic,” Computer Communication
review, vol. 27, pp. 5–18, Oct. 1997.
[20] J. R. M. Hosking, “Modeling persistence in hydrological time series using fractional differencing,” Water Resources Research, vol. 20, pp. 1898–1908, 1984.
[21] R. B. Davies and D. S. Harte, “Tests for Hurst effect,” Biometrika, vol. 74, pp. 95–101, 1987.
[22] B. B. Mandelbrot and J. V. Ness, “Fractional brownian motions, frac-tional noises and applications,” SIAM Rev., vol. 10, pp. 422–437, Feb. 1968.
[23] C. W. J. Granger, , and R. Joyeux, “An introduction to long-memory time series models and fractional differencing,” Journal of Time Series
Analysis, vol. 1, pp. 15–29, Oct. 1980.
[24] J. R. M. Hosking, “Fractional differencing,” Biometrika, vol. 68, pp. 165–176, Oct. 1981.
[25] P. Flandrin, “Wavelet analysis and synthesis of fractional brownian motion,” IEEE Transactions on Information Theory, vol. 38, no. 2, pp. 910–917, 1992.
[26] L. M. Kaplan and C.-C. J. Kuo, “Fractal estimation from noisy data via discrete fractional Gaussian noise (DFGN) and the Haar basis,” IEEE
Transactions on Signal Processing, vol. 12, pp. 3554–3562, 1993.
[27] J.-A. B¨ackar, “A framework for implementing fractal traffic models in real time,” Master Thesis, SERC, Melbourne, 2000.
H desejado H estimado 0.5 0.6 0.7 0.8 0.9 1.0 0.5 0.6 0.7 0.8 0.9 1.0 H estimado H ideal
Fig. 12. CurvaH versus ˆH (m´etodo de Whittle) para s´eries filtradas.
H desejado H estimado 0.5 0.6 0.7 0.8 0.9 1.0 0.4 0.5 0.6 0.7 0.8 0.9 H estimado H ideal
Fig. 13. CurvaH versus ˆH (m´etodo do periodograma) para s´eries filtradas.
[28] R. H. Riedi, M. S. Crouse, V. J. Ribeiro, and R. G. Baraniuk, “A multifractal wavelet model with application to network traffic,” IEEE
Transactions on Information Theory, vol. 45, no. 3, pp. 992–1018, April
1999.
[29] M. Taqqu, V. Teverovsky, and W. Willinger, “Estimators for long-range dependence: An empirical study,” Fractals, vol. 3, pp. 785–798, 1995. [30] E. Zivot and J. Wang, Modeling Financial Time Series with S-PLUS.
Springer, 2003.
[31] A. Papoulis, Probability, Random Variables, and Stochastic Processes, 3rd ed. McGraw-Hill, 1996.
[32] H. Stark and J. W. Woods, Probability and Random Processes with
Applications to Signal Processing, 3rd ed. Upper Saddle River, NY: Prentice Hall, 2002.
[33] J. P. Z. Peebles, Probability, Random Variables, and Random Signal
Principles, third edition ed. McGraw-Hill, 1993.
[34] P. A. Morettin and C. M. C. Toloi, An´alise de S´eries Temporais. Editora Edgard Bl¨ucher, 2004.
[35] G. Kaiser, A Friendly Guide to Wavelets. Boston, Mass.: Birkh¨auser, 1994.
[36] S. G. Mallat, “A theory for multiresolution signal decomposition: The wavelet representation,” IEEE Transactions on Pattern Analysis and
Machine Intelligence, vol. 11, pp. 674–693, 7 1989.
[37] P. Abry and D. Veitch, “Wavelet analysis of long-range dependent traffic,” IEEE Transactions on Information Theory, vol. 4, no. 1, pp. 2–15, 1998.
[38] P. Flandrin, “On the spectrum of fractional brownian motions,” IEEE
Transactions on Information Theory, vol. 35, pp. 197–199, 1989.
[39] G. W. Wornell, “A karhunen-lo`eve-like expansion for 1/f processes via wavelets,” IEEE Transactions on Information Theory, vol. 36, no. 4, pp. 859–861, July 1990.
[40] ——, “Wavelet-based representations for the 1/f family of fractal pro-cesses,” Proceedings of the IEEE, vol. 81, no. 10, pp. 1428–1450, Oct. 1993.
[41] C. M. Jarque and A. K. Bera, “A test for normality of observations and regression residuals,” International Statistical Review, vol. 55, no. 5, pp. 163–172, 1987.
[42] D. B. Percival and A. T. Walden, Spectral Analysis for Physical
Applications. New York, NY: Cambridge, 1993.
[43] G. Casella and R. L. Berger, Statistical Inference, 2nd ed. Duxbury, 2002.
[44] J. R. Sato, “Processos com mem´oria longa compartilhada,” Dissertac¸ ˜ao de Mestrado, IME-USP, S˜ao Paulo, 2004.
Fernando Lemos de Mello recebeu o t´ıtulo de engenheiro eletricista (ˆenfase em telecomunicac¸ ˜oes) pela Escola Polit´ecnica da Universidade de S˜ao Paulo (EPUSP), Brasil, em 2002. Atua na seguinte ´area de pesquisa: s´ıntese de teletr´afego. Est´a cur-sando o mestrado em engenharia el´etrica na EPUSP.
Alexandre Barbosa de Lima recebeu os t´ıtulos de bacharel em ciˆencias navais (ˆenfase em eletrˆonica) pela Escola Naval, Brasil, em 1990, de engenheiro eletricista (ˆenfase em telecomunicac¸ ˜oes) pela Escola Polit´ecnica da Universidade de S˜ao Paulo (EPUSP), Brasil, em 1996, e de mestre em engenharia el´etrica (´area de concentrac¸ ˜ao sistemas eletrˆonicos) pela EPUSP em 2002. Atua nas seguintes ´areas de pesquisa: modelagem de teletr´afego, QoS em redes e processamento digital de sinais. Est´a cursando o doutorado em engenharia el´etrica na EPUSP.
Marcelo Lipas recebeu o t´ıtulo de engenheiro eletricista (ˆenfase em telecomunicac¸ ˜oes) pela Es-cola Polit´ecnica da Universidade de S˜ao Paulo (EPUSP), Brasil, em 2001. Atua nas seguintes ´areas de pesquisa: modelagem de teletr´afego e processa-mento digital de sinais. Est´a cursando o mestrado em engenharia el´etrica na EPUSP.
Jos´e Roberto de A. Amazonas recebeu o t´ıtulo de engenheiro eletricista pela Escola Polit´ecnica da Universidade de S˜ao Paulo (EPUSP), Brasil, em 1979, al´em dos t´ıtulos de mestre, doutor e livre-docente pela EPUSP, em 1983, 1988 e 1996, respec-tivamente.
´
E professor associado do Departamento de Enge-nharia de Telecomunicac¸ ˜oes e Controle da EPUSP, onde ´e respons´avel por pesquisa e ensino de comunicac¸ ˜oes ´opticas e redes de comunicac¸˜ao de alta velocidade. Esteve em diversos cargos em uni-versidades no Brasil e na Europa, e tamb´em liderou pesquisas em parceria com v´arias companhias brasileiras, europ´eias e norte-americanas.
Seus interesses s˜ao na ´area de comunicac¸ ˜oes ´opticas, redes cabeadas e sem-fio, qualidade de servic¸o (QoS) e ensino a distˆancia (EaD).