Geração de Séries Auto-Similares Gaussianas via Wavelets para Uso em Simulações de Tráfego

(1)

Geração de Séries Auto-Similares Gaussianas via

Wavelets para Uso em Simulações de Tráfego

F. L. de Mello, A. B. de Lima, M. Lipas, Membro, IEEE, e J. R. de A. Amazonas

Resumo— Medidas mostraram que o tráfego das redes possui propriedades fractais, tais como auto-similaridade e memória longa (ou dependência de longa duração). A memória longa é caracterizada pela existência de um p ólo na origem da função densidade espectral (formato 1/fα, 0 < α < 1). Também foi constatado que o tráfego pode apresentar dependência de curta duração em algumas escalas temporais. A utilização de um gerador de tráfego agregado “realista”, que sintetize séries temporais fractais, é fundamental para a validaç ão de algoritmos de controle de tráfego. Neste trabalho, a s´ıntese de realizações aproximadas de um tipo de processo aleatório auto-similar denominado Ru´ıdo Gaussiano Fracion ário é feita via transformada wavelet. O método proposto também é capaz de sintetizar séries Gaussianas com espectros mais genéricos do que

1/fα_{, ou seja, séries que também apresentam dependência de} curta duração. A geração é feita em dois estágios. O primeiro gera uma realização aproximada do Ru´ıdo Gaussiano Fracionário via Transformada Wavelet Discreta. O segundo introduz dependência de curta duração por meio de de uma filtragem IIR (Infinite Impulse Response) da sa´ıda do primeiro estágio. Efetuou-se uma caracterização detalhada das séries resultantes, utilizando-se nas análises momentos estat´ısticos de2a¯, 3a¯e4a¯ordens, além de testes

estat´ısticos espec´ıficos para séries auto-similares. Verificou-se que o estimador de Whittle do parâmetro de HurstH é mais robusto do que o do método do periodograma em séries que apresentam, simultaneamente, dependência de curta e de longa duração.

Palavras-chave— Auto-similaridade, dependência de longa duração, dependência de curta duração, memória longa, tráfego, wavelets.

I. INTRODUC¸ ˜AO

A

T ´E o in´ıcio da d´ecada de 1990, pensava-se que o

tr´afego das redes1 _{de pacotes poderia ser modelado pelo}

processo aleatório de Poisson [1], [2]. Entretanto, medidas em redes locais [3] e de grande área [4] mostraram que o teletráfego possui propriedades fractais, tais como memória longa (Long Range Dependence - LRD) ou persistência e auto-similaridade. A memória longa implica a existência de um pólo na origem da Densidade Espectral de Potência (DEP). Um objeto matemático (conjunto, medida etc.) é auto-similar quando apresenta auto-similaridades estruturais em todas (ou pelo menos em uma faixa dinâmica extensa) as escalas de observação. No caso do teletráfego, a alternância de per´ıodos de surto e de suavidade (impulsividade ou burstiness) e a

Manuscrito recebido em 30/3/2006 e revisado em 25/5/2006.

Fernando Lemos de Mello, Alexandre Barbosa de Lima, Marcelo Lipas e José Roberto de Almeida Amazonas são membros do Laboratório de Comunicaç ões e Sinais do Departamento de Engenharia de Telecomunicaç ões e Controle da Escola Politécnica da Universidade de São Paulo (LCS-PTC-EPUSP). e-mails:{mello,ablima,lipas,jra}@lcs.poli.usp.br

1_{Entenda-se “tráfego” como a série temporal de chegadas de pacotes em} um nó da rede.

LRD s˜ao mantidas em v´arias escalas de tempo, na faixa de ms a min ou h (a auto-similaridade ocorre em um sentido estat´ıstico).

A memória longa pode levar a maiores taxas de perda de pacotes do que as que são previstas pela teoria clássica das filas [3], [5]. Séries de memória longa também foram observadas nas áreas de Climatologia e Hidrologia (década de 1950) e, mais recentemente, em séries de dados econômicos e finan-ceiros (década de 1980) e séries de imagens de ressonância magnética funcional do cérebro humano (década de 1990) [6], [7].

Os artigos [3] e [4] mostraram que não é razoável supor que séries de teletráfego possam ser geradas por modelos ARMA (Autoregressive Moving Average) ou Markovianos, cujas autocorrelações decaem exponencialmente para zero com o aumento do lag [8], [9]. Na literatura, os processos LRD

s˜ao tamb´em conhecidos como processos com espectro 1/fα,

0 < α < 1.

Mais recentemente, o estudo emp´ırico de Riedi e Véhel [10] (vide também Feldmann et al. [11] e Gilbert et al. [12]) mostrou que o tráfego TCP/IP é um multifractal aleatório em escalas refinadas de tempo (até centenas de ms) e assintoti-camente auto-similar de segunda ordem em escalas temporais de maior agregação (segundos, minutos etc.). Dito de forma simples, o tráfego pode ser um multifractal em escalas “mais rápidas” porque o seu grau de impulsividade, que é caracteri-zado pelo parâmetro de Hurst H (conforme será visto na seção II), varia aleatoriamente no tempo.

A implementação de mecanismos preventivos de controle de tráfego, tais como o Controle de Admissão de Conexões (CAC) [13] e Controle Dinâmico de QoS (Quality of

Ser-vice) [14], ´e essencial para o bom funcionamento de uma

rede multisserviço. Sem controle, a demanda irrestrita pelos recursos compartilhados (buffers, banda e processadores) pode degradar seriamente o desempenho da rede. O controle do tráfego é necessário para proteger a QoS percebida pelos usuários e para assegurar a eficiente utilização dos recursos da rede. Os testes de validação dos algoritmos de controle de tráfego devem ser realizados com um tráfego agregado “realista” e bem definido. Deve-se ter a possibilidade de se variar as propriedades do tráfego utilizado nas simulações.

A transformada wavelet ´e indicada para a an´alise e a s´ıntese

de sinais 1/fα[7], [15], [16] porque:

1) os coeﬁcientes wavelet de um processo 1/fαs˜ao

aproxi-madamente não correlacionados no plano tempo-escala. Portanto, a modelagem e o processamento desses sinais naquele dom´ınio podem ser realizado de maneira efi-ciente. Mais precisamente, pode-se afirmar que não há

(2)

correlação entre coeficientes wavelet de uma mesma escala e que a correlação entre escalas diferentes é fraca (neste caso, a correlação é maior entre escalas adjacentes [17]).

2) é o método mais eficiente do ponto de vista computa-cional. A complexidade (em termos de operações de adição e multiplicação) associada à geração de uma realização de M amostras é O(M ). Métodos baseados na FFT (Fast Fourier Transform) [18], [19] possuem complexidade O(M log M ). A técnica de geração no dom´ınio do tempo de Hosking [20], baseada nas

re-cursões de Levinson-Durbin, requer O(M2) operações.

3) oferece a possibilidade de s´ıntese de tr´afego n˜ao-gaussiano.

4) a noção de escala temporal é intr´ınseca à definição da transformada.

Davies e Harte [21] introduziram na literatura estat´ıstica o método DHM (Davies and Harte Method) de geração de realizações de processos estacionários gaussianos de média nula. O método assume que a seqüência de autocovariância é conhecida, como é o caso para o Ru´ıdo gaussiano Fracionário (Fractional Gaussian Noise - FGN) [22] e para o Ru´ıdo Branco Fracionário (Fractionally Differenced Process - FD) [23], [24]. O método é baseado na FFT. Percival [18] publicou outro método baseado na FFT, denominado Gaussian

Spec-tral Synthesis Method (GSMM). Paxson [19] tamb´em propˆos

um método de geração de realizações aproximadas do FGN baseado na FFT, porém sua estratégia foi baseada no artigo de Flandrin [25]. Paxson demonstrou que o seu método gera séries estatisticamente indistingu´ıveis de realizações FGN. Note que os três métodos acima compartilham a caracter´ıstica de utilizarem o método da FFT para geração de séries tem-porais, apresentando, portanto, complexidade O(M log M ), superior à complexidade do método proposto nesse trabalho.

De acordo com [26], a energia (variˆancia) dos coeﬁcientes da transformada wavelet do FGN decai exponencialmente com

o aumento da resolução temporal2. Bäckar [27] implementou

um gerador de tráfego fractal baseado nessa propriedade da transformada wavelet de processos LRD, tendo conseguido sintetizar realizações auto-similares gaussianas e do modelo

Wavelet Multifractal (Multifractal Wavelet Model - MWM)

[28]. Bäckar sugere ter implementado realizações aproximadas do FGN. Esta afirmação não é correta tecnicamente, pois, conforme será explicado na seção III, não há uma prescrição no dom´ınio tempo-escala que garanta que a DEP da série gerada seja a do FGN. Não obstante, reconhece-se o fato de que as DEPs obtidas são bastante similares às do FGN, podendo-se afirmar, do ponto de vista prático, que as séries simulam o FGN.

Entretanto, sabe-se que traces reais de tráfego também podem apresentar dependência de curta duração (Short Range

Dependence - SRD) ou mem´oria curta em escalas temporais

“mais rápidas” (por exemplo, em bins de 10 ms), o que significa dizer que uma parte não desprez´ıvel da energia do

2_{Assume-se que as escalas de tempo são diádicas. Portanto, aumenta-se a} resolução temporal dividindo-se a escala por um fator de 2, conforme será visto na seção III-A.

sinal pode estar localizada nas regiões de médias e altas freqüências do espectro [3], [19], [29]. Portanto, o formato

da DEP de teletr´afego pode ser mais gen´erico do que 1/fα_.

Os algoritmos de controle de tráfego também devem levar em conta a caracter´ıstica SRD do tráfego; portanto, há necessidade de se incorporar SRD ao tráfego simulado [19]. Observe-se que o gerador proposto por Bäckar [27] não pode simular (conforme será explicado no seção III-B) séries temporais com estrutura de correlação mista, isto é, séries que apresentam, simultaneamente, as caracter´ısticas LRD e SRD.

Ma et al. [17] desenvolveram os seguintes modelos gaus-sianos de tr´afego no dom´ınio wavelet, que capturam as carac-ter´ısticas LRD e SRD de um trace de treinamento:

1) general Markov model (modelo Markoviano gene-ralizado), que captura a SRD intra e inter-escalas. 2) independent wavelet model (modelo wavelet

indepen-dente), em que os coeficientes wavelet, em uma deter-minada escala, são modelados como variáveis aleatórias gaussianas independentes e identicamente distribu´ıdas (i.i.d.). Esse modelo assume que não há correlação entre escalas.

3) low-order Markov wavelet model (modelo wavelet Markoviano de ordem baixa), que captura a correlac¸˜ao entre escalas adjacentes.

A seqüência de autocorrelação amostral foi adotada como métrica de desempenho dos modelos. Os experimentos de Ma

et al. mostraram que o independent wavelet model (que ´e o

modelo mais simples) ´e capaz de caracterizar as propriedades

LRD e SRD de s´eries Gaussianas3 _{e que o desempenho}

de modelos wavelet Markovianos de ordem baixa é apenas marginalmente superior. A utilização dos modelos wavelet de Ma et al. em geradores de tráfego possui as seguintes desvantagens:

1) falta de flexibilidade. O algoritmo de geração de tráfego não usa o parâmetro de Hurst H como parâmetro de entrada (na prática, deseja-se que um gerador de tráfego auto-similar possa simular uma série com um dado valor de H).

2) os modelos wavelet Markoviano e Markoviano gene-ralizado não são atraentes do ponto de vista estat´ıstico (há dependência intra e inter-escalas).

10estágio: IDWT 20estágio: Filtro IIR Sérieyk Gaussiana LRD Sériexk Gaussiana LRD e SRD

Fig. 1. Diagrama do gerador de s´eries Gaussianas auto-similares LRD e SRD em dois blocos.

Este artigo apresenta um gerador wavelet de séries auto-similares Gaussianas com estrutura de correlação mista, que é implementado em dois estágios (vide Fig. 1). O primeiro é

3_{A idéia básica do método é a modelagem da variância dos coeficientes}

wavelet (vide curvas do log₂ da variância dos coeficientes wavelet versus escala de tempoj associadas a alguns modelos paramétricos LRD e SRD em [17]).

(3)

similar ao gerador implementado por B¨ackar e simula um sinal

gaussiano 1/fα _{a partir da IDWT (Inverse Discrete Wavelet}

Transform - Transformada Wavelet Discreta Inversa) de uma

matriz de coeficientes, que é gerada assumindo-se que: a) a progressão da variância dos coeficientes wavelet é exponen-cial, b) os coeficientes wavelet intra-escala são i.i.d. e c) não há correlação entre escalas. Os resultados mostram que as DEPs das séries simuladas são bastante similares com as DEPs de

processos 1/fα, tais como o FGN, o PPL (Pure Power Law)

[7] e o Ru´ıdo Branco Fracion´ario [23], [24]4. O segundo

estágio introduz a SRD via filtragem IIR (Infinite Impulse

Response) da sa´ıda do primeiro est´agio. O esquema proposto

possui as seguintes vantagens: 1) flexibilidade, pois podem-se simular séries com parâmetros de Hurst especificados a

priori e com um n´ıvel de SRD arbitrário (vide seção III-B)

e 2) eficiência estat´ıstica, porque os coeficientes wavelet são processos do tipo ru´ıdo branco gaussiano.

Efetuou-se uma análise estat´ıstica das séries geradas por meio da estimação de DEPs e de seqüências de autocorrelação parcial (momentos de segunda ordem), e dos momentos de terceira e de quarta ordens. Também avaliou-se o desempenho dos estimadores do parâmetro de auto-similaridade pelos métodos de Whittle [6] e do periodograma [30] para as séries que apresentam dependência de curta e de longa duração. O restante do artigo está organizado como descrito abaixo.

A seção II apresenta o FGN, que foi o primeiro modelo auto-similar proposto na literatura e que, até hoje, é um

dos processos 1/fα _{mais relevantes. A sec¸˜ao III apresenta}

o método de geração de realizações auto-similares Gaussianas via IDWT e filtragem IIR. A seção IV apresenta a análise es-tat´ıstica das séries geradas. Também avaliou-se o desempenho de dois estimadores do parâmetro H. Finalmente, a seção V apresenta as conclusões e sugestões para trabalhos futuros.

II. RU´IDO GAUSSIANOFRACIONARIO´

Considere um espaço de probabilidade de referência (Ω, , P), em que Ω denota o espaço amostral de um

expe-rimento aleatórioH, é uma álgebra de Borel [31, pág. 23]

de eventos deﬁnidos em Ω e P, P : → R, ´e uma medida

de probabilidade [32, p´ag. 11].

Definição 1 (Processo Estoc ástico): seja X um

mento de Ω num espaço de funções temporais. Esse mapea-mento é um processo estocástico (ou aleatório) se, para cada instante de tempo t, o mapeamento é uma variável aleatória,

ou seja, um evento{ζ : X(t, ζ) ≤ x} ⊂ para qualquer x e

−∞ < t < ∞, em que ζ denota um resultado aleat´orio de H [32, p´ag. 402].

No restante deste artigo, adota-se a notac¸˜ao X(t) (ou Xt)

para um processo estocástico X(t, ζ). Desta forma, não será realizada distinção de notação entre processos estocásticos e variáveis aleatórias.

A média μ(t) de X(t) é dada por [31, pág. 288]:

μ(t) = E{X(t)} =

_∞

−∞xf (x; t) dx , (1)

4_{O Ru´ıdo} _Branco _{Fracion´ario} _{´e um caso} _particular _{do modelo} ARFIMA(p, d, q), ou seja, corresponde a um ARFIMA(1, d, 0).

em que f (x; t) é a função densidade de probabilidade de

primeira ordem de X(t). A autocorrelac¸˜ao RX(t1, t2) de X(t)

é definida como [31, pág. 288]:

RX(t1, t2) = E{X(t1)X(t2)} = = _∞ −∞ _∞ −∞x1x2f (x1, x2 ; t₁, t₂) dx₁dx₂, (2)

em que f (x1, x2; t1, t2) corresponde à função densidade de

segunda ordem de X(t). A autocovariˆancia γX(t1, t2) de X(t)

é dada pela relação

γX(t1, t2) = RX(t1, t2) − μ(t1)μ(t2) . (3)

Definição 2 (Processo Estacion ário em Sentido Amplo):

X(t) é estacionário em sentido amplo quando [33, pág. 171], [34, pág. 26],

1) E{X(t)} = μ, ∀ t,

2) γX{t + m, t} = γX(m), ∀ t, m5.

Definição 3 (Processo H-ss): X(t), t ∈ R, é auto-similar

com parˆametro 0 < H < 1, ou seja, ´e H-ss (self-similar with

parameter H) se, para qualquer a > 0,

X(t)= ad −HX(at), (4)

em que = denota igualdade entre as distribuições finito-d

dimensionais.

Note-se que, segundo a definição 3, X(t) não pode ser

estacion´ario devido ao fator a−H (excetuando-se o caso em

que X(t) ´e degenerado, isto ´e, X(t) = 0 , t≥ 0) [6].

Definição 4 (Processo Estacion ário de Mem ória Longa):

um processo estacion´ario Yt, t∈ Z, possui mem´oria longa, ou

LRD, se existem constantes α e CP, satisfazendo 0 < α < 1

e CP > 0, tais que [7, p´ag. 279]

lim

f →0

PY(f)

CP|f|−α

= 1 , (5)

em que PY(f) denota a DEP de Yte f representa a freq¨uˆencia

normalizada (−1/2 ≤ f ≤ 1/2), em ciclos/amostra.

Portanto, a DEP de processos LRD tende a infinito na freqüência zero. Observe que a definição 4 é assintótica, pois o formato da DEP em freqüências afastadas da origem não é especificado.

Uma definição alternativa pode ser dada no dom´ınio do

tempo, em termos da autocorrelação RY(m). Yté um processo

do tipo 1/fα se a sua autocorrelac¸˜ao RY(m), para valores

suficientemente grandes do lag m, decresce segundo uma função potência (isto é, apresenta um decaimento lento para zero, do tipo hiperbólico):

lim

m→∞

RY(m)

C_Rm−(1−α) = 1 , (6)

em que CR > 0. Por razões históricas, é mais comum

caracterizar-se a mem´oria longa pelo parˆametro H de Hurst:

H = α + 1

2 ∈ (0, 5 ; 1) . (7)

Quanto maior o valor de H, maior ´e o grau de mem´oria longa do processo.

(4)

Um processo H-ss é LRD se 1/2 < H < 1. O processo Movimento Browniano (de tempo cont´ınuo) [22] satisfaz a definição 3, sendo auto-similar com H = 1/2 (mas não é LRD). Se o processo de incrementos Y (t) de X(t) (Y (t) =

X(t)− X(t − 1)) é estacionário, então X(t) é denominado

H-sssi (H self-similar with stationary increments - auto-similar com incrementos estacion´arios).

Definição 5 (Auto-Similaridade Exata de Segunda Ordem):

seja o processo estacion´ario de incrementos Yt, t∈ Z. Ent˜ao,

Y_t ´e um processo exatamente auto-similar de segunda ordem

com parˆametro de Hurst H (1/2 < H < 1) se,

γY(m) =

σ_Y2

2 (|m + 1|2H− 2|m|2H+ |m − 1|2H),

m = . . . ,−1, 0, 1, . . . (8)

Observe-se que auto-similaridade de segunda ordem implica o comportamento LRD, pois 1/2 < H < 1.

O processo estacion´ario FGN Yt, proposto por Mandelbrot

e van Ness em 1968 [22], corresponde à primeira diferença (é o processo de incrementos) de um processo auto-similar

Xt denominado movimento Browniano fracion´ario de tempo

discreto (discrete fractional Brownian motion - DFBM) [6],

Yt= Xt− BXt= Xt− Xt−1= ∇Xt, (9)

em que B denota o operador atraso unit´ario e∇ = (1 − B) ´e

o operador diferença. A DEP do DFBM é dada pela fórmula [7, pág. 280] PX(f) = σY2CH ∞ j=−∞ 1 |f + j|2H+1, (10)

em que σ_Y2 ´e a potˆencia do FGN, CH = Γ(2H+1) sin (πH)_2π2H+1 e

0 < H < 1. De acordo com (10), a DEP do DFBM possui um p´olo na origem, pois

P_X(f) ∝ |f|1−2H, f → 0 . (11)

O DFBM é um processo integrado de ordem 1 (portanto é não estacionário), porque a sua primeira diferença, o FGN, é

estacion´aria. Como Yt= ∇Xt, o FGN e o DFBM est˜ao

rela-cionados pela função de transferência (na variável complexa z)

H(z) = Y (z)

X(z) = 1 − z

−1_. ₍₁₂₎

A resposta em freqüência é dada por

H(f ) = H(z)|z=ej2πf = 1 − e−j2πf. (13)

Como a relação entrada/sa´ıda em termos das DEPs é igual a [32, pág. 351]

PY(f) = |H(f)|2PX(f) , (14)

em que|H(f)|2 ´e dado por,

|H(f)|2_{= G(f) = 4 sin}2_{(πf) ,} ₍₁₅₎

ent˜ao,

PY(f) = 4 sin2(πf)PX(f) . (16)

Assim, (10) e (16) mostram que a DEP do FGN ´e

caracte-rizada por somente dois parˆametros: σ_Y2 e H (respons´avel pela

forma do espectro). Além disso, é importante se ter em mente que o FGN é completamente especificado pela sua média e pela sua DEP, pois é gaussiano.

Em [19], ´e mostrado que (16) pode ser reescrita na forma:

PY(f) = A(f, H)[|2πf|−2H−1+ B(f, H)] , (17)

em que A(f, H) = 2 sin (πH)Γ(2H + 1)(1− cos (2πf)) e

B(f, H) =∞_j=1[(2πj + 2πf)−2H−1+ (2πj − 2πf)−2H−1].

Para pequenos valores de f tem-se que PY(f) ∝ |f|1−2H .

Constata-se que o FGN apresenta seqüência de autoco-variância de acordo com (8), portanto trata-se de um processo exatamente auto-similar de segunda ordem quando 1/2 < H < 1. Para H = 1/2 , o FGN reduz-se a um ru´ıdo branco gaussiano. Quando 0 < H < 1/2, o processo é SRD.

A Fig. 2 apresenta os gr´aﬁcos das DEPs de um modelo

AR(4) Xt = 2, 7607Xt−1− 3, 8106Xt−2+ 2, 6535Xt−3−

0, 9238X_t−4+ w_t (SRD), em que wt é uma seqüência de

inovação (ru´ıdo branco de potência σ2_W), e dos processos 1/fα

FGN(H = 0, 9) e FD(d = 0, 4). Uma vez que (17) da DEP do FGN envolve uma somatória infinita, a sua DEP foi desenhada com base na aproximação fornecida por Paxson em [19]. Os

três processos têm a mesma potência σ2. Note-se que a DEP

de um processo LRD tem um pólo na origem e que as DEPs do FGN e do FD estão superpostas na região de freqüências muito baixas. 0 0.1 0.2 0.3 0.4 0.5 -30 -20 -10 0 10 20 30 40 DEPs de processos SRD e 1/f f Magnitude em dB FD(0,4) AR(4) FGN(0,9)

Fig. 2. DEPs de processos AR(4), FD(0, 4) e FGN(0, 9) de mesma potˆencia.

Processos de integração fracionária como o FD têm, por caracter´ıstica, o parâmetro de memória longa d, que está relacionada a H por (18),

d = H− 1/2 . (18)

III. S´INTESE DETRAFEGO VIA´ WAVELETS

A. Transformada Wavelet Discreta

Uma wavelet é uma função de suporte compacto (duração finita) com média temporal nula. Há decomposições wavelet em tempo cont´ınuo e em tempo discreto. Este seção introduz

(5)

uma das vers˜oes discretas, a DWT (Discrete Wavelet

Trans-form), que é a ferramenta básica para o estudo de séries

temporais via wavelets. O leitor interessado poderá encontrar, em [15], [35], [36], descrições aprofundadas da teoria wavelet. Bases ortonormais constru´ıdas a partir de funções wavelet são utilizadas para descrição de sinais no plano tempo-escala (ou tempo-freqüência), de maneira análoga à transformada janelada de Fourier. A transformada wavelet é uma solução natural para a análise de séries temporais auto-similares,

porque a sua aplicação envolve “dilações”6 (expansões) de

bandas espectrais. Portanto, a DWT possui resolução temporal variável (a transformada janelada de Fourier não possui esta funcionalidade). Além disso, os coeficientes da DWT de

um sinal 1/fα _{s˜ao praticamente n˜ao-correlacionados (intra e}

inter-escalas) [7], [16]. Por esta razão, as wavelets têm sido amplamente empregadas na análise e na s´ıntese (simulação) de sinais fractais [37].

Seja uma seqüência{Vj}, j ∈ Z, de subespaços sucessivos

de aproximação do espaço das funções de quadrado integrável

L2(R) que satisfaz `as seguintes propriedades [15]:

1) . . . V2⊂ V1⊂ V0⊂ V−1 ⊂ V−2⊂ . . .;

2) _j∈ZV_j= {};

3) _j∈ZVj= L2(R);

4) x(t)∈ Vj ⇔ x(2jt)∈ V0, j > 0;

5) Existe uma func¸˜ao φj(t) = 2−j/2φ0(2−jt) em Vj,

denominada func¸ ˜ao de escala, tal que o conjunto

{φj,k, k ∈ Z} ´e uma base ortonormal de Vj, com

φj,k(t) = 2−j/2φ0(2−jt− k) ∀j, k ∈ Z.

A obtenção da função de escala φ₀(t) da propriedade 5

depende da fam´ılia wavelet escolhida (Haar, Daubechies etc.) O leitor interessado poder´a encontrar mais detalhes sobre o assunto em [15].

Se a projeção sobre Vj de x(t) é representada pelos

coeﬁ-cientes de escala uj,k = x(t), φj,k, ent˜ao as propriedades 1

e 3 garantem que limj→−∞_kuj,kφj,k(t) = x(t), ∀ x ∈

L2(R). A propriedade 4 implica que o subespac¸o Vj ´e

uma versão em escala do subespaço V₀ (multirresolução). A

base ortonormal mencionada na propriedade 5 ´e obtida por

translações no tempo da função passa-baixas φj.

Considere a seqüência de aproximações sucessivas de x,

aprox_j(t) = xj(t) =

k

uj,kφj,k(t) . (19)

De acordo com a propriedade 1, tem-se que

xj(t) = xj+1(t) + Δxj+1(t), (20)

em que Δx_j+1(t) (dito detalhe de x_j(t)) pertence ao

subespac¸o W_j+1, correspondente ao complemento ortogonal

do subespac¸o Vj+17. O detalhe Δxj+1(t) ´e obtido pela

equac¸˜ao Δxj+1(t) = k ψj+1,k(t) ψj+1,k(t), x(t) = dj+1(t) , (21)

6_{Dilations, em inglês. O termo “dilaç ão” tem o significado de dilataç ão.} 7_{Além disso,}_W

j+1est´a contido no subespac¸oVj.

em que ψj+1,k(t), x(t) = wj+1,k denotam os coeﬁcientes

wavelet e{ψj+1,k(t)} é uma fam´ılia de funções wavelets que

gera o subespac¸o Wj+1.

Na prática, um sinal de tráfego x pode ser capturado em várias escalas de tempo, resultando em um conjunto de séries

temporais {xj,k}, em que o ´ındice j = 0, 1, 2, . . . , J − 1

está associado às escalas de interesse (j = 0 corresponde à escala mais rápida) e k é um ´ındice de tempo. A análise

de x comec¸a com a s´erie u0(k) = x0,k, φ0,k(t), k =

0, 1, . . . , M − 1. A seqüência {u0(k)} é decomposta via

ﬁltragem e subamostragem por um fator de 2 (downsampling)

em duas seq¨uˆencias: {u₁(k)} e {d₁(k)}, cada uma contendo

M/2 pontos. Este processo de filtragem e subamostragem é repetido várias vezes, obtendo-se as seqüências

{{u0(k)}M,{u1(k)}M 2,{u2(k)}M4, . . . ,{uJ−1(k)}2J−1M } (22) e {{w1(k)}M 2,{w2(k)}M4 , . . . ,{wJ−1(k)}2J−1M } . (23)

A reconstrução ou s´ıntese de x é implementada via filtragem e sobreamostragem por um fator de 2 (upsampling) das

seqüências (22) e (23). Após J iterações, o sinal original x0,k

pode ser reconstru´ıdo por (24)

x_0,k= aprox_J−1+ d₁+ d₂+ · · · + dJ−1. (24)

Diz-se que a função φ(t) determina uma análise de multirresolução (MultiResolution Analysis - MRA) de x de acordo com (24), se a mesma obedece às seguintes condições:

1) ortonormalidade intra-escala (propriedade 5)

φ(t − m), φ(t − n) = δm,n, (25)

em que δm,n´e o delta de Kronecker (δm,n= 1 se m =

n, δm,n= 0 para m = n). (25) impõe uma condição de

ortonormalidade na escala j = 0. 2) média unitária _∞ −∞φ(t) dt = 1 . (26) 3) equação de dilação 1 √ 2φ( t 2) = k hkφ(t− k) , (27)

em que um ﬁltro hk de resposta impulsiva ﬁnita (FIR)

´e dado.

Demonstra-se que vale a relac¸˜ao [35] 1 √ 2ψ( t 2) = k gkφ(t− k) , (28)

conhecida como equac¸˜ao wavelet.

Mallat [36] propôs uma maneira eficiente de implementar a decomposição recursiva de (22) e (23) utilizando-se ban-cos de filtros. A MRA é então implementada via banban-cos de filtros passa-baixas G(f ) e passa-altas H(f ) (em que

G(f ) = ∞_k=−∞g_ke−j2πfk e H(f ) =∞_k=−∞h_ke−j2πfk)

adequadamente posicionados para separação dos sinais de aproximação e de detalhe. Posteriormente é poss´ıvel recons-truir o sinal original pelo mesmo processo de filtragens, de

(6)

modo que os filtros de decomposição e de reconstrução for-mam um sistema conhecido como Quadrature Mirror Filters (QMF). O algoritmo de Mallat é conhecido como algoritmo da pirâmide. Ressalta-se que a complexidade desse algoritmo é O(M ), ao passo que o cálculo “direto” da IDWT (que envolve

multiplicação de matrizes) é O(M2) [7].

B. Geração de Séries Auto-Similares Gaussianas

Kaplan e Kuo [26] mostraram que os coeficientes da DWT (com a base de Haar) do FGN são pouco correlacionados (intra e inter-escalas) e que a variância desses coeficientes decai exponencialmente com o refinamento da escala, isto é,

Var{Wj}

Var{Wj−1}

= 2α_. ₍₂₉₎

A Eq. (29) aﬁrma que o FGN ´e caracterizado pela linearidade

do diagrama logscale log₂(Var{wj}) versus j dos coeﬁcientes

da análise wavelet de suas realizações. Resultados similares também foram obtidos por Flandrin [25] [38] para o processo FBM de tempo cont´ınuo analisado por meio da transformada

wavelet de tempo cont´ınuo. Wornell [39] [40] demonstrou

que s´eries temporais com espectro “quase” 1/fα podem ser

geradas a partir da IDWT de uma matriz de coeﬁcientes

wavelet n˜ao-correlacionados.

Como (29) garante que o espectro de uma s´erie yt gerada

via algoritmo da pirˆamide seja aproximadamemte 1/fα para

f → 0, ent˜ao y_t pode ser modelada como um processo de

integração fracionária FD(d) [30, pág. 266]:

(1 − B)d_(y

t− μ) = wt, (30)

em que μ denota a média de yt, d é o parâmetro fracionário

(0 < d < 0, 5 para que ytseja estacion´ario e LRD) e wt ´e um

ru´ıdo branco gaussiano de m´edia nula e potˆencia σ2.

De acordo com Brockwell e Davis [9, p´ag. 349], uma s´erie

xt com estrutura de correlac¸˜ao mista pode ser obtida por

meio da ﬁltragem linear da s´erie yt de (30), ou seja, xt pode

ser interpretada como a sa´ıda de um ﬁltro (processo) linear

ARMA(p, q), cuja entrada ´e yt:

x_t+ a₁x_t−1+ . . . + a_px_t−p= b₀y_t+ b₁y_t−1+ . . . + b_qy_t−q.

(31) A função de transferência associada à equação de diferenças (31) é dada por

H(z) = B(z) A(z) = b₀+ b₁z−1+ . . . + b_qz−q 1 + a₁z−1+ . . . + apz−p , (32) ou H(z) = b₀ q k=1(1 − ckz−1) _p k=1(1 − dkz−1) . (33)

O filtro digital (33) é causal e estável se os p pólos z = dk de

H(z) estão dentro do c´ırculo de raio unitário, isto é, se|dk| <

1. Portanto, (30) e (31) sugerem que s´eries auto-similares que sejam simultaneamente LRD e SRD podem ser simuladas por meio de um gerador com dois est´agios, como ilustrado na

Fig. 1, em que o primeiro bloco produz a realizac¸˜ao yt(com

espectro 1/fα) via IDWT e a sa´ıda do segundo bloco, o qual

introduz SRD em yt, ´e a s´erie de interesse xt. Neste trabalho, o

segundo est´agio foi implementado por meio de um ﬁltro IIR do

tipo H(z) = 1/A(z), o que garante a invertibilidade do ﬁltro.

A série xt é Gaussiana se as seqüências dj,k são realizações

de ru´ıdos do tipo branco e gaussiano de média nula. Observe-se que o gerador de tráfego de Bäckar só possui o primeiro estágio.

Bäckar sugere ter sintetizado “aproximações grosseiras” do FGN. Ressalta-se que o método de geração via IDWT

n˜ao garante que o espectro de yt seja igual ao espectro do

FGN (f´ormula (17)), mas t˜ao somente que o comportamento

assintótico seja o mesmo para f → 0. Não obstante, a análise

espectral de várias realizações yt(conforme será visto no seção

IV) mostra que a sa´ıda do primeiro estágio simula, do ponto de vista prático, os processos FGN e FD, conforme ilustrado pela Fig. 2. Essa figura mostra que as DEPs de processos FGN(H)

e FD(H − 1/2) (de mesma potˆencia) est˜ao superpostas nas

baixas freq¨uˆencias.

O procedimento de s´ıntese de uma s´erie xt de m´edia nula

e com M = 2J amostras adotado neste trabalho ´e o seguinte:

1) escolha o valor de H. Gere J − 1 seq¨uˆencias wavelet

{wj(k)} do tipo ru´ıdo branco gaussiano de m´edia nula

que obedeçam à condição (29), com Var{WJ−1(k)} =

1. O sinal de aproximac¸˜ao na escala mais lenta deve ser

nulo, ou seja, aprox_J−1(t) = 0.

2) escolha o ﬁltro de escala passa-baixas G(f ) e o ﬁltro

wavelet passa-altas H(f ) que ser˜ao utilizados pelo

al-goritmo da pirˆamide. Este trabalho utilizou os ﬁltros de

Haar: {gk}k∈Z = {. . . , 0, g0 = √ 2 2 , g1 = √ 2 2 , 0, . . .} e {hk}k∈Z= {. . . , 0, h0= − √ 2 2 , h1= √ 2 2 , 0, . . .}.

3) projete um filtro digital causal, estável e invers´ıvel. As simulações deste artigo foram realizadas com o seguinte filtro passa-bandas:

H(f ) = 1

1 − 0, 3e−j2πf_{+ 0, 4e}−j4πf . (34)

A Fig. 3 mostra a magnitude da resposta em freqüência desse filtro.

4) gere o sinal ytpor meio da reconstruc¸˜ao piramidal.

5) ﬁltre o sinal ytcom o ﬁltro do passo (3) e obtenha uma

realizac¸˜ao xt.

Ressalta-se que o ﬁltro IIR adotado (34) ´e, de certa maneira,

arbitrário. É válido indagar sobre o grau de SRD que deve estar

presente nas simulações de tráfego. Entretanto, a resposta a essa pergunta não faz parte do escopo deste artigo. Porém, note-se que a resposta em freqüência adotada procura reforçar

a DEP do ru´ıdo 1/fα _{nas médias freqüências, conforme}

sugerido, sob um ponto de vista qualitativo, pela DEP do AR(4) (Fig. 2).

IV. ANALISE´ ESTAT´ISTICA

A análise estat´ıstica das séries foi feita em duas partes: I) efetuou-se uma análise comparativa entre as séries geradas pelo método da FFT de Paxson e as do método wavelet; II) compararam-se as séries geradas pelo método wavelet antes e depois da filtragem. A utilização do método de Paxson como

referência é justificada pelo fato de que uma realização xt

é obtida a partir da transformada inversa discreta de Fourier de uma seqüência de coeficientes X(n/M ) no dom´ınio da

(7)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 5 4 3 2 1 0 1 2 3 4 5

Freqüência Normalizada (×π rad/amostra)

Magnitude (dB)

Magnitude da Resposta em Freqüência dB

Fig. 3. Filtro IIR utilizado para enfatizar médias freqüências.

freqüência, 0 ≤ n ≤ M − 1, que tenha DEP igual à do

FGN. Como a s´erie gerada xt tem a DEP do FGN (por

construção), então garante-se que x_t simule o FGN, o que

foi conﬁrmado pela an´alise estat´ıstica apresentada no artigo

[19]8_{. As realizações foram geradas variando-se o parâmetro}

H na faixa de 0, 5 a 1, 0 em passos de 0, 05, sendo que para cada valor do parâmetro H foram sintetizadas três realizações (ou seja, 33 realizações por método).

As seguintes estat´ısticas foram utilizadas:

1) função de autocorrelação ρ_X(m) (ACF - Autocorrelation

Function);9

2) DEP PX(f);

3) assimetria A(Xt), que representa a concentrac¸˜ao dos

valores em um dos extremos da distribuic¸˜ao;

4) curtose K(Xt), que indica o grau de achatamento de

uma densidade de probabilidade com relação à normal; 5) H, pelos métodos de Whittle e do periodograma; J B,

de Jarque e Bera [41], para teste de normalidade. O estimador da ACF ´e dado por

ˆ ρ_X,m= 1 M s2_X M t=m+1 (X_t− ˆμ)(Xt−m− ˆμ) , (35)

em que M é o número de amostras, ˆμ é a média amostral e

s2_X ´e a variˆancia amostral. Note-se que−1 ≤ ρ ≤ 1.

O estimador ˆPX(f) da DEP ´e obtido pelo m´etodo

n˜ao-param´etrico10 _{do periodograma [42], com janelamento de}

dados (data tapering, para redução de vazamento de potência)

8_{Paxson disponibilizou programas em linguagens S e C para geração de} séries FGN aproximadas. Este estudo utilizou o código escrito em S.

9_{Na literatura de engenharia, o termo função de autocorrelaç ão está} asso-ciado ao momentoRX(m). Na área estat´ıstica, a ACF ρX(m) corresponde a RX(m)

σ2 X .

10_{Os métodos paramétricos de análise espectral são baseados em modelos} AR, MA e ARMA. Portanto não devem ser aplicados para estimação da DEP de um ru´ıdo 1/fα.

e suavização (smoothing, para redução da variabilidade de ˆ

PX(f)). O periodograma ´e calculado via11

ˆ

P_X(f) = 1

M|X(f)|

2_. ₍₃₆₎

A assimetria ´e um momento de 3a

¯ ordem e ´e dada por

A(X_t) = E _(X t− μ)3 σ3 , (37)

em que μ é a média e σ é o desvio-padrão de Xt.

O estimador de assimetria ´e deﬁnido como ˆ A(Xt) = 1 M s3_X M t=1 (Xt− ˆμ)3. (38)

A curtose ´e um momento de 4a

¯ ordem e ´e deﬁnida como

K(X_t) = E _(X t− μ)4 σ4 . (39)

O estimador da curtose ´e dado pela f´ormula ˆ K(Xt) = 1 M s4_X M t=1 (Xt− ˆμ)4. (40)

Observe-se que a distribuic¸˜ao Gaussiana possui A = 0 e K = 3.

O teste de Jarque-Bera é baseado nas medidas de assimetria e curtose. A estat´ıstica desse teste é definida como

J B = M 6 ˆ A2+( ˆK− 3) 2 4 . (41)

Sob a hip´otese nula (H0) de que os dados sejam normalmente

distribu´ıdos, espera-se que J B ∼ χ2(2) (chi-quadrada com

dois graus de liberdade).

O método de estimação do parâmetro H de Whittle [30] é baseado em uma estimação de máxima verossimilhança no dom´ınio da freqüência, assumindo-se que a série seja

modelada por um processo FD(d)12. O método de estimação

de H pelo periodograma baseia-se no fato de que PX(f) ∝

f1−2H para freqüências próximas de zero.

Os testes de hip´otese foram avaliados com base na estat´ıstica

p-value [43]. Para um dado n´ıvel de signiﬁcˆancia α , rejeita-se

H₀se p≤ α, ao passo que aceita-se H₀se p > α. Deste modo,

quanto menor for o valor do p-value maior ser´a a evidˆencia

emp´ırica de que H₀ deve ser rejeitada em favor da hip´otese

alternativa H₁.

A. Comparação entre as Séries Geradas via FFT e Wavelets

O teste de Jarque-Bera rejeitou a normalidade de apenas 2 de 33 realizações geradas pelo método da FFT a um n´ıvel de significância α = 1%. Para as séries geradas pelo método

wavelet, o teste rejeitou apenas uma das realizac¸˜oes com o

mesmo α. A Tabela I mostra as estimativas de assimetria e de curtose para as s´eries geradas via FFT e wavelets. Portanto,

(8)

TABELA I

ESTIMATIVAS DEASSIMETRIA ECURTOSE DAS SERIES GERADAS VIA´ FFT

Ewavelets. H Aˆ Kˆ FFT H → 0, 5 | Â| ≤ 0, 05 | ˆK − 3| ≤ 0, 1 H → 1, 0 | Â| ≤ 0, 2 | ˆK − 3| ≤ 0, 1 Wavelets H → 0, 5 | Â| ≤ 0, 05 | ˆK − 3| ≤ 0, 15 H → 1, 0 | Â| ≤ 0, 1 | ˆK − 3| ≤ 0, 15

os testes realizados indicam que as séries geradas pelos dois métodos têm distribuição aproximadamente Gaussiana.

As Figs. 4, 5, 6 e 7 mostram os gráficos de ACF e periodograma suavizado para séries simuladas via FFT e

wavelets com H = 0, 6 ; 0, 75 e 0, 9. Os periodogramas

Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.FFT.H.60 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.FFT.H.75 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.FFT.H.90

Fig. 4. Autocorrelaç ão de algumas séries geradas pelo método da FFT.

mostram que as DEPs das séries com H = 0, 75 e 0, 9 de ambos os métodos têm pólos na origem, ou seja, que

as séries são 1/fα_{. Já para o caso das simulações com}

H = 0, 6, observa-se que: a) a variabilidade do periodograma da série gerada via wavelets é maior do que a variabilidade do periodograma da série FFT; b) o periodograma da série

wavelet não indica, de modo claro, se há ou não um pólo

na origem. A comparação entre os gráficos de autocorrelação para H = 0, 75 e 0, 9 mostra que a taxa de decaimento da autocorrelação aumenta com H.

As Figs. 8 e 9 mostram as curvas de H (usado como

parˆametro de modelagem) versus ˆH estimado por meio do

11_{A definiç ão foi dada sem incluir o janelamento e a suavização, para} melhor compreensão da natureza essencial do estimador.

12_{O m´etodo de Whittle usa o periodograma.}

frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 34 36 38 40 Series: fGn.FFT.H.60 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 30 35 40 45 Series: fGn.FFT.H.75 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 25 30 35 40 45 50 Series: fGn.FFT.H.90 Smoothed Periodogram

Fig. 5. Periodograma suavizado de algumas s´eries geradas pelo m´etodo da FFT.

método de Whittle [6] para os dois métodos de geração. De acordo com Paxson [19], esse é um bom método de estimação de H para séries que apresentam LRD.

A Fig. 8 sugere que o método de geração via FFT tende a gerar séries com H superior ao que é usado como entrada do modelo (viés positivo), enquanto a Fig. 9 sugere que o método

wavelet tende a produzir s´eries com H inferior ao da entrada

do modelo (vi´es negativo). A Fig. 8 sugere tamb´em que pode

haver saturac¸˜ao para valores de H ≥ 0, 95 quando se usa o

m´etodo da FFT.

B. Comparação entre as Séries Geradas pelo Método Wavelet com e sem Filtro IIR

O teste de Jarque-Bera rejeitou a normalidade de apenas três séries a um n´ıvel de significância α = 1%. A Tabela II mostra as medidas de assimetria e curtose. Portanto, os testes realizados indicam que as séries geradas continuam a apresentar distribuição aproximadamente Gaussiana (como esperado).

TABELA II

ESTIMATIVAS DEASSIMETRIA ECURTOSE DAS SERIES GERADAS VIA´

waveletsAPOS FILTRAGEM´ .

H Aˆ Kˆ

Wavelets H → 0, 5 | Â| ≤ 0, 06 | ˆK − 3| ≤ 0, 3 com filtro IIR H → 1, 0 | Â| ≤ 0, 06 | ˆK − 3| ≤ 0, 3

As Figs. 10 e 11 mostram os gráficos da autocorrelação e periodograma suavizado para séries simuladas com H =

(9)

Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.H.60 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.H.75 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.H.90

Fig. 6. Autocorrelaç ão de algumas séries geradas via wavelets.

0, 6; 0, 75 e 0, 9, após filtragem. O periodograma da série gerada com H = 0, 6 não apresenta pólo na origem. Por outro lado, o periodograma da série sintetizada com H = 0, 9 mostra, de forma clara, que a série é mista, isto é, há presença simultânea de LRD e SRD (para tal, deve-se comparar esse gráfico com o periodograma para H = 0, 9 da Fig. 7). O periodograma da série modelada com H = 0, 75 sugere uma situação de transição do comportamento SRD observado no gráfico com H = 0, 6 para a caracter´ıstica mista da série com H = 0, 9.

Diferentemente do procedimento usado nos dois conjuntos

anteriores de realizac¸˜oes, em que as curvas H versus Hˆ

foram levantadas com base somente no m´etodo de Whittle, as

curvas H versus ˆH relativas às séries filtradas foram obtidas

por dois métodos distintos, o de Whittle (Fig. 12) e o do periodograma (Fig. 13) com a finalidade de se avaliarem os desempenhos desses dois estimadores nesta nova situação, qual seja, presença simultânea de LRD e SRD.

A curva obtida pelo método de Whittle é similar à do caso em que as séries foram geradas via wavelets, porém sem filtragem. Por outro lado, a Fig. 13 mostra que o método do periodograma tende a subestimar o valor de H, apresen-tando maior variabilidade do que o estimador de Whittle. Sato [44] também observou a maior variância do estimador via periodograma em sua pesquisa. De acordo com [42], o periodograma é um estimador que tem os seguintes problemas: inconsistência, grande variância e viés para M finito. Portanto, justifica-se o comportamento observado na Fig. 13.

frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -7 -6 -5 -4 -3 -2 -1 Series: fGn.Haar.H.60 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -14 -10 -8 -6 -4 Series: fGn.Haar.H.75 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -20 -15 -10 -5 Series: fGn.Haar.H.90 Smoothed Periodogram

Fig. 7. Periodograma suavizado de algumas s´eries geradas via wavelets.

V. CONCLUSAO˜

O presente trabalho reproduziu e comparou, com sucesso, os mecanimos de geração de séries temporais apresentados nos trabalhos de Paxson e Bäckar, que se mostraram eficientes

para s´ıntese de s´eries temporais 1/fα_{. Demonstrou-se que a}

geração de séries auto-similares via algoritmo da pirâmide não garante que as realizações obtidas são FGN, mas apenas que

estas têm comportamento 1/fα _{(o que é suficiente quando}

se quer gerar teletráfego LRD). Ressalta-se que o trabalho de Bäckar não se utilizou de testes estat´ısticos como o de Whittle ou do periodograma para comprovar que tais séries apresentam parâmetro H de acordo com o esperado, o que é complementado pelo procedimento de análise deste trabalho. Buscou-se, neste estudo, verificar as caracter´ıticas LRD e Gaussianas das séries geradas. Observou-se que o estimador do parâmetro H de Whittle é mais robusto do que o estimador pelo método do periodograma quando as séries são LRD (sa´ıda do primeiro estágio) ou quando apresentam LRD e SRD (in-troduzida por um filtro passa-bandas) simultaneamente. Adi-cionalmente, constatou-se que uma escolha não cautelosa de um estimador para o parâmetro H pode levar a resultados com demasiada variabilidade, ou ainda viés. Também demonstrou-se que o método de dois estágios proposto é bastante flex´ıvel e capaz de inserir dependência de curta duração em realizações

de processos do tipo 1/fα_.

Em trabalhos futuros, será feita uma análise espectral de séries reais de teletráfego (provenientes de diferentes redes de comunicações) com o objetivo de se investigar o n´ıvel de SRD presente nesses traces. Também será avaliado o desempenho de vários estimadores do parâmetro de Hurst em séries com

(10)

H desejado H estimado 0.5 0.6 0.7 0.8 0.9 1.0 0.5 0.6 0.7 0.8 0.9 1.0 H estimado H ideal

Fig. 8. CurvaH versus ˆH para s´eries geradas via FFT.

Fig. 9. CurvaH versus ˆH para s´eries geradas via wavelets.

estrutura de correlação mista. Diante da relevância do modelo de teletráfego Multifractal Wavelet Model (MWM), pretende-se implementar espretende-se modelo, avaliar o efeito do estágio de inserção de dependência de curta duração sobre as realizações do modelo MWM e aplicar o mesmo procedimento de análise desenvolvido neste trabalho para avaliação dos resultados.

AGRADECIMENTOS

Os autores agradecem à Ericsson Telecomunicações por ter financiado a pesquisa do grupo no per´ıodo 2000-2002, por meio do contrato USP-08 LCS/FDTE/Ericsson (Projeto

Wire-less Multimedia Distributed Applications). Tamb´em somos

gratos ao prof. dr. Luiz Antonio Baccal´a (LCS-PTC-EPUSP),

Lag ACF 0 20 40 60 80 100 -0.2 0.2 0.6 1.0 Series : fGn.Haar.IIR2.H.60 Lag ACF 0 20 40 60 80 100 0.0 0.4 0.8 Series : fGn.Haar.IIR2.H.75 Lag ACF 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 Series : fGn.Haar.IIR2.H.90

Fig. 10. Autocorrelaç ão de séries filtradas.

por ter nos auxiliado com inúmeras cr´ıticas e sugestões, princi-palmente na área de processamento de sinais via wavelets, e ao prof. dDr. Pedro Morettin (MAE-IME-USP), pelas discussões sobre a teoria de séries temporais.

REFERENCIASˆ

[1] H. Sato, Teletrafﬁc Technologies in ATM Networks. Artech House, 1994.

[2] M. Schwartz, Broadband Integrated Networks. Prentice Hall, 1996. [3] W. Leland, M. Taqqu, W. Willinger, and D. Wilson, “On the self-similar

nature of ethernet trafﬁc (extended version),” IEEE/ACM Transactions

on Networking, vol. 2, no. 1, pp. 1–15, Feb. 1994.

[4] V. Paxson and S. Floyd, “Wide-area trafﬁc: The failure of Poisson modeling,” IEEE/ACM Transactions on Networking, vol. 3, no. 3, pp. 226–244, June 1995.

[5] A. Erramilli, O. Narayan, and W. Willinger, “Experimental queueing analysis with long-range dependent trafﬁc,” IEEE/ACM Transactions on

Networking, vol. 4, pp. 209–223, April 1996.

[6] J. Beran, Statistics for Long-Memory Processes. Chapman & Hall, 1994.

[7] D. B. Percival and A. T. Walden, Wavelet Methods for Time Series

Analysis. Cambridge University Press, 2000.

[8] G. E. P. Box, G. M. Jenkins, and G. C. Reinsel, Time Series Analysis:

Forecasting and Control, 3rd ed. Prentice Hall, 1994.

[9] P. J. Brockwell and R. A. Davis, Introduction to Time Series and

Forecasting. New York, NY: Springer-Verlag, 1996.

[10] R. Riedi and J. L. V´ehel, “Multifractal properties of TCP trafﬁc: a numerical study, tech. rep. 3129,” INRIA Rocquencourt, France, Tech. Rep., 1997. [Online]. Available: http://www.dsp.rice.edu/∼riedi/ cv publ theme.html

[11] A. Feldmann, A. C. Gilbert, and W. Willinger, “Data networks as cascades: investigating the multifractal nature of Internet WAN trafﬁc,”

Computer Communication review, vol. 28, no. 4, pp. 42–55, 1998.

[12] A. C. Gilbert, W. Willinger, and A. Feldmann, “Scaling analysis of conservative cascades, with applications to network trafﬁc,” IEEE

Transactions on Information Theory, vol. 45, no. 3, pp. 971–991, April

1999, special Issue on “Multiscale Statistical Signal Analysis and its Applications”.

(11)

frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -10 -6 -4 -2 0 Series: fGn.Haar.IIR2.H.60 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -18 -14 -10 -6 Series: fGn.Haar.IIR2.H.75 Smoothed Periodogram frequency spectrum 0.0 0.1 0.2 0.3 0.4 0.5 -25 -20 -15 -10 -5 Series: fGn.Haar.IIR2.H.90 Smoothed Periodogram

Fig. 11. Periodograma suavizado de s´eries ﬁltradas.

[13] A. B. de Lima, “Proposta de uma estratégia para controle de admissão de conexões baseado em mediç ões de tráfego agregado e caracterizaç ão de redesIP,” Dissertaç ão de Mestrado, Escola Politécnica da USP, São Paulo, 2002.

[14] C. R. Barra, “Caracterizaç ão experimental e por simulaç ão e modelagem da qualidade de serviço obtida na transmissão de áudio e v´ıdeo em tempo real.” Tese de Doutorado, Escola Politécnica da USP, São Paulo, 2005. [15] I. Daubechies, Ten Lectures on Wavelets. Philadelphia: SIAM, 1992. [16] R. Gençay, F. Selçuk, and B. Whitcher, An Introduction to Wavelets and

Other Filtering Methods in Finance and Economics. Academic Press, 2001.

[17] S. Ma and C. Ji, “Modeling heterogeneous network trafﬁc in wavelet domain,” IEEE Transactions on Networking, vol. 9, no. 5, pp. 634–649, Oct. 2001.

[18] D. B. Percival, “Simulating Gaussian random processes with speciﬁed spectra,” Computing Science and Statistics, vol. 24, pp. 534–538, 1992. [19] V. Paxson, “Fast, approximate synthesis of fractional Gaussian noise for generating self-similar network trafﬁc,” Computer Communication

review, vol. 27, pp. 5–18, Oct. 1997.

[20] J. R. M. Hosking, “Modeling persistence in hydrological time series using fractional differencing,” Water Resources Research, vol. 20, pp. 1898–1908, 1984.

[21] R. B. Davies and D. S. Harte, “Tests for Hurst effect,” Biometrika, vol. 74, pp. 95–101, 1987.

[22] B. B. Mandelbrot and J. V. Ness, “Fractional brownian motions, frac-tional noises and applications,” SIAM Rev., vol. 10, pp. 422–437, Feb. 1968.

[23] C. W. J. Granger, , and R. Joyeux, “An introduction to long-memory time series models and fractional differencing,” Journal of Time Series

Analysis, vol. 1, pp. 15–29, Oct. 1980.

[24] J. R. M. Hosking, “Fractional differencing,” Biometrika, vol. 68, pp. 165–176, Oct. 1981.

[25] P. Flandrin, “Wavelet analysis and synthesis of fractional brownian motion,” IEEE Transactions on Information Theory, vol. 38, no. 2, pp. 910–917, 1992.

[26] L. M. Kaplan and C.-C. J. Kuo, “Fractal estimation from noisy data via discrete fractional Gaussian noise (DFGN) and the Haar basis,” IEEE

Transactions on Signal Processing, vol. 12, pp. 3554–3562, 1993.

[27] J.-A. B¨ackar, “A framework for implementing fractal trafﬁc models in real time,” Master Thesis, SERC, Melbourne, 2000.

Fig. 12. CurvaH versus ˆH (método de Whittle) para séries filtradas.

Fig. 13. CurvaH versus ˆH (método do periodograma) para séries filtradas.

[28] R. H. Riedi, M. S. Crouse, V. J. Ribeiro, and R. G. Baraniuk, “A multifractal wavelet model with application to network trafﬁc,” IEEE

Transactions on Information Theory, vol. 45, no. 3, pp. 992–1018, April

1999.

[29] M. Taqqu, V. Teverovsky, and W. Willinger, “Estimators for long-range dependence: An empirical study,” Fractals, vol. 3, pp. 785–798, 1995. [30] E. Zivot and J. Wang, Modeling Financial Time Series with S-PLUS.

Springer, 2003.

[31] A. Papoulis, Probability, Random Variables, and Stochastic Processes, 3rd ed. McGraw-Hill, 1996.

[32] H. Stark and J. W. Woods, Probability and Random Processes with

Applications to Signal Processing, 3rd ed. Upper Saddle River, NY: Prentice Hall, 2002.

[33] J. P. Z. Peebles, Probability, Random Variables, and Random Signal

Principles, third edition ed. McGraw-Hill, 1993.

[34] P. A. Morettin and C. M. C. Toloi, Análise de Séries Temporais. Editora Edgard Blücher, 2004.

(12)

[35] G. Kaiser, A Friendly Guide to Wavelets. Boston, Mass.: Birkh¨auser, 1994.

[36] S. G. Mallat, “A theory for multiresolution signal decomposition: The wavelet representation,” IEEE Transactions on Pattern Analysis and

Machine Intelligence, vol. 11, pp. 674–693, 7 1989.

[37] P. Abry and D. Veitch, “Wavelet analysis of long-range dependent trafﬁc,” IEEE Transactions on Information Theory, vol. 4, no. 1, pp. 2–15, 1998.

[38] P. Flandrin, “On the spectrum of fractional brownian motions,” IEEE

Transactions on Information Theory, vol. 35, pp. 197–199, 1989.

[39] G. W. Wornell, “A karhunen-lo`eve-like expansion for 1/f processes via wavelets,” IEEE Transactions on Information Theory, vol. 36, no. 4, pp. 859–861, July 1990.

[40] ——, “Wavelet-based representations for the 1/f family of fractal pro-cesses,” Proceedings of the IEEE, vol. 81, no. 10, pp. 1428–1450, Oct. 1993.

[41] C. M. Jarque and A. K. Bera, “A test for normality of observations and regression residuals,” International Statistical Review, vol. 55, no. 5, pp. 163–172, 1987.

[42] D. B. Percival and A. T. Walden, Spectral Analysis for Physical

Applications. New York, NY: Cambridge, 1993.

[43] G. Casella and R. L. Berger, Statistical Inference, 2nd ed. Duxbury, 2002.

[44] J. R. Sato, “Processos com memória longa compartilhada,” Dissertaç ão de Mestrado, IME-USP, São Paulo, 2004.

Fernando Lemos de Mello recebeu o t´ıtulo de engenheiro eletricista (ênfase em telecomunicaç ões) pela Escola Politécnica da Universidade de São Paulo (EPUSP), Brasil, em 2002. Atua na seguinte área de pesquisa: s´ıntese de teletráfego. Está cur-sando o mestrado em engenharia elétrica na EPUSP.

Alexandre Barbosa de Lima recebeu os t´ıtulos de bacharel em ciências navais (ênfase em eletrônica) pela Escola Naval, Brasil, em 1990, de engenheiro eletricista (ênfase em telecomunicaç ões) pela Escola Politécnica da Universidade de São Paulo (EPUSP), Brasil, em 1996, e de mestre em engenharia elétrica (área de concentraç ão sistemas eletrônicos) pela EPUSP em 2002. Atua nas seguintes áreas de pesquisa: modelagem de teletráfego, QoS em redes e processamento digital de sinais. Está cursando o doutorado em engenharia elétrica na EPUSP.

Marcelo Lipas recebeu o t´ıtulo de engenheiro eletricista (ênfase em telecomunicaç ões) pela Es-cola Politécnica da Universidade de São Paulo (EPUSP), Brasil, em 2001. Atua nas seguintes áreas de pesquisa: modelagem de teletráfego e processa-mento digital de sinais. Está cursando o mestrado em engenharia elétrica na EPUSP.

José Roberto de A. Amazonas recebeu o t´ıtulo de engenheiro eletricista pela Escola Politécnica da Universidade de São Paulo (EPUSP), Brasil, em 1979, além dos t´ıtulos de mestre, doutor e livre-docente pela EPUSP, em 1983, 1988 e 1996, respec-tivamente.

´

E professor associado do Departamento de Enge-nharia de Telecomunicaç ões e Controle da EPUSP, onde é responsável por pesquisa e ensino de comunicaç ões ópticas e redes de comunicação de alta velocidade. Esteve em diversos cargos em uni-versidades no Brasil e na Europa, e também liderou pesquisas em parceria com várias companhias brasileiras, européias e norte-americanas.

Seus interesses são na área de comunicaç ões ópticas, redes cabeadas e sem-fio, qualidade de serviço (QoS) e ensino a distância (EaD).