• Nenhum resultado encontrado

3.4 Detecção de Determinismo

3.4.2 Aplicação do Teste de Dados Sub-rogados SSS

Para os primeiros testes realizados com os dados da CEMIG e de New England utilizou-se o algoritmo SSS (descrito logo acima), proposto em Nakamura and Small (2005), para verificar se as flutuações nas séries são aleatórias ou se realmente há dinâmica local. Importante é que se tenha em mente que a hipótese nula considerada por esse algoritmo é de que não existe dinâmica local nas séries, ou seja, as flutuações irregulares são aleatórias11. Diferentemente da sequência adotada na Seção 3.2, foram

tratados primeiramente os dados mensais de consumo total.

Séries de consumo total da CEMIG

Conforme já foi apresentado anteriormente, os dados de consumo total da CEMIG estão agrupados por hora, e a partir desses dados é possível portanto construir séries de consumo total por dia, por semana, por quinzena e por mês. Para tanto, basta a realização de uma soma cumulativa com os dados da primeira série.

Da maneira como foi proposto, o SSS aplica-se a séries temporais não-estacionárias na média, porém considerou-se sensata a decisão de subtrair a componente de tendência da série da CEMIG em virtude do número muito reduzido de 84 amostras desta série em relação às séries de 300 a 1000 amostras estudadas pelos criadores do método em (Nakamura and Small, 2005). Para tanto, no caso mensal, utilizou-se o SSA para decompor a série em 30 sub-séries e considerou-se a soma das quatro componentes mais significativas em amplitude como o termo de tendência, uma vez que a primeira componente não foi suficiente devido à variação brusca na série decorrente da crise do setor elétrico brasileiro em maio de 200112. A série original juntamente com a

componente de tendência estimada e a série resultante da subtração das duas primeiras são apresentadas na Figura 3.21.

Assim sendo, os dados foram agrupados da forma descrita acima, extraiu-se a sua componente de tendência, e a eles foram aplicados o SSS considerando-se a geração de 1000 séries de dados sub-rogados em cada teste. A Figura 3.22 ilustra as estatísticas

10Neste trabalho esse algoritmo será sempre referenciado como CSS.

11Justamente por isso foram considerados apenas atrasos de quatro amostras no cálculo das EDs.

12No caso das séries de consumo por semana e por quinzena, consideraram-se as duas primeiras

componentes para aproximar a tendência, e para as séries de consumo horário e diário, só o a primeira componente foi utilizada.

38 3 Descrição e Análise de Dados 0 10 20 30 40 50 60 70 80 90 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 tempo (meses) Consumo (normalizado) Série Tendência 0 10 20 30 40 50 60 70 80 90 −0.08 −0.06 −0.04 −0.02 0 0.02 0.04 0.06 0.08 0.1 Consumo (normalizado) tempo (meses)

Figura 3.21: À esquerda, série original e componente de tendência estimada; à direita, série resultante após a extração da componente de tendência.

discriminantes associadas à série mensal juntamente com a significância que mede a proximidade entre a série original e as séries sub-rogadas. A aplicação do SSS no caso das séries de consumo quinzenal, diário e horário conduziu aos resultados apresentados na Tabela 3.3. Nela encontram-se os valores de S associados à FAC e à IMM em função do número de atrasos que variou entre 1 e 4. Em negrito estão evidenciados os valores de S que superaram o limiar do intervalo de confiança de 2σ, e que portanto definem a rejeição da hipótese em nível de confiança de 95%.

1 1.5 2 2.5 3 3.5 4 −0.5 0 0.5 Atraso (amostras) FAC 1 1.5 2 2.5 3 3.5 4 −1 0 1 2 Atraso (amostras) Significância (FAC) 1 1.5 2 2.5 3 3.5 4 1 1.2 1.4 1.6 1.8 Atraso (amostras) IMM 1 1.5 2 2.5 3 3.5 4 0 0.5 1 1.5 Atraso (amostras) Significância (IMM)

Figura 3.22: FAC e IMM das séries de consumo mensal de baixa tensão da CEMIG e das respectivas séries sub-rogadas. A significância define a distância entre a série original e as séries artificiais.

Para confirmar ou retificar a informação obtida com o cálculo de significância, a qual assume gaussianidade das EDs dos dados sub-rogados, realizou-se o cálculo dos p-valores para a mesma faixa de atrasos, os quais são apresentados na Tabela 3.4. Os p-valores menores do que 0,01, a definirem uma evidência muito forte de rejeição da hipótese nula, e entre 0,01 e 0,05, que estabelecem a faixa de forte evidência de rejeição (ver Tabela 3.2), estão destacados em negrito.

3.4 Detecção de Determinismo 39 Tabela 3.3: Séries de consumo total da CEMIG - Significância associada à FAC e à IMM para atrasos de 1 a 4 amostras.

SFAC SIMM Série vs Atraso 1 2 3 4 1 2 3 4 Mensal 0,07 1,29 0,78 1,53 1,14 1,07 0,56 0,84 Quinzenal 3,03 1,40 0,16 1,10 2,18 0,59 0,14 0,83 Semanal 3,31 0,21 1,02 1,21 2,76 0,62 0,44 1,55 Diária 16,51 10,99 6,31 6,75 31,56 11,42 4,51 5,70 Horária 30,05 17,66 5,42 7,00 59,20 33,51 29,13 30,21

Tabela 3.4: Séries de consumo total da CEMIG - p-valores associados à FAC e à IMM para atrasos de 1 a 4 amostras.

PvFAC PvIMM Série vs Atraso 1 2 3 4 1 2 3 4 Mensal 0,90 0,18 0,50 0,09 0,24 0,29 0,60 0,40 Quinzenal 0,002 0,50 0,94 0,41 0,006 0,16 0,90 0,27 Semanal 0,002 0,81 0,31 0,22 0,004 0,52 0,67 0,11 Diária 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 Horária 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002

Observa-se pelos valores em negrito das duas tabelas que a rejeição de hípótese com base em limites de confiança de 2σ foi confirmada pelos respectivos p-valores associados. É interessante ressaltar que só não houve rejeição de hipótese no caso da série mensal, sendo que no caso quinzenal a rejeição se deveu à detecção de alguma correlação não-linear significativa, já que a significância associada à IMM superou o limiar de 2σ. É curioso o fato de que existe uma tendência a haver maior correlação entre as flutuações locais conforme se consideram os dados agrupados em unidades de tempo menores. Talvez isso se deva ao fato de que os dados agrupados por hora trazem informações acerca do processo de consumo energético com maior nível de detalhe do que os dados agrupados por mês, por exemplo. No caso das séries diária e horária, houve rejeição para todos os quatro atrasos considerados no cálculo de ambas as estatísticas discriminantes, tanto em termos de análise de significância como de p-valores.

Séries de consumo mensal de baixa tensão da CEMIG

No caso das séries de consumo mensal de baixa tensão da CEMIG, foi aplicado o SSS a cada uma das oito séries associadas às diferentes classes de consumidores, além da própria série de consumo total de baixa tensão. Em cada teste foram geradas 1000 séries de dados sub-rogados. Na Figura 3.23, são apresentados os gráficos da série original de consumo de baixa tensão total juntamente com a componente de tendência estimada e a série resultante do procedimento de extração da tendência.

40 3 Descrição e Análise de Dados 0 20 40 60 80 100 120 0.7 0.75 0.8 0.85 0.9 0.95 1 tempo (meses) Consumo (normalizado) Série Tendência 0 20 40 60 80 100 120 −0.15 −0.1 −0.05 0 0.05 0.1 Consumo (normalizado) tempo (meses)

Figura 3.23: Dados de consumo mensal de baixa tensão da CEMIG - À esquerda, série original e componente de tendência estimada; à direita, série resultante após a extração da componente de tendência.

de dados sub-rogados realizado com as oito séries de consumo mensal por setor e a série de consumo mensal total de baixa tensão. Em todos os casos foram consideradas as primeiras quatro componentes obtidas via SSA para a aproximação da tendência, à exceção das séries dos setores ‘poder público’ e ‘rural’, para as quais se utilizaram a duas primeiras componentes e a primeira componente, respectivamente.

A observação das referidas tabelas revela que os setores para os quais se patenteou a rejeição da hipótese nula, que pressupõe aleatoriedade nas flutuações irregulares das séries, foram o ‘poder público’, o ‘rural’, o ‘industrial’ e o ‘serviço público’, em termos de limites confiança de 2σ. A análise de p-valores conduz à mesma conclusão acrescentando-se o setor ‘iluminação pública’, e com a ressalva de que para este setor e para o setor ‘industrial’ a rejeição se dá em nível forte (0,01 < Pv < 0,05), enquanto que nos outras ela se verifica em nível muito forte (Pv < 0,01), de acordo com a escala apresentada na Tabela 3.2. No caso do setor ‘iluminação pública’ a análise do p-valor indicou rejeição em nível forte, sendo que não houve rejeição analisando-se a significância com intervalos de confiança de 2σ. Isso parece ser um indicativo que a distribuição de FACs, pelo menos para o atraso de uma amostra, não é gaussiana.

As séries para as quais não se acusou a rejeição da hipótese respondem por algo em torno de 75% do total de consumo de baixa tensão, o que se reflete na não rejeição da hipótese para o caso da série de consumo total de baixa tensão.

Série de consumo total de New England

Do mesmo modo que a série de consumo total da CEMIG, a série de consumo de New England também está originalmente agrupada por hora, e a partir dela é possível construir as séries de consumo total por dia, por semana, por quinzena e por mês. Na Figura 3.24 são apresentados os gráficos da série original de consumo mensal juntamente com a componente de tendência estimada e a série obtida após extração da tendência. Para estimação da tendência, foi considerada a combinação aditiva das

3.4 Detecção de Determinismo 41

Tabela 3.5: Séries de consumo mensal de baixa tensão da CEMIG - Significância asso- ciada à FAC e à IMM para atrasos de 1 a 4 amostras.

SFAC SIMM Série vs Atraso 1 2 3 4 1 2 3 4 Ilum. Pub. 1,64 0,48 1,36 1,05 1,72 0,52 0,91 0,13 Pod. Pub. 3,33 2,25 1,67 2,85 1,06 1,04 2,26 0,05 Rural 4,36 2,46 0,29 2,69 3,92 1,40 0,22 1,27 Resid. 0,62 1,20 0,28 0,19 0,11 0,49 0,05 0,66 Ind. 1,59 1,15 0,27 2,10 1,40 0,57 1,34 0,59 Serv. Pub. 0,82 0,02 0,97 0,03 2,40 0,61 0,51 0,69 Cons. Prop. 1,35 1,00 0,65 0,64 0,57 1,21 0,44 0,09 Comer, 1,21 0,42 1,19 0,66 1,25 0,09 0,25 0,94 Total BT 0,32 0,81 0,69 0,84 1,15 0,54 1,09 1,65

Tabela 3.6: Séries de consumo mensal de baixa tensão da CEMIG - p-valores associados à FAC e à IMM para atrasos de 1 a 4 amostras.

PvFAC PvIMM Série vs Atraso 1 2 3 4 1 2 3 4 Ilum. Pub. 0,02 0,61 0,12 0,25 0,09 0,58 0,38 0,92 Pod. Pub. 0,002 0,02 0,07 0,002 0,30 0,30 0,01 0,99 Rural 0,002 0,002 0,75 0,002 0,002 0,16 0,83 0,08 Resid. 0,53 0,21 0,77 0,87 0,86 0,66 0,99 0,52 Ind. 0,09 0,24 0,82 0,02 0,14 0,60 0,15 0,56 Serv. Pub. 0,50 0,96 0,49 0,79 0,006 0,54 0,52 0,57 Cons. Prop. 0,17 0,30 0,56 0,56 0,60 0,24 0,68 0,97 Comer. 0,22 0,65 0,24 0,54 0,22 0,88 0,75 0,35 Total BT 0,79 0,41 0,50 0,42 0,25 0,62 0,30 0,10

42 3 Descrição e Análise de Dados quatro primeiras componentes obtidas por meio da decomposíção da série original em 30 componentes via SSA. A Figura 3.25 ilustra as estatísticas discriminates associadas à série mensal juntamente com as respectivas significâncias obtidas ao se realizar o teste de dados sub-rogados com a geração também de 1000 séries artificiais.

0 50 100 150 200 250 6 7 8 9 10 11 12x 10 6 tempo (meses) Consumo (MWh) Série Tendência 0 50 100 150 200 250 −1 −0.5 0 0.5 1 1.5 2 2.5x 10 6 tempo (meses) Consumo (MWh)

Figura 3.24: Dados de consumo mensal de New England - À esquerda, série original e componente de tendência estimada; à direita, série resultante após a extração da componente de tendência. 1 1.5 2 2.5 3 3.5 4 −0.5 0 0.5 Atraso (amostras) FAC 1 1.5 2 2.5 3 3.5 4 0 2 4 6 Atraso (amostras) Significância (FAC) 1 1.5 2 2.5 3 3.5 4 0.4 0.6 0.8 1 Atraso (amostras) IMM 1 1.5 2 2.5 3 3.5 4 2 4 6 8 Atraso (amostras) Significância (IMM)

Figura 3.25: FAC e IMM das séries de consumo mensal de New England e das respec- tivas séries sub-rogadas. A significância define a distância entre a série original e as séries artificiais.

As Tabelas 3.7 e 3.8 apresentam as significâncias e os p-valores do teste de dados sub-rogados para o caso mensal. É inequívoca a rejeição da hipótese nula tanto para a FAC como para a IMM, o que nos permite concluir quanto à existência de determinismo nas flutações irregulares dessa série. Com base nesta constatação e na observação feita anteriormente, no caso das séries de consumo de baixa tensão da CEMIG, acerca da maior tendência em se rejeitar a hipóteses em séries com intervalos menores entre amostras adjacentes, poupou-se do trabalho de realização do teste para as séries sema- nal, quinzenal, diária e horária. Importante lembrar mais uma vez que a série mensal

3.4 Aplicação do Método de Dados Sub-rogados CSS 43 de New England apresenta um padrão muito mais regular e detectável a olho nu do que as séries da CEMIG, e talvez seja por esse fato que a rejeição de hipótese no caso da primeira seja mais patente no que no caso das últimas.

Tabela 3.7: Aplicação do SSS às séries de consumo mensal de New England - Signifi- cância associada à FAC e à IMM para atrasos de 1 a 4 amostras.

SFAC SIMM

Série vs Atraso 1 2 3 4 1 2 3 4

Mensal 4,95 1,61 4,30 3,15 5,59 5,89 5,07 2,58

Tabela 3.8: Aplicação do SSS às séries de consumo mensal de New England - p-valores associados à FAC e à IMM para atrasos de 1 a 4 amostras.

PvFAC PvIMM

Série vs Atraso 1 2 3 4 1 2 3 4

Mensal 0,002 0. 09 0,002 0,002 0,002 0,002 0,002 0,01