• Nenhum resultado encontrado

Multiple Aggregation Prediction Algorithm com regressores

de variáveis exógenas, que de modo geral podem ser feita da seguinte maneira [20]: yt = ot(ω(vt−l+ a

0

t−1xt+ r(vt−l)εt)

vt = f(vt−l) + g(vt−l)εt (2.112)

at = Fxat−1+ gxxt−1εt

onde vt é o vetor de estados, até o vetor de parâmetros variáveis de tempo para vetor de variáveis

exógenas xt, Fx é a matriz de transição para variáveis exógenas, gx é vetor de persistência para

variáveis exógenas e xt−1é o vetor de variáveis exógenas invertidas.

Se for assumido que os parâmetros não devem mudar ao longo do tempo, então gx= 0. A

matriz de transição Fxno caso mais simples é a matriz de identidade, embora esta condição possa

ser relaxada para introduzir interações complexas entre os parâmetros. O vetor xt contém kx ele-

mentos. Quando xt = 0, a adaptação não está a acontecer, o que significa que at = at−1. Por

exemplo, modelo ETS (A, N, N), baseado no conjunto de equações2.112, com 2 regressores pode ser escrito como um sistema:

yt = lt−1+ a1,t−1x1,t+ a2,t−1x2,t+ εt lt = lt−1+ αεt a1,t = ( a1,t−1+ δ1xε1,tt , quando x1,t 6= 0 a1,t−1, quando x1,t= 0 a2,t = ( a2,t−1+ δ2xε2,tt , quando x2,t 6= 0 a2,t−1, quando x2,t= 0 (2.113)

A estrutura de adaptação para regressores sugerido em2.112é denominado "suavização não uniforme"e é baseado na modificação do método de aproximação estocástica. Os modelos de espaço de estados, neste caso, tornam-se não estáveis, mas ainda podem ser previsíveis. Esta condição é verificada durante a estimativa dos parâmetros. O mecanismo de adaptação permite a atualização eficiente de parâmetros de modelos com regressores muito diferentes, incluindo variá- veis dummy. Por padrão, este mecanismo não é ativado, então Fx é matriz de unitária, enquanto

todos os elementos do gxsão configurados para ser igual a zero.

Para implementar este método em R, é necessário recorrer à utilização do package smooth.

2.7

Multiple Aggregation Prediction Algorithm com regressores

Este é um método que propõe a extensão do MAPA, para a inclusão de variáveis exógenas (regressores). Doravante este método irá ser chamada de MAPAx.

É um método desenvolvido por Kourentzes e Petropoulos e foi elaborado para o caso de estudo de modelação promocional [4].

Seja Xj com observações xj,t a j-ésima variável exógena a ser incluída no modelo com j =

34 Metodologias e estado de arte forma [4]: ˜ yt = yt+ J

j=1 dj,t (2.114) dj,t = cjxj,t (2.115)

onde dj,t contêm o efeito de cada variável Xjno tempo t e cj é o seu coeficiente.

A formulação do MAPAx é similar ETSx, única diferença é que o efeito de cada variável é medido separadamente em dj; t permitindo incorporá-lo diretamente no MAPA.

Em cada nível de agregação temporal k, um d[k]j,i separado é calculado, com base no c[k]j esti- mado e X[k]j agregado temporariamente. Os vetores resultantes são tratados da mesma forma que os componentes de séries temporais estimados no caso univariante. Primeiro, eles são transfor- mados para o domínio do tempo original usando a equação2.72e depois combinados num único efeito em todos os níveis de agregação para cada variável Xj:

¯ dj,t+h = K−1 K

k=1 d[k]j,t+h (2.116)

Por fim a equação2.76, utilizada para a previsão univariada, é ajustada para incluir o efeito das estimações multivariadas:

ˆ yt[1]+h = ¯lt+h+ ¯bt+h+ ¯st−m+h+ J

j=1 ¯ dj,t+h (2.117)

Os parâmetros do ETS multivariado serão otimizados em cada nível de agregação temporal da mesma forma que o ETS univariado, e um modelo será ajustado usando AIC, como foi explicado anteriormente.

Porém, a agregação temporal introduz uma complexidade adicional para os modelos multi- variados. Conforme Xj são agregados, ficam mais suaves. Este efeito altera a correlação entre

variáveis explicativas e pode induzir à multicolinearidade em níveis de agregação superiores, se mais de uma variável estiver incluída no modelo. Para evitar tal efeito, é desejável transformar as variáveis para que estas se tornem ortogonais. Utiliza-se a análise de componentes principais, de forma a evitar o problema da multicolinearidade das entradas conforme o nível de agregação aumenta e reduz a dimensionalidade do MAPA multivariado.

Em suma podemos descrever o MAPAx como se segue. As séries temporais fornecidas e as promoções são temporariamente agregadas. Em cada nível de agregação, os dados são processados de acordo com a Figura2.7. As variáveis promocionais são processadas primeiro utilizando PCA e incorporadas no alisamento exponencial descrito pela equação2.115. Depois, os componentes de nível, tendência e sazonalidade, bem como o efeito promocional são extraídos. Os componentes são transformados em aditivos usando as expressões na Figura2.5. Estes componentes aditivos, juntamente com a parte promocional, retornam à sua frequência original utilizando a equação

2.7 Multiple Aggregation Prediction Algorithm com regressores 35

as equações2.74,2.75,2.75e2.116para cada nível, tendência, sazonalidade e componentes de promoção, respetivamente. Por fim, estes são combinados na previsão final utilizando equação

2.117. [4]

Figura 2.7: Fluxograma das etapas de cálculo para cada nível de agregação temporal do MA- PAx [4].

Capítulo 3

Caso de estudo

3.1

Conjunto de dados

O caso de estudo analisado recorreu a dados fornecidos pela Jerónimo Martins (JM). A JM possui diferentes topologias de lojas espalhadas por diversas regiões do país. Foram disponibiliza- das 12 lojas, com diferentes topologias, de acordo com a tabela3.1. Na tabela3.1está apresentado o número de identificação da loja (ID Loja), o número de produtos distintos para venda em cada loja e, também, a topologia de cada loja (em que T4 é a loja de maior dimensão).

Tabela 3.1: Número de SKUs e topologia de cada loja.

ID Loja Número de SKUs Tipo

412 20454 T4 843 19941 T4 689 21386 T4 687 21483 T4 480 17569 T2 392 17526 T2 821 17001 T2 391 16806 T1 393 17021 T2 388 17238 T2 491 13364 T2 492 11632 T2

Os produtos das lojas encontram-se distribuídos por 14 áreas, conforme mostra a tabela3.2. Nesta tabela é apresentado o nome de cada área, o número de produtos em cada uma e a percen- tagem a que corresponde esse número de produtos num universo do total de produtos disponíveis.

1

Destas 14 áreas foram escolhidas as 6 áreas principais – as primeiras 6 áreas apresentadas na tabela3.2– que correspondem a 93% do volume total de vendas diárias, acomodando 24 316 SKUs diferentes.

1De notar que esta informação é relativa ao conjunto das 12 lojas.

38 Caso de estudo

Tabela 3.2: Áreas, número de SKUs em cada área e a percentagem.

Descrição da área Número de SKUs Pergentagem

1 PERECIVEIS ESPECIALIZADOS 6302 4.9%

2 MERCEARIA 6217 4.8%

3 PERECIVEIS NÃO ESPECIALIZADOS 3682 2.9%

4 PRODUTOS PESSOAIS 3606 2.8%

5 DETERGENTES E PRODUTOS LIMPEZA 2514 1.9%

6 BEBIDAS 1995 1.5% 7 TEXTIL 84044 65% 8 BAZAR LIGEIRO 9778 7.6% 9 ELECT ENTRETENIMENTO 6202 4.8% 10 NEGOCIOS COMPLEMENTARES 4302 3.3% 11 TEXTIL JM 339 0.26% 12 SERVICOS 86 0.0666% 13 ARTIGOS RETORNAVEIS 11 0.0085% 14 ECONOMATO 3 0.002324%

A loja escolhida para ser analisada foi a 412 por ser uma loja de grande dimensão, com diversos produtos, e que apresenta o maior número de vendas. Os dados disponibilizados tem um período temporal de 3 de Janeiro de 2012 até 27 de Abril de 2015, ou seja, 1211 dias que corresponde a 173 semanas. Os estudos feitos foram realizados com dados semanais.

Na previsão da procura existem aquilo a que chamam fast moving goods e slow moving goods. Os fast moving goods são, como o próprio nome indica, bens que se movimentam rapidamente. Ou seja, as séries temporais que representa este tipo de bens não apresentam zeros, portanto apresenta apenas produtos com 100% de vendas. Neste caso, como os dados que iremos trabalhar são semanais, representam produtos que se vendem todas as semanas. Os slow moving goods são o oposto, portanto representam séries intermitentes.

Neste trabalho abordamos apenas os fast moving goods, e todos os métodos apresentados no capítulo2são válidos para utilizar em séries que não apresentam zeros. Temos um total de 988 SKUs, distribuídos por 203 categorias.

Na tabela3.3 estão disponíveis 50 categorias (apenas a título demonstrativo), o número de SKUs distintos que cada categoria contém, a média de unidades vendidas por semanas, a mediana de unidades vendidas por semana e a percentagem de semanas que a categoria revelou estar com promoções.

No desenvolvimento deste trabalho recorreu-se, em alguns métodos, à inclusão de informação externa - regressores. Foram utilizados 51 regressores para o LASSO e 50 para o ETSx e MAPAx. Os regressores são os seguintes: log(Vendas) com lag 1 2, preço, preço com lag de uma semana, número de dias semanais de promoção, número de dias semanais de promoção com uma semana de lag, percentagem de desconto, percentagem de desconto com lag 1, a última semana do mês, a última semana do mês com lag 1, 13 eventos de calendário (ano novo, carnaval, sexta-feira

Documentos relacionados