• Nenhum resultado encontrado

Data Warehouse Toolkit: Telecomunicações e Utilitários (Cap. 10)

N/A
N/A
Protected

Academic year: 2021

Share "Data Warehouse Toolkit: Telecomunicações e Utilitários (Cap. 10)"

Copied!
29
0
0

Texto

(1)

Data Warehouse Toolkit:

Telecomunicações e Utilitários (Cap. 10)

Vinícius Ramos Toledo Ferraz Prof. Dr. Ricardo Rodrigues Ciferri

(2)

Data Warehouse e OLAP dezembro de 2009 2

Agenda

n  Dicas para revisão de projetos

n  O que está errado neste estudo de caso?

n  Correções!

n  Dimensão Posição Geográfica

(3)

Dicas para revisão de projetos

n  Granularidade

q  Qual o grão da tabela de fatos?

“Declarar uma definição clara e concisa do grão da tabela de fatos é fundamental para um

esforço de modelagem produtivo”

“Devem ser identificados os fatos que são consistentes com a declaração do grão”

(4)

Data Warehouse e OLAP dezembro de 2009 4

Dicas para revisão de projetos

n  Granularidade

q  Qual o grão da tabela de fatos?

Fato da transação de vendas a varejo no POS

Chave da data (FK) Chave do produto (FK) Chave da loja (FK)

Chave da promoção (FK)

Número da transação POS (DD) Quantidade de vendas

Total de vendas em dólar Valor de custo em dólar

Valor de lucro bruto em dólar

Grão = 1 linha por linha de transação POS

Fato da cesta de mercado no POS Chave da data (FK)

Chave do produto A (FK) Chave do produto B (FK) Chave da loja (FK)

Chave da promoção (FK) Contagem da cesta

Quantidade de vendas do produto A Quantidade de vendas do produto B Total de vendas em dólar do produto A Total de vendas em dólar do produto B

Grão = 1 linha para cada par de produtos vendidos em um

dia por loja e promoção

(5)

Dicas para revisão de projetos

n  Granularidade

q  Qual o grão da tabela de fatos?

“Fatos agregados como totais anuais são perigosos, pois não são totalmente aditivos”

“Ir para o nível mais baixo de granularidade possível não implica utilizar a maior quantidade

de dados detalhados disponíveis na empresa”

(6)

Data Warehouse e OLAP dezembro de 2009 6

Dicas para revisão de projetos

n  Granularidade

q  Qual o grão da tabela das tabelas de dimensão?

“Cada dimensão deve utilizar um único valor com cada linha de medições da tabela de fatos”

“Devemos recolher as hierarquias de atributos das dimensões, sempre que possível”

(7)

Dicas para revisão de projetos

n  Granularidade

q  Qual o grão da tabela das tabelas de dimensão?

“A economia de disco com o snowflaking raramente compensa suas desvantagens em

complexidade e desempenho da consulta”

“Usar outriggers em um cluster de cardinalidade baixa ou atributos reaproveitados com

freqüência deve ser a exceção, e não a regra”

(8)

Data Warehouse e OLAP dezembro de 2009 8

Dicas para revisão de projetos

n  Dimensão Data

A que se refere a Dimensão Data?

(9)

Dicas para revisão de projetos

n  Dimensões de degeneração

q  O grão da tabela de fatos representa uma transação ou item de linha da transação?

q  Se tivéssemos uma dimensão separada para as informações de cabeçalho de uma

transação, seríamos redundantes?

“Os números de controle operacional

normalmente dão origem a dimensões vazias e são representados como dimensões de

degeneração”

(10)

Data Warehouse e OLAP dezembro de 2009 10

Dicas para revisão de projetos

(11)

Dicas para revisão de projetos

n  Chaves substitutas

q  Há identificadores operacionais sendo utilizados como chave?

“Em vez de contar com chaves ou identificadores operacionais, recomendamos o uso de chaves

substitutas no seu projeto dimensional”

“Nenhuma chave do DW deve ser inteligente”

(12)

Data Warehouse e OLAP dezembro de 2009 12

Dicas para revisão de projetos

n  Dimensões em excesso (ou em falta)

q  O projeto contém entre 5 e 15 dimensões?

“Um número muito grande de dimensões

normalmente é um sinal de que várias delas não são completamente independentes e devem ser

combinadas.

(13)

Dicas para revisão de projetos

(14)

Data Warehouse e OLAP dezembro de 2009 14

Agenda

n  Dicas para revisão de projetos

n  O que está errado neste estudo de caso?

n  Correções!

n  Dimensão Posição Geográfica

(15)

O que está errado neste projeto?

n  Data Warehouse de uma grande

empresa de telecomunicações wireless

Da ta

Cli ent e

Pr od ut o

Pla no de Tar

ifa Ca nal

de ve nd as

Lin ha de ser

viç o

Sw itc h

Fo rn ec ed or

Co nta

do LR

E mp res a

Fu nci on ári o

Tip o da ch am ad a

St atu s da ch am ad a

Bilhetagem do cliente X X X X X X

Tráfego de detalhes da chamada X X X X X X

Compras X X X X X

Estoque do distribuidor X X X X X

Vendas por canal X X X X X X X

Chamadas de serviço X X X X X X X

(16)

Data Warehouse e OLAP dezembro de 2009 16

O que está errado neste projeto?

n  Foco no processo de bilhetagem do cliente, pois deseja-se poder analisar...

n  Uso mensal

n  Receita gerada pelo cliente (bilhetagem)

n  Organização de vendas

n  Plano de tarifas

q  ...para medir o desempenho do canal de vendas e seu representante, além de analisar a eficácia dos planos de tarifas.

(17)

O que está errado neste projeto?

n  Dinâmica dos serviços da empresa:

n  Todo mês, é gerada uma conta para cada linha de serviço (número telefônico)

n  Cada linha de serviço é associada a um único cliente

n  Um cliente pode ser várias linhas de serviço, que aparecem como itens de linha separados na mesma conta

n  Cada linha de serviço possui seu próprio conjunto de métricas de bilhetagem, como o número de minutos usados e a tarifa de serviço mensal

n  Há um único plano de tarifa associado a cada linha de serviço em uma dada conta. Mas tal plano pode

mudar

n  Um rep. de vendas (e sua empresa/canal de vendas respectivos) é associado a cada linha de serviço para avaliar a receita gerada por cada rep. de vendas.

(18)

Data Warehouse e OLAP dezembro de 2009 18

O que está errado neste projeto?

n  A equipe de DW expõe orgulhosamente sua

“obra-prima” da modelagem dimensional e aguarda o SEU pronunciamento...

Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

Dimensão Rep. Vendas

Chave do rep. de vendas (PK natural) Nome do rep. de vendas

ID da empresa de vendas

Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas

Fato da conta Conta nº (FK)

ID do cliente (FK)

Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Conta Conta nº (PK)

Data da conta

Nº linha de serviço (FK)

Dimensão Linha de Serviço Nº linha de serviço (PK)

Cód. da área

Cód. e prefixo da área

Cód. ativação da linha de serviço

Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas

Grão = 1 linha por conta a cada mês

(19)

Revisando o projeto...

Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

Dimensão Rep. Vendas

Chave do rep. de vendas (PK natural) Nome do rep. de vendas

ID da empresa de vendas

Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas

Fato da conta Conta nº (FK)

ID do cliente (FK)

Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Conta Conta nº (PK)

Data da conta

Nº linha de serviço (FK)

Dimensão Linha de Serviço Nº linha de serviço (PK)

Cód. da área

Cód. e prefixo da área

Cód. ativação da linha de serviço

Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas

Grão = 1 linha por conta a cada mês O grão mais baixo seria: 1 linha por linha de serviço em

X

(20)

Data Warehouse e OLAP dezembro de 2009 20

Revisando o projeto...

Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

Dimensão Rep. Vendas

Chave do rep. de vendas (PK natural) Nome do rep. de vendas

ID da empresa de vendas

Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas

Fato da conta Conta nº (FK)

ID do cliente (FK)

Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº da linha de serviço (FK) Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Conta Conta nº (PK)

Data da conta

Dimensão Linha de Serviço Nº linha de serviço (PK)

Cód. da área

Cód. e prefixo da área

Cód. ativação da linha de serviço

Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas

Grão = 1 linha por linha de serviço em uma conta

Esta dimensão provavelmente terá o mesmo nº de tuplas que a tabela de fatos!

DD

Vamos criar uma dimensão data!

(21)

Revisando o projeto...

Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

Dimensão Rep. Vendas

Chave do rep. de vendas (PK natural) Nome do rep. de vendas

ID da empresa de vendas

Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas

Fato da conta Chave da data da conta (FK) Conta nº (DD)

ID do cliente (FK)

Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº da linha de serviço (FK) Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Data da conta Chave da data da conta (PK) Data da conta

Ano da data da conta ...mais atributos

Dimensão Linha de Serviço Nº linha de serviço (PK)

Cód. da área

Cód. e prefixo da área

Cód. ativação da linha de serviço

Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas

Grão = 1 linha por linha de serviço em uma conta

Este snowflaking é desnecessário!

(22)

Data Warehouse e OLAP dezembro de 2009 22

Revisando o projeto...

Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

Dimensão Rep. Vendas

Chave do rep. de vendas (PK natural) Nome do rep. de vendas

ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas

Fato da conta Chave da data da conta (FK) Conta nº (DD)

ID do cliente (FK)

Nº do rep. de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº da linha de serviço (FK) Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Data da conta Chave da data da conta (PK) Data da conta

Ano da data da conta ...mais atributos

Dimensão Linha de Serviço Nº linha de serviço (PK)

Cód. da área

Cód. e prefixo da área

Cód. ativação da linha de serviço

Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas

Grão = 1 linha por linha de serviço em uma conta

Fatos textuais raramente são uma boa escolha de projeto!

Vamos agupar este fato textual e seus atributos descritivos na Dimensão Plano de Tarifas!

(23)

Revisando o projeto...

Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

Dimensão Rep. Vendas

Chave do rep. de vendas (PK natural) Nome do rep. de vendas

ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas

Fato da conta Chave da data da conta (FK) Conta nº (DD)

ID do cliente (FK)

Nº do rep. de vendas (FK) Cod. do plano de tarifas (FK) Nº da linha de serviço (FK) Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Data da conta Chave da data da conta (PK) Data da conta

Ano da data da conta ...mais atributos

Dimensão Linha de Serviço Nº linha de serviço (PK)

Cód. da área

Cód. e prefixo da área

Cód. ativação da linha de serviço

Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas Descrição do plano de tarifas Código do tipo de plano de tarifas Descrição do tipo de plano de tarifas

Incentiva-se a implementação de chaves substitutas!

(24)

Data Warehouse e OLAP dezembro de 2009 24

Revisando o projeto...

Dimensão Cliente Chave do cliente (PK) ID do cliente (chave natural) Nome do cliente

Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

...mais atributos

Dimensão Rep. Vendas Chave do rep. de vendas (PK)

ID do rep. de vendas (chave natural) Nome do rep. de vendas

ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas

Fato da conta Chave da data da conta (FK) Conta nº (DD)

Chave do cliente (FK)

Chave do rep. de vendas (FK) Chave do plano de tarifas (FK) Chave da linha de serviço (FK) Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual

Tarifa de roaming Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Data da conta Chave da data da conta (PK) Data da conta

Ano da data da conta ...mais atributos

Dimensão Linha de Serviço Chave da linha de serviço (PK) Nº linha de serviço (chave natural) Cód. da área

Cód. e prefixo da área Prefixo da linha de serviço

Data de ativação da linha de serviço

Dimensão Plano de Tarifas Chave do plano de tarifas (PK) Cód. plano de tarifas (chave natural) Abreviação do plano de tarifas Descrição do plano de tarifas Código do tipo de plano de tarifas Descrição do tipo de plano de tarifas

Grão = 1 linha por linha de serviço em uma conta

Fato atualizado anualmente em meio a fatos atualizados mensalmente!

(25)

Revisando o projeto...

Dimensão Cliente Chave do cliente (PK) ID do cliente (chave natural) Nome do cliente

Cidade do cliente CEP do cliente

Data do primeiro serviço Crédito original

...mais atributos

Dimensão Rep. Vendas Chave do rep. de vendas (PK)

ID do rep. de vendas (chave natural) Nome do rep. de vendas

ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas

Fato da conta Chave da data da conta (FK) Conta nº (DD)

Chave do cliente (FK)

Chave do rep. de vendas (FK) Chave do plano de tarifas (FK) Chave da linha de serviço (FK) Nº de chamadas

Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist.

Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de roaming

Tarifa de longa dist.

Impostos

Tarifas regulatórias

Dimensão Data da conta Chave da data da conta (PK) Data da conta

Ano da data da conta ...mais atributos

Dimensão Linha de Serviço Chave da linha de serviço (PK) Nº linha de serviço (chave natural) Cód. da área

Cód. e prefixo da área Prefixo da linha de serviço

Data de ativação da linha de serviço

Dimensão Plano de Tarifas Chave do plano de tarifas (PK) Cód. plano de tarifas (chave natural) Abreviação do plano de tarifas Descrição do plano de tarifas Código do tipo de plano de tarifas Descrição do tipo de plano de tarifas

Versão final!

(26)

Data Warehouse e OLAP dezembro de 2009 26

Dimensão Posição Geográfica

n  Utilizada quando a localização geográfica faz parte do conjunto de atributos

q  Pode ser uma rua, cidade, estado CEP ou

mesmo um conjunto de latitudes e longitudes

q  Cria-se uma tabela geográfica mestra, onde os dados são padronizados e depois reutilizados

q  Cada linha desta tabela é um uma localização geográfica.

(27)

Dimensão Posição Geográfica

n  Outrigger de localização Outrigger de localização:

Normalização aceitável de uma dimensão com atributos de

localização que, de outra forma, seriam demasiadamente replicados.

Notem que a hierarquia de localização não foi normalizada!

Notem também que este exemplo não aplica algumas das dicas apresentadas neste capítulo ;-)

(28)

Data Warehouse e OLAP dezembro de 2009 28

Dimensão Posição Geográfica

n  Integração com GIS

q  Possibilita visualização espacial das consultas, permitindo evidenciar informações antes

“escondidas” em planilhas e relatórios tradicionais

q  Permite que o GIS tire proveito dos recursos espaciais dos SGBD’s

(29)

Vinícius R. T. Ferraz

vinicius_ferraz@dc.ufscar.br

Perguntas

Referências

Documentos relacionados

Compete ao conselho geral emitir parecer sobre todas as questões solicitadas pelo conselho de administração da ULS, nomeadamente sobre programas e planos de actividade e

No período de primeiro de janeiro a 30 de junho de 2011, foram encaminhadas, ao Comitê de Segurança do Paciente da instituição sede do estudo, 218 notificações de

após a administração, a curto prazo, da dose recomendada para o tratamento da ansiedade transitória e dos distúrbios de ansiedade (por exemplo, 0,75 a 4 mg por dia). Certos

Pregão Eletrônico nº 0074/2016 – Aquisição de material de consumo para laboratório do Hospital Universitário Professor Edgar Santos- HUPES da Universidade Federal da Bahia -

O objetivo deste trabalho foi avaliar, in vitro, os efeitos anti-helmínticos do extrato aquoso das folhas e do extrato metanólico dos frutos de algaroba sobre cultivos de larvas de

Júri de Seleção de trabalhos Ginecologia/ Obstetrícia Hélder Ferreira Luís Guedes Martins Júri de Prémio CO Ginecologia/ Obstetrícia Anabela Branco José Cabral Luísa Vieira

O escore CHADS2 também diferiu entre os grupos, havendo maior prevalência de escore igual a zero entre os pacientes com FApa e flutter em relação aos pacientes com FApe (27,8%

O uso de jogos para este grupo se torna uma ferramenta eficaz, pois muitos destes profissionais tem baixa formação escolar além de estarem há muito tempo fora das salas