• Nenhum resultado encontrado

CIn/UFPE Projeto Conceitual de BD - Prof. Robson Fidalgo 1

N/A
N/A
Protected

Academic year: 2021

Share "CIn/UFPE Projeto Conceitual de BD - Prof. Robson Fidalgo 1"

Copied!
51
0
0

Texto

(1)
(2)

Projeto Conceitual de BD

Data Warehouse e OLAP

Principais conceitos

Principais conceitos

Por:

Robson do Nascimento Fidalgo

(3)

Sistemas de Suporte à Decisão

Sistemas de Suporte a Decisão (SSD)



Permitem armazenar e analisar grandes volumes de dados

para extrair informações que auxiliam a compreensão do

comportamento dos dados

Armazenar  DW

Analisar  Relatórios, OLAP, Mineração e SIG



São sistemas computacionais que integram dados oriundos

de diversas fontes, devem ser de uso amigável e com

grande poder analítico

(4)

Suporte à Decisão X Operacional

Diferem de sistemas de suporte operacional, pois:



Operacional → orientado por transação

Ex: o produto vendido, o artigo publicado, o imposto predial pago



Decisão → orientado por assunto

Ex: Vendas, Publicações de Artigos, Gerenciamento Urbano

Dividir os dados em dois ambientes ortogonais



Operacional (normalmente já existe)



Estratégico (construir um DW)

(5)
(6)

Data Warehouse

Data Warehouse (DW)



Segundo Inomn, o DW é uma base de dados para facilitar

a execução de consultas de apoio à decisão, onde suas

principais características são :

Orientada ao assunto: pois o objetivo é tomar decisões sobre o

Orientada ao assunto: pois o objetivo é tomar decisões sobre o

"assunto” - tema dos dados.

Perfeitamente integrada: pois deve consolidar dados de

diferentes origens

Variante no tempo: pois deve-se manter um histórico dos dados,

permitindo comparações ao longo do tempo

Não volátil: pois as informações já presentes no banco são

(7)

Data Warehouse & Data Mart

Data Warehouse (DW)



BD otimizado para processamento de consulta complexas (Modelo

Estrela ou Flocos de Neve)



Objetivo: fornecer uma "imagem global da realidade do negócio".

Data Mart (DM)



O que é ?



O que é ?

É um

DW departamental

(específico a um assunto/negócio)

Subconjunto do DW que satisfaz os requisitos de uma atividade de negócio



Benefício ?

Tempo/dificuldade de implantação minimizado



Restrição ?

(8)

DW & Data Warehousing

Data Warehouse (DW) = Dados armazenados.

Data Warehousing =

Processo de construção do DW.



Data Warehousing é uma estratégia para armazenar e

manipular dados estratégicos, separadamente dos

operacionais, de forma a subsidiar a tomada de decisões

operacionais, de forma a subsidiar a tomada de decisões

Data Warehousing

Data Warehousing

DW

Estrela

ou

F. Neve

BD

Op.

BD

Op.

BD

Op.

BD

Op.

DM DM

DM

DM

DM

DM

DM

OLAP

Data Mining

Relatórios

Metadados produzidos em todas as etapas

E

T

L

Extract

Transform

Load

Operational

OD

S

Data

Store

(9)

ETL e ODS

Ferramentas de ETL



Responsáveis pela conversão dos dados do ambiente

operacional para o de suporte à decisão



Realizam Acesso, Extração, Transformação, Validação e Carga

dos dados

Operational Datastore (ODS)



Repositório de dados intermediário



Benefícios

Otimiza a criação do DW

Possibilita a realização de consultas relacionais sobre dados

históricos

(10)

Arquiteturas de Data Warehousing

Data Warehousing (Top-Down).



Visão do DW corporativo

Grande abrangência

Complexo/Custoso/Demorado

Alta probabilidade de insucesso



Só pode ser avaliado quando terminado.



Só pode ser avaliado quando terminado.

DW

DM

DM

DM

Data Warehousing Top

Data Warehousing Top--Down

Down

BD

Op.

BD

Op.

BD

Op.

BD

Op.

OLAP

Data Mining

Relatórios

Metadados produzidos em todas as etapas

E

T

L

Extract

Transform

Load

Operational

OD

S

Data

Store

(11)

Arquiteturas de Data Warehousing

Data Warehousing (Botton-Up).



Visão do DW Departamental

Foco específico nos aspectos mais críticos

-Complexo/-Custoso/-Demorado

Alta probabilidade de ilhas de dados



Pode acontecer dos DM não se integrarem.



Pode acontecer dos DM não se integrarem.

Data Warehousing Botton

Data Warehousing Botton--Up

Up

BD

Op.

BD

Op.

BD

Op.

BD

Op.

OLAP

Data Mining

Relatórios

E

T

L

Extract

Transform

Load

Operational

OD

S

Data

Store

DM

DM

DM

DW

(12)

Arquiteturas de Data Warehousing

Data Warehousing (Abordagem corrente).



Visão do DW Incremental

Planejar Top-Down

Desenvolver Botton-Up

ODS Histórico

DW

Data Warehousing Botton

Data Warehousing Botton--Up

Up

BD

Op.

BD

Op.

BD

Op.

BD

Op.

OLAP

Data Mining

Relatórios

Metadados produzidos em todas as etapas

E

T

L

Extract

Transform

Load

Operational

OD

S

Data

Store

DM

DM

DM

(13)

Modelagem = processo de abstração da realidade

Modelo ER



Usado para identificar relacionamentos entre tipos de entidades



Visa remover a redundância de dados



Processamento de Transações On-Line (OLTP)

Modelagem de Dados

Modelo Dimensional



Apresenta dados em uma estrutura intuitiva permitindo alta

performance de acesso



Independe da representação física dos dados



Organiza dados em tabelas de

fatos

e

dimensões



Processamento Analítico On-Line (OLAP)

(14)

Modelagem Dimensional

Tabelas de

Dimensão

Geográfica

Geográfica

Geográfica

Geográfica

Tabela Fatos

Medidas

Medidas

Dimensão

Dimensão

Componentes de Modelagem Dimensional

Geográfica

Produto

Tempo Und.

$

Produto

Produto

Produto

Produto

Tempo

Tempo

Tempo

Tempo

Tabela Fatos

Fatos

Fatos

(15)

Tabelas de fatos e de dimensões

As tabelas de Dimensões



Tabelas periféricas com pouco volume de dados



Seus atributos armazenam as descrições do negócio.

Ex: Categoria (Bebida), Tipo (refrigerante), Ano (2000)



Atributos tendem a ser organizados em hierarquias



Atributos tendem a ser organizados em hierarquias

EX: Produto (Categoria → Marca → Descrição)

Loja (Tipo → Endereço → Nome_Loja)

Tempo (Ano → Mês → Dia_Do_Mês)

O menor nível hierárquico define o grão do DW

(16)

Fatos e dimensões

A tabela de Fatos



Tabela central com grande volume de dados



Armazena as medições numéricas do negocio

(fatos)

e as FK para as dimensões

(fatos)

e as FK para as dimensões



As melhores medidas são numéricas e aditivas:

EX: Vendas

(R$)

, Vl_unitário

(R$)

, Despesas

(R$)

, QtdVendida

Temperatura não é um bom fato!

(17)

Fatos e dimensões

A tabela de Fatos



Quando um dado numérico é medida ou atributo ?

Medida ⇒ varia continuamente a cada amostragem



Ex: Quantidade vendida de um produto

Atributo ⇒ praticamente constante

Atributo ⇒ praticamente constante



Ex: Peso de um produto



Cada fato é a interseção entre as dimensões

relacionadas

(18)

Modelos Dimensionais do DW

Tabela Fato

Tabela Dimensão

Dim_Tempo

Dim_Tempo

Dim_Funcionario

Dim_Funcionario

Chave_Funcionario Codigo_Funcionario . . .

Dim_Produto

Dim_Produto

O esquema estrela (Star)

Tabela Fato

Dim_Tempo

Dim_Tempo

Chave_Tempo Data Data . . .

Fato_Vendas

Fato_Vendas

Chave_Tempo Chave_Empregado Chave_Produto Chave_Cliente Chave_Entregador

.

Data_Requerida

.

.

.

Dim_Produto

Dim_Produto

Chave_Produto Codigo_Produto

.

Codigo_Produto

.

.

.

Dim_Cliente

Dim_Cliente

Chave_Cliente Codigo_Cliente . . .

Dim_Entregador

Dim_Entregador

Chave_Entreegador Codigo_Entregador . . .

(19)

Modelos Dimensionais do DW

Fato_Vendas Chave_Funcionario Chave_Entregador Chave_Tempo Chave_Funcionario Chave_Produto Chave_Cliente Chave_Entregador RequiredDate . . .

Dim_Produto

Dim_Produto

Dim_Produto

Dim_Produto

Chave_Produto Nome Tamanho CodigoMarca Tabela-Dimensão Principal

O esquema Flocos de Neve (Snowflake)

Tabelas-Dimensão Secundárias . . .

MarcaProduto

MarcaProduto

MarcaProduto

MarcaProduto

CodigoMarca CodigoCategoria

Categoria

Categoria

Categoria

Categoria

CodigoCategoria Nome



Normalizar as dimensões



Kimball

aconselha,

devido

a

complexidade desta estrutura, não

transformar o esquemas estrela em

esquemas floco de neve (o ganho

(20)

Escolhendo um schema

Star

Star

Snowflake

Snowflake

Clareza

+ fácil

+ difícil

Número de tabelas

<

>

Número de tabelas

<

>

Complexidade de consultas

+ simples

+ complexo

(21)

O cubo multidimensional



É uma abordagem multidimensional (metáfora) para

visualização e organização dos dados



Várias dimensões podem ser usadas simultaneamente



Os dados são manipulados mais rapidamente e

facilmente (agregação em níveis de hierarquia)

Abstração do DW

Lo

ja

Tempo

P

r

o

d

u

t

o

categoria

marca

descrição

tipo

endereço

nome_loja

ano

mes

(22)

Dimensão Tempo

Chave_Tempo

Mes

Trimestre

Ano

^

Tempo

^

^

1996

Trim1/96

Janeiro

Fevereiro

Cubo Multidimensional

Agregação em Níveis de Hierarquias

Produto

1997

Trim2/96

Trim3/96

Trim4/96

Fevereiro

Março

(23)

Como representar as dimensões no cubo?

Produto

Loja Vendas

AAAA

F01

50

AAAA

F02

60

AAAA

100

BBBB

F01

40

F03

AAAA

Cubo Multidimensional

BBBB

40

BBBB

70

BBBB

80

CCCC

90

CCCC

120

CCCC

140

DDDD

20

DDDD

10

DDDD

30

F01

F01

F01

F02

F02

F02

F03

F03

F03

AAAA

BBBB

CCCC

DDDD

F01 F02 F03

(24)

Como representar as dimensões no cubo?

Produto

Loja Vendas

AAAA

F01

50

AAAA

F02

60

AAAA

100

BBBB

F01

40

F03

Produto Loja Tempo Vendas

AAAA F01 1999 50 AAAA F02 1999 60 AAAA F03 1999 100 BBBB F01 1999 40 BBBB F02 1999 70 BBBB F03 1999 80 CCCC F01 1999 90 CCCC F02 1999 120 CCCC F03 1999 140

1999

2000

AAAA

Cubo Multidimensional

BBBB

40

BBBB

70

BBBB

80

CCCC

90

CCCC

120

CCCC

140

DDDD

20

DDDD

10

DDDD

30

F01

F01

F01

F02

F02

F02

F03

F03

F03

CCCC F03 1999 140 DDDD F01 1999 20 DDDD F02 1999 10 DDDD F03 1999 30 AAAA F01 2000 50 AAAA F02 2000 60 AAAA F03 2000 100 BBBB F01 2000 40 BBBB F02 2000 70 BBBB F03 2000 80 CCCC F01 2000 90 CCCC F02 2000 120 CCCC F03 2000 140 DDDD F01 2000 20 DDDD F02 2000 10

AAAA

BBBB

CCCC

DDDD

F01 F02 F03

(25)

1999

2000

AAAA

1999

2000

AAAA

Qual o total de vendas do produto AAAA?

Exemplo de Consultas

Cubo Multidimensional

AAAA

BBBB

CCCC

DDDD

AAAA

BBBB

CCCC

DDDD

(26)

1999

2000

AAAA

1999

2000

AAAA

Qual o total de vendas da loja F03?

Exemplo de Consultas

Cubo Multidimensional

AAAA

BBBB

CCCC

DDDD

F01

F02

F03

AAAA

BBBB

CCCC

DDDD

F01

F02

F03

(27)

Qual o total de vendas do ano 1999?

1999

2000

AAAA

1999

2000

AAAA

Exemplo de Consultas

Cubo Multidimensional

AAAA

BBBB

CCCC

DDDD

AAAA

BBBB

CCCC

DDDD

(28)

Qual o total de vendas do produto BBBB no ano de

1999 e na loja F2?

1999

2000

AAAA

1999

2000

AAAA

Exemplo de Consultas

Cubo Multidimensional

AAAA

BBBB

CCCC

DDDD

F01

F02

F03

AAAA

BBBB

CCCC

DDDD

F01

F02

F03

(29)
(30)

O que é OLAP (On-Line Analytical Processing)?



Conjunto de tecnologias projetadas para analisar dados

típicos de suporte à decisão que estão no DW



Fornece dados em alto nível (totais,medias,min..)

OLAP



Acessa vários registros



Tem alta performance e consultas fáceis e interativas



Lida com dados históricos (dimensão temporal)

(31)

O que é OLAP ? (Cont.)



Exemplos de consultas típicas de OLAP:

Quais os produtos mais bem vendidos no mês passado?

Quais os 10 piores vendedores dos departamentos da filial X?

OLAP

Quais os 10 piores vendedores dos departamentos da filial X?

Qual a média salarial dos funcionários de informática na região sul

nos últimos 5 anos?

(32)

OLTP

O que é OLTP (On-Line Transaction Processing)?



Conjunto de tecnologias projetadas para analisar e

acessar dados típicos de suporte operacional

Exemplos de consultas típicas de OLTP:



Qual o produto mais vendido?



Qual o pior vendedor?



Qual o total de vendas?

(33)

OLAP X OLTP

Características

Ope racional

Estratégico

Objetivo

Op. diárias do negócio

Análisar o negócio

Visão dos dados

Relacional

Dimensional

Op. com os dados

Incl., Alt, Excl e Cons.

Carga e Consulta

Atualização

Contínua (tempo real)

Periódica (Bach)

N

o

de usuários

Milhares

Dezenas

OLAP

Características

OLTP

N

o

de usuários

Milhares

Dezenas

Tipo de usuário

Operaciona l

Gerencial

Interação c/ usuário

Pré-definida

Pré-definida e ad-hoc

Granularidade dos dados Detalhados

Detalhados e Resumos

Redundância dos dados Não ocorre

Ocorre

Volume dos dados

Megabytes-Gigabytes

Gigabytes-Terabytes

Histórico dos dados

Até a última atualização 5 a 10 anos

(34)

Arquiteturas OLAP

Relacional OLAP = ROLAP

Multidimensional OLAP = MOLAP

Híbrido OLAP = HOLAP

ROLAP



Utiliza BD relacional para fazer análise dos fatos



Utiliza SQL para Manipula os dados de forma

multidimensional



Lida com fatos atômicos assim como sumarizados.

(35)

Arquiteturas OLAP

ROLAP

Data Warehouse ou Data Mart

Data Warehouse ou Data Mart

Dados ROLAP Dados ROLAP

Dados ROLAP

Agregações ROLAP Agregações

AgregaçõesROLAPROLAP Agregações são armazenadasem tabelas relacionais

Dados-base são mantido no SGBD-fonte

Data Warehouse ou Data Mart

Data Warehouse ou Data Mart

Dados ROLAP Dados ROLAP

Dados ROLAP

Agregações ROLAP Agregações

AgregaçõesROLAPROLAP Dados ROLAP

Dados ROLAP

Dados ROLAPDados ROLAPDados ROLAP

Dados ROLAP

Agregações ROLAP Agregações

AgregaçõesAgregações ROLAPROLAPROLAP Agregações

AgregaçõesROLAPROLAP Agregações são armazenadasem tabelas relacionais

Dados-base são mantido no SGBD-fonte

SGBD

SGBD

em tabelas relacionais Estrutura totalmente relacional.

SGBD

SGBD

SGBD

SGBD

em tabelas relacionais Estrutura totalmente relacional.

(36)

MOLAP



Utiliza MDDB proprietários (com matrizes

n-dimensionais) para manipular fatos agregados



Principal premissa

Armazenar de forma multidimensional para visualizar de forma

Arquiteturas OLAP

Armazenar de forma multidimensional para visualizar de forma

multidimensional



Desvantagens

Não manipula fatos atômicos

Não trabalha com muitas dimensões

(37)

MOLAP

Data Warehouse ou

Data Mart

Data Warehouse ou

Data Mart

Cubo

Cubo

Armazena cópia da tabela fato e dimensões Armazena agregações

Data Warehouse ou

Data Mart

Data Warehouse ou

Data Mart

Data Warehouse ou

Data Mart

Data Warehouse ou

Data Mart

Cubo

Cubo

Armazena cópia da tabela fato e dimensões

Armazena agregações

Cubo

Cubo

Armazena cópia da tabela fato e dimensões Armazena agregações

Arquiteturas OLAP

SGBD

SGBD

Dados MOLAP Agregações MOLAP Armazena agregações

SGBD

SGBD

SGBD

SGBD

SGBD

SGBD

Dados MOLAP Agregações MOLAP Armazena agregações Dados MOLAP Agregações MOLAP Armazena agregações

(38)

HOLAP



Mistura de MOLAP com ROLAP



Suporta manipulação de fatos atômicos e agregados



Utiliza MDDB para analisar os fatos agregados

Arquiteturas OLAP



Utiliza SQL para manipular fatos atômicos

(39)

HOLAP

Data Warehouse ou Data Mart

Data Warehouse ou Data Mart

Cubo

Cubo

Dados-base mantidos no BD fonte

Agregações calculadas e armazenadas no cubo

Data Warehouse ou Data Mart

Data Warehouse ou Data Mart

Cubo

Cubo

Dados-base mantidos no BD fonte Agregações calculadas e armazenadas no cubo

Arquiteturas OLAP

Dados ROLAP Dados ROLAP Dados ROLAP SGBD SGBD Agregações MOLAP Dados ROLAP Dados ROLAP

Dados ROLAPDados ROLAPDados ROLAP

Dados ROLAPDados ROLAPDados ROLAP

Dados ROLAP

SGBD

SGBDSGBD

SGBD Agregações

(40)

Resumo sobre as Arquiteturas

Armazenamento Armazenamento Dados de base Agregações MOLAP MOLAP Cubo Cubo HOLAP HOLAP Tabela Relacional Cubo ROLAP ROLAP Tabela Relacional Tabela Relacional

Arquiteturas OLAP

Relacional Perspectiva do Cliente

Perspectiva do Cliente MOLAPMOLAP HOLAPHOLAP ROLAPROLAP

Performance de consulta Consumo em disco Manutenção do cubo Imediato Alto Alto Mais rápido Médio Médio Rápido Baixo Baixo

(41)

Conclusão sobre as Arquiteturas



ROLAP é mais flexível e mais geral



MOLAP é para soluções específicas ou departamentais

Arquiteturas OLAP

(42)

Desempenho x Armazenamento

Tempo de

Resposta

Calcular os agregados no momento

da recuperação ou armazená-los?

BD1

Quanto maior o número de agregados, melhor o

desempenho e mais dados para serem armazenados

e gerenciados!

(43)

Desempenho x Armazenamento

Tempo de

Resposta

Calcular os agregados no momento

da recuperação ou armazená-los?

BD1

BD2

Quanto maior o número de agregados, melhor o

(44)

Desempenho x Armazenamento

Tempo de

Resposta

Calcular os agregados no momento

da recuperação ou armazená-los?

BD1

BD2

BD3

Quanto maior o número de agregados, melhor o

desempenho e mais dados para serem armazenados

e gerenciados!

(45)

Desempenho x Armazenamento

Tempo de

Resposta

Calcular os agregados no momento

da recuperação ou armazená-los?

BD1

BD2

BD3

BD4

Quanto maior o número de agregados, melhor o

(46)

Principais Operações OLAP

Drill Down e Rolll Up (ou Drill Up)



Técnica que possibilita caminhar pela estrutura

multidimensional (hierarquias), permitindo ver

diferentes níveis de detalhes

Drill/Roll Up

Drill/Roll Up

1 Total

1 Total

Drill Down

Drill Down

50.000 Clientes

50.000 Clientes

500 Cidades

500 Cidades

50 Estados

50 Estados

5 Regiões

5 Regiões

1 Total

1 Total

(47)

Principais Operações OLAP

Drill Down e Roll Up (ou Drill Up)

Drill Down

Drill Down

Loja

Vendas

Loja

Tipo

Vendas

F01

Luxo

50

Popular

40

Padrão

90

Franquia

20

200

Drill Up

Drill Up

Loja

Vendas

F01

200

F02

260

F03

350

Franquia

20

F02

Luxo

60

Popular

70

Padão

120

Franquia

10

F03

Luxo

100

Popular

80

Padrão

140

260

350

(48)

Rotação



Técnica que gira o cubo, permitindo diferentes visões dos dados

4

3

4

Principais Operações OLAP

4

2

3

4 x 2 x 3

3

2

4

3 x 2 x 4

4

3

2

4 x 3 x 2

(49)

Slice and Dice



Técnica que fatia o cubo, permitindo restringir a

análise aos dados,

sem inversão

de eixos



“Semelhante” a cláusula WHERE de SQL

Principais Operações OLAP

4

2

3

4

2

2

2

2

3

(50)

DW e OLAP



Grupo de DW da UFRJ

(http://genesis.nce.ufrj.br/dataware/)



Data Warehouse Brasil (http://www.dwbrasil.com.br/)



Artigos de Kimball

Referências



Artigos de Kimball

(http://www.ralphkimball.com/html/articles.html)



Data Warehousing Institute

(http://www.dw-institute.com/)



OLAP Report

(51)

Referências

Documentos relacionados

No presente trabalho apresentou-se um modelo constitutivo de dano composto capaz de representar o comportamento diferenciado de materiais quase-frágeis, quando solicitados à

Em Ribeiro (1998), fica claramente demonstrada a existência de tais especificidades de ativo através da comparação do valor da madeira alocada na transação

Este documento é cópia do original, assinado digitalmente por JULIANA NASCIMENTO GALHARDO, liberado nos autos em 17/04/2018 às 11:35 ... Oficie-se como

Rua Visconde de Ouro Preto, 77 - Bairro Custódio Pereira - Uberlândia – MG - CEP 38405-202 Em seguida clique no ícone destacado para configurar o hardware. Para finalizar clique

O trabalho foi realizado com o objetivo de avaliar economicamente o efeito de doses e épocas de aplicação de manganês e de glifosato em pós-emergência

Especialidade médica que trata clinicamente ou através de cirurgia das doenças do aparelho reprodutor

Proponha Proponha uma uma função função chamada chamada inicializa() inicializa() que receba um vetor de inteiros, seu que receba um vetor de inteiros, seu tamanho,

Docente: Prof. A universidade como ambiente formativo está condicionada a sua organização. Houve mudanças no último século, essas dinâmicas foram diferentes em