1 INTRODUÇÃO
2.1 BUSINESS INTELLIGENCE (CONCEITOS E DEFINIÇÕES)
2.3.7 MODELO DIMENSIONAL
Com referência a modelagem dimensional e tabelas fatos, pode-se citar a afirmação de Kimball (2002, p. 20):
Na década de 1970, AC Nielsen e IRI usaram esses termos de modo consistente para descrever suas ofertas de dados corporativos, que poderiam ser descritos precisamente hoje em dia como data marts dimensionais para dados de vendas no varejo. Muito antes de a simplicidade ser um estilo de vida, os desenvolvedores de bancos de dados adotaram esses conceitos para simplificar a apresentação de informações analíticas. Eles compreenderam que um banco de dados não seria usado a menos que fosse incluído de forma simples.
Na visão de Machado (2011, p. 79):
A modelagem multidimensional é uma técnica de concepção e visualização de um modelo de dados de um conjunto de medidas que descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresenta- los em visões que suportem a análise dos valores desses dados.
Portanto, a modelagem dimensional pode ser uma forma de modelar os dados, para que os dados fiquem de fácil acesso para manipulação e/ou extração de relatórios (KIMBALL, 2002, p.20).
Em comum, os autores Barbieri (2001), Kimball (2002) e Machado (2011), citam que a modelagem dimensional é composta dos seguintes itens:
tabela fato;
tabela de dimensão; medidas.
Para o melhor entendimento, os itens, citados a cima, serão abordados nas próximas sessões.
2.3.7.1 Tabelas fato
Em concordância com Kimball (2002, p. 21), Uma tabela de fatos é a principal tabela de um modelo dimensional em que as medições numéricas de desempenho da empresa estão armazenadas”. A tabela fato é responsável por armazenar os dados de medição dos processos de negócio em um único local. (KIMBALL, 2002, p.21).
A palavra fato pode representar uma medição de negócio. Pode-se imaginar as vendas diárias de um mercado, em que cada dia é anotado a quantidade de produtos vendidos e quantidade de venda em dinheiro para cada produto comercializado. Então é feito um agrupamento por dia, produto e valor, resultando em uma linha para cada item agrupado (KIMBALL, 2002, p.21).
A seguir, é exibida a figura 7 que representa um exemplo de tabela fato.
Figura 7 - Tabela fato
Fonte: Kimball (2002, p. 21).
Para Kimball (2002, p. 23), “Todas tabelas de fatos possuem duas ou mais chaves estrangeiras, conforme designado na notação FK (foreign key) ”. Essa notação é apresentada na figura 7, acima. Todavia essa chave estrangeira pode se referir a outra tabela, como exemplo, na figura 7 Chave do Produto (FK), que pode referenciar uma tabela de produtos que podem descrever produtos cadastros. Essa aplicação pode-se fazer para que não seja perdido a referência do produto descrito na tabela fato. (KIMBALL, 2002, p. 23).
Citando a afirmação de Kimball (2002, p. 23), “[...] veremos que todas as granularidades de uma tabela de fatos enquadram-se em uma destas três categorias: transação, instantâneos periódico e instantâneos acumulados”. Podeser abordado o assunto granularidade de tabela fato na sessão seguinte.
2.3.7.2 Granularidade
O conceito de granularidade pode ser apresentado conforme Kimball (2002, p. 37):
Declare o grão (nível de detalhes) do processo de negócio. Declarar o grão significa especificar exatamente o que cada linha da tabela de fatos representa. O grão exprime o nível de detalhes associados às medidas da tabela de fatos. Ele fornece a resposta para a pergunta: “Como descrever uma linha específica na tabela de fatos? ”.
São exemplos de declaração de grãos:
um item de linha individual em um ticket de vendas a varejo de um cliente à medida que é lido por um dispositivo de varredura (scanner);
um item de linha em uma conta recebida de um médico; um cartão de embarque individual para entrar no avião;
um instantâneo diário dos níveis de estoque de cada produto em um warehouse;
um instantâneo mensal de cada conta bancária.
Conforme descrito por Kimball (2002), a granularidade de tabelas fato instantâneos periódicos são para apresentar dados em períodos de tempo regulares, exemplo o valor em venda para os produtos dividido em meses. Outra granularidade é fato de transação que representa os dados de um acontecimento no tempo instantâneo. Fato de instantâneo cumulativo pode representar diversas datas e múltiplos eventos.
Após o descrito sobre tabelas fatos e granularidade, poderá ser apresentado, na próxima sessão sobre tabelas de dimensão.
2.3.7.3 Tabelas de dimensão
Como afirma Kimball (2002, p. 24), “Em um modelo dimensional bem projetado, as tabelas dimensão possuem muitas colunas ou atributos. Esses atributos descrevem as linhas na tabela de dimensão”. Entretanto, a tabela de dimensão está sempre acompanhada a uma tabela fato. Elas podem ser caracterizadas por carregar os atributos da tabela fato, porém em uma tabela dimensão (KIMBALL, 2002, p. 25).
No exemplo, a seguir, pode-se ter entendimento de vários atributos carregados em tabelas de dimensão. Como exemplo, na figura 8, é apresentada uma tabela dimensão de um produto, em que essa tabela pode conter atributos desse produto.
Figura 8 - Tabela dimensão
Fonte: Kimball (2002, p. 25).
Conforme afirmação de Kimball (2002, p. 25), “Os melhores atributos são os textuais e os discretos. Os atributos devem ser formados por palavras reais e não por abreviações criptografadas”.
Na concepção de Machado (2011, p. 6), “Conceitualmente são os elementos que participam de um fato, assunto de negócios. São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por país”, “por produto” e “por região”“.
Após apresentar, nas sessões anteriores, sobre os assuntos tabela fato, granularidade e tabela dimensão, pode-se apresentar a sessão de medidas, ou variáveis, como afirma Machado (2011).
2.3.7.4 Medidas (variáveis)
Na visão de Machado (2011, p. 81), “Medidas são atributos numéricos que representam um fato, a performance de um indicador de negócios relativo às dimensões que participam desse fato”, é possível citar alguns exemplos de medida como: valor total das
vendas, quantidade de produtos vendidos, quantidade em estoque de produtos, custo da venda e lucro obtido com venda.
Medidas podem ser entendidas como as variáveis que serão calculadas, existente dentro da tabela fato, ou a forma que será calculada.
Na próxima sessão, será feita a união do conteúdo apresentado nas sessões anteriores, contendo tabela fatos e dimensão, podendo ser resultado em um data warehouse.
2.3.7.5 União de fatos e dimensão
Para Barbieri (2001, p.81), “O produto final da modelagem Dimensional é a produção de um modelo conceitual dimensional, formado por tabelas fatos e tabelas dimensão”.
No entendimento de Kimball (2002, p. 27), “[...] a tabela de fatos formada por medidas numéricas é associada a um conjunto de tabelas dimensão preenchidas com atributos descritivos”.
Na compreensão Machado (2011, p. 92):
O modelo estrela é a estrutura básica de um modelo de dados multidimensional. Sua composição típica possui uma grande entidade central denominada fato (fact table) e um conjunto de entidades menores denominadas dimensões (dimension table), arranjadas ao redor dessa entidade central, formando uma estrela.
A visão dos três autores, citados a cima, Barbieri (2001), Kimball (2002) e Machado (2011), podem convergir para o mesmo modelo dimensional, ou esquema estrela, conforme figura 9, apresentada a seguir, podendo serem visualizadas as dimensões tempo, região, cliente, vendedor e produto, e apresentando a tabela de fato vendas.
Figura 9 - Modelo estrela
Fonte: Machado (2011, p. 92).
Com a compreensão de modelo dimensional, poderá ser abordado, na próxima sessão, OLAP, responsável por apresentar os dados existentes no DW.