• Nenhum resultado encontrado

1 INTRODUÇÃO

2.5 Modelagem multidimensional

2.5.4 Modelo normalizado x Modelo multidimensional

O modelo ER, que é o modelo normalizado, fornece um modelo de dados de uma área específica de interesse, usando dois conceitos básicos: entidades e relacionamentos entre entidades. Os modelos multidimensionais usam três conceitos básicos: medidas, fatos e dimensões.

A modelagem ER é uma técnica de projeto lógico que busca eliminar a redundância dos dados. Este processo é extremamente benéfico para processar transações deixando-as simples e determinísticas. Em contrapartida, a modelagem multidimensional é uma técnica de projeto lógico que busca apresentar os dados em um framework padrão que é intuitivo e permite um acesso de alto desempenho (Kimball, 1998).

Em um ambiente de data warehousing a modelagem é radicalmente diferente do ambiente operacional, esquecendo-se tudo o que se sabe sobre a modelagem ER (Kimball, 1998). Porém, Moody e Kortink (2000) apresentam a modelagem ER como sendo igualmente aplicável no contexto de data warehouse tanto quanto no contexto operacional e que, segundo os autores, fornece uma importante base para projetos de data warehouse.

Singh (2001, p. 151) elabora uma comparação entre o modelo relacional e o modelo multidimensional, enfatizando que o modelo relacional tem sua origem no suporte aos processos operacionais, enquanto o modelo multidimensional destina-se a atender as necessidades dos profissionais do conhecimento e do suporte a decisão.

A modelagem multidimensional é bem diferente da modelagem normalizada, pois esta busca remover redundâncias de dados, gerando várias tabelas em um banco de dados. A diferença substancial entre as duas modelagens consiste, portanto, no nível de normalização de cada uma. Porém, tanto a modelagem normalizada quanto a multidimensional podem ser representadas através do diagrama ER (Kimball, 2002).

Aspectos relevantes para a comparação entre os dois modelos (Singh, 2001, p.151):

• no modelo multidimensional, a perspectiva da visualização das informações é de um período no tempo, enquanto no relacional, as transações são atômicas;

• os sistemas relacionais registram eventos atuais ou transações, enquanto o modelo multidimensional não se preocupa com os eventos em si, mas com o resultado quantitativo em um intervalo de tempo;

• a modelagem dos relacionamentos de entidades é a base do modelo relacional, que os registra explicitamente, enquanto no modelo multidimensional, estes relacionamentos estão implícitos na interseção das dimensões com a tabela de fatos.

Comparando-se o modelo ER (normalizado) e o modelo Estrela (multidimensional), são apontadas algumas das diferenças entre os dois modelos e a principal diferença entre estes modelos é a complexidade, considerando que a normalização do modelo ER gera inúmeras tabelas conectadas entre si, tornando-o confuso e de difícil compreensão para o usuário. O modelo multidimensional do tipo Estrela apresenta, porém, uma estrutura mais simples, em que uma tabela central, a Tabela Fatos, é ligada a várias Tabelas Dimensão de uma única vez, tornando o modelo mais facilmente compreendido (Oliveira, 1998).

O modelo ER está baseado no relacionamento entre os dados, de acordo com o procedimento real, enquanto que o modelo multidimensional está projetado com base nas necessidades do usuário, de acordo com sua visão de dados.

No modelo multidimensional as informações são armazenadas e analisadas sob uma perspectiva histórica, oferecendo uma visão global consistente e integrada para toda a empresa. No modelo ER as transações são atômicas, consistentes em um determinado escopo.

Os relacionamentos no modelo ER são modelados explicitamente, enquanto no modelo multidimensional tais relacionamentos são representados pela existência de fatos na intersecção entre as dimensões (Oliveira, 1998).

A maioria dos processos parte da suposição de que todos os elementos chaves podem ser agrupados em relacionamentos hierárquicos normalizados. Este conceito é comumente usado na modelagem ER, que busca assegurar a integridade do modelo. Porém, um modelo ER com estruturas normalizadas reflete relacionamentos e entidades como um instantâneo no tempo, não capturando mudanças nos relacionamentos com o passar do tempo. Como resultado, usar o modelo ER com tais objetivos pode gerar problemas de integridade de dados em uma análise histórica.

A volatilidade dos dados envolvidos gera problemas na análise operacional, pois a única hierarquia que não é volátil é a própria dimensão tempo. As demais hierarquias são voláteis no tempo (Wan, 2004).

A chave para entender a relação entre o diagrama multidimensional - DM e o diagrama entidade relacionamento – DER, é que um único diagrama ER pode ser decomposto em múltiplos diagramas multidimensionais. De certo modo, o DER pode representar em um único diagrama, múltiplos processos que nunca coexistem em um único conjunto de dados e em um único ponto consistente no tempo (Kimball, 1997).

Considera-se que o modelo ER e o modelo multidimensional, embora relacionados, são diferenciados um do outro. O quadro 3 mostra um resumo das diferenças entre os dois modelos.

Característica Modelo ER Modelo multidimensional

Estrutura • Confusa e de difícil

compreensão para o usuário • Simples e mais facilmente compreendida

Base do projeto • Relacionamento entre os dados • Base nas necessidades do usuário, de acordo com sua visão de dados Armazenamento de

dados • Transações são atômicas • Perspectiva histórica

Relacionamentos • Modelados explicitamente • Representados pela intersecção entre as dimensões Redundância de

dados • Remove a redundância • Permanece a redundância Quadro 3 - Resumo das principais diferenças entre os modelos ER e multidimensional. Fonte: Adaptado de Oliveira, 1998, p. 65.

Procedimentos de desnormalização podem ser adotados como projeto pré-físico de banco de dados e como um passo intermediário entre a modelagem lógica e física, e fornece uma visão adicional refinada do banco de dados lógico antes do projeto físico. O processo de refinamento requer um bom nível de conhecimento do projetista de banco de dados, bem como um conhecimento adequado dos requisitos da aplicação (Shin e Sanders, 2005).

Documentos relacionados