• Nenhum resultado encontrado

3.4 O CONTEXTO TECNOLÓGICO DA GESTÃO DO CONHECIMENTO

3.4.6 Sistemas para Descoberta de Conhecimento em Bases de Dados

3.4.6.1 Data Warehouse

Segundo Inmon (1997), o Data Warehouse (DW) é um conjunto de dados baseado em assuntos, integrado, não- volátil e variável em relação ao tempo, de apoio às decisões gerenciais. Essa definição é tida como clássica pela maioria dos estudiosos do assunto. A seguir são apresentadas as principais características de um DW, possibilitando uma melhor compreensão dessa definição.

a) baseado em assuntos - refere-se ao armazenamento de informações sobre temas específicos para o negócio da organização, conforme o interesse das pessoas que o utilizarão;

b) integração - essa é a característica mais relevante do DW, pois é ela quem irá definir a representação única para os dados provenientes dos diversos sistemas operacionais que formarão o DW (INMON, 1997);

c) não-volátil - significa que o DW permite apenas a carga periódica dos dados e consultas a esses dados (MORAES, 1998);

d) variante no tempo - o dado em um DW tem valor histórico, ou seja, refere-se a algum momento específico, não sendo atualizável. A cada ocorrência de mudança, uma nova entrada é criada a fim de sinalizá-la.

Um ambiente de Data Warehousing13, como o ilustrado na Figura 3.4, é um sistema composto por (INMON, 1997; MORAES, 1998):

a) fontes de dados que “alimentam” o sistema; b) o armazém de dados (DW) do sistema;

c) um sistema de gerência de banco de dados (SGBD);

d) um componente back end – conjunto de aplicações responsáveis por extrair, “limpar”, transformar, integrar e carregar os dados de diferentes fontes no DW;

e) um componente front end – conjunto de aplicações responsáveis por disponibilizar aos usuários finais acesso ao DW;

f) um componente para armazenar e gerenciar os metadados do sistema.

Componente Back End Componente Front End . . . 1 2 n Fontes externas Fontes internas Repositório de Metadados Data Warehouse SGBD Usuários finais

Figura 3.4 – Arquitetura básica de um sistema de Data Warehousing

Fonte: (MORAES, 1998)

13

O projeto de uma DW com propósitos corporativos está intimamente relacionado a esse ambiente, a sua função básica é oferecer suporte aos administradores para monitorarem e alcançarem seus objetivos, visando ao sucesso no gerenciamento dos negócios (FREITAS JR. et al., 2000).

3.4.6.1.1 Metodologia de Desenvolvimento de Soluções Data

Warehouse

Os primeiros projetos sobre Data Warehouse referiam-se a uma arquitetura do tipo centralizada. A implementação dessa abordagem requer uma metodologia rigorosa e uma completa compreensão dos negócios da organização. Essa abordagem pode ser longa e dispendiosa e, por isso, sua implementação exige um planejamento bem detalhado. Com o aparecimento de Data Mart (Data Warehouse departamental), a abordagem descentralizada passou a ser uma das opções de arquitetura Data Warehouse (DOMENICO, 2001).

A tecnologia usada, tanto no DW como no Data Mart, é a mesma. As variações que ocorrem são mínimas, tanto em volume de dados como na complexidade de carga. A principal diferença é a de que os Data Marts são voltados somente para uma determinada área da organização. Já o DW é voltado para os assuntos de uma organização como um todo. Portanto, cabe a cada organização avaliar a sua demanda e optar pela melhor solução.

Distinguem-se seis etapas consecutivas no desenvo lvimento de Data Warehousing. A primeira etapa consiste na identificação da área de negócio a ser modelada. Na segunda etapa, faz-se necessário definir qual o processo de negócio a ser modelado.

A terceira etapa consiste nos levantamentos de requisitos, que deverão ser revistos à medida que o protótipo for implementado e apresentado. Devido à própria natureza exploratória do trabalho de pesquisa e da própria natureza dos sistemas que se procura atender no ambiente DW, em um primeiro momento não se obtém uma especificação completa de todos os requisitos. Ao se implementar sistemas cuja finalidade é análise, o refinamento dos requisitos necessários deve ser realizado de forma incremental. Essa análise forma-se no decorrer da implementação e validação do protótipo. Kimball (1998) considera o levantamento de requisitos o centro do DW. É esse levantamento que determina que dados devem estar disponíveis no DW, como devem ser organizados e com que freqüência deve m ocorrer às atualizações.

A quarta etapa consiste na construção do modelo propriamente dito. Normalmente, utiliza-se a modelagem dimensional. A modelagem dimensional é uma técnica de projeto lógico de banco de dados mais utilizada no desenvolvimento de um Data Warehouse. Na verdade, ela busca apresentar os dados em um formato que seja intuitivo e, ao mesmo tempo, atenda a acessos com um alto desempenho (KIMBALL, 1998).

A quinta etapa consiste na implementação do protótipo do DW. Nessa etapa, é realizada a implementação dos componentes de software que compõem o processo de extração, transformação e carga. Normalmente, essa é a parte mais trabalhosa, sobretudo, quando se constrói um DW baseando-se em vários sistemas fontes. Finalmente, a última etapa consiste na implantação da solução desenvolvida, ou seja, na carga inicial da base, seguida pela inicialização da ferramenta OLAP14 e pelo treinamento dos usuários finais (TARAPANOFF, 2001).

As ferramentas OLAP representam uma categoria de software que permite aos analistas, gerentes e executivos extrairem, de forma rápida e interativa, informações dos dados armazenados em um DW. A fim de permitir essa visualização e manipulação dos dados, essas ferramentas oferecem diferentes funções, sendo que as mais tradicionais são a apresentação dos dados em “tabelas cruzadas”, pivoting, drill-down, drill-up e slice-dice. A tabela cruzada permite que seja facilmente realizada uma operação conhecida como pivoting. Ela refere-se tanto a rearranjar as dimensões, como a adicionar novas dimensões. Drill-down é o processo utilizado para solicitar uma visão mais detalhada de um conjunto de dados. Por outro lado, a operação drill-up é o oposto, já que fornece uma visão dos dados cada vez mais generalizada. Uma outra operação muito utilizada em aplicações de OLAP é a slice-dice, que consiste em reduzir a dimensionalidade dos dados (MORAES, 1998).