• Nenhum resultado encontrado

Data Warehouse Departamental

No documento FREDERICO CLÁUDIO PEIXINHO (páginas 82-87)

De acordo com TURBAN et al. (2009), as organizações estão coletando dados, informações e conhecimento em níveis cada vez maiores e, manter e usar estes dados está se tornando cada vez mais complexo. Com o advento da Internet o número de usuários que acessam informações está crescendo cada vez mais. O trabalho com múltiplos bancos de dados vem se tornando uma tarefa muito difícil e que exige um grande conhecimento especializado.

A CPRM é uma empresa pública que atua no campo da geração e difusão do conhecimento geocientífico, nas áreas de geologia, hidrologia e meio ambiente. A empresa manipula grande quantidade de dados que necessitam estar armazenados em bancos de dados, de modo a permitir tomada de decisões estratégicas. Atualmente, estes dados estão organizados em bases de dados temáticas, sendo que uma dela refere-se à hidrogeologia, um importante segmento de serviço da instituição.

Os dados hidrogeológicos são coletados interna e externamente, estes últimos, dos órgãos gestores e intervenientes em recursos hídricos. Estes dados, depois de efetuada sua depuração são armazenados numa base central e difundidos para o usuário final, através de sistema transacional/operacional (SIAGAS).

O SAD proposto considera a necessidade de prover uma plataforma de dados históricos integrados a partir do qual se possa fazer análise para dar suporte às decisões estratégicas. O ambiente mais adequado para atender esta finalidade é o de um Data

Warehouse.

O motivo principal que leva a considerar no modelo conceitual do SAD aplicado aos recursos hídricos subterrâneos, o ambiente de Data Warehouse Departamental ou Data

Mart ao invés de um ambiente de banco de dados tradicional, reside no fato dos ambientes de

suporte à decisão e extração do conhecimento em bases de dados serem caracterizados pela não volatilidade e pela complexidade das consultas ad hoc.

A escolha do Data Warehouse Departamental, ou seja, um Data Mart ao invés de

Data Warehouse Corporativo decorreu do fato de se estar projetando um SAD para uma área

específica de serviço da empresa.

Em relação ao modelo de dados, é proposto adotar o modelo dimensional ao invés do modelo tradicional, denominado relacional por que o modelo dimensional atende melhor aos requisitos relacionados com maior facilidade em manipular funções de agregações, associações, classificações, entre outros aspectos, próprios do ambiente do sistema de apoio à decisão ao contrário do que ocorre com o modelo relacional cujo foco reside na definição de um modelo de transação eficiente GOUVEIA (2008).

Vale considerar que a fonte principal de dados para o Data Store Operacional - ODS e Data Warehouse vem da base de dados operacional administrada pelo SIAGAS, cujo modelo de dados é normalizado e tem um dicionário de dados padronizado. Esta característica reduz a complexidade de estrutura do ODS ou Base de Dados Referencial, bem como facilita a execução das etapas de processamento e transformação do processo KDD.

3.7 Análise de Negócios e Visualização de Dados

Neste item será abordada a análise de negócios com suas respectivas características, bem como a visualização dos dados.

3.7.1 Análise do Negócio das Águas Subterrâneas

Cada vez mais estão sendo necessários dados e informações detalhadas, precisas e oportunas para dar suporte à decisão e a implementação de estratégicas em recursos hídricos. A seguir são apresentadas as principais áreas que demandam dados e informações sobre recursos hídricos subterrâneos:

Gestão dos Recursos Hídricos

Os dados e informações de águas subterrâneas são insumos essenciais para a aplicação dos instrumentos de gestão dos recursos hídricos. O deficiente controle das águas subterrâneas, a carência de dados confiáveis e representativos e a falta de sistemas integrados de informações são os principais fatores que mais tem contribuído para aplicação deficiente do instrumento de outorga de direito do uso da água, cuja atribuição é dos órgãos estaduais em recursos hídricos. O modelo de sistema de apoio à decisão proposto neste trabalho considera o estabelecimento de mecanismo de integração entre o SIAGAS os sistemas de informações de recursos hídricos dos órgãos gestores e intervenientes em recursos hídricos.

Estudos Hidrogeológicos

A ampliação do conhecimento dos recursos hídricos subterrâneos nos principais aquíferos brasileiros envolve a elaboração de mapas hidrogeológicos, apoiado em sistema de informações geográficas (SIG). Os dados de poços são insumos essenciais na elaboração destes mapas. A insuficiência de dados e a ausência de sistema de informações geográficas integrado aos mapas são as principais deficiências do processo. No modelo conceitual de SAD aplicado aos recursos hídricos subterrâneos propõe-se incorporar funcionalidades relacionadas à integração da base de dados aos mapas hidrogeológicos.

Oferta de Água

Ampliar a oferta de água, principalmente, nas regiões com elevado deficit hídrico, como o semiárido nordestino, através da revitalização de poços, tem sido a estratégia adotada pelo Governo. Para realizar este trabalho é fundamental dispor de sistema de apoio à decisão que, a partir de uma regra negócio estabelecida, escolha a melhor alternativa para recuperação dos poços. Atualmente este procedimento é feito em ambiente externo ao SIAGAS. No modelo conceitual proposto neste trabalho será considerada a análise de negócio acima exposta.

Contaminação das Águas

A contaminação das águas subterrâneas é pouco conhecida no Brasil em decorrência de falta de informações. A base de dados atual contempla um número muito pequeno de parâmetros hidroquímicos. O grande esforço deve ser concentrado no processo de enriquecimento dessa base de dados. No modelo de SAD considerado neste trabalho, destaca- se o uso da técnica de mineração de dados, principalmente, aplicada à avaliação da qualidade das águas subterrâneas.

A partir da análise de negócio de águas subterrâneas o modelo conceitual do sistema de apoio à decisão aplicada à água subterrânea, deve considerar:

 ferramenta automática de extração, transformação e carga (ETL) dos dados provenientes de fontes externas para o banco de dados operacional administrado pelo SIAGAS;

data store operational - ODS, derivado da base de dados operacional, o qual constitui a base de dados referencial;

data warehouse departamental serve para organizar dados para o processamento analítico da informação;

 ferramentas para análise de negócios estruturado nos seguintes níveis: descoberta de informações e conhecimento, suporte decisão e visualização

3.7.2 Relatórios e Consulta para Visualização de Dados

Segundo TURBAN et al. (2009), o termo processamento analítico online (OLAP) normalmente refere-se a uma gama de atividades realizada por usuários finais em sistema

online. OLAP inclui atividades de geração e respostas de consultas, solicitação de relatórios e

gráficos ad hoc e execução dos mesmos, realização de análises estatísticas tradicionais ou modernas e construção de apresentações visuais.

Os produtos OLAP oferecem recursos de modelagem, análise e visualização de grandes quantidades de dados, ou para sistema de gerenciamento de dados (SGDB) ou para sistema de data warehouse. Eles oferecem uma visão conceitual multidimensional dos dados. Uma das características que devem estar presentes em ferramenta OLAP é a capacidade de efetuar operações como:

drill Across: ocorre quando o usuário pula de nível intermediário dentro de uma mesma dimensão; por exemplo a dimensão tempo é composta por ano, semestre, trimestre, mês e dia. A operação drill Across é executada quando o usuário, estando na dimensão de ano, passa direto para trimestre ou mês, sem visitar a dimensão de semestre;

drill Down: ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade.

drill Up: é o oposto do drill Down, ocorre quando o usuário aumenta a granularidade, diminuindo o nível de detalhamento da informação;

drill Thought: ocorre quando o usuário passa de uma informação contida numa dimensão para outra. Por exemplo: Inicia na dimensão do tempo e no próximo passo analisa a informação por região;

Slice e Dice: é uma das principais características de uma ferramenta OLAP. Como a ferramenta OLAP recupera microcubo (no OLAP as informações são armazenadas em cubos multidimensionais, que gravam valores quantitativos e medidas, permitindo a visualização através de diversos ângulos. Estas medidas são organizadas em categorias descritivas, chamadas de dimensões e formam, assim, a estrutura de cubo), surgiu a necessidade de criar um módulo, que se convencionou de Slice and Dice, para ficar responsável por trabalhar esta

informação. Ele serve para modificar a posição da informação, trocar linhas por colunas de maneira a facilitar a compreensão do usuário e girar o cubo sempre que houver necessidade.

A ferramenta OLAP, que obedece a estrutura cliente/servidor multiusuário, pode ser implementada de diversas formas, classificadas nos seguintes tipos:

 OLAP multidimensional (MOLAP). Quando o OLAP é implementado através de um banco de dados (ou data store) multidimensional especializado, ele é chamado de OLAP multidimensional (MOLAP). Os dados são organizados em estrutura de cubos. Seu uso é mais adequado para consultas financeiras. Com o MOLAP as consultas são mais rápidas, pois a consolidação já foi realizada.

 OLAP relacional (ROLAP). Quando um banco de dados OLAP é implementado através de um banco de dados relacional existente, ele é chamado de OLAP relacional (ROLAP). As ferramentas OLAP relacional extraem dados de bancos de dados relacionais.

Database OLAP e Web OLAP (DOLAP e Web OLAP). O database OLAP se refere a um sistema de gerenciamento de banco de dados relacional projetado para hospedar uma estrutura e executar cálculos OLAP. O Web OLAP se refere a dados de OLAP acessíveis de um navegador da Web.

 Desktop OLAP. O desktop OLAP envolve ferramentas OLAP simples e baratas que executam análise local multidimensional e apresentação de dados baixados de bancos de dados relacionais ou multidimensionais para máquinas do cliente.

A Oracle e a Microsoft, grandes fornecedores de banco de dados, fornecem servidores OLAP juntamente com banco de dados relacionais tradicionais: OLAP option da Oracle e Analysis Services 2005 da Microsoft. Além disso, temos outras ferramentas OLAP, como Distributor Data Solutions da MicroStrategy e Analytics Maestro da Centage Corporation.

O Analysis Services 2005 é uma tecnologia utilizada por trás do Analysis Services 2000. Ele vem com o conceito UDM (Unified Dimensional Model) – Modelo Dimensional Unificado), o qual permite que DBAs (Database Administrator) e desenvolvedores definam dimensões, cubos OLAP e hierarquias de forma ―abstrata‖ que possam subsequentemente ser armazenados em bases de dados relacionais ou multidimensionais.

O OLAP Option da Oracle é executado com um processo único, com única instância de banco de dados, sendo portável para todas as plataformas de servidor em que o banco de dados Oracle pode ser executado.

O DSS MicroStrategy é classificada como uma ferramenta ROLAP por acessar um banco relacional via comandos SQL.

A ferramenta OLAP Maestro, é fornecida e desenvolvida pela Hyper Consultoria em Informática. Ela suporta a metodologia de desenvolvimento de Data Warehouse. Esta medotologia tem a vantagem de ter resolvido o problema de conformidade entre conceitos e dimensões. O Maestro resolve este problema através do uso de um repositório central onde são definidas medidas e dimensões.

A tecnologia OLAP permite ao usuário realizar cálculos complexos, através de consultas com maior flexibilidade e funcionalidade. As qualidades essenciais das ferramentas OLAP são a rapidez, a sumarização e análise flexível dos dados.

No documento FREDERICO CLÁUDIO PEIXINHO (páginas 82-87)

Documentos relacionados