Uma das iniciativas para transformar dados em informação para utilização em Sistemas de Apoio à Decisão, foi criado o conceito de Data Warehouse. Este trabalho de conclusão de curso tratou das definições, tipos e principalmente da importância dos sistemas de informação para as organizações, focando principalmente nos Sistemas de Apoio à Decisão (SAD), mas o objetivo principal foi a pesquisa, definição e desenvolvimento de um projeto de Data Warehouse para auxiliar os gestores da ACAFE na tomada de decisão.
PROBLEMATIZAÇÃO
Formulação do Problema
Desenvolver um projeto de Data Warehouse é um processo muito crítico com múltiplos pontos e fases que precisam ser muito bem analisados e desenhados. Também trabalharam em ferramentas de desenvolvimento e análise, principalmente nas fases de desenvolvimento de data warehouse e interação com usuários finais.
Solução Proposta
A necessidade de conseguir abstrair informação para apoiar os gestores na tomada de decisões tem crescido e está a tornar-se não só um problema de gestão, mas também operacional.
OBJETIVOS
Objetivo Geral
Objetivos Específicos
Algumas dessas informações podem até ser desconhecidas dado o cenário atual dos sistemas utilizados para extraí-las. Estas decisões podem ajudar a ACAFE neste novo modelo de ingresso de novos estudantes nas universidades.
METODOLOGIA
Foram identificados modelos existentes das bases de dados envolvidas no processamento do vestibular da ACAFE para análise e estudo no desenvolvimento do data warehouse informacional. A modelagem de data warehouse foi uma das principais atividades deste trabalho de conclusão de curso e foi o foco desta fase.
ESTRUTURA DO TRABALHO
A aplicação do ETL (extração, transformação e carregamento) foi uma das principais tarefas desta fase, pois é um ponto crucial no desenvolvimento deste data warehouse, pois inclui todas as regras de negócio a serem aplicadas ao projeto. O Capítulo 3 apresenta o desenvolvimento detalhado do Data Warehouse, incluindo a especificação, implementação e apresentação da metodologia utilizada.
SISTEMAS DE INFORMAÇÃO
- Dados vs. Informação
- A Qualidade da Informação
- A Importância dos Sistemas de Informação
- Tipos de Sistemas de Informação
- A Evolução dos Sistemas de Informação
- Processo de tomada de decisão
- Sistemas de Apoio a Decisão
- Características dos Sistemas de Apoio à Decisão
Fatores ambientais como clientes, fornecedores, concorrentes, acionistas e agências reguladoras interagem com a organização e seus sistemas de informação” (LAUDON E LAUDON, 2004). Estas bases de dados devem ser concebidas, implementadas e desenvolvidas tendo em vista servir estes sistemas de informação.
A ACAFE
Para isso, os SADs necessitam de bases de dados muito bem estruturadas e planejadas, atendendo assim às suas necessidades. Atualmente existe uma base de dados que recolhe amostras de internamentos, mas esta base de dados não suporta as características da informação que um data warehouse pode suportar de forma mais adequada.
DATA WAREHOUSE
Características
Enquanto os bancos de dados operacionais estão focados em aplicações de negócios, o Data Warehouse está focado em tópicos e negócios. No Data Warehouse as atualizações ocorrem apenas por meio de gravações, sem alterações ou exclusões de registros. Os dados residentes no Data Warehouse nada mais são do que uma série sofisticada de instantâneos capturados em um momento específico.”
Arquitetura
Camada de metadados (dicionário de dados): informações que descrevem os dados, informações como descrições de registros, comandos de criação de tabelas, diagramas de entidade/relacionamento (ER) e dados de um dicionário de dados. A Figura 15 ilustra como funciona a arquitetura em duas camadas, composta por componentes cliente (Front end) e componentes servidor (Back end), sendo atrativa porque utiliza sistemas e servidores de banco de dados existentes, o que requer um investimento mínimo em hardware e software. Conforme ilustra a Figura 16, na terceira camada estão as fontes de dados, na segunda camada os servidores de banco de dados de alta velocidade contendo o DW e na primeira camada as aplicações de interface do usuário (Front end) (OLIVEIRA, 2002).
Granularidade
O exemplo apresentado na Figura 17 mostra os diferentes níveis de granularidade em relação ao tema valor de vendas. A primeira granularidade mostra o valor das vendas por data, hora, vendedor e valor utilizando cerca de 50 registros por mês. A segunda granularidade mostra o valor de vendas por mês, fornecedor e valor utilizando apenas 1 registro por mês.
ETL (Extraction, Transformation and Loading)
Um fator a ser observado é que não é o tamanho do registro no volume de dados que importa, mas sim o número de registros. Os dados podem ser provenientes de sistemas de transações corporativas, planilhas, arquivos externos ou até mesmo dados provenientes de outras bases de dados (OLIVEIRA, 2002). Carregar dados do ambiente operacional existente também não é um grande desafio, pois isso só precisa ser feito uma vez.
Tipos de Implementação
Herança e Arquitetura: Todos os DMs provenientes do DW utilizam a arquitetura e os dados desse DW, permitindo fácil manutenção; Como a implementação top-down é difícil de definir, bastante cara e requer muito tempo e investimento de implementação, a implementação Botton Up se popularizou, permitindo o planejamento e design de DMs sem depender do DW da empresa. Os dados do DW são modelados a partir de uma visão macro, seguida da implementação de partes desse modelo escolhidas pelas áreas de interesse que compõem os DMs.
Modelagem Dimensional
Cada registro na tabela de fatos representa o total de vendas de um determinado produto por dia em uma loja. As medidas são os atributos numéricos que representam um fato, desde o desempenho de um indicador de negócio até as medidas que participam desse fato. É determinado pela combinação de dimensões que participam de um fato, e se localizam como propriedades de um fato (MACHADO, 2000).
Modelo Star (Estrela)
Dimensões são os elementos que compõem um fato, assunto ou negócio, e definem o contexto desse assunto ou negócio, normalmente não possuem atributos numéricos, sendo descritivos e classificatórios apenas dos elementos que compõem um fato (MACHADO, 2000). Os membros de uma dimensão determinam a posição de um item de dados. Por exemplo, a ocorrência de ano, trimestre e mês constitui a dimensão temporal, e todas as cidades, estados e regiões constituem a dimensão geográfica. O relacionamento entre tabelas de fatos e tabelas de dimensões é um link simples ou um relacionamento um-para-muitos, respectivamente.
Modelo SnowFlake (Flocos de Neve)
Ciclo de Vida do DW
Planejamento do Projeto: É aqui que o projeto de Data Warehouse começa e o escopo do projeto é especificado. Especificação do Aplicativo do Usuário Final: Define as ferramentas para acesso do usuário final ao Data Warehouse. Gestão de projetos: esta atividade ocorre durante todo o ciclo de vida do Data Warehouse.
OLAP (On-Line Analytical Processing)
É também um conjunto de funções para análise multidimensional, que facilita ao usuário a visualização de informações históricas e de dados projetados. Cubos são massas de dados retornados de consultas ao banco de dados e podem ser manipulados e visualizados de vários ângulos (usando a tecnologia Slice-and-dice) e diferentes níveis de agregação (usando a tecnologia Drill Down)” Oliveira Oliveira (2002). A consulta é enviada ao servidor de banco de dados relacional e lá processada, enquanto o cubo é mantido lá.
Metadados
A desvantagem é que um grande número de usuários acessando simultaneamente pode sobrecarregar o servidor e até causar seu travamento. Os metadados técnicos usados pelo pessoal de desenvolvimento e manutenção fornecem definições técnicas de dados e suas operações, especificando nomes de atributos, tipos de dados, fontes de extração, regras de transformação e outros. Os metadados de negócios usados pelos analistas de negócios são um elo entre o data warehouse e os gerentes, mostrando uma visão clara das regras de negócios.
Ferramentas de Apoio
O Microsoft Excel é uma ferramenta muito utilizada pelos gestores não só para interagir com cubos OLAP, mas também no seu dia a dia, onde disponibiliza outras funcionalidades importantes como planilhas de cálculo, análise, importação e exportação de dados em bancos de dados e tabelas operacionais.
METODOLOGIA DE DESENVOLVIMENTO
PLANEJAMENTO
Estudo da Organização
Para melhor identificar quais as decisões que estão a ser tomadas e com base nisso identificar as suas principais necessidades de informação, foi necessário realizar entrevistas com os responsáveis por estes sectores. De acordo com o organograma, os responsáveis pela Secretaria Executiva são o secretário executivo e pela Comissão Vestibular o coordenador técnico do vestibular.
Entrevista com gestores
Como o objetivo deste trabalho é atender a área de vestibular e auxiliar as instituições com informações, é necessário definir o processo a ser trabalhado. A partir das entrevistas foram coletados alguns indicadores escolhidos como importantes pelos gestores na tomada de decisão no planejamento do vestibular e auxiliar as instituições com informações sobre o mesmo. Quais locais de testes são historicamente viáveis para oferecer testes, levando em consideração os custos operacionais envolvidos;
REGRAS DE NEGÓCIO
Isso permite prever a demanda de candidatos em qualquer cidade, possibilitando novas estratégias de gestão. Permite a evolução da demanda por cursos, possibilitando novas estratégias de gestão na abertura de novos cursos. Permite a evolução da demanda por cursos por cidade campus, possibilitando novas estratégias de gestão em termos de abertura de campi.
MODELAGEM
Como este projeto de Data Warehouse visa apresentar informações aos gestores em um curto espaço de tempo, este modelo tem se mostrado eficaz. A Figura 29 ilustra a modelagem multidimensional do Data Warehouse do Vestibular ACAFE segundo o modelo estrela utilizando uma versão de teste da ferramenta ERwin na versão 7.2. TOTAL: todo CLASSIFICADO: todo CLASS_MASC: todo CLASS_FEM: todo NAO_CLASS: todo NAO_CLASS_MASC: todo NAO_CLASS_FEM: todo MISSING: todo MISSING_MASC: todo MISSING_FEM: todo INSCRIÇÃO: todo NO_PAID: todo CAMPUS.
PROJETO FÍSICO
TIME_ID: inteiro ANO: inteiro SEMESTRE: inteiro MONTH: inteiro DAY_WEEK: inteiro DAY: inteiro HORA: inteiro. INSTITUTION_ID: Inteiro (FK) MARKETING_ID: Inteiro (FK) BANK_ID: Inteiro (FK) PROOF_CITY_ID: Inteiro (FK) RESIDENCE_CITY_ID: Inteiro (FK) CITY_ID_COURSE: Inteiro (FK) TIME_ID: Inteiro (FK) SHIFT_ID: inteiro (FK) CAMPUS_ID: inteiro (FK) inteiro (FK) ID_CURSO_REOPCAO: inteiro (FK) ID_STATUS_COURSE: inteiro (FK) VACANCY_ID: inteiro (FK).
ETL E CARGAS DE DADOS
Classificar cidades" lista os dados recebidos do componente "Eu", necessário para comparação, pelo componente "Join", com as cidades que já existem na dimensão Data Warehouse. O componente "Verificar se existe" é responsável por verificar se existe uma cidade na dimensão Cidade. Caso não exista, chama o componente "Inserir no DW", responsável por inserir a nova cidade na dimensão Data Warehouse. Poderiam existir diversas saídas deste componente, mas apenas uma foi necessário, que é justamente a inserção caso não exista através do componente “Insert into DW” da Figura 33.
INICIAÇÃO DO FUNCIONAMENTO E RESULTADOS
TEČAJ COURSE_ID: int CODE: varchar(20) INTERNAL_CODE: varchar(20 NAME: varchar(150) ACTIVE_ESTAH: char(1) VESTIBULAR_VACANCIES: int ENEM_VACANCIES: int VACANCIES_EXIT: int TOTAL_APPROVED: int TOTAL_CLASSIFIEDS: int TOTAL_FAILED: int COORD INATOR : varchar ( 100) EMAIL: varchar (100) CAMPUS_ID: int TEST_AREA ID: int SHIFT_ID: int OBSERVATION_ID: int MODE_ID: int COMPETITION_ID: int TOTAL_CANDIDATES_MASC: int TOTAL_CANDIDATES_FEM: int TOTAL_CANDIDATES: int TOTAL_MISSING: int COMPETITION_TYPE ID SO: int TEST_ROOM ID_TEST_ROOM: int ŠTEVILKA: int OPIS: varchar(100) KAPACITETA: int ZGRADBA: varchar(100) BLOK: varchar(50) SOBA: varchar(50) FLOOR_TYPE: varchar(6) FLOOR: int TEST_AREA_ID: int TEST_LOCAL_ID: int COURSE_INFO.