• Nenhum resultado encontrado

UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO"

Copied!
88
0
0

Texto

(1)

UNIVERSIDADE DO VALE DO ITAJAÍ

CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR

CURSO DE CIÊNCIA DA COMPUTAÇÃO

UM MODELO DE DATA MART PARA ÁREA DE MARKETING DE UMA

OPERADORA DE PLANOS DE SAÚDE

Área de Sistemas de Informação

por

Tiago Zaccaron Pazeto

Luiz Eduardo Perfeito Nunes, M.Sc

Orientador

Jean Carlos Raduenz, Bel.

Co-orientador

(2)

UNIVERSIDADE DO VALE DO ITAJAÍ

CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR

CURSO DE CIÊNCIA DA COMPUTAÇÃO

UM MODELO DE DATA MART PARA ÁREA DE MARKETING DE UMA

OPERADORA DE PLANOS DE SAÚDE

Área de Sistemas de Informação

por

Tiago Zaccaron Pazeto

Relatório apresentado à Banca Examinadora do Trabalho de Conclusão do Curso de Ciência da Computação para análise e aprovação.

Orientador: Luiz Eduardo Perfeito Nunes, M.Sc Co-orientador: Jean Carlos Raduenz, Bel.

(3)

ii

SUMÁRIO

LISTA DE ABREVIATURAS... iv

LISTA DE FIGURAS ... v

LISTA DE TABELAS ... vi

RESUMO ... vii

ABSTRACT ... viii

1

INTRODUÇÃO ... 1

1.1

PROBLEMATIZAÇÃO ... 2

1.1.1

Formulação do Problema ... 3

1.1.2

Solução Proposta ... 3

1.2

OBJETIVOS ... 3

1.2.1

Objetivo Geral ... 3

1.2.2

Objetivos Específicos... 4

1.3

METODOLOGIA ... 4

1.4

ESTRUTURA DO TRABALHO ... 5

2

FUNDAMENTAÇÃO TEÓRICA ... 7

2.1

EMPRESA ... 7

2.2

MARKETING ... 7

2.3

BUSINESS INTELLIGENCE (BI) ... 9

2.4

DATA WAREHOUSE (DW) ... 10

2.5

DATA MART (DM) ... 14

2.5.1

Modelo Top-Down ... 16

2.5.2

Modelo Bottom-up ... 19

2.5.3

Granularidade ... 21

2.5.4

OLAP (On-Line Analytical Processing) ... 22

2.5.5

Cubo ... 23

2.5.6

ETL (Extract, Transform and Load) ... 28

2.5.7

QlikView ... 29

2.6

SISTEMAS SIMILARES ... 31

3

DESENVOLVIMENTO ... 36

3.1

EMPRESA ... 36

3.1.1

Área de Marketing da Operadora de Planos de Saúde ... 37

3.1.2

Fontes de Informações ... 39

3.1.3

Regras de Negócio ... 40

3.2

DESCRIÇÃO DO PROBLEMA ... 41

3.3

MODELAGEM... 41

3.4

IMPLEMENTAÇÃO DAS REGRAS DE NEGÓCIO E SEUS SCRIPTS .. 48

(4)

iii

3.6

UTILIZAÇÃO DA FERRAMENTA E RESULTADOS ALCANÇADOS.. 57

4

CONCLUSÕES ... 68

REFERÊNCIAS BIBLIOGRÁFICAS ... 70

(5)

iv

LISTA DE ABREVIATURAS

BD Banco de Dados

BI Business Intelligence

CADSUS Cadastramento Nacional de Usuários do Sistema Único de Saúde

DBMS Database Management System

DM Data Mart

DW Data Warehouse

DTS Data Transformation Service

EDW Enterprise Data Warehouse

EQIE Equipe de Informações Estratégicas ETL Extract, Transform and Load

ETC Extração, Transformação e Carga

HOLAP Hybrid On-Line Analytical Processing

MOLAP Multidimensional On-Line Analytical Processing

OLAP On-line Analytical Processing

OLTP On-Line Transaction Processing

SAD Sistema de Apoio à Decisão

SGBD Sistemas de Gerenciamento de Banco de Dados ROLAP Relational On-Line Analytical Processing

TCC Trabalho de Conclusão de Curso

TI Tecnologia da Informação

(6)

v

LISTA DE FIGURAS

Figura 1. Arquitetura da tecnologia de BI ... 10

Figura 2. Data Warehouse orientado a assunto ... 11

Figura 3. Integração dos dados ... 12

Figura 4. Variação no tempo ... 13

Figura 5. Dados dinâmicos x dados estáticos ... 13

Figura 6. As estruturas de dados e sua utilização dentro da corporação ... 15

Figura 7. Modelo Top-down ... 17

Figura 8. Modelo Bottom-up. ... 19

Figura 9. Cubo ... 23

Figura 10. Modelo Estrela ... 25

Figura 11. Modelo SnowFlake ... 26

Figura 12. Estrutura OLAP na visão geral da arquitetura DW ... 28

Figura 13. Processo ETL ... 29

Figura 14. Exemplo do QlikView ... 30

Figura 15. Tela QlikView – ETL ... 31

Figura 16. Organograma da Operadora de Planos de Saúde ... 37

Figura 17. Modelagem das tabelas Fato e Dimensões. ... 42

Figura 18. Modelagem Flocos de Neve ... 47

Figura 19. Tela Filtros de Clientes ... 58

Figura 20. Tela de Filtros de Endereços ... 59

Figura 21. Informações do cadastro dos clientes ... 60

Figura 22. Informações de endereços dos clientes ... 60

Figura 23. Receita x Utilização ... 61

Figura 24. Gráfico Motivo de Exclusão ... 62

Figura 25. Alta Utilização ... 63

Figura 26. Quantidade de Vidas ... 64

Figura 27. Gráfico por Faixa Etária ... 65

(7)

vi

LISTA DE TABELAS

Tabela 1. Comparativo entre Data Warehouse e Data Mart ... 15

Tabela 2. Vantagens e desvantagens da abordagem top-down. ... 18

Tabela 3. Vantagens e desvantagens da abordagem buttom-up. ... 20

Tabela 4. Dados Operacionais comparados com Dados de um DW. ... 22

Tabela 5. Descrição da tabela FATO_CLIENTES ... 43

Tabela 6. Descrição da tabela DIM_RECEITA ... 43

Tabela 7. Descrição da tabela DIM_UTILIZACAO ... 43

Tabela 8. Descrição da tabela DIM_PROCEDIMENTO ... 44

Tabela 9. Descrição da tabela DIM_CLIENTES ... 44

Tabela 10. Descrição da tabela DIM_MEDICOS ... 44

(8)

vii

RESUMO

PAZETO, Tiago Zaccaron. Um modelo de Data Mart para área de Marketing de uma Operadora de Planos de Saúde. São José, 2010. nº 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Centro de Ciências Tecnológicas da Terra e do Mar, Universidade do Vale do Itajaí, São José, 2010.

A competitividade nas empresas está cada vez mais acirrada, para que uma empresa possa tomar decisões cada vez mais rápidas e corretas, ela precisa obter informações de maneira rápida e clara, caso contrário, uma decisão errada poderá afetar drasticamente seus resultados. Este trabalho objetiva a criação de um modelo de Data Mart (DM) para agilizar a busca por informações para área de Marketing de uma Operadora de Planos de Saúde, para análise e fornecimento de informações para apoio a tomada de decisões de maneira mais rápida, clara e segura, que a utilizada atualmente, sem que seja necessária a busca intensa por planilhas eletrônicas, relatórios solicitados a outras áreas da empresa e o envolvimento da área de Tecnologia da Informação (TI) a cada nova demanda, pois estes relatórios precisam ser validados, sem contar com o tempo para criá-los. Após a conclusão deste trabalho, a área de Marketing não precisa mais aguardar de dois a trinta dias para receber a solicitação de um relatório, pois com as visões desenvolvidas, a mesma pode extrair informações em alguns minutos, ou seja, quase que instantaneamente. Além do ganho no tempo, também consegue extrair informações não pensadas anteriormente, possibilitando novas ações no departamento.

(9)

viii

ABSTRACT

The competitiveness in business are becoming more intense, that a company can make decisions faster and more accurate, it needs to obtain information quickly and clearly, otherwise, a wrong decision can dramatically affect your results. This work aims to create a model of Data Mart (DM) to speed the search for information on the marketing area of a Provider of Health Insurance for review and providing information to support decision-making faster, clear and safe, that we currently use, without requiring the massive search for spreadsheets, reports requested in other areas of the company and the involvement of the area of Information Technology (IT) to each new demand, as these reports need to be validated without have the time to create them. Upon completion of this work, the marketing area no longer need to wait two to thirty days to receive the request for a report as to the visions developed, it can extract information in a few minutes, or almost instantly. Besides the gain in time, also can extract information not previously thought, opening up new shares in the department.

(10)

1

INTRODUÇÃO

O uso da área de Marketing para gerar um diferencial competitivo tem sido uma crescente entre tantas outras áreas do mercado, pois ela faz a divulgação da marca, promover os produtos que serão comercializados em sua área de abrangência, assim como a parte de comunição em jornais, revistas, etc., entre outras funções que fazem parte do Marketing.

Hoje já se pode perceber que existem vários tipos/aplicações de Marketing, do tradicional ao dirigido. Por exemplo, a Coca-Cola é direcionada a todas as pessoas, porém um plano de saúde para viagens internacionais é direcionado a um grupo específico de pessoas. No entanto, para fazer o Marketing de um produto ou empresa qualquer, normalmente envolve obter informações que podem ser encontradas nas mais variadas fontes de dados (repositórios) que vão desde o tradicional (anotações em papel), aos utilizados por softwares (Banco de Dados - BD).

A área de Marketing da Operadora de Planos de Saúde em questão toma suas decisões com base em planilhas eletrônicas, documentos de texto e relatórios solicitados a outros departamentos da empresa. No entanto, a todo o momento surgem novas solicitações e/ou visões desses relatórios, que demandam novos dados ou de dados já coletados, porém em formato (apresentação) diferente. Existem situações em que os dados estão espalhados ou até mesmo invisíveis, ou talvez num grau de complexidade que pode inviabilizar o seu uso, caso não haja uma ferramenta que auxilie na sua extração e/ou compreensão. Por exemplo, se disser “o tempo está bom”, no contexto de quem vende guarda chuva ou no contexto de que vende guarda sol, quais dados seriam necessários para avaliar o resultado de vendas de cada cenário.

O atual modelo usado na área de Marketing pode ser satisfatório, pois mesmo sem utilizar um sistema de informação para obter informações, como os já citados anteriormente, a área consegue utilizar dados resgatados de planilhas, de textos digitais ou de relatórios solicitados a outras áreas. Como se percebe, o uso de tecnologia da informação nesta área pode agregar um valor ainda maior ao trabalho. É sabido que o tempo, a facilidade de acesso, de entendimento, entre outros pontos, dão um maior dinamismo, uma maior facilidade/flexibilidade de uso das informações para a área interessada.

Este trabalho se propôs a desenvolver um Data Mart (DM) para tirar proveito da tecnologia da informação, tendo como vantagens a diminuição do tempo, aumento da segurança e a agilidade para obter informações para tomada das decisões, envolvendo o menor número de pessoas possível.

(11)

2

Com o uso da nova proposta as informações estariam mapeadas e preparadas, à disposição do usuário para selecionar os dados desejados da maneira que necessitarem (LAUDON & LAUDON, 2007).

Conforme Montefusco et al (2008), o DM serve como fonte de dados para as aplicações utilizadas pelos usuários (Front End), assegurando consistência, integração e precisão dos dados. O DM é uma abordagem específica do Data Warehouse (DW), focada em uma área ou departamento.

É possível não só obter informações claras e rápidas, mas também associá-las a outros eventos, tais como: faixa etária dos planos de saúde por sexo, ou seja, saber de qual sexo em uma determinada faixa etária tem-se mais clientes ou utilizou-se mais determinado plano; também se pode obter informações para contato com o cliente, usando o seu perfil, por exemplo: telefone, e-mail, endereço, etc.; também é possível saber qual é o cliente em um determinado período que utiliza o plano com uma frequência maior, tudo para que seja possível agir com uma ação preventiva, ou seja, sempre que possível agir de forma proativa para que este cliente diminua a utilização do seu plano.

Seguindo os exemplos descritos anteriormente, a área de Marketing pode propor uma campanha de conscientização para evitar o mal uso de determinado produto, orientando o uso correto do mesmo. Esse trabalho está apoiado nos mesmos dados que o gestor utiliza para validá-lo, porém Marketing e gestor vêem os mesmos de forma e formatos diferentes.

1.1

PROBLEMATIZAÇÃO

Neste capítulo serão descritas informações referentes ao trabalho, tais como: o problema em questão, objetivos, metodologia e a estrutura do trabalho.

Cabe aqui, levantar a diferenciação básica das palavras Dados e Informações, pois em várias partes do texto elas estarão contidas:

- Dados: significa os registros nas bases de dados, ou seja, o nome de uma praia ou localização.

- Informações: é o agrupamento de vários dados, ou seja, em Florianópolis existem 42 praias.

(12)

3

1.1.1

Formulação do Problema

Hoje a área de Marketing da Operadora de Planos de Saúde consome muito tempo na busca dos dados necessários para obter informações para a tomada de decisão.Esses dados estão contidos em planilhas, documento textual, em outros tipos de arquivo ou em outras áreas, envolvendo a solicitação de relatórios que podem demorar dias para ficarem prontos e ainda precisam ser validados, pois são atos isolados e muitas vezes não repetitivos.

Os dados utilizados atualmente não foram pensados/modelados neste sentido, mas sim com enfoque Administrativo e Financeiro. Apesar disso, a empresa tem utilizado esses dados para diversas áreas, desta forma percebeu-se a deficiência para a área de Marketing executar o seu devido trabalho, sem ficar na dependência de tarefas que não são da sua competência.

Esta nova maneira de pensar e agir da empresa tem exigido não só da área de Marketing, mas também, da área da Equipe de Informações Estratégicas (EQIE), por causa das solicitações de vários relatórios e consequentemente alocação de recursos para atender a essa demanda, gerando um retrabalho constante, onde sempre há a necessidade de validação.

1.1.2

Solução Proposta

Desenvolver um DM na área de Marketing que auxilie na obtenção de informações para tomada das decisões. Com o uso da nova proposta, as informações estão à disposição dos gestores para selecionar os dados desejados da maneira que necessitarem.

1.2

OBJETIVOS

Nesta seção será descrito o objetivo principal do trabalho, assim como os objetivos específicos.

1.2.1

Objetivo Geral

O objetivo do trabalho é desenvolver um modelo de Data Mart para a área de Marketing de uma Operadora de Planos de Saúde que permita obter informações de maneira mais rápida e prática que a utilizada atualmente, otimizando a tomada de decisões da área de Marketing de forma a melhorar a visualização das informações para desenvolver novas ações na empresa.

(13)

4

1.2.2

Objetivos Específicos

Os objetivos específicos desta pesquisa são:

• Levantar/ Identificar as necessidades da área de negócio; • Projetar as estruturas do Data Mart;

• Projetar o modelo ETL (Extract, Transform and Load); e • Testar e validar a utilização do Data Mart.

1.3

METODOLOGIA

Este trabalho foi desenvolvido em seis etapas, que são: estudo, modelagem, desenvolvimento, teste, validação e documentação. A seguir são descritas cada etapa:

- Estudo: para desenvolver esta fase, foi efetuado uma fundamentação teórica (pesquisa), dividida em duas subfases. A primeira subfase foi respaldada em livros, artigos, TCC’s, na internet, nos sites de busca, ou seja, foram estudados os conceitos de DM, DW, OLAP (On-line Analytical

Processing), entre outros. Na segunda subfase foi estudada através de entrevistas a situação atual da

área de Marketing da empresa em questão, bem como as suas necessidades.

- Modelagem: nesta etapa, a partir do que foi estudado, surgiu a proposta de uma modelagem baseada no modelo Estrela para ser utilizada no desenvolvimento do DM, para suprir as necessidades da área de Marketing/Empresa.

- Desenvolvimento: para desenvolver esta fase foi analisado a ferramenta QlikView, onde esta foi utilizada como ferramenta de Front-End para facilitar o acesso do gestor ao modelo proposto na fase de modelagem e que nesta fase foi implementado.

- Testes: nesta etapa foi testado o modelo DM desenvolvido, para verificar se existem desconformidades e ou erros, em não existindo divergências, foi desenvolvido uma massa de testes a ser aplicada no modelo, após a sua aprovação pelo desenvolvedor, será solicitada a avaliação do gestor (usar o modelo), passando em ambos os testes, pode-se homologar junto ao usuário final.

- Validação: nesta etapa foram utilizados os requisitos levantados junto ao gestor, para validar se as necessidades dos usuários finais foram atingidas.

(14)

5

- Documentação: durante todo o processo de desenvolvimento foram feitas anotações, para registrar como o trabalho foi desenvolvido, seja dos conceitos estudados ou da parte prática. Nesta fase, os dados levantados nos estudos, na empresa e na visão do desenvolvedor, foram registrados e transcritos segundo o modelo de TCC fornecido pela Universidade do Vale do Itajaí (UNIVALI). Conforme já citado, esta etapa foi composta por duas fases, TCC I e do TCC II, cumprindo com os prazos pré-estabelecidos.

1.4

ESTRUTURA DO TRABALHO

Este documento está estruturado em quatro capítulos. O Capítulo 1, Introdução, apresentou detalhes gerais referentes ao trabalho de pesquisa. No Capítulo 2, Fundamentação Teórica, apresentará conceitos da Empresa, Marketing, DW, DM, On-line Analytical Processing (OLAP),

Extract, Transform and Load (ETL) e QlikView. O Capítulo 3, Desenvolvimento, apresentará a

forma de condução do trabalho, como foi desenvolvido e os resultados apresentados com as visões. O capítulo 4, Conclusão, apresentará as conclusões do acadêmico com base nos resultados obtidos.

(15)

2

FUNDAMENTAÇÃO TEÓRICA

Este capítulo apresentará informações da empresa e os conceitos utilizados neste trabalho de pesquisa tais como: Marketing, DW, DM, On-line Analytical Processing (OLAP), Extract,

Transform and Load (ETL) e a ferramenta QlikView.

2.1

EMPRESA

A Operadora de Planos de Saúde em questão é uma empresa especializada em prestação de serviços na área medico hospitalar, em sua maioria terceirizados. Sua abrangência é de mais de 20 municípios, abrangendo assim a capital do estado e suas proximidades, possui o seu próprio centro de atendimento especializado e de emergência e já analisa a viabilidade para um hospital. É uma empresa de grande porte, que possui dezenas milhares de clientes em sua carteira e para atendê-los com qualidade, trabalha com mais de mil prestadores (hospitais, clínicas, laboratórios, etc.) em sua área de atuação. Os planos de saúde são os seus principais produtos, comercializados por seus funcionários buscando suprir as necessidades de seus clientes. Para conhecer informações adicionais sobre a empresa, ir para a Seção 3.1.

2.2

MARKETING

O foco deste trabalho é a área de Marketing. Para entender o cliente em foco, será descrito o que é o Marketing. Assim será possível visualizar as respostas para as necessidades da área e suas dificuldades.

Kotler (1993 apud BECKER, 2005, p.8), escreve: “Marketing é tão básico que não pode ser considerado como uma função isolada. É o negócio inteiro, cujo resultado final depende do ponto de vista do cliente”. Desta forma, é possível entender que o Marketing não caminha sozinho dentro das empresas, ele trabalha de forma paralela às outras áreas.

Segundo Serrano (2007), “Marketing é função única da empresa moderna, e que tem por objetivo conquistar e preservar clientes”. Ainda diz que, “Marketing é toda atividade dirigida para a satisfação das necessidades e desejos dos clientes”, sendo que estes são satisfeitos pela compra de produtos ou serviços. Assim, conhecendo e estudando estas motivações ao consumo, as empresas procuram produzir bens e serviços que atendam ao cliente da melhor forma, ou mostrar produtos que satisfazem uma determinada necessidade dele. Entende-se que reconhecer uma necessidade é

(16)

8

uma coisa, mostrar que se tem a solução para ela, é outra. O Marketing se propõe a ser o elo entre estes dois fatos, que a princípio parece simples, mas nem sempre o é.

Seguindo a mesma linha de pensamento, Cobra (2001) define Marketing como uma construção de relacionamentos, pois o sucesso das organizações está ligado diretamente na relação entre cliente e empresa, onde o lucro decorre naturalmente desse relacionamento de confiança.

Conforme Palmer (2006), “Marketing é o processo gerencial que identifica, antecipa e atende, de modo eficiente e rentável, as exigências do cliente”. Complementa dizendo que isso acontece, pelo fato de que são os clientes que pagam pelo serviço ou mercadoria que uma empresa produz.

De acordo com Almeida (2010), Marketing é a área do conhecimento que engloba todas as atividades referentes às relações de troca. “É tão somente entender a necessidade e os anseios dos consumidores e fornecer produtos (bens ou serviços) compatíveis com tais necessidades e anseios”.

Com base nos conceitos dos autores citados, o Marketing é algo que não pode ser feito de forma isolada, pois é necessário entender o negócio por inteiro, da necessidade do cliente a solução ou vice e versa. O cliente é visto como o centro das atenções numa organização, onde esta irá satisfazê-lo da melhor maneira possível com bens e serviços que se adéquam a sua situação financeira, de modo a suprir suas necessidades.

Palmer (2006) diz que o composto de Marketing é uma estrutura conceitual que destaca as principais decisões que gerentes e executivos devem tomar para atender as necessidades dos clientes. “Essas ferramentas podem ser utilizadas para desenvolver tanto estratégias de longo prazo como programas táticos de curto prazo”.

Segundo Kotler (1998), “Sistema de Apoio à Decisão de Marketing é um conjunto coordenado de dados, sistemas e ferramentas”, “pelos quais uma organização reúne e interpreta informações relevantes da empresa e do ambiente, transformando-as em base para a tomada de decisão do Marketing”. O autor dá ênfase aos sistemas que organizam informações para tomada de decisão, isto reflete a necessidade da área de Marketing em questão, que hoje não possui nenhum sistema para auxiliar a busca por informações.

Como descrito por Palmer (2006) e Kotler (1998), as ferramentas de apoio à decisão ajudam os gestores das empresas na tomada de decisões, trazendo agilidade, segurança e rapidez para que

(17)

9

não haja perda de tempo em um ambiente operacional. Para que se tenha uma visão do problema é necessário conhecer o cliente.

Para saber detalhes sobre a área de Marketing dentro da Operadora de Saúde em questão, ir para a Seção 3.1.1. Como já citado neste trabalho, o Marketing, além de divulgar a empresa, auxilia também a trazer novos clientes, chegando a um ponto em que para gerenciar essa gama de clientes necessária a utilização de uma ferramenta que auxilie na tomada de decisão, para isto, serão detalhados a seguir, alguns pontos para se construir esta ferramenta.

2.3

BUSINESS INTELLIGENCE (BI)

Sabe-se que o foco do trabalho é um DM para área de Marketing de uma Operadora de Saúde, no entanto, por trabalhar com o Qlikview que é uma ferramenta de BI, esta seção servirá para entender um pouco como funciona a estrutura do conceito de Business Intelligence.

BI pode ser entendido como a evolução de Sistemas de Apoio a Decisão (SAD), ou seja, sistema esse que gera relatórios de maneira não rotineira, com ênfase a flexibilidade e a resposta rápida, fazendo uso de tecnologias e metodologias apoiando assim a tomada de decisão (LAUDON & LAUDON, 2004).

O conceito de BI pode ser entendido como a utilização de variadas fontes de informação, auxiliando os gestores a definir estratégias de competitividade nos negócios da empresa (BARBIERI, 2001, apud RADUENZ, 2006).

Fortulan e Gonçalves Filho (2005, p.59), afirmam que as vantagens do uso de sistemas de BI quando comparados com outros sistemas tradicionais, “incluem facilidades de uso, acesso universal às diversas plataformas, possibilidade de configuração para diversos níveis de usuários e capacidade de trabalho com gráficos, sons e vídeos além de textos e números.” As vantagens de trabalhar com gráficos, textos e números, são algumas das propostas desse trabalho.

Para entender como o BI traz tantas vantagens ao tomador de decisão, vale explicar como é estruturado, para assim compreender por que este conceito ganha cada vez mais espaço nas empresas.

O BI utiliza estruturas de armazenamento de dados como: DW e DM e também de tratamento desses dados como: OLAP e Data Mining. Tem como objetivo definir regras e técnicas

(18)

10

para transformar os dados em informações, atendendo as necessidades dos tomadores de decisões (MORALES, 2010).

Figura 1. Arquitetura da tecnologia de BI Fonte: Zero83 (2009).

A Figura 1 mostra a estrutura completa de uma ferramenta de Business Intelligence, onde se percebe o processo desde os sistemas utilizados pelos usuários até chegar à ferramenta que dará facilidade ao gestor. Assim, como onde ficam determinados conceitos na estrutura, como: DW, DM, ETL e OLAP, conceitos este que serão apresentados nas próximas seções. Isto demonstra que futuramente o trabalho proposto poderá se tornar uma ferramenta de BI.

2.4

DATA WAREHOUSE (DW)

Esta seção irá apresentar o papel do DW para obter um banco de dados agregando valor aos sistemas de informação.

Conforme Laudon e Laudon (2004, p.240), “DW é um banco de dados que armazena dados correntes e históricos de potencial interesse dos gerentes de toda a empresa”. Os dados podem ser originados de sistemas operacionais centrais, sistemas legado, aplicativos de Database Management

(19)

11

System (DBMS) relacional e de fontes externas, incluindo sites da internet. Eles são copiados para o

DW com a frequência desejada, onde são padronizados em um modelo comum e consolidados para que possam ser usados por toda a empresa para análise gerencial e tomada de decisões.

Inmon e Hackathorn (1997, p.14) dizem que os dados brutos que entram no DW são oriundos do ambiente operacional não integrado e define DW como “uma coleção de dados orientados a assuntos, integrados, variáveis com o tempo, não voláteis, para suporte ao processo gerencial de tomada de decisão”. Os autores complementam alguns detalhes a seguir:

Orientado por assunto: uma das características mais notáveis do DW é a sua organização em torno dos assuntos da corporação, fazendo com que o projeto seja “orientado a dados”, como por exemplo: clientes, vendedores, produtos e atividades, conforme mostra a Figura 2 (INMON & HACKTHORN, 1997).

Figura 2. Data Warehouse orientado a assunto Fonte: Machado (2000).

Integração: esta é a característica mais importante do DW, pois é ela quem completa os dados que podem aparecer de diversas maneiras em diferentes sistemas ou até mesmo em um único sistema. Por exemplo, o campo sexo em um sistema pode ser visto como “m” ou “f”, em outro sistema como “0” ou “1”, podendo aparecer ainda como “masculino” ou “feminino”. Essas variações podem ser notadas em outros campos, como: atributos de medidas (cm, m², jardas, etc.), formato das datas (ddmmyyyy, mmyy, etc.), entre outros, conforme mostra a Figura 3 (INMON & HACKTHORN, 1997).

(20)

12 Figura 3. Integração dos dados Fonte: Inmon & Hackathorn (1997).

Variação no tempo: o DW pode variar no tempo de diversas maneiras. A mais simples é quando os dados representam informações em um amplo período de tempo, cinco a dez anos. Porém, como característica de um bom projeto, as aplicações operacionais possuem um horizonte de tempo pequeno. A segunda maneira é utilizar implícita ou explicitamente, uma data como dia, mês e ano. A terceira maneira é utilizar uma longa série de fotografias, assumindo que estas estejam corretas, não será possível alterá-las, caso contrário, poderá ser corrigida com nova fotografia. A Figura 4 mostra a variância no tempo dos dados do DW (INMON & HACKTHORN, 1997).

(21)

13 Figura 4. Variação no tempo

Fonte: Inmon & Hackathorn (1997).

Não volatilidade: esta característica se dá pelo fato de que no DW poderão ocorrer apenas duas operações: a carga inicial e o acesso aos dados, não possibilitando inserções, deleções e alterações diretamente no DW, como acontece no banco de dados do ambiente operacional que são atualizados registro a registro. A Figura 5 mostra as alterações feitas no ambiente operacional, enquanto no DW apresenta apenas duas operações (INMON & HACKTHORN, 1997).

Figura 5. Dados dinâmicos x dados estáticos Fonte: Inmon & Hackathorn (1997).

Conforme Accorsi (2008), a função principal do DW “é o armazenamento de informações de um banco de dados referente a uma ou mais atividades de uma empresa de forma consolidada”. Podendo também ser visto “como um agrupamento inteligente de dados de uma mesma fonte, como: origem, formato, nomes, tipo de negócio, regras, conexões entre outros”, tendo objetivo de trabalho com uma vasta quantidade de dados, principalmente históricos.

(22)

14

Dias (2009, p.1) diz que “DW é um repositório central de dados, históricos e atuais, que podem representar algum valor para os tomadores de decisão dentro de uma organização”. Agrupando informações de várias fontes de dados da empresa, tornando possível a análise dos gestores para tomada de decisões.

Segundo Back (2010),

DW ou armazém de dados é o nome que se dá a uma grande base de dados informacional que tem por objetivo armazenar em um único repositório os dados que foram consolidados, limpos e uniformizados, armazenados em estruturas lógicas dimensionais, possibilitando o seu processamento por ferramentas especiais.

O autor anterior ainda define DW como uma base de dados em vários níveis de granularidade, armazenando esses dados em vários graus de relacionamentos, onde os mesmos deverão estar prontos para serem utilizados nas mais diversas formas de consultas.

Anzanello (2002) diz que “O DW é utilizado para armazenar informações e o OLAP

(On-Line Analytic Processing) para recuperá-las”, os dois de forma eficiente, onde um depende do

outro, resumindo, o OLAP serve para extrair e alavancar totalmente as informações no DW contidas.

Assim como o DW, o DM também serve como um repositório de dados e também utilizará uma ferramenta OLAP para recuperá-los. Porém, o DM tem um tamanho menor, de modo a tratar apenas um departamento, enquanto o DW tratará da empresa por completo.

2.5

DATA MART (DM)

Os DMs têm o mesmo propósito do DW, no entanto, abrange uma área menor dentro da empresa, atingindo apenas um determinado departamento da empresa, enquanto o DW pode atingir a empresa por completo.

Dias (2009) diz que DM é um subconjunto do DW focado em um assunto específico, utiliza um modelo de dados multidimensional, também conhecido como cubo. Já Farina, Meneguzzi e Pires (1999) complementam dizendo que DM é uma forma simplificada de um DW, se concentrando em um único assunto ou área funcional, como vendas, finanças ou Marketing. Dado seu direcionamento a um assunto único, os DM’s geralmente utilizam dados de poucas fontes, podendo essas serem sistemas operacionais internos.

(23)

15

Segundo Dias (2009), DM é uma estrutura de dados para servir as necessidades de análise de um grupo de pessoas, tais como departamento de finanças, recursos humanos, etc. Assim como outros departamentos existentes nas empresas, como o Marketing.

Conforme Miyazaki (2009), o objetivo do DM é entregar aos gestores as informações na forma mais precisa e utilizável possível. Os DM’s são atualizados frequentemente e destinados a gerenciar uma grande quantidade de dados.

De modo geral, pode-se diferenciar o DW do DM da seguinte forma: o DW é uma estrutura corporativa e o DM uma estrutura departamental, conforme mostra a Figura 6 (VIDOTTI, 2001).

Figura 6. As estruturas de dados e sua utilização dentro da corporação Fonte: Vidotti (2001).

Além da diferença mostrada pela Figura 6, podem ocorrer outras diferenças entre DW e DM referente às suas características particulares, conforme mostra a Tabela 1.

Tabela 1. Comparativo entre Data Warehouse e Data Mart

DATA WAREHOUSE DATA MART

Corporativo Departamental

Altamente granular Sumarizado e agregado

Dados históricos Dados Recentes

Grandes Volumes de Dados Volumes de dados limitados

Versatilidade Especificidade

(24)

16

Para Kimball (2007, apud BACK, 2010), o melhor para as empresas é construir vários DMs para depois integrá-los, chegando ao DW, ou seja, “deve ser dividido para depois ser conquistado”. Já para Inmon (2007, apud BACK, 2010), primeiramente deve-se modelar o DW para toda a empresa e depois dividir e desenvolver os DMs para os departamentos, ou seja, “conquistar para dividir”. Conforme outros autores, é comum que seja implementado o modelo citado por Kimball, visto as vantagens que serão apresentadas na próxima seção.

Os dois modelos citados por Back (2010), dividir para conquistar e conquistar para dividir, são conhecidos como: Bottom-up e Top-down, respectivamente, existindo ainda um outro modelo que seria a união dos dois já comentados, esses modelos serão detalhados a seguir.

2.5.1

Modelo Top-Down

O processo inicia-se na identificação, extração, transformação e carga das bases de dados operacionais para o DW. Após a carga, irão DW servirá os DMs departamentais com os dados. Um projeto desta dimensão, normalmente tem um custo elevado e demanda bastante tempo para implementação, no entanto, ao fim do levantamento inicial, fornecerá uma base de dados integrada e corporativa (MENOLLI, 2004).

A Figura 7 mostra como acontece o processo de extração dos dados iniciando pelo OLTP (On-Line Transaction Processing) aplicações às operações do dia-a-dia da organização, passa pela ETL (Extract, Transform and Load), processo que extraí, transforma e carrega os dados, passando pelo DW, até chegar aos Data Marts. OLTP e ETL, que serão descritos com mais detalhes nas seções seguintes.

(25)

17 Figura 7. Modelo Top-down

Fonte: DataPrix (2010).

Para Sobral e Souza (2006), DM é um termo “usado para uma fração de um DW, de escopo de dados restrito, elaborado para atender especificamente a uma unidade estratégica de negócio”, pode-se dizer também que é um subconjunto lógico de um DW completo. A Tabela 2 apresenta as vantagens e desvantagens de utilizar a abordagem top-down.

(26)

18

Tabela 2. Vantagens e desvantagens da abordagem top-down.

Fonte: Machado (2004).

Menolli (2004, p.45) diz que esta proposta “se baseia em um DW central, onde todas as decisões sobre as fontes de dados, segurança, estrutura de dados e padrões de dados devem ser analisadas antes de iniciar o desenvolvimento, resultando em um grande trabalho inicial”. A próxima seção apresenta o modelo Bottom-up, onde primeiramente cria-se vários DMs para depois uni-los e criar o DW, diferenciando-se do modelo Top-Down.

Vantagens Desvantagens

Herança de arquitetura – Todos os DM originados a partir de um DW utilizam a arquitetura e os dados desse DW, permitindo uma fácil manutenção.

Implementação muito longa – Os DW são, normalmente, desenvolvidos de modo iterativo por área de assunto, como, por exemplo, vendas, finanças e recursos humanos. Mesmo assim, são necessários, em média, 15 ou mais meses para que a primeira área de assunto entre em produção, dificultando a garantia de apoio político e orçamentário.

Visão de empreendimento – O DW concentra todos os negócios da empresa, sendo possível, a partir dele, extrair níveis menores de informações.

Alta taxa de risco – Não existem garantias para o investimento neste tipo de ambiente.

Repositório de metadados centralizado e simples – O DW provê um repositório de metadados central para o sistema. Essa centralização permite manutenções mais simples do que aquelas realizadas em múltiplos repositórios.

Heranças de cruzamentos funcionais – É necessária uma equipe de desenvolvedores e usuários finais altamente capacitados, para avaliar as informações e consultas que garantam à empresa habilidade para sobreviver e prosperar na arena de mudanças de competições políticas, geográficas e organizacionais. Controle e centralização de regras – A

arquitetura top-down garante a existência de um único conjunto de aplicações para extração, limpeza e integração dos dados, além de processos centralizados de manutenção e monitoração.

Expectativas relacionadas ao ambiente – A demora do projeto e a falta de retorno podem induzir expectativas nos usuários.

(27)

19

2.5.2

Modelo Bottom-up

Este modelo é baseado em DMs independentes, os quais irão compor um DW incremental. O desenvolvimento e o retorno são rápidos, porém existe a dificuldade de integrar os metadados, além dos processos de extração e transformação (MENOLLI, 2004). Os metadados são informações com um conjunto de dados, para facilitar o entendimento, são "dados sobre os dados" do DW.

A Figura 8 mostra a extração dos dados iniciando pelas aplicações e fontes de dados até chegar ao Data Warehouse.

Figura 8. Modelo Bottom-up. Fonte: DataPrix (2010).

Machado (2004, apud RADUENZ, 2006, p.75) diz que as novas abordagens baseiam-se neste conceito, “pois elas procuram otimizar o processo de desenvolvimento, garantir a consistência dos metadados, facilitar a integração do ambiente e apresentar resultados em tempo mais reduzido”. A Tabela 3 apresenta as vantagens e desvantagens de utilizar a abordagem bottom-up.

(28)

20

Tabela 3. Vantagens e desvantagens da abordagem buttom-up.

Vantagens Desvantagens

Implementação rápida – A construção dos DM é altamente direcionada, permitindo um rápido desenvolvimento. Normalmente, um DM pode ser colocado em produção em um período de seis a nove meses.

Perigo de legamarts – Um dos maiores perigos no DW é a criação de DMs independentes. O advento de ferramentas de “drag-and-drop” facilitou o desenvolvimento de soluções individuais, de acordo com as necessidades da empresa. Estas soluções podem não considerar a arquitetura de forma global. Desta forma, os DMs independentes transformam-se em DMs legados, ou legamarts. Os legamarts dificultam, quando não inviabilizam futuras integrações. Eles são parte do problema e não da solução. Retorno rápido – A arquitetura baseada em DM

com incremento demonstra rapidamente seu valor, permitindo uma base para investimentos adicionais, com um nível mais elevado de confiança.

Desafio de possuir a visão de empreendimento – Durante a construção dos DMs incrementais, é necessário que se mantenha um rígido controle do negócio como um todo. Este controle requer um maior trabalho ao extrair e combinar as fontes individuais do que utilizar um DW. Manutenção do enfoque da equipe – Um dos

maiores desafios do desenvolvimento de um DW é a manutenção do mesmo enfoque por toda a equipe. A elaboração de DMs incrementais permite que os principais negócios sejam enfocados inicialmente, sem que haja gastos no desenvolvimento de áreas que não são essenciais ao problema.

Administrar e coordenar múltiplas equipes e iniciativas – Normalmente, esse tipo de arquitetura emprega o desenvolvimento de DM em paralelo. Isto pode conduzir a uma rígida administração, tentando coordenar os esforços e recursos das múltiplas equipes, especialmente nas áreas de regas e semântica empresariais. Herança incremental – A estratégia de DMs

incrementais obriga a entrega de recursos de informação, passo a passo. Isto permite à equipe crescer e aprender, reduzindo os riscos. A avaliação de ferramentas, tecnologias, consultores e vendedores só deve ser realizada

A maldição de sucesso – A arquitetura com DMs incrementais carrega a “maldição de sucesso”. Nestes casos, os usuários finais do DM encontram-se felizes, querendo mais informação para seus DMs. Ao mesmo tempo, outros usuários de outros DMs aguardam o

(29)

21 uma vez, a não ser que existam restrições que impeçam o reaproveitamento.

incremento de seus DMs. Isto conduz a equipe de DMs a vencer desafios políticos, de recurso e de administração.

Fonte: Machado (2004).

Com a união dos dois modelos apresentados anteriormente, pode-se dizer que efetuando o planejamento do DW como uma visão macro e após isso, dividi-lo para criar os DMs que devem ser planejados e integrados, construindo assim um DW integrado e incremental, ou seja, a implementação do DW é realizada top-down e no desenvolvimento dos DMs usa-se Bottom-up (MENOLLI, 2004);(RADUENZ, 2006).

Sendo assim definidos os modelos de DM, percebe-se que a utilização do modelo Bottom-up é o mais aconselhável, visto que as vantagens referentes a tempo e custo de implantação são mais baixas, satisfazendo os gestores. Independente do modelo que se escolha trabalhar, é necessário definir o nível de granularidade que o DM terá - isto será visto em detalhes a seguir.

2.5.3

Granularidade

O volume dos dados armazenados é afetado pelo nível de granularidade, isso implica no tempo de resposta às consultas feitas pelos usuários. Quanto menor for o nível de granularidade, maior será a quantidade de dados apresentados ao usuário, assim como maior será a quantidade de dados armazenados. Ao contrário disto, quando maior for o nível de granularidade, menor será a quantidade de dados apresentados aos usuários, assim como menor será a quantidade de dados armazenados (CRAMER, 2006).

Após os modelos serem definidos e as regras de negócio levantadas, é possível se pensar na modelagem a ser utilizada no processamento analítico das informações, denominado OLAP, o qual será detalhado na próxima seção.

(30)

22

2.5.4

OLAP (On-Line Analytical Processing)

Com base nas pesquisas efetuadas, pode-se dizer que OLAP serve como ferramenta de auxílio aos gestores para analisar as informações apresentadas, de forma a agilizar a tomada de decisões.

Para Pinheiro (1999, apud MEIRA & CAZARINI, 2003), OLAP dá a ideia de que “os gerentes possam manipular modelos de dados através de suas dimensões, de forma a atender as mudanças que estão ocorrendo em seu segmento de negócio”. Dessa forma, os gestores poderão extrair relatórios mais flexíveis.

Segundo Raduenz (2006, p.65), “OLAP é uma das ferramentas de consulta (front-end) que servem para apresentar respostas aos usuários do DW”. Esta tecnologia foi criada devido à necessidade de análises dos dados de forma fácil e flexível, com várias visões do negócio em diversos níveis de detalhes, comparações e tendências.

Sistemas OLTP (On-Line Transaction Processing) são quando um usuário de conta corrente efetua saques ou depósitos, pois acessam dados de uma única conta, enquanto que a aplicação OLAP, tem por finalidade agrupar muitos dados para que um gerente de contas bancária possa tomar suas decisões (ANZANELLO, 2002). A Tabela 4 se refere à diferença entre os dados operacionais e dados analíticos, quanto aos requisitos funcionais e desempenho, ou seja, sistemas OLTP e OLAP, respectivamente (VIDOTTI, 2001).

Tabela 4. Dados Operacionais comparados com Dados de um DW.

Dados Operacionais Dados em um Data Warehouse

Baseados em aplicações Baseados em assuntos ou negócios

Detalhados Resumidos ou refinados

Exatos em relação do momento de acesso Representam valores de momentos já decorridos ou instantâneos

Acessados uma unidade por vez Acessados um conjunto por vez

Voltados para transações Voltados para análise

Alta disponibilidade Disponibilidade atenuada

Não contemplam a redundância A redundância não pode ser ignorada Estrutura fixa: conteúdos variáveis Estrutura flexível

Pequena quantidade de dados usada em um processo

Grande quantidade de dados usada em um processo Atendem às necessidades cotidianas Atendem às necessidades gerenciais

Alta probabilidade de acesso Baixa, ou modesta probabilidade de acesso Fonte: Adaptado de Centenaro (2003).

(31)

23

Conforme Inmon(1997, apud Raduenz, 2006), OLAP é uma “categoria da tecnologia de software que permite que, analistas, gerentes e executivos obtenham, de maneira rápida, consistente e interativa, o acesso a uma variedade de visualizações possíveis da informação”. Assim pode-se compreender como as estruturas multidimensionais auxiliam no dia-a-dia dos gestores. Os detalhes dessa estrutura serão visto na próxima seção.

2.5.5

Cubo

Para entender melhor como funcionam as estruturas multidimensionais, pode-se comparar a forma que as planilhas usam nas pastas de trabalho ou como os bancos de dados usam tabelas. Essas estruturas são representadas por determinado cubo que facilita o entendimento das dimensões, sendo estes compostos por medidas e N dimensões (PACHECO, 2003), conforme mostra a Figura 9.

Figura 9. Cubo

Fonte: Pacheco (2003).

Como se percebe na Figura 9, cada aresta do gráfico representa uma dimensão e cada célula do cubo representa uma visão diferente para o gestor. “A visão multidimensional de dados possibilita vê-los de diferentes pontos de vista (slice and dice), mediante a rotação (pivoting) do cubo e a navegação (drill-up/drill-down) entre os níveis de agregação”, onde estes termos serão explicados adiante. Com isso, as informações serão facilmente selecionadas com uma visão global do negócio, possibilitando cálculos e relacionamentos de variáveis de forma simples (RADUENZ, 2006).

Drill-down e Drill-up são operações utilizadas para aumentar ou diminuir a granularidade das informações. Pode-se dizer que é uma “técnica analítica específica através da qual o usuário navega entre níveis de abrangência de dados a partir do mais resumido (up) para o mais detalhado (down)” (CRAMER, 2006).

(32)

24

Slice and dice, segundo Machado (2000), “são operações para realizar navegação por meio dos dados na visualização de um cubo”. Esta operação corta uma parte do cubo mantendo a mesma perspectiva de visão dos dados, é como girar o cubo nas mãos.

Pivoting segundo Pichiliani (2006) “é definido como escolher um ângulo do cubo, por meio da seleção de duas dimensões em torno das quais o cubo agregará a(s) medida(s) dos dados”.

Ad-hoc, Segundo Oliveira (2002, apud RADUENZ, 2006), “é quando o usuário pode gerar consultas de acordo com suas necessidades, e cruzar as informações de uma forma não vista, com métodos que o levam a descoberta daquilo que ele procura”.

As maneiras de o cubo trabalhar conforme citado anteriormente, como o drill, servem para auxiliar na capacidade de manipular os dados e formas de apresentar as informações com a agilidade que a modelagem multidimensional possui.

Conforme Imhoff, Galemmo e Geiger (2003, apud CRAMER, 2006), Modelagem Multidimensional “é uma forma de modelagem de dados que acondiciona os dados de acordo com consultas e processos específicos do negócio. Os objetivos são a compreensibilidade dos usuários de negócio e o desempenho de consultas multidimensionais”. A seguir serão detalhados dois modelos multidimensionais que são base para modelagem das tabelas.

Modelo Star ou Estrela

Segundo Machado (2000), o modelo estrela ou star schema “é uma estrutura básica de um modelo de dados multidimensional”. Essa estrutura possui uma tabela central chamada Fato e um conjunto de tabelas menores denominadas Dimensões, que ficam ao redor da tabela central, conforme é apresentado na Figura 10.

Segundo Pichiliani (2006, p.3), para melhorar o desempenho das consultas, teve-se “a introdução de um novo conceito em termos de modelagem de dados, que se diferencia do modelo relacional por permitir redundância”.

(33)

25 Figura 10. Modelo Estrela

Fonte: adaptado de Cramer (2006).

O número de dados armazenados nesse modelo é muito maior que no flocos de neve, sendo este um ponto franco devido a redundância existente (CRAMER, 2006). O modelo flocos de neve é detalhado na próxima seção.

Modelo SnowFlake ou Flocos de Neve

Este modelo pode ser visto como uma extensão do modelo, no entanto, tem como objetivo principal a normalização das dimensões, (Cramer, 2006). O modelo SnowFlake é de fácil compreensão por desenvolvedores, visto que estão acostumados com sistema OLTP, que “aplica as formas normais como em um projeto relacional” (MACHADO, 2000).

Este modelo também pode ser visto como um modelo de hierarquia, já que as tabelas das Dimensões podem ter relacionamentos com outras dimensões, tornado a organização das tabelas mais complexa (PICHILIANI, 2006), conforme a Figura 11.

(34)

26 Figura 11. Modelo SnowFlake Fonte: adaptado de Cramer (2006).

Segundo Machado (2000), modelagem multidimensional é uma técnica de geração e visualização de um modelo de dados que descrevem aspectos comuns de negócios, “utilizada para sumarizar e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados”. Os três elementos básicos são Fatos, Dimensões e Medidas (variáveis).

Tabela Fato

Fato é tudo que pode ser representado por valores numéricos, sendo estes denominados de métricas ou medidas, (Machado, 2000). Estas métricas são usadas para medir o desempenho do negócio, usando as intersecções com as tabelas de dimensões que se relaciona (KIMBALL, 1998).

Anzanello (2002) diz que a tabela de fatos é uma tabela central carregada de forma normalizada, representando as transações com os valores que estão sendo analisados e as chaves estrangeiras das tabelas de dimensão.

(35)

27 Tabela Dimensão

De acordo com Machado (2000), Dimensões são os elementos que estão no contexto de um fato de um assunto de negócios. Dimensão é um nome diferente para determinar um item de dado. As dimensões para fins de análise em um DM devem ser tratadas hierarquicamente.

Pichiliani (2006), diz que agrupa os dados relacionados ao negócio. Representam possíveis formas de visualizar os dados, de modo a flexibilizar a manipulação das informações. Complementa dizendo que o Tempo (data) é uma das dimensões mais importantes, pois pode exibir em linha de tempo as ocorrências das consultas.

Para uma aplicação OLAP, existem métodos de armazenamento que estão divididos em duas correntes de tecnologia de Sistemas de Gerenciamento de Banco de Dados – SGBD (SOBRAL & SOUZA, 2006), cada uma com sua função definida, que devem ser utilizados quando melhor atender as necessidades de análise. São elas: MOLAP (Multidimensional On-Line Analytical

Processing) e ROLAP (Relational On-Line Analytical Processing), além da combinação das duas

HOLAP (Hybrid On-Line Analytical Processing) (ANZANELLO, 2002).

MOLAP: “é um conjunto de interfaces de usuário, aplicações e banco de dados, com tecnologia proprietária, que possui características eminentemente dimensionais" (SOBRAL & SOUZA, 2006). ROLAP: “os dados são armazenados no modelo relacional como também suas consultas são processadas pelo gerenciador do banco relacional” (ANZANELLO, 2002). Ou seja, a consulta é enviada e processada no mesmo servidor de banco de dados, onde se mantém o cubo (RADUENZ, 2006).

HOLAP: é a combinação entre ROLAP e MOLAP. A mistura dessas tecnologias traz a vantagem de se extrair a alta performance do MOLAP e a escalabilidade do ROLAP (ANZANELLO, 2002). Esta tecnologia apresenta tanto flexibilidade quanto desempenho (SOBRAL & SOUZA, 2006). A Figura 12 mostra onde exatamente está o OLAP na estrutura de DW e BDs operacionais.

(36)

28

Figura 12. Estrutura OLAP na visão geral da arquitetura DW Fonte: Raduenz (2006).

Para ser possível que uma ferramenta OLAP disponibilize as informações aos gestores, é necessário que seja efetuado o processo ETL (Extract, Transform and Load), que será detalhado na próxima seção.

2.5.6

ETL (Extract, Transform and Load)

Este processo é dividido em três etapas: extração, transformação e carga, sendo responsável pela integridade, qualidade e consolidação das informações extraídas de uma ou mais fontes externas até o armazenamento do DW ou DM (CRAMER, 2006). Traduzindo para o português, é comum usar a sigla ETC (Extração, Transformação e Carga) no lugar de ETL (RADUENZ, 2006).

Abreu (2008) diz que ETL é o processo mais crítico e demorado na construção de um DM, pois consiste na extração dos dados de bases irregulares, na transformação e limpeza destes dados e na carga dos dados na base do DM.

O processo de ETL de um banco de dados multidimensional é complexo o suficiente para ser considerado o processo mais demorado, isso ocorre devido aos cálculos que são realizados para “agregar os dados às dimensões e preencher as estruturas do banco” (ANZANELLO, 2002). Esta informação é confirmada por Inmon (2002, apud CRAMER, 2006), "o processo de integração e transformação de dados tipicamente consome até 80% dos recursos de desenvolvimento". A Figura 13 mostra o processo de extração dos sistemas para a base de dados do DM.

(37)

29 Figura 13. Processo ETL

Fonte: ETL-Tools.Info (2010).

Existem ferramentas ETL no mercado, tais como: DataStage da IBM, PowerCenter, DTS (Data Transformation Service), dentre várias outras, onde na maioria delas o processo pode ser agendado um horário para execução, garantindo os dados atualizados sem que haja problemas no ambiente de produção. Dentre tantas ferramentas ETL (conforme Apêndice II) para fazer a extração dos dados da base de dados, neste trabalho será utilizado a ferramenta QlikView, que servirá tanto na extração dos dados (ETL) quanto na visualização desses pelos gestores (OLAP).

2.5.7

QlikView

O QlikView é um software de BI (Business Inteligence) que utiliza uma tecnologia própria para análise de informações relacionais provindas de várias fonte de dados. Este software foi escolhido para ser utilizado como ferramenta front-end que realizará a publicação dos dados para o usuário final.

Conforme mostra no Apêndice II, ao comparar o QlikView com outras ferramentas de código proprietário, por exemplo, o SAP – Business Object, pode-se perceber que o QlikView permite um fácil manejo e rápido implementação, enquanto o SAP tem sua infraestrutura aberta, onde ambas interagem com o Microsoft Office, sabendo disso, poderia ser utilizado qualquer ferramenta para este trabalho. No entanto, o principal motivo para utilizar a ferramenta QlikView é

(38)

30

devido ao fato de possuir conhecimentos na mesma e também por esta já estar disseminada em algumas áreas da empresa, onde até o momento a área de Marketing não faz parte desse grupo.

A ferramenta possui acesso às mais variadas fontes de dados de aplicativos operacionais, tais como: Oracle, SAP, Salesforce.com; e também bases de dados: SQL Server, MySQL, Oracle e dados locais constantes em planilhas, entre outros.

A Figura 14 demonstra exemplo de gráfico e listas que podem ser gerados a partir do QlikView, podendo também criar vários tipos de gráficos, entre outros componentes que irão auxiliar o gestor na tomada de decisão.

Figura 14. Exemplo do QlikView Fonte: Elaborado pelo autor.

A Figura 14, apresentada anteriormente, mostra o QlikView agindo como ferramenta OLAP, já a Figura 15, apresenta a tela onde serão inseridos os scripts que irão extrair, transformar e carregar os dados da base de dados, dessa forma o QlikView estará agindo como ferramenta ETL.

Essa ferramenta pode integrar as ferramentas tradicionais de BI numa única arquitetura, possuindo uma plena integração com o pacote Office da Microsoft (GALICIA, 2009).

(39)

31 Figura 15. Tela QlikView – ETL

Fonte: Elaborado pelo autor.

Detalhes sobre os requisitos para instalação e os navegadores/celulares suportados pela ferramenta podem ser vistos no Apêndice I. Por este software ser uma ferramenta de BI, este conceito foi apresentado na Seção 2.3.

A seguir, serão comentados sistemas similares ao trabalho proposto, tanto com foco no Marketing, quanto em Operadoras de Planos de Saúde, os sistemas que serão descritos a seguir ajudaram os gestores de outras empresas na tomada de decisão.

2.6

SISTEMAS SIMILARES

Nesta seção são apresentados alguns sistemas similares ao que será desenvolvido, sistemas estes que estão ligados ao Marketing ou área de saúde, e que utilizam os conceitos de DM ou DW.

Meira e Cazarini (2003) escrevem sobre a aplicação de uma ferramenta OLAP/ DM para captar doadores de sangue em um Hemonúcleo. A aplicação teve como objetivo a tomada de decisão na convocação de doadores de sangue e no agendamento de coletas externas. Nesta aplicação, foram criadas duas tabelas Fato, para diferenciar os “candidatos à doação” e “doações que ocorreram”, com suas respectivas tabelas de Dimensões. Os autores concluem dizendo que o uso dessas tecnologias na área da saúde é imprescindível, pois uma grande quantidade de dados é

(40)

32

gerada de diversas fontes, que devem ser tratadas para a utilização dos profissionais da área na tomada de decisão.

A ferramenta citada anteriormente é utilizada para obter informações dos usuários que serão convocados para efetuar a retirada de sangue, pois estes serão escolhidos dentre todos os usuários do banco de dados, conforme as regras de negócio definidas.

Segundo Dallora et al (2004) uma ferramenta de DM foi desenvolvida para no centro cirúrgico do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto. Nesta ferramenta o cubo criado foi composto por especialidade, unidade federativa do pacientes, idade, ano de execução da cirurgia, entre outros dados. Após a carga dos dados foi possível fazer relações como: especialidade versus idade; unidade federativa de procedência do paciente versus especialidade versus ano, entre várias outras correlações.

Ainda Dallora et al (2004), informa que com “os testes obtidos com o uso dessas ferramentas proporcionaram aos usuários maior agilidade e facilidade de manuseio, velocidade, independência”, uma maior visão sobre as informações disponíveis, despertando idéias e possibilidade de novos cruzamentos inicialmente não idealizados. Futuramente, se espera que a abrangência do DM ganhe uma dimensão maior de acordo com as necessidades dos usuários e do surgimento de novos sistemas que serão incorporados como novos DMs de forma a obter o DW corporativo.

Seguindo na área de saúde, este exemplo teve como objetivo identificar problemas na grade de horários das cirurgias, assim como os recursos: humanos, materiais, etc. O próximo exemplo visa gerar informações com a flexibilidade de utilizar vários relacionamentos entre as tabelas, auxiliando o tomador de decisão.

Kuhnen e Vieira (2004) apresentam um estudo de caso na Unimed de Francisco Beltrão referente à implantação de um DW. O projeto do DW foi construído juntamente com outras duas Unimeds (Londrina e Curitiba), onde foi formado um comitê para definir os modelos e validar os dados, após isso criaram a infraestrutura para armazenar e processar os dados. Na sequência, criaram o modelo de dois DMs, Produção e Usuários, para depois serem liberados no DW, depois houve a validação dos modelos, criação do Banco de Dados e desenvolvimento do processo de carga dos dados, por fim criação o material para auxílio dos usuários e treinamento aos mesmos.

(41)

33

Ainda Kuhnen e Vieira (2004), descrevem como vantagem do DW os seguintes pontos: 1 – relatório com “ranking dos clientes com maiores custos”; 2 – “relatório com quantidade de consulta por usuário”; 3- “relatório com consulta que demonstra a quantidade de usuários por faixa etária no Paraná”, entre outros relatórios que ajudaram os gestores na tomada de decisão.

O exemplo descrito a seguir, fala sobre o Sistema Único de Saúde, que visou obter informações para decidir, qual região ou quais diagnósticos devem ser utilizados em políticas sociais. A DataSus (2010) diz que o sistema CadSus se refere ao Cadastramento Nacional de Usuários do Sistema Único de Saúde, onde este, consiste no processo por meio do qual são identificados os usuários do Sistema Único de Saúde e seus domicílios de residência”, com isso será possível a emissão do Cartão Nacional de Saúde para os usuários, assim como a vinculação de cada usuário ao domicílio de residência, isto trará uma maior eficiência na realização das ações de natureza individual e coletiva. O CadSus utiliza um DM para a geração de base de consulta e extração de dados, permite ainda a construção de um banco de dados para diagnóstico, avaliação, planejamento e programação das ações de saúde, assim como a construção de políticas sociais integradas e intersetoriais (educação, trabalho, assistência social, tributos etc.) nos diversos níveis do governo.

Saindo da área da saúde e entrando na área de Marketing, o próximo exemplo, descreve um sistema que tem como foco o cliente.

Conforme Teradata (2009), a rede Carrefour, maior varejista da Europa, está expandindo seu ambiente de EDW (Enterprise Data Warehouse) da empresa Teradata, com objetivo de suportar análises de negócio dentro do departamento de Marketing. A nova solução permitirá o controle de mais de 14 milhões de famílias, dando ao Carrefour uma visão de 360º em tempo real de seus clientes por uma ampla variedade de canais de contato com o consumidor. Mais de 60 mil categorias de consumidor podem ser gerenciadas pelos profissionais de Marketing do Carrefour, com alto grau de detalhamento. Por exemplo, será possível detectar que determinado cliente fez 50 visitas a qualquer loja Carrefour no período de um ano, ou uma visita por semana, adquirindo em média de 20 a 25 produtos, fazendo seus pagamentos com o cartão de fidelidade Carrefour em 80% das vezes.

Assim como o anterior, outro exemplo voltado à área de Marketing é o da VM2 (2006), empresa com ramo no trabalho integrado em consultoria e planejamento estratégico digital, apresenta o serviço de Marketing de Relacionamento. Este serviço que tem foco no cliente é

(42)

34

utilizado para captação de novos clientes assim como a retenção dos que já existem. O serviço utiliza como base para extração dos dados, o DW, assim como também utiliza o Data Mining para extrair do DW um conjunto de métodos Inteligíveis.

(43)

3

DESENVOLVIMENTO

Neste capítulo será apresentada uma descrição da empresa, da área de Marketing e do trabalho, assim como a metodologia de como este foi desenvolvido durante o TCC II, ou seja, até a conclusão deste trabalho. Por fim, foi descrito alguns pontos de risco que poderiam intervir na conclusão do trabalho.

3.1

EMPRESA

A Operadora de Planos de Saúde em questão é uma empresa de grande porte, que possui milhares de clientes em sua carteira e para atendê-los com qualidade, trabalha com mais de mil prestadores (hospitais, clínicas, laboratórios, entre outros) em sua área de atuação. A empresa tem como produto principal seus planos de saúde comercializados por seus funcionários buscando suprir as necessidades de seus clientes.

Para alcançar suas metas e objetivos, esta empresa tem como missão a satisfação dos clientes e profissionais, conforme descrito a seguir:

• Missão: "Promover Saúde e Qualidade de Vida, buscando a satisfação dos Clientes e demais Profissionais, com responsabilidade socioambiental".

• Visão: "Ser reconhecida como empresa de excelência e a melhor promotora de saúde e qualidade de vida".

• Valores: "Os valores da empresa que constituem seus princípios são: Equidade, Ética, Integridade, Lealdade, Solidariedade e Verdade".

• Política de Qualidade: "Buscar a satisfação dos clientes através da melhoria contínua dos processos, oferecendo e administrando planos de saúde e serviços com qualidade".

Com base nestes objetivos, a empresa apresenta uma estrutura composta por uma hierarquia onde na parte superior está a diretoria executiva, logo abaixo está a diretoria de gestão, seguido de seus gerentes, após estes, estão os supervisores e por fim os funcionários da parte operacional. Como apresentado no exemplo da Figura 1.

(44)

37

Figura 16. Organograma da Operadora de Planos de Saúde Fonte: Elaborado pelo autor.

A Figura 16 é apenas ilustrativa. Em todas as diretorias existem um ou mais gerentes seguidos de seus supervisores e assim por diante conforme já comentado. Como exemplo, pode-se imaginar que a área de Marketing em uma das caixas Gerente, onde abaixo estão seus respectivos os supervisores divididos em três divisões: Comunicação, Marketing e Produto. Esta área, assim como suas divisões, serão detalhadas na próxima seção.

3.1.1

Área de Marketing da Operadora de Planos de Saúde

Hoje em dia, as empresas dos diversos portes existentes no mercado possuem serviços que se propõem a satisfazer as necessidades dos clientes e como resultado disso, obter sua lucratividade. Na Operadora de Planos de Saúde em questão não é diferente, ela também cria produtos (bens e serviços) de modo a atrair os clientes para suprir suas necessidades.

A divisão de Marketing da empresa em questão está divida em três grandes grupos: Comunicação, Produtos e Marketing. É necessário que cada qual cumpra com suas obrigações para que a área alcance suas metas e resultados e por consequência a empresa aos seus anseios.

Referências

Documentos relacionados

Para Souza (2004, p 65), os micros e pequenos empresários negligenciam as atividades de planejamento e controle dos seus negócios, considerando-as como uma

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Este estudo tem como objetivos identificar os níveis de trauma manifestados e de estratégias de coping utilizadas pelos TEPH; caracterizar os incidentes mais

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

Foram analisados a relação peso-comprimento e o fator de condição de Brycon opalinus, em três rios do Parque Estadual da Serra do Mar-Núcleo Santa Virgínia, Estado de São

The focus of this thesis was to determine the best standard conditions to perform a laboratory-scale dynamic test able to achieve satisfactory results of the

For additional support to design options the structural analysis of the Vila Fria bridge was carried out using a 3D structural numerical model using the finite element method by

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e