,ü
u-evtrra
I.I!{IYER§iEÂEE DE E}ETÂDEPARTAMENTO DE INFORMÁTICA
Mestrado
em EngenhariaInformática
Dissertação
Metodologias de Qualidade e Testes de Data Warehouses - sua importância Para a flexibilização e
optimização do processo de Data Warehouse
"Esta dissertação não inclui as críticas e sugestôes feitas pelo
júri"
Francisco
Luís
Marinho do
Rosário Matias
(no 17386)
ORIENTADOII PAU LO QU ARES MA COORDENN)OR ilTERNO: JOÃO DUARTE
I,]E L69 090
f
u.evüra
UHIYE$ITEâOE DE ÊTETADEPARTAMENTO DE INFORMÁTICA
Mestrado
emEngenharia
Informática
Dissertação
Metodologias de Qualidade e Testes de Data Warehouses - sua importância Para a flexibilização e optimização do processo de Data Warehouse
"Esta dissertação não
inclú
as críticas e sugestões feitas pelofúri"
,l
úq
oqo
Francisco
Luís
Marinho
do
Rosário Matias
(no 17386)
ORIENTADOII PA U LO QU ATTES MA CooRDENADOR EXTERNO: JOÃO DU A RTE
Agradecimentos
Em
primeiro
lugar gostaria de agradecer a toda a minha famllia e amigos, portodo
o
seu apoioe
incentivos, especialmente aos meus pais que semPre me ajudaram. Sem eles com certeza que esta oPortunidade não poderiater
sido concretizada.Gostaria também de agradecer ao professor Paulo Quaresma da Universidade de Évora, pela orientação e ajuda ao longo deste proiecto, bem como todos os ensinamentos que me transmitiu ao longo destes anos'
Um agradecimento muito especial Para o Dr' )oão Duarte' pela forma como me
recebeu
e
me ajudou
incondicionalmente, mas tambémPor me
ter
dado
aoportunidade de puder realizar este proiecto'
Gostaria também de expressar a minha gratidão a todos os meus colegas de trabalho, em especial ao Eng. Hugo Malarranha e ao Eng. Miguel Macedo. Ao meu colega e amigo sérgio Faustino, agradeço toda a sua aiuda e apoio nos momentos em que mais necessitei.
por fim, mas não menos importante, a todos os meus colegas e professores que me acompanharam no meu percurso escolar e académico, um
muito
obrigado também.-I-Metodologias
de
Qualidade
e
Testes
de
Data
Warehouses
sua
impoftância para
a
flexibilização
e
optimizaçâo do
processo
de
Data
warehouse
Conseguir informações
que permitam
a
tomadade
decisões baseadas numvolumoso histórico
de
dados torna-sediflcil
quando as
grandes emPresasdetêm
um
enorÍnevolume
de
dados espalhadosem
diversos sistemas' Ossistemas
de
Data
Warehousesurgiram
da
necessidadede
transformar
eorganizar estes dados para a geração de informações estratégicas úteis' Com o
avanço exponencial
do
progresso tecnológico,
o
ciclo
de úda
dedesenvolvimento
dos produtos
torna-se menor, obrigando as
empresas a tomarem decisões operacionais e estratégicas em curtos intervalos de tempo.Assim,
a
competitiüdade
de
uma
organizaçãoé
determinada
pela
sua capacidadede
tomar
decisões precisasque
garantam
o
sucessoda
sua estratégiade
negócio. Essas decisões devemser
baseadasem
informações actualizadas, completas e de elevada qualidade.A
aplicação de metodologiasde
qualidadee
testes assumem-secomo
essenciaisPara
a
manutenção eoptimização
do
processo deData
Warehouse.Investir nestas metodologias éinvestir na qualidade da informação.
Data
warehouse
quality
methodologies
and
tests
- their
importance
for the
flexibility
and
optimization
of
the
Data
Warehouse
process
Getting information
that
allow
decisionmaking
basedon
a
voluminoushistorical
data
becomesdificult
when
large
companies havean
enoÍmous amountof
data
scatteredin
dffirent
§ystems. TheData
Warehouse sysfems arosefrom
the needto
transfotm and organize the datafor
generating usefulstrategic information.
With
the
exponential growth
of
the
technologicalprogÍess,
the
life
cycleof
product dorclopment
becomes smaller,forcing
companiesto take
strategic and operational decisions inshort
intervalsof
time. Thus, the competitiveness of an organization is determined by its ability to make accutate decisionsto
ensure the successof
its business. These decisions shouldbe
basedon
updated, futfilted andhigh
quatity information- The applicationof
quality
methodologies and tests takeon
os
essentialto
the maintenance and optimizaüonof
the Data Warehouse ptocess. Invesüngin
these methodsis
to invest in the quality of information.-v-Índice
Geral
1
Introdução
1 2 2 2 3 3 1.1 L.2 1.3 L.4 1.5 Contexto Académico Contexto InstltucionalContexto Tecnológlco e Científico
Objectivos da Dissertação
Estrutura do Documento
2
Data
Warehouse
2.1
Enquadramento Histórico e Motivação2.2
Definições de Data Warehouse5 6 8
2.3
Características de um DataWarehouse
l0
2.3.1 Orientado por assunto 10
2.3.2 Não
Volátil
112.3.3
Integrado
ll
2.3.4
Histórico
122.4
Arquitectura do DataWarehouse
142.4.1 Arquitectura Tradicional de Data Warehousing L4
2.4.2 Àrquitectura em Três
Camadas
152.4.3 Arquitectura em Duas Camadas 15
2,4.4 Base de Dados Integrada que Alimenta o Data Warehouse
-
16
2.5
Modelos de Arquitectura de Dados L72.5.1 Modelo em Estrela t7
2.5.2 Modelo Floco de Neve t7
2.5.3 Modelo
Normalizado
lS2.6
Processos Básicos do Data Warehouse 182.6.1
Extracção
t92.6.2
Transformação
192.6.3 Carregamento e Indexação 19
2.6.4 Garantia de
Qualidade
20-uI-2.6.5 Publicação 2.6.6
Consulta_
2.6.7 Recuperação e
Backup_
2.6.8 Segurança de acesso ao Data Warehouse
3
Conceitos
Envolvidos
3.1
Conceito de Business Intelligence_
3.1.1 Arquitectura de um Sistema de RI 20 20 2t 2L
3.2
EIS vsDSS_
26
27 28 28 31 32 32 33 33 33 34 34 35 38 39 40 4L3.3
BICC3.4
Data Warehouse vs Data Mart3.5
Staging Area3.6
ETL 3.6.1 Extracção 3.6.2 Transformação 3.6.3 Carregamento3,8
oráP3,7
ODS 3.9 3.103.8.1 Características das ferramentas OLAp 3.8.2 Arquitectura das ferramentas Olâp Metadata
Near Real T'ime Data Warehouse
4
Importância de um Data warehouse para uma organização
de
Telecomunicações num ambiente em constante mutação
_
43
5
o
Processo
de construção e
Manutenção
Evolutiva de um
Data
Warehouse
46
6
Abordagens e Metodologias de eualidade
eTestes de um
Data
Warehouse
516.1
Enquadramento de uma equipa de testes 536.3
6.4
6.5
6.6
Clclo de desenvolvimento 55
Operaclonalização de uma equlpa de testes 58
6.4.1 Fluxo de
Interacção
58 O concelto deteste
62 T1pos de Testes 63 6.6.1 Testes deSlstema
63 6.6.2 Testes deCarga
63 6.6.3 Testes de DesemPenho 63 6.6.4 Testes de Usabilidade 64 6.6.5 TestesFuncionais
64_64
6.6.6 Testes Unitários 6.6.7 Testes deIntegração
656.7
Exemplos deTestes
65 6.7.1 Valldação deitens
656.7.2 Distribuição dos itens e preparação do ambiente de
trabalho-
65 6.7.3 Execução do processo e verificação dos6.7.4 Comparação entre processo antigo
/
processo novo 6.7.5 Contagem de registos duplicados6.7.6 Análise de integridade referencial
6.7.t4 6.7.t5 6.7.16 6.7.t7 66 66 67 68 68 69 70
6.7.7 Análise da coerência Factual
-
Agregada-6.7.8 Teste de reprocessamento
6.7.9 Validação do correcto mapeamento de novas colunas
6,7.LO Comparação/contabillzação de registos entre fontes
/
tabelacarregada
706.7.t!
IdenHficação pontual de amostras de registos nas fontes e nastabelas
carregadas
716.7.t2
veriflcação da correcta dlstribuiçao de flcheiros fonte-
72
6.7.L3
Verlflcação do correcto carregamento de ficheiros 72 Validação de métricas das tabelas agregadas-
72
Simutação do carregamento de regtstos para as tabelas
-
73
Veriflcação dos tempos de execução do
processo-
73Verificação da existencia de valores null em
tabelas-
74 746.7,t9
Comparação da estrutura de tabel-IX-6.8 vantagens e desvantagens da aplicação de metodologias de qualidade e testes
7
Caso Prático
7.L
Nota introdutória7.2
Aplicação ao Caso prático7.3
Ferramentas utiI iz:/ aa8
Conclusões
7576
77 77 9192
93 94 96 8.1 8.2 8.39
Bibliografia
Apreciação Crítica
/
Avaliação Principais DesenvolvimentosConclusões Finais
Índice
de Figuras
FIGURA 1- NÃO VOUNUDADE .,...
FIGURA 2 - INTEGRAçÃO DOS DADOS ORIEIITADOS pOn npUCA6O PARA UM Dare WtnrnOUSE""' FIGURA 3 - ARQUTTESTURA TRADICIONALDE DATA WAREHOUSING
FTGURA 4 - ARQUTTECTUna ru TnÊs CaN{eo4s...
FIGURÂ 5 - ARQUrrEcruRA EM DuAs CeMnoAS...
FIGURA 6 - ARQUTTECTURA EM QUE O Dnte WaArnOUSr É ALIMENTADO POR UMA BD INTEGRADA ' '
FTGURA 7
-
MoDELo em Esrneu...FIGURÂ 8
-
MODELO FLOCO DE NEVE... FTGURA 9-
Ftnrweu-.FIGURA 10
-
ENcRIPÍAçÃo SttuÊrrucaFTGURA 1 1
-
ENCRIPTAçÃo AssluÊrnlcA. "... ..',.... FrGUR 12 - ARQUTTECTURA DE uM SISTEMA oe BI ...'...' FIGURA 13-
PTúUIDC EIS VS DSS..FTGURA 14 - AsPEcÍo eúnco DE uM EIS
(ran*
oe corurnolo)""'
FTGURA 15 - AsPEsÍo cúnco oe uu murÔuo GERADo PoR DSS"' FIGURA 16-
MooeuaçÃo DIMENSIoNAL . "...FIGURA 17
-
PROCESSO DE DATA WAREHOUSEFIGURA 18 - CICLO DE DESENVOLVIMENTO PARA NOVOS PROJECTOS FTGURA 19
-
ConnecçÕes oe emeRcÊNcIA ...."...FTGURA 20 - CICLo oe conaecçÃo e uautmnçÃo EvoLUnvA
"'
FTGURA 21 - FLUxo oe InrenecçÃo DE UMA EQUIPA DETEsrEs"'
...11 ... L2 ... L4 ...15 ...16 ...16 t7 18 23 24 24 28 29 30 30 36 48 55 57 58 58
-xI-Índice
de
Tabelas
TABE|á 1
-
EXEMPLo DE REcIsro ANTES DA ar-renaçÃo ..TABEIÁ 2 - EXEMPLO DE REGTSTO DEPOIS DAALTERAÇÃO TABELA 3
-
Drenrnçes ENrRE OLTP e OI-AP ..."..TABELA 4 - ITENS CONTIDOS NO PROJECTO
13 13 37 7A
-Termos
abreviados,
Definições
Termo Descrição
BI Business Intelligence
BICC Business Intelligence CompetenaT Center
BD Base de dados
DBA Data ba se Ad m i n i strato
r
DM Data Mart
DSS Decision Support System
DW Data Warehouse
ECTS European Credit Transfer and Accumulation System
EIS Execu ti ve I nfo rmati o
n
Syste mETL Extract, Transform and Load
FS Filesystem
FTP File Transfer Protocol
HOIáP Hybrid On Line Analitical Processing
IDW Integration, Development and Warehousing
LDAP Lightweight Directory Access protocol MIT M a ssac h u setts I n stit u te of Tech n o I ogy
MOLAP Multidimensional On Line Anatitical processing
ODS Operacional Data Storage
OI.AP On-Li ne Ana lytical Processi ng
OLTP On-Li ne Transadion Processing ROLAP Relational On Line Analitical processing
RTDW Real Time Data Warehouse
SSL Secure Sockets Layer
1
Introdução
1.1t.z
1.3 L.4 1.5Contexto Tecnológico e Científico Objectlvos da DisseÊação Estrutura do Documento 2 2 2 3 3
1.1
Conrexro
AcaoÉMrco
Este
documento
foi
escrito
no
contexto
da
dissertaçãofinal de
curso
do Mestradoem
Engenharialnformática
da Universidade de Évora. Trata-se deuma
unidade curricular
de
48
ECTS (European
credit
Transfer
and Accumulation System).Como base da realização desta dissertação foi efectuado um estágio curricular, sendo a carga horária semanal média de 3o horas.
o
estágio decorreu durante o período de 6 de Fevereiro de zoog a 5 de Agostode zoo8.
A
orientação pedagógica desteprojecto
estevea
cargodo
professor paulo Quaresma do Departamento de Informática da universidade de Évora.o
estágio
curricular
decorreu
para
a
instituição
IDw
(Integration,
Development
and
warehousing)
em
outsourcing
numa
empresa
detelecomunicações. A coordenação externa esteve a cargo do Dr. João Duarte.
L.2
Correxro
lNsrrrucroNAl
A
instituição
que me recebeu e possibilitoua
realização desteprojecto
foi
aIDW. Fundada em 2oo3, a
IDw
é uma empresa portuguesa com apostas clarase inequívocas. Uma arquitectura de serviços e produtos coerente e consistente,
que
priülegia
essencialmentea
integração,
as
capacidadestécnicas
dos produtos e a capacidade de suporte e manutenção que pode ser oferecida. As principais áreas de actuação da empresa são: Business Intelligence, Segurança,consultoria,
Business ProcessAutomation, Data
Management€s
Business Continuity (tDW, zoo3).1.3
Corurexro
TEcNor-ócrco
=
CreurÍFrco
Conseguir informações que permitissem a tomada de decisões baseadas num volumoso histórico de dados tornava-se numa missão
difícil
sendo necessárioUniversidade
de Évora enormevolume de
dados espalhadosem
diversos sistemas.Os
sistemas de Data Warehouse surgiram da necessidade de conseguir darum
"rumo" a esta informação,permitindo
assim avaliações de negócio ao maisalto
nÍvel. Essasavaliações devem ser baseadas
em
informações actualizadas, completase
deelevada qualidade. Nas
últimas
décadas a qualidade de sofovare temvindo
aser uma área cada vez mais importante e com a necessidade de melhorar cada
vez
maisa
qualidade,têm
ündo a
cresceÍ aS metodologiasde
qualidade etestes.
L.4
Oerecrrvos
DA
DrssenraçÃo
Esta dissertação tem por objectivo em primeiro lugar, conceituar e enquadrar historicamente
os
sistemasde
Data
Warehousebem como
abordar as suascaracterísticas, arquitecturas
e
modelosde
arquitecturade
dados. Pretendetambém mostrar
a
importância
destes sistemaspara
uma
empresa detelecomunicações, bem como
todo o
processode
construçãoe
manutençãoevolutiva envolüdo.
É
também objectivo
desta dissertação, demonstrar asmetodologias de qualidade e testes que podem ser aplicadas aos projectos de
Data
Warehouse, mostrandocomo
garantema
qualidadeda
informação adisponibilizar nestes sistemas. O estágio curricular
foi
a base Para a descriçãodestas
metodologias,
permitindo
que
fosse
feita Por fim
uma avaliação/apreciação crítica.1.5
EsrnuruRA
Do
Documenro
A
estrutura desta dissertação está organizada pelos seguintes capítulos:Data
Warehouse
-
Este
capítulo
pretendeenquadrar
historicamente os sistemasde Data
Warehousee
fornecer definições Para estes sistemas de acordo com alguns autores. Pretende também descrever as características deum Data
Warehouse, arquitecturas e modelos de arquitectura de dados, bemcomo os seus processos básicos.
-3-Conceitos Envolvidos
-
Este capítulo
descreveimportantes
conceitos envolüdos com o tema dos sistemasde
Data warehouse, tais como, BusinessIntelligence,
Executive Information
systems,
Decision support
systems,Business Intelligence competency center, Data
Mart,
staging Areo, etc.Importância
de
um
Data
warehouse
p.rÍa runa
organização
detelecomunicações
num
ambiente em constante mutação
-
Tal
como otítulo
indica, este capítulo pretende mostrar a importância deum
sistema deData
warehouse parauma
empresa de telecomunicações, tendo em conta omercado altamente competitivo em que üvemos e de constante mudança.
o
pÍocesso
de
construção
e
manutenção
evolutiva
de um
Dota
warehouse
-
Nestecapitulo é
descritode
um
modo
geral,o
processo decontínuo
desenvolvimento
evolutivo
e
de
eficiente
manutenção
que
énecessário aos sistemas de Data Warehouse.
Abordagens
e
Metodologias
de
eualidade
e
Testes
de
um
Data
Warehouse
-
Aqui
são apresentadas abordagens e metodologias de qualidadee
testes,
tais
como,
o
enquadramento
de
uma
equipa
de
testes,operacionalização
de uma
equipa
de
testes, objectivosda
aplicação destasmetodologias, ciclo de desenvolümento, tipos de testes, exemplos de testes, etc.
caso Prático
-
Estecapítulo,
pretende demonstrarem
termos
práticos aaplicação de metodologias de qualidade e testes
por
parte de uma equipa detestes numa empresa de telecomunicações.
conclusões
-
Nestecapítulo
é
feita uma
apreciaçãocrítica
ao
trabalhodesenvolvido,
são
apresentados resumidamente
os
principais
projectosUniversidade de Évora
2
Data
Warehouse
2
Data
Warehouse
2,L
Enquadramento Hlstórico e Motivação2.2
Definições de Data Warehouse2.3
Características de um Data Warehouse2.3.1 Orientado por assunto
2.3.2 Não Volátil
2.3.3 Integrado
2.3.4 Hlstórico
2.4
Arquitectura do Data Warehouse2.4.1 Arquitectura Tradlcional de Data Warehousing 2.4.2 Arquitectura em Três Camadas
2.4.3 Arquitectura em Duas Camadas
2.4.4 Base de Dados Integrada que Alimenta o Data Warehouse
-
16 5 6 8 10 10 11 11 t2 L4 L4 15 152,5
Modelos de Arquitectura de Dados2,5.2 Modelo Floco de Neve 2.5.3 Modelo Normalizad
2.6
Processos Básicos do Data Warehouse2.6.1 Extracção 2.6.3 Carregamento e Indexação 2.6.4 Garantla de Qualldade 2.6.5 Publicação 2.6.6 Consulta 2.6.7 Recuperação e BackuP
2,6.8 Segurança de acesso ao Data
Warehouse-t7 L7 L7 18 18 19 19 19 20 20 20
2t
2t-5-2,L
EnqunonnMENTo
Hrsrónrco
e
MorrvaçÃo
À medida que o progresso tecnológico avança a uma velocidade exponencial, o
ciclo
de
vida de
desenvolvimento dosprodutos
torna-se cadavez
menor, obrigando as emPresasa
tomarem
decisões operacionaise
estratégicas em intervalos decrescentesde tempo.
Dada esta situação,a
competitividade deuma
organização passaa
ser
determinada,em
grande
parte,
pela
sua capacidadede
tomar
decisões precisasque
garantam
o
sucessoda
sua estratégiade
negócio. Essas decisões devemser
baseadasem
informações actualizadas, completas e de elevada qualidade.No início da década de 9o, os sistemas Data Warehouse (DW) surgiram como uma solução Para os problemas de apoio à decisão.
A
informação tornou-se obem
mais valiosodentro
das instituições,e o
mais
interessanteé
que estainformação
está
disponível
nas
próprias
organizações.Os
dados
para
aobtenção de informações estão armazenados nas bases de dados operacionais, sistemas legados, arquivos pessoais e documentos.
O
grande desafio é sabercomo
tornar
estes dadosúteis
para
o
negócio, transformandodados
eminformações,
e
estasem
acçõesque
melhorema
gestiio dos negócios. para acedera
uma base de dados gigantesca e dispersa,e
conseguir concretizá-lanuma
fonte de
informaçãoviável,
é
necessáriotransformar
e
organizar osdados para a geração de informações estratégicas úteis.
Como as decisões se fazem consoante a informação que está disponível e são
tanto
mais eficazesquanto melhor
for
essa informação, torna-se necessário reestruturar e repensar os sistemas de uma empresa com o objectivo de melhordisponibilizar
a
informação relevante para cadatipo
de
decisão.O tipo
de informaçãoque circula numa
organizaçãoé
específicopara
cadanível
da estrutura organizacional. Assim, enquanto um gestor operacional necessita deinformação Para
tratar
e
armazenar transacçõesdiárias
e
necessárias aonegócio
(suportado
por
sistemas transaccionais),a
nível
estratégico, ainformação deverá ser proveniente de diversas fontes (internas e/ou externas), sob
um
Ponto deüsta
analítico e centrada nos negócios (suportadopor
um sistema de apoio à decisão).Universidade de Évora
A
evolução da tecnologia e o crescimento do uso de computadores ligados emrede, permitiu
que
médias
e
glandes
emplesas
utilizassem
sistemas informáticos Para realizar os seus Processos mais importantes,o
quecom
o passar do tempo gerou uma quantidade enorme de dados relacionados com osnegócios,
mas
que não
estavam
relacionados
entre
si.
Esses dadosarmazenados
num ou
mais
sistemas operacionaisde uma
empresa sãoum
recurso,mas
de modo
geral,
raramente seryemcomo
recurso estratégico quando se encontram ainda nesse estadooriginal.
Os sistemas informáticos convencionais não são desenvolvidos para gerar eatrnzenar
as informações esffatégicas,o
quetoma
os dados vagos e sem valor para o apoio ao processode
tomada
de
decisãodas
organizações. Estas decisõessão
normalmentetomadas
com
basena
experiênciados
administradoresda
empresa, maspoderiam
também ser
baseadasem
factos históricos
armazenados pelosdiversos sistemas de informação utilizados pelas organizações. Mediante esta situação surgiu
o
DataWarehouse, como um desafio para integrar esses dados, eliminando as redundâncias e identificando informações iguais que pudessem estar representadas sob formatos diferentes em sistemas distintos.A importância dos dados como fonte não apenas do controlo operacional, mas
da
estratégia operacionaltem
sido
a
chaveprincipal no
conceito de
Data Warehouse. Os dados são assimum
elemento estratégico, sendo muitas vezes desperdiçadosem
suPortesdigitais que só
existem devido
a
normas
da empresa de registar os dados hansaccionaispor
um
determinado período detempo.
O
Data
Warehouse tornou-se teoricamenteuma fonte
de vantagemcompetitiva,
no
entanto, manter
a
competição
iá
não
é
garantia
de sobrevivência, é necessário surpreender a concorrência. Este sistema tomou-se numa peçamuito
útil
nesA nova filosofia de negócio,utilizando
hoje em diaum
processode
armazenamentode
dadosque tem
ündo a
ganhar
força devido à evoluçãodo
hardware e sofovare. O objectivo do DataWarehousing éportanto fornecer a informação certa, Para a Pessoa certa, no momento er{ilcto.
-2.2
DrrrrurçõEs
DEDare Wanrxouse
O
professor RalphKimball é
um
dos maiores conceituados precursores dos conceitos deData
Warehouse. DefineData
Warehouse como toda a fonte deinformação "questionável" de uma empresa. Este autor refere que um
DW
não é mais do que a união deum conjunto
deData
Marts.um
DataMort
(DM)pode ser definido como
um Dato
warehousede
pequena capacidade queabrange
uma
determinada áreaou
departamento, oferecendo informações mais detalhadas sobre um determinado assunto em questiio.O paradigma que Ralph Kimball defende baseia-se no facto da informação ser
guardada
utilizando
o
modelo dimensional (Kimbal,
199g).
Outra
dasdefinições mais difundidas
de
Dw
foi
dadapor Bill
Inmon
queo
descreve como "uma colecção de dados integrados, orientados por assunto, não voláteis, variáveisno
tempo, e que fornecem suporte ao processo de apoioà
decisão"(INMON, Lgg6).o
paradigma desteautor
difereum
pouco do paradigma deKimball.
Bill
Inmon
defende queum Data
warehouse é apenas uma parte de todo o processo de Business Intelligence. uma empresa possui um DW de ondeos Data Marts extraem a informação, sendo a informação guardada na terceira
forma
normal. Ambos
os
paradigmas
são válidos
na
medida
em
que representam filosofias diferentes de Data Warehouse.No entanto, eústem muitos e variados conceitos de
DW
dadospor
diferentes autores. Shams defineData
warehouse comouma
plataformaque
contémtodos os
dados
da
organização, centralizadose
organizadospara que
osutilizadores possam
extrair
relatórios analíticos
complexos,
contendo informações para apoio à decisão (Shams, zoor).segundo
o
autor Devlin pode
definir-se
um
Data
warehousecomo
umrepositório de dados simples, completo e consistente, obtido de uma variedade de fontes e disponibilizado para
o utilizador
de maneira a queo
entenda e outilize
no contexto organizacional (MALLACH, zooo).Gardner define Data warehouse por um processo, e não por um produto, para
Universidade
de Évora propósito de obter uma visão simples e detalhada de parte de todo o negócio (Gardner, 1998).Outra definição
foi
dada por Bigus que o define como um repositório de dadospara uma
grande quantidadede
dados corporativos(MALLÂCH,
zooo).lá
Wang tem uma definição
um
Pouco mais elaborada quandodiz
que o DW é o processo pelo qual os dados relacionados de vários sistemas operacionais sãofundidos
para proporcionaruma única
e
integradaüsão de
informação de negócios que abrange todas as áreas de uma empresa (COME, zoor).Um
DW
permitereunir
informações dispersaspor
diversas bases de dados eplataformas
distintas,
permitindo
análises bastante eficazes, transformando dados dispersosem
informações estratégicas que antes eram inacessíveis ou subaproveitadas(TAURION,
rg97).Pode serdefinido
comoum
conjunto
de componentes de hardware e sofuvare que podem ser usados para analisar uma quantidade massiva de dados que as organizações vão acumulando ao longo do tempo, de modo a apoiar na decisão e gestão do negócio. É portanto uma base de dados de suporte à decisão que é mantida separadamente dos sistemasoperacionais
da
organização. Suporta
Processamento
de
informaçãofornecendo
uma
plataforma sólida para
análise
de
dados históricos
econsolidados.
As soluções de Data Warehouse incluem:
o
Um
repositório unificado
e
consolidado
da
informação
da empresa, com um determinado histórico;o
Processosde
extracção, transformaçãoe
calTegamento dessainformação, proveniente de diferentes sistemas operacionais;
.
Processos de "limpeza" de dados;r
RePositórios departamentais (Data Marts);.
Aplicações no cliente, para consulta à informação do repositório.-9-2.3
CanacrenÍsrrcas
DEuM
Dlre
Wanerouse
Um Data Warehouse deve (Kimbal, 1998) :
o
Tornar as informações de uma organização acessíveis. O conteúdodo DW
deveser
o
mais
compreensivo possívele o
acesso aosdados deve ser efectuado com o melhor desempenho possível.
o
Tornar as
informações
de
uma
organização consistentes. Asinformações provenientes
de
diferentes
áreasda
organizaçãodevem conseguir
garantir
a
integridade semântica,ou
seja, não devemexistir
problemas de nomes iguais para coisas diferentes, ou nomes diferentes para a mesma coisa.o
ser
uma
fonte de
informações flexívele
adaptável. Deveter
acapacidade
de
suportar sucessivas modificações estruturais parainserção
de
novos
dados,
sem
comprometer
a
estrutura
jáexistente.
.
ser o alicerce para a tomada de decisão. Deve conter os dados na forma comecta para suportar a processo de apoio à decisão.Para
garantir
estes requisitos,um
DW
deveseguir as
características mencionadas em seguida(INMON,
ryg6).2,3.L
Orurrureoo
poR ASSUNToUma das principais características
do
Data Warehouse é o facto de teruma forte
orientação
por
assunto.
É
organizadoem torno de
assuntos importantes, tais comopor
exemplo, cliente,produto
e vendas. sãopor
issofocados na modelação e análise de dados para quem toma decisões, em vez de
operações diárias e processamento de transacções.
os
Data warehouses sãoseleccionados, isto é, fornecem uma úsão simples e concisa sobre questões de
um
tema particular através da exclusão de dados que não são importantes no suporte ao Processo de decisão. Pelo contrário, em ambientes operacionaisas aplicações
contêm dados
necessáriosà
satisfaçãoimediata
dos
requisitos funcionais que podem ou não ser utilizados no processo de decisão. Os dadosUniversidade de Évora
do
Data
Warehouse,
além
de
abrangerem
um
maior
número
derelacionamentos, têm em atenção um esPectro temporal mais alargado.
2.3.2
NÃo
Vomnl
Um sistema operacional permite diversas operações de actualização dos dados (acrescentar, substituir, apagar). Num Dato Warehouse, pelo contrário,
só
existemdois
tipos de
operações:uma introdução
inicial
dos
dadose
oacesso
a
estes,não
requerendopor
isso mecanismosde
processamento de transacções, recuperaçãoe
controlo
de
concorrência.Os
dados
que
sãointroduzidos
no
DW
são
estáticos,
são
dados
que
reflectem
situações consolidadas, que não sofrerão actualizações. Os dados após serem extraídos,transformados
e
transportados
para
o
DW
estão
disponíveis
para
osutilizadores apenas para consulta.
Figura 1- Não Volatilidade
ImrccRRoo
Um DW é construído por integração de múltiplas e heterogéneas fontes de dados. São aplicadas técnicas de limpeza de dados e integração de dados.
A
integraçãode
dados, provenientesde
sistemas operacionais, efectua-se nos mais variados níveis, na estrutura consistente de códigos, na forma consistente das variáveis, na conversão de nomes, etc. Os dados que são inseridos noDW
devem estar consistentes entre si em termos de nomes, formatos e unidades de medida. Quando a informação é movida para
o
DW,
é feita a conversão. No processo de integração dos dados, também pode ser necessáriocorrigir
dados que estejam inconsistentes na origem,deüdo à
não integração dos sistemas2.3.3
Drta \f,'arüouse Troce OPeracion't hchi Cerge Acesso-
11-transaccionais
que
fornecemos
dados.os
dadosfonte
são modificados e convertidos para um estado uniforme de modo apermitir
a carga no DW.Drte S'uúoEê
Operlciolrl
Figura 2 - rntegração dos dados orientados por aplicação para um Data
Warehouse.
2.3.4
Hrsronrco
Num ambiente
operacional os dados são exactosno
momentoem que
sãoacedidos,
ou
seja,a
base de dados operacional contema
informação actual.Um Data
Warehousetem
geralmente diversas fontesde
dados operacionaisdiferentes,
o
que significa que os dados aí acedidos podemjá
não ser os mais actualizados, pois podemjá ter
sido modificadosno
sistema operacionale
orefrescamento do Data Warehouse ainda não ter sido efectuado. Assim ,
o
Datawarehouse
representaos
dados sobre
um
horizonte
de
tempo
distante(geralmente alguns anos) enquanto que
o
horizonte
de tempo representado pelo âmbito operacional é mais curto (alguns dias).os
dadosno
DW
reflectem situações ao longodo
tempo,ou
seja, são dados históricospor
natureza. Esta característicaé
essencialdo
ponto
devista
deavaliação do negócio, pois é preciso manter o histórico do comportamento dos negócios para que seja possível analisar os resultados mais recentes. Os dados
são regularmente inseridos para manter
o
registo histórico das operações deuma
organizaçãoao
longo
da
sua
existência. Existeportanto
a
noção
de timestampe de
datade
validadedo
registo.Isto permite
que as consultas possamser
executadaspara
recuperaro
estadoda
informaçãonum
dadoD - urculino, foinim. emrcrÇio A-@, D-ArÍ.rc{Çio A-c B - 1,0, c - x,!',
Universidade de Évora período de tempo. Os dados e os assuntos são sempre mutáveis, logo
o
DW
terá que ter flexibilidade para acompanhar as mudanças de negócio. Não deveportanto
ser alterado
o
histórico dos
dadospara não
colocar
em
dúúda
relatórios e análises já efectuadas.
A título
de exemplo, na dimensãoproduto
seum
mesmo código de produtomudar
de
nome/descrição,deve criar-se
um
novo produto com
o
novo descritivo, e alterar no registo antigo a data final de validade:a Antes da alteração
CódigoProduto Nome DatalnicioValidade DataFimValidade Válido
lo Pr ol-ol-2000 S
Tabela 1
-
Exemplo de registo antes da alteração Depois da alteração:Tabela 2
-
Exemplo de registo depois da alteraçãoTodas estas características conduzem
a
um
ambiente
muito
diferente
do ambiente operacional.O
Data
Warehousesurgiu
paradar
respostaa
novas necessidades de negócio e de concorrência empresarial, e não para substituiros
sistemas operacionais emvigor.
Existeuma certa
redundânciade
dados entre estes dois ambientes, sendo de destacar:o
Os dados são filtrados quando passam do ambiente operacional para oDataWarehouse.
o
Existe uma diferença temporal entre os dados dos dois ambientes..
O
Data
Warehousepode
conter
dados
sumarizados. Paraisso
sãoconstruídas tabelas Agregadas derivadas de tabelas do Data Warehouse. Estas
tabelas
contêm
informação "resumida"
e
agregadada
forma pretendidade
modoa optimizar
e generalizaro
processo de consulta aCódigoproduto Nome DatalnicioValidade DataFimValidade V:iiido
lo Pr 01-ol-2000 o7-o5-zoo8 N
lo Pz o8-o5-zoo8 S
-13-a
aos dados. Uma tabela com dados agregados ocupa menos espaço na base de dados do que uma tabela com dados mais pormenorizados.
A
transferênciade
dados sofre algumas transformações necessárias àintegração dos dados.
2.4
AngurrecruRA
Do
DATA
Wanrnouse
Entende-se por arquitectura, o conjunto de regras/estruturas a
partir
das quaisé
construído
um
sistema. Estaidentifica
e
compreendeo
fluxo de
dadosatravés
do
sistemae a
forma como
serãoutilizados
dentro
da
própriaorganização.
A
estrutura deum Doto
Warehouse é constituídapor
uma basede dados independente, desenhada especificamente para apoio à decisão não
podendo ser
actualizadae
à
qual os
utilizadores acedem atravésde
uma ferramenta front-end. De entre os vários tipos de arquitectura, são de destacaros seguintes:
2.4.L
AnqunrcruRA
TRRorcloNAL
DEDarR
Wnnrnousllrc
Na arquitectura tradicional, os dados são integrados e carregados directamente
para
o
Data
warehouse, sendo
depois
trabalhados
de
acordo
com
as funcionalidades do sistema e dos pedidos específicos dos utilizadores.t
B
I
EI
retãt
EI
ffitãt
EI
ffitEt
Transfcrêucia dos Dedos Integração dos Dados Siíemr Tranra c ciomis*ü*
lnilizl dore!Universidade de Évora
2.4.2
AneurecruRA
EMTnÊs Ceunons
Nesta arquitectura o
Data
Warehouse serve como depósito central dos dados históricosda
organização. Esta camadaé a
basede
alimentação dos Dato Marts, orientados para uma dada área de negócio da empresa e comPostos Por conjuntos de tabelas estruturadas de forma a acelerar as respostas às consultas.Este modelo
apresenta vantagens,tais
como,
o
bom
desempenho nasconsultas, bons tempos na agregação dos dados e visão multidimensional entre estes.
Constitui no
entantoum
problema para empresas que estão Presentesem
vários mercadose
em
diferentes países,pois terão que
representar um universo mais complexo.Figura 4 - Arquitectura em Três Camadas
2.4.3
AnqurecruRA
EMDuns
Cnunons
Este
tipo
de arquitectura não prevê a existência da camada correspondente ao Data Warehouse. OsData
Marts são actualizados directamente pelos sistemastransaccionais.
Este
modelo
caracteriza-se
pela
alta
velocidade
deimplementação.
IEII
r-En
m
rEn
m
r-En
Ttansfú'cucia dos Dados Itrt gB9ão Dadosml
IXa 1I,
Dl2t
thiliadoru I I Si!t@3Trrmcciomir Data po.;L."tMerts
-15-tEl
roI
EIIm
r-En
t-l
r-Eil
dos llados Integração de Dadosü
mí2 !I
Éí SiícurTrccciouir Dâta porÁrcarMrrtr
trat
Figura 5
-
Arquitectura em Duas Camadas2.4.4
Bnsr
DEDADos
IrurecRRoA
euE
ALrMeNre
o
DATAwRRenousr
Nesta arquitectura,
os
dados são
extraídos, integradose
carregados dos diversos sistemas transaccionaisda
organizaçãopara uma
basede
dados integrada. Nesta basede
dados, poderão ser ainda actualizados alguns dos dados atravésde
uma
aplicação. Estetipo
de arquitectura
é utilizado
em organizações que começampor
dar prioridade à tomada de decisões tácticas(curto
prazo)no
seu negócio.A
integração préviados
dados antesdo
seu carregamentono
Data
Warehouseé
necessáriaem
ambientesde
grande turbulência onde o factor tempo é decisivo. A figura apresentada abaixo ilustra este tipo de arquitectura:Figura 6 - Arquatectura em que o Data warehouse é alimentado por uma BD integrada Dados Antuelizeções
I
{ at
Universidade
de
Evora2.5
2.5.L
Mooelos
DEARQUrrEcruRA
DEDADos
Existem
três
modelos fundamentais
de
arquitectura
de
base
de
dados utilizados em sistemas de Dota Warehouse:.
Estrela (Star Schemo).
Floco de Neve (Snowflake).
Modelo NormalizadoMooero
EM ESTRELANeste modelo, cada tabela Factual contem todos
os
níveisde
agregação de dados possíveis. As chaves primárias existem apenas para osatributos
mais atómicos (mais elementares). Cada tabela de lookup possui todos os atributos associadosa
essa dimensão.Este modelo
é
chamadomodelo
em
Estrelaporque
a
tabelade
factosfica
aocentro,
cercada das tabelasde
Dimensão, fazendo lembrara
forma de uma estrela. A vantagem deste modelo é que o número de operações de "ioin" entre tabelas é minimizado na generalidade dasanálises efectuadas. No entanto, a desvantagem deste modelo tem que ver com o facto das tabelas de Dimensão possuírem um tamanho muito grande.
Figura 7
-
Modelo em EstrelaMoorlo
Ft-oco
DE NEVENo
modelo
de
dadosFloco
de
Neve, cadaatributo de uma
determinadadimensão
é
identificado
por
uma
tabela de lookup diferente. Cadaatributo
incluí
um ou
mais
atributos
pais
e
cadanível de
agregaçãode
dados
éDimensáo Prodúo Dimensão Tempo Facto Vondas codjÍoduto descrição pÍodutor catêgoria embalagem Dimensâo Lo.ia cod_lempo die_sêmana mes tÍimestre ano feriado cod_tempo codlcroduto cod loja vendas unidede cod-loia nomê endêreço
2.5.2
-t7-representado
por
uma
tabeladistinta.
Neste caso,em vez
do
esquema em Estrela, passa a existir um conjunto de tabelas de Dimensão que se relacionam entre si através de alguns dos seus atributos.A
vantagem deste modelo tem que ver como
facto das tabelas de atributos serem normalizadas, pequenas e sem redundâncias,diminuindo
o espaço em disco. No entanto, as análises deníveis mais elevados implicam a realização de um grande número de operações
de "join" entre tabelas, o que constituí uma desvantagem.
outra
desvantagemé a sua manutenção complexa. Este modelo é chamado de Floco de Neve dado
que cada dimensão "se
divide"
em várias outras tabelas organizadas de uma certaforma
fazendolembrar
um
floco
de neve.A
figura
seguinteilustra
oaspecto de um modelo de dados Floco de Neve:
Figura 8
-
Modelo Floco de Neve2.5
.3
Mooelo
NoRrvRuzRoo
Neste
modelo,
apenasos
dados elementaresficam
guardadosem
tabelas.Todas
as
agregaçõese
acumulaçõesde
dados
não ficam
registadas. seexistirem, serão feitas em processos "on-line", em modo "on-demand,, (ou seja,
a pedido do utilizador).
2.6
Pnocessos BÁsrcos
Do
Dara Wenexouse
um
Data
warehouse compreende vários sub-processos, tais como, extracção,transformação, carregamento e indexação, garantia de qualidade, publicação, consulta, segurança, recuperação e backup (Kimbal, 199g).
Dimensão Produto cod_embalagem tamanho cod merce cad*armazenamento codJcroduto descrição cod_embalagem pêso c,od_marca nomê cod-cetegoria cod_categoria nome cod_armazenarn€nto tipo cod_tempo_vidalorat cod_têmpo_vidaJcrat têmpo_vidajrat
Universidade de Évora
2.6.t
2.6.2
E>rnncçÃo
O
processo de extracçãoé
o
primeiro
Passo paraobter a
informação para o ambientedo
Data Warehouse.Extrair
significaler
e
compreender fontes de informação,e copiar
as Partes necessárias,de
relevante impoÚância, para aárea de estágio (estrutura intermédia entre os sistemas operacionais e
o
DW) para que futuramente essa informação seja trabalhada.A
extracção de dados éfeita muitas das vezes de sistemas legados. Os dados podem estar em diversos
formatos (como
por
exemPlotabelas
relacionais,arquivos
ASCII,
fonteslnformix,
etc),
o
que
requer
a
sua traduçãoe
adequação Paraa
estrutura padrão do repositório.TRnrusroRMAçÃo
A
transformaçãode
dados
é
efectuadacom
baseem
regrasde
negócio definidascom
o
objectivo de
obter a
informaçãomais
imPortantepara
onegócio.
A
transformação dos dados embruto
envolve a adaptação, limpeza econsolidação
da
informação antes
de ser
integrada
no
DW.
O
objectivoprincipal
destaetapa
é
eliminar
as
diferenças semânticasentre os
dados extraÍdos e o esquema multidimensional adoptado. Extraída a informação para a área de estágio, existem variados possíveis Passos de transformação, dentro os quais se podem destacar:o
Limpezada
informação,de modo a
resolverconflitos
existentes. Por exemplo,o
nome de uma cidade que é incompatível como
seu código postal ou sobreposições, como por exemplo, dois camPos representandoa mesma informação com formatos diferentes.
o
Exclusão de campos dos sistemas fonte que não são necessários no Dato Warehouse.o
Complementação de campos com valor nulo, etc.CeRReceuENTo e
IruoexnçÃo
Terminado o processo de transformação, a informação é carregada pata o Data Warehouse.
Deüdo
ao
grande
volume
de
dados
são
utilizadas
técnicas2.6.3
-19-esPeciais,
como
proces§amentoparalelo
ou
incremental,para
aumentar
aeficiência
e
garantir
o
carregamentodos
dadosno
DW na
data
preüsta. Durante esta fase, outras actiüdades são desempenhadas, tais como a criação de índices, classificação e agregação de dados, particionamentos e verificação de integridade (para controlo de qualidade).2.6.4
GnRRrurre
DE QUALTDADEQuando cada Data
Mart
for carregado, oúltimo
passo antes que estes possam serutilizados é
a garantia de qualidade dos dados. Essa qualidade pode serassegurada através
da
aplicaçãode
diversas metodologiasde
qualidade e testes. Por exemplo, a execução de contagens sobre os dados carregados nas tabelas sendoque
essas contagensterão
que ser consistentes consoante osvalores existentes nas fontes, a identificação de amostras de registos nas fontes
e nas tabelas carregadas, a validação de mapeamentos, etc.
2,6.5
PuauceçÃo
Quando
cadaData
Mart
tiver sido
prontamente
carregadoe
tiver
sido asseguradaa
qualidade dos dados,a
nova informação estápronta
para ser utilizada, sendo os utilizadores alertados para esse facto.2.6.6
Corusulra
A
consulta aos dados nãotem lugar
na área de estágio. É realizadano
Data warehouse.e
éo ponto fulcral
parao
seu uso. Inúmeros autores(MooDy,
zooo),
(WATTERSON, 1998),(Kimbal,
r99B),(BREITNE&
LggZ), (POWER,zooo),
argumentam
que
a
solução mais
viável
é a
divisão
do
DW
em subconjuntos de dados significativos, que são alimentados consoante a área aque dizem
respeito.
Estesmini
Data
Warehouses são denominados DotaMarts.
O
termo
consulta envolve todas as actiüdades relacionadascom
o acesso à informação num DataWarehouse.Universidade
de Évora2.6.7
2.6.8
RecupenaçÃo
e
BecruP
Um
Data
Warehouse pode ser visto como uma corrente de dados dos sistemas legados paraos
Data Marts e eventualmente para os desktops dos utilizadores' De onderetirar
a informação necessária com o propósito de ser arquivada ou recuperada de "desastres" é uma questão que merece ba§tante atenção' Mais complicado ainda é recuperar metadados que controlem o DataWarehouse'SecuneruçA
DE AcESSoAo
DATAWeRenouse
A
segurança é um tema que merece especial atenção, dada a importância dos dados armazenadosno
Data Warehouse. Apesar deexistir a
necessidade dedisponibilizaÍ
a
informação para
o
máximo
de
utilizadores
possível, com interfacesde fácil
utilização, existe também
a
necessidadede
Proteger a informação de hackers, snooPers e "espiões industriais". O desenvolvimento da internettem vindo
aamplificar
drasticamente este dilema, dadaa
facilidade oferecida no acesso aos dados.A
segurançanum
Data warehouse tem que ver, em grande parte, com o facto de reconhecer os utilizadores e fornecer-lhes direitos específicos de acesso aosdados.
Nem
todos os utilizadorestêm
acesso aos mesmos dados'i!
o
Data WarehouseManager
quem qualifica
os
utilizadores
e
lhes
fornece
osrespectivos direitos de acesso. O roubo de informação de um
Dcto
Warehouse poderia seÍ um alvo bastante lucrativo.Alguns cenários tlpicos de segurança
em
Data Warehousing sãopor
exemploos seguintes:
o
Uma empresa que controleum
DataWarehouse que é usado por todas as suas áreasde
negócio necessitade
um
sistemade
segUrança que assegure que os empregados de cada área apenas possuem permissões de acesso para aceder à informação que é relevante para a área em que actuam..
Uma
emPresapode armazenal
no
Data
Warehouse informações pessoais.As leis de
privacidade devemser
usadaspara controlar
o-2L-a
acesso a essas informações pessoais.
o
acesso a estas leis de privacidadedeve estar implementado
no
DataWarehouse.uma
empresa que venda informação contida numDoto
warehouse aosseus clientes deve
ter a
capacidadede
apenaspermitir o
acesso aos dadosque
cada
cliente
comprou.Nunca deve ser
possivelque
osclientes vejam a informação de outros crientes, principalmente clientes que são concorrentes entre si.
os
priülégios
de acesso, asseguram queum utilizador
apenas pode efectuar uma operação sobre um objecto da base de dados se estiver autorizado a fazeressa operação.
um
priülégio
é
uma
autorização
para permitir
umadeterminada operação.
Por
exemplo, sem ospriülégios de
GRÁN?um
user não poderá aceder a determinada informação numa base de dados.os
privilégios de
sistemaautorizam
por
exemploum
usera
efectuar uma operação específica de cREATE TABLE, quepermite
a criação de uma tabela na base de dados. Ospriülégios
a objectos autorizamum
user a efectuar uma determinada operação sob um determinado objecto.De
acordo
com
Ralph
Kimball,
eústem
algumas tecnologiasde
segurançaimportantes que devem ser utilizadas
num
DataWarehouse, sendo de destacaras seguintes: Routers e Firewalls, Directory server, Encriptaçã
o,
signed software Certificates e Secure Sockets Layer.
2.6.8.1
Roureas
E FIREwALLSPossuem
a
capacidadede rejeitar
tentativasde
conexãopor
parte de
hosts desconhecidos(intrusos).
Têm
como objectivo aplicar
uma
politica
desegurança
a um
determinadoponto de controlo da
rede. sãoportanto
um mecanismo de segurança bastante importante num DW.Universidade de Évora
WAN
Figura 9
-
Firewall2.6.8. 2 DlnectoRY
SERVERÉ
como que
um
Data
Warehousede
recursosdisponível
na
rede.
Essesrecursos
envolvem
máquinas, repositórios
de
documentos, sistemas
detransacção, impressoras, nomes e endereços, contas de e-mail, etc. Deve ser o ponto central e singular para autenticação e autorização de todos os users do Data Warehouse independentemente se estão conectados à rede interna ou se
são provenientes
do
exterior (Internet).
Esta tecnologia pode ser vista como uma consola de administração onde as politicas de segurança são definidas. O DBA(Dato
Base Administrator) pode correr máquina a máquina edefinir
osprivilégios aos utilizadores.
Paraa
implementaçãodo
Directory
Server éutilizado o protocolo LDAP (Lightweight Directory Áccess Protocol), protocolo derivado do X. 5oo.
2.6.8.3
ErucruPrAÇÃoÉ a técnica de trocar o conteúdo de uma mensagem compreensível (dentro de
um
domínio
de onde
fazem parte
os
membrosda
comunicação)Por
um
conteúdo
incompreensível(texto
encriptado),
atravésde
uma
função
detransformação.
A
forma mais simples de encriptação é a encriptação simétrica. Na encriptação simétrica a chave utilizada para encriptar os dados é a mesma chave queé
usada para desencriptá-los. Estetipo
de
encriptação também é chamado de encriptação de chave privada.A
figura abaixo ilustra estetipo
de encriptação:-23-Sistemas disuibuídos Kjh34r#365 dlmou2dlol
ú
o
chave:k
chave: kFigura lO
-
Encriptação Simétricaum
dos principais
algoritmos
de
encriptaçãosimétrica
é o
DES (Data
Encryption standard) que possui chaves com 56 bits. No entanto este
tipo
de encriptação apresenta alguns problemas. Sepor
exemploum
user encriptar informação com uma chave privada que não revela a ninguém, caso se esqueça dessachave
a
informação será
perdida para
sempre.
Dado
o
principal problemade
comodistribuir
em
segurança as chaves, surgiua
encriptação assimetrica, também conhecidacomo
encriptaçãode
chavepública.
Nesta técnica,a
chave usada paraencriptar
dados e diferente da chave usada para desencriptar. Este método baseia-se em chaves distintas e cadautilizador
deve possuir um par de chaves, uma pública usada para encriptar dados e uma outra privada para desencriptar:Kyh34r#365 dlrnou2dlol
ú
o
chave: k1 chave: k2
Figura 11
-
Encriptação Assimétrica2.6.8.4
Srcrueo
SorrweRr CrRurucerrs
Basicamente, neste tipo de mecanismo qualquer componente de software vem acompanhado de uma mensagem
que
identificao
criador do
software. Essamensagem
está encriptada
com
a
chave privada
do
criador.
só
sãorecepcionadas componentes de software caso se possua
a
chavepública
do criador do software. No entanto, no caso de não se possuir a chave, esta podeser
requerida
ao
certificado
de
segurança (TrustedCertificate
Authority). Sistemas distribuídos Sistemas distribuídos Sistemas distribuídosUniversidade de Évora Depois de se verificar se o software é realmente de confiança pode escolher-se
se este vai correr ou não no sistema
2.6.8.5
Secune
Socrrrs
Leven
No
ano de 1995, a Netscape (empresa famosa Porter
produzidoo
conhecido browserde
Internet
Netscape Navigator) aPresentouo
Secure Sockefs Layer (SSL) comoum
protocolo standart para comunicação entre cliente e servidor. Este protocolo é hoje em dia usado em muitos dos browsers de Internet. O SSLutiliza
uma combinação entre encriptação de chave pública e encriptação dechave simétrica.
A
encriptação de chave pública é usada na máquina cliente para verificar se realmentefoi
estabelecida a ligação com a máquina servidorque era
destinada.Opcionalmente,
o
servidor
pode
também
exigir
uma verificação da identidade do cliente. Esta ligação é chamada de Handshake e eutilizada
para
que as
duas
máquinas cheguema
acordo
relativamente àpartilha da chave de encriptação simétrica. Esta chave de encriptação simétrica é utilizada para as comunicações de alta velocidade que são exigidas. Pode ser alterada pelas duas máquinas
a
cada segundo que passa, como
objectivo demanter elevado o grau de segurança.
r
*F
3
Conceitos
Envolvidos
ô3
Conceitos Envolvidos
26
3.1
Conceito de Business Intelligence 27 3.1.1 Arquitectura de um Sistema deBI_
2g3.4
Data Warehouse vs Data Mart3.5
Staging Area3.6
ETL 3.6.1 Extracção 3.6.2 Transformação 3.6.3 Carregamento3.2
EIS vsDSS
2A3.3 BICC_
31 32 32 33 33 33 34 34 35 38 39 40 4L3,7
ODS3.8
OLAP3.8.1 Características das ferramentas OLAP
3.8.2 Arquitectura das ferramentas OLAp
3.9
MetadataUniversidade de Évora
3.1
Concerro
DEBusrruess
INTELLTcENcE
O
conceito
de
Businesslntelligence
(BI) não
é
recente. Fenícios, persas,egípcios e outros povos do Oriente já utilizavam este princípio há milhares de anos,
quando
cruzavam informações provenientesda
natureza. Observar e analisaro
comportamento das marés,os
períodosde
secae de
chuvas, a posição dos astros, entre outros, eram formas de obter informações que eramutilizadas
paratomar
decisõesque
permitissemuma melhoria de
vida
nas comunidades.O
mundo
mudou desde então, maso
conceito Permaneceu o mesmo.O
interessepelo
BI
tem
vindo a
crescerna
medidaem que
a
sua utilização possibilita às empresas realizar análisese
simulações,de forma
atornar mais eficientes os Processos relacionados com o apoio à decisão.
Este termo surgiu nos anos 8o e descreve a capacidade que as emPresas têm de aceder
a
dadose
explorar as
informações, analisando-ase
desenvolvendo percepções a seu respeito. Com o passar dos anos o termo Business lntelligenceganhou
maior
abrangência,dentro de
um
Processonatural
de
evolução,envolvendo
uma
série
de
ferramentas,
como
o
próprio EIS
(ExecutiveInformation System), as soluções de DSS (Decision Support System), geradores
de consultas e de relatórios,
Data
Marts, Data Mining, ferramentas OLAP (On-LineAnalytical
Processing),entre outras.
Éum
conceito"up
dated" que vai além da gestão empresarial.Em
soluçõesde
Business Intelligence para emPresasde
telecomunicações, é necessárioque
a
informação cheguede
forma rápida
e
coerente Porque asobrevivência
no
mercado
será
medida
pela
capacidade
de
"gerarconhecimento".