E T L
L
A B
( 9 1 5 5 )
P R O G R A M A Ç Ã O L E C T I V A 2 0 1 0 - 2 0 1 1 3 º A N O - 2 º S E M E S T R E L I C E N C I A T U R A E M G E S T Ã O D E I N F O R M A Ç Ã O ( 9 1 5 5 ) R O B E R T O H E N R I Q U E SPRÉ-REQUISITOS
NenhumCRÉDITOS
4 ECTSDURAÇÃO 42 HORAS (14 SEMANAS,14 DE FEVEREIRO A 1 DE JUNHO DE 2011)
DOCENTES
ROBERTO HENRIQUESPiso 2 - Gabinete 6 Telef.: 351-21-3870413 (ext. 207) roberto@isegi.unl.pt www.isegi.unl.pt/labnt/roberto
HORÁRIO DE
ATENDIMENTO
Depois das aulas com marcação prévia.
HORÁRIO DAS AULAS
Terça-feira das 09h30m às 12h15mCONTACTO Repositório de dados gabinete6 (www.gabinete6.pt.vu)
DESCRIÇÃO
Os sistemas de gestão de informação, usados pela maioria das empresas e organizações da nossa sociedade, são construídos com suporte em sistemas de bases de dados relacionais. Estes sistemas são, pela sua propria natureza estrutural, fundamentalmente vocacionadas para armazenar, com altos níveis de eficiência, os resultados das operações quotidianas das organizações.A exploração da informação armazenada numa base de dados é feita através da linguagem SQL (Structured Query Language). As técnicas de programação SQL (vulgarmente designadas por queries ou pesquisas) são complexas e, consequentemente, fora do alcance dos utilizadores de bases de dados.
OBJECTIVOS
A Unidade Curricular de ETL Lab pretende dotar os alunos deconhecimentos avançados de programação SQL, análise e exploração de dados.
Neste contexto serão abordados os seguintes conceitos:
Data Warehousing com particular ênfase na Programação avançada SQL;
Processamento SQL em SAS;
Criação e manipulação de Macros em SAS; Reporting, utilizando SAS Enterprise Guide e Excel Desta forma, pretende-se que os discentes sejam capazes de
compreender e de aplicar os conhecimentos adquiridos nesta unidade curricular no mundo prático das Tecnologias de Informação.
COMPETÊNCIAS A
ADQUIRIR
Em termos de competências gerais a disciplina tem por objectivos: Apresentar as arquitecturas e componentes em Data Warehousing Abordar o paradigma da área de Extracção, Transformação e
carregamento do Data Warehouse
Apresentar um conjunto de ferramentas cuja função é a extracção e transformação de dados de diversos sistemas.
Aprofundar os conhecimentos de programação SQL e SAS.
Introduzir os conceitos de Business Intelligence e EIS (Executive Information Systems)
Abordar os métodos de acesso e exploração de dados, bem como as arquitecturas OLAP (On-line Analytical Processing): MOLAP, ROLAP e HOLAP
Efectuar em ambiente de laboratório de informática exercícios de aplicação dos conhecimentos teóricos abordados
Espera-se que em termos de conhecimentos, na conclusão do curso, o aluno seja capaz de:
Analisar e desenhar um modelo multidimensional. Analisar e desenhar um processos ETL.
Efectuar uma exploração analítica de um modelo multidimensional. Saber utilizar ferramentas de Reporting.
Dominar a linguagem SQL
Desenhar e implementar processos ETL
O SUCESSO NA
DISCIPLINA
A unidade curricular de ETL Lab tem um carácter fortemente prático, pelo que o sucesso do aluno depende, em larga medida, do seu empenho e envolvimento nas tarefas propostas. Assim, é fundamental que o aluno cumpra os seguintes requisitos:
Presença nas aulas (teóricas e práticas);
Capacidade para desenvolver trabalho e reflexão sobre os temas propostos ao longo do semestre;
Capacidade para desenvolver pesquisa e conhecimentos para além do que é apresentado nas aulas, nomeadamente através do estudo das referências bibliográficas sugeridas;
Leitura das referências bibliográficas sugeridas;
Entrega de todos os exercícios e projecto nos prazos estabelecidos (a acordar nas primeiras aulas).
PROGRAMA 1. Data Warehousing
Introdução ao Data WareHousing Planeamento de um Data Warehouse Construção de um Data Warehouse
2. Base de Dados e Programação SQL
Bases de Dados e Sistemas de Gestão de Bases de Dados Linguagem SQL (Structured Query Language)
SQL Avançado
3. Programação SAS e Reporting
Processamento SQL em SAS
Criação e Manipulação de Macros em SAS
Análise e exploração de dados utilizando SAS Enterprise Guide Análise e exploração de dados utilizando Microsoft Excel
ESTRUTURA
Aulas teórico / práticasAVALIAÇÃO
Os conhecimentos da unidade curricular serão alvo de avaliação contínua, de acordo com o seguinte programa:Avaliação Continua*:
Trabalho Prático: 40% da Classificação Final.
Duas Frequências: 60% da Classificação Final (30% Cada). Avaliação 2ª Época**:
Trabalho Prático: 40% da Classificação Final.
Exame Teórico: 60% da Classificação Final da 2ª Época.
*Os alunos só obterão aprovação na avaliação contínua se alcançarem o mínimo de 9,5 valores tanto no projecto como na média das avaliações intercalares.
**Classificação mínima obrigatória de 9,5 em qualquer elemento de avaliação.
CRONOGRAMA DAS
AULAS DE ETL
Semana 9-13 Fev.
Apresentação do Programa da Unidade Curricular de ETL
Apresentação da Equipa Docente e Alunos Regras de Avaliação
O que é um Data Warehouse (DW) Volume de dados
Semana 16 a 20 Fev.
Propriedades e características de um Data Warehouse (DW)
Data Marts
BD Operacionais vs Data Warehouses Optimização e desempenho
Normalização vs Desnormalização Semana
2 a 6 Mar.
Modelos dimensionais: Estrela e Floco de Neve Tabelas de Factos e tabelas de dimensão Semana
9 a 13 Mar.
Identificação do modelo de dados das BD fonte Definição do modelo de dados da DW
Modelo em estrela e dimensões conforme Granularidade dos dados
Exemplo de uma DW de um Banco Semana
16 a 20 Mar.
Inicio do Caso de estudo: DW de uma Cadeia de Hipermercados
Descrição do modelo de dados da BD Operacional Dimensão da BD Operacional
O Conceito de Staging Area
As 3 etapas de um processo ETL (Extract, Transform and Load)
Semana 23 a 27 Mar.
Criação da estrutura da Base de dados num Ambiente Microsoft SQL Server 2005
Criação de Stored Procedures Descrição do comando Bulk Insert Semana
30 Mar. a 03 Abr.
Introdução ao SQL Server Integration Services (SSIS)
Business Intelligence Development Studio (BIDS) O ambiente BIDS
Componentes mais importantes no Integration Services
Exercício: Criação de um SSIS package para o carregamento da Stanging Area
Semana 13 a 17 Abr.
Revisão dos conceitos dos conceitos da linguagem SQL Exercícios Semana 20 a 24 Abr. Exercícios de consolidação Semana 27 Abr. a 01 Mai.
Métodos de acesso e exploração dos dados de um DataWarehouse
On-Line Analytical Processing (OLAP) Termos e conceitos OLAP
Cubos de análise Drill-down e o rollup Slide and dice
Características das aplicações OLAP
Arquitecturas OLAP: MOLAP, ROLAP e HOLAP Ferramentas (produtos) OLAP
Semana 04 a 08 Mai. Realização da 1ª frequência Semana 11 a 15 Mai. Processamento SQL em SAS Instrução PROC SQL
Criação de queries utilizando a instrução PROC SQL
Criação e Manipulação de DataSets utilizando PROC SQL
Semana 18 a 22 Mai.
Criação e manipulação de Macros em SAS Semana
25 a 29 Mai.
Introdução ao SAS Enterprise Guide Acesso a BD relacionais
Criação e manipulação de DataSets Funcionalidades OLAP
Semana 01 a 05 Jun.
BIBLIOGRAFIA
Recomendada: Kimball, R.; Reeves, L.; (2001). The Data Warehouse Lifecycle Toolkit, Wiley
Kimball, R.; Mundy, J.; Thornthwaite, W. (2006). The Microsoft Data Warehouse Toolkit: With SQL Server 2005 and the Microsoft Business Intelligence Toolset, John Wiley & Sons, ISBN: 0471267155
SAS Publishing (2007). SAS Certification Prep Guide: Advanced Programming for SAS 9, SAS Institute, ISBN 13: 978-1-59994-559-0 Alexander, M (2008). Excel 2007 Dashboards & Reports for Dummies,
Wiley Publishing, ISBN: 978-0-470-22814-2
Software:
Microsoft SQL Server 2005:
http://www.microsoft.com/Sqlserver/2005/en/us/default.aspx SAS 9.1: http://www.sas.com/index.html
SAS Enterprise Guide 4: