• Nenhum resultado encontrado

Sistemas de Apoio à Decisão (SAD) Decision Support Systems

N/A
N/A
Protected

Academic year: 2021

Share "Sistemas de Apoio à Decisão (SAD) Decision Support Systems"

Copied!
22
0
0

Texto

(1)

Sistemas de Apoio à Decisão

(SAD)

Decision Support Systems

Andreas Wichert

MEIC / MERC Tagus

(Página da cadeira: Fenix)

Objectivo Geral

 

Acumular

informação

para produzir

indicadores

de negócio

que permitam tomar

decisões

 

Extracção de

conhecimento interessante

(regras, padrões, restrições) dos dados

existentes em grandes BDs

(2)

Corpo docente

 

Andreas Wichert - Teóricas

 andreas.wichert@ist.utl.pt  tel: 214233231  room: N2 5-7  

- Laboratórios

 Andreas Wichert

Horário de dúvidas

 

3ª-feira (Tuesday), 14H-18H, 2-N5.7

(3)

Organização das aulas

 

Teóricas

:

 Matéria (slides baseados no livro e artigos)  Apresentação de pessoas externas

 

Práticas/Laboratório

:

 Exercícios

 Utilização do SQL Server 2008 / Windows 7  Ínicio: 27/2

 Grupos: número de alunos 3

Avaliação

 

A Nota Final (NF) é dada por:

NF = 6.5% (1)NDW +6.5% (2)NDW+6.5% (3)NDW+6.5% (4)NDW+ 6.5% (5)NDM+6.5% (6)NDM+6.5% (7)NDM+6.5% (8)NDM+

48 % NE

(4)

Exame

 

1º exame: 12 de Junho

 

2º exame: 28 de Junho

Data Mining:


(5)

Reconhecimento

 

Prof. Jiawei Han

 hanj@cs.uiuc.edu

 

University of Illinois at Urbana-Champaign

 

http://www-sal.cs.uiuc.edu/~hanj/

 

Slides:

 

http://www-sal.cs.uiuc.edu/~hanj/bk2/

Bibliografia - DW

 

Data Mining: Concepts and Techniques,

J. Han & M. Kamber, Morgan Kaufmann,

2001

 

The Data Warehouse Toolkit, 2nd ed,

(6)

Bibliografia - DM

  Machine Learning, T. Mitchell, 1997

  Reconhecimento de padrões métodos estatísticos e neuronais, JORGE SALVADOR MARQUES, 1999, IST-press, http://istpress.ist.utl.pt/lrecpad.html

  Artificial ,Intelligence - A Modern Approach, Second Edition, S. Russel and P. Norvig, Prentice Hall, 2003

  Artificial Intelligence - Structures and Strategies for Complex Problem Solving, Second Edition, G. L. Luger and W. A. Stubblefield, Benjamin/Cummings Publishing, 1993

 

Relational Data Base: Data collection

  Extraction of interesting (non-trivial, implicit, previously unknown

and potentially useful) patterns or knowledge from huge amount of data (interesting patterns?)

(7)

 

How to represent data?

 

By a coordinate system!

(8)

Multidimensional databases

 

A Cartesian coordinate system is

determined

 

By its dimensions

• Time, place, “product”, “costumer”

 

By its value

• Sales in € or $, …

 

By the resolution

(9)

 

Our coordinate system is defined by our

Data Base

 

What can we do?

 

Look at the data

 

Project the data

• collapse some dimensions, how to do it?

 

Change the resolution

(10)

 

For two dimensions

 

Spreadsheet (Excel) with spreadsheet

formulas calculations

 

For more than two dimensions

 

We will require several spreadsheet tables

 

-> Data explosion

 

We will look for one “Excel” table with

several dimensions

First Part – data warehouse

 

Mapping of data represented in a data

base into a coordinate system..

(11)

Second part - Data Mining

 

Statistics

 

t-test, linear regression

 

Feature extracting

 

PCA

 

Machine Learning 

Feature / Vector space

  Sample

x

(1)

,

x

(2)

,..,

x

(k )

,..,

x

(n )

{

}

x =

x

1

x

2

..

∈ ℜ

d

x −

y =

(x

i

− y

i

)

2 d

(12)
(13)

What is machine Learning?

 

Parallels between “animals” and machine

learning

 

Many techniques derived from efforts of

psychologist / biologists to make more

sense “animal” learning through

computational models

Machine Learning

 

Changes in the system that perform tasks

associated with AI

 

Recognition

 

Prediction

(14)
(15)

 

We might add other features that are not

correlated with the ones we already have. A

precaution should be taken not to reduce the

performance by adding such “noisy features”

(16)

 

However, our satisfaction is premature

because the central aim of designing a

classifier is to correctly classify novel input 


(17)

 

We could use several tools

 

MySQL & Pentaho & Matlab & S & R & ….

• http://www.pentaho.com/

• http://www.cs.waikato.ac.nz/ml/weka/

(18)

Bibliografia SQL Server 2008

 

Microsoft SQL Server 2008 Tutorial

 

Microsoft SQL Server online Books

Some Information about 


SQL Server

  General Information about SQL Server:

  http://en.wikipedia.org/wiki/Microsoft_SQL_Server

  http://technet.microsoft.com/en-us/sqlserver/default.aspx

  Data Mining and SQL Server:

(19)

  We will use SQL Server 2008 (Windows 7)

(we will NOT use SQL Server 2008 R2)

  General Information:

  http://msdn.microsoft.com/en-us/library/bb545450.aspx   Microsoft SQL Server 2008 Books Online (October 2009)

  http://www.microsoft.com/downloads/en/details.aspx?

FamilyId=765433F7-0983-4D7A-B628-0A98145BCB97&displaylang=en

  Adventure Works example database

(SQL Server 2008 SR4):

Adventure Works example database: Sample Databases for Microsoft SQL Server 2008 (December 2009) Samples Refresh 4

  http://msftdbprodsamples.codeplex.com/releases/view/37109

Programa

  Datawarehouse (DW) e Sistemas de Apoio à Decisão

  Operações OLAP (Online Analytical Processing)

  Modelo multidimensional vs modelo relacional, Teoria da normalização do modelo relacional

(20)

Programa

  Pré-processamento, transformação e limpeza de dados

  Exploração de dados (data mining)

  Descrição de conceitos e generalização de dados

  Regras de associação

  Redes bayesianas

  Árvores de decisão

  Classificação baseada em instâncias   Análise de clusters

  Redes neuronais

Informação necessária para apoio

à decisão

 

Características

requeridas para a informação

utilizada para a tomada de decisão:

  precisa

(21)

Sistemas operacionais

 

Contabilidade, compras, reservas,

telecomunicações, etc

 

Muitas fontes de dados dispersas (ficheiros

excel, BD Access) de suporte a aplicações do

tipo: SAP, ERPs, etc

 

Alguns

problemas

: acesso aos dados díficil,

qualidade de dados duvidosa, dados

estruturados à aplicação (ex: códigos

específicos), suporte a interrogações simples

Conceito de um DW

 

Conjunto centralizado de dados:

  temáticos   históricos   datados   integrados

(22)

Arquitectura geral SAD

Data Sources Operational DBs other sources Analysis Query Reports Data mining Front-End Tools OLAP Engine Serve OLAP Server Data Warehouse Extract Transform Load Refresh Metadata Data Marts Data Storage

What is Data Mining ?


Referências

Documentos relacionados

Para o desenvolvimento deste trabalho foram realizados dois experimentos, com o in- tuito de avaliar o sistema proposto. No primeiro foi feito uma classificac¸˜ao com toda a base

Atividades enquadradas como projetos especiais de empreendimento de impacto, conforme arts.. Comércio Atacadista Comércio Varejista Prestação

Se o desliga- mento não acontecer e o manômetro de aço inoxidável continua a indicar a pressão total, isso pode dever-se a fuga na bomba de alta pressão, no comutador de pressão,

f) Fotocópia da Autorização/Procuração para o Banco Central que deve ser preenchida com LETRA LEGÍVEL e assinada conforme documento de identidade por todos os integrantes

(C) A agroindústria do açaí de Codajás não servirá de modelo ainda que os pequenos produtores e trabalhadores da lavoura do açaí recebam pagamento injusto.. (D) A agroindústria

É concedido aos empregados beneficiados por esta convenção coletiva, não contemplados com os reajustes disciplinados nas cláusulas anteriores (Vigilantes e Auxiliares

9.1 - A não comunicação do evento no prazo de 90 dias, por culpa exclusiva das empresas, implicará para a empresa na obrigação do reembolso à gestora ou ao sindicato

Aos empregados afastados do serviço por motivo de doença ou acidente do trabalho, a EMPRESA concederá, por um período de até 180 (cento e oitenta) dias, a complementação de