De SGBD a Gerência de Dados
Carlos A. Heuser
ERBD 2012 Curi5ba
Pesquisa, ensino e trabalho na área de BD
-‐-‐
Passado, presente e futuro
Uma visão pessoal e limitada
Obje>vo
•
Tentar responder a perguntas:
–
Ainda há o que pesquisar em BD?
–
Se sim, quais os temas?
–
O que alguém que quer trabalhar na área deve aprender?
–
O que devemos ensinar?
Roteiro
• Evolução histórica de banco de dados • Evolução da pesquisa na área de BD
– Perfil do pesquisador (ontem) – Evolução dos temas de pesquisa – Perfil do pesquisador (hoje)
Roteiro
• Evolução histórica de banco de dados
• Evolução da pesquisa na área de BD – Perfil do pesquisador (ontem) – Evolução dos temas de pesquisa – Perfil do pesquisador (hoje)
Linha de tempo de BD
6
Pré-‐história (antes de 1970)
•
Limitações de
hardware
→
–
Limitações de
so\ware
•
Baixíssimo nível de abstração
•
Sistemas de gerência de arquivos
Como era a área (70-‐85)
•
Muitos recursos para pesquisa em BD.
Como era a área (70-‐85)
•
Muitos recursos para pesquisa em BD.
•
Muitos grupos de BD espalhados pelo mundo.
Como era a área (70-‐85)
•
Principal resultado:
– Modelo de dados relacional de Codd (IBM) – Técnicas para implementá-‐lo
Principais resultados da pesquisa
(70 a 85)
•
Teoria de banco de dados
– resultou na formalização do modelo relacional
•
SQL
– linguagem declara5va de programação
•
O5mização de consultas
Principais resultados da pesquisa
(70 a 85)
•
Gerência de transações
– algoritmos eficientes para concorrência e reconstrução suportando grandes bases e grande número de usuários
Primeiros protó>pos e produtos
•
System R (IBM)
Primeiros protó>pos e produtos
•
System R (IBM)
•
INGRES (Berkeley)
Indústria de soTware de BD
•
Pesquisas na área de BD resultaram em uma importante
indústria de so\ware.
•
2007 (IDC):
– US$ 19 bilhões Oracle 45% IBM Microso\ 15% OutrosIndústria de soTware de BD
•
Mercado de SGBDs
parou de crescer
.
•
Grandes usuários de SGBD já o adquiriram:
sistemas legados
.
•
Novos usuários:
– Grande crescimento de bases de dados baseadas em so\ware livre
(MySQL, PostgreSQL).
SGBD omnipresente
•
Originalmente:
– SGBD era u5lizado em sistemas de informação gerenciais
•
Hoje:
– SGBD tornou-‐se sistema de arquivos de alto-‐nível
– Aparece em todo 5po de aplicações
SGBD omnipresente
•
Originalmente:
– SGBD era u5lizado em sistemas de informação gerenciais
•
Hoje:
– SGBD tornou-‐se sistema de arquivos de alto-‐nível
Roteiro
• Evolução histórica de banco de dados • Evolução da pesquisa na área de BD
– Perfil do pesquisador (ontem)
– Evolução dos temas de pesquisa – Perfil do pesquisador (hoje)
Perfil dos pesquisadores
•
Theory guys
O que era necessário saber para
pesquisar na área
•
Theory guys
– Uma boa base de lógica matemá5ca
– Muitos pesquisadores de teoria de BD oriundos da área de
teoria da computação
O que era necessário saber para
pesquisar na área
•
System guys
– Sistemas operacionais
– Rudimentos de arquitetura de computadores (principalmente, disposi5vos de armazenamento)
– Linguagens de programação e compiladores (?)
Áreas de pesquisa compar>mentadas
•
Mesmo ocorria em outras áreas clássicas da Computação
(Redes, Linguagens de programação, Sistemas
distribuídos,. . . ).
26
•
Áreas de pesquisa eram bem
compar5mentadas
•
Pouca cooperação entre
pesquisadores de áreas
diferentes
Roteiro
• Evolução histórica de banco de dados • Evolução da pesquisa na área de BD
– Perfil do pesquisador (ontem)
– Evolução dos temas de pesquisa
– Perfil do pesquisador (hoje)
Como era a pesquisa
•
Temas
das sessões das conferências:
–
1975-‐1984
–
SIGMOD
–
VLDB
Temas de sessões SIGMOD e VLDB pré-‐85
•
nuvem de termos
que aparecem nos
otulos de sessões
•
foram
excluídas
:
§
stop words
§ palavras muito comuns que não
caracterizam o tema de pesquisa:
Temas de sessões SIGMOD e VLDB pré-‐85
Temas de sessões SIGMOD e VLDB pré-‐85
1980 – perfil das publicações
•
Ar5gos analisados:
– SIGMOD'1980 (20 ar5gos)
– VLDB'1980 (30 ar5gos)
1980 – perfil das publicações
•
Ar5gos analisados:
– SIGMOD'1980 (20 ar5gos)
1980 – perfil das publicações
•
Ar5gos foram classificados em:
–
Formal
: validação da proposta através de algum
formalismo
–
Experimentos
: validação experimental
–
Es5ma5va/simulação
: validação através de um modelo
matemá5co ou de simulação
–
Comparação
: ar5go situa a proposta dentro do estado-‐da-‐
arte
•
Um ar5go pode estar em mais de uma classe
•
Ar5gos em nenhuma das acima:
Só descrição
1980 – perfil das publicações
Só descrição Formal Comparação Es5ma5va/simulação Experimentos1980 – perfil das publicações
38 Só descrição Formal Comparação Es5ma5va/simulação Experimentos 0% 10% 20% 30% 40% 50% 60%Ar5gos
descreviam
implementações,
linguagens,
modelos ou
sistemas
Temas de sessões SIGMOD e VLDB (86-‐95)
Temas de sessões SIGMOD e VLDB (86-‐95)
42
linguagens e modelos também
Temas de sessões SIGMOD e VLDB (86-‐95)
44
aparece OO ...
85-‐95 -‐ Aplicações
•
So\ware de banco de dados para aplicações “
não-‐
convencionais
”:
– aplicações de projeto (engenharia), – bases de dados espaciais,
– aplicações de tempo real, – . . .
1995 – perfil das publicações
•
Ar5gos analisados:
– SIGMOD 95 (20 ar5gos)
1995 – perfil das publicações
48 Só descrição Formal Comparação Es5ma5va/simulação Experimentos 0% 10% 20% 30% 40% 50% 60% 70% 80% 1995 19801995 – perfil das publicações
Só descrição Formal Comparação Es5ma5va/simulação Experimentos 1995 1980 Ar5gos: • relacionam otrabalho com o de outros;
• baseados em
experimentos e/ou modelos analí5cos.
Fase adulta (1996 -‐ ...)
Temas de sessões SIGMOD (99-‐09)
52
Temas de sessões SIGMOD (99-‐09)
54
Temas de sessões SIGMOD (99-‐09)
56
quebrando paradigmas: ..., streams
99-‐.. -‐ Temas de pesquisa
•
Mineração de dados
– em conjunto com pesquisadores de outras áreas:
• IA
• aprendizagem de máquina
•
Skyline queries,
approximate queries
,
en:ty-‐resolu:on
, ...
– com um pé em:
• recuperação de informações e
• aprendizagem de máquina
2011 -‐ Temas de pesquisa
•
Databases on new hardware
–
Memórias
flash
(disposi5vos com caracterís5cas diferentes
que os HDs)
•
Cloud compu:ng, Web databases
2005 – perfil das publicações
60 Só descrição Formal Comparação Es5ma5va/simulação Experimentos 0% 20% 40% 60% 80% 100% 120% 2005 1995 1980•
20 ar5gos do SIGMOD'2005 foram examinados.
2005 – perfil das publicações
Formal Comparação Es5ma5va/simulação Experimentos 2005 1995 1980Roteiro
• Evolução histórica de banco de dados • Evolução da pesquisa na área de BD
– Perfil do pesquisador (ontem) – Evolução dos temas de pesquisa
– Perfil do pesquisador (hoje)
O que é necessário saber para
pesquisar na área
•
Tudo que já era necessário
conhecer anteriormente:
– Uma boa base de Lógica Matemá5ca – Teoria de BD
– Sistemas operacionais – Compiladores
– Base de matemá5ca discreta
– Rudimentos de arquitetura de computadores (principalmente, disposi5vos de armazenamento)
O que é necessário saber para
pesquisar na área
•
..., e
muito mais
:
–
Uma base mais ampla de Matemá5ca (volumes de
dados envolvidos =
métodos aproximados
):
•
álgebra, cálculo,
estaos5ca
...
–
Algorítmica
(foco não é mais somente o número de
acessos a disco);
–
Parlelismo
;
–
Recuperação de informações
;
–
Aprendizagem de máquina
, . . .
O que é necessário saber para
pesquisar na área
•
Método
experimental
:
– Reproduzibilidade dos experimentos – Exemplo:
Roteiro
• Evolução histórica de banco de dados • Evolução da pesquisa na área de BD
– Perfil do pesquisador (ontem) – Evolução dos temas de pesquisa – Perfil do pesquisador (hoje)
Papéis no mercado (extremos)
operário
engenheiro
Operário
•
Função:
operário
da fábrica de sistemas de informação
– Tarefas repe55vas
– Uso de ferramentas existentes – Pouca cria5vidade
Engenheiro
•
Engenheiro
de so\ware
– Projeta e constrói soluções para novas aplicações – Boa base conceitual
Usuário avançado
•
Atua em outras áreas (medicina, engenharia,
arquitetura,...)
– Projeta e constrói soluções para novas aplicações
– Pouco conhecimento de computação – grande conhecimento de seu domínio de problema
Tendências no mercado
•
EUA prevê
declínio no seu mercado de trabalho
de TI
nesta área:
– Migração para países em desenvolvimento
– So\wares que automa5zam o desenvolvimento – Até quanto vai?
Tendências no mercado (EUA)
Tendências no mercado (Canadá)
Jobs With a Less-‐Than-‐Stellar Future
Despite the rosy forecasts for technical workers men:oned earlier, some posi:ons, par:cularly in technical support (help desk) or
computer programming, are seen as vulnerable to outsourcing.
Ontario Job Futures points out that employment for computer
programmers is expected to grow more slowly than for other computer-‐related occupa:ons because the programs can be
transmiIed digitally, meaning that the work can be done anywhere in the world.
(Toronto’s Online Employment Center, 2011)
Roteiro
• Evolução histórica de banco de dados • Evolução da pesquisa na área de BD
– Perfil do pesquisador (ontem) – Evolução dos temas de pesquisa – Perfil do pesquisador (hoje)
• Mercado de trabalho na área de TI ( e na de BD )
Conclusões (temá>ca)
•
A área de banco de dados
deixou de tratar apenas o
armazenamento de grandes bases de dados.
•
O foco da pesquisa na área é:
– tratamento de grandes massas de dados em geral (não necessariamente persistentes);
– tratamento de dados que tenham alguma estrutura.