Grupo de Banco de Dados da UFSC
(GBD / UFSC)
Oportunidades de Pesquisa e TCCs
GBD/UFSC
Objetivo
Pesquisa e desenvolvimento de soluções para problemas de gerenciamento de dados
LISA –
Laboratório para Integração de Sistemas e Aplicações Avançadas
Corpo Docente
Ronaldo S. Mello Dr., UFRGS, 2002
Pos-doc, University of Utah, 2010 www.inf.ufsc.br/~ronaldo Renato Fileto Dr., UNICAMP, 2003 www.inf.ufsc.br/~fileto Carina F. Dorneles Dra., UFRGS, 2006 www.inf.ufsc.br/~dorneles Vania Bogorny Dra., UFRGS, 2006
Pos-doc, Hasselt Univ., 2007 Pos-doc, UFRGS, 2008
Carina F. Dorneles
Carina – Temas de Trabalho
1. Banco de Dados
Ferramentas que auxiliem tarefas de gerenciado de SGBDs Ferramentas que utilizem o SGBD como fonte de dados
2. Gerência de Dados na Web
Ferramentas que auxiliem o acesso a dados na Web
Ferramentas que usem os dados disponibilizados na Web
Carina – Proposta de TCC 1
Titulo: Sistema Web para divulgação de ofertas de
estágios, empregos, bolsas de pesquisa, etc.
Ter conhecimentos em: banco de dados, alguma linguagem
para Web
Resumo: desenvolver uma aplicação que auxilie a divulgação e
procura de estágios, empregos, bolsas de pesquisa, etc. O sistema deverá ser capaz de mostrar ao estudante interessado uma lista ranqueada de oportunidades, de acordo com seus tópicos de interesse.
Carina – Proposta de TCC 2
Titulo: Sistema Web para inscrição e classificação de
alunos no PPGC.
Ter conhecimentos em: banco de dados, alguma linguagem
para Web
Resumo: desenvolver uma aplicação que auxilie a inscrição de
candidatos ao mestrado na PPGCC. O sistema deverá ser capaz de efetuar inscrição, classificar alunos dentro de grupos de pesquisa, associar alunos a professores (dependendo do tema e grupo escolhidos), gerar rankings, etc.
Carina – Proposta de TCC 3
Titulo: Desenvolvimento de uma ferramenta para auxílio
na auditoria de Banco de dados
Ter conhecimentos em: Banco de dados e alguma linguagem
de programação
Resumo: desenvolver uma ferramenta para auxílio na auditoria
de BD (multi-SGBD, free). A ferramenta deve ser capaz de gerenciar todas as ações efetuadas por usuários sobre o SGBD, e gerar gráficos a respeito delas.
O aluno deverá fazer um levantamento de trabalhos relacionados ao
tema.
Carina – Proposta de TCC 4
Titulo: Avaliação de ferramentas para benchmark para
integração de dados (XML e relacionais)
Ter conhecimentos em : XML e banco de dados
Resumo: baixar várias ferramentas de Benchmark e avaliar o
que cada uma delas faz, e qual o objetivo principal de cada uma. Depois, o aluno deve elencar características importantes e avaliar qual ferramenta tem ou não tal característica.
Para começar, algumas ferramentas: THALIA, DIPBench,
STBenchmark, XBenchMatch
Carina – Proposta de TCC 5
Titulo: Ferramenta para construção de um Banco de
Dados com dados duplicados
Ter conhecimentos em: banco de dados e alguma linguagem
de programação
Resumo: desenvolvimento de uma ferramenta que possibilite a
população de um BD com dados duplicados, estruturados e não-estruturados. O BD será usado posteriormente para execução de algoritmos construídos para detecção de similaridade de dados. A ferramenta deve ser capaz de permitir ao usuário a criação de esquemas e a posterior detecção e extração de dados na Web que estejam de acordo com este esquema
Carina – Proposta de TCC 6
Titulo: Ferramenta para consulta por similaridade em
documentos XML
Ter conhecimentos em: XML e alguma linguagem de consulta
Resumo: construir uma ferramenta, com interface amigável,
que possibilite a consulta por similaridade a documentos XML. A ferramenta deve prever a consulta por palavra-chave e a apresentação de um resultado ranqueado.
Carina – Proposta de TCC 7
Titulo: Ferramenta para indexação por similaridade em
documentos XML
Ter conhecimentos em: XML e alguma linguagem de consulta
Resumo: construir uma ferramenta que implemente um
algoritmo de indexação por similaridade, usando alguma estrutura de indexação que prevê o acesso aos dados por similaridade. A ferramenta deve permitir a execução paralela da indexação dos documentos XML.
Ronaldo dos Santos Mello
Ronaldo – Temas de Pesquisa
Gerência de Dados na Web
extração, armazenamento, indexação e consulta
dados de diversas naturezas e com diferentes níveis
de estruturação:
* Web forms (“hidden Web”) * Web tables
* Wikipedia
* Google square * XML
Ronaldo – Temas de Pesquisa
Matching de Dados
- Problemática: fontes com dados idênticos e com representações heterogêneas
- Aplicações: acesso integrado, consultas por similaridade, data cleaning, …
- Dados de diversas naturezas: * Tabelas relacionais
* Geográficos * XML
Ronaldo – Temas de Pesquisa
Gerência de Dados Não-Convencionais
XML, geográficos, temporais, …
Foco principal: projeto/modelagem, restrições de
integridade, ...
Ferramentas de apoio ao ensino de BD
Exemplos: modelagem de dados, simuladores de
SGBDs, interfaces gráficas de consulta para aprendizado
de linguagens de acesso a BDs, normalização,
Renato Fileto
Fileto – Temas de Pesquisa
Web semântica
catalogação e recuperação de informação usando
ontologias, anotações semânticas e informação de contexto de usuários
BDs para suporte a decisão
modelos, padrões, ferramentas e aplicações de
Sistemas de Informação Geográfica (SIG) e Data Warehouses (DWs) espaciais e temporais para análise de informação de redes complexas
Processos sobre a Web
processos de negócios e workflows científicos usando
Universidade Aberta do SUS
Universidade Aberta do SUS
Análise de Redes Complexas
(tráfego)
Densidade do tráfego em Milão ao longo dos horários do dia (acima) e dias da semana (abaixo) (Leonardi et al. 2010)
Fileto – Oportunidades de TCC
Anotação e recuperação de informação usando conhecimento
da área médica (1 vaga)
Adaptação de conhecimento de domínio (e.g., vocabulário DeCS
-Descritores em Ciência da Saúde – na área médica)
Interfaces gráficas avançadas para navegação no conhecimento e anotação de recursos de informação
Busca semântica e composição de recursos
Estudos de caso junto ao UnaSUS (Universidade Aberta do SUS – Ministério da Saúde) e ao laboratório de Telemedicina
Análise de informação de redes complexas em DWs espaciais (2 vagas)
Implementação de framework conforme modelo proposto em artigo Estudos de caso nas área de energia elétrica (smart grids) e análise
de dados de trânsito (usando informações sobre tragetórias) para inferir distribuição dos dados
Fileto – Caracteristicas dos Alunos
Estar iniciando a disciplina introdução a projetos (ou
antes)
Vontade de trabalhar e produzir coisas úteis e inovações Capacidade comprovada por boas notas em disciplinas e
bom desempenho em possíveis projetos anteriores
Motivação, iniciativa e certa autonomia para
desenvolvimento do trabalho
Responsabilidade e disponibilidade Domínio de inglês
Habilidade de escrita e expressão das idéias
Capacidade de trabalhar em grupo, desenvolvendo
Vânia
– Temas de pesquisa
Sistemas de Informação Geográfica
permite e facilita a análise, gestão ou representação
do espaço e dos fenômenos que nele ocorrem
Data Mining Espaço-temporal
Extrair dados de sistemas espaço-temporais
Modelagem de Dados Espaciais
Qual a melhor maneira de representar as
Vânia – Pesquisa atual
Foco
: Trajetórias de Objetos Móveis
Dispositivos móveis deixam traços digitais que podem ser
coletados como trajetórias, descrevendo a mobilidade de seus usuários
Algumas Aplicações
Rastreamento de Veículos
Transportadoras monitoram seus caminhões
Trânsito
Quais são as áreas/trajetos mais congestionados na cidade?
Controle de Barcos de Pesca
Barcos estão pescando em áreas onde realmente deveriam
Vânia – Pesquisa atual
Análise e Mineração de Trajetórias
Desenvolvimento de ferramentas de análise e mineração de
dados geográficos e de trajetórias (extensão da ferramenta
de mineração Weka)
Elaboração de algoritmos de mineração de trajetórias que
considerem informações semânticas e de contexto
Desenvolvimento de interfaces para visualização de padrões
de trajetórias.
Desenvolvimento de linguagens de consulta e mineração de
trajetórias
Orientadores do GBD/UFSC
Ronaldo S. Mello - http://www.inf.ufsc.br/~ronaldo
e-mail: ronaldo@inf.ufsc.br
Renato Fileto - http://www.inf.ufsc.br/~fileto
e-mail: fileto@inf.ufsc.br
Carina F. Dorneles - http://www.inf.ufsc.br/~dorneles
e-mail: dorneles@inf.ufsc.br
Vania Bogorny - http://www.inf.ufsc.br/~vania