• Nenhum resultado encontrado

2.2 Interoperabilidade de Dados

2.2.2 Integra¸c˜ ao de Dados

Nesse cen´ario de heterogeneidade de dados surge a ideia de Integra¸c˜ao de Dados com o objetivo de superar o problema da heterogeneidade (em todas as formas) e permitir a manipula¸c˜ao de dados de maneira transparente entre as diversas fontes.

Figura 2.4: Sistemas de Integra¸c˜ao de Dados Centralizado. Adaptado de (Lenzerini, 2010)

Segundo Cruz e Xiao (2005), existem dois tipos diferentes de sistemas: Sistemas de Integra¸c˜ao de Dados Centralizado (Figura 2.4) e Sistemas de Integra¸c˜ao de Dados Peer- to-Peer (Par a Par) (Figura 2.5). O primeiro possui um esquema global que permite ao usu´ario acessar as informa¸c˜oes armazenadas nas fontes de dados por uma interface uniforme. No segundo, por sua vez, n˜ao existem pontos globais para o controle dos dados, cada par pode receber requisi¸c˜oes dos usu´arios sobre qualquer informa¸c˜ao distribu´ıda no sistema.

Nas duas abordagens, mapeamentos s˜ao usados para a conex˜ao entre as fontes de dados e os esquemas (global ou do par) nos quais as consultas s˜ao realizadas.

Por exemplo, na Figura 2.4 o usu´ario faz uma consulta no esquema global que atrav´es de mapeamentos recupera os dados direto nas fontes. Na Figura 2.5, por sua vez, existem cincos pares (p1 a p5) e cada um pode receber uma consulta de algum usu´ario atrav´es do esquema do par. Os dados para responderem essa consulta podem estar em uma fonte local, que ´e conectada ao esquema do par por mapeamentos locais; ou podem estar em uma fonte externa, que ´e conectada com o esquema do par atrav´es de mapeamentos p2p. Ainda no processo de construir um sistema de integra¸c˜ao de dados, existem abor- dagens distintas para construir esses mapeamentos: O Global-as-View (GaV) onde cada entidade no esquema global ´e definida por consultas sob as fontes de dados. Nessa aborda- gem, estrat´egias de busca s˜ao simples, mas a evolu¸c˜ao das fontes locais n˜ao s˜ao facilmente

Figura 2.5: Sistemas de Integra¸c˜ao de Dados Par-a-Par. Adaptado de (Lenzerini, 2010)

suportadas; o Local-as-View (LaV), onde as entidades locais s˜ao definidas por consultas sob o esquema global. Nessa abordagem ´e permitida a mudan¸ca das fontes locais sem afetar o esquema global, mas o processamento de busca pode ser mais complexo (Cruz e Xiao, 2005; Calvanese et al., 2011); e o Global-Local-as-View (GLAV), uma aborda- gem mista onde as rela¸c˜oes entre o esquema global e as fontes s˜ao estabelecidas usando defini¸c˜oes GAV e LAV (Lenzerini, 2002).

A integra¸c˜ao semˆantica de dados ´e o processo de usar uma representa¸c˜ao conceitual dos dados e suas rela¸c˜oes (uma ontologia) para eliminar as poss´ıveis heterogeneidades. Existem trˆes diferentes abordagens para o uso de ontologias no problema de Integra¸c˜ao de Dados, resumidas na Figura 2.6 (Cruz e Xiao, 2005; Wache et al., 2001; Uzdanaviciute e Butleris, 2011):

ˆ Abordagem de Ontologia ´Unica: Os esquemas de todas as fontes s˜ao diretamente relacionados a uma ontologia global e compartilhada, que ´e respons´avel pela inter- face uniforme com o usu´ario. Esse tipo de abordagem requer que todas as fontes possuam uma vis˜ao semelhante do dom´ınio;

ˆ Abordagem de M´ultiplas Ontologias: Cada fonte de dados ´e descrita por uma on- tologia local. Ao inv´es de usar uma ontologia comum, as ontologias locais s˜ao ma- peadas entre elas. Para essa abordagem, um formalismo de representa¸c˜ao adicional faz-se necess´ario para a defini¸c˜ao do mapeamento entre as ontologias;

ˆ Abordagem H´ıbrida: ´E a combina¸c˜ao das duas abordagens anteriores. Uma on- tologia local tamb´em ´e constru´ıda para cada fonte de dados, mas buscando fazer essas ontologias similares, elas s˜ao constru´ıdas em cima de uma ontologia global e compartilhada. Nessa abordagem novas fontes podem ser adicionadas facilmente sem a necessidade de modificar os mapeamentos existentes.

2.2 INTEROPERABILIDADE DE DADOS 21

Figura 2.6: Os trˆes Tipos de Abordagem de Ontologias na Integra¸c˜ao de Dados. Adaptado de (Wache et al., 2001)

apropriadas nos casos de sistemas centrais de integra¸c˜ao de dados, sendo ontologia ´unica indicada para sistemas GaV e h´ıbrida para sistemas LaV. Abordagens h´ıbridas tamb´em podem ser usadas em sistemas de integra¸c˜ao par-a-par quando existe uma ontologia global funcionando como “super-par”. Nos casos de par-a-par puro, sem a existˆencias de “super- pares”, a abordagem de m´ultiplas ontologias ´e a mais indicada.

Em (Cruz e Xiao, 2005) destacam-se tamb´em cinco tipos de uso para ontologias na integra¸c˜ao de dados. S˜ao eles:

ˆ Representa¸c˜ao de Metadados: usar uma ontologia local e particular para representar os metadados (ou esquema) de cada fonte de dados;

ˆ Conceitualiza¸c˜ao Global: uma ontologia global fornece uma vis˜ao conceitual sob as fontes de dados heterogˆeneas;

ˆ Suporte a Consultas de Alto N´ıvel: um usu´ario faz uma consulta utilizando a ontologia global, sem precisar de conhecimento espec´ıfico sobre as diferentes fontes de dados. Isso ´e reescrito em consultas sob as fontes locais tomando como base os mapeamentos entre a ontologia global e as fontes de dados. O resultado retorna e, ent˜ao, ´e apresentado ao usu´ario;

ˆ Media¸c˜ao Declarativa: caso parecido com o item anterior, mas levando-se em consi- dera¸c˜ao um sistema par-a-par h´ıbrido onde a ontologia global ser´a o mediador para a reescrita das consultas entre os pares;

ˆ Suporte a Mapeamentos: uma esp´ecie de dicion´ario, formalizado nos termos de uma ontologia para facilitar o processo de mapeamento.

O trˆes primeiros itens est˜ao no contexto de abordagens de integra¸c˜ao de dados cen- tralizados, enquanto os dois ´ultimos est˜ao no contexto de abordagens de integra¸c˜ao de dados par-a-par.

Documentos relacionados