• Nenhum resultado encontrado

PROCESSAMENTO MULTIDIMENSIONAL E

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE

Figura 4.8 Exemplo Fun¸c˜oes Hol´ısticas com Retorno Espacial

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE

Baseado no DWG formalmente definido na Se¸c˜ao 4.2, v´arios cubos de dados podem ser in- stanciados. Dessa forma, a seguir, apresentamos o modelo GeoMDCube (Geographic and Mul- tidimensional Cube) [81], o qual inclui defini¸c˜oes formais para dimens˜oes, hierarquias, n´ıveis, dimens˜oes geogr´aficas, cubo de dados e fun¸c˜oes de agrega¸c˜ao.

Defini¸c˜ao 8 (N´ıvel). Dado um Data Warehouse Geogr´afico GDW = (DT, F T ), um n´ıvel l ´e um atributo de uma dt∈ DT ou de uma ft ∈ F T .

Cada dimens˜ao em um cubo de dados ´e definida por um conjunto de hierarquias sobre um conjunto de n´ıveis, atributos ou valores de geometria. Uma defini¸c˜ao mais precisa destes conceitos ´e dada a seguir.

Defini¸c˜ao 9 (Esquema de Dimens˜ao). Dado um Data Warehouse Geogr´afico GDW = (DT, F T ) um esquema de dimens˜ao DS ´e um conjunto parcialmente ordenado

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE 57

(X∪ {All}, ≤), no qual:

(i) X ´e um conjunto de n´ıveis ou X ´e um conjunto de atributos ou valores de geometrias em uma dt∈ DT ou em uma ft ∈ F T ;

(ii)≤ define o relacionamento de ordena¸c˜ao parcial entre os elementos de X;

(iii) All ´e um valor adicional, o qual ´e o maior elemento do conjunto parcialmente ordenado (X∪ All, ≤), i.e. x ≤ All para todo x ∈ X;

Na Figura 4.9 temos um exemplo de esquema de dimens˜ao. A Figura 4.9-(A) mostra a tabela dimens˜ao convencional d tempo2 (que pode substituir a tabela d tempo no DWG de exemplo apresentado na Figura 4.2 ). Por sua vez, a Figura 4.9-(B) exibe o esquema de dimens˜ao para esta tabela dimens˜ao do DWG. Como pode ser observado, existe uma hierarquia impl´ıcita entre os elementos envolvidos (i.e. dia, mes, trimestre, semetre e ano).

Figura 4.9 Exemplo de Esquema de Dimens˜ao

Defini¸c˜ao 10 (Membros). Dado um esquema de dimens˜ao DS (X∪ {All}, ≤), no qual X ´e um conjunto de n´ıveis. Cada n´ıvel li ∈ X ´e um conjunto de membros (tamb´em chamados de membros do n´ıvel). Os membros de li s˜ao os valores de atributo dos atributos que definem o n´ıvel li juntamente com os membros pertencentes a todos os n´ıveis ljtal que lj∈ X e lj> li. Se o menor n´ıvel em X possuir uma geometria associada, ent˜ao a geometria ´e adicionada a seus membros. Neste caso, n´os dizemos que os membros s˜ao geogr´aficos, caso contr´ario, os membros s˜ao chamados de convencionais. Al´em disso, se um membro de um n´ıvel l ´e geogr´afico, ent˜ao

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE 58

todos os membros de l s˜ao geogr´aficos e n´os dizemos que l ´e geogr´afico, caso contr´ario l ´e chamado convencional.

Exemplos para as defini¸c˜oes de membro convencional e geogr´afico s˜ao dados na Figura 4.10- (A) e Figura 4.11-(A), respectivamente.

Defini¸c˜ao 11 (Hierarquia). Uma hierarquia h ´e uma cadeia em um esquema de dimens˜ao DS = (X ∪ {All}, ≤). Em outras palavras, uma hierarquia h ´e um subconjunto totalmente ordenado de um DS. Se o conjunto X de DS ´e um conjunto de n´ıveis, n´os dizemos que a hierarquia ´e baseada em n´ıveis, caso contr´ario, a hierarquia ser´a baseada em valores. Adicional- mente, se h ´e baseada em valores e seus elementos s˜ao do tipo TG, n´os dizemos que a hierarquia ´e geogr´afica. Se h ´e baseada em n´ıveis, e pelo menos um n´ıvel da hierarquia h for geogr´afico, ent˜ao dizemos que a hierarquia ´e geogr´afica.

Na Figura 4.9 exemplificamos a defini¸c˜ao de hierarquias. Como pode ser observado, na (Figura 4.9-(B)) ´e mostrado o esquema de dimens˜ao para a tabela dimens˜ao convencional d tempo2 (Figura 4.9-(A)). Dessa forma, com base neste esquema de dimens˜ao, podem ser criadas diversas hierarquias, algumas s˜ao listadas na Figura 4.9-(C).

Defini¸c˜ao 12 (Dimens˜ao). Dado um esquema de dimens˜ao DS = (X∪ {All}, ≤) uma di- mens˜ao d ´e um conjunto de hierarquias em DS. Se pelo menos uma hierarquia h em d for geogr´afica, n´os dizemos que a dimens˜ao ´e geogr´afica.

O valor ALL, adicionado nas hierarquias, representa a agrega¸c˜ao sobre toda a dimens˜ao.

Figura 4.10 Exemplos de N´ıvel Convencional

Na Figura 4.10-(A), n´os apresentamos um exemplo de n´ıvel convencional, definido a partir da tabela dimens˜ao d tempo. Neste exemplo, n´os definimos os n´ıveis Ano e Mˆes, mostrando seus respectivos membros. Ent˜ao, a Figura 4.10-(B) mostra um exemplo de hierarquia (H1) que pode ser definida a partir dos n´ıveis criados. Por sua vez, a Figura 4.10-(C) mostra a especifica¸c˜ao da dimens˜ao Tempo, que ´e formada pela hierarquia H1.

Na Figura 4.11, n´os mostramos a especifica¸c˜ao de dois n´ıveis geogr´aficos, os quais s˜ao basea- dos nas tabelas cgd localizacao, pgd estado e pgd municipio. Como podemos observar, todos os membros dos n´ıveis geogr´aficos Estado (Figura 4.11-(A)) e Munic´ıpio (Figura 4.11-(B)) possuem

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE 59

Figura 4.11 Exemplos de N´ıveis Geogr´aficos

informa¸c˜oes geogr´aficas vindas das tabelas geogr´aficas primitivas pgd Estado e pgd municipio, respectivamente. Assim, na Figura 4.11-(C)), ´e mostrada a hierarquia geogr´afica (H1), que cont´em os dois n´ıveis anteriormente definidos. Por fim, temos na Figura 4.11-(D), uma di- mens˜ao geogr´afica Localiza¸c˜ao que ´e composta pela hierarquia (H1).

Um dos pontos mais importantes da especifica¸c˜ao de um cubo de dados ´e a defini¸c˜ao das fun¸c˜oes de agrega¸c˜ao que s˜ao utilizadas para gerar os fatos do cubo. A seguir, damos a defini¸c˜ao formal para as fun¸c˜oes de agrega¸c˜ao, as quais foram detalhadas na Se¸c˜ao 4.3.

Na defini¸c˜ao de um cubo de dados, o processo de agrega¸c˜ao ´e executado por uma fun¸c˜ao f , a qual obt´em um multi conjunto R constru´ıdo a partir de colunas de uma tabela de fatos f t∈ F T , produzindo um ´unico valor. Para definir o dom´ınio de f , n´os n˜ao podemos utilizar uma proje¸c˜ao sobre f t, uma vez que a proje¸c˜ao n˜ao aceita duplicatas. Por exemplo, para somar a precipita¸c˜ao registrada na tabela de fatos f acompanha precipitacao ( ver Figura 4.12), a tabela de fatos seria projetada na medida precipitacao e as duplicatas seriam retidas. Esta ´e a raz˜ao pela qual n´os utilizamos um multi conjunto como dom´ınio de f . Al´em das colunas, as linhas da tabela de fatos na qual f atua s˜ao definidas a partir dos n´ıveis, valores de atributos ou valores de geometria de um conjunto D de dimens˜oes (´e importante lembrar que a chave prim´aria de uma tabela de fatos ´e composta pelas chaves estrangeiras das tabelas dimens˜oes). Ent˜ao, para definirmos o dom´ınio de f n´os primeiro introduzimos uma opera¸c˜ao chamada Proje¸c˜ao de Fatos que produz um multi conjunto P . Esta opera¸c˜ao ´e semelhante a uma proje¸c˜ao, entretanto, ela retorna um multi conjunto de tuplas como resultado ao inv´es de uma rela¸c˜ao (i.e. um conjunto de tuplas), permitindo assim duplica¸c˜oes.

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE 60

f t ∈ F T e o dom´ınio da defini¸c˜ao ´e um multi conjunto de tuplas R constru´ıdo a partir das colunas e linhas da f t na qual f opera.

Defini¸c˜ao 13 (Proje¸c˜ao de Fatos). Dada uma tabela de fatos f t : K×A1×. . .×Am×M1× . . . Mr× MG1× . . . × MGq, na qual K, o conjunto de atributos representando a chave prim´aria ´e S1× S2× . . . × Sp e n = p + m + r + q, conforme definido na Defini¸c˜ao 6. A proje¸c˜ao de fatos ℘s1,...,sx,a1...ay,m1...mz,mg1...mgw, na qual 0≤ x ≤ p, 0 ≤ y ≤ m, 0 ≤ z ≤ r e 0 ≤ w ≤ q mapeia as

n-tuplas de f t para um multi conjunto de l-tuplas, no qual l = x + y + z + w e l≤ n.

Defini¸c˜ao 14 (Fun¸c˜ao de Agrega¸c˜ao). Uma fun¸c˜ao de agrega¸c˜ao fi ∈ Fg, um conjunto cont´avel Fg={f1, f2, . . .}, ´e uma fun¸c˜ao parcial fi: f t→ V ∪ ⊥ na qual:

(i) f t : K× A1× . . . × Am× M1× . . . Mr× MG1× . . . × MGq ´e uma tabela de fatos na qual fi opera, e K ´e S1× S2× . . . × Sp;

(ii) V ´e um conjunto de valores do tipo TB ou TG; (iv) e o dom´ınio da defini¸c˜ao de fi´e definido como segue:

(1) Sendo P = ℘s1,...,sx,a1...ay,m1...mz,mg1...mgwuma proje¸c˜ao de fatos sobre f t, na qual 0≤ x ≤ p,

0≤ y ≤ m, 0 ≤ z ≤ r e 0 ≤ w ≤ q; (2) Sendo D um conjunto de dimens˜oes;

(3) R ´e um multi conjunto de l-tuples de P selecionadas dos n´ıveis, valores de atributos ou valores de geometrias de D.

Aqueles elementos de f t nos quais fi´e indefinido s˜ao mapeados para⊥ (bottom).

Defini¸c˜ao 15 (Cubo de Dados). Um cubo de dados (ou simplesmente cubo) C ´e uma 3-tupla < D, f t, f > onde:

(i) D ´e um conjunto de dimens˜oes; (ii) f t ´e uma tabela de fatos;

(iii) f : P (N )× {ft} → V ∪ ⊥ ´e uma fun¸c˜ao de agrega¸c˜ao pela qual os fatos de C s˜ao definidos; (iv) a dimens˜ao do cubo C ´e igual a |D|, i.e. a cardinalidade de D. Se |D| = n, n´os usamos a nota¸c˜ao Cn para denotar a dimens˜ao de C.

Se D possui pelo menos uma dimens˜ao geogr´afica, n´os dizemos que C ´e um cubo geogr´afico, denotado por GC.

Em um DW ou DWG, os n´ıveis das dimens˜oes guiam a gera¸c˜ao dos fatos, por meio da aplica¸c˜ao das fun¸c˜oes de agrega¸c˜ao. Assim, um fato pode ser gerado considerando somente algumas dimens˜oes do cubo. Ent˜ao, considerando a utiliza¸c˜ao da fun¸c˜ao de agrega¸c˜ao Soma, para gerar um fato conforme mostrado no exemplo da Figura 4.12, o fato a ser gerado pode ser Precipita¸c˜ao Total (Fato1). Este fato ter´a o valor 72, que ´e obtido por meio da soma de todos os valores da coluna precipitacao da tabela de fatos f acompanha precipitacao. Como pode ser observado, para a gera¸c˜ao do fato Fato1, toda dimens˜ao do DWG ´e considerada.

4.4 O MODELO DE DADOS FORMAL GEOMDCUBE 61

Figura 4.12 Exemplo de Fato Convencional

Em um cubo de dados, cada fato gerado est´a associado a um n´ıvel de uma dimens˜ao do DWG. Dessa forma, o valor do fato ´e obtido a partir da aplica¸c˜ao da fun¸c˜ao de agrega¸c˜ao sobre uma ou mais colunas da tabela de fatos. Por exemplo, considerando o n´ıvel Ano, definido no esquema da Figura 4.10, e os valores da medida precipitacao da tabela de fatos f acompanha precipitacao (Figura 4.12), podemos observar que um valor ser´a gerado para cada membro do n´ıvel Ano (ver Fato na Figura 4.12). Por sua vez, o exemplo de fato Fato3 (Figura 4.12) ´e gerado levando em considera¸c˜ao somente o membro Pernambuco do n´ıvel geogr´afico Estado (Figura 4.11-(A)) e o membro 2005 do n´ıvel convencional Ano (Figura 4.10-(A)).

Figura 4.13 Um Exemplo de Fato Geogr´afico

De forma similar, os dados geogr´aficos armazenados na tabela de fatos f acompanha precipitacao, com uma fun¸c˜ao de agrega¸c˜ao de medidas que realiza a uni˜ao de geometrias, n´os podemos definir um fato para o membro 2005 do n´ıvel Ano (Figura 4.10-(A)). O exemplo FatoGeo1, da Figura 4.13, mostra o fato geogr´afico gerado para exibir todas as geometrias que representam as ´areas alagadas no ano de 2005.

No outro exemplo (FatoGeo2 ), as ´areas alagadas s˜ao agrupadas (tamb´em utilizando uma fun¸c˜ao para uni˜ao de geometrias) levando em considera¸c˜ao o membro 2005 do n´ıvel Ano (Figura 4.10-(A)) e o membro Pernambuco do n´ıvel Estado ((Figura 4.10-(A))). Ou seja, o fato ge- ogr´afico FatoGeo2 mostrado na Figura 4.13 representa a uni˜ao das ´areas alagadas no estado de Pernambuco no ano de 2005. Outras fun¸c˜oes de agrega¸c˜ao de medidas geogr´aficas (ver Se¸c˜ao

4.5 CONSIDERAC¸ ˜OES 62

4.3) podem ser utilizadas, dependendo das necessidades de an´alise.

4.5 CONSIDERAC¸ ˜OES

Este cap´ıtulo apresentou nosso modelo formal de DWG, que estende o arcabou¸co GeoDWFrame [115] para prover suporte a medidas espaciais. Tamb´em ´e apresentado um conjunto de fun¸c˜oes para agrega¸c˜ao de medidas espaciais, e um modelo formal para cubos de dados multidimensionais e geogr´aficos.

Com a formaliza¸c˜ao matem´atica dos modelos de DWG e do cubo de dados, juntamente com a formaliza¸c˜ao do processo de agrega¸c˜ao, que gera os fatos a partir das medidas armazenadas no DWG, deixamos expl´ıcito, de forma consistente e n˜ao amb´ıgua, o relacionamento existente entre os elementos do DWG, cubo de dados e processo de agrega¸c˜ao.

Um ponto importante a ser observado, ´e que quest˜oes de otimiza¸c˜ao como pr´e-agrega¸c˜ao e materializa¸c˜ao espacial [223, 267] n˜ao fazem parte do escopo desta tese. Outro fato ´e que, neste primeiro momento, estamos considerando apenas hierarquias bem definidas.

No pr´oximo cap´ıtulo, ser´a discutida a nossa linguagem de consulta, chamada GeoMDQL, juntamente com sua sintaxe e seu conjunto de operadores. Esta nova linguagem multidimen- sional e geogr´afica atua sobre os cubos de dados definidos a partir do modelo de dados GeoMD- Cube apresentado neste cap´ıtulo.

CAP´ITULO 5