• Nenhum resultado encontrado

3.5 O processo de modelação de dados geográficos aplicado às águas superficiais

3.5.2.3 Elementos de metadados codificados em XML

Durante o processo de declaração do modelo conceptual de dados foi produzida metainformação relativa à descrição dos conceitos modelados. Estes metadados constam das marcas de valor (tagged values) de cada classe, atributo, associação e lista codificada de valores. Esta informação consta do elemento de metadados relativo ao “resumo do recurso”, cujo conteúdo é de texto livre57.

Com base no conhecimento de que a partir dos diagramas de classes UML não é possível extrair os metadados para a base de dados geográficos final, mas que simultaneamente é reconhecida a vantagem de associar aos elementos do modelo conceptual a sua metainformação, optou-se por não dissociar os dois.

Para que a metainformação constasse no dicionário de dados e posteriormente no modelo físico de dados, foi necessário executar uma extracção desses metadados a partir dos diagramas de classes UML. Para tal foram identificados os elementos de linguagem de marcação extensível (XML), resultantes dos diagramas de classes UML, que continham os conceitos e definições dos elementos do modelo conceptual, tendo estes sido individualizados para um novo ficheiro XML.

A Figura 8 refere-se à marca de valor documentation utilizada para registar as descrições dos conceitos modelados.

Figura 8. Exemplo de utilização da marca de valor documentation para descrição do elemento UML

Apresenta-se na Figura 9 o código XSL (XML StyleSheet) utilizado para extrair do ficheiro XMI (XML Metadata Interchange) do modelo conceptual, as definições dos conceitos subjacentes aos elementos declarados através dos diagramas de classes UML.

Dado que o perfil UML utilizado na declaração do modelo de dados se baseia em estereótipos específicos da tecnologia ESRI (perfil ArcInfo UML model), o ficheiro XMI produzido está de acordo com o esquema XML de uma ESRI Geodatabase (ESRI, 2008).

Com a identificação dos elementos que contêm as definições e descrição dos elementos representados no modelo de dados, foi produzido um ficheiro XSL para individualizar os valores da marca de valor documentation. A afectação do ficheiro XSL ao ficheiro XMI, permite obter um ficheiro XML com a estrutura do que se apresenta na Figura 9.

<?xml version="1.0"?>

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"

xmlns:esri="http://www.esri.com/schemas/ArcGIS/9.3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xs="http://www.w3.org/2001/XMLSchema">

<xsl:output indent="yes"/> <xsl:template match="/">

<!-- Para todas as definições das entidades presentes no modelo de dados --> <ElementDescriptions> <xsl:for-each select="//Foundation.Core.Class[Foundation.Core.ModelElement.name!='&lt;unspecified&gt;']"> <ModelElement> <Name> <xsl:value-of select="Foundation.Core.ModelElement.name"/> </Name> <xsl:variable name="codeElement" select="Foundation.Core.ModelElement.taggedValue/Foundation.Extension_Mechanisms.TaggedValue[Fou ndation.Extension_Mechanisms.TaggedValue.tag='documentation']"/> <xsl:variable name="tagValue" select="$codeElement/Foundation.Extension_Mechanisms.TaggedValue.value"/> <Description> <xsl:value-of select="$tagValue"/> </Description> </ModelElement> </xsl:for-each> </ElementDescriptions> </xsl:template> </xsl:stylesheet>

Figura 9. Ficheiro XSL de extracção de definições das classes consideradas nos diagramas de classes UML

De acordo com a ferramenta CASE utilizada (MS Visio™) e com o perfil UML adoptado (ArcInfo UML model), a marca de valor documentation encontra-se referenciada pelo elemento XML <Foundation.Extension_Mechanisms.TaggedValue.tag>. A descrição deste elemento encontra-se no elemento XML <Foundation.Extension_Mechanisms.TaggedValue.value>. A Figura 10 ilustra um exemplo dos elementos XML referidos.

- <Foundation.Extension_Mechanisms.TaggedValue xmi.id="UIDE1E0CA94-B1A8-45CA-9931-8BB4740C7603">

<Foundation.Extension_Mechanisms.TaggedValue.tag>documentation</Foundation.Extension_Mechanisms.TaggedVal ue.tag>

<Foundation.Extension_Mechanisms.TaggedValue.value>Bacia Hidrográfica: Área terrestre a partir da qual todas

as águas fluem para o mar, através de uma sequência de rios, ribeiros ou eventualmente lagos, desaguando numa única foz, estuário ou delta </Foundation.Extension_Mechanisms.TaggedValue.value>

</Foundation.Extension_Mechanisms.TaggedValue>

Figura 10. Excerto do código XML exportado a partir do modelo de dados UML, respeitante à definição de bacia hidrográfica

Aplicando-se a função de formatação ao ficheiro XMI com origem na aplicação de modelação (MS Visio™) obteve-se um ficheiro do qual se apresenta extracto na Figura 11.

<?xml version="1.0" ?>

-<ElementDescriptions xmlns:esri=http://www.esri.com/schemas/ArcGIS/9.3 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xmlns:xs="http://www.w3.org/2001/XMLSchema"> …

-<ModelElement>

<Name>RegioesHidrograficas</Name>

<Description>A classe de região hidrográfica consiste no polígono que identifica a fronteira administrativa. Centraliza a informação a reportar ao nível da RH. Agrega a área de mar e terra que inclui todas as massas de águas correspondentes. (Lei da Água) «Região hidrográfica» a área de terra e de mar constituída por uma ou mais bacias hidrográficas contíguas e pelas águas subterrâneas e costeiras que lhes estão associadas, constituindo-se como a principal unidade para a gestão das bacias hidrográficas

</Description>

</ModelElement>

Figura 11. Ficheiro XML formatado com o nome, definição, e descrição das classes presentes nos diagramas UML

Com a estrutura física dos dados implementada num sistema de gestão de base de dados, a metainformação residirá numa coluna BLOB58

de uma tabela da base de dados. Na eventualidade de a informação estar em sistema de ficheiros esses metadados seriam armazenados documento XML estruturado de acordo com a norma ISO 19139:2005. Os elementos de metadados neste formato foram manipulados com XPath59. Optou-se por integrar no mesmo documento o dicionário de dados e o catálogo de entidades.

3.5.3 Modelo lógico (esquema de aplicação)

O modelo lógico, ou esquema de aplicação, consiste na definição exaustiva, através de diagramas de classes UML, dos elementos do modelo conceptual, nomeadamente: tipos de entidades (materializadas em classes de objectos); atributos; tipos de dados; listas codificadas de valores; associações entre classes e restrições de utilização ou de aplicação.

No desenvolvimento do modelo lógico de dados foram utilizados elementos com origem nas normas ISO referentes à informação geográfica (colecção ISO 19100), bem como as normas de enquadramento para a especificação de informação geográfica da Directiva INSPIRE, nomeadamente as seguintes:

-

definition of annex theme and scope (D 2.3);

-

generic conceptual model (D 2.5);

-

methodology for the development of data specifications (D 2.6);

-

guidelines for the encoding of spatial data (D 2.7).

58

Bynary Large Object

59

XPath Language, linguagem de programação que permite construir expressões que recorrem e processam um documento XML de modo parecido a uma expressão regular (wikipedia)

Destaca-se das normas ISO a aplicação da norma 19109 – Rules for Application Schema – e da norma 19131 – Data product specifications. O modelo lógico contém uma descrição formal da estrutura e do conteúdo dos dados, incluindo:

-

representação dos tipos de entidades (spatial data objects, na denominação sugerida pelas normas INSPIRE);

-

atributos e tipos de dados (data types);

-

restrições ao domínio de valores dos atributos declarados através de listas codificadas de valores;

-

associações entre classes de objectos do modelo de dados.

Durante o desenvolvimento do modelo de dados procurou-se garantir a implementação dos sistemas de codificação previstos na implementação da DQA, nomeadamente, os descritos no WFD Guidance document nº. 22 (European Commission, 2009d), bem como os conceitos e requisitos técnicos subjacentes ao relato da localização e classificação das entidades geográficas de relevância para a política da água portuguesa, materializada na Lei da água e respectivos diplomas complementares.

No caso específico das massas de água superficiais, é reconhecida uma necessidade fundamental em hidrologia e hidráulica que implica a representação das massas de água com recurso a redes geométricas, em que o fluxo do escoamento possa ser representado com a devida coerência topológica. Este facto é particularmente relevante para os estudos de dispersão de poluentes, para o cálculo de cenários de gestão ou para a avaliação do estado hidromorfológico, químico e ecológico das massas de águas. Para a descrição da rede geométrica foi utilizado o INSPIRE Generic Conceptual Model (INSPIRE, 2010a), no âmbito do qual se descreve o Generic Network Model (baseado em diversas normas ISO). Esta especificação contempla as noções de nós, arcos, agregação de arcos, e áreas. Esta especificação fornece os mecanismos básicos para a referenciação linear e pontual, inter-conexões de redes e topologia associada. Neste âmbito, o MDG foca-se nos seguintes aspectos:

-

definições – descrição dos conceitos subjacentes ao universo de discurso considerado; as definições das classes de objectos, dos seus atributos e das associações que se estabelecem entre classes são registadas no modelo lógico, o que permite a sua incorporação automática no perfil de metadados considerado;

-

hierarquia – descrição da hierarquia e associações de classes por intermédio de uma linguagem de notação própria; neste caso utilizaram-se estereótipos UML específicos para a criação de bases de dados geográficos;

-

redes – massas de águas e outras classes de objectos são partes de uma rede para a qual é definida uma direcção de escoamento;

implementados sistemas de codificação próprios que garantem a extensibilidade do MDG a outros modelos de dados específicos, como o das aplicações de dados de monitorização (p.ex. a solução LabWay da Ambidata), do licenciamento ou outros modelos de dados específicos;

-

tempo – os objectos possuem uma validade temporal (ciclo de vida) recorrendo a tipos de dados (data types) da norma ISO 19108;

-

estruturação de dados – a partir do MDG podem ser gerados ficheiros que definem a estrutura que deve ser seguida na implementação da base de dados geográficos (BDG), bem como na partilha de informação, conhecidos como ficheiros de esquemas XML; os ficheiros candidatos que transportam dados devem ser validados com os esquemas XML de acordo com o modelo de dados definido;

-

partilha de dados – os esquemas de XML e GML, tal como definidos na norma ISO 19136:2007 podem proporcionar a partilha de dados com independência da plataforma computacional.

Dado que se pretende que o modelo funcione como um suporte à informação legalmente referenciada para o exercício do planeamento e gestão de recursos hídricos, procurou-se que a totalidade dos termos e conceitos com valor legal (como por exemplo bacia hidrográfica ou zona de infiltração máxima), fossem reproduzidos no modelo. Para os tipos de objectos geográficos considerados no modelo de dados por questões de coerência e operacionalidade, ou para aqueles que não se encontram claramente definidos no âmbito da legislação aplicável, recorreu-se à definição científica considerada mais apropriada. As definições dos conceitos adoptadas no MDG seguiram a seguinte ordem de adopção:

-

directivas europeias, indicadas na secção 3.2.1;

-

diplomas legais nacionais, indicados na secção 3.2.2;

-

dicionário de dados do WISE expressos nos WISE XML schemas (Lack et al., 2009);

-

dicionário de dados INSPIRE (feature concept dictionary) quando aplicável;

-

dicionário de dados DFDD60, quando aplicável (DFDD, 2010);

-

glossário internacional de hidrologia (UNESCO-OMM, 1992).

A filosofia seguida no âmbito da definição do modelo de dados privilegia um número mínimo de elementos (classes, propriedades, associações), em detrimento de um grande número de

60

DGIWG Feature Data Dictionary (DFDD): contém a descrição dos conceitos utilizados pelos estados membros da comunidade DGIWG, de forma a caracterizar aspectos de fenómenos do mundo real. É baseado no seu antecessor Feature and Attribute Coding Catalogue (FACC), uma componente do Digital Geographic Information Exchange Standard (DIGEST). O DFDD é baseado na ISO 19126 e mantido segundo os princípios da ISO 19135.

elementos que materializaria a ambição de descrever exaustivamente o sistema ambiental que contém ou influencia o estado das massas de água superficiais. Cada classe de objectos possui um conjunto mínimo de atributos que se considerou de relevância para implementar as funcionalidades de identificação, caracterização, quantificação e classificação das massas de água e dos respectivos ecossistemas associados. A geometria dos objectos é definida com recurso ao modelo de dados vectorial, considerando três tipos de dados geográficos: ponto, linha, e polígono.

O modelo lógico não se aplica à representação e caracterização da rede de águas de abastecimento para consumo humano, da rede de águas residuais urbanas, ou de infra-estruturas rodoviárias e ferroviárias que possam influenciar o escoamento superficial. No que respeita às infra-estruturas hidráulicas, apenas se desenvolveu suporte à sua codificação de identificação com o objectivo de contribuir para um sistema de codificação único ao nível de cada base de dados implementada. Ainda assim o modelo lógico pode ser extensível a estes tipos de caracterizações através do sistema de codificação adoptado. Não são consideradas operações de generalização sobre os conceitos modelados, pelo que a geometria definida no modelo lógico para cada tipo de entidades geográficas é imutável.

O modelo lógico pretendeu-se responder às seguintes questões:

-

quais as principais entidades de recursos hídricos que marcam a paisagem e o seu estado ecológico e químico enquadradas pelos objectivos ambientais a atingir;

-

como se move a água entre essas entidades;

-

que tipos de medidas se preconizam para manter ou melhorar o estado das massas de água e as zonas protegidas que influenciam;

-

quais as características dos programas de monitorização a aplicar às massas de água de forma a aferir o seu estado e a caracterizar as pressões de que são alvo.

Os principais objectivos do modelo lógico são os seguintes:

-

fornecer o enquadramento para a aplicação de uma estrutura de dados e respectivos conteúdos;

-

adoptar um conjunto comum de conceitos, definições e descrições;

-

facilitar a partilha de informação entre organizações aos diversos níveis da administração (local, regional, nacional, supra-nacional, e europeia);

-

promover a interoperabilidade entre os diversos produtores e manipuladores de informação geográfica aplicada ao planeamento e gestão de recursos hídricos;

-

descrever uma estrutura de dados facilmente interpretável e de fácil utilização.

O exercício de identificação e caracterização dos tipos de entidades geográficas consideradas no modelo baseou-se quer em objectos reais associados ao universo de discurso, quer aos objectos sem uma expressão física evidente. De notar que a identificação e caracterização destas últimos resulta sobretudo da interpretação do quadro legal aplicável, nomeadamente, a LA e a DQA. Consideram-se assim como exemplo de objectos com evidente existência física: as diversas categorias de massas de água superficiais, as bacias e sub-bacias hidrográficas, as estações de monitorização, ou as captações de água para consumo humano. Como objectos sem uma expressão física evidente podem ser considerados os seguintes: perímetros de protecção, zonas inundáveis e a delimitação do domínio público hídrico. Descreve-se para cada diagrama de classes UML do modelo lógico:

-

o suporte legal que lhe dá origem;

-

as classes que o compõem e as suas propriedades (atributos);

-

as associações entre classes;

-

o suporte a funcionalidades de análise espacial.

Consistência entre representações no modelo de dados

A produção de CDG com base no MDG é aplicável ao nível regional, podendo ser transformados para aplicação a nível nacional, supra-nacional e europeu. O MDG é aplicável a todos os níveis de detalhe, no entanto recomenda-se a sua aplicação a representações cartográficas a escalas entre 1:150.000 e 1:350.000.

Admite-se que possam coexistir representações topográficas baseadas em áreas (normalmente utilizadas em levantamentos a escalas grandes) e representações baseadas num certo nível de generalização, como é o caso da utilização das linhas de talvegue para a representação de massas de água.

Para qualquer destes níveis de detalhe deve ser mantida, quer a consistência lógica, quer a consistência posicional. A consistência lógica relaciona-se com a referência correcta aos identificadores e códigos das entidades geográficas referenciadas. A consistência posicional relaciona-se com a representação de uma mesma entidade geográfica com recurso a mais que uma geometria. É o caso das linhas de talvegue dos cursos de água e os limites do seu leito: as linhas de talvegue deverão estar representadas no interior das linhas de limite da margem direita e esquerda do curso de água referenciado.