• Nenhum resultado encontrado

Processo de análise documental e de conteúdo

Ontologia Modelos pretendidos

Cenário 1: especificação dos

4.2.3 Análise, avaliação e comparação das ontologias candidatas a reúso

4.2.3.2 Processo de análise documental e de conteúdo

Esta etapa iniciou-se em fevereiro de 2014 e se estendeu até abril do mesmo ano. A atividade de análise das ontologias multimídia foi considerada como um processo de auditoria, no qual as ontologias e documentações subjacentes foram inspecionadas e analisadas. No total, foram gastas 224 horas de análise sobre as nove ontologias envolvidas na pesquisa, conforme pode ser conferido nas seções relativas a cada uma delas. Os métodos usados para análise documental e de conteúdo das ontologias são descritos a seguir.

O processo de análise e interpretação dos documentos relacionados a cada ontologia se deu através da utilização de técnicas de análise de conteúdo (BARDIN, 1977), que contempla um conjunto de métodos de análise das comunicações visando obter indicadores (quantitativos ou não) que permitam a inferência de conhecimentos presentes nas mensagens. A principal técnica utilizada foi a determinação de categorias que subsidiariam a análise de conteúdo dos materiais envolvendo as ontologias multimídia candidatas a reúso. Alguns critérios envolvendo o ranking para reúso

foram usados como estratégia metodológica para cumprimento de dois propósitos, a saber: i) subsidiar a organização e a interpretação dos conteúdos envolvidos no material empírico da pesquisa; e ii) obter para os critérios envolvidos suas mensurações por meio de evidências na literatura e no código da ontologia. Os critérios foram transformados em categorias de análise e endereçados como se segue.

Para a análise documental, as categorias destinam-se a: i) propósito de desenvolvimento da ontologia; ii) disponibilidade de documentação da ontologia; iii) recursos de conhecimento utilizados; iv) disponibilidade de conhecimento externo; v) disponibilidade de testes; vi) disponibilidade de resultados de avaliação de testes; vii) informação sobre a equipe de desenvolvimento; e viii) informação sobre projetos e ontologias que fazem uso. E para a análise de código das ontologias, as categorias referem-se a: i) linguagem de implementação; ii) claridade no código; iii) adequação a extração de conhecimento; iv) adequação a convenção de nomes; v) cobertura terminológica frente a requisitos multimídia; e vi) anotações e axiomas existentes na terminologia compatibilizada.

A atividade de análise de conteúdo das ontologias demandou conhecimentos acerca das linguagens da Web Semântica (elucidadas na seção 3.3.3), especialmente OWL por ser a linguagem representativa da maioria das ontologias analisadas; além do manuseio do editor de ontologias Protégé 4.3, o qual foi escolhido como ferramenta para inspeção das ontologias. Com o apoio dos

requisitos para descrição de documentos multimídia (ver Apêndice A), os elementos de parâmetro

172

funcionais endereçadas à descoberta da cobertura terminológica (total ou parcial) frente às

ontologias candidatas a reúso.

Nesse ponto, torna-se válido enfatizar que requisitos funcionais são resultados de práticas advindas da área de engenharia de software (PRESSMAN, 2002) e que foram adaptadas na área de engenharia de ontologias (FERNANDEZ, GOMEZ-PEREZ e JURISTO, 1999; FIGUEROA, GÓMEZ-PÉREZ e FERNÁNDEZ-LÓPEZ, 2012) como forma de viabilizar as tarefas voltadas a especificações de conteúdo de um domínio de conhecimento em particular, obtendo-se, como resultado, terminologias endereçadas a uma ontologia. No caso específico do domínio multimídia, um conhecimento sobre mídia poderia ser representado, por exemplo, nas seguintes declarações: “um GIF é um tipo de formato de imagem”; “um formato 3D é uma subclasse de formato de mídia”; e como terminologia poder-se-ia obter a partir de uma convenção do padrão MPEG-7: “mpeg7: Content” e “mpeg7: FileFormat”.

As estruturas de análise de requisitos funcionais foram organizadas por ontologia

multimídia e modularizadas pelas categorias de metadados elencadas na pesquisa: metadados independentes de conteúdo, metadados dependentes de conteúdo e metadados descritivos de conteúdo.

Foram criados 3 arquivos146 textos para comportar cada categoria de metadados concernente a cada ontologia. Desse modo, resultou-se em 27 arquivos referentes às análises das ontologias. Na concepção das estruturas de análise, os elementos de parâmetro e suas descrições

foram dispostos em suas linhas, e os elementos ontológicos inspecionados foram postos em suas colunas. Tais elementos foram determinados a partir do conhecimento adquirido na fundamentação teórica de que os requisitos multimídia, se cotejados com as declarações ontológicas nas ontologias, poderiam aparecer em formato de classes, propriedades e/ou instâncias. Os itens analisados são apresentados, conforme abaixo:

Classes (taxonomia): estrutura hierárquica responsável pela organização dos conceitos do domínio multimídia. Nesse caso, quando identificado o requisito como uma classe, optou-se em mapear a estrutura taxonômica na ontologia identificando suas subclasses e superclasses. O prefixo “:” (dois pontos) que acompanha o termo significa a origem do mesmo, isto é, identifica a ontologia na qual o recurso está vinculado. O sinal “.” (ponto) indica a relação de subclasse entre as classes envolvidas. Este mesmo princípio é empregado para os dados Propriedades descritos adiante.

146 Optou-se por esse tipo de instrumento para coleta e registro dos dados em razão do número razoável de ontologias

envolvidas na análise. Em situações em que houver um número maior de objetos empíricos envolvidos na análise, sugere-se a construção de uma base de dados endereçada a organização dos mesmos e a obtenção de resultados com maior agilidade.

Propriedades: características que descrevem uma classe da ontologia (conceito multimídia), tais como definição, sinônimos, relações entre classes, papéis, links para esquemas de classificação externo (como conceitos em SKOS147),

relação inversa, atributos, valores e comentários. Nesta pesquisa, foram considerados para análise os seguintes elementos relativos a propriedades: propriedades de objeto (Object Properties), propriedades de tipos de dado (Data Properties) e propriedades de anotação (Annotation Properties). O primeiro

elemento relaciona objetos com outros objetos; o segundo relaciona objetos com seus valores de tipos de dado; e o terceiro contempla informações relevantes sobre um elemento na ontologia por meio de definições, comentários, sinônimos, dentre outros. Na identificação do requisito como uma propriedade, o mesmo seria apontado como uma relação (r) ou como um atributo (a). E, ainda, para tais elementos, foram verificadas a existência, ou não, de restrições de propriedades envolvendo domínio (rdfs:domain) e escopo (rdfs:range), as quais permitem

restrições de participação dos objetos nas classes, favorecendo a realização de inferências lógicas e, consequentemente, a interpretação das ontologias pelas máquinas.

Instâncias: objetos específicos (Individuals) de um conceito multimídia. • Axiomas: restrições impostas sobre os conceitos (classes e propriedades) envolvidos na ontologia multimídia a fim de evitar ambiguidades na semântica dos termos, garantindo, assim, que as definições formais apoiem a interpretação pela máquina por meio de inferências lógicas (conforme já destacado na tese).

O processo de análise de conteúdo das ontologias consistiu de uma análise de compatibilidade (um mapeamento ou alinhamento) entre os vocabulários das ontologias e os requisitos multimídia determinados na pesquisa. A análise de compatibilidade ocorreu especialmente nos elementos das declarações ontológicas, sob dois aspectos e em sequência: i) nível linguístico; e ii) nível de definição do conceito. No nível linguístico, a interpretação do significado da nomenclatura do termo é subjetiva, não sendo suficiente para assegurar uma correspondência de ordem conceitual. Desse modo, como segunda etapa foi realizada uma análise conceitual que refletiu no significado intencionado do elemento (termo) frente ao contexto pretendido. Para este último, as propriedades de anotação dos conceitos (por exemplo: comentários e definições) foram verificadas e, quando existentes, analisadas para a obtenção de informações relevantes sobre a natureza dos mesmos. O mapeamento considerou possíveis diferenças semânticas ocorridas no

147 SKOS (Simple Knowledge Organization System) é uma recomendação W3C que define um vocabulário para

representar Sistemas de Organização do Conhecimento e relacionamentos entre eles. Informações adicionais em http://www.w3.org/TR/skos-reference/

174 processo de compatibilização de vocabulários, as quais podem ser caracterizadas como: i) exata; ii) mais específica; iii) mais genérica; e iv) relacionada. Em (i) a semântica de dois elementos são equivalentes na maioria dos contextos possíveis; em (ii) a semântica envolvida no elemento ontológico cobre apenas um subconjunto de possibilidades expressas pelo elemento equiparado; em (iii) a semântica envolvida no elemento ontológico é mais genérica do que as propriedades envolvidas no elemento equiparado; e em (iv) os dois elementos são relacionados, porém essa relação não tem semântica definida. Tal abordagem tem sido considerada em projetos de construção de ontologias multimídia, como foi o caso da Media Ontology (STEGMAIER, 2009). Torna-se válido ressaltar que o sucesso para a análise conceitual depende da coerência adotada pelos criadores da ontologia em explicitar em linguagem natural informações claras e objetivas sobre as declarações ontológicas, além de determinação não ambígua para termos e de composição taxonômica que reflita de maneira precisa o domínio multimídia.

Finalmente, após a atividade de análise de todas as ontologias multimídia envolvidas no estudo, foi realizada uma análise comparativa envolvendo os dezessete critérios determinados e elucidados na pesquisa, com destaque para o aspecto de cobertura frente aos metadados de conteúdo multimídia. Para tal, de modo a apoiar a visualização comparativa envolvendo os objetos investigados foram propostos quadros e gráficos com variados tipos de informação sinóptica envolvendo os critérios examinados na documentação e no conteúdo das ontologias.