• Nenhum resultado encontrado

Ontologia Modelos pretendidos

4- METODOLOGIA DE PESQUISA

Este capítulo se propõe a fornecer uma explanação sobre os fundamentos metodológicos empregados no delineamento da pesquisa. A seção 4.1 visa posicionar teoricamente a pesquisa-tese frente ao tipo de abordagem em relação ao problema, objetivos e procedimentos técnicos utilizados em seu desenvolvimento, além da forma como foi conduzida a investigação nas bases de dados de documentos científicos adequadas à delimitação teórica e empírica da tese. A seção 4.2, por sua vez, descreve o percurso metodológico para o alcance do objetivo geral da tese.

4.1 FUNDAMENTOS DA PESQUISA

A classificação da pesquisa torna-se útil para o estabelecimento de seu marco teórico e da análise de seus fatos do ponto de vista empírico, de forma a confrontar a visão teórica com os dados da realidade. Desse modo, a presente pesquisa pode ser classificada segundo seu problema, seus objetivos e seus procedimentos técnicos para coleta e análise dos dados (GIL, 2002; DEMO, 1996; MARCONI e LAKATOS, 2010; CERVO e BERVIAN, 2002).

Com base na abordagem do problema, esta pesquisa pode ser classificada como qualitativa e quantitativa. No primeiro caso, há a necessidade de se entender o que está por detrás do fenômeno investigado do qual ainda pouco se conhece. Sendo assim, a determinação, a análise e a descrição dos métodos e das técnicas adequadas aos processos envolvidos na pesquisa serão possíveis através de um maior entendimento desse fenômeno presente no domínio a ser estudado. No segundo caso, há a necessidade de se usar formatos numéricos para mensurações de critérios avaliativos frente a análises de ontologias, as quais são pontuadas e classificadas por métodos estatísticos.

Com base em seus objetivos, esta pesquisa pode ser classificada em três tipologias, a

saber: i) exploratória, pois pretende investigar e aprimorar ideias sobre um assunto emergente no campo das ontologias – recursos de conhecimento para anotação de conteúdo multimídia – em que

se requer uma investigação minuciosa na literatura e em casos específicos que fazem uso de recursos nessa perspectiva; ii) descritiva, pois pretende levantar e descrever características do fenômeno a ser investigado (conforme já elucidado acima) à luz da literatura e de material empírico específico; e iii) explicativa, pois a proposta de modelagem conceitual requer a elucidação de parte da realidade multimídia representada na conceituação do modelo.

Em relação aos procedimentos técnicos para coleta e análise dos dados, esta pesquisa

pode ser classificada como bibliográfica e documental, pois pretende usar como fonte de consulta materiais já publicados: artigos científicos, anais de congressos, relatórios técnicos de pesquisa, teses, dissertações, normas e fontes documentais subjacentes às ontologias estudadas.

146 O primeiro ponto a considerar numa pesquisa científica é o levantamento bibliográfico e o estudo inicial das teorias que circundam o problema de modo a fornecer sustentabilidade teórica à pesquisa. Nesse sentido, o levantamento dos principais assuntos envolvidos nos permite estabelecer um recorte temático nas áreas envolvidas na investigação. Feito isso, a revisão de literatura ou o estudo do estado da arte nos leva a situação do conhecimento atual sobre o problema ou tema-chave da pesquisa.

O cerne desta pesquisa está localizado na temática organização e representação do conhecimento em sistemas de informação. A representação do conhecimento tem sido tratada como

objeto de estudos em diferentes campos do conhecimento. Esta pesquisa está concentrada em alguns desses campos, dentre os quais podemos destacar a ciência da informação e a ciência da computação.

Para a identificação de documentos nos campos da CI e da CC, foram consultadas bases de dados de documentos científicos no portal de periódicos da Capes120 e na biblioteca digital Citeseer121. Esta última proporciona análises estatísticas das citações para todos os documentos do repositório, o que possibilita ao pesquisador tomar conhecimento da opinião dos pares em relação ao artigo em questão e, em consequência, de sua aceitação pela comunidade. No que diz respeito ao portal de periódicos da Capes, as editoras consultadas foram: i) Association Computing Machinery,

conhecida como portal ACM; ii) Journal Multimedia Tools and Applications; iii) IEEE MultiMedia;

iv) Journal of signal processing systems for signal, image, and video technology; e v) IEEE Transactions on Circuits and Systems for Video Technology. A primeira dissemina literatura de

diversas áreas da CC, destacando a inteligência artificial, área na qual há várias publicações sobre ontologias. A segunda e a terceira disseminam publicações sobre sistemas multimídia e hipermídia, bibliotecas digitais e ciências da Web; além de revisões de literatura sobre ferramentas e aplicações emergentes envolvendo anotações de documentos multimídia com uso de vocabulários semânticos, especialmente ontologias. A quarta e a quinta fornecem informações de cunho tecnológico para processamento de sinais e extração de dados envolvendo imagem, vídeo e áudio; neste caso, a atenção voltou-se a assuntos relacionados à tecnologia MPEG-7, por ser o padrão de metadados multimídia de interesse da pesquisa. Pesquisas também foram realizadas nas revistas classificadas na categoria Qualis tanto da CI quanto da CC, além da Biblioteca Digital Brasileira de Teses e Dissertações (BDTD122).

Para a recuperação dos documentos nas bases de dados científicas foi empregada a técnica de busca por palavras-chave que refletem o universo do assunto. O propósito foi identificar e selecionar documentos relacionados com o problema da pesquisa, em que os autores procuraram

120 http://www.periodicos.capes.gov.br/ 121 http://citeseer.ist.psu.edu

resolver o mesmo problema ou um problema semelhante. Esta etapa foi composta de três partes: i) levantamento dos trabalhos relacionados; ii) estudo destes trabalhos e iii) análise dos trabalhos, que resultou em um resumo crítico apontando as características de cada uma das abordagens.

4.2 MODELO ONTOLÓGICO MULTIMÍDIA: PLANO DE CONSTRUÇÃO

Dado que o objetivo geral desta tese é desenvolver um modelo conceitual baseado em ontologias para o domínio de anotação de documentos multimídia, fez-se necessária a adoção de

um guia metodológico atual, testado e validado em diferentes domínios e áreas. Para a seleção de um guia com tais características, foi necessária uma revisão na literatura da área de engenharia de ontologias. O procedimento permitiu identificar e selecionar a NeOn Methodology (SUÁREZ-

FIGUEROA, 2010; ONTOLOGY ENGINEER GROUP, 2010; SUÁREZ-FIGUEROA, GÓMEZ- PÉREZ e FERNÁNDEZ-LÓPEZ, 2012), advinda de frameworks metodológicos amplamente

aceitos em áreas maduras como engenharia de software e engenharia do conhecimento (FERNANDEZ, GOMEZ-PEREZ e JURISTO, 1997; SILVA, SOUZA e ALMEIDA, 2008). Citam- se áreas e domínios contemplados pelo uso da metodologia NeOn, apenas para citar alguns

exemplos, na educação (CLEMENTE, RAMÍREZ e ANTONIO, 2011), no turismo (LAMSFUS et al, 2009), em ambientes móveis (POVEDA-VILLALÓN et al, 2010), em iniciativas Linked Data

(VILCHES-BLÁZQUEZ et al, 2010), e, especialmente, no domínio da descrição de conteúdo multimídia (ATEMEZING, 2011; CENIT BUSCAMEDIA123), foco de interesse desta pesquisa.

A metodologia de engenharia de ontologias NeOn abrange nove cenários que sugerem

uma série de passos flexíveis para o desenvolvimento de ontologias. Os cenários envolvidos cobrem situações em que ontologias disponíveis em repositórios da Web necessitem, por exemplo, de reengenharia, alinhamento, modularização, localização, suporte em diferentes línguas e culturas, integração com padrões de projeto e recursos não ontológicos, tais como padrões de metadados, tesauros, folksonomias, etc. Outra característica da metodologia é subsidiar o desenvolvimento de redes de ontologias, definidas como uma coleção de ontologias relacionadas entre si através de diferentes relações e correspondências, modularizações e versionamento (SUÁREZ-FIGUEROA, GÓMEZ-PÉREZ e FERNÁNDEZ-LÓPEZ, 2012). O conhecimento ontológico requerido é introduzido por diferentes pessoas, incluindo especialistas de domínios e ontologistas, em diferentes estágios no processo de desenvolvimento, o que redunda em repositórios de ontologias na Internet. A filosofia de desenvolvimento colaborativo e argumentativo e de disponibilização distribuída de recursos de conhecimento se aproxima da iniciativa Linked Data apresentada na seção 3.3.3.5. Os

projetos envolvidos nessa perspectiva buscam ligar semanticamente seus recursos na Web de dados

148 por meio de atividades como identificação de fontes de conhecimento existentes; modelagem de vocabulários; transformação de dados para o padrão W3C RDF; e ligação destes dados com outras fontes de conhecimento na nuvem.

Nesta tese, a etapa de modelagem de vocabulários multimídia requer um modelo conceitual baseado em ontologias a fim de organizar semanticamente os elementos das ontologias multimídia selecionadas na pesquisa. Neste contexto, Suárez-Figueroa, Gómez-Pérez e Fernández- López (2012) recomendam o quanto possível o reúso de recursos de conhecimento disponíveis para modelar o conhecimento necessário, e, para tal, a NeOn oferece um guia capaz de apoiar o

ontologista na atividade de criação dos vocabulários necessários. Dentre os nove cenários indicados no guia, conforme elucidados na seção 3.2.4, seis foram selecionados (Cenários 1, 2, 3, 5, 6 e 8) pelo fato de atenderem às expectativas de cumprimento dos objetivos específicos nucleares e do propósito geral da tese, conforme pode ser visualizado no Quadro 7. A terceira coluna do quadro indica a seção para acesso aos procedimentos metodológicos descritos em detalhe de acordo com os objetivos e cenários combinados.

Quadro 7 - Relação entre objetivos geral e específicos da tese e cenários NeOn

Objetivos da tese Uso de cenários NeOn Seções da tese que refletem o

método utilizado

Identificar e selecionar recursos ontológicos e não ontológicos no

domínio multimídia.

Cenário 2: reúso e reengenharia

de recursos não ontológicos.

Cenário 3: reúso de recursos

ontológicos.

Seções 4.2.1 e 4.2.2

Analisar e comparar ontologias multimídia à luz de requisitos

previamente propostos.

Cenário 3: reúso de recursos

ontológicos. Seção 4.2.3

Selecionar ontologias multimídia adequadas a reúso de recursos de

conhecimento destinados à construção do modelo proposto.

Cenários 3 e 5: reúso,

alinhamento e combinação de

recursos ontológicos. Seção 4.2.4

Desenvolver um modelo conceitual baseado em ontologias

para o domínio de anotação de documentos multimídia.