MOGNO: um modelo computacional para análise da dinâmica florestal

(1)

Universidade Federal do Amazonas

Instituto de Computa¸c˜

ao

Programa de P´

os-Gradua¸c˜

ao em Inform´

atica

MOGNO: um modelo computacional para

an´

alise da dinˆ

amica florestal

Daniella Rodrigues Bezerra

(2)

Universidade Federal do Amazonas

Instituto de Computa¸c˜

ao

Daniella Rodrigues Bezerra

MOGNO: um modelo computacional para an´

alise

da dinˆ

amica florestal

Segunda qualifica¸cão submetida à comissão do Programa de Pós-Gradua¸cão em Informática da UFAM, como parte dos requisitos necessários à candidatura para o Doutorado em Informática.

´

Area de concentra¸c˜ao: Engenharia de Soft-ware. Sub-´area: Compiladores e Linguagem de Dom´ınio Espec´ıfico.

Orientador: Prof Raimundo da Silva Barreto, Dr.

(3)

Daniella Rodrigues Bezerra

MOGNO: um modelo computacional para

an´

alise da dinˆ

amica florestal

Segunda qualifica¸cão submetida à comissão do Programa de Pós-Gradua¸cão em Informática da UFAM, como parte dos requisitos necessários à candidatura para o Doutorado em Informática.

´

Area de concentra¸c˜ao: Engenharia de Soft-ware. Sub-´area: Compiladores e Linguagem de Dom´ınio Espec´ıfico.

BANCA EXAMINADORA

Prof. Raimundo da Silva Barreto, Dr., Presidente Universidade Federal do Amazonas

Prof. Francisco Heron de Carvalho J´unior, Dr., Membro Universidade Federal do Cear´a

Prof. Marco Antˆonio Pinheiro de Cristo, Dr., Membro Universidade Federal do Amazonas

(4)

Que vocês sejam grandes empreendedores. Se empreenderem, não tenham medo de falhar. Se falharem, não tenham medo de chorar. Se chorarem, repensem a sua vida, mas não desistam. Dêem sempre uma nova chance a si mesmos.

(5)

Resumo

As florestas representam um componente fundamental para o sistema climático pois contribuem diretamente na regula¸cão do clima e influenciam em varios ciclos como o hidrológico, de carbono e energia. Este forte elo de coopera¸cão entre as florestas e o sistema climático vem despertando o interesse da comunidade cient´ıfica em compreender melhor as vulnerabilidades, impactos e a capacidade de regenera¸cão das florestas diante de mudan¸cas climáticas. Trata-se de um dom´ınio complexo que envolve muitos questionamentos sobre a análise da dinâmica florestal, estimativa de carbono e que sofre uma carência de modelos computacionais formais capazes de auxiliar tais atividades. Este trabalho de pesquisa aborda o problema de como ma-ximizar a análise da dinâmica florestal e estimativa de carbono minimizando tempo, custo, esfor¸co e propõe um modelo computacional formado por dois componentes centrais inovadores que são respectivamente: a linguagem de dom´ınio espec´ıfico Car-bonQL e a ontologia Carbontology. Esses dois componentes integrados formam o modelo Mogno que usa a Engenharia Guiada por Modelos como método para a in-tegra¸cão e modulariza¸cão dos mesmos. A partir da linguagem CarbonQL conectada a um banco de dados cient´ıfico, os engenheiros florestais podem obter respostas aos seus questionamentos por meio da especifica¸cão de consultas usando a terminologia do dom´ınio, formalizada por este trabalho através da Carbontology. Este trabalho tem como principal contribui¸cão cient´ıfica a prova de que o modelo Mogno parte dos questionamentos feitos pelos especialistas ao n´ıvel de execu¸cão computacional de tal forma que propriedades do dom´ınio possam ser extra´ıdas e validadas de forma otimizada.

(6)

Lista de Figuras

1.1 Fase de concep¸cão da metodologia. . . 8 1.2 Fase de avalia¸cão da metodologia. . . 9 2.1 Tradicional abordagem entre a modelagem matemática e

computaci-onal, adaptada de Daniluk [9]. . . 13 3.1 Metodologia sugerida por Shull et al. [42] e estendida por Mafra et

al. [32]. . . 23 3.2 Detalhamento da fase de concep¸c˜ao, composta pelo ciclo do projeto

piloto e mapeamento sistemático. . . 25 3.3 Detalhamento do ciclo de avalia¸cão e revisão sistemática da

metodo-logia. . . 27 3.4 Atividades de pesquisa, ferramentas usadas no desenvolvimento e

es-for¸co demandado em ambas as fases desta pesquisa. . . 34 3.5 Adapta¸c˜ao da Metodologia de Shull et al. [42] para o contexto desta

pesquisa em fun¸c˜ao do tempo. . . 34 5.1 Fluxo MDE adaptado de Haan [21] e as respectivas escolhas

tec-nológicas desta pesquisa que dão suporte à implementa¸cão. . . 42 5.2 Abstra¸cão MDE para o desenvolvimento da linguagem CarbonQL. . . 44 5.3 Fragmento da gramática CarbonQL em formato EBNF. . . 46 5.4 Projeto do compilador CarbonQL. . . 48 5.5 Visão macro do padrão MVC no projeto. . . 50 5.6 Visão micro do padrão MVC aplicado ao Compilador CarbonQL. . . 51 5.7 Instâncias da classe CarbonBalance. . . 54 5.8 Propriedade de tipo de dados da classe CarbonEstimationMethod. . . 55 5.9 Propriedade objeto locatedIn e uma classe anônima. . . 55 5.10 Classes disjuntas. . . 56

(7)

LISTA DE FIGURAS vii

6.1 Fluxo para a condu¸cão da Revisão Sistemática. . . 60 7.1 Uso do compilador CarbonQL: do questionamento do usuário a

(8)

Lista de Tabelas

3.1 Plano de Desenvolvimento da Pesquisa . . . 28 3.2 Distribui¸cão de atividades do cronograma por semestre de cada ano. . 30 5.1 Interpreta¸cão das principais regras da gramática CarbonQL. . . 45 5.2 Equa¸cões e coeficientes de regressão (Araújo et. al. [2], tabela 1).

FW - fresh weight - é o peso fresco (kg), D - diameter - diâmetro à altura do peito (cm), H - tree hight - altura total da árvore (m), ρ densidade média da madeira (g cm−3), M teor médio de humidade por unidade de biomassa fresca, α, β, γ e Φ coeficiente de regressão, e R2 _{coeficiente de determina¸c˜}_{ao. . . 52}

5.3 Algumas consultas de interesse dos especialistas relacionadas a dinâmica florestal e estimativa do carbono que foram identificadas durante a etapa de análise. . . 57 6.1 Metas de Publica¸cões - Conferências Candidatas. . . 62 6.2 Metas de Publica¸cões - Periódicos Candidatos. . . 62

(9)

Sum´

ario

Resumo v

Lista de Figuras vi

Lista de Tabelas viii

1 Introdu¸c˜ao 1

1.1 Motiva¸c˜ao e Justificativa . . . 4

1.2 Quest˜oes de Pesquisa . . . 5

1.3 Objetivos . . . 6

1.4 Metodologia . . . 7

1.5 Organiza¸c˜ao da Proposta de Tese . . . 9

I

Fundamenta¸

c˜

ao Te´

orica

11

2 Modelos computacionais 12 2.1 Modelagem e Modelos Computacionais: conceitos e motiva¸c˜oes . . . . 12

2.2 Contribui¸c˜ao dos Modelos Computacionais . . . 14

2.3 Engenharia Guiada por Modelo . . . 15

2.4 Linguagens de Dom´ınio Espec´ıfico . . . 16

2.5 Ontologias Formais . . . 18

2.6 Considera¸c˜oes Finais . . . 20

II

Descri¸

c˜

ao Metodol´

ogica

21

3 Instrumental de Pesquisa 22 3.1 Metodologia . . . 22

3.1.1 Fase de Concep¸c˜ao do Modelo . . . 23 ix

(10)

SUM ´ARIO x

3.1.2 Fase de Avalia¸c˜ao do Modelo . . . 26

3.2 Plano de Desenvolvimento da Pesquisa . . . 27

3.3 Cronograma . . . 28

III

Apresenta¸

c˜

ao, An´

alise e Interpreta¸

c˜

ao dos Resultados

Parciais

36

4 Mogno: um modelo computacional para análise da dinâmica flores-tal 37 4.1 Visão Geral . . . 37

4.2 Contribui¸c˜oes Esperadas . . . 38

4.3 Avalia¸c˜ao da Proposta . . . 39

5 Implementa¸cão e Aplica¸cão do Modelo Mogno 40 5.1 Introdu¸cão . . . 40

5.2 A linguagem CarbonQL . . . 43

5.3 A ontologia Carbontology . . . 50

5.3.1 Escopo . . . 51

5.3.2 Processo de Desenvolvimento . . . 53

5.4 Estudo de caso: uma análise do sequestro e emissão de carbono em uma área da floresta amazônica . . . 56

6 Próximos Passos 59 6.1 Revisão Sistemática . . . 59

6.2 Aprimoramento e Avalia¸c˜ao do Modelo Mogno . . . 60

6.3 Publica¸c˜oes . . . 61

6.3.1 Artigos Aceitos . . . 61

6.3.2 Metas de Publica¸c˜oes . . . 61

7 Conclus˜oes 63 7.1 Resultados Obtidos . . . 63

7.2 Limita¸c˜oes . . . 65

(11)

Cap´ıtulo 1

Introdu¸

c˜

ao

Técnicas como generaliza¸cão e especializa¸cão são utilizadas pela ciência para mo-delar, analisar e explicar fenômenos nas mais diversas áreas do conhecimento. Na computa¸cão um dos modelos teóricos pioneiros que fundamenta a generaliza¸cão e a especializa¸cão é a máquina de Turing [13]. Do ponto de vista da generaliza¸cão, Tu-ring propôs uma máquina universal, capaz de dizer se uma dada fun¸cão naturalmente considerada computável, pode ser computada por seu modelo abstrato. Já do ponto de vista espec´ıfico, a máquina de Turing é usada para representar aspectos lógicos do funcionamento de um computador como memória, estados e transi¸cões. Linguagens de programa¸cão ou de especifica¸cão surgiram a partir deste modelo teórico proposto e são usadas basicamente em propósitos gerais ou espec´ıficos, cujo termo popular em inglês é respectivamente General Purpose Language (GPL) e Domain Specific Language (DSL)1

As GPLs tais como Java, C, Python, etc., oferecem um amplo conjunto de abs-tra¸cões disponibilizando flexibilidade ao programador para constru¸cão de sistemas relacionados aos mais variados dom´ınios como processos de negócios, computa¸cão numérica, processamento simbólico, programa¸cão cient´ıfica, entre outros. Já as DSLs são mais pontuais e restritas (conjunto reduzido de nota¸cões e abstra¸cões) ao subdom´ınio para o qual elas foram projetadas, por exemplo, Eugene [4] é uma DSL para especifica¸cão e defini¸cão de restri¸cões de partes, recursos e regras associadas a elementos da biologia sintética. Esta DSL foi desenvolvida com o intuito de permitir que biólogos e outros especialistas de áreas correlatas e com o mesmo interesse de pesquisa possam criar de forma autônoma e padronizada suas especifica¸cões sobre o

1_{Por uma quest˜}_{ao de padroniza¸}_c˜_{ao com a literatura internacional, no decorrer deste trabalho}

ser˜ao utilizadas as siglas GPL para referenciar linguagem de prop´osito geral e DSL para linguagem de dom´ınio espec´ıfico.

(12)

2

dom´ınio. Como resultado, os especialistas passaram a ter um método formal e que adicionou mais confiabilidade as especifica¸cões. Eugene é uma alternativa ao método ad-hoc que agregou maior produtividade na análise do DNA (deoxyribonucleic acid ). Desde o modelo de Turing aos atuais, que derivaram ou não deste, os problemas da área de modelagem computacional investigados por este trabalho são:

Problema 1. Mapear quais problemas podem ser ou n˜ao computados em um dado modelo computacional e,

Problema 2. Como evoluir os modelos computacionais para otimizar a representa¸c˜ao e a solu¸c˜ao dos problemas do mundo real.

Existem vários métodos que sugerem um ponto de partida à obten¸cão de solu¸cões de tais problemas. Um deles é a engenharia guiada por modelos, em inglês, model-driven engineering (MDE), que procura contribuir com seus exemplos de heteroge-neidade através da automa¸cão de modelos entre linguagens de modelagem de forma que modelos sejam transformados do alto para o baixo n´ıvel, resultando em um modelo pass´ıvel de execu¸cão, seja por gera¸cão de código ou pela interpreta¸cão de modelos.

MDE promove o uso de modelos em vários n´ıveis de abstra¸cão como artefatos para a especifica¸cão de sistemas bem como transforma¸cões automáticas do modelo do usuário em software e emerge como um paradigma promissor em engenharia de software por enfatizar o uso de modelos não apenas para fins de documenta¸cão e comunica¸cão, mas como artefatos que podem ser transformados em outros modelos. Dentro do contexto de MDE, as DSL’s representam para os especialistas o encap-sulamento de um determinado dom´ınio, capaz de melhorar a qualidade e produtivi-dade do desenvolvimento de software, como exemplificado anteriormente no caso da DSL Eugene. Parte desta produtividade está associada à possibilidade dos especia-listas desenvolverem, modificarem, validarem e testarem suas próprias aplica¸cões já que a sintaxe/semântica da linguagem contempla uma terminologia que faz parte do vocabulário comum, onde o mesmo pode ser descrito com o aux´ılio de uma ontologia formal.

De acordo com Henderson-Sellers [15], a ontologia formal, tema de pesquisa amplamente explorado pela área de inteligência artificial, pode ser definida como um conjunto de conceitos pertinentes a um dom´ınio e expressos em uma linguagem computacional de representa¸cão ontológica. Atualmente uma linguagem que vem ganhando popularidade neste contexto é a Web Ontology Language, informalmente conhecida como OWL.

(13)

3

Segundo France e Rumpe [12], pesquisas sobre técnicas de especifica¸cão, como ontologias formais, são particularmente relevantes porque linguagens de modelagem devem ter uma semântica formalmente definida caso realmente se queira criar mo-delos pass´ıveis de análise.

O projeto de uma DSL envolve uma análise profunda do dom´ınio, o que acarreta um custo significativo ao processo de desenvolvimento. De acordo com um estudo desenvolvido por Tairas et al. [45], a utiliza¸cão de ontologias na fase de análise de uma DSL pode reduzir significativamente o custo do projeto. Neste mesmo estudo também são apresentados ind´ıcios de que ontologias podem ser utilizadas também em fases posteriores como projeto e desenvolvimento.

Kaufmann e Bernstein [23] fizeram uma avalia¸cão de quatro linguagens de con-sulta, com n´ıveis formais diferentes, variando da consulta feita em linguagem natural, no idioma inglês (e.g. Chinese restaurants in San Francisco? ) usando a ferramenta NLPReduce, passando por duas pseudo-linguagens, análogas ao portugol porém em inglês, chamadas Querix e Ginseng e uma linguagem visual chamada Semantic Crys-tal que permite definir consultas usando uma estrutura gráfica que se assemelha com mapas conceituais ou grafo.

Todas as quatro ferramentas avaliadas, usam ontologias como base para a termi-nologia do dom´ınio e isso confere maior autonomia ao usuário pois um vocabulário intuitivo pode ser utilizado na elabora¸cão de uma consulta sem exigir um esfor¸co ex-tra para aprender uma DSL. Em conex-trapartida, o esfor¸co é repassado ao engenheiro de software que precisa incorporar ao projeto uma base ontológica que contemple uma ampla ou restrita cobertura de termos em linguagem natural. Este tipo de abordagem é particularmente relevante para este trabalho que tem como objetivo espec´ıfico avaliar de que forma ontologias podem ser efetivamente incorporadas aos compiladores de DSL, bem como vantagens e desvantagens deste método.

Como a área de modelagem computacional é multi e interdisciplinar, os Proble-mas 1 e 2 também são amplamente discutidos em outras áreas de conhecimento, por exemplo, na Engenharia Florestal. As florestas representam um componente funda-mental para o sistema climático pois contribuem diretamente na regula¸cão do clima e influenciam em vários ciclos como o hidrológico, de carbono e energia. Este forte elo de coopera¸cão entre as florestas e o sistema climático vem despertando o interesse da comunidade cient´ıfica em compreender melhor as vulnerabilidades, impactos e a capacidade de regenera¸cão das florestas diante de mudan¸cas climáticas. Trata-se de um dom´ınio complexo que envolve muitos questionamentos sobre a análise da

(14)

1.1 Motiva¸c˜ao e Justificativa 4

dinˆamica florestal, estimativa de carbono e que sofre uma carˆencia de modelos com-putacionais formais capazes de auxiliar tais atividades. Essas dificuldades fazem com que os engenheiros florestais se deparem com o seguinte problema:

Problema 3. Como maximizar a an´alise da dinˆamica florestal e estimativa de car-bono minimizando tempo, custo, esfor¸co?

Segundo um levantamento feito por Juvenal e Mattos [22], o Brasil é o segundo pa´ıs com maior cobertura florestal do mundo, superado apenas pela Rússia. Com tal extensão de cobertura florestal, além de posi¸cão estratégica nas questões ambientais globais, o Brasil possui um grande potencial produtivo de produtos madeireiros e servi¸cos ambientais. Inicialmente este fato motivou a investiga¸cão deste dom´ınio como um poss´ıvel estudo de caso, realiza¸cão de experimentos e aplica¸cões práticas para esta pesquisa já que do ponto de vista computacional, a dinâmica florestal é um dom´ınio de estudo muito suscet´ıvel a abstra¸cões e simula¸cões, ideal para a aplica¸cão e análise de modelos computacionais.

1.1 Motiva¸

c˜

ao e Justificativa

Com base nos Problemas 1, 2 e 3, é poss´ıvel observar uma interse¸cão nos interesses de pesquisa que resultou no mapeamento de dois grupos relevantes para o contexto desse trabalho: (i) comunidade da ciência da computa¸cão, interessada em criar/evoluir modelos computacionais e aplicar métodos como MDE e linguagens formais (GPLs ou DSLs) em sistemas complexos que representem abstra¸cões do mundo real, com o objetivo de entender como modelos, metamodelos e métodos podem ser otimizados, e (ii) a comunidade da engenharia florestal com interesse em obter respostas para questões que resultem em uma melhor compreensão da dinâmica florestal e ciclo do carbono já que o tema envolve a sociedade como um todo, desde a¸cões individuais, passando pela cadeia produtiva, econômica e chegando ao n´ıvel de decisões governamentais.

A motiva¸cão para a análise deste dom´ınio está no fato de a atividade madei-reira e a cadeia produtiva a ela associada contemplarem problemas interessantes de serem investigados do ponto de vista computacional e por ser um dom´ınio mundi-almente em evidência já que em vários pa´ıses, a atividade madeireira é objeto de investimentos e transa¸cões comerciais de elevado valor.

A justificativa para a realiza¸cão deste trabalho está alinhada com os grandes desafios da pesquisa em computa¸cão no Brasil (2006-2016), mapeados e discutido

(15)

1.2 Quest˜oes de Pesquisa 5

em um seminário realizado pela Sociedade Brasileira da Computa¸cão. Um dos cinco grandes desafios está associado à “modelagem computacional de sistemas complexos artificiais, naturais e da intera¸cão homem-natureza”. A modelagem computacional envolve um grande conjunto de algoritmos e técnicas de simula¸cão, manipula¸cão, minera¸cão de dados, dentre outros, em que o modelo é um dos produtos da pesquisa, sendo interpretado como um processo computacional que filtra, transforma, aglutina e gera dados. Isto envolve frequentemente coopera¸cão entre cientistas da computa¸cão e de outros dom´ınios. Normalmente, na modelagem computacional há incertezas sobre o próprio modelo, pois esses envolvem um grande número de parâmetros que devem ser explorados e ajustados [5].

Este trabalho tem como principal contribui¸c˜ao cient´ıfica a prova de que o mo-delo Mogno parte dos questionamentos feitos pelos engenheiros florestais ao n´ıvel de execu¸c˜ao computacional de tal forma que propriedades do dom´ınio possam ser extra´ıdas e validadas de forma otimizada.

1.2 Quest˜

oes de Pesquisa

A análise da dinâmica florestal é um tópico de pesquisa que está em constante investiga¸cão, por não haver uma tecnologia consolidada nesta área. Por isso podem ser encontrados diversos questionamentos que levam a novos caminhos de pesquisa. As questões de pesquisa deste trabalho são as seguintes:

Questão de Pesquisa 1. É viável o desenvolvimento de um modelo computacional para análise da dinâmica florestal?

Atualmente existem modelos que contemplam mais a parte de simula¸cão, com o objetivo de imitar o comportamento de crescimento e mortalidade de árvores e fatores de perturba¸cão do cenário como queimadas, fenômenos climáticos, desmata-mento, reflorestadesmata-mento, etc. Até o momento, nenhum modelo foi desenvolvido com o intuito de estabelecer um mecanismo de consultas aos dados do dom´ınio que via-bilize a análise dos mesmos e que leve em considera¸cão a autonomia dos engenheiros florestais para obter respostas aos seus questionamentos.

Questão de Pesquisa 2. Que linguagens formais podem ser obtidas a partir de um modelo computacional para análise da dinâmica florestal?

Uma das poss´ıveis formas de se compreender o poder de expressividade de um modelo computacional ´e atrav´es da classe das linguagens formais que o modelo

(16)

1.3 Objetivos 6

pode gerar. Ao fazer uma analogia com a tese de Turing, qualquer programa de computador2 _{pode ser traduzido em uma m´}_{aquina de Turing, e qualquer m´}_aquina

de Turing pode ser traduzida para uma GPL.

Questão de Pesquisa 3. Que interfaces multimodais extens´ıveis podem ser usadas com o intuito de facilitar a configura¸cão dinâmica dos modelos?

O desenvolvimento de modelos corretos envolve uma alta complexidade e é uma atividade que demanda tempo e um extraordinário esfor¸co de implementa¸cão e pro-jeto. Todo esse custo dificulta o processo de adapta¸cão, portabilidade, integra¸cão e neste caso, interfaces multimodais extens´ıveis que facilitem a configura¸cão dinâmica dos modelos são muito bem-vindas.

Questão de Pesquisa 4. Quais são os aspectos que um modelo computacional precisa contemplar, para que possa ser considerado potencialmente satisfatório?

Um modelo computacional é criado inicialmente com o intuito de representar fatos, eventos, objetos e/ou processos. Normalmente os modelos são mais simples que o mundo a ser modelado e espera-se obter com a implementa¸cão dos modelos a compreensão do mundo modelado. Um outro aspecto importante dos modelos e do processo de modelagem é que a mesma realidade pode ser modelada de diferentes maneiras, representando diferentes aspectos do problema ou diferentes visões. Do ponto de vista da valida¸cão cient´ıfica, é necessário estabelecer critérios formais para garantir que determinado modelo é potencialmente satisfatório dentro das fronteiras do seu propósito.

Questão de Pesquisa 5. Como ocorre o processo natural de análise da dinâmica florestal?

A modelagem computacional deve refletir primeiramente a realidade constatada em pesquisas de manejo e inventário florestal. Isso porque todo modelo é uma representa¸cão do mundo real. Se a realidade em questão é a análise da dinâmica florestal, os questionamentos dos pesquisadores deste dom´ınio devem ser investigados para se obter tal concep¸cão.

1.3 Objetivos

O objetivo geral desta proposta de tese de doutorado ´e demonstrar que a partir do modelo Mogno, os engenheiros florestais podem obter respostas aos seus

(17)

1.4 Metodologia 7

namentos por meio da especifica¸c˜ao de consultas usando a terminologia do dom´ınio com o intuito de extrair e validar propriedades.

Em linhas gerais, este objetivo geral decomp˜oe-se nos seguintes objetivos es-pec´ıficos:

1. Criar uma DSL com base no benchmark3 _{da ´}_{area de Linguagens de Dom´ınio}

Espec´ıfico que receba como entrada consultas definidas sob a terminologia formalizada;

2. Formalizar a terminologia do dom´ınio de dinˆamica florestal por meio de uma ontologia formal e incorpor´a-la a DSL;

3. Gerar automaticamente c´odigo para um framework4 _{de mapeamento}

objeto-relacional de forma que as consultas originalmente especificadas na DSL sejam mapeadas do alto n´ıvel para um n´ıvel execut´avel em banco de dados relacional; 4. Aplicar MDE com o intuito de facilitar o entendimento dos objetos e eventos

modelados e facilitar a configura¸c˜ao dinˆamica dos modelos;

5. Avaliar o método proposto do ponto de vista do usuário (usando métricas como usabilidade, ortogonalidade, conformidade, etc.) e do processo (usando métricas como integrabilidade, suportabilidade, etc.).

1.4 Metodologia

A metodologia deste trabalho se divide, em alto n´ıvel, em duas fases incrementais e iterativas: (i) concep¸c˜ao e (ii) avalia¸c˜ao do modelo proposto.

A fase de concep¸cão compreende entrevistas com especialistas do dom´ınio e estu-dos in loco em reservas florestais para compreender a análise da dinâmica florestal e questões relacionadas bem como a identifica¸cão de evidências na literatura por meio de mapeamento sistemático [39] com o intuito de obter o estado-da-arte e respostas para questões de pesquisa em n´ıvel abrangente como: Quais os principais desafios

3_{De acordo com a ´}_{area de compiladores e linguagens, benchmark ´}_{e um conjunto de parˆ}_ametros

definidos com o intuito de avaliar performance e qualidade. Funciona como um referencial do que é considerado satisfatório dentro de um escopo estabelecido e reconhecido pela comunidade cient´ıfica. Um exemplo prático é o benchmark de compiladores livres (GCC, LLVM, PCC e Open64).

4_{Framework ´}_{e uma estrutura de sistema que deve ser instanciada. O processo de instancia¸}_c˜_ao

(18)

1.4 Metodologia 8

da área? Quais são os tópicos mais investigados? Quais são os tipos de pesquisa mais populares? Quais são os principais ve´ıculos de publica¸cão? etc.

A proposta do Mogno se concretiza através da constru¸cão de um projeto piloto para valida¸cão da ideia. A fase de concep¸cão se subdivide em quatro etapas que são respectivamente: (1) análise, (2) projeto, (3) implementa¸cão e (4) teste, conforme Figura 1.1.

Figura 1.1: Fase de concep¸c˜ao da metodologia.

Uma revisão exploratória da literatura e o mapeamento dos requisitos são os ar-tefatos de entrada para a fase de concep¸cão gerando como sa´ıda o projeto piloto, ou seja, o modelo Mogno, inicialmente em escala simplificada e reduzida que gradati-vamente é incrementado com as várias itera¸cões da fase de concep¸cão. Desta forma, é poss´ıvel observar que existe uma subfase de desenvolvimento embutida dentro da fase de concep¸cão pois compreende-se que o conhecimento cient´ıfico é dinâmico e que a concep¸cão guia o desenvolvimento. Ao final dessas itera¸cões ou ciclos, a ideia é que se obtenha um modelo apto a ser submetido como entrada para a próxima etapa que é a avalia¸cão emp´ırica.

A fase de avalia¸cão compreende a análise de evidências na literatura por meio de revisão sistemática [25] com o intuito de obter respostas para questões mais objetivas de pesquisa que evolu´ıram ao longo do processo de concep¸cão/desenvolvimento. No contexto desta pesquisa, foi selecionado o Framework de Experimenta¸cão proposto por Basili [3] que compreende em alto n´ıvel as seguintes etapas: (1) planejamento dos experimentos, (2) projeto, (3) coleta de dados e mensura¸cão e (4) análise e interpreta¸cão, conforme Figura 1.2.

O modelo em si, gerado pela fase de concep¸cão, é a entrada para a fase de avalia¸cão. A interpreta¸cão dos resultados e novas descobertas representam a sa´ıda e respectivas contribui¸cões cient´ıficas deste trabalho.

Esta pesquisa é do tipo explicativa pois visa esclarecer que ganhos a análise da dinâmica florestal pode obter com um modelo computacional capaz de filtrar, transformar e gerar dados bem como a identifica¸cão de incertezas sobre o próprio

(19)

1.5 Organiza¸c˜ao da Proposta de Tese 9

Figura 1.2: Fase de avalia¸c˜ao da metodologia.

modelo, já que parâmetros devem ser explorados e ajustados juntamente com a iden-tifica¸cão dos fatores que determinam e contribuem para uma melhor representa¸cão do dom´ınios espec´ıficos.

A pesquisa também se caracteriza como experimental do ponto de vista dos pro-cedimentos emp´ıricos utilizados pois um dos objetivos deste trabalho considera a aplica¸cão do Mogno e a avalia¸cão de quão bom é este modelo para o propósito es-tabelecido. Segundo as boas práticas cient´ıficas, novos métodos, modelos, técnicas, linguagens e ferramentas não devem ser apenas sugeridos, publicados ou apresenta-dos sem a devida experimenta¸cão e valida¸cão. Uma das melhores formas de garantir um modo sistemático e controlado para tal valida¸cão é por meio da utiliza¸cão de um método experimental.

1.5 Organiza¸

c˜

ao da Proposta de Tese

Esta proposta está dividida em três partes. A Parte I, “Fundamenta¸cão Teórica”, corresponde ao estudo realizado e concentra as referências mais relevantes para este trabalho. O Cap´ıtulo 2 aborda conceitos relacionados a modelos e modelagem com-putacional bem como a importância de MDE como uma interface multimodal ex-tens´ıvel capaz de facilitar a configura¸cão dinâmica dos modelos. Este tópico é par-ticularmente relevante para o contexto deste trabalho pois está relacionado com uma das questões de pesquisa. As DSLs também são abordadas neste Cap´ıtulo e discutidas dentro do contexto das linguagens formais. Ontologias Formais também são discutidas neste Cap´ıtulo bem como a interse¸cão com MDE e DSLs. A Parte II, trata da orienta¸cão metodológica utilizada para a condu¸cão deste trabalho. O Cap´ıtulo 3, destaca o escopo do projeto, os métodos, técnicas utilizadas, plano de desenvolvimento da pesquisa e o cronograma. A Parte III apresenta os resultados parciais obtidos pelo trabalho. O Cap´ıtulo 4 apresenta o modelo Mogno e a sua formaliza¸cão. O Cap´ıtulo 5 apresenta uma análise da aplica¸cão prática do modelo

(20)

1.5 Organiza¸c˜ao da Proposta de Tese 10

Mogno bem como os principais artefatos produzidos a partir deste modelo que são respectivamente a DSL CarbonQL e a ontologia Carbontology. Para tal, um estudo de caso foi elaborado com o intuito de ilustrar a análise do sequestro e emissão de carbono em uma área experimental da floresta amazônica usada por pesquisadores da engenharia florestal. O Cap´ıtulo 6 apresenta os próximos passos que serão ado-tados no decorrer da pesquisa. Para finalizar, a conclusão do trabalho é apresentada no Cap´ıtulo 7 seguida pelas referências utilizadas no desenvolvimento deste.

(21)

Parte I

Fundamenta¸

c˜

ao Te´

orica

(22)

Cap´ıtulo 2

Modelos computacionais

O objetivo central deste Cap´ıtulo é discutir sobre conceitos, motiva¸cões, be-nef´ıcios e desvantagens dos modelos computacionais ao longo das Se¸cões 2.1 e 2.2. Através do levantamento do estado da arte e da prática, a Engenharia Guiada por Modelo, discutida na Se¸cão 2.3, foi identificada como uma metodologia capaz de mi-nimizar a complexidade relacionada a modelagem computacional. As Linguagens de Dom´ınio Espec´ıfico são discutidas na Se¸cão 2.4 como uma abordagem de destaque para gera¸cão, tradu¸cão e transforma¸cão de modelos. Na Se¸cão 2.5 discute-se sobre Ontologias Formais. Finalmente, a Se¸cão 2.6 apresenta algumas considera¸cões.

2.1 Modelagem e Modelos Computacionais:

con-ceitos e motiva¸

c˜

oes

Modelagem é a atividade de construir modelos que expliquem as caracter´ısticas ou o comportamento de fenômenos. Os modelos computacionais representam uma forma de obter elicita¸cão e predi¸cão que vai muito além do próprio modelo. A constata¸cão deste fato pode ser observada através de inúmeros exemplos no campo cient´ıfico onde pesquisadores fazem uso de modelos computacionais para descrever, implementar, testar teorias e consequentemente obter experimentos sobre elas e se surpreendem com os resultados capazes de fornecer entendimento para áreas de conhecimento que não estão diretamente relacionadas com a teoria original.

Assim, a motiva¸cão fundamental para a modelagem computacional é que ela ofe-rece uma liberdade relativa aos mecanismos de integra¸cão do modelo e do ambiente de experimentos, juntamente com a capacidade de observar as consequências, por vezes não óbvias, de tais escolhas.

(23)

2.1 Modelagem e Modelos Computacionais: conceitos e motiva¸c˜oes 13

O esfor¸co desempenhado por pesquisadores que desenvolvem modelos para defi-nir explicitamente constru¸cões teóricas e as rela¸cões causais entre as mesmas também representa uma motiva¸cão para o uso da modelagem como uma ferramenta de in-vestiga¸cão. Nem sempre é poss´ıvel identificar com antecedência as consequências de certos compromissos teóricos, particularmente quando se desenvolve ou se faz uso de múltiplos mecanismos de intera¸cão. Em alguns casos, a única maneira de compreender as suas implica¸cões é formalizá-los matematicamente.

Daniluk [9] comenta sobre um poss´ıvel fluxo de formaliza¸cão, ilustrado na Fi-gura 2.1 que inicia com a modelagem matemática. Após o tratamento numérico é poss´ıvel criar um algoritmo. A atividade de implementa¸cão produz um modelo com-putacional implementado que permitirá a visualiza¸cão de resultados obtidos com o processamento de tal modelo pass´ıveis de análise, interpreta¸cão e aplica¸cão prática.

Figura 2.1: Tradicional abordagem entre a modelagem matem´atica e computacional, adaptada de Daniluk [9].

Modelos e aplica¸cões práticas ou experimentos comportamentais dos mesmos, são mutuamente informativos. Modelos implementam teorias, fornecem provas de suficiência, geram previsões, e respondem a perguntas sobre as teorias. Estudos comportamentais avaliam estas previsões e fornecer uma métrica para comparar modelos. Além disso, eles podem ajudar a compreender os processos, mesmo quando a teoria não é detalhada o suficiente para se construir um modelo.

(24)

2.2 Contribui¸c˜ao dos Modelos Computacionais 14

Schlesinger [40] comenta que para uma modelo ter sucesso ele deve oferecer uma explica¸cão em linguagem cientifica, sem se prender a jargões de modelagem e enfa-tiza que modelos podem construir n´ıveis de análise, por exemplo, genes-neurônios, neurônios-cérebro, cérebro-comportamento e de volta novamente formando um ciclo de análise. Desta forma, os modelos computacionais podem desempenhar um papel cr´ıtico no desenvolvimento de explica¸cões coerentes que abrangem esses n´ıveis.

Uma outra forte caracter´ıstica é que os modelos não tem necessariamente que capturar a vida, fenômenos ou processos como eles são. Modelos computacionais estão abertos a uma gama muito maior de experiências. Eles podem também ser expostos a entradas não naturais, ou manipuladas de uma maneira que não pode ser feito, por exemplo, com seres humanos. Isso os torna uma ferramenta ideal para investigar fenômenos que nem sempre podem ser estudados empiricamente in vivo.

Todas essas caracter´ısticas e fatores motivantes não querem dizer que a modela-gem computacional é isenta de riscos. Além das habilidades técnicas, a modelagem exige do pesquisador uma habilidade teórica complexa. Lane [31] argumenta que a concep¸cão de um modelo computacional útil e aplicável se restringir a um dom´ınio espec´ıfico. Modelos com compromissos mais abstratos são usados para responder questões mais teóricas.

2.2 Contribui¸

c˜

ao dos Modelos Computacionais

Modelos computacionais podem ter um papel crucial como parte do processo cient´ıfico-dedutivo. Cada modelo é uma implementa¸cão de uma teoria espec´ıfica e, quando bem sucedido, fornecem uma prova de demonstra¸cão de que a teoria é plaus´ıvel ou poss´ıvel. Modelos computacionais não só validam as teorias, mas também fornecem parâmetros que ajudam a rever teorias. Ao mesmo tempo, os mo-delos computacionais não apenas reproduzem descobertas centrais de experimentos cr´ıticos, mas também geram novas previsões e sugerem novos testes.

Uma das contribui¸cões mais importante dos modelos computacionais é conduzir a teoria em uma nova dire¸cão e ajudar na análise de consequências não óbvias de tais teorias. Assim como os modelos computacionais se tornam incrivelmente poderosos e complexos, é igualmente importante que eles se tornem acess´ıveis e compreens´ıveis, para que possam efetivamente contribuir com a interconexão entre novos modelos e teorias. A modelagem computacional está no seu melhor caso quando ela nos permite entender a gama de poss´ıveis mecanismos que podem dar origem a um

(25)

2.3 Engenharia Guiada por Modelo 15

comportamento e por que. Sendo assim, a utiliza¸cão da modelagem computacional permite fazer perguntas sobre determinadas teorias e descobrir novas consequências. A maioria dos modelos computacionais surgem a partir de um conjunto de com-promissos teóricos básicos. Desta forma, uma das perguntas mais comuns feitas por um modelo é se alguns fenômenos podem emergir, ou ser explicado, por tais princ´ıpios. Do ponto de vista da modelagem computacional, uma de suas contri-bui¸cões é viabilizar que no in´ıcio, comece com um modelo relativamente simples e se torne progressivamente elaborado através de um processo iterativo de projeto, teste e refinamento.

2.3 Engenharia Guiada por Modelo

Segundo Schmidt [41] uma metodologia que promete expressar efetivamente con-ceitos de dom´ınios complexos é a engenharia guiada por modelo (em inglês, model-driven engineering - MDE). MDE prioriza o desenvolvimento de software com foco na máxima produtividade, interoperabilidade, portabilidade e reusabilidade.

A ideia central desta metodologia inicia com modelos computacionais em alto n´ıvel de abstra¸cão (em inglês, Computational Independent Model - CIM). Em se-guida, o modelo é submetido a um processo de transforma¸cão que reduz o n´ıvel de abstra¸cão para um modelo independente da plataforma computacional usada (Pla-taform Independent Model - PIM) que representa a solu¸cão em n´ıvel de projeto para os requisitos do CIM. O PIM pode ser transformado em um ou mais modelos es-pec´ıficos para uma ou mais plataformas tecnológicas desejadas (Plataform Specific Model - PSM) que estará pronto para ser refinado ou diretamente usado.

MDE emerge como um paradigma promissor em engenharia de software por en-fatizar o uso de modelos não apenas para fins de documenta¸cão e comunica¸cão, mas como artefatos que podem ser transformados em outros modelos, código fonte ou scripts de teste [21, 18]. MDE promove o uso de modelos em vários n´ıveis de abs-tra¸cão como artefatos para a especifica¸cão de sistemas bem como a transforma¸cões automáticas do modelo do usuário em software.

Kent [24] sugere UML (Unified Modeling Language) como linguagem de mode-lagem PIM de forma que os modelos gerados possam ser transformado de forma semi ou automática para código. Linguagens expressivas como UML oferecem um bom suporte para modelagem de sistemas até um certo ponto de vista, facilitando a comunica¸cão entre múltiplas aplica¸cões. No entanto, sabe-se que quanto mais

(26)

2.4 Linguagens de Dom´ınio Espec´ıfico 16

expressiva é a linguagem de modelagem, mais dif´ıcil é o tratamento semântico da mesma. A complexidade de linguagens como UML se reflete em seus metamodelos. A identifica¸cão de dependência entre conceitos fica comprometida, dificultando o entendimento e o uso efetivo por parte dos desenvolvedores que necessitam mani-pulá-los e identificar se o metamodelo captura todas as dependências requeridas.

No entanto, de acordo com Hutchinson et al. [18] os resultados de sua pesquisa emp´ırica mostram que os usuários MDE utilizam várias linguagens de modelagem. Aproximadamente 85% dos entrevistados fazem uso de UML e aproximadamente 40% usam uma DSL de projeto próprio. Entretanto, há uma ambivalência significa-tiva sobre o equil´ıbrio entre a complexidade da UML. 43% dos participantes acham que UML é muito complexa comparado com 32% que discordam. Enquanto que 23% são neutros. Essa visão inconclusiva, indica que a discussão sobre linguagens de modelagem alternativas é bem-vinda, bem como entender que tipo de linguagem de modelagem pode representar melhor certos tipos de modelos.

2.4 Linguagens de Dom´ınio Espec´ıfico

As DSLs são linguagens de programa¸cão ou linguagens de especifica¸cão que ofe-recem um conjunto restrito de nota¸cões e abstra¸cões apropriadas ao dom´ınio para o qual elas foram projetadas [11, 27, 36]. SQL (Structured Query Language), por exemplo, é uma linguagem que permite apenas a cria¸cão de consultas e esquemas para bancos de dados e só atendem a este propósito, ao passo que uma linguagem de propósito geral (em inglês, General Purpose Language - GPL) como Java, possui um amplo conjunto de abstra¸cões, oferecendo flexibilidade ao desenvolvedor para constru¸cão de sistemas relacionados aos mais variados dom´ınios.

Muitos dos requisitos das GPLs se aplicam as DSLs. A diferen¸ca está no n´ıvel de importância para o contexto das DSLs, que segundo Kolovos et al. [29], são listados na seguinte ordem:

• Conformidade: as constru¸c˜oes da DSL devem corresponder a importantes con-ceitos do dom´ınio.

• Ortogonalidade: nada de ambiguidades. Cada constru¸c˜ao existente na lingua-gem ´e usada para representar exatamente um conceito distinto do dom´ınio. • Suportabilidade: uma DSL necessita de ferramentas complementares que

(27)

2.4 Linguagens de Dom´ınio Espec´ıfico 17

editar, rastrear erros (debugging) e transformar.

• Integrabilidade: a DSL e suas ferramentas, podem ser combinadas com ou-tras linguagens e ferramentas preferencialmente com o minimo esfor¸co. Isso ´

e essencial para integrar a DSL com outras facilidades usadas no processo de engenharia. Um requisito alternativo é a extensibilidade, ou seja, a DSL e suas ferramentas podem ser estendidas para suportar constru¸cões adicionais e conceitos. Entretanto, a integrabilidade é preferencialmente considerada como requisito para DSLs de forma a preservar a coerência semântica.

• Longevidade: o ciclo de vida de uma DSL est´a associado ao ciclo de vida do dom´ınio. Enquanto houver interesse de se investigar tal dom´ınio, o custo de desenvolvimento incremental da DSL e de suas ferramentas de suporte s˜ao justificados.

• Simplicidade: uma DSL deve ser o mais simples poss´ıvel, expressar os conceitos de interesse e dar aos seus usu´arios a forma esperada de trabalho e produ¸c˜ao de artefatos.

• Qualidade: a linguagem deve prover mecanismos que resultem na produ¸c˜ao de sistemas com qualidade. Isto inclui recursos que melhorem a confiabilidade, seguran¸ca, etc.

• Escalabilidade: a linguagem deve prover constru¸c˜oes que ajudem a gerenciar descri¸c˜oes em larga escala.

• Usabilidade: inclui requisitos como acessibilidade e simplicidade de compre-ens˜ao.

Segundo Deursen et al.[46], adotar uma DSL envolve benef´ıcios e riscos listados a seguir.

Os benef´ıcios de uma DSL incluem:

(i) Os softwares implementados em DSLs seguem a nomenclatura do dom´ınio e consequentemente, especialistas podem validar, modificar e desenvolver os programas.

(ii) A concis˜ao dos programas pode ser provada e validada mais facilmente e reu-sada para diferentes prop´ositos.

(28)

2.5 Ontologias Formais 18

(iii) A manutenibilidade, portabilidade e produtividade melhoram. (iv) Facilidade no reuso e conserva¸c˜ao do conhecimento mapeado.

As desvantagens do uso de uma DSL s˜ao:

(i) O custo de projetar, implementar e manter uma DSL. (ii) O custo de aprender uma DSL.

(iii) Dificuldade de definir o escopo de uma DSL.

(iv) Dificuldade de balancear as constru¸cões e poss´ıveis conexões entre DSL e GPL. (v) Potencial perda de eficiência quando comparada a codifica¸cão de programas

feita por programadores.

No contexto de MDE, os modelos come¸caram a ser desenvolvidos inicialmente em linguagens de modelagem de uso geral, tais como o UML (Unified Modeling Language). Atualmente o estado da arte é a utiliza¸cão de DSLs, que fornecem aos especialistas do dom´ınio a op¸cão de trabalhar no espa¸co do problema sem se preocupar com detalhes técnicos do espa¸co da solu¸cão.

Publica¸c˜oes recentes demonstram um crescente interesse da comunidade cient´ıfica pelo uso de DSLs em abordagens como o desenvolvimento de software dirigido por modelos [44, 12] e arquitetura dirigida por modelo [28, 8]. Estas abordagens usam DSLs com linguagens que representam uma abstra¸c˜ao familiar aos especialistas do dom´ınio.

A integra¸cão entre DSL e MDE vem se destacando do ponto de vista prático e cient´ıfico por criar camadas eficientes entre a especifica¸cão ou modelagem do pro-blema e a modulariza¸cão da solu¸cão. No contexto de problemas computacionalmente complexos, essa divisão pode ser crucial por viabilizar o mapeamento de solu¸cões eficientes.

2.5 Ontologias Formais

De acordo com Sellers [15], ontologias formais amplamente exploradas pela área de inteligência artificial tem sido desenvolvida em paralelo a metamodelos investiga-dos por MDE, mas estuinvestiga-dos mostram que ambos possuem similaridades. No contexto desta pesquisa, uma ontologia formal é um conjunto de conceitos, expressos em uma

(29)

2.5 Ontologias Formais 19

linguagem de representa¸cão ontológica. No contexto desta pesquisa, a linguagem selecionada foi OWL DL [34] por permitir inferência lógica realizada por mecanis-mos de racioc´ınio automático com suporte a valida¸cão de consistência, verifica¸cão de satisfabilidade, classifica¸cão, taxonomia e consultas.

Afsharchi [1] apresenta uma defini¸cão para ontologias formais onde esta é definida como uma estrutura O := (C, ≤C, R, σ, ≤R). C e R são conjuntos disjuntos onde

os membros de C são chamados de conceitos e os membros de R são chamados de rela¸cões. ≤C é uma ordem parcial de C chamada de hierarquia de conceitos ou

taxonomia e ≤R´e uma ordem parcial de R chamada de hierarquia de rela¸c˜ao.

Se c1 ≤C c2 para c1, c2 ∈ C, ent˜ao c1 ´e chamado de subconceito de c2 e c2

é superconceito de c1. Obviamente a rela¸cão ≤C é supostamente conectada com

conceitos que são definidos. Na literatura, as taxonomias são constru´ıdas usando-se rela¸cão de subconjuntos, ou seja, ci ≤C cj se e somente se para todo o ∈ ci tem-se

o ∈ cj. Esta defini¸c˜ao de ≤C produz uma ordem parcial em C que ´e usada pelas

ontologias formais.

Os conceitos podem ser vistos como cole¸c˜oes de objetos que podem ter cer-tas caracter´ısticas instanciadas. Neste trabalho, para uma ontologia O existe um conjunto de caracter´ısticas F = f1, . . . , fn e para cada caracter´ıstica fi existe um

dom´ınio Di = vil, . . . , vimi que define os poss´ıveis valores e caracter´ısticas. Ent˜ao,

um objeto o = ([f1 = v1], . . . , [fn = vn]) ´e caracterizado por valores para cada

ca-racter´ıstica (muitas vezes uma caca-racter´ıstica é o nome de identifica¸cão de um objeto que por sua vez tem uma única combina¸cão de caracter´ısticas).

As ontologias formais oferecem vários benef´ıcios para a representa¸cão do conheci-mento. O primeiro deles é que métodos formais introduzem o conceito de corretude ao sistema. O segundo benef´ıcio é o fato da estrutura lógica de um problema ser en-fatizada ao invés de uma constru¸cão engessada de um procedimento para resolvê-lo. Isso permite que o conhecimento seja reusado e inferido sobre o dom´ınio.

Trabalhos relacionados a técnicas de especifica¸cão formal são particularmente relevantes para MDE pois DSLs devem incorporar uma semântica formalmente defi-nida caso realmente se queira criar modelos pass´ıveis de análise. Pesquisas apontam que MDE necessita que a manipula¸cão dos modelos seja baseada na semântica e em seus aspectos apropriados e as linguagens de modelagem devem ser formalizadas [12].

A ideia de agregar ontologias + DSLs + MDE vem sendo gradativamente inves-tigada [43, 14, 30, 38]. Pahl [35] prop˜oe um processo de transforma¸c˜ao de modelos

(30)

2.6 Considera¸c˜oes Finais 20

baseado em ontologia como alternativa a clássica abordagem baseada em UML. Walter et al. [47] apresenta um framework que permite reusar o conhecimento de projeto e desenvolvimento de ontologias em DSLs. Já o interesse desta pesquisa é efetivamente embarcar uma ontologia no contexto de uma DSL de forma que a especifica¸cão feita por um usuário através da DSL siga a terminologia representada por uma ontologia.

2.6 Considera¸

c˜

oes Finais

Os modelos computacionais têm fornecido uma nova perspectiva sobre a compre-ensão de fenômenos e/ou processos, se destacando como uma poss´ıvel manipula¸cão metodológica posteriormente confirmada experimentalmente. Os modelos computa-cionais permitem responder perguntas sobre determinada teoria e, ocasionalmente, revelam consequências inesperadas a partir de pressupostos teóricos. No contexto desta pesquisa, a compreensão das caracter´ısticas, benef´ıcios e riscos dos modelos computacionais estão alinhadas com o objetivo central de pesquisa.

Com o intuito de mitigar as dificuldades relacionadas com o desenvolvimento de um modelo computacional, MDE foi investigada e adotada como metodologia capaz de fragmentar a complexidade dos modelos computacionais em camadas que vai do n´ıvel mais abstrato (espa¸co do problema) ao n´ıvel de execu¸c˜ao computacional (espa¸co da solu¸c˜ao).

As DSL são adotadas como uma eficiente abordagem para gera¸cão de modelos no PIM e/ou PSM. A decisão de onde aplicar uma DSL vai depender da caracter´ıstica do problema que se pretende resolver. Com base na análise do problema é que a arquitetura se definirá.

As ontologias contribuem com a representa¸cão formal de determinado dom´ınio. Como discutido na Se¸cão 2.1, um modelo computacional aplicável se restringe com frequência a um dom´ınio espec´ıfico e as ontologias auxiliam exatamente neste pro-cesso por meio de formalismo lógico.

(31)

Parte II

Descri¸

c˜

ao Metodol´

ogica

(32)

Cap´ıtulo 3

Instrumental de Pesquisa

O objetivo deste cap´ıtulo é apresentar o instrumental de pesquisa adotado para o desenvolvimento deste projeto. A Se¸cão 3.1 define a metodologia e detalha cada uma das fases e subfases previstas. O plano de pesquisa é discutido na Se¸cão 3.2. O cronograma estabelecido para esta pesquisa é apresentado na Se¸cão 3.3. Na Se¸cão 3.4 são discutidas as considera¸cões finais.

3.1 Metodologia

Segundo Denning [10] a ciência classifica conhecimento. Já a ciência experimen-tal classifica conhecimento derivado de observa¸cões. Desde a publica¸cão de Denning, que em 1980 chamou aten¸cão para a importância da experimenta¸cão na ciência da computa¸cão aos dias atuais, é poss´ıvel observar que gradativamente estamos cami-nhando para um n´ıvel maior de comprometimento com os experimentos. O enfoque experimental agrega muitos benef´ıcios como a possibilidade de eliminar abordagens inúteis e suposi¸cões errôneas. A experimenta¸cão ajuda também a orientar a enge-nharia e a teoria nas dire¸cões promissoras de pesquisa. Baseado neste princ´ıpio, a engenharia de software experimental sugere que, na medida do poss´ıvel, os métodos experimentais validados sejam reusados. Com base nesta sugestão, na análise das metodologias existentes e nas caracter´ısticas desta pesquisa, este trabalho segue a metodologia proposta por Shull et al. [42], posteriormente estendida por Mafra et al. [32] conforme Figura 3.1. Tal metodologia se divide, em alto n´ıvel, em duas fases: (i) concep¸cão e (ii) avalia¸cão do modelo proposto. Estas duas fases, sofreram uma adapta¸cão iterativa e incremental no contexto deste trabalho de acordo com a Figura 3.5.

(33)

3.1 Metodologia 23

Figura 3.1: Metodologia sugerida por Shull et al. [42] e estendida por Mafra et al. [32].

3.1.1 Fase de Concep¸

c˜

ao do Modelo

A fase de concep¸cão tem como objetivo criar o alicerce da pesquisa e ao final, gerar um projeto piloto que valide a ideia. Esta fase inicia com uma revisão explo-ratória ou ad-hoc da literatura com o intuito de se obter uma visão geral do problema de pesquisa, da problemática relacionada a área da dinâmica florestal, mapeamento prévio de modelos existentes, desafios associados a modelagem computacional, bem como a extra¸cão de termos técnicos e sinônimos, que posteriormente serão usados na formula¸cão da string de busca tanto no mapeamento como na revisão sistemática da literatura. É importante enfatizar a análise prévia da real necessidade de se realizar mapeamentos e/ou revisões sistemáticas da literatura. O pesquisador deve caracte-rizar, com base nos objetivos definidos, que tipo de pesquisa pretende realizar e em seguida investigar se não existe até o presente momento algum mapeamento e/ou revisão que possa ser reusado no contexto da pesquisa.

Em seguida são realizadas entrevistas com engenheiros florestais e estudos de observa¸cão in loco em reservas florestais para compreender a análise da dinâmica florestal e questões relacionadas. De posse da revisão ad-hoc e do estudo de ob-serva¸cão, requisitos iniciais de pesquisa são formulados.

Desta forma é poss´ıvel confrontar necessidades regionais, por exemplo, relacio-nadas ao cenário amazônico e necessidades mais abrangentes de pesquisa com base na revisão ad-hoc da literatura. Essa fundamenta¸cão é o primeiro ponto de partida

(34)

3.1 Metodologia 24

para auxiliar o pesquisador a identificar questões válidas ou não do ponto de vista cient´ıfico, foco, fatores motivacionais, objetivos, etc.

O próximo passo é iniciar ciclos iterativos e incrementais que vão compor a fase de concep¸cão, subdividindo-se, no caso desta pesquisa, nos subciclos de mapeamento sistemático e projeto piloto.

Mapeamento Sistem´atico

O mapeamento sistemático segue a mesma metodologia da revisão sistemática, porém com objetivo diferente. Através do mapeamento sistemático é poss´ıvel obter uma visão geral de determinada área de interesse e mapear quais subtópicos neces-sitam mais de estudos primários ou de estudos secundários. Já a revisão sistemática é considerada um estudo secundário pois usa os estudos primários como fonte para a compila¸cão de dados cient´ıficos e conclusões a partir de questões espec´ıficas de pesquisa. A diferen¸ca entre ambos os métodos é discutida com mais propriedade por Kitchenham [26].

O processo para a condu¸cão do mapeamento sistemático envolve três etapas: 1. Planejamento: os objetivos da pesquisa são listados e o protocolo do

mapea-mento ´e definido;

2. Execu¸cão: as fontes para o mapeamento são selecionadas, os estudos primários são identificados, selecionados e avaliados de acordo com os critérios de in-clusão, exclusão e de qualidade estabelecidos durante o protocolo do mapea-mento;

3. An´alise dos Resultados: os dados do estudo s˜ao extra´ıdos e sintetizados. Projeto Piloto

A proposta do Mogno se concretiza através da constru¸cão de um projeto piloto para valida¸cão da ideia. Este processo, compreende a constru¸cão de artefatos de pesquisa com base na engenharia guiada por modelos que sugere a constru¸cão sim-plificada do dom´ınio em duas camadas: (i) modelos independentes de plataforma e (ii) modelos de plataforma espec´ıfica. Com o objetivo de atender a camada (i), o projeto piloto gera a DSL CarbonQL e a Carbontology como artefatos. Entre a camada (i) e (ii) existe um tradutor de modelos chamado CarbonQLWalker e na camada (ii) temos o CarbonQL2HQL, um gerador de código para um framework

(35)

3.1 Metodologia 25

de mapeamento objeto-relacional que é responsável em gerenciar o mapeamento en-tre a CarbonQL (n´ıvel de especifica¸cão) e SQL (n´ıvel de execu¸cão). O framework selecionado foi o Hibernate [16] por ser um projeto open source consolidado e de desenvolvimento ativo capaz de oferecer o arcabou¸co necessário a este projeto. Os artefatos de pesquisa gerados na camada (i) e (ii) foram constru´ıdos com base nas seguintes etapas:

1. Análise: os requisitos previamente identificados são refinados e as caracter´ısticas, estruturas e comportamentos do projeto piloto são descritos em n´ıvel concei-tual;

2. Projeto: nesta etapa, o projeto piloto é descrito em um n´ıvel mais concreto, métodos, linguagens de programa¸cão, ferramentas e frameworks são avaliados e selecionados para que a fase seguinte seja realizada com base em um arcabou¸co tecnológico e cient´ıfico.

3. Implementa¸cão: os artefatos do projeto piloto são efetivamente implementados na forma de componentes com base nas decisões de projeto.

4. Teste: os artefatos são testados. Os que apresentarem algum tipo de falha ou restri¸cão retornam ao fluxo de implementa¸cão para que os mesmos sejam corrigidos ou reimplementados.

A Figura 3.2 ilustra cada uma das etapas da fase de concep¸c˜ao com destaque para os interesses de pesquisa de cada uma.

Figura 3.2: Detalhamento da fase de concep¸c˜ao, composta pelo ciclo do projeto piloto e mapeamento sistem´atico.

(36)

3.1 Metodologia 26

3.1.2 Fase de Avalia¸

c˜

ao do Modelo

A fase de avalia¸cão tem como objetivo identificar o quão bom é o modelo Mogno para o propósito estabelecido. Segundo as boas práticas cient´ıficas, novos métodos, modelos, técnicas, linguagens e ferramentas não devem ser apenas sugeridos, publi-cados ou apresentados sem a devida experimenta¸cão e valida¸cão. Uma das melhores formas de garantir um modo sistemático e controlado para tal valida¸cão é por meio de um método experimental.

No contexto desta pesquisa, a fase de avalia¸cão ocorre de forma iterativa e incre-mental com um subciclo de revisão sistemática seguindo os mesmos passos do mape-amento sistemático que são respectivamente: planejamento, execu¸cão e análise dos resultados. A execu¸cão desta revisão sistemática visa obter respostas para questões mais espec´ıfica relacionada aos modelos computacionais e consequentemente oferecer uma contribui¸cão em uma das subáreas de pesquisa carente de estudos secundários identificadas pelo mapeamento sistemático.

Para que o experimento ofere¸ca resultados válidos, ele deve ser adequadamente organizado e controlado. Com o propósito de atingir este objetivo várias metodolo-gias de organiza¸cão dos experimentos foram elaboradas, por exemplo, o Framework de Experimenta¸cão proposto por Basili [3] e adotado neste trabalho. Este framework possui as seguintes etapas:

1. Planejamento do Experimento: descreve os objetivos, o objeto do estudo, o foco da qualidade, o ponto de vista e contexto. Como resultado, a fase de planejamento fornece a dire¸cão geral do experimento, o seu escopo, a base para a formula¸cão das hipóteses e as nota¸cões preliminares para a avalia¸cão da validade.

2. Projeto: implementa a funda¸cão do experimento. Nesta fase o contexto é se-lecionado, as hipóteses são formuladas, as variáveis e os participantes são sele-cionados, ocorre a prepara¸cão da instrumenta¸cão e a considera¸cão da validade do experimento. O resultado dessa fase apresenta o experimento totalmente elaborado e pronto para execu¸cão.

3. Coleta de Dados e Mensura¸cão: Ocorre sobre a execu¸cão do experimento. Nesta fase é importante atentar ao fator humano. Os participantes devem ser preparados para a experimenta¸cão do ponto de vista moral e metodológico para evitar resultados errôneos devido ao mal-entendido ou falta de interesse. A

(37)

3.2 Plano de Desenvolvimento da Pesquisa 27

coleta de dados deve ser realizada de maneira que n˜ao cause efeito significativo ao estudo em andamento.

4. Análise e interpreta¸cão: oferecem as conclusões sobre a possibilidade da re-jei¸cão da hipótese nula, a redu¸cão do conjunto de dados, e a verifica¸cão das hipóteses. Nessa fase, os aspectos mais importantes são: escolher o teste estat´ıstico apropriado, explicar os resultados considerando os aspectos da va-lidade, realizar a análise custo-benef´ıcio, e interpretar corretamente os resul-tados negativos.

A Figura 3.3 ilustra cada uma das etapas da fase de concep¸c˜ao com destaque para os interesses de pesquisa de cada uma.

Figura 3.3: Detalhamento do ciclo de avalia¸cão e revisão sistemática da metodologia. A repeti¸cão é um princ´ıpio muito importante que deve ser considerado em um experimento pois está diretamente relacionado com a reprodu¸cão dos resultados por outros investigadores. Tal repeti¸cão é importante porque implica que as variáveis imprevistas não estão afetando os resultados. Os resultados dos experimentos não podem ser amplamente aceitos sem que a repeti¸cão interna ou externa seja aplicada.

3.2 Plano de Desenvolvimento da Pesquisa

A Tabela 3.1 destaca os principais objetivos, metas, atividades e indicadores previstos para esta pesquisa.

(38)

3.3 Cronograma 28

Tabela 3.1: Plano de Desenvolvimento da Pesquisa

Objetivos Metas Atividades Indicadores Criar uma DSL com

base no benchmark da ´

area de Linguagens de Dom´ınio Espec´ıfico que receba como entrada consultas definidas sob a terminologia formalizada.

(1)Estudo de métodos, técnicas e ferramentas; (2)Formula¸cão do escopo da DSL; (3)Desenvolvi-mento iterativo e incre-mental da DSL.

(1) Mapeamento Sis-temático; (2)Planeja-mento do Projeto Piloto; (3) Desenvolvimento da CarbonQL seguindo as atividades de: análise, projeto, implementa¸cão e teste. (1)Principais métodos e técnicas conhecidas; (2)Linguagem CarbonQL implementada. Formalizar a terminologia do dom´ınio de dinâmica florestal por meio de uma ontologia formal e incor-porá-la a DSL.

(1)Estudo de métodos, técnicas e ferramentas; (2)Formula¸cão do escopo da Ontologia; (3)Desen-volvimento iterativo e in-cremental da Ontologia; (4) Incorporar a ontologia na DSL.

(1) Continua¸cão do ma-peamento Sistemático; (2)Entrevistas com en-genheiros florestais; (3)Estudos de observa¸cão em campo; (4) Desenvol-vimento da Carbontology seguindo as atividades de: análise, projeto, implementa¸cão e teste; (5)Carbontology incorpo-rada na CarbonQL (1)Principais métodos e técnicas conhecidas; (2)Carbontology imple-mentada; (3)Avalia¸cão dos benef´ıcios desta incorpora¸cão já que o vocabulário do dom´ınio espec´ıfico pode ser in-corporado na gramática da CarbonQL sem a necessidade de uma ontologia.

Gerar automaticamente c´odigo para um fra-mework de mapeamento objeto-relacional de forma que as consultas original-mente especificadas na DSL sejam mapeadas do alto n´ıvel para um n´ıvel execut´avel em banco de dados relacional.

(1)Estudo de métodos, técnicas e ferramentas; (2)Desenvolvimento itera-tivo e incremental do tradutor e gerador au-tomático de código.

(1)Continua¸cão do mape-amento Sistemático; (2) Desenvolvimento do tra-dutor CarbonQLWalker e do gerador de código Car-bonQL2HQL seguindo as atividades de: análise, projeto, implementa¸cão e teste.

(1)Consultas partindo da especifica¸cão em Car-bonQL, traduzidas para HQL, executadas em SQL e visualiza¸cão dos resultados, (2)Garantir a equivalência entre con-sultas CarbonQL x HQL x SQL; (3)Consistência; (4)Completude.

Aplicar MDE com o in-tuito de facilitar o en-tendimento dos objetos e eventos modelados e facilitar a configura¸c˜ao dinˆamica dos modelos.

Formular a arquitetura multicamadas da solu¸c˜ao usando os princ´ıpios de MDE.

(1)Implementa¸c˜ao da ca-mada de modelos inde-pendentes de plataforma, (2)Implementa¸c˜ao da ca-mada de modelos depen-dentes de plataforma.

(1)Configura¸c˜ao dinˆamica dos modelos; (2)Reusabi-lidade; (3)Confiabilidade. Avaliar

experimental-mente o modelo proposto do ponto de vista do usuário (usando métricas como usabilidade, ortogo-nalidade, conformidade, etc.) e do processo (usando métricas como integrabilidade, suporta-bilidade, etc.).

(1)Estudo de métodos, técnicas e ferramentas; (2)Desenvolvimento itera-tivo e incremental da ava-lia¸cão e realiza¸cão dos ex-perimentos.

(1)Revisão sistemática; (2)Planejamento dos experimentos; (3)Projeto; (4)Coleta de dados e mensura¸cão; (5)Análise e interpreta¸cão; (6)Em-pacotar os experimentos de forma que os mes-mos sejam facilmente repetidos.

Validade interna, externa, da conclus˜ao e constru¸c˜ao do estudo.

3.3 Cronograma

O cronograma de execu¸cão desta pesquisa envolve vários marcos. As atividades atuais constam como “Em andamento”. As que já foram conclu´ıdas estão iden-tificadas nos itens seguintes com o status “Realizado”. As atividades sem status são as que serão realizadas no decorrer dos próximos doze meses.

1. Cumprimento de Créditos - Participa¸cão em disciplinas essenciais para a fun-damenta¸cão da pesquisa. (Realizado)

(39)

3.3 Cronograma 29

2. Pesquisa bibliográfica ad-hoc - Realizada com o intuito de se obter uma visão geral do problema de pesquisa, da problemática relacionada a área da dinâmica florestal, mapeamento prévio de modelos existentes, desafios associados a mo-delagem computacional, bem como a extra¸cão de termos técnicos e sinônimos, que posteriormente serão usados na formula¸cão da string de busca tanto no mapeamento como na revisão sistemática da literatura. (Realizado)

3. Participa¸cão no WOPI-UFAM 2010 (Workshop de Pesquisa em Informática) -Apresenta¸cão do andamento do trabalho e resultados parciais obtidos. (Realizado) 4. Coopera¸cão com a Rede FLORestal - Foram realizadas algumas

entrevis-tas com engenheiros florestais da EMBRAPA - Amazˆonia Ocidental, UFAM, INPA, IBAMA e Servi¸co Florestal Brasileiro. (Realizado)

5. Mapeamento Sistemático - Coleta, organiza¸cão e análise da literatura técnica e cient´ıfica relacionada com os assuntos abordados no trabalho. O intuito desta revisão foi identificar principais ve´ıculos de publica¸cão, fronteiras do estado da arte e estado da prática. (Realizado)

6. Primeira Qualifica¸c˜ao - Apresenta¸c˜ao do estado da arte em outubro de 2011. (Realizado)

7. Estudo de Campo - Realizado na Reserva Florestal ZF2, localizada no km 50 da BR 174, na estrada vicinal ZF-2, Manaus/AM. Neste estudo foram observadas áreas experimentais de estudo da dinâmica florestal. (Realizado) 8. Projeto Piloto - Realizado com o intuito de validar a ideia. Nesta etapa foi desenvolvida a DSL CarbonQL, Carbontology, o tradutor CarbonQLWalker e o gerador de código CarbonQL2HQL. (Em andamento - 80% realizado) 9. Doutorado Sandu´ıche - Estágio no grupo de sistemas eletrônicos e software

(ESS) da Universidade de Southampton - Inglaterra, no intervalo de dezem-bro/2011 a dezembro/2012. (Realizado)

10. Segunda Qualifica¸c˜ao - Apresenta¸c˜ao da proposta de tese de doutorado em mar¸co de 2013.

11. Revisão Sistemática - Estudo secundário - Coleta, organiza¸cão e análise da literatura técnica e cient´ıfica seguindo um protocolo e metodologia que permita a repeti¸cão e avalia¸cão do estudo realizado.

(40)

3.3 Cronograma 30

Tabela 3.2: Distribui¸c˜ao de atividades do cronograma por semestre de cada ano.

Tarefas 1/2010 2/2010 1/2011 2/2011 1/2012 2/2012 1/2013 2/2013 1/2014 Cumprimento de Cr´editos

Revis˜ao ad-hoc

Participa¸cão no WOPI-UFAM 2010 Coopera¸cão com a REDE FLORestal Mapeamento Sistemático

Primeria Qualifica¸cão Estudo de campo Projeto Piloto Doutorado Sandu´ıche Segunda Qualifica¸cão Revisão sistemática

Realiza¸cão de Experimentos e Ajustes Escrita de Artigos e Relatórios Técnicos Defesa da tese

12. Realiza¸cão de Experimentos e Ajustes - Nesta etapa serão realizados experi-mentos mais refinados a partir da experiência adquirida com a fase anterior. Além disso, novas alternativas para obten¸cão de melhores resultados deverão ser estudadas para que o objetivo deste trabalho seja alcan¸cado. Nesta etapa, a partir da análise dos resultados e implementa¸cões, novos experimentos podem ser feitos.

13. Participa¸c˜ao em simp´osios, congressos e encontros cient´ıficos relacionados ao tema do trabalho.

14. Escrita de textos cient´ıficos divulgando os resultados parciais e finais. 15. Defesa da tese. Previs˜ao para mar¸co de 2014.

A Figura 3.4 complementa a Tabela 3.2 através de um gráfico aproximado. De 2013 para frente o gráfico mostra apenas previsões. De 2012 para trás as apro-xima¸cões são baseadas em fatos reais.

Com base na linha do tempo de execu¸cão deste trabalho duas atividades se des-tacam: a pesquisa e o desenvolvimento. Na atividade de pesquisa, a área que se forma ao longo da linha do tempo (destacada em amarelo), demonstra o esfor¸co gasto com as atividades de pesquisa. O destaque vai para o pico máximo (durante a revisão ad-hoc) e pico m´ınimo (durante o mapeamento sistemático). Esse tipo de resultado gera um questionamento inevitável: Porque tal resultado foi obtido se temos como premissa que o mapeamento/revisão sistemática são mais trabalhosos e demandam mais tempo que a revisão ad-hoc? Na verdade o que foi observado no decorrer desta pesquisa é que a revisão ad-hoc foi realizada de forma exploratória