• Nenhum resultado encontrado

Trabalhos propondo modelos completamente novos, que não buscam a melhoria de métricas existentes, têm ganhado força nos últimos anos. Estes modelos, em sua grande maioria, utilizam o conceito de tamanho funcional do software que tem o Ponto de Função (PF) como medida mais utilizada (ALBRECHT,1979).

No artigo deFerrucci et al.(2009), os autores utilizaram a técnica Busca Tabu (TS, do inglês Tabu Search) para explorar o conjunto de dados Deshrnais, composto por 81 projetos da década de 1980. O espaço de busca consiste de todas as equações factíveis que podem ser geradas alterando os valores de fatores, coeficientes, constantes e operadores durante cada movimentação. Os resultados apontam que o modelo TS obteve resultados equivalentes quando comparado a um modelo CBR e regressão stepwise.

Um modelo ANN foi proposto porNassif, Capretz e Hill(2012). O objetivo era analisar os impactos dos requisitos não-funcionais na estimativa de um projeto. Esta análise foi feita

também utilizando o conjunto de dados Deshrnais. De acordo com os autores, quando estes requisitos são ignorados pelo modelo, e apenas o tamanho do projeto é usado, pode levar a um aumento de até 100% no valor da MMRE. Portanto, os autores enfatizam que os requisitos não-funcionais são de suma importância e devem ser levados em consideração em todo modelo para EEDS.

Pai, McFALL e Subramanian (2013), em seu estudo, investigaram o relacionamento dos atributos que afetam diretamente a estimativa de esforço, através da aplicação de um modelo ANN em um conjunto de dados composto por 163 projetos de uma empresa privada. Ao contrário do que se espera, o estudo mostrou que variáveis além do tamanho em Pontos de Função não parecem impactar de forma significante as predições. Esta conclusão, no entanto, parece não retratar a realidade e é mais provável que a análise realizada esteja tratando os atributos de forma inadequada.

Shams e Kamel(2012) propuseram um estudo para selecionar o algoritmo de ANN mais adequado para o conjunto de dados ISBSG. Primeiramente, algumas melhorias foram feitas no conjunto de dados para aumentar sua qualidade. Um destes ajustes, foi a remoção dos outliers. A redefinição das variáveis categóricas como, por exemplo, a principal linguagem de programação usada, também foi realizada. Em seguida, uma análise via regressão Fuzzy envolvendo algumas variáveis resultou em uma equação que foi utilizada na seleção do algoritmo mais apropriado para o conjunto de dados ISBSG. A quantidade de projetos selecionados não foi divulgada. Contudo, vários testes foram conduzidos e os resultados devidamente expostos. Em termos da MMRE, os autores afirmam que o algoritmo Radial Basis foi o que obteve melhores resultados.

As técnicas DT e uma variante denominada Floresta de Árvores de Decisão (DTF, do inglês Decision Tree Forest) foram aplicadas porNassif et al. (2013) no contexto de EEDS. Uma análise estatística extensiva foi apresentada para sustentar a conclusão de que o modelo DTF superou as técnicas DT e regressão linear, baseados nos critérios de avaliação MMRE, MdMRE e Pred(25) em ambos conjuntos de dados, ISBSG e Desharnais5.

Minku e Yao(2013) concluem em seu artigo que modelos aplicando várias técnicas de IC melhoram, sensivelmente, modelos que utilizam apenas uma única técnica no contexto de EEDS. O estudo fornece diferentes insights que podem ser úteis para pesquisas futuras. Na linha dos Algoritmos Evolutivos, um modelo aplicando GA foi desenvolvido porOliveira et al. (2010) para seleção de atributos e otimização dos parâmetros de três técnicas bem estabelecidas: Support Vector Regression, Multilayer Perceptron e Decision Tree. Estas técnicas foram testadas sobre vários conjuntos de dados, dentre eles pode-se citar

os conjuntos Albrecht 6 e Kemerer 7. De acordo com os autores, embora populares e

amplamente utilizados, os critérios de avaliação MMRE e Pred não são suficientes para uma análise estatística satisfatória. Mesmo assim, com a finalidade de comparação, ambos critérios foram apresentados.

Ainda seguindo a mesma linha evolucionária, um estudo comparativo entre Programação Genética (GP, do inglês Genetic Programming) e Programação Genética Multiobjetivo (MOGP, do inglês Multiobjective Genetic Programming) foi realizado por Singh e Misra (2012). O modelo GP foi executado com 5 diferentes funções objetivo, separadamente, enquanto o modelo MOGP considerou todas no mesmo processo evolutivo. Por fim, os autores concluíram que, por mais que o modelo MOGP tenha mostrado bons resultados, o mesmo não apresenta um bom custo benefício, pois requer mais processamento e tempo de modelagem e os resultados não são muito superiores à uma implementação simples utilizando GP para o problema de EEDS.

Outro modelo evolutivo, desta vez utilizando Grammatical Evolution (GE), foi desenvolvido por Barros et al.(2013). O modelo foi testado em diversos conjuntos de dados públicos. Mesmo a maioria deles sendo datados da década de 1980 e 1990, uma análise estatística bastante abrangente e relevante destes conjuntos de dados foi devidamente exposta. A técnica foi comparada com algoritmos tradicionais da literatura como: Regressão Linear, ANN e Support Vector Machine. Como resultado, a proposta apresentou melhores resultados em alguns critérios de avaliação e piores em outros como, por exemplo, a MMRE, onde o modelo utilizando Support Vector Machine se sobressaiu. Contudo, a técnica GE, objetivo desta dissertação, ou até mesmo um modelo híbrido, quando aplicada em conjuntos de dados mais recentes e com agrupamento de projetos, precisa ser profundamente analisada para o contexto de EEDS.

Por fim, Minku e Yao (2013) investigaram a utilização de modelos híbridos no contexto de EEDS em comparação à modelos utilizando apenas uma técnica de IC. Os autores afirmaram ter obtido resultados superiores com alguns modelos híbridos, porém não há evidência da superioridade destes modelos em relação à modelos individuais em todos os casos. De toda forma, este trabalho fornece diversos insights que podem ser de extrema utilidade em pesquisas futuras.

O Quadro 4 exibe os principais dados em relação aos trabalhos apresentados nesta subseção.

6https://terapromise.csc.ncsu.edu:8443/svn/repo/effort/function-points/albrecht/albrecht.arff 7https://terapromise.csc.ncsu.edu:8443/svn/repo/effort/function-points/kemerer/kemerer.arff

Quadro 4 – Técnicas de IC aplicadas em novos modelos.

Técnica Referência Dados Avaliação Comparação

TS (FERRUCCI et al., 2009) Desharnais MMRE e Pred(25) CBR e regressão stepwise

ANN (IDRI; ZAKRANI; ZAHI, 2010)

COCOMO81 MMRE e

Pred(25)

Outros estudos ANN (SHAMS; KAMEL,

2012)

ISBSG MMRE Regrassão fuzzy

ANN (NASSIF; CAPRETZ; HILL,2012)

Desharnais MMRE e

Pred(25)

RLM ANN (PAI; MCFALL; SU-

BRAMANIAN,2013)

Privado MMRE RLM

DT e DTF (NASSIF et al.,2013) ISBSG e Deshar- nais MMRE, MdMRE e Pred(25) RLM GA (OLIVEIRA et al., 2010) Desharnais, NASA, CO- COMO81, Albre- cht e Kemerer MMRE e Pred(25) Outros estudos GP (SARRO; FERRUCCI; GRAVINO,2012) Desharnais MMRE, MdMRE e Pred(25) MOGP

GE (BARROS et al.,2013) Albrecht, CO- COMO81,

Desharnais, Ke- merer, Maxwell e NASA93

MMRE Regressão linear, ANN e Support Vector Machine

Modelos hí- bridos

(MINKU; YAO,2013) COCOMO81, Desharnais, NASA, NASA93 e ISBSG MMRE e Pred(25) Técnicas desen- volvidas

Documentos relacionados