• Nenhum resultado encontrado

Uso de resumos gráficos baseados em mapas conceituais para apoiar a seleção de estudos primários no processo de revisão sistemática na engenharia de software: replicações de um experimento controlado

N/A
N/A
Protected

Academic year: 2021

Share "Uso de resumos gráficos baseados em mapas conceituais para apoiar a seleção de estudos primários no processo de revisão sistemática na engenharia de software: replicações de um experimento controlado"

Copied!
69
0
0

Texto

(1)

PROGRAMA DE P ´

OS-GRADUAC

¸ ˜

AO EM INFORM ´

ATICA

ALEX FERNANDO BONORA

USO DE RESUMOS GR ´

AFICOS BASEADOS EM MAPAS

CONCEITUAIS PARA APOIAR A SELEC

¸ ˜

AO DE ESTUDOS

PRIM ´

ARIOS NO PROCESSO DE REVIS ˜

AO SISTEM ´

ATICA NA

ENGENHARIA DE SOFTWARE: REPLICAC

¸ ˜

OES DE UM

EXPERIMENTO CONTROLADO

DISSERTAC

¸ ˜

AO

CORN ´ELIO PROC ´OPIO, PR

(2)

USO DE RESUMOS GR ´

AFICOS BASEADOS EM MAPAS

CONCEITUAIS PARA APOIAR A SELEC

¸ ˜

AO DE ESTUDOS

PRIM ´

ARIOS NO PROCESSO DE REVIS ˜

AO SISTEM ´

ATICA NA

ENGENHARIA DE SOFTWARE: REPLICAC

¸ ˜

OES DE UM

EXPERIMENTO CONTROLADO

Dissertac¸˜ao apresentada ao Programa de P´os-graduac¸˜ao em Inform´atica da Universidade Tecnol´ogica Federal do Paran´a como requisito parcial para obtenc¸˜ao do grau de “Mestre Profissional em Inform´atica” – Area´ de Concentrac¸˜ao: Engenharia de Software.

Orientador: ProfaDraKatia Romero Felizardo

CORN ´ELIO PROC ´OPIO, PR

(3)

Uso de resumos gráficos baseados em mapas conceituais para apoiar a seleção de estudos primários no processo de revisão sistemática na engenharia de software : replicações de um experimento controlado / Alex Fernando Bonora. – 2019.

68 f. : il.; 31 cm.

Orientadora: Katia Romero Felizardo Scannavino.

Dissertação (Mestrado) – Universidade Tecnológica Federal do Paraná. Programa de Pós-Graduação em Informática. Cornélio Procópio, 2019.

Bibliografia: p. 64-68.

1. Resumos. 2. Gráficos em engenharia. 3. Engenharia de software. 4. Informática – Dissertações. I. Scannavino, Katia Romero Felizardo, orient. II. Universidade Tecnológica Federal do Paraná. Programa de Pós-Graduação em Informática. III. Título.

CDD (22. ed.) 004 Biblioteca da UTFPR - Câmpus Cornélio Procópio

Bibliotecário/Documentalista responsável: Romeu Righetti de Araujo – CRB-9/1676

(4)

Câmpus Cornélio Procópio

Programa de Pós-Graduação em Informática

Av. Alberto Carazzai, 1640 - 86.300-000- Cornélio Procópio – PR.

Tel. +55 (43) 3520-4055 / e-mail: ppgi-cp@utfpr.edu.br / www.utfpr.edu.br/cornelioprocopio/ppgi

Título da Dissertação Nº 59:

USO DE RESUMOS GRÁFICOS BASEADOS EM MAPAS

CONCEITUAIS PARA APOIAR A SELEÇÃO DE ESTUDOS

PRIMÁRIOS NO PROCESSO DE REVISÃO SISTEMÁTICA NA

ENGENHARIA DE SOFTWARE: REPLICAÇÕES DE UM

EXPERIMENTO CONTROLADO

”.

por

Alex Fernando Bonora

Orientadora: Profa. Dra. Katia Romero Felizardo Scannavino

Esta dissertação foi apresentada como requisito parcial à obtenção do grau de MESTRE EM INFORMÁTICA – Área de Concentração: Computação Aplicada, pelo Programa de Pós-Graduação em Informática – PPGI – da Universidade Tecnológica Federal do Paraná – UTFPR – Câmpus Cornélio Procópio, às 13h30 do dia 06 de junho de 2019. O trabalho foi _____________ pela Banca Examinadora, composta pelos professores:

__________________________________

Prof. Dr. Willian Massami Watanabe (Presidente – UTFPR-CP)

__________________________________

Prof. Dr. Eduardo Cotrin Teixeira (UTFPR-CP)

_______________________________________ Prof. Dr. Edson Alves de Oliveira Junior

(UEM)

Participação à distância via ______________

Visto da coordenação: __________________________________

Danilo Sipoli Sanches

Coordenador do Programa de Pós-Graduação em Informática UTFPR Câmpus Cornélio Procópio

(5)
(6)

Em primeiro lugar agradec¸o `a Deus pela oportunidade concedida e pela minha sa´ude. Aos meus pais e irm˜aos pelo incentivo e apoio incondicional.

Aos colegas Andr´e, Eduardo, Glauco, Luis, Marco e Anderson, que tornaram nossas viagens mais divertidas e motivantes.

Aos meus l´ıderes no trabalho, Frei Jac´o, Frei Tarc´ısio e Helton, pela compreens˜ao e apoio.

`

A instituic¸˜ao UTFPR por ofertar este curso, com recursos humanos e materiais adequados para o enriquecimento do conhecimento com dignidade.

`

A todos os professores pelo comprometimento com a evoluc¸˜ao do conhecimento.

`

A minha orientadora ProfaDraKatia Felizardo que, com muita sabedoria, paciˆencia e generosidade soube me conduzir pelos caminhos da construc¸˜ao deste trabalho.

(7)
(8)

BONORA, Alex. USO DE RESUMOS GR ´AFICOS BASEADOS EM MAPAS CONCEITUAIS PARA APOIAR A SELEC¸ ˜AO DE ESTUDOS PRIM ´ARIOS NO PROCESSO DE REVIS ˜AO SISTEM ´ATICA NA ENGENHARIA DE SOFTWARE: REPLICAC¸ ˜OES DE UM EXPERIMENTO CONTROLADO. 68 f. Dissertac¸˜ao – Programa de P´os-graduac¸˜ao em Inform´atica, Universidade Tecnol´ogica Federal do Paran´a. Corn´elio Proc´opio, PR, 2019.

Contexto: Este trabalho est´a inserido no contexto da Engenharia de Software Baseada em Evidˆencia, mais especificamente na tem´atica de Revis˜ao Sistem´atica da Literatura (RSL), com foco no processo de selec¸˜ao de estudos, que envolve, em primeira instˆancia, a leitura dos resumos de tais estudos. Lacuna: A baixa qualidade dos resumos ´e uma ameac¸a ao processo de selec¸˜ao de estudos, uma vez que isso acarreta uma falta de informac¸˜oes para julgar a relevˆancia do estudo para uma dada RSL. Uma alternativa para melhorar a qualidade dos resumos ´e adotar resumos gr´aficos. O uso desse tipo de resumo j´a foi proposto, por´em h´a pouca evidˆencia para avaliar o seu uso; apenas um experimento controlado foi executado. Objetivo: Objetiva-se neste trabalho executar replicac¸˜oes de um experimento controlado utilizando resumos gr´aficos representados por mapas conceituais (MCs), a fim de gerar conhecimento a respeito do uso desses resumos para apoiar a selec¸˜ao de estudos na RSL. M´etodo: Foram adotados o mesmo projeto experimental e materiais do experimento original. Resultados: Evidˆencias foram geradas a respeito do uso de resumos gr´aficos representados por MCs para apoiar a selec¸˜ao de estudos prim´arios no processo de RSL na Engenharia de Software. Al´em disso, foi poss´ıvel constatar que o uso de resumos gr´aficos contribui de forma positiva na atividade de selec¸˜ao de estudos no processo de RSL. Conclus˜ao: A utilizac¸˜ao dos resumos gr´aficos tende a melhorar o desempenho e a efetividade na atividade de selec¸˜ao de estudos, al´em de torn´a-la mais motivante e menos cansativa.

(9)

BONORA, Alex. USING GRAPHICAL ABSTRACT BASED ON CONCEPTUAL MAPS TO SUPPORT THE SELECTION OF PRIMARY STUDIES IN SYSTEMATIC REVIEW PROCESS IN SOFTWARE ENGINEERING: REPLICATION OF A CONTROLLED EXPERIMENT. 68 f. Dissertac¸˜ao – Programa de P´os-graduac¸˜ao em Inform´atica, Universidade Tecnol´ogica Federal do Paran´a. Corn´elio Proc´opio, PR, 2019.

Background: This study is inserted in Evidence-Based Software Engineering context, specifically in Systematic Literature Review (SLR) thematic, focusing on the studies selecting process. It involves in a first instance the reading of abstract’s studies. Gap: The lack of abstracts quality makes it difficult to select studies, since there is few information to judge the relevance of a study for an SLR. An alternative to improve the abstracts quality is to adopt graphical abstracts. The use of this type of abstracts have been proposed, but only one controlled experiment was executed. Objective: This work aims to perform replications of a controlled experiment using graphical abstracts based on conceptual maps (CM), in order to generate knowledge regarding the use of these abstracts to support studies selection. Method: The same experimental design and materials from the original experiment were adopted. Results: Evidence on the use of graphical abstracts represented by CMs to support the studies selection in the SLR process in Software Engineering was generated. In addition, it was possible to verify that the use of graphic summaries contributes positively to the study selection activity in the SLR process. Conclusion: The use of graphical abstracts tends to improves the performance and effectiveness of the study selection activity, as well as making it more motivating and less tiring.

(10)

FIGURA 1 Exemplo de mapa conceitual . . . 20 –

FIGURA 2 Selec¸˜ao de estudos . . . 28 –

FIGURA 3 M´edia anual de replicac¸˜oes por ´area . . . 32 –

FIGURA 4 M´edia anual dos m´etodos replicados . . . 33 –

FIGURA 5 Taxa de confirmac¸˜ao dos resultados das replicac¸˜oes em relac¸˜ao aos experimentos originais . . . 34 –

FIGURA 6 Modelo para apoiar a criac¸˜ao de resumos gr´aficos . . . 37 –

FIGURA 7 Projeto experimental . . . 39 –

FIGURA 8 Motivac¸˜ao dos participantes lendo resumos textuais – Replicac¸˜oes 1–5 . . . 55 –

(11)

TABELA 1 Proposta de taxonomia . . . 22 –

TABELA 2 Adoc¸˜ao dos crit´erios PICO . . . 25 –

TABELA 3 Termos derivados do PICO . . . 25 –

TABELA 4 Termos derivados de palavras encontradas em estudos relevantes . . . 26 –

TABELA 5 Concatenac¸˜ao de palavras alternativas utilizando operador OU (OR) . . . 26 –

TABELA 6 Concatenac¸˜ao de todas as palavras poss´ıveis utilizando o operador E (AND) 27 –

TABELA 7 Estudos inclu´ıdos no processo de selec¸˜ao inicial . . . 29 –

TABELA 8 Estudos inclu´ıdos no processo de selec¸˜ao final . . . 30 –

TABELA 9 Formul´ario de extrac¸˜ao de dados . . . 31 –

TABELA 10 Resumo dos resultados do experimento original de Takemiya (2017) . . . 41 –

TABELA 11 Replicac¸˜oes realizadas e quantidade de participantes por grupo . . . 43 –

TABELA 12 Resumo dos resultados das replicac¸˜oes . . . 44 –

TABELA 13 Parˆametros de definic¸˜ao de Cohen’s . . . 45 –

TABELA 14 Resultados para o teste de Mann-Whitney – replicac¸˜oes . . . 45 –

TABELA 15 Comparativo de desempenho (tempo) . . . 46 –

TABELA 16 Comparativo de efetividade . . . 47 –

TABELA 17 Comparativo de desempenho – n´ıvel de formac¸˜ao . . . 49 –

TABELA 18 Comparativo de efetividade – n´ıvel de formac¸˜ao . . . 50 –

TABELA 19 Comparativo de desempenho – autoavaliac¸˜ao . . . 51 –

TABELA 20 Comparativo de efetividade – autoavaliac¸˜ao . . . 52 –

TABELA 21 Teste de Kruskal Wallis . . . 52 –

TABELA 22 Coeficiente de correlac¸˜ao de Spearman . . . 53 –

TABELA 23 Resumo dos resultados das quest˜oes qualitativas – motivac¸˜ao . . . 56 –

TABELA 24 Parte dos dados brutos: documentos classificados corretamente pelos participantes . . . 57 –

TABELA 25 Parte dos dados brutos: estudos classificados incorretamente pelos participantes . . . 58 –

TABELA 26 Resumo dos resultados: replicac¸˜ao 6 . . . 59 –

(12)

ESBE Engenharia de Software Baseada em Evidˆencia RSL Revis˜ao Sistem´atica da Literatura

RS Revis˜ao Sistem´atica MS Mapeamento Sistem´atico ES Engenharia de Software MC Mapa Conceitual MA Mapa de Argumento MDC Mapa de Conhecimento MM Mapa Mental NP Nuvem de Palavra

IHMC Institute for Human and Machine Cognition CC Ciˆencia da Computac¸˜ao

QP Quest˜ao de Pesquisa

(13)

1 INTRODUC¸ ˜AO . . . 13

1.1 MOTIVAC¸ ˜AO . . . 16

1.2 CEN ´ARIO DE PESQUISA . . . 17

1.3 OBJETIVOS . . . 18

1.4 ORGANIZAC¸ ˜AO DO TEXTO . . . 18

2 FUNDAMENTAC¸ ˜AO TE ´ORICA . . . 19

2.1 MAPAS CONCEITUAIS . . . 19

2.2 REPLICAC¸ ˜AO . . . 21

2.3 ESTUDO TERCI ´ARIO SOBRE REPLICAC¸ ˜OES DE EXPERIMENTOS NA ES . . . 23

2.3.1 ETAPA DE PLANEJAMENTO . . . 24

2.3.1.1 QUEST ˜OES DE PESQUISA . . . 24

2.3.1.2 BUSCA POR LITERATURA RELEVANTE . . . 25

2.3.1.3 ESTRAT ´EGIA DE BUSCA . . . 26

2.3.2 CRIT ´ERIOS DE SELEC¸ ˜AO DE ESTUDOS . . . 27

2.3.2.1 Processo de Selec¸˜ao Inicial . . . 29

2.3.2.2 Processo de Selec¸˜ao Final . . . 30

2.3.3 ESTRAT ´EGIA DE EXTRAC¸ ˜AO E S´INTESE DOS DADOS . . . 30

3 EXPERIMENTO ORIGINAL: MCS PARA APOIAR A SELEC¸ ˜AO DE ESTUDOS . . . 35

3.1 PACOTE DE LABORAT ´ORIO DO EXPERIMENTO ORIGINAL . . . 38

3.2 CONDUC¸ ˜AO E RESULTADOS DO EXPERIMENTO ORIGINAL . . . 40

4 REPLICAC¸ ˜OES DO EXPERIMENTO ORIGINAL . . . 43

4.1 VIS ˜AO GERAL DOS RESULTADOS . . . 43

4.2 COMPARANDO OS RESULTADOS DAS REPLICAC¸ ˜OES COM OS RESULTADOS DO EXPERIMENTO ORIGINAL . . . 45

4.3 DISCUSS ˜AO . . . 57

4.4 AMEAC¸ AS `A VALIDADE . . . 61

5 CONCLUS ˜OES . . . 62

5.1 PUBLICAC¸ ˜OES . . . 63

(14)

1 INTRODUC¸ ˜AO

O paradigma baseado em evidˆencias tem como objetivo coletar e analisar sistematicamente dados experimentais dispon´ıveis sobre um determinado tema de pesquisa (KITCHENHAM, 2004). Na Engenharia de Software Baseada em Evidˆencia (ESBE), a Revis˜ao Sistem´atica da Literatura (RSL), tamb´em conhecida como Revis˜ao Sistem´atica (RS), e o Mapeamento Sistem´atico (MS). Destacam-se como m´etodos que sumarizam estudos prim´arios (KITCHENHAM; CHARTERS, 2007b; PETERSEN et al., 2008). Exemplos de estudos prim´arios s˜ao os surveys, os experimentos controlados e os estudos de casos. A sumarizac¸˜ao de estudos prim´arios ´e realizada por meio de RSLs e MSs, considerados estudos secund´arios (KITCHENHAM; CHARTERS, 2007b; KITCHENHAM et al., 2015).

Os estudos secund´arios foram adotados como m´etodo de pesquisa na ESBE no ano de 2004, com o trabalho de Kitchenham (2004), que estabeleceu os procedimentos para a conduc¸˜ao desses estudos, motivando o seu uso na comunidade da Engenharia de Software (ES). A divulgac¸˜ao desse trabalho proporcionou a conduc¸˜ao de in´umeras RSLs em diferentes ´areas e temas da ES (CARVER et al., 2013; KITCHENHAM; BRERETON, 2013; HEATON; CARVER, 2015; SOOMRO et al., 2016; VURAL et al., 2017; RAMIREZ et al., 2018; GAROUSI et al., 2019).

O processo de conduc¸˜ao de uma RSL envolve trˆes etapas: planejamento, execuc¸˜ao e s´ıntese dos resultados. O planejamento abrange atividades como a identificac¸˜ao da necessidade de uma revis˜ao e a criac¸˜ao do protocolo. O protocolo cont´em, entre outros itens, os procedimentos necess´arios para a execuc¸˜ao da revis˜ao, as quest˜oes de pesquisa, estrat´egias de busca e selec¸˜ao dos estudos, os crit´erios de inclus˜ao e exclus˜ao, crit´erios de qualidade e formul´arios ou planilhas que auxiliam na extrac¸˜ao dos dados dos estudos identificados como relevantes. A etapa de execuc¸˜ao tem como finalidade a obtenc¸˜ao e an´alise de estudos prim´arios e envolve as atividades de selec¸˜ao dos estudos candidatos e extrac¸˜ao de dados dos estudos inclu´ıdos. A selec¸˜ao ´e conduzida em trˆes fases, selec¸˜ao inicial, selec¸˜ao final e revis˜ao da selec¸˜ao. Durante a selec¸˜ao inicial, os t´ıtulos e os resumos dos estudos candidatos s˜ao lidos e classificados como inclu´ıdos ou exclu´ıdos, atrav´es da aplicac¸˜ao de crit´erios de inclus˜ao e exclus˜ao. Na

(15)

selec¸˜ao final, os estudos inclu´ıdos na fase anterior s˜ao lidos na ´ıntegra, e novamente os crit´erios de inclus˜ao e exclus˜ao s˜ao aplicados. Se necess´ario, novos crit´erios podem ser elaborados especificamente para a fase de selec¸˜ao final. Durante a revis˜ao da selec¸˜ao, a classificac¸˜ao de pelo menos trinta por cento (30%) dos estudos ´e reavaliada (KITCHENHAM et al., 2015) para garantir que somente estudos relevantes foram inclu´ıdos, e que os estudos exclu´ıdos s˜ao de fato irrelevantes no contexto da revis˜ao. A atividade de extrac¸˜ao de dados dos estudos inclu´ıdos ´e aplicada ap´os a selec¸˜ao final e consiste em extrair dados que respondam `as quest˜oes de pesquisa. Na etapa de s´ıntese dos resultados ´e realizada a sumarizac¸˜ao dos dados dos estudos que satisfac¸am ao escopo da revis˜ao e a consequente divulgac¸˜ao dos resultados em eventos como congressos, conferˆencias, entre outros (KITCHENHAM et al., 2004; KITCHENHAM; CHARTERS, 2007b).

O processo de MS segue procedimentos similares aos da RSL, com algumas particularidades. A RSL possui quest˜oes de pesquisas mais precisas, focadas em um ponto espec´ıfico de uma ´area de estudo. Por outro lado, no MS as quest˜oes de pesquisas s˜ao mais abrangentes e tˆem como finalidade obter uma vis˜ao geral sobre um tema de pesquisa, fornecendo tamb´em um indicador quantitativo das evidˆencias coletadas. Com relac¸˜ao `a atividade de extrac¸˜ao de dados, no MS essa atividade ocorre de forma abrangente e busca a classificac¸˜ao dos dados obtidos; j´a na RSL, a extrac¸˜ao ´e mais minuciosa e envolve mensurac¸˜ao de qualidade dos estudos analisados (KITCHENHAM, 2004; KITCHENHAM; CHARTERS, 2007b; PETERSEN et al., 2008). Os resultados de um MS podem identificar ´areas pertinentes para a realizac¸˜ao de RSLs e ´areas em que seja mais adequada a realizac¸˜ao de novos estudos prim´arios (KITCHENHAM, 2004; KITCHENHAM; CHARTERS, 2007b; KITCHENHAM et al., 2015).

Uma das ameac¸as ao processo de RSL encontra-se na etapa de selec¸˜ao de estudos relevantes. Como mencionado anteriormente, durante a primeira fase da selec¸˜ao, crit´erios de inclus˜ao e exclus˜ao s˜ao aplicados com base na leitura dos resumos dos estudos. No entanto, de maneira geral em ES, h´a falta de informac¸˜oes importantes nesses resumos, como o m´etodo adotado no estudo (HASSLER et al., 2014; MARSHALL et al., 2018).

Uma alternativa para minimizar esse problema ´e a utilizac¸˜ao de resumos gr´aficos (TAKEMIYA, 2017). Em recentes esforc¸os de pesquisa, Takemiya (2017) propˆos o uso de resumos gr´aficos utilizando mapas conceituais (MCs) para apoiar a atividade de selec¸˜ao de estudos. O uso de resumos gr´aficos foi inicialmente validado por meio de um estudo de viabilidade, doravante chamado de estudo original ou experimento original. Apesar da pouca validac¸˜ao proveniente do estudo original, os resultados promissores motivaram a continuac¸˜ao da

(16)

pesquisa, assim, este projeto visa avaliar experimentalmente a alternativa proposta pela autora. Vale destacar que uma limitac¸˜ao do estudo original ´e a pequena amostra de participantes. Dessa forma, os resultados n˜ao foram analisados estatisticamente.

A execuc¸˜ao de um experimento, como o realizado no estudo de Takemiya (2017), ganha relevˆancia e justifica-se na afirmac¸˜ao de Travassos et al. (2002) de que a experimentac¸˜ao oferece um modo sistem´atico, disciplinado, comput´avel e controlado para a avaliac¸˜ao da atividade humana. O m´etodo experimental sugere o modelo, desenvolve o m´etodo qualitativo e/ou quantitativo, aplica um experimento, mede e analisa, avalia o modelo e o repete. Para realizar a validac¸˜ao dos resultados dos experimentos e sua consequente gerac¸˜ao de evidˆencias, replicac¸˜oes s˜ao recomendadas. Segundo SHULL et al. (2002), o verdadeiro objetivo da pesquisa experimental em ES n˜ao deve ser a execuc¸˜ao de estudos individuais, mas desenvolver uma melhor compreens˜ao do tema a fim de consolidar um corpo de conhecimento. Um caminho para essa realizac¸˜ao ´e a execuc¸˜ao do estudo em uma variedade de ambientes, ou seja, a replicac¸˜ao do estudo. A diversidade no local de cada replicac¸˜ao ´e uma caracter´ıstica importante de qualquer experimento e ´e a base para a credibilidade e a aprendizagem. Estudos complementares replicados permitem aos investigadores combinarem conhecimento diretamente ou atrav´es de meta-an´alise, al´em de permitirem conclus˜oes mais robustas, caso os resultados sejam parecidos, ou ainda a identificac¸˜ao de limitac¸˜oes a respeito do tema abordado.

Apoiando a afirmac¸˜ao de Shull et al. (2002), Carver et al. (2014) destacam que a replicac¸˜ao ´e uma parte essencial do paradigma experimental e ´e considerada a pedra angular do conhecimento cient´ıfico. Uma afirmac¸˜ao constante na literatura sobre replicac¸˜oes em ES ´e que a execuc¸˜ao de um experimento em condic¸˜oes adversas a sua aplicac¸˜ao original ´e determinante para comprovac¸˜ao dos objetivos da pesquisa. Esses mesmos autores afirmam que os experimentos precisam ser replicados em diferentes contextos, em diferentes momentos e sob diferentes condic¸˜oes, antes que eles possam produzir conhecimento. Carver et al. (2014) definem como sendo uma repetic¸˜ao deliberada de um estudo prim´ario com vista a determinar se os resultados desse primeiro experimento podem ser reproduzidos.

As replicac¸˜oes podem ser incentivadas pela disponibilidade de pacotes de laborat´orio que documentam um experimento (SHULL et al., 2002). O pacote de laborat´orio descreve o experimento em termos espec´ıficos e fornece materiais para a sua replicac¸˜ao, destaca oportunidades de variac¸˜ao, e cria um contexto para a combinac¸˜ao de resultados.

O cen´ario descrito anteriormente ratifica a importˆancia das replicac¸˜oes para avanc¸ar o paradigma de pesquisa experimental em ES. Assim, neste trabalho foram conduzidas replicac¸˜oes do experimento executado por Takemiya (2017), que ser´a explicado em detalhes

(17)

no Cap´ıtulo 3, para gerar evidˆencias e construir um corpo de conhecimento sobre o uso de resumos gr´aficos no contexto de RSL na ES.

1.1 MOTIVAC¸ ˜AO

Devido `a natureza rigorosa dos estudos secund´arios, pesquisas tˆem sido realizadas na busca por pr´aticas que contribuam para o aprimoramento do processo de RSL (RIAZ et al., 2010; FELIZARDO et al., 2011; ZHANG; MUHAMMAD, 2012; CARVER et al., 2013; KITCHENHAM; BRERETON, 2013; FABBRI et al., 2013; HASSLER et al., 2014). Uma dificuldade comumente encontrada ´e a selec¸˜ao de estudos prim´arios, principalmente quando o pesquisador se depara com grandes volumes de estudos para serem selecionados atrav´es da aplicac¸˜ao dos crit´erios de inclus˜ao e exclus˜ao em cada um deles. Extrair informac¸˜oes relevantes dos estudos tem se tornado progressivamente mais dif´ıcil, principalmente devido ao aumento na quantidade de informac¸˜oes disponibilizadas em formato digital (KEIM, 2002). Alguns estudos constataram que um n´umero expressivo de publicac¸˜oes da ES cont´em resumos que omitem informac¸˜oes importantes e incluem outras irrelevantes. Aspectos como esses dificultam ainda mais o processo de selec¸˜ao, uma vez que a selec¸˜ao inicial dos estudos tem como base a leitura do t´ıtulo e do resumo (HASSLER et al., 2014). Dessa forma, considera-se imprescind´ıvel desenvolver estrat´egias que contribuam para melhorar a qualidade dos resumos na ES. Uma potencial soluc¸˜ao para promover essa melhoria ´e a utilizac¸˜ao de resumos estruturados e gr´aficos.

Resumos estruturados baseiam-se na utilizac¸˜ao de um conjunto de sec¸˜oes como contexto, objetivo, m´etodo, resultados e conclus˜oes, que orientam o pesquisador na escrita do resumo. Os resumos estruturados quando comparados aos resumos tradicionais, possuem as seguintes vantagens (KITCHENHAM et al., 2008): (i) facilitam a busca por estudos relevantes; (ii) s˜ao mais f´aceis de serem lidos; (iii) informam com mais exatid˜ao o conte´udo de um artigo e (iv) incluem mais informac¸˜oes. Contudo, apesar das vantagens do resumo estruturado, pesquisadores que conduzem estudos secund´arios ainda se deparam com uma grande quantidade de estudos para serem lidos e analisados.

Os resumos gr´aficos apresentam o conte´udo de um artigo de forma concisa atrav´es de uma imagem e proporcionam ao leitor a identificac¸˜ao mais r´apida da mensagem principal de um estudo, instigando-o `a leitura do texto completo. ´E fato que os seres humanos tˆem fortes habilidades de processamento visual e que as representac¸˜oes visuais, como os resumos gr´aficos, podem ser exploradas para apoiar a descoberta de conhecimento (KEIM; KRIEGEL, 2006).

(18)

et al., 2011). No entanto, as orientac¸˜oes atuais para a elaborac¸˜ao dos resumos gr´aficos se limitam `as informac¸˜oes t´ecnicas como, tamanho da figura, n´umero m´ınimo de pixels, resoluc¸˜ao de tela adequada e tipos de arquivos (TIFF, EPS, PDF ou MS Office). Jarvenpaa (1985) afirma que as representac¸˜oes visuais s˜ao as mais indicadas para resumir dados. Dyb˚a e Cruzes (2010) investigaram o uso de representac¸˜oes visuais aplicadas `a fase de sumarizac¸˜ao (s´ıntese de dados) do processo de RSL, contudo, existe uma carˆencia de pesquisas que investiguem a aplicac¸˜ao dessas representac¸˜oes relacionadas a elaborac¸˜ao de resumos gr´aficos com a finalidade de apoiar a atividade de selec¸˜ao no processo de RSL. Nesse sentido, o MC apresenta-se como uma alternativa para representar o conhecimento e recuperar informac¸˜oes (NOVAK; GOWIN, 1984). Outras representac¸˜oes gr´aficas poderiam ser adotadas, como Mapas de Argumentos (MAs) (DAVIES, 2011), Mapas de Conhecimento (MDCs) (O’DONNELL et al., 2002), Mapas Mentais (MMs) (ZHANG et al., 2010) e Nuvens de Palavras (NPs) (HEIMERL et al., 2014). No entanto, apenas os MCs s˜ao diagramas de significados, ou seja, de relac¸˜oes significativas, e at´e mesmo de hierarquias conceituais.

Replicar o estudo original de Takemiya (2017), que sugere o uso de MCs para apoiar a selec¸˜ao de estudos ´e determinante para estabelecer sua validac¸˜ao e gerar evidˆencias, pois de acordo com SHULL et al. (2002), um estudo produz conhecimento, validade e credibilidade ap´os replicac¸˜oes.

1.2 CEN ´ARIO DE PESQUISA

A presente proposta est´a estreitamente relacionada `a ´area de ES e ESBE, podendo-se destacar no cen´ario mundial instituic¸˜oes de pesquisa como a Universidade de Keele (Reino Unido), a Universidade de Auckland (Nova Zelˆandia), National ICT (Austr´alia), a Universidade de Trodheim (Noruega) e o Laborat´orio de Pesquisa Simula (Noruega). O Laborat´orio Simula ´e uma das principais instituic¸˜oes de ES em termos de pesquisa e conduc¸˜oes de estudos secund´arios (KITCHENHAM et al., 2009). No Brasil, a COPPE/UFRJ tem liderado essas iniciativas.

Com relac¸˜ao aos MCs, h´a um grupo de pesquisa organizado pelo Instituto de Cognic¸˜ao de M´aquina e Humana (IHMC – Institute for Human and Machine Cognition) que conta com o apoio do idealizador dos MCs, Novak, para a organizac¸˜ao da conferˆencia internacional sobre MCs. Com realizac¸˜ao a cada dois anos, a conferˆencia divulga trabalhos relacionados ao tema e tem como principal objetivo incentivar o uso dos MCs na comunidade acadˆemica e industrial.

(19)

1.3 OBJETIVOS

´

E evidente o desafio de selecionar estudos relevantes de um determinado conjunto de estudos. Estrat´egias que agreguem conceitos de visualizac¸˜ao poderiam auxiliar essa atividade. At´e o presente momento o uso de resumos gr´aficos no contexto de estudos secund´arios na ES foi pouco validado. Baseado nas observac¸˜oes apresentadas, este trabalho tem como objetivo gerar evidˆencias para construir um corpo de conhecimento a respeito do uso de resumos gr´aficos baseados em MCs para apoiar a selec¸˜ao de estudos na RSL atrav´es da execuc¸˜ao de replicac¸˜oes do experimento controlado inicialmente conduzido por Takemiya (2017).

1.4 ORGANIZAC¸ ˜AO DO TEXTO

Foi exposto nesse cap´ıtulo o contexto no qual este trabalho se insere, a motivac¸˜ao para a sua realizac¸˜ao e o objetivo a ser alcanc¸ado. No Cap´ıtulo 2 ser˜ao apresentados conceitos b´asicos sobre estudos secund´arios, sobre o uso dos MCs no contexto da Ciˆencia da Computac¸˜ao (CC) e sobre replicac¸˜ao de experimentos. No Cap´ıtulo 3 ser´a apresentado o pacote de laborat´orio do experimento original e os resultados da avaliac¸˜ao inicial. No Cap´ıtulo 4 ser˜ao apresentadas as replicac¸˜oes, assim como os resultados alcanc¸ados. Por fim, no Cap´ıtulo 5 ser˜ao apresentadas as conclus˜oes.

(20)

2 FUNDAMENTAC¸ ˜AO TE ´ORICA

Nesse cap´ıtulo s˜ao descritos os principais conceitos sobre MCs e replicac¸˜ao de experimentos. Na Sec¸˜ao 2.1 ´e apresentada uma vis˜ao geral sobre MCs. J´a na Sec¸˜ao 2.2 s˜ao apresentados conceitos gerais e caracter´ısticas de replicac¸˜oes de experimentos. Na Sec¸˜ao 2.3 s˜ao apresentados o planejamento, conduc¸˜ao e resultados de um estudo terci´ario conduzido sobre replicac¸˜oes de experimentos na ES.

2.1 MAPAS CONCEITUAIS

MCs s˜ao ferramentas gr´aficas utilizadas para organizar e representar conhecimento. Trata-se de uma t´ecnica desenvolvida na d´ecada de 70 por Joseph Novak e seus colaboradores na Universidade de Cornell, nos Estados Unidos, com o objetivo de investigar o aprendizado dos alunos sobre os conceitos relacionados a ´area de ciˆencias. O desenvolvimento dos MCs teve como base a teoria da psicologia do aprendizado de Paul (1963) que sugere que a aprendizagem ocorre pela assimilac¸˜ao de novos conceitos, proposic¸˜oes em conceitos existentes e estruturas cognitivas individuais.

Um exemplo de MC e seus atributos ´e apresentado na Figura 1. Observa-se na figura que os MCs incluem conceitos dentro de c´ırculos ou retˆangulos e as relac¸˜oes entre eles s˜ao indicadas por linhas. Essas linhas contˆem palavras associadas (de ligac¸˜ao) que descrevem a natureza da relac¸˜ao que vincula os conceitos. Um MC permite a estruturac¸˜ao e a s´ıntese, al´em de possibilitar a visualizac¸˜ao de elementos relacionados simplificando a obtenc¸˜ao de conhecimento (NOVAK; GOWIN, 1984).

Comumente adotados no contexto de aprendizagem, MCs representam importante ferramenta de suporte, podendo auxiliar em anotac¸˜oes, s´ıntese e planejamento de um assunto, al´em de contribuir no entendimento das relac¸˜oes entre os conceitos, na transferˆencia do conhecimento de forma sintetizada e como instrumento de avaliac¸˜ao (ALIAS; SURADI, 2008; ADESOPE; NESBIT, 2009).

(21)

Figura 1: Exemplo de mapa conceitual Fonte: (NOVAK; CANAS, 2007)

No contexto da ES, os MCs tˆem sido aplicados em diferentes cen´arios, como os descritos a seguir.

Morsi et al. (2007) relataram o uso do MCs para elaborac¸˜ao de curr´ıculos dos cursos de graduac¸˜ao de uma universidade. Nesse estudo foi gerado um MC gen´erico que serviu de modelo para representar os curr´ıculos dos cursos de graduac¸˜ao. Em outra oportunidade, Faily et al. (2013) relataram o uso de MCs com o objetivo de melhorar a qualidade das especificac¸˜oes de requisitos. Mohamed et al. (2013) destacaram que um dos obst´aculos do desenvolvimento de ontologias para projetos de software ´e a capacidade das partes interessadas compreenderem e representarem o seu conhecimento. Assim, os autores sugeriram o uso de MCs baseados em ontologias para ES para minimizar essa dificuldade. Snider et al. (2014) motivaram o uso dos MCs como um meio para determinar e assegurar as propriedades de seguranc¸a de softwares em diferentes fases do ciclo de vida de seu desenvolvimento.

No dom´ınio de estudos secund´arios, tamb´em nota-se a utilizac¸˜ao de MCs. Alias e Suradi (2008) conduziram um experimento com alunos de p´os-graduac¸˜ao no intuito de utilizar

(22)

MCs para auxiliar na s´ıntese de dados. Os resultados do experimento revelaram que os MCs podem auxiliar na extrac¸˜ao de ideias de um estudo, organizar os dados extra´ıdos, al´em de facilitar a atividade de s´ıntese.

2.2 REPLICAC¸ ˜AO

A replicac¸˜ao de experimentos ´e um dos m´etodos de pesquisa cient´ıfica que pode ser utilizado na ES, e como os demais m´etodos da ´area apresenta desafios `a sua realizac¸˜ao. Na busca por estudos para ajudar a compreender os desafios de replicar experimentos na ES, dois MSs foram desenvolvidos (de Magalh˜aes et al., 2014; MAGALH ˜AES et al., 2015). Informac¸˜oes relevantes foram identificadas, por´em os estudos encontrados n˜ao apresentaram definic¸˜oes claras de conceitos, termos ou taxonomia para distinguir os tipos de replicac¸˜oes, seus pap´eis e diretrizes para apoiar o processo de replicac¸˜ao.

O cen´ario apresentado anteriormente em conjunto com a crescente utilizac¸˜ao das replicac¸˜oes pela comunidade de ES e a inconsistˆencia nas terminologias utilizadas referente ao tema, motivou Baldassarre et al. (2014) a apresentarem um estudo propondo uma taxonomia para o tema. O resultado ´e apresentado na Tabela 1.

´

E poss´ıvel observar que uma replicac¸˜ao em ES pode ser classificada em 5 tipos:

• Interna: A replicac¸˜ao do tipo interna se caracteriza por envolver os mesmos pesquisadores (ou a maioria deles) que participaram do experimento original e, em alguns estudos, pode ser chamada de replicac¸˜ao dependente.

• Externa: Uma replicac¸˜ao classifica-se como externa quando seus pesquisadores ou a maioria deles diferem dos pesquisadores do experimento original. Em alguns estudos ´e tamb´em chamada de independente.

• Pr´oxima: Uma replicac¸˜ao ´e classificada como pr´oxima quando a mesma n˜ao pode ser executada exatamente como o experimento original, sendo realizada o mais pr´oximo poss´ıvel. Assim o projeto, a hip´otese, o contexto e as medidas permanecem os mesmos.

• Diferenciada: Tamb´em chamada de melhorada na literatura, esse tipo de replicac¸˜ao indica alterac¸˜oes propositais no projeto, hip´otese, contexto e medidas com relac¸˜ao ao experimento original.

• Conceitual: Nesse tipo enquadram-se as replicac¸˜oes que alteram todo o experimento original, preservando somente a quest˜ao ou hip´otese de pesquisa.

(23)

Tabela 1: Proposta de taxonomia Fonte: Adaptado de Baldassarre et al. (2014) Termo

Portuguˆes

Termo Inglˆes Similaridade com outras definic¸˜oes na literatura

Definic¸˜ao

Interna Internal Dependente Os mesmos pesquisadores realizam a replicac¸˜ao.

Externa External Independente Pesquisadores diferentes realizam a replicac¸˜ao.

Pr´oxima Close Exata, Estrita, Semelhante

O experimento n˜ao pode ser replicado exatamente como o original. Replicac¸˜ao realizada o mais pr´oxima poss´ıvel do experimento original. Projeto, hip´otese, contexto e medidas permanecem inalteradas.

Diferenciada Differentiated Melhorada Mudanc¸as referentes ao experimento original s˜ao intencionalmente feitas para a replicac¸˜ao: o projeto, a hip´otese, o contexto e as medidas.

Conceitual Conceptual N˜ao h´a Tudo na configurac¸˜ao do projeto experimental ´e diferente, exceto a quest˜ao ou hip´otese de pesquisa.

Dois fatores que caracterizam replicac¸˜oes foram determinantes para a definic¸˜ao dos termos que comp˜oem a taxonomia de Baldassarre et al. (2014): (i) o projeto experimental, isto ´e, as etapas seguidas no estudo; e (ii) os pesquisadores que conduzem a replicac¸˜ao.

Independentemente do tipo de replicac¸˜ao, o seu crescente uso na ES deve-se ao fato de que sua utilizac¸˜ao e a diversidade de ambientes nas quais s˜ao realizadas, proporcionam o fortalecimento e enriquecimento do conhecimento a respeito de um determinado tema (SHULL et al., 2002).

Diante da variabilidade nos resultados das replicac¸˜oes, pode-se afirmar que uma replicac¸˜ao bem-sucedida ´e aquela que ajuda a comunidade de pesquisa a desenvolver conhecimento nas mais diversas condic¸˜oes (BASILI et al., 1999; VEGAS et al., 2006). Assim, uma replicac¸˜ao que produz resultados semelhantes aos do experimento original em que se baseou, ´e t˜ao ´util para a comunidade como uma replicac¸˜ao que produz resultados diferentes e, por sua vez, fornece informac¸˜oes que ajudam os pesquisadores a entenderem o porquˆe das

(24)

diferenc¸as (SHULL et al., 2008).

Replicac¸˜oes bem sucedidas devem ser relatadas com fidelidade aos resultados obtidos. Um bom relat´orio de uma replicac¸˜ao pode ser usado como um crit´erio para uma replicac¸˜ao ser considerada bem sucedida. N˜ao ´e suficiente fazer um bom trabalho durante a replicac¸˜ao do estudo, ´e necess´ario produzir tamb´em um relat´orio completo da replicac¸˜ao (MAGALH ˜AES et al., 2015). Carver (2010) apresenta diretrizes para criac¸˜ao de relat´orios de replicac¸˜oes. No estudo de Silva et al. (2014), os autores utilizam essas diretrizes para criar um conjunto de crit´erios de qualidade para avaliar as replicac¸˜oes. O resultado da avaliac¸˜ao de qualidade realizada por eles mostra que, em geral, os documentos de replicac¸˜ao n˜ao cumprem as prescric¸˜oes das diretrizes de relat´orio. Dessa forma, ´e fundamental a atenc¸˜ao dos pesquisadores no processo de divulgac¸˜ao dos resultados das replicac¸˜oes.

Para a realizac¸˜ao de uma replicac¸˜ao, a documentac¸˜ao detalhada do processo de execuc¸˜ao do experimento original ´e fundamental. Essa documentac¸˜ao ´e comumente chamada de pacote de laborat´orio (BROOKS et al., 2008). Os pacotes de laborat´orio devem ser vistos como fonte dos detalhes para se obter uma compreens˜ao suficiente do estudo que ser´a replicado. Com isso, os pesquisadores podem definir qual o tipo de replicac¸˜ao a executar. Por exemplo, um pesquisador pode decidir que uma replicac¸˜ao dependente com pequenas modificac¸˜oes no estudo original ´e o melhor plano de ac¸˜ao. Nesse caso, o pacote de laborat´orio tem que fornecer informac¸˜oes para apoiar a replicac¸˜ao. O pesquisador tamb´em pode escolher usar uma replicac¸˜ao independente para re-testar a mesma hip´otese com um projeto experimental completamente novo. Nesse caso, o pacote de laborat´orio tem que fornecer ao pesquisador detalhes suficientes sobre como o estudo original foi realizado para permitir que seja criado um estudo suficientemente diferente (SHULL et al., 2008).

Visando compreender o cen´ario atual sobre replicac¸˜oes no contexto da ES, foi conduzido um estudo terci´ario, apresentado a seguir.

2.3 ESTUDO TERCI ´ARIO SOBRE REPLICAC¸ ˜OES DE EXPERIMENTOS NA ES

Segundo Kitchenham (2004), a evidˆencia mais confi´avel a respeito de um dado t´opico de pesquisa adv´em da agregac¸˜ao de todos os estudos prim´arios sobre esse t´opico. A RSL ´e um m´etodo recomendado para agregar estudos prim´arios. J´a um estudo terci´ario pressup˜oe uma RSL de estudos secund´arios.

O objetivo do estudo terci´ario que ser´a apresentado nessa sec¸˜ao ´e identificar trabalhos secund´arios (RSLs e MSs) relacionados com replicac¸˜ao de experimentos em ES sob a

(25)

perspectiva de replicac¸˜oes de estudos experimentais.

O processo adotado para a conduc¸˜ao desse estudo terci´ario foi o sugerido por Kitchenham e Charters (2007a). Em resumo, as trˆes etapas que comp˜oem esse processo s˜ao: planejamento, execuc¸˜ao e divulgac¸˜ao dos resultados. O presente protocolo, descrito em detalhes na sequˆencia, ´e resultado da etapa de planejamento.

2.3.1 ETAPA DE PLANEJAMENTO

´

E durante a etapa de planejamento que o protocolo ´e criado. Esse documento cont´em itens como as quest˜oes de pesquisa, estrat´egias de busca e selec¸˜ao de estudos, al´em dos formul´arios adotados para a extrac¸˜ao dos dados relevantes para responderem as quest˜oes de pesquisa. O protocolo e seus itens s˜ao detalhados nas pr´oximas subsec¸˜oes.

2.3.1.1 QUEST ˜OES DE PESQUISA

As quest˜oes de pesquisa (QPs) a serem respondidas s˜ao:

• QP 1: Quais s˜ao os estudos secund´arios sobre replicac¸˜oes em ES que foram desenvolvidos?

A QP1 pode ser decomposta nas seguintes subquest˜oes:

• QP 1.1: Qual a ´area de execuc¸˜ao dos experimentos replicados? • QP 1.2: Qual o m´etodo dos experimentos replicados?

• QP 1.3: Qual a taxa de confirmac¸˜ao dos resultados das replicac¸˜oes em relac¸˜ao ao experimento original?

A QP1 e suas respectivas subquest˜oes foram estruturadas seguindo os crit´erios PICO, como apresentado na Tabela 2.

Uma forma de estruturar as quest˜oes de pesquisa ´e utilizar os crit´erios PICO definidos por Pettigrew e Roberts (2006): (i) Populac¸˜ao (grupo da populac¸˜ao que ser´a investigado pela intervenc¸˜ao, por exemplo, publicac¸˜oes sobre o tema da RSL); (ii) Intervenc¸˜ao (o que ser´a observado); (iii) Comparac¸˜ao (parˆametro de referˆencia ou um conjunto inicial de dados que o pesquisador j´a possu´ıa) e (iv) Outcomes - resultados (resultados esperados ao final da RSL).

(26)

Tabela 2: Adoc¸˜ao dos crit´erios PICO

Populac¸˜ao Estudos secund´arios relacionados `as replicac¸˜oes de experimentos em ES.

Intervenc¸˜ao Avaliac¸˜ao das caracter´ısticas das replicac¸˜oes como o tipo de replicac¸˜ao, entre outras.

Comparac¸˜ao N˜ao se aplica.

Resultados Trabalhos secund´arios (RSLs e MSs) relacionados com replicac¸˜ao de experimentos em ES.

2.3.1.2 BUSCA POR LITERATURA RELEVANTE

O prop´osito de uma RSL ´e conduzir uma busca abrangente e exaustiva de estudos relevantes para abordar as QPs (KITCHENHAM; CHARTERS, 2007a). O processo precisa ser rigoroso e imparcial, e deve envolver uma ampla cobertura das fontes como bases de dados online, revistas e conferˆencias. A fim de minimizar vieses e maximizar o n´umero de fontes, uma estrat´egia pr´e-definida para identificar potenciais estudos secund´arios foi necess´aria. Para esse estudo foi adotada a busca autom´atica, sendo assim fez-se necess´aria a construc¸˜ao de uma stringde busca. A estrat´egia usada para construir a string de busca foi composta por quatro etapas:

• Etapa 1. Identificar os principais termos considerando as quest˜oes de pesquisa (Tabela 3);

• Etapa 2. Identificar sinˆonimos ou palavras alternativas ou abreviac¸˜oes ou termos significativos encontrados em estudos relevantes da ´area de interesse deste trabalho (Tabela 4);

• Etapa 3. Utilizar operador l´ogico OU (em inglˆes OR) para incorporar sinˆonimos, palavras alternativas e abreviac¸˜oes (Tabela 5);

• Etapa 4. Utilizar operador l´ogico E (em inglˆes AND) para ligar os termos relevantes (Tabela 6).

Tabela 3: Termos derivados do PICO

Populac¸˜ao Revis˜oes Sistem´aticas da Literatura (RSLs) e Mapeamentos Sistem´aticos (MSs) Intervenc¸˜ao Replicac¸˜oes de experimentos

(27)

Tabela 4: Termos derivados de palavras encontradas em estudos relevantes

Autores Ano Palavras

Silva et al. 2011 Replication, experiment, empirical study, mapping study,literature review, software engineering

de Magalh˜aes et al. 2014 Replication of empirical studies, replication, empirical software engineering, experimental replication.

Magalh˜aes et al. 2015 Replications, experiments empirical studies, mapping study, systematic literature review, software engineering

Silva et al. 2014 Replications, experiments, empirical studies, mapping study, systematic literature review, software engineering

Tabela 5: Concatenac¸˜ao de palavras alternativas utilizando operador OU (OR) No T´opico principal Resultado

1 Replication

in software

engineering

(replication OR replications OR experiments OR ”empirical studies” OR ”empirical study” OR ”mapping study” OR ”mapping studies” OR ”software engineering”)

2 Systematic

literature review

(”systematic literature review” OR SLR OR ”systematic review” OR ”systematic reviews” OR ”literature review” OR ”review of studies” OR ”structured review” OR ”literature analysis” OR ”in-depth survey” OR ”literature survey” OR ”meta-analysis” OR ”past studies” OR ”empirical body of knowledge” OR ”overview of existing research” OR ”body of published research” OR ”software engineering”)

2.3.1.3 ESTRAT ´EGIA DE BUSCA

Ap´os a definic¸˜ao da string de busca, o processo de identificac¸˜ao de literatura relevante foi iniciado. A busca foi baseada nas principais bases eletrˆonicas adotadas por pesquisadores

(28)

Tabela 6: Concatenac¸˜ao de todas as palavras poss´ıveis utilizando o operador E (AND) Resultado

(replication OR replications OR experiments OR ”empirical studies” OR ”empirical study” OR ”mapping study” OR ”mapping studies” OR ”software engineering”) AND (”systematic literature review” OR SLR OR ”systematic review” OR ”systematic reviews” OR ”literature review” OR ”review of studies” OR ”structured review” OR ”literature analysis” OR ”in-depth survey” OR ”literature survey” OR ”meta-analysis” OR ”past studies” OR ”empirical body of knowledge” OR ”overview of existing research” OR ”body of published research” OR ”software engineering”) AND (”software engineering”)

que conduzem RSLs na ES (BRERETON et al., 2007), por meio do dom´ınio da Universidade Tecnol´ogica Federal do Paran´a, Campus de Corn´elio Proc´opio, sendo que as bases definidas para a busca foram:

• ACM Digital Library (http://dl.acm.org/)

• IEEE Xplore (http://ieeexplore.ieee.org/Xplore/home.jsp) • Science Direct (http://www.sciencedirect.com/)

• Scopus (http://www.scopus.com/)

Todos os estudos retornados das bases de dados foram catalogados no software gerenciador de referˆencias denominado JabRef. Algumas bases eletrˆonicas ofereceram o recurso de exportac¸˜ao de meta-dados que puderam ser importados nesse software. Nos demais casos, essas informac¸˜oes foram inseridas manualmente.

2.3.2 CRIT ´ERIOS DE SELEC¸ ˜AO DE ESTUDOS

Estudos foram inclu´ıdos na RSL se satisfizeram ao seguinte crit´erio inclus˜ao (CI):

• CI1. ´E um estudo secund´ario, RSL ou MS, abordando replicac¸˜ao de experimentos em ES.

Estudos foram exclu´ıdos da RSL se satisfizeram um ou mais crit´erios de exclus˜ao (CE):

• CE1. N˜ao ´e escrito em inglˆes. • CE2. ´E um estudo prim´ario.

(29)

• CE3. N˜ao dispon´ıvel nas bases eletrˆonicas consideradas para este estudo. • CE4. Texto completo do estudo n˜ao dispon´ıvel para visualizac¸˜ao.

• CE5. ´E um trabalho convidado, palestra, oficina de relat´orios, livro, tese ou dissertac¸˜ao. • CE6. E um documento incompleto, rascunho, slide de apresentac¸˜oes ou resumo´

estendido.

• CE7. ´E um estudo terci´ario ou estudo de meta-an´alise.

• CE8. Aborda outras ´areas da Ciˆencia da Computac¸˜ao e n˜ao a ES.

• CE9. Aborda um estudo secund´ario (RSL ou MS) de replicac¸˜ao de experimentos em ES somente como parte de trabalho futuro.

• CE10. N˜ao ´e um estudo secund´ario, RSL ou MS, abordando replicac¸˜ao de experimentos em ES.

Os crit´erios de selec¸˜ao foram aplicados em duas etapas, descritas na sequˆencia e representadas na Figura 2.

(30)

2.3.2.1 PROCESSO DE SELEC¸ ˜AO INICIAL

Inicialmente, foram identificados 48 potenciais estudos secund´arios, sendo 13 duplicados. Em seguida os crit´erios de selec¸˜ao foram aplicados atrav´es da leitura dos t´ıtulos e resumos de cada estudo com a finalidade de decidir pela sua inclus˜ao ou exclus˜ao. A selec¸˜ao foi realizada por dois pesquisadores, de forma independente. Conflitos foram resolvidos por consenso. Ao final da selec¸˜ao inicial, 15 estudos foram inclu´ıdos, conforme detalhados na Tabela 7.

Tabela 7: Estudos inclu´ıdos no processo de selec¸˜ao inicial

Id Base Ano T´ıtulo

1 ACM 2013 An ecological perspective towards the evolution of quantitative studies in software engineering

2 ACM 2014 Guidelines for Snowballing in Systematic Literature Studies and a Replication in Software Engineering 3 ACM 2006 Is there a future for empirical software engineering? 4 ACM 2014 Reviewing Technical Approaches for Sharing and

Preservation of Experimental Data

5 ACM 2015 Views on Internal and External Validity in Empirical Software Engineering

6 IEEE 2009 Evaluation and assessment in software engineering [Editorial]

7 IEEE 2014 Outliers and replication in software engineering 8 IEEE 2015 Replication of empirical studies in software

engineering: An update of a systematic mapping study

9 IEEE 2011 Replication of Empirical Studies in Software Engineering: Preliminary Findings from a Systematic Mapping Study

10 Scince Direct 2015 Investigations about replication of empirical studies in software engineering: A systematic mapping study 11 Scince Direct 2014 Understanding replication of experiments in software

engineering: A classification

12 Scopus 2010 Applying empirical software engineering to software architecture: Challenges and lessons learned

13 Scopus 2014 Replication of empirical studies in software engineering research: A systematic mapping study

14 Scopus 2012 Reporting guidelines for simulation-based studies in software engineering

15 Scopus 2013 The use of visual text mining to support the study selection activity in systematic literature reviews: A replication study

(31)

2.3.2.2 PROCESSO DE SELEC¸ ˜AO FINAL

Os 15 estudos inclu´ıdos durante a selec¸˜ao inicial foram analisados em detalhes, ou seja, o texto completo de cada estudo secund´ario foi lido por dois revisores (Bonora e Felizardo) de forma independente. Ao total, quatro estudos foram inclu´ıdos na selec¸˜ao final, conforme detalhado na Tabela 8. Esses estudos corresponderam aos estudos relevantes que responderam as QPs desse estudo terci´ario. N˜ao ocorreram conflitos durante o processo de selec¸˜ao final.

Tabela 8: Estudos inclu´ıdos no processo de selec¸˜ao final

Id Ano Base T´ıtulo

8 2015 IEEE Replication of empirical studies in software engineering: An update of a systematic mapping study

9 2011 IEEE Replication of Empirical Studies in Software Engineering: Preliminary Findings from a Systematic Mapping Study 10 2015 Science Direct Investigations about replication of empirical studies in

software engineering: A systematic mapping study

13 2014 Scopus Replication of empirical studies in software engineering research: A systematic mapping study

2.3.3 ESTRAT ´EGIA DE EXTRAC¸ ˜AO E S´INTESE DOS DADOS

Com o conjunto final de estudos secund´arios definido a atividade de extrac¸˜ao de dados foi realizada. Um pesquisador foi respons´avel por extrair os dados e preencher o formul´ario de extrac¸˜ao de dados, mostrado na Tabela 9. Outro revisor fez a conferˆencia dos dados extra´ıdos, e os conflitos foram solucionados por consenso.

(32)

Tabela 9: Formul´ario de extrac¸˜ao de dados

Item Valor Observac¸˜oes

Identificac¸˜ao do estudo T´ıtulo Autor Ano de publicac¸˜ao Tipo de referˆencia Nome da conferˆencia/jornal Editora Pa´ıs do estudo

Dados relevantes para responder a QP1 Objetivo do estudo

´

Area da replicac¸˜ao

M´etodo do estudo replicado

Confrontac¸˜ao da replicac¸˜ao com o estudo original

Relevˆancia/contribuic¸˜ao

Os dados extra´ıdos foram catalogados em planilhas do software Microsoft Excel, sendo poss´ıvel responder as QPs:

• QP 1: Quais s˜ao os estudos secund´arios sobre replicac¸˜oes em ES que foram desenvolvidos?

Foram encontrados quatro estudos secund´arios, sendo que trˆes deles relataram replicac¸˜oes, s˜ao eles: (SILVA et al., 2011), (Silva et al., 2014) e (BEZERRA et al., 2015); e um estudo (MAGALH ˜AES et al., 2015) te´orico/conceitual focado em definic¸˜oes, classificac¸˜oes, processos, diretrizes e outros temas sobre replicac¸˜ao na ES. Esse ´ultimo estudo contribuiu para reforc¸ar o referencial te´orico sobre replicac¸˜oes na ES. A RSL de Silva et al. (2011) ´e sobreposta pela RSL de Silva et al. (2014), tanto em tema de pesquisa como em per´ıodo de tempo, por esse motivo somente esse ´ultimo foi considerado para para responder as QPs.

(33)

• QP 1.1: Qual a ´area de execuc¸˜ao dos experimentos replicados?

A Figura 3 apresenta a comparac¸˜ao da m´edia de replicac¸˜oes anuais entre os per´ıodos de 1994 a 2010 e 2011 a 2012. Foram consideradas as replicac¸˜oes dos estudos Silva et al. (2014) e Bezerra et al. (2015). Percebe-se que, em geral, entre os anos de 2011 a 2012 houve consider´avel aumento na m´edia anual de replicac¸˜oes de 7,8 para 25,5 em m´edia por ano, respectivamente, destacando-se as ´areas de Projeto de Software, que de uma m´edia 0,3 replicac¸˜oes por ano no per´ıodo de 1994 a 2010 aumentou para uma m´edia de 6,5 replicac¸˜oes entre os anos de 2011 a 2012, e a de Teste de Software que evoluiu de 0,4 para 5,0 replicac¸˜oes em m´edia por ano nos respectivos per´ıodos analisados. As ´areas de Gerenciamento de Configurac¸˜ao de Software e Processo em ES n˜ao possuem replicac¸˜oes entre os anos de 2011 e 2012. Outra excec¸˜ao ´e a ´area de Requisitos de Software que apresentou mais replicac¸˜oes entre os anos de 1994 e 2010 em relac¸˜ao ao per´ıodo de 2011 a 2012.

Figura 3: M´edia anual de replicac¸˜oes por ´area

• QP 1.2: Qual o m´etodo dos experimentos replicados?

Observa-se na Figura 4 que h´a uma prevalˆencia por replicar estudos que adotaram o Quasi-Experimento e Experimento Controlado como m´etodos de pesquisa. Isso porque esses dois m´etodos s˜ao essenciais para que se adquira o conhecimento necess´ario sobre

(34)

um determinado t´opico de interesse. Al´em disso, a validade de um experimento pode ser influenciada pela validade externa, que ´e a confianc¸a na qual os resultados obtidos dos experimentos podem ser generalizados (LOTT; ROMBACH, 1996). A validade externa pode ser fortalecida pelas replicac¸˜oes (BASILI et al., 1996). A replicac¸˜ao de surveys foi fortalecida de 2010 a 2012, passando de uma m´edia anual de 0,1 replicac¸˜oes para 2.

Figura 4: M´edia anual dos m´etodos replicados

• QP 1.3: Qual a taxa de confirmac¸˜ao dos resultados das replicac¸˜oes em relac¸˜ao ao experimento original?

A replicac¸˜ao consiste em aplicar o mesmo experimento eventualmente em diferentes contextos, a fim de se obter maior credibilidade nas hip´oteses, caso haja confirmac¸˜ao das mesmas, ou aprendizagem quando as hip´oteses s˜ao negadas (FUSARO et al., 1997). Nesse contexto, nota-se na Figura 5 que a prevalˆencia entre as medic¸˜oes referentes a confirmac¸˜ao dos resultados das replicac¸˜oes (1994 a 2010 e 2010 a 2012) em relac¸˜ao ao estudo original mantiveram-se inalterados entre os per´ıodos. Considerando o tipo de replicac¸˜ao para ambos os per´ıodos, foi percebido que nas replicac¸˜oes internas, a maioria delas confirmam o resultado do estudo original, em contrapartida, a maioria das replicac¸˜oes externas n˜ao confirmam os resultados do estudo original. Segundo (BEZERRA, 2014), conjuntos de replicac¸˜oes internas e externas podem equilibrar o vi´es de cada tipo de replicac¸˜ao e contribuir para a comunidade cient´ıfica com maior confianc¸a dos resultados.

(35)

Figura 5: Taxa de confirmac¸˜ao dos resultados das replicac¸˜oes em relac¸˜ao aos experimentos originais

Esse estudo terci´ario serviu como referencial te´orico sobre replicac¸˜ao de experimentos na ES. Na Sec¸˜ao 3, a seguir, ser´a apresentado o experimento original, foco das replicac¸˜oes deste trabalho.

(36)

3 EXPERIMENTO ORIGINAL: MCS PARA APOIAR A SELEC¸ ˜AO DE ESTUDOS

A execuc¸˜ao do experimento envolve a utilizac¸˜ao de resumos gr´aficos e, para auxiliar a criac¸˜ao desses resumos, Takemiya (2017) estabeleceu um modelo de representac¸˜ao visual hier´arquica por meio de MCs. Esse modelo visa representar graficamente o conhecimento e recuperar informac¸˜oes. O objetivo dos MCs n˜ao ´e apenas classificar conceitos, mas relacion´a-los e hierarquiz´a-los. Dessa forma os MCs destacam-se por tamb´em especificar o relacionamento entre os conceitos (NOVAK; GOWIN, 1984). Esses mapas hier´arquicos se estruturam de acordo com a Teoria da Aprendizagem Significativa de David Ausubel, (AUSUBEL et al., 1980; AUSUBEL, 2003) e desse modo contribuem para a construc¸˜ao do conhecimento (TAVARES, 2007).

Com relac¸˜ao `a representac¸˜ao visual proporcionada pelos MCs, existem evidˆencias sobre a sua eficiˆencia. Foi verificado que os interessados localizam mais informac¸˜oes quando elas s˜ao apresentadas em formas de mapas ao inv´es de textos (ODONNELL, 1993). Embora os MCs possam transmitir informac¸˜oes factuais t˜ao bem quanto os textos, esses organizadores gr´aficos s˜ao mais eficientes que os textos para ajudar os leitores a construirem inferˆencias complexas e integrarem as informac¸˜oes que eles fornecem (VEKIRI, 2002). De maneira geral um MC torna mais f´acil a percepc¸˜ao e compreens˜ao de eventos. Existe uma grande proximidade entre a mem´oria visual e as imagens que s˜ao apresentadas, e por causa das suas propriedades visuais espaciais, seu processamento requer um n´umero menor de transformac¸˜oes cognitivas que o processamento de um texto, e desse modo n˜ao excede as limitac¸˜oes da mem´oria de curto prazo (VEKIRI, 2002).

O modelo de MCs proposto por Takemiya (2017) ´e composto da raiz e trˆes n´ıveis hier´arquicos. O primeiro n´ıvel ´e composto dos cinco conceitos fixos que representam as sec¸˜oes dos resumos estruturados, cada qual com um tom de cinza. O segundo n´ıvel envolve os conceitos opcionais que surgem do refinamento dos conceitos fixos, como por exemplo “motivac¸˜ao”, “problema” e “´area de pesquisa” que s˜ao refinamentos do conceito fixo “contexto”. O n´ıvel trˆes abrange os conceitos vari´aveis. O modelo cont´em quatro links cruzados, tais como “ajuda a definir” que liga os conceitos opcionais “problema” e “objetivo”,

(37)

entre outros.

O modelo ´e organizado por um conceito principal (posicionado no centro do mapa), em torno do qual outros conceitos relacionados s˜ao agrupados em n´ıveis. O conceito no topo do mapa ´e o mais inclusivo. Conceitos mais espec´ıficos s˜ao organizados hierarquicamente abaixo. Quanto menor ´e o n´ıvel, mais detalhes s˜ao descritos, como ilustrado na Figura 6. ´E poss´ıvel observar o conceito principal (na raiz), os conceitos fixos, opcionais e vari´aveis (em trˆes outros n´ıveis), e as ligac¸˜oes (b´asicas e cruzadas), descritos como segue (FELIZARDO et al., 2017):

• Conceito principal: representa o conceito mais geral poss´ıvel. Como exemplo pode-se assumir como sendo o t´ıtulo do estudo;

• Conceito fixo: obrigat´orio no modelo proposto, ´e representado por retˆangulos com bordas arredondadas. Como exemplos de conceitos fixos tˆem-se o “Contexto” e o “Objetivo”;

• Conceito opcional: conceito diretamente ligado a estudos experimentais e ´e resultante do refinamento do conceito fixo. ´E representado por um quadrado. Por ser opcional, sua utilizac¸˜ao depende do tipo do estudo;

• Conceito vari´avel: ´e o refinamento do conceito opcional, representado por c´ırculo tracejado. ´E definido de acordo com o tema do estudo. O conceito “ ” ´e um exemplo de conceito vari´avel;

• Link b´asico: estabelece o relacionamento entre conceitos do mesmo n´ıvel no MC e ´e representado por uma linha cont´ınua. Pode-se citar como exemplos “´e formado por” e “´e dividido em”, como demonstrado na Figura 6;

• Link cruzado: representado por linha tracejada, define o relacionamento entre conceitos de n´ıveis diferentes. S˜ao exemplos de links cruzados “ajuda definir” e “ajuda justificar”.

(38)

Figura 6: Modelo para apoiar a criac¸˜ao de resumos gr´aficos Fonte: (TAKEMIYA, 2017)

(39)

No intuito de apoiar a construc¸˜ao dos resumos gr´aficos, Santos et al. (2016) desenvolveram uma ferramenta de construc¸˜ao semiautom´atica de resumos gr´aficos baseados em MCs apoiado em t´ecnicas de Processamento de Linguagem Natural (PLN). Dessa forma, est´a fora do escopo do experimento a criac¸˜ao dos resumos gr´aficos pelos participantes.

Nesse cap´ıtulo ser˜ao apresentadas os itens que comp˜oem o pacote de laborat´orio do experimento original de Takemiya (2017).

3.1 PACOTE DE LABORAT ´ORIO DO EXPERIMENTO ORIGINAL

O experimento de (TAKEMIYA, 2017) foi elaborado no intuito de caracterizar a viabilidade da utilizac¸˜ao de resumos gr´aficos no processo de selec¸˜ao de estudos em RSL.

As quest˜oes de pesquisa (QPs) foram:

• QP1: Resumos gr´aficos baseados em MCs melhoraram o desempenho (em termos de tempo) na atividade de selec¸˜ao de estudos?;

• QP2: Resumos gr´aficos baseados em MCs melhoraram a efetividade (em termos de estudos corretamente inclu´ıdos ou exclu´ıdos) na atividade de selec¸˜ao de estudos?; e

• QP3: Usar resumos gr´aficos baseados em MCs fazem da selec¸˜ao de estudos prim´arios uma atividade menos desagrad´avel e/ou menos cansativa?

Detalhes sobre o projeto experimental s˜ao ilustrados na Figura 7.

Como pode ser observado, os participantes foram divididos em dois grupos, um para executar a selec¸˜ao inicial com resumos textuais (leitura tradicional) e o outro com apoio de resumos gr´aficos. O projeto experimental ´e formado por duas etapas: treinamento e execuc¸˜ao. A primeira etapa, de treinamento, tem o objetivo de nivelar o conhecimento sobre o experimento e mitigar poss´ıveis vi´eses na segunda etapa, que ´e a de execuc¸˜ao. Durante a execuc¸˜ao os participantes selecionam estudos de maneira tradicional ou com apoio dos resumos gr´aficos.

As m´etricas utilizadas foram:

• Desempenho: Soma do total de tempo que cada participante utilizou para classificar os estudos prim´arios como inclu´ıdos ou exclu´ıdos.

• Efetividade: Foi calculada como a soma dos estudos corretamente selecionados (inclu´ıdos ou exclu´ıdos) por cada participante. Como referˆencia para determinar a correta classificac¸˜ao de cada estudo sugerido, as autoras definiram um or´aculo.

(40)

Figura 7: Projeto experimental Fonte: Autoria pr´opria

• Fadiga/N´ıvel de Cansac¸o: Foi mensurada atrav´es da an´alise qualitativa da opini˜ao dos participantes.

Em resumo, o pacote de laborat´orio disponibilizado ´e composto por documentos e materiais como:

• Formul´ario de identificac¸˜ao do participante e hor´ario de in´ıcio da atividade.

• Conjunto de estudos a serem submetidos ao processo de selec¸˜ao de acordo com os crit´erios de inclus˜ao e exclus˜ao. Nesse caso, nove estudos para a etapa de treinamento e 20 para a de execuc¸˜ao, sendo a mesma quantidade para cada grupo.

• Formul´ario com o hor´ario de t´ermino do processo de selec¸˜ao e com uma tabela de sumarizac¸˜ao do processo.

• Para a etapa de treinamento, um question´ario do perfil do participante e para a etapa de execuc¸˜ao, um question´ario referente ao modelo de resumo utilizado, textual ou gr´afico.

(41)

3.2 CONDUC¸ ˜AO E RESULTADOS DO EXPERIMENTO ORIGINAL

O experimento original conduzido por Takemiya (2017) contou com a participac¸˜ao de oito estudantes da ´area de ES, cinco de doutorado e trˆes de mestrado, todos com experiˆencia na conduc¸˜ao de estudos secund´arios.

No in´ıcio do experimento, as autoras explanaram aos participantes uma vis˜ao geral do estudo, estabelecendo-o em duas etapas: uma de treinamento e outra de execuc¸˜ao. Para realizar o processo de selec¸˜ao de estudos, em ambas etapas, os participantes foram aleatoriamente divididos em dois grupos: (i) Grupo 1 (G1) realizaram a selec¸˜ao de estudos atrav´es da leitura dos resumos textuais ou estruturados, e o (ii) Grupo 2 (G2) realizaram a selec¸˜ao de estudos com o apoio e suporte dos resumos gr´aficos baseados em MCs. Os estudos utilizados para o treinamento foram diferentes dos utilizados na execuc¸˜ao, evitando assim vi´eses. Cada grupo recebeu os estudos prim´arios a serem analisados com seu t´ıtulo, respectivo resumo, os crit´erios de inclus˜ao e exclus˜ao e um formul´ario para resumir a decis˜ao de cada participante, individualmente, em incluir ou excluir os estudos.

O conjunto de estudos utilizados consistiu de estudos selecionados resultantes de um MS conduzido por Souza et al. (2014) relacionado `a Gerˆencia do Conhecimento (GC) em teste de software. Esse MS ´e composto por quarenta estudos, sendo que vinte deles foram escolhidos aleatoriamente para compor o conjunto de estudos a serem utilizados na etapa de execuc¸˜ao.

Ap´os a execuc¸˜ao dos procedimentos do experimento original, a autora sumarizou os resultados. Takemiya (2017) afirmou que devido `a pequena amostra, n˜ao foram utilizados testes de significˆancia estat´ıstica.

Para responder `a QP1 foi medido o desempenho dos participantes com relac¸˜ao ao tempo gasto para tomar suas decis˜oes (Tabela 10).

(42)

Tabela 10: Resumo dos resultados do experimento original de Takemiya (2017) Grupo ID Tempo (min) Estudos Correta-mente Inclu´ıdos Estudos Correta-mente Exclu´ıdos Total Correta-mente Selecio-nados Estudos Incorreta-mente Inclu´ıdos Estudos Incorreta-mente Exclu´ıdos Total Incorreta-mente Selecio-nados G1 1 29 6 7 13 (65%) 3 4 7 2 26 6 8 14 (70%) 2 4 6 3 19 6 7 13 (65%) 3 4 7 4 19 8 7 15 (75%) 3 2 5 G2 5 20 7 7 14 (70%) 3 3 6 6 20 7 9 16 (80%) 1 3 4 7 30 7 7 14 (70%) 3 3 6 8 13 8 7 15 (75%) 4 2 5

A hip´otese elaborada pelas autoras foi de que os participantes que utilizassem resumos gr´aficos apresentariam um melhor desempenho e efetividade. No entanto, os resultados mostraram que os resumos gr´aficos apresentaram desempenho e efetividade semelhantes ao processo de selec¸˜ao realizado com o resumo textual. Por esse motivo, as autoras acreditam que um experimento quantitativo poderia fornecer evidˆencias que fundamentassem a hip´otese por elas sugerida.

O trabalho tamb´em avaliou a atividade de selec¸˜ao em termos de usabilidade, facilidade de uso, facilidade de aprendizado e satisfac¸˜ao do usu´ario. As autoras mostraram-se motivadas diante da an´alise dos dados coletados, pois quatro participantes concordaram plenamente de que o uso de resumos gr´aficos facilitou a atividade de selec¸˜ao dos estudos e trˆes deles relataram ter aprendido facilmente a leitura dos resumos gr´aficos.

Os participantes tamb´em expressaram que os resumos gr´aficos foram f´aceis de seguir, seus conceitos foram de claro entendimento e os links/links cruzados n˜ao empregaram dificuldade de compreens˜ao. Todos os participantes do G2 revelaram que estavam completamente satisfeitos quanto `a utilizac¸˜ao dos resumos gr´aficos para a selec¸˜ao de estudos prim´arios e manifestaram que recomendariam fortemente o seu uso para outros pesquisadores.

Por fim, o experimento original forneceu evidˆencias iniciais de que resumos gr´aficos poderiam contribuir positivamente na atividade de selec¸˜ao de estudos, reduzindo a fadiga inerente ao processo. As autoras destacaram que s˜ao necess´arias mais evidˆencias quantitativas que justifiquem o uso dos resumos gr´aficos na conduc¸˜ao de estudos secund´arios, reforc¸ando

(43)

que resumos gr´aficos baseados em MCs poderiam ser amplamente adotados pela ES e outras ´areas de pesquisa como um meio para facilitar a transmiss˜ao de informac¸˜oes via representac¸˜ao visual.

Como trabalho futuro, Takemiya (2017) sugeriu replicac¸˜oes do experimento a fim de reforc¸ar os indicadores obtidos, pois os resultados quantitativos n˜ao puderam ser generalizados devido `a pequena amostra de participantes. Dessa forma, com este trabalho tem-se a oportunidade de gerar evidˆencias para gerar um corpo de conhecimento sobre o uso dos MCs para apoiar a selec¸˜ao de estudos no processo de RSL na ES.

(44)

4 REPLICAC¸ ˜OES DO EXPERIMENTO ORIGINAL

Essa sec¸˜ao relata as replicac¸˜oes conduzidas, assim como os resultados dessas replicac¸˜oes, abordando nossas QPs.

4.1 VIS ˜AO GERAL DOS RESULTADOS

A busca pela consolidac¸˜ao do conhecimento no uso de resumos gr´aficos representados por MCs e sua contribuic¸˜ao na etapa de selec¸˜ao de estudos na RSL motivou a realizac¸˜ao das replicac¸˜oes relatadas neste estudo. Vale lembrar que os pesquisadores utilizaram o mesmo projeto experimental (pacote de laborat´orio) do experimento original.

Ao todo foram realizadas 5 replicac¸˜oes, detalhadas a seguir. Uma sexta replicac¸˜ao foi realizada em um pa´ıs de l´ıngua inglesa com a finalidade de verificar a hip´otese de que o conhecimento nativo desse idioma pudesse influenciar nos resultados, uma vez que todo o material utilizado (estudos) estava escrito em inglˆes. Essa sexta replicac¸˜ao est´a relatada na subsec¸˜ao 4.3.

Tabela 11: Replicac¸˜oes realizadas e quantidade de participantes por grupo

NoReplicac¸˜ao Local G1 G2 Total

1 Universidade Estadual de Maring´a - UEM 9 9 18

2 Universidade Tecnol´ogica Federal do Paran´a - UTFPR 4 4 8

3 Universidade Federal de Pernambuco - UFPE 9 8 17

4 Universidade Federal de S˜ao Carlos - UFSCAR 13 16 29

5 Instituto de Ciˆencias Matem´aticas e de Computac¸˜ao da

Universidade de S˜ao Paulo - ICMC-USP 6 5 11

Total 41 42 83

Um resumo dos resultados das 5 replicac¸˜oes ´e mostrado na Tabela 12. O desempenho dos participantes foi mensurado (veja a segunda coluna da Tabela 12) para responder `a QP1 (Resumos gr´aficos baseados em MCs melhoraram o desempenho (em termos de tempo) na atividade de selec¸˜ao de estudos?). A m´edia de tempo gasto pelos participantes do G1 foi de 24,50 minutos e do G2 foi de 17,10 minutos, sendo que o tempo gasto pelos participantes de G1 (R1–R5) variou entre 18,60 e 31,50 minutos e em G2 (R1–R5) entre 12,20 e 21,00 minutos.

(45)

O tempo economizado usando resumos gr´aficos nas replicac¸˜oes foi de 7,40 minutos para cada conjunto de 20 estudos.

Tabela 12: Resumo dos resultados das replicac¸˜oes

Grupo Tempo (min) I Cor. E Cor. I e E Cor. I Inc. E Inc. E e E Inc.

REPLICAC¸ ˜AO 1 G1 18.60 7,89 5,56 13,44 2,11 4,44 6,56 G2 12,20 7,22 7,11 14,33 2,78 2,89 5,67 REPLICAC¸ ˜AO 2 G1 23,30 6,50 7,25 13,75 3,50 2,75 6,25 G2 21.00 7,25 7,50 14,75 2,75 2,50 5,25 REPLICAC¸ ˜AO 3 G1 20,70 7,56 3,56 11,11 2,44 6,44 8,89 G2 14,30 7,25 6,38 13,63 2,75 3,63 6,38 REPLICAC¸ ˜AO 4 G1 28,50 7,46 4,54 12,00 2,54 5,46 8,00 G2 20,80 7,25 4,81 12,06 2,75 5,19 7,94 REPLICAC¸ ˜AO 5 G1 31,50 6,67 5,17 11,83 3,33 4,83 8,17 G2 15,40 8,00 5,80 13,80 2,00 4,20 6,20

RESUMO DE TODAS AS REPLICAC¸ ˜OES

G1 24,50 7,37 4,90 12,27 2,63 5,10 7,73

G2 17,10 7,33 5,98 13,31 2,67 4,02 6,69

Legenda: Cor. = Correto; Inc. = Incorreto; I = Inclus˜ao; E = Exclus˜ao

A Tabela 12 (veja a quinta coluna) mostra a m´edia de estudos corretamente inclu´ıdos/exclu´ıdos durante as cinco replicac¸˜oes. A m´edia de estudos corretamento inclu´ıdos/exclu´ıdos foi 12,27 e 13,31 em G1 e G2. Considerando a m´edia (diferenc¸a de 1,04 estudos em favor de G2 – Cohen’s d = 0,48), pode-se afirmar que resumos gr´aficos apresentaram uma vantagem de 1,04 estudos em comparac¸˜ao `a G1. Considerando os estudos incorretamente inclu´ıdos/exclu´ıdos, as m´edias foram de 7,73 e 6,69 no G1 e G2, respectivamente. A mesma diferenc¸a de 1,04 estudos tamb´em foi observada em favor do G2.

Para avaliar formalmente os resultados, utilizou-se o teste de Man-Whitney, tamb´em denominado teste de Mann-Whitney-Wilcoxon, teste de hip´otese estat´ıstica n˜ao param´etrica.

Em relac¸˜ao ao desempenho, nossos resultados mostraram que (veja a Tabela 14 – Desempenho) existe uma diferenc¸a estatisticamente significante (p-value < 0,05) entre as m´edias de tempo com o uso de resumos gr´aficos e o m´etodo tradicional (selec¸˜ao manual/resumos textuais). Portanto, pode-se afirmar que o uso de resumos gr´aficos tem uma “grande” melhoria no desempenho da tarefa de revis˜ao dos estudos prim´arios (Cohen’s d = 1,04 – ver Tabela 13).

Quanto `a efetividade, os resultados mostraram que (ver Tabela 12) existe uma diferenc¸a estatisticamente significante (p-valor < 0,05) entre inclus˜oes e exclus˜oes corretas e incorretas

Referências

Documentos relacionados

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

Ninguém quer essa vida assim não Zambi.. Eu não quero as crianças

O primeiro passo para introduzir o MTT como procedimento para mudança do comportamento alimentar consiste no profissional psicoeducar o paciente a todo o processo,

Para disciplinar o processo de desenvolvimento, a Engenharia de Usabilidade, também conceituada e descrita neste capítulo, descreve os métodos estruturados, a

Mineração de conhecimento interativa em níveis diferentes de abstração: Como é  difícil  prever  o  que  exatamente  pode  ser  descoberto  de  um  banco 

Este trabalho busca reconhecer as fragilidades e potencialidades do uso de produtos de sensoriamento remoto derivados do Satélite de Recursos Terrestres Sino-Brasileiro

é bastante restrita, visto que tanto suas duas entradas, quanto as galerias e condutos que interligam os pequenos salões são bastante estreitos, e a umidade na maioria dos salões

Esse trabalho envolveu o Georreferenciamento dos indivíduos arbóreos da sede administrativa da Universidade Tecnológica Federal do Paraná (UTFPR), Câmpus Dois