Representa¸c˜ao de Dados de Teste - Framework de geração de dados de teste para programas orien

Para gera¸cão de dados de teste para programas orientados a objetos é necessário representar objetos, métodos e seus valores em uma codifica¸cão poss´ıvel de ser executa por seus algoritmos. Essa se¸cão apresenta dois modelos de representa¸cão de dados de teste encontrados na literatura.

de software orientado a objetos. Sua representa¸cão especifica uma estrutura cromossômica que agrupa sequências de comandos, cria¸cão de objetos, mudan¸cas de estados e chamada de métodos. Essa estrutura cromossômica constitui uma entrada de dados para um al- goritmo de teste, a qual consideramos como indiv´ıduo de teste. Na representa¸cão de Tonella um cromossomo (indiv´ıduo) é dividido em duas partes, separadas pelo caractere “@” (arroba). A primeira parte contém uma sequência de a¸cões (i.e., construtores e métodos), separadas pelo caractere “:” (dois pontos). Cada a¸cão pode conter um novo objeto, atribu´ıdo a uma variável do cromossomo, indicada como “$id”.

A segunda parte contém os valores de entrada dos métodos para serem usados nas suas chamadas. Valores de entrada de métodos ou construtores podem ser de tipos primitivos (i.e., int, double, boolean), separados pelo caractere “,” (v´ırgula).

Figura 3.9– Aplica¸c˜ao da representa¸c˜ao de Tonella. Fonte: Criado com base em To- nella (2004)

A Figura 3.9 apresenta o modo como a representa¸cão de Tonella é aplicada. Do lado esquerdo pode-se observar um bloco de código e do lado direito sua representa¸cão utilizando a representa¸cão de Tonella. Pode-se notar que os valores inteiros utilizados como parâmetros para os métodos são posicionados do lado direito do s´ımbolo de “@” (arroba), enquanto que as chamadas a métodos são posicionadas do lado esquerdo. Vale ressaltar a sintaxe utilizada para representar a constru¸cão de instâncias de objetos e as chamadas a métodos. No caso, a instru¸cão “A a = new A();” foi escrita na representa¸cão de Tonella (2004) com a sintaxe “$a=A()”, assim como a sintaxe da chamada de método “b.f(2);” foi representada com a sintaxe “$b.f(int)”. Nota-se que a representa¸cão de Tonella mantém a apresenta¸cão do indiv´ıduo de forma intuitiva, o que facilita a sua leitura e compreensão. Todo o conjunto de instru¸cões foi adequado a uma nova representa¸cão que ordena todos os comandos em uma única linha.

A gera¸cão de valores para os parâmetros de tipo primitivo é aleatória, mas segue algumas regras, como:

Valores inteiros e de ponto flutuante – valores inteiros e de ponto flutuante s˜ao se- lecionados no intervalo de 0 a 100.

Booleanos – valores booleanos true (verdadeiro) e false (falso) s˜ao escolhidos aleatoriamente, assumindo probabilidade igual (0,5).

Strings e caracteres – valores escolhidos uniformemente dentre os caracteres alfanu- m´ericos (i.e., [a-z A-Z 0-9]).

Segundo Silva e Someren (2010) um dos principais fatores que levam à escolha da representa¸cão de Tonella é o risco de utilizar uma estrutura na qual deve-se tomar cuidado com a compatibilidade dos parâmetros quando testados os métodos, a fim de que não haja corrompimento dos cromossomos. A estrutura de Tonella resolve este problema por meio de uma representa¸cão bem estruturada de composi¸cão dos cromossomos. Silva e Someren (2010) ainda afirmam que outra vantagem de sua utiliza¸cão é a possibilidade de desacoplar o cromossomo do sistema, tornando fácil a aplica¸cão e constru¸cão de diferentes operadores de muta¸cão e crossover.

A representa¸cão de Tonella não é a ´unica utilizada. Segundo Tracey et al. (2002), os algoritmos genéticos tradicionalmente utilizam codifica¸cão binária para suas solu¸cões. Isso decorre do desenvolvimento histórico dos algoritmos genéticos, no qual se faz uma analogia entre os bits e os cromossomos na evolu¸cão natural. No entanto, para gera¸cão de dados de teste, três problemas podem ser encontrados: perda de informa¸cão, corrup¸cão binária e disparidade espacial da solu¸cão original. A disparidade espacial é causada por solu¸cões muito próximas no espa¸co de solu¸cão, mas que são muito distantes no espa¸co de solu¸cão codificado. Por exemplo, a representa¸cão binária do número 31 é “1 1 1 1 1”, enquanto que o número 32 (o número posterior a 31) a representa¸cão é “1 0 0 0 0 0”. Isto é, dois números tão próximos na solu¸cão original, mas que são muito diferentes em suas codifica¸cões. Opera¸cões de muta¸cão e crossover têm dificuldade de executar movimentos entre estas duas solu¸cões.

Para resolver esta questão, os autores propõem o uso da codifica¸cão de Gray (TRACEY et al., 2002, p. 9) como forma de solu¸cão para o problema da disparidade espacial. A codifica¸cão de Gray auxilia com os tipos numéricos, mas não ajuda com tipos não-numéricos, além de não resolver o problema da perda de informa¸cão e da corrup¸cão binária.

A perda de informa¸cão ocorre durante o crossover, quando a representa¸cão binária de um valor é acidentalmente partida em duas partes gerando um terceiro valor, diferente dos valores dos indiv´ıduos que originaram a evolu¸cão. Conforme a Figura 3.10, podemos

identificar dois indiv´ıduos P1 e P2, cujos atributos X possuem valores diferentes (35 e

12, respectivamente), mas que após uma divisão errada do indiv´ıduo para execu¸cão do crossover, geram um novo indiv´ıduo com um valor para X diferente dos demais (TRACEY et al., 2002).

Outro problema enfrentado é a corrup¸cão binária que ocorre durante a muta¸cão de um cromossomo, devido à cópia indevida de alguns bits de uma representa¸cão para outra, modificando o valor de um número que não deveria ser alterado. Na Figura 3.11 pode-se observar que a muta¸cão copia indevidamente os primeiros bits da representa¸cão de um atributo que não deveria ser mutado, acarretando na muta¸cão de mais de um atributo ao mesmo tempo (TRACEY et al., 2002).

Figura 3.10 – Codifica¸cão binária - perda de informa¸cão. Fonte: Tracey et al., 2002.

3.2.1 Opera¸c˜oes com indiv´ıduos de teste

Em sua abordagem, Tonella (2004), prop˜oe um conjunto de operadores de muta¸c˜ao e

crossover, com o objetivo de evoluir os indiv´ıduos da popula¸c˜ao para obter uma popula¸c˜ao

mais adaptada. Os operadores de Tonella funcionam da seguinte maneira:

Muta¸cão de valores de entrada: o valor de um parâmetro primitivo é substitu´ıdo por outro valor, de mesmo tipo, aleatoriamente gerado.

$a=A() : $b=B() : $b.f(int) : $a.m(int, $b) @ 2, 5 $a=A() : $b=B() : $b.f(int) : $a.m(int, $b) @ 6, 5

Figura 3.12 – Representa¸c˜ao de Tonella: muta¸c˜ao de valores de entrada

A Figura 3.12 mostra o parˆametro passado para o m´etodo “f(int)” da classe “B” alterado de 2 para 6.

Mudan¸ca de construtor: um dos construtores do indiv´ıduo é aleatoriamente tro- cado. Esse operador pode acarretar a inclusão de novos parâmetros ou objetos na estrutura do indiv´ıduo, dependendo dos parâmetros esperados pelo novo construtor.

$a=A() : $b=B() : $b.f(int) : $a.m(int, $b) @ 2, 5

$a=A() : $c=C() : $b=B($c, int) : $b.f(int) : $a.m(int, $b) @ 3, 2, 5 Figura 3.13 – Representa¸c˜ao de Tonella: mudan¸ca de construtor

No exemplo da Figura 3.13, o construtor da classe “B” é substitu´ıdo por outro construtor, que recebe dois parâmetros, onde um deles é outro objeto, do tipo “C”, e o segundo parâmetro é de um tipo primitivo.

Inclusão de chamada a método: novas chamadas a métodos são inclu´ıdas aleatoriamente na estrutura do indiv´ıduo. Essa opera¸cão pode exigir a inclusão de novos parâmetros (i.e., objetos, variáveis de tipos primitivos).

$a=A() : $b=B() : $b.f(int) : $a.m(int, $b) @ 2, 5

$a=A() : $b=B() : $b.g(int) : $b.f(int) : $a.m(int, $b) @ 3, 2, 5 Figura 3.14 – Representa¸cão de Tonella: inclusão de chamada a método

Como se pode observar, no exemplo da Figura 3.14, foi inclu´ıda uma chamada ao método “g(int)”, que acarretou a inclusão de um parâmetro de tipo primitivo com valor 3.

Remo¸cão de chamada a método: na estrutura do indiv´ıduo, após a aplica¸cão deste operador, um dos métodos intermediários é removido, junto com seus respectivos parâmetros.

$a=A() : $b=B() : $b.f(int) : $a.m(int, $b) @ 2, 5 $a=A() : $b=B() : $a.m(int, $b) @ 5

Figura 3.15 – Representa¸cão de Tonella: remo¸cão de chamada a método

O exemplo da Figura 3.15 mostra a aplica¸cão deste operador removendo a chamada do método intermediário “f(int)” da classe “B”.

Crossover: Depois de selecionar dois indiv´ıduos aleatoriamente, trocam-se partes dos cromossomos entre si, com o objetivo de gerar dois novos cromossomos na popula¸c˜ao.

$a=A() : $b=B() : $b.f(int) : $a.m(int, $b) @ 2, 5

$a=A() : $b=B() : $b.n(int) : $b.g(int,int) : $a.m(int, $b) @ 8, 4, 7, 6 $a=A() : $b=B() : $b.g(int,int) : $a.m(int, $b) @ 4, 7, 5

$a=A() : $b=B() : $b.n(int) : $b.f(int) : $a.m(int, $b) @ 8, 2, 6

Figura 3.16 – Representa¸c˜ao de Tonella: crossover

Nota-se na Figura 3.16 que no exemplo apresentado o método intermediário “f(int)” da classe “B” do primeiro cromossomo, é substitu´ıdo pelo método intermediário “g(int, int)” da classe “B” do segundo cromossomo, junto com seus respectivos parâmetros. Da mesma forma que o segundo indiv´ıduo troca o método “g(int, int)” da classe “B” pelo método intermediário “f(int)” da classe “B” do primeiro cromossomo, junto com seus respectivos parâmetros.

No documento Framework de geração de dados de teste para programas orientados a objetos (páginas 45-50)