• Nenhum resultado encontrado

Aprendizado de um Grafo Menos Denso para um Grafo Mais Denso

6.4 Experimentos e Resultados

6.4.1 Aprendizado de um Grafo Menos Denso para um Grafo Mais Denso

Considere a matriz de adjacência 𝑀𝑥𝐵, com graus médio e total, respectivamente,

𝑑𝑚 = 1.25 e 𝑑𝑡 = 10, representando o grafo 𝐺0 = 𝐵, com 8 nós. Seja também a matriz

de adjacência 𝑀𝑦𝐴 do grafo final 𝐺𝑓 = 𝐴, com 𝑑𝑚 = 6.25 e 𝑑𝑡= 50, conforme observado na Figura 23. Aplicando a equação6.6, foram necessárias 6 iterações para que o grafo 𝐵 igualasse o grau médio 𝑑𝑚 do grafo 𝐴, onde cada iteração corresponde a uma geração de grafo 𝑀𝑦* = [𝑝, 𝑞].𝑀𝑥𝐵 e a consequente correção de 𝑤 quando 𝑀𝑦𝐴 ̸= 𝑀𝑦*. Os valores dos

parâmetros ao final desta etapa foram 𝑝 = 0.796 e 𝑞 = 0.204.

Figura 23 – Matrizes de adjacência 𝑀𝑥𝐵 e 𝑀𝑦𝐴 correspondentes aos grafos 𝐵 e 𝐴.

Utilizando os parâmetros 𝑝 = 0.796 e 𝑞 = 0.204 encontrados após esse primeiro acerto, ou seja, após a primeira equivalência de grau entre 𝑀𝑦𝐴 e 𝑀𝑦*, foram gerados

a partir da aplicação do modelo Markoviano em 𝑀𝑥𝐵, ou seja, [0.796, 0.204].𝑀𝑥𝐵, uma sequência de 𝛼 = 233 grafos, a fim de se obter 𝛽 = 50 equivalências exatas de grau entre [0.796, 0.204].𝑀𝑥𝐵 e 𝑀𝑦𝐴, sem qualquer correção adicional do vetor 𝑤 no processo. Assim, em média 𝜗 = 4.66 grafos devem ser gerados para que se obtenha o grau médio de 𝐵, segundo os valores anteriormente calculados para 𝑝 e 𝑞. Como pode ser observado,

𝜗 = 4.66 é um valor elevado, lembrando que quanto menor o valor de 𝜗, melhor. Deste

modo, essa abordagem de utilizar os parâmetros 𝑝 e 𝑞 logo no primeiro acerto não é a estratégia mais adequada. Nesta tese, valores considerados ótimos encontram-se entre 1 ≤ 𝜗 ≤ 2 e valores aceitáveis entre 2 < 𝜗 ≤ 4.

Deste modo, uma nova abordagem foi então considerada. Testou-se também a correção contínua do vetor 𝑤, ou seja, mesmo após o primeiro acerto, a correção continuou ocorrendo cada vez que uma diferença entre 𝑀𝑦𝐴 e 𝑀𝑦* acontecia durante a geração de

grafos. Repetiu-se a geração e a correção até a obtenção de 𝛽 = 50 grafos. A média de iterações foi de 𝜗 = 8.02, para um 𝛼 = 401. Considerando todos os valores de parâmetros encontrados durante o processo, o menor e o maior valor obtido para 𝑝 foi representado

Capítulo 6. Estratégia On-line para Predição de Dados Estruturados em Grafos de Markov 91

pelo intervalo 𝐼𝑝𝑡 = [0.760, 0.808], e para q, pelo intervalo: 𝐼𝑞𝑡 = [0.192, 0.240]. A média final de todos os parâmetros obtidos foram 𝑝𝑚𝑡= 0.783220 e 𝑞𝑚𝑡= 0.216781. Analisando somente os parâmetros nos 50 casos considerados como acertos, tem-se como intervalos

𝐼𝑝𝑎 = [0.764, 0.802] e 𝐼𝑞𝑎 = [0.192, 0.236]. Os valores médios para os 50 acertos de 𝛽, foram 𝑝𝑚𝑎= 0.781200 e 𝑞𝑚𝑎= 0.218800.

Note que a diferença entre a média dos parâmetros quando houve acerto e a média geral foi somente de: 𝑑𝑝 = |0.783220 − 0.781200| = 0.00202 e 𝑑𝑞 = |0.216781 − 0.218800| = 0.002019. Esta diferença mínima será obtida em todos os cenários posteriores tornando válidas as duas formas de avaliação dos parâmetros.

Utilizando as médias finais 𝑝𝑚𝑎 e 𝑞𝑚𝑎 como valores fixos para 𝑝 e 𝑞 no modelo

Markoviano, necessitou-se de um 𝛼 = 93 grafos para se obter 50 acertos 𝑀𝑦* = 𝑀𝑦𝐴, ou

seja, para 𝛽 = 50. Nota-se que neste caso não se está corrigindo o vetor 𝑤, mas somente estão sendo gerados novos grafos a partir de 𝑝𝑚𝑎 e 𝑞𝑚𝑎, ou seja, 𝑀𝑦* = [𝑝𝑚𝑎, 𝑞𝑚𝑎].𝑀𝑥𝐵,

para 𝑝𝑚𝑎 e 𝑞𝑚𝑎fixos. Uma média 𝜗 de 1.86 iterações foram necessárias para cada corres- pondência exata de grau médio.

Ou seja, existem duas etapas principais no processo. A primeira refere-se à obten- ção de um vetor 𝑤 estável, através de sua contínua correção, até se atingir 50 acertos, para então ser calculada a média do vetor 𝑤. A segunda refere-se ao processo de geração de novos 50 grafos, utilizando-se o vetor 𝑤 = [𝑝𝑚𝑎, 𝑞𝑚𝑎] fixo, calculado anteriormente, de modo a verificar sua qualidade.

Outra importante medida é o grau do erro absoluto 𝜀 para cada grafo gerado. Este erro é definido como o módulo da diferença entre o grau total obtido em algum grafo gerado 𝐺𝑡 e o grau do grafo desejado 𝐺𝑓. No exemplo de aprendizado apresentado anteriormente obteve-se 𝜀 < 3 em 95% dos grafos.

A seguir são apresentados resultados com o objetivo de verificar a variação dos valores dos parâmetros 𝑝 e 𝑞 e sua eficácia no processo de geração. Neste sentido, observou- se que os valores médios 𝑝𝑚𝑎 e 𝑞𝑚𝑎 tendem a convergir para os mesmos resultados, independentemente dos valores iniciais.

Considere novamente os mesmos grafos 𝐵 e 𝐴 e o mesmo processo experimental descrito acima executado desde o início. Neste segundo treinamento, os valores de 𝑝 e 𝑞 obtidos foram, respectivamente, 0.659375 e 0.340625 para a primeira convergência. Consi- derando 𝛽 = 50, necessitou-se de um 𝛼 = 1204 para estes valores de 𝑝 e 𝑞, com 𝜗 = 20.48. Em 95% dos casos tem-se 𝜀 < 11 e somente em 45% dos grafos tem-se 𝜀 < 3. Observe que estes valores estão aquém da eficiência desejada.

Verificando-se agora novamente a contínua correção de 𝑤 durante a geração dos grafos, foram necessárias 370 iterações, ou seja, 𝛼 = 370, resultando em um 𝜗 = 3.40. Ao final desse novo processo se obteve 𝐼𝑝𝑡= [0.659375, 0.83125] e 𝐼𝑞 = [0.16875, 0.340625]. A

Capítulo 6. Estratégia On-line para Predição de Dados Estruturados em Grafos de Markov 92

média final de todos os parâmetros obtidos foram 𝑝𝑚𝑡 = 0.809228 e 𝑞𝑚𝑡 = 0.190072. Se forem analisados somente os parâmetros das vezes que ocorreram acertos, 𝐼𝑝𝑎 = [0.659375, 0.83000] e 𝐼𝑞𝑎 = [0.192, 0.340625]. As novas médias obtidas entre os 50 acertos foram 𝑝𝑚𝑎= 0.797750 e 𝑞𝑚𝑎= 0.202250.

Para testar a eficiência de 𝑝 e 𝑞 para essa nova simulação, uma nova sequência

𝛽 = 50 grafos foi gerada, utilizando as médias finais 𝑝𝑚𝑎 e 𝑞𝑚𝑎 como parâmetros de entrada. O total de grafos necessários reduziu-se para 𝛼 = 289, gerando um 𝜗 = 5.78, uma diminuição considerável se comparado com o 𝜗 anterior de 20.48. Analisando o erro têm-se: 𝜀 < 6 em 95% das vezes e 𝜀 < 3 em 80% das vezes.

Considerando as duas simulações apresentadas, notou-se que os valores médios

𝑝𝑚𝑎 e 𝑞𝑚𝑎 convergem para resultados próximos. Esta convergência se torna mais precisa quando se aumenta o número de correções, atribuindo-se um valor superior para 𝛽. Como exemplo, para 𝛽 = 100 a diferença de valores de 𝑝𝑚𝑎 e 𝑞𝑚𝑎 se reduziu para menos de 0.009. E no final, ambos obtiveram 𝜀 < 3 em 95% dos casos.

Estes resultados validam a utilização dos valores médios das variáveis para a pa- rametrização do modelo markoviano. A explicação para este fato se dá através da Lei dos Grandes Números, onde se a probabilidade de um certo evento é 𝜌 e se 𝑛 tentativas independentes são feitas com 𝑘 sucessos, então 𝑘/𝑛 → 𝜌 se 𝑛 → ∞. Assim, se o custo computacional não for uma restrição, pode-se optar pela obtenção dos valores médios de

𝑝 e 𝑞 para valores superiores de 𝛽 acertos, e posterior utilização desses valores para a

geração de sequências de grafos que obedeçam a dinâmica do modelo de Markov, descrito na seção 6.2.