A Tabela de Transposi¸ c˜ ao - de Aprendizagem de Damas

de Aprendizagem de Damas

4.3.2 A Tabela de Transposi¸ c˜ ao

O algoritmo alfa-beta, apresentado na se¸cão 4.3.1, não mantém um histórico dos estados da árvore de jogo procurados anteriormente. Assim, se um estado S0 do tabuleiro

for apresentado 2 vezes para o algoritmo alfa-beta, a mesma rotina será executada 2 vezes a fim de encontrar a predi¸cão associada ao estado S0. Para evitar redundância de

trabalho, ou seja, evitar que o algoritmo alfa-beta seja executado duas vezes para encontrar a predi¸cão do mesmo estado S0, pode-se associá-lo com uma tabela de transposi¸cão.

Uma tabela de tranposi¸cão (MILLINGTON, 2006) é um repositório de predi¸cões passadas associadas aos estados do tabuleiro do jogo que já foram submetidos ao procedimento de busca. Os detalhes da tabela de transposi¸cão utilizada pelo VisionDraughts serão descritos a seguir.

4.3.2.1 Transposi¸c˜ao - Mais de uma Ocorrˆencia do Mesmo Estado do Tabu- leiro do Jogo

No jogo de damas, dentro de uma mesma partida, pode-se chegar a um mesmo estado do tabuleiro várias vezes e, quando isso ocorre, diz-se que houve uma transposi¸cão (MILLINGTON, 2006). As transposi¸cões ocorrem, em damas, de duas maneiras básicas:

1. Diferentes combina¸cões de jogadas com pe¸cas simples: as pe¸cas simples não se movem para trás. Apesar disso, elas podem desencadear uma transposi¸cão, conforme mostrado na figura 24. Nesse caso, os estados do tabuleiro mostrados em a e d são idênticos, assim como os estados mostrados em c e f. Assumindo a como estado inicial, é poss´ıvel alcan¸car c passando por b. Assumindo d como estado inicial, é poss´ıvel alcan¸car f passando por e. Então, os únicos estados diferentes são b e e. No caso da seqüência de movimentos a, b e c, o jogador preto move-se primeiro para a direita e, em seguida, para a esquerda, enquanto na seqüência de movimentos d, e e f, o jogador preto move-se primeiro para a esquerda e, em seguida, para a direita.

2. Diferentes combina¸cões de jogadas com reis: os reis se movem em qualquer dire¸cão, gerando transposi¸cões facilmente, conforme mostrado na figura 25. Partindo do estado a, avan¸cando o rei, é poss´ıvel alcan¸car o estado b e, em seguida, recuando o rei, é poss´ıvel alcan¸car o estado c, idêntico ao a.

As próximas subse¸cões abordarão, em detalhe, como o VisionDraughts utiliza esse repositório de estados, chamado tabela de transposi¸cão. Como a compreensão da técnica

4.3 O Eficiente Mecanismo de Busca do VisionDraughts 83

Figura 24: Exemplo de transposi¸cão em c e f : o mesmo estado do tabuleiro é alcan¸cado por combina¸cões diferentes de jogadas com pe¸cas simples.

Figura 25: Exemplo de transposi¸cão em a e c: o mesmo estado do tabuleiro é alcan¸cado por combina¸cões diferentes de jogadas com reis.

de Zobrist é fundamental para a constru¸cão da tabela de transposi¸cão, inicialmente é apresentada a técnica de Zobrist. Na seqüência, são apresentados a estrutura da tabela de transposi¸cão e como tratar poss´ıveis colisões de estados do tabuleiro dentro da tabela. Assim, as se¸cões se sucedem de acordo com o disposto a seguir: i) Técnica de Zobrist - Cria¸cão de Chaves Hash para Indexa¸cão dos Estados do Tabuleiro do Jogo; ii) Estrutura ENTRY - Dados Armazenados para um Determinado Estado do Tabuleiro do Jogo; e, iii) Colisões - Conflitos de Endere¸cos para Estados do Tabuleiro do Jogo.

4.3.2.2 Técnica de Zobrist - Cria¸cão de Chaves Hash para Indexa¸cão dos Estados do Tabuleiro do Jogo

A tabela de tranposi¸cão utilizada pelo VisionDraughts, ou seja, o repositório de predi¸cões anteriormente calculadas e associadas aos estados do tabuleiro do jogo que

4.3 O Eficiente Mecanismo de Busca do VisionDraughts 84

já foram submetidos ao procedimento de busca, foi implementada como uma tabela hash. Uma tabela hash é uma estrutura de dados que associa chaves a valores (RUSSELL; NOR- VIG, 2004). Cada chave representa um estado do tabuleiro do jogo de damas e é associada

a informa¸cões relevantes obtidas, a partir do algoritmo alfa-beta, para àquele estado. A representa¸cão de um determinado estado do tabuleiro do jogo, na forma de uma chave hash, é feita utilizando a técnica descrita por Zobrist (ZOBRIST, 1969) e apresentada nesta

se¸c˜ao.

Quando um programa de computador armazena um item I1 em uma tabela muito

grande T1, h´a duas formas de se tentar localizar este item na tabela: uma, executando-se

um procedimento de busca em T1 (o que pode ser muito ineficiente devido ao tamanho da

tabela); outra, dispondo-se de um m´etodo de c´alculo do endere¸co de I1, na tabela T1, a

partir do próprio item I1. Uma fun¸cão que converte itens em endere¸cos é chamada fun¸cão

hash e a tabela resultante ´e chamada tabela hash.

O método descrito por Zobrist utiliza o operador XOR (ou exclusivo), simbolizado matematicamente por ⊕. Logicamente, o XOR é um tipo de disjun¸cão lógica entre dois operandos que resulta em “verdadeiro” se, e somente se, exatamente um dos operandos tiver o valor “verdadeiro”. Computacionalmente, o operador XOR pode ser aplicado sobre dois operandos numéricos. Por exemplo:

1. Operandos numéricos na base binária: o XOR aplicado sobre dois bits quaisquer resulta em “1” se, e somente se, exatamente um dos operandos tiver o valor “1”. Assim, considere Seq1 = b1, b2, ..., bn uma seqüência binária de n bits. Além disso,

considere Seq2 = r1, r2, ..., rn outra seqüência binária, também, de n bits. Para

calcular Seq3 = Seq1⊕Seq2, basta aplicar o operador XOR sobre os bits das posi¸c˜oes

correspondentes de Seq1 e Seq2, isto ´e, basta fazer Seq3 = b1⊕ r1, b2⊕ r2, ..., bn⊕ rn.

2. Operandos numéricos na base decimal: a opera¸cão XOR sobre dois inteiros decimais segue o mesmo procedimento mostrado para operandos numéricos na base binária, exceto que, os dois argumentos inteiros decimais devem ser, antes de tudo, convertidos para a base binária. A conversão de inteiros decimais para binários é transparente em C++. Isso significa que dois operandos inteiros decimais podem ser passados como argumentos para o operador XOR (a conversão é feita implicita- mente).

Assuma as seguintes propriedades, descritas em (ZOBRIST, 1969), para o operador XOR aplicado sobre seqüências aleatórias (r ) de inteiros decimais de n bits:

4.3 O Eficiente Mecanismo de Busca do VisionDraughts 85

1. ri ⊕ (rj ⊕ rk) = (ri ⊕ rj) ⊕ rk;

2. ri ⊕ rj = rj ⊕ ri;

3. ri ⊕ ri = 0;

4. se si = r1 ⊕ r2 ⊕ ... ⊕ ri então si é uma seqüência aleatória de n bits;

5. si é uniformemente distribu´ıda (uma variável é dita uniformemente distribu´ıda

quando assume qualquer um dos seus valores poss´ıveis com a mesma probabilidade);

Suponha que exista um conjunto finito S qualquer e que se deseje criar chaves hash para os subconjuntos de S. Um m´etodo simples seria associar inteiros aleat´orios de n bits aos elementos de S e, a partir da´ı, definir a chave hash de um subconjunto S0 de S como

sendo o resultado da opera¸c˜ao ⊕ sobre os inteiros associados aos elementos de S0. Pelas

propriedades 1 e 2, a chave hash é única e, pelas propriedades 4 e 5, a chave hash é aleatória e uniformemente distribu´ıda. Se qualquer elemento for adicionado ou retirado do subconjunto S0, a chave hash muda pelo inteiro que corresponde àquele elemento.

No caso do VisionDraughts, existem 2 tipos distintos de pe¸cas (pe¸ca simples e rei), 2 cores distintas de pe¸cas (pe¸ca preta e branca) e 32 casas no tabuleiro do jogo. Então, existem, no máximo, 128 possibilidades distintas (2 × 2 × 32) de colocar alguma pe¸ca em alguma casa do tabuleiro. Assim, foi criado um vetor de 128 elementos inteiros aleatórios para representar os estados poss´ıveis do tabuleiro (cada elemento representa uma possi- bilidade de se ocupar uma das 32 casas do tabuleiro com alguma das 4 pe¸cas inerentes ao jogo). A chave hash para representar cada estado do tabuleiro é o resultado da opera¸cão XOR realizada entre todos os elementos do vetor associados às casas não vazias do tabuleiro. Veja o seguinte exemplo:

1. Considere um vetor V de 128 elementos inteiros aleatórios de 64 bits como sendo o mostrado na figura 26. O vetor V foi utilizado pelo sistema VisionDraughts para implementa¸cão da tabela de transposi¸cão. A maioria dos geradores de números aleatórios, principalmente geradores baseados em softwares, não gera seqüências verdadeiramente aleatórias e sim seqüências que possuem algumas das propriedades dos números aleatórios (uma cuidadosa análise matemática é necessária para assegurar que a gera¸cão de números seja suficientemente aleatória). Números verdadeiramente aleatórios são imposs´ıveis de serem gerados com máquinas de estado finito (computadores atuais). Neste caso, cientistas são obrigados a usar geradores

4.3 O Eficiente Mecanismo de Busca do VisionDraughts 86

baseados em caras e especializadas arquiteturas de hardware ou, mais freqüente- mente, contentarem-se com solu¸cões sub-ótimas (como números pseudo-aleatórios gerados por software). Assim, para garantir a qualidade dos números aleatórios utilizados pelo VisionDraughts, os inteiros aleatórios do vetor V foram gerados a partir do s´ıtio (STEVANOVIC, 2008), utilizando a técnica descrita em (STIPCEVIC; ROGINA, 2007), que garante a aleatoriedade da seqüência gerada baseando-se na

aleatoriedade intr´ınseca de processos f´ısicos em que f´otons s˜ao detectados ao acaso.

No documento VisionDraughts – Um Sistema de Aprendizagem de Jogos de Damas Baseado em Redes Neurais, Diferen¸ cas Temporais, Algoritmos Eficientes de Busca em ´ Arvores e Informa¸ c˜ oes Perfeitas Contidas em Bases de Dados (páginas 84-88)