• Nenhum resultado encontrado

EVOLUÇÃO E BUSCA

4.4 PESQUISANDO COM OBSERVAÇÕES PARCIAIS

4.4.1 Pesquisar sem observação

Quando as percepções do agente não fornecem nenhuma informação, temos o que chamamos problema sem sensoriamento ou, algumas vezes, problema conformante. Num primeiro momento, pode-se pensar que o agente sem sensoriamento não tem esperança de resolver um problema se não tiver ideia do estado em que ele está; de fato, problemas sem sensoriamento são muitas vezes solúveis. Além disso, os agentes sem sensoriamento podem ser surpreendentemente úteis, principalmente porque eles não dependem de sensores funcionando corretamente. Em sistemas de manufatura, por exemplo, foram desenvolvidos muitos métodos engenhosos para orientar corretamente as peças a partir de uma posição inicial desconhecida usando uma sequência de ações completamente sem atividade sensorial. O alto custo da atividade sensorial é outra razão para evitá- la: por exemplo, os médicos geralmente prescrevem um antibiótico de amplo espectro em vez de usar o plano de contingência de fazer um exame de sangue caro, ficar à espera dos resultados e então prescrever um antibiótico mais específico e talvez também a hospitalização devido à progressão da infecção.

Podemos também fazer uma versão sem sensoriamento do mundo do aspirador de pó. Suponha que o agente conheça a geografia do seu mundo, mas não conheça a localização ou a distribuição da sujeira. Nesse caso, seu estado inicial poderia ser qualquer elemento do conjunto {1, 2, 3, 4, 5, 6, 7, 8}. Agora, considere o que acontece se tentar a ação Direita. Isso fará com que ele fique em um dos estados {2, 4, 6, 8} — o agente agora tem mais informações! Além disso, a sequência de ação [Direita, Aspira] sempre vai acabar em um dos estados {4, 8}. Finalmente, a sequência [Direita,

Aspira, Esquerda, Aspira] é a garantia de que atingirá o estado objetivo 7, não importa qual seja o

estado de início. Dizemos que o agente pode coagir o mundo para estado 7.

Para resolver problemas sem sensoriamento, buscamos no espaço do estado de crença em vez de no estado físico.10 Observe que, no espaço do estado de crença, o problema é totalmente observável

porque o agente sempre conhece o seu próprio estado de crença. Além disso, a solução (se houver) é sempre uma sequência de ações. Isso porque, como nos problemas comuns do Capítulo 3, as percepções recebidas após cada ação são completamente previsíveis — são sempre vazias! Portanto, não há contingências para planejar. Isso é verdadeiro mesmo se o ambiente for não determinístico.

É instrutivo ver como é construído o problema de busca de estado de crença. Suponha que o problema físico subjacente P seja definido por AÇÕESP, RESULTADOP, TESTAR-OBJETIVOP e Custo do passoP. Então, podemos definir o problema sem sensoriamento correspondente da seguinte forma:

• Estados de crença: O espaço de estado de crença inteiro contém cada conjunto possível de estados físicos. Se P tiver N estados, então o problema sem sensoriamento terá até 2n estados,

embora muitos possam estar inacessíveis a partir do estado inicial.

• Estado inicial: Normalmente, o conjunto de todos os estados em P, embora em alguns casos o agente tenha mais conhecimento do que isso.

• Ações: Isso é um pouco complicado. Suponha que o agente esteja no estado de crença b = {s1,

s2}, mas as AÇÕESP (s1) ≠ AÇÕESP (s2); então, o agente não tem certeza de quais ações são aplicáveis. Se assumirmos que as ações não aplicáveis não têm nenhum efeito sobre o meio ambiente, então é seguro considerar a união de todas as ações em qualquer dos estados físicos no estado de crença atual b:

Por outro lado, se uma ação não aplicável pode ser o fim do mundo, é mais seguro permitir apenas a interseção, isto é, o conjunto de ações aplicáveis em todos os estados. Para o mundo do aspirador de pó, cada estado tem as mesmas ações aplicáveis; assim, ambos os métodos dão o mesmo resultado.

• Modelo de transição: O agente não sabe qual estado no estado de crença é o correto, por isso, ele só sabe que pode chegar a qualquer um dos estados resultantes da aplicação da ação para um dos estados físicos no estado de crença. Para ações determinísticas, o conjunto de estados que pode ser alcançado é

Com ações determinísticas, b′ nunca será maior do que b. Com não determinísticas, temos

que pode ser maior do que b, como mostrado na Figura 4.13. O processo de geração de um novo estado de crença após a ação é chamado de etapa de predição; a notação b′ = PREDIÇÃOP(b, a) é mais apropriada.

• Testar objetivo: O agente quer um plano que é certo que funcione, o que significa que um estado de crença satisfaz o objetivo somente se todos os estados físicos nele satisfizerem TESTE- OBJETIVOP. O agente poderá atingir acidentalmente o objetivo antes, mas não saberá que fez isso.

• Custo do passo: Esse é também complicado. Se a mesma ação pode ter custos diferentes em diferentes estados, então o custo de tomar uma ação em um dado estado de crença pode ser um de vários valores (isso dá origem a uma nova classe de problemas, que vamos explorar no Exercício 4.9). Por ora assumimos que o custo de uma ação é o mesmo em todos os estados e por isso pode ser transferido diretamente do problema físico subjacente.

Figura 4.13 (a) Previsão do próximo estado de crença para o mundo do aspirador de pó sem

sensoriamento com uma ação determinística, Direita. (b) Previsão para o mesmo estado de crença e ação na versão incerta do mundo do aspirador de pó sem sensoriamento.

A Figura 4.14 mostra o espaço de estado de crença acessível para o mundo do aspirador de pó determinístico, sem sensoriamento. Existem apenas 12 estados de crença acessíveis de 28 = 256

estados de crença possíveis.

Figura 4.14 A porção acessível do espaço de estado de crença para o mundo determinístico do

aspirador de pó, sem sensoriamento. Cada caixa sombreada corresponde a um estado de crença individual. Em um passo qualquer, o agente está em um estado de crença particular, mas não sabe em que estado físico está. O estado de crença inicial (completa ignorância) é a caixa central superior. As ações são representadas pelas ligações rotuladas. Para maior clareza, os laços para um mesmo estado de crença são omitidos.

As definições anteriores permitem a construção automática da formulação do problema de estado de crença a partir da definição do problema físico subjacente. Uma vez feito isso, podemos aplicar qualquer um dos algoritmos de busca do Capítulo 3. Na verdade, podemos fazer um pouco mais do que isso. Na busca em grafos “comum”, os estados recentemente gerados são testados para verificar se são idênticos aos estados existentes. Isso funciona também para os estados de crença; por exemplo, na Figura 4.14, a sequência de ação [Aspirar, Esquerda, Aspirar] inicia quando o estado inicial atinge o mesmo estado de crença [Direita, Esquerda, Aspirar], ou seja, {5, 7}. Agora, considere o estado de crença alcançado por [Esquerda], ou seja, {1, 3, 5, 7}. Obviamente, não é idêntico a {5, 7}, mas é um superconjunto. É fácil provar (Exercício 4.8) que, se uma sequência de ação é uma solução para um estado de crença b, é também uma solução para qualquer subconjunto de

b. Assim, podemos descartar alcançar um caminho {1, 3, 5, 7} se {5, 7} já foi gerado. Por outro

lado, se {1, 3, 5, 7} já foi gerado e verificado que é solucionável, é garantido que qualquer

subconjunto, como {5, 7}, é solucionável. Esse nível extra de poda pode melhorar drasticamente a

eficiência da resolução do problema sem sensoriamento.

No entanto, mesmo com essa melhora, a resolução do problema sem sensoriamento como descrito, raramente é viável na prática. A dificuldade não é tanto a vastidão do espaço do estado de crença — mesmo sendo exponencialmente maior do que o espaço de estado físico subjacente; na maioria dos casos, o fator de ramificação e a extensão da solução no espaço do estado de crença e no espaço do estado físico não são tão diferentes. A verdadeira dificuldade reside no tamanho de cada estado de crença. Por exemplo, o estado de crença inicial para o mundo do aspirador de pó 10 × 10 contém 100 × 2100 ou cerca de 1032 estados físicos — é demasiado se utilizarmos a representação atômica,

que é uma lista explícita de estados.

Uma solução é utilizar alguma descrição mais compacta para representar o estado de crença. Em português, poderíamos dizer que o agente não sabe “nada” no estado inicial; após mover-se para a

Esquerda, poderíamos dizer “Não está na coluna mais à direita”, e assim por diante. O Capítulo 7

explica como fazer isso em um esquema de representação formal. Outra abordagem é evitar os algoritmos de busca-padrão, que tratam o estado de crença como caixas-pretas, tal como qualquer outro problema de estado. Em vez disso, podemos olhar no interior dos estados de crença e desenvolver algoritmos de busca de estado de crença incremental que constroem a solução de um estado físico de cada vez. Por exemplo, no mundo do aspirador de pó sem sensoriamento, o estado de crença inicial é {1, 2, 3, 4, 5, 6, 7, 8} e temos que encontrar uma sequência de ação que funcione em todos os oito estados. Podemos fazer isso encontrando primeiro uma solução que funcione para o estado 1; então verificamos se funciona para o estado 2; senão, voltamos e encontramos uma solução diferente para o estado 1, e assim por diante. Como uma busca E-OU tem que encontrar uma solução para todos os ramos de um nó E, esse algoritmo tem que encontrar uma solução para cada estado no estado de crença; a diferença é que a busca E-OU pode encontrar uma solução diferente para cada ramo, enquanto uma busca de estado de crença incremental tem que encontrar uma solução que funcione para todos os estados.

A principal vantagem da abordagem incremental é que normalmente é capaz de detectar a falha rapidamente — quando um estado de crença é insolúvel, geralmente é o caso dos primeiros estados examinados que consistem de um pequeno subconjunto do estado de crença, também é insolúvel. Em alguns casos, isso leva a um aumento de velocidade proporcional ao tamanho dos estados de crença,

que poderá ser tão grande quanto o espaço de estado físico em si.

Mesmo o algoritmo de solução mais eficiente não é de muita utilidade quando não existem soluções. Muitas coisas simplesmente não podem ser feitas sem atividade sensorial. Por exemplo, o quebra-cabeça de oito peças sem sensoriamento é impossível. Por outro lado, um pouco de atividade sensorial pode contribuir bastante. Por exemplo, cada instância do quebra-cabeça de oito peças pode ser resolvido se apenas uma área for perceptível — a solução envolve mover cada peça, por vez, para um local perceptível e, então, se manter atualizado da sua localização de acordo com as ações tomadas.