Verifica¸cão de Modelos Simbólicos - Planejamento baseado em Verifica¸cão de Modelos

4.5 Planejamento baseado em Verifica¸c˜ao de Modelos

4.5.1 Verifica¸c˜ao de Modelos Simb´olicos

Modelos realistas necessitam de um enorme número de estados. Uma abordagem simbólica [JEK⁺90] para verifica¸cão de modelos utiliza fórmulas proposicionais para re-presentar, de modo compacto, modelos de estados finitos e transforma¸cões sobre fórmu-las. A explora¸cão do espa¸co de estados utiliza então estas formas compactas para ganhar eficiência.

Diferente dos algoritmos tradicionais, que verificam estados individualmente, os algo-ritmos de verifica¸cão de modelos simbólicos efetuam busca regressiva sobre conjuntos de estados e transi¸cões. É demonstrado que, em alguns casos, o uso destas representa¸cões compactas melhora exponencialmente

Um tratado sobre planejamento em dom´ınios não-determin´ısticos, utilizando verifi-ca¸cão de modelos simbólicos, pode ser encontrado em [Rov01].

30 CAP´ITULO 4. PLANEJAMENTO SOB INCERTEZA

Cap´ıtulo 5

Planejamento Hier´ arquico sob Incerteza

Em dom´ınios de planejamento determin´ısticos, muito trabalho tem sido feito com o objetivo de melhorar a eficiência de planejadores, procurando preven´ı-los de visitar estados não promissores. A maior parte desses trabalhos concentra-se em planejadores que utilizam busca progressiva no espa¸co de estados, tais como HSP [BG99], FF [HN01], TLPlan [BK00], TALplanner [DK99], e SHOP2 [NAI⁺03]. Estes planejadores conhecem sempre o estado atual do mundo, o que facilita o uso de algumas técnicas poderosas de poda do espa¸co de busca, especialmente em planejadores que permitem especificar formas de poda espec´ıficas de dom´ınio.

Em [KN04], é apresentado um meio de transportar estas melhorias de eficiência para planejamento não-determin´ıstico. Dentre as contribui¸cões de [KN04], pode-se citar uma técnica geral de “indeterminizar” planejadores progressivos, ou seja, estendê-los para que possam trabalhar em dom´ınios não-determin´ısticos. Esta forma de transforma¸cão preserva a corretude e a completude do algoritmo original. Em seguida, é descritoYoYo [KNPT05], que incorpora ao planejador hierárquico SHOP2 essa técnica, preparando-o para lidar com planejamento não-determin´ıstico. Além disso, YoYo utiliza técnicas de verifica¸cão de modelos simbólicos para conseguir um maior ganho de desempenho.

5.1 “Indeterminizando” Planejadores Progressivos

Em [KN04], é descrita uma técnica geral para produzir, a partir de planejadores progressivos para dom´ınios determin´ısticos, versões “indeterminizadas” destes, ou seja, transformá-los em planejadores que lidam com problemas não-determin´ısticos. A técnica apresentada produz novos planejadores que tentam devolver solu¸cões c´ıclicas fortes, se existirem, para problemas não-determin´ısticos.

A base para a t´ecnica ´e coposta de dois procedimentos abstratos de planejamento:

Planejamento Progressivo (Forward Chaining Planning) (FCP) (Algoritmo 7), para do-m´ınios determin´ısticos, e um procedimento correspondente, com alguas modifica¸c˜oes, Non-Deterministic Forward Chaining Planning(ND-FCP) (Algoritmo 8), para dom´ınios n˜ao-determin´ısticos.

O propósito da utiliza¸cão de procedimentos abstratos é permitir demonstrar a trans-31

32 CAP´ITULO 5. PLANEJAMENTO HIER ´ARQUICO SOB INCERTEZA Algoritmo 7: FCP (s₀, g,D, α)

Entrada: Estado inicials₀, Objetivo g, Dom´ınioD, Fun¸cão de sele¸cão de a¸cões α Sa´ıda: Planoπ

in´ıcio

π← ∅;s←s₀;

repita

ses satisfaz g ent˜ao devolva π;

A← {(s, a)|aé uma instância total de um operador em D,aé aplicável a

s, e a∈α(s)};

seA=∅ ent˜ao devolvafalha;

n˜ao-deterministicamente escolha (s, a)∈A;

π←π∪ {(s, a)};

s←γ(s, a);

fim

forma¸cão de forma mais clara: em suma, como planejadores progressivos podem ser preparados, de forma sistemática, para lidar com a¸cões não-determin´ısticas. Formal-mente, um planejador Λ é uma instância de FCP se existe uma substitui¸cão de certas partes do procedimento FCP de modo que este se comporte como Λ. Se um planejador Λ pode ser descrito como uma instância do procedimento FCP (um algoritmo progres-sivo determin´ıstico), a instância correspondente ND-Λ de ND-FCP (algoritmo progresprogres-sivo não-determin´ıstico) será a“indeterminiza¸cão”c´ıclica forte de Λ. ND-SHOP2 [KN04] é resultante da transforma¸cão de SHOP2 [NAI⁺03].

Em instâncias de FCP, a rela¸cão de satisfa¸cão de objetivos e a fun¸cão α variam, de acordo com o algoritmo de planejamento Λ usado como base. A rela¸cão s satisfaz g depende de Λ e pode ir além da simples verifica¸cão s ∈ S_g. A fun¸cão de sele¸cão de a¸cões α é utilizada para podar o espa¸co de busca: devolve um sub-conjunto das a¸cões a aplicáveis a s, que são denominadas a¸cões que satisfazem α(s). Alguns exemplos de instâncias de FCP podem ser:

• No caso mais simples, planejamento STRIPS,α(s) apenas devolve as a¸cõesa apli-cáveis a s e a rela¸cão de satisfa¸cão s ∈ S_g se mantém, onde g é substitu´ıdo por S_g.

• Já em SHOP2 [NAI⁺03], a busca é controlada pelo conjunto de métodos utilizados para decompor sub-tarefas, e α(s) nos procedimentos denota o conjunto de a¸cões que podem ser produzidas por estes métodos. Em casos com metas puramente de decomposi¸cão, qualquers, se alcan¸cado através das decomposi¸cões, satisfazg. Em outras palavras, se a rede de tarefaswalcan¸cada junto asé vazia, entãossatisfaz g.

• Outro planejador que pode ser utilizado ´e TLPlan [BK00], que tem a busca con-trolada por uma f´ormulaφespecificada em LTL [Pnu77]. Para cada estados,α(s)

é o conjunto de todas as a¸cões a aplicáveis a s, tal que o estado sucessor γ(s, a) satisfa¸ca a fórmula.

5.1. “INDETERMINIZANDO” PLANEJADORES PROGRESSIVOS 33 Um ponto importante a notar é que a fun¸cão α pode vir a carregar consigo um estado interno. No caso do planejamento hierárquico, a manuten¸cão da hierarquia de decomposi¸cão corrente é de responsabilidade de α, que pode mudar durante a escolha não-determin´ıstica. Por se tratar de procedimentos abstratos, FCP e ND-FCP mantêm este fato impl´ıcito.

FCP (Algoritmo 7) come¸ca com um estado inicial s₀ e efetua uma busca progressiva (Algoritmo 1), explorando outros estados, sucessivamente, através da escolha e aplica¸cão de a¸cões. A busca termina quando um estado que satisfaz a meta g é alcan¸cado. Ao invés de examinar todas as a¸cões aplicáveis a s, FCP considera somente o sub-conjunto destas que satisfaz α(s).

Como FCP, ND-FCP (Algoritmo 8) também planeja progressivamente a partir dos estados em S₀, mas o critério de sucesso é mais complexo. Em FCP, um plano π é uma solu¸cão se seu estado final satisfaz a condi¸cão metag. Para que uma pol´ıtica em ND-FCP seja uma solu¸cão, todo estado na estrutura de execu¸cão de π deve ter pelo menos um π-descendente que satisfaz a meta. Estados que já têm um caminho em Σ_π que leve a um estado meta são denotados estadosresolvidos. Do contrário, são chamados de estadosem aberto. A busca termina quando todos os estados alcan¸cáveis são resolvidos, se existir uma pol´ıtica solu¸cão. Caso contrário, devolvefalha.

Algoritmo 8: ND-FCP (S₀, g,D⁰, α⁰)

Entrada: Conjunto inicialS₀, Objetivo g, Dom´ınioD⁰, Fun¸cão de sele¸cão de a¸cões α⁰

Sa´ıda: Planoπ in´ıcio

π← ∅;S ←S₀;S_resolvidos ← ∅;

repita

seS =∅ ent˜ao devolvaπ;

selecione um estados∈S e remova-o de S;

ses satisfaz g ent˜aoinsira sem S_resolvidos;

sen˜ao ses /∈S_π ent˜ao

A← {(s, a)|aé uma instância total de um operador em D⁰,aé

aplic´avel a s, e a∈α⁰(s)};

seA=∅ ent˜ao devolva falha;

n˜ao-deterministicamente escolha (s, a)∈A;

π←π∪ {(s, a)};

S←S∪γ(s, a);

senão ses não tem π-descendentes em (S∪S_resolvidos)\S_π então

devolvafalha ; fim

fim

34 CAP´ITULO 5. PLANEJAMENTO HIER ´ARQUICO SOB INCERTEZA

No documento Planejamento Hierárquico com A¸cões Não-Determin´ısticas Ricardo Guimarães Herrmann (páginas 43-48)