• Nenhum resultado encontrado

9/5/2007 herrmann@ime.usp.br RicardoGuimar˜aesHerrmann PlanejamentoHier´arquicosobIncerteza

N/A
N/A
Protected

Academic year: 2022

Share "9/5/2007 herrmann@ime.usp.br RicardoGuimar˜aesHerrmann PlanejamentoHier´arquicosobIncerteza"

Copied!
56
0
0

Texto

(1)

Planejamento Hier´arquico sob Incerteza

Ricardo Guimar˜ aes Herrmann herrmann@ime.usp.br

Orientadora: Profa. Dra. Leliane Nunes de Barros Instituto de Matem´ atica e Estat´ıstica

Universidade de S˜ ao Paulo

9/5/2007

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(2)

Motiva¸c˜ao

Diferentes formas de Planejamento:

Planejamento Hier´ arquico (HTN) permite planejamento para aplica¸c˜oes pr´ aticas envolvendo milhares de a¸c˜ oes

Planejamento N˜ ao-Determin´ıstico permite lidar com incerteza sobre efeitos de a¸c˜ oes

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(3)

Motiva¸c˜ao

Diferentes formas de Planejamento:

Planejamento Hier´ arquico (HTN) permite planejamento para aplica¸c˜oes pr´ aticas envolvendo milhares de a¸c˜ oes

Planejamento N˜ ao-Determin´ıstico permite lidar com incerteza sobre efeitos de a¸c˜ oes

Sinergia entre as t´ecnicas:

O uso de HTNs como controle de busca permite maior eficiˆencia ao Planejamento N˜ ao-Determin´ıstico

Planejamento N˜ ao-Determin´ıstico d´ a maior robustez a planos de a¸c˜ oes

N˜ ao existe uma implementa¸c˜ ao publicamente dispon´ıvel de um planejador que integre as duas t´ecnicas

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(4)

Dom´ınio Protot´ıpico: Presas e Predador

Descri¸c˜ ao do dom´ınio: Presas e Predador

Presas e predador movem-se em uma grade n × n Movimentos utilizando as a¸c˜ oes norte, sul, leste e oeste Predador possui a a¸c˜ ao adicional agarrar, aplic´ avel quando alcan¸ca uma presa

Presas possuem a a¸c˜ ao adicional descansar

N˜ ao-determinismo do dom´ınio reside nas a¸c˜ oes das presas Possui um grande fator de ramifica¸c˜ ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(5)

Problema Protot´ıpico: Presas e Predador

grade 5 × 5 2 presas

3 a¸c˜ oes poss´ıveis

5 × 5 × 3 = 75 poss´ıveis estados sucessores

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(6)

1 Introdu¸c˜ ao

Planejamento Cl´ assico e Hier´ arquico Planejamento N˜ ao-Determin´ıstico

2 Planejamento N˜ ao-Determin´ıstico Hier´ arquico T´ecnica de “N˜ ao-determiniza¸c˜ ao”

Planejador ND-SHOP2 Implementa¸c˜ ao

Testes Comparativos

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(7)

1 Introdu¸c˜ ao

Planejamento Cl´ assico e Hier´ arquico Planejamento N˜ ao-Determin´ıstico

2 Planejamento N˜ ao-Determin´ıstico Hier´ arquico T´ecnica de “N˜ ao-determiniza¸c˜ ao”

Planejador ND-SHOP2 Implementa¸c˜ ao

Testes Comparativos

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(8)

Planejamento Cl´assico (N˜ao-Hier´arquico)

Planejamento em IA consiste na busca automatizada de planos de a¸c˜oes que visam alcan¸car metas pr´e-estabelecidas em mundos descritos formalmente

Utiliza como formalismo um Sistema de Transi¸c˜ ao de Estados

Defini¸c˜ ao

Um Sistema de Transi¸c˜ ao de Estados ´e a 3-tupla Σ = hS, A, γi:

S ´e um conjunto finito de estados A ´e um conjunto finito de a¸c˜oes

γ : S × A 7→2

S

´e uma fun¸c˜ao de transi¸c˜ ao de estados

Um problema de Planejamento Cl´ assico consiste em encontrar uma sequˆencia de a¸c˜oes que, se executadas a partir de um determinado estado inicial s

0

∈ S, leve a um estado meta de S

g

⊆ S

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(9)

Suposi¸c˜oes do Planejamento Cl´assico

Suposi¸c˜oes restritivas feitas pelo Planejamento Cl´ assico Conjunto finito de estados

Ambiente completamente observ´ avel A¸c˜oes determin´ısticas

Ambiente est´atico (sem eventos externos) Metas de alcan¸cabilidade

Planos seq¨ uenciais Tempo impl´ıcito Planejamento offline

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(10)

Suposi¸c˜oes do Planejamento Cl´assico

Suposi¸c˜oes restritivas feitas pelo Planejamento Cl´ assico Conjunto finito de estados

Ambiente completamente observ´ avel A¸c˜oes determin´ısticas

Ambiente est´atico (sem eventos externos) Metas de alcan¸cabilidade

Planos seq¨ uenciais Tempo impl´ıcito Planejamento offline

Desafios:

Problemas de pequeno porte j´ a envolvem quantidades enormes de estados

NP-completo, mesmo sob essas restri¸c˜oes

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(11)

Busca Progressiva no Espa¸co de Estados

FCP (s 0 , g , Σ) π ← ∅; s ← s 0

loop

se s satisfaz g ent˜ ao devolva(π)

A ← {(s , a) | a ´e uma a¸c˜ ao de Σ aplic´ avel a s } se A = ∅ ent˜ ao devolva(falha)

n˜ ao-deterministicamente escolha (s, a) ∈ A π ← π ∪ {(s , a)}

s ← γ (s , a)

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(12)

Planejamento Hier´arquico

Planejamento guiado por Redes Hier´ arquicas de Tarefas (HTNs) Projetista do dom´ınio fornece diferentes m´etodos para decompor a¸c˜oes compostas (ou tarefas)

A¸c˜oes (ou tarefas) compostas, abstratas, representam sub-metas de alto n´ıvel

A¸c˜oes (ou tarefas) primitivas representam a¸c˜oes

O estado corrente deve satisfazer um conjunto de pr´e-condi¸c˜oes de um m´etodo para que este seja aplic´ avel

Mais expressivo que o Planejamento Cl´ assico

Faz uma busca no espa¸co de redes de tarefas atrav´es das diferentes decomposi¸c˜oes

Um problema de Planejamento Hier´ arquico consiste em, dado um estado inicial s 0 e uma a¸c˜ ao composta, decompˆ o-la atrav´es de m´etodos at´e o n´ıvel de a¸c˜oes primitivas, execut´ aveis a partir de s 0

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(13)

Exemplo de Planejamento Hier´arquico

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(14)

Redes Simples de Tarefas

Redes Simples de Tarefas (STNs):

Caso especial de HTNs

Efetua busca progressiva no espa¸co de estados Escolha de a¸c˜ oes guiada pela decomposi¸c˜ ao de redes hier´ arquicas de tarefas

Base para a fam´ılia SHOP de planejadores:

SHOP - decomposi¸c˜ao em ordem total (listas de tarefas) SHOP2 - decomposi¸c˜ao em ordem parcial (redes de tarefas) JSHOP2 - compila¸c˜ao de planejadores espec´ıficos de dom´ınio

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(15)

Decomposi¸c˜ao Hier´arquica em Ordem Parcial

PFD (s, w, D, M)

se w = ∅ ent˜ ao devolva(π)

n˜ao-deterministicamente escolha u ∈ w, sem predecessores em w se t

u

´e uma a¸c˜ao primitiva ent˜ ao

A ← {(a, σ) | a ´e uma a¸c˜ao de D, σ ´e uma substitui¸c˜ao tal que nome(a) = σ(t

u

) e a ´e aplic´avel a s } se A = ∅ ent˜ ao devolva(falha)

n˜ao-deterministicamente escolha (a, σ) ∈ A π ← PFD (γ(s, a), σ(w \ {u}), D, M) se π = falha ent˜ ao devolva(falha) sen˜ ao devolva(a.π)

sen˜ ao

M ← {(m, σ) | m ´e um m´etodo de M, σ ´e uma substitui¸c˜ao tal que nome(m) = σ(t

u

) e m ´e aplic´avel a s } se M = ∅ ent˜ ao devolva(falha)

n˜ao-deterministicamente escolha (m, σ) ∈ M n˜ao-deterministicamente escolha w

0

∈ δ(w, u, m, σ) devolva PFD (s , w

0

, D, M)

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(16)

Exemplo de M´etodos de Decomposi¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(17)

1 Introdu¸c˜ ao

Planejamento Cl´ assico e Hier´ arquico Planejamento N˜ ao-Determin´ıstico

2 Planejamento N˜ ao-Determin´ıstico Hier´ arquico T´ecnica de “N˜ ao-determiniza¸c˜ ao”

Planejador ND-SHOP2 Implementa¸c˜ ao

Testes Comparativos

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(18)

Planejamento N˜ao-Determin´ıstico

Motiva¸c˜ ao:

Ambientes pr´ aticos n˜ ao s˜ ao t˜ ao bem comportados como os do Planejamento Cl´ assico

A¸c˜ oes podem falhar de modo previs´ıvel

E poss´ıvel representar a ´ incerteza nos efeitos de a¸c˜ oes Agentes mais informados podem planejar para contingˆencias Estrat´egia:

Planejador deve considerar todos os poss´ıveis caminhos de execu¸c˜ ao diferentes, para poder encontrar um plano que funcione, apesar do n˜ ao-determinismo

Problemas:

Ainda mais dif´ıcil que o Planejamento Cl´ assico O tamanho do plano condicional obtido pode crescer exponencialmente

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(19)

N˜ao-determinismo Limitado

A¸c˜oes podem ter efeitos n˜ ao-determin´ısticos, mas os efeitos poss´ıveis podem ser descritos atrav´es de uma linguagem de a¸c˜ oes Planejamento Conformante, ou planejamento sem sensores,

constr´ oi planos seq¨ uenciais que podem ser executados sem percep¸c˜ ao

Planejamento Contingente, ou condicional, lida com o

n˜ ao-determinismo limitado construindo um plano condicional com diferentes ramifica¸c˜ oes que prevˆeem as diferentes contigˆencias que possam surgir, ou uma pol´ıtica

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(20)

Planos como Pol´ıticas

Um plano seq¨ uencial n˜ ao ´e capaz de representar a¸c˜ oes para diferentes evolu¸c˜oes do mundo

Outro tipo de formalismo mais expressivo para representar planos deve ser utilizado em Planejamento N˜ ao-Determin´ıstico Defini¸c˜ ao

Uma pol´ıtica π:

Fun¸c˜ ao π : S 7→ A, diz qual a¸c˜ ao executar em um determinado estado

Geralmente um conjunto de pares de estado e a¸c˜ ao (s, a) Conjunto de estados em π, S π = {s | (s, a) ∈ π}

Pol´ıtica determin´ıstica: apenas uma a¸c˜ ao por estado

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(21)

Estrutura de Execu¸c˜ao de Pol´ıticas

Defini¸c˜ ao

A estrutura de execu¸c˜ ao Σ π de uma pol´ıtica π, dado o sistema de transi¸c˜ ao de estados Σ ´e:

Σ π ⊆ Σ ´e um grafo direcionado, onde:

N´os s˜ao estados alcan¸c´aveis atrav´es de a¸c˜ oes de π Arestas s˜ao poss´ıveis transi¸c˜ oes de estado causadas por π Caminho em Σ π de s 1 at´e s 2 ⇐⇒ s 1 ´e π-ancestral de s 2 e s 2

´e π-descendente de s 1

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(22)

Estrutura de Execu¸c˜ao de Pol´ıticas

Sistema de Transi¸c˜ ao de Estados Σ

Estrutura de Execu¸c˜ ao Σ π s 2 ´e π-ancestral de s 7

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(23)

Classes de Solu¸c˜oes

Diferentes n´ıveis de garantia de planos como pol´ıticas

Fracos Para cada s ∈ S 0 , existe pelo um caminho em Σ π

que alcan¸ca um estado meta

Fortes Qualquer estado de S π alcan¸ca a meta sem que estados sejam visitados novamente (sem ciclos) Fortes C´ıclicos Qualquer estado de S π alcan¸ca a meta, por´em

podem existir ciclos em Σ π

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(24)

Classes de Solu¸c˜oes

Diferentes n´ıveis de garantia de planos como pol´ıticas

Fracos Para cada s ∈ S 0 , existe pelo um caminho em Σ π

que alcan¸ca um estado meta

Fortes Qualquer estado de S π alcan¸ca a meta sem que estados sejam visitados novamente (sem ciclos) Fortes C´ıclicos Qualquer estado de S π alcan¸ca a meta, por´em

podem existir ciclos em Σ π

N´ıvel crescente de garantia: Fracos < Fortes C´ıclicos < Fortes Algumas vezes planos fortes n˜ ao existem mas solu¸c˜ oes fortes c´ıclicas s˜ ao satisfat´orias

Como ´ ultimo recurso, caso n˜ ao exista outra solu¸c˜ ao melhor, um plano fraco pode vir a funcionar

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(25)

Algoritmos Tradicionais

Tradicionalmente, utiliza-se algoritmos de Verifica¸c˜ ao de Modelos:

T´ecnica de verifica¸c˜ao formal

Baseada na explora¸c˜ao exaustiva de um sistema de transi¸c˜ao de estados Σ

Utiliza busca em largura regressiva, a partir dos estados meta, at´e os estados iniciais

Baseia-se em uma fun¸c˜ ao de pr´e-imagem, que computa um conjunto de predecessores de S

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(26)

Testes Comparativos

1 Introdu¸c˜ ao

Planejamento Cl´ assico e Hier´ arquico Planejamento N˜ ao-Determin´ıstico

2 Planejamento N˜ ao-Determin´ıstico Hier´ arquico T´ecnica de “N˜ ao-determiniza¸c˜ ao”

Planejador ND-SHOP2 Implementa¸c˜ ao

Testes Comparativos

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(27)

Testes Comparativos

Planejamento N˜ao-Determin´ıstico Hier´arquico

Suposi¸c˜oes do Planejamento N˜ ao-Determin´ıstico Hier´arquico Conjunto finito de estados

Ambiente completamente observ´ avel A¸c˜ oes n˜ ao-determin´ısticas

Ambiente est´ atico (sem eventos externos)

Metas como decomposi¸c˜ ao de tarefas e alcan¸cabilidade Planos como pol´ıticas

Tempo impl´ıcito Planejamento offline

No contexto deste trabalho, Planejamento N˜ ao Determin´ıstico Hier´ arquico denota Planejamento Hier´ arquico com A¸c˜ oes N˜ ao-Determin´ısticas sob Observabilidade Total

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(28)

Testes Comparativos

“N˜ao-determiniza¸c˜ao” de Planejadores Progressivos

Motiva¸c˜ ao:

Muito trabalho tem sido feito para melhorar a eficiˆencia de planejadores que efetuam busca progressiva no espa¸co de estados

E desej´ ´ avel poder transportar estas t´ecnicas para o Planejamento N˜ ao-Determin´ıstico

Caracter´ısticas:

Transforma¸c˜ ao de modo sistem´ atico (FCP → ND-FCP) Estende planejadores progressivos para lidar com n˜ ao-determinismo

Preserva corretude e completude Suposi¸c˜oes:

Σ com estados totalmente observ´ aveis

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(29)

Testes Comparativos

Planejamento Progressivo Determin´ıstico

FCP (s 0 , g , D, α) π ← ∅; s ← s 0 loop

se s satisfaz g ent˜ ao devolva(π)

A ← {(s , a) | a ´e uma instˆ ancia total de um operador em D, a ´e aplic´ avel a s, e a ∈ α(s)}

se A = ∅ ent˜ ao devolva(falha)

n˜ ao-deterministicamente escolha (s, a) ∈ A π ← π ∪ {(s , a)}

s ← γ (s , a)

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(30)

Testes Comparativos

Planejamento Progressivo N˜ao-Determin´ıstico

ND-FCP (S 0 , g , D 0 , α 0 )

π ← ∅; S ← S 0 ; resolvidos ← ∅ loop

se S = ∅ ent˜ ao devolva(π)

selecione um estado s ∈ S e remova-o de S se s satisfaz g ent˜ ao insira s em resolvidos sen˜ ao se s ∈ / S π ent˜ ao

A ← {(s, a) | a ´e uma instˆ ancia total de um

operador em D 0 , a ´e aplic´ avel a s, e a ∈ α 0 (s)}

se A = ∅ ent˜ ao devolva(falha)

n˜ ao-deterministicamente escolha (s , a) ∈ A π ← π ∪ {(s , a)}

S ← S ∪ γ(s , a)

sen˜ ao se s n˜ ao tem π-descendentes em (S ∪ resolvidos) \ S π

ent˜ ao devolva(falha)

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(31)

Testes Comparativos

Caracteriza¸c˜ao de Planos de ND-FCP

ND-FCP gera planos fortes c´ıclicos, mas pode ser adaptado para gerar tamb´em planos:

Fortes , trocando o teste por π-descendentes por falha assim que um ciclo for detectado

Fracos , removendo, cada vez que um estado meta ´e gerado, todo estado n˜ ao-inicial do conjunto S , for¸cando o planejador a encontrar um caminho a partir de cada estado inicial at´e uma meta

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(32)

Testes Comparativos

1 Introdu¸c˜ ao

Planejamento Cl´ assico e Hier´ arquico Planejamento N˜ ao-Determin´ıstico

2 Planejamento N˜ ao-Determin´ıstico Hier´ arquico T´ecnica de “N˜ ao-determiniza¸c˜ ao”

Planejador ND-SHOP2 Implementa¸c˜ ao

Testes Comparativos

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(33)

Testes Comparativos

ND-SHOP2

Planejador ND-SHOP2 [Kuter & Nau 2004]

T´ecnica de “n˜ ao-determiniza¸c˜ ao” aplicada a SHOP2 α representa a escolha de a¸c˜ oes geradas pela decomposi¸c˜ ao hier´ arquica

Alguns resultados emp´ıricos mostram condi¸c˜ oes em que o tempo de execu¸c˜ ao cresce apenas polinomialmente em rela¸c˜ ao

`

a vers˜ ao determin´ıstica do problema Permite combinar:

Poder de controle de busca espec´ıfico de dom´ınio do planejamento hier´ arquico

Capacidade de lidar com a¸c˜ oes n˜ ao-determin´ısticas

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(34)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(35)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(36)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(37)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(38)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(39)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(40)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(41)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(42)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(43)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(44)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(45)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(46)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(47)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(48)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(49)

Testes Comparativos

Simula¸c˜ao

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(50)

Testes Comparativos

Modelo da Linguagem para ND-SHOP2

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(51)

Testes Comparativos

Exemplo Presas e Predador

M´etodos HTN para obter eficiˆencia:

Seguir presas primeiro na horizontal e depois na vertical Diminui o n´umero de a¸c˜ oes de movimento a considerar Escolher uma presa espec´ıfica, segu´ı-la e agarr´ a-la, depois considerar outras presas

Escolha de a¸c˜ oes independe do n´ umero total de presas

Efeito

Adotar estas duas estrat´egias combinadas reduz o n´ umero de a¸c˜ oes aplic´ aveis a apenas uma por estado

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(52)

Testes Comparativos

Tamanhos das Pol´ıticas Obtidas

10 100 1000 10000 100000 1e+006

1 10 100

Tamanho da politica

Tamanho da grade (n x n)

1 presa 2 presas 3 presas 4 presas

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(53)

Testes Comparativos

Tempo M´edio de Execu¸c˜ao

0.01 0.1 1 10 100 1000 10000

1 10 100

Tempo (s)

Tamanho da grade (n x n)

1 presa 2 presas 3 presas 4 presas

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(54)

Testes Comparativos

N´umero Total de Estados

1 100 10000 1e+006 1e+008 1e+010 1e+012 1e+014

1 2 3 4 5 6 7 8 9 10

Total de estados

Numero de presas

grade 2x2 grade 3x3 grade 4x4

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

(55)

Testes Comparativos

Conclus˜ao

ND-FCP permite que avan¸cos nos planejadores com busca progressiva no espa¸co de estados possam ser utilizados para dom´ınios n˜ ao-determin´ısticos

ND-SHOP2 permite controle sobre escolhas de a¸c˜ oes mas ainda deve explorar todos os estados alcan¸c´ aveis

Meios de representa¸c˜ ao compacta de conjuntos de estados s˜ ao necess´ arios para a solu¸c˜ ao de problemas maiores

YoYo [Kuter et al. 2005] representa conjuntos de estados e transi¸c˜ oes atrav´es de BDDs

Ricardo Guimar˜aes Herrmann herrmann@ime.usp.br Planejamento Hier´arquico sob Incerteza

(56)

Testes Comparativos

Referˆencias

U. Kuter. (PhD thesis, 2006)

Planning under Uncertainty: Moving Forward U. Kuter, D. Nau, M. Pistore, P. Traverso. (2005) A Hierarchical Task-Network Planner based on Symbolic Model Checking

U. Kuter, D. Nau (2004)

Forward-Chaining Planning in Nondeterministic Domains M. Ghallab, D. Nau, P. Traverso. (2004)

Automated Planning.

S. Russell, P. Norvig. (2002) Inteligˆ encia Artificial.

Ricardo Guimar˜aes Herrmann Planejamento Hier´arquico sob Incerteza

Referências

Documentos relacionados

Mais especificamente, no planejamento cl´assico faz-se a suposi¸c˜ao de que o ambiente possa ser modelado como um sistema de transi¸c˜ao de estados determin´ıstico, es-

Criar de uma implementa¸c˜ ao em Scala do modelo de atores que use o padr˜ ao AMQP para o transporte de mensagens entre atores remotos.. Comparar o desempenho do prot´

user’s secret + partial secret calculated by KGC (using the user’s identity and the KGC’s secret).. Some

Marco A. Gerosa IME / USP.

Planejamento guiado por Redes Hier´ arquicas de Tarefas (HTNs) Faz uma busca no espa¸co de redes de tarefas atrav´es das diferentes decomposi¸c˜oes de a¸c˜oes compostas (ou

Planejamento guiado por Redes Hier´ arquicas de Tarefas (HTNs) Projetista do dom´ınio fornece diferentes m´etodos para decompor a¸c˜oes compostas (ou tarefas). A¸c˜oes (ou

Departamento de Ciência da Computação do

(consequence of a wrong equation in the proof of Strategy 9) Mistakes in equations (6) and (8) from Multiplicative double BDH Trapdoor Test (and a wrong equation in the proof