• Nenhum resultado encontrado

Cadeias de Markov Intervalares finitas com tempo discreto

3.6 Cadeias de Markov Intervalares

3.6.1 Cadeias de Markov Intervalares finitas com tempo discreto

Nesta seção, com o intuito de unificar as teorias de cadeias de Markov intervalar, P será denotada como qualquer uma das funções de probabilidade intervalar PIR ou PI.

Nesta seção considera somente cadeias de Markov intervalares finitas com tempo discreto, ou seja, aquelas nas quais os estados mudam em certos instantes de tempo discreto, indexados por uma variável inteira n. A cada passo de tempo n, a cadeia de Markov tem um estado, denotado por Xn, que pertence a um conjunto finito S de possíveis estados. Sem perda de generalidade, suponha

que o conjunto de estados é S = {1,...,m}, onde m é um inteiro positivo. A cadeia de Markov é descrita em termos de suas probabilidades intervalares de transição Pi j: sempre que o estado passa

a ser i, existe uma probabilidade intervalar Pi j que o próximo estado seja j. Matematicamente, se

i, j ∈ S,

Pi j= P(Xn+1= j | Xn= i).

A suposição principal que norteia os processos de Markov é que as probabilidades intervalares de transição Pi jestão definidas sempre que o estado i seja visitado, independente do que aconteceu

no passado e de como o estado i foi atingido. Matematicamente, suponha a seguinte propriedade de Markov, que demanda:

P(Xn+1= j | Xn= i, Xn−1= in−1, . . . , X0= i0) = P(Xn+1= j | Xn= i) = Pi j

1Andrey Markov obteve os primeiros resultados para estes processos em 1906. Uma generalização para espaços de estados infinitos contáveis foi dada por Kolmogorov em 1936. Cadeias de Markov estão rela- cionadas ao movimento Browniano e à hipótese ergódica, dois importantes tópicos da física nos primeiros anos do século XX, mas a motivação de Markov para o desenvolvimento da teoria parece ter sido estender a teoria dos números grandes para eventos dependentes.

Capítulo 3. Teoria de Probabilidade Intervalar

para todos os tempos n, todos os estados i, j ∈ S e todas as sequências possíveis i0, . . . , in−1 de

estados passados. Em outras palavras, a lei de probabilidade intervalar do estado seguinte Xn+1

depende do passado apenas através do valor do estado presente Xn.

Defina a probabilidade intervalar de transição de n-passos Pi j(n) como a probabilidade inter-

valar de Xnestar no estado j dado que X0está no estado i. Matematicamente,

Pi j(n) = P(Xn= j | X0= i).

Note que, pelo Teorema da probabilidade total intervalar tem-se que P(Xn= j) ⊆ m

i=1 P(X0= i) · P(Xn= j | X0= i) = m

i=1 P(X0= i) · Pi j(n).

Observação 3.6.1 Note que, pela Observação 3.5.2 os processos Markovianos intervalares podem ser olhados como famílias de processos Markovianos clássicos. Mais precisamente, pode-se olhar as probabilidades de transição intervalares Pi j como uma família de probabilidades de transição

clássica da seguinte forma

Pi j = {Pa(X1= j | X0= i) : a ∈ I} = n Pi ja : a ∈ I o , se P = PI ou Pi j= ( Pa(X1= j | X0= i) : a ∈ I e r

i=1 ai= 1 ) = ( Pi ja : a ∈ I e r

i=1 ai= 1 ) , se P = PIR.

De forma análoga pode-se caracterizar a probabilidade intervalar de transição de n-passos Pi j(n) como uma família de probabilidades de transição de n-passos clássica, da seguinte forma

Pi j(n) = {Pa(Xn= j | X0= i) : a ∈ I} = n Pi ja(n) : a ∈ Io, se P = PI ou Pi j(n) = ( Pa(Xn= j | X0= i) : a ∈ I e r

i=1 ai= 1 ) = ( Pi ja(n) : a ∈ I e r

i=1 ai= 1 ) , se P = PIR.

A seguir será provado a versão intervalar da importante equação de Chapman-Kolmogorov, pois ela fornece um método eficaz para computar as probabilidades intervalares de transição de n-passos Pi j(n).

Capítulo 3. Teoria de Probabilidade Intervalar

Teorema 3.6.2 Sejam s,t ∈ N. Então, Pi j(s + t) ⊆

m

k=1

Pik(s) · Pk j(t).

Prova: Note que, os eventos{Xs= k}, com k = 1, . . . , m, formam uma partição do conjunto Ω

no sentido que são mutuamente disjuntos e cobrem Ω. Logo, pelo Teorema 3.5.8, tem-se que Pi j(s + t) = P(Xs+t= j|X0= i)

⊆ ∑m

k=1

P(Xs= k|X0= i) · P(Xs+t= j|Xs= k, X0= i).

Mas, pela propriedade de Markov, tem-se que

P(Xs+t= j|Xs= k, X0= i) = P(Xs+t = j|Xs= k) = P(Xt= j|X0= k), ou seja, Pi j(s + t) ⊆ m

k=1 P(Xs= k|X0= i) · P(Xt = j|X0= k) = m

k=1 Pik(s) · Pk j(t).

Um estado j é dito ser acessível intervalarmente a partir do estado i, e será escrito i → j, se existir n ∈ N tal que Pi j(n) > 0. Isto significa que se iniciar com o estado i, existe uma probabili-

dade intervalar positiva (mas não necessariamente igual a [1]) que a cadeia estará no estado j após npassos. Como Pi j(n) = {Pi ja(n) : a ∈ I} se P = PI, e Pi j(n) = {Pi ja(n) : a ∈ I e r

i=1 ai= 1}, se P = PIR,

tem-se que j é acessível intervalarmente a partir do estado i se, e somente se, j é acessível a partir do estado i com respeito da probabilidade Pa para todo a ∈ I (respectivamente, a ∈ I com

r

i=1ai= 1) se P = PI (respectivamente, se P = PIR.)

Se um estado j é acessível intervalarmente a partir de i e i é acessível intervalarmente a partir de j, diz-se que i e j se comunicam intervalarmente, e será escrito i ↔ j. Esta relação de comuni- cação intervalar é uma relação de equivalência, ou seja, satisfaz as seguintes propriedades: Proposição 3.6.3 (1) (Reflexividade) i↔ i, para todo estado i.

(2) (Simetria) Se i↔ j então j ↔ i.

(3) (Transitividade) Se i↔ k e k ↔ j então, i ↔ j.

Prova: Como Pii(0) = P(X0 = i|X0= i) = [1] > 0, tem-se a propriedade (1). A propriedade

Capítulo 3. Teoria de Probabilidade Intervalar

existem inteiros s,t ∈ N tais que Pik(s) > 0 e Pk j(t) > 0. Em particular, m

k=1

Pik(s) · Pk j(t) > 0.

Portanto, pelo Teorema 3.6.2 tem-se que Pi j(s + t) > 0. Assim, i ↔ j.

Como esta relação de comunicação intervalar é uma relação de equivalência, tem-se que o espaço de estados S pode ser decomposto em uma união finita disjunta de classes de equivalência módulo a relação "↔", ou seja, existem subconjuntos C1, . . . ,Csde S, dois a dois disjuntos, tais que

S= Ss

i=1

Cie tais que todos os estados em Ci se comunicam intervalarmente entre si. Os conjuntos

C1, . . . ,Cssão chamados de classes de comunicação intervalar da cadeia de Markov.

Seja i um estado e AI(i) o conjunto de todos os estados que são acessíveis intervalarmente a partir de i. Diz-se que i é recorrente intervalarmente se para todo j que é acessível intervalarmente a partir de i tem-se que i é acessível intervalarmente a partir de j; ou seja, i satisfaz a propriedade que se j ∈ AI(i) então i ∈ AI( j). Em particular, tem-se que i é recorrente intervalarmente se, e somente se, i é recorrente com respeito das probabilidades crisp Papara todo a ∈ I, se P = PI, ou

para todo a ∈ I com ∑r

i=1

ai= 1, se P = PIR.

Quando a cadeia de Markov começa no estado recorrente intervalarmente i, somente podem ser visitados os estados j ∈ AI(i) a partir dos quais i é acessível intervalarmente, ou seja, dado qualquer estado futuro, existe sempre alguma probabilidade intervalar de retornar ao estado i e, após um certo tempo, tem-se a certeza que isto de fato vai acontecer. Assim, repetindo este argumento indefinidamente, pode-se concluir que, se um estado recorrente intervalarmente i é visitado alguma vez, ele será revisitado uma infinidade de vezes.

Um estado i que não é recorrente intervalarmente é dito transiente intervalarmente. Assim, o estado i é transiente intervalarmente se existirem estados j ∈ AI(i) tais que i não é acessível a partir de j. Em particular, tem-se que i é transiente intervalarmente se, e somente se, i é transiente com respeito da probabilidade crisp Pa para algum a ∈ I, se P = PI, ou para algum a ∈ I com

r

i=1

ai= 1, se P = PIR.

Após a cadeia ter visitado o estado transiente intervalarmente i, há uma probabilidade interva- lar positiva de visitar o estado j e, após algum tempo, isto de fato vai acontecer, e quando aconteça, o estado i nunca mais será visitado. Pode-se concluir, que um estado transiente intervalarmente será visitado somente um número finito de vezes.

Note que, uma cadeia de Markov intervalar finita sempre possui pelo menos um estado re- corrente intervalarmente pois, se todos os estados forem transiente intervalarmente então, pelo comentado acima, após um número finito de passos (tempo) a cadeia deixará todos os estados e nunca mais os visitarão. Para onde irá?

Pode-se dividir os estados transientes intervalarmente em dois tipos: os fortemente transientes intervalarmente, ou seja, aqueles que são transientes com respeito da probabilidade crisp Papara

todo a ∈ I, se P = PI, ou para todo a ∈ I com ∑r

i=1ai

= 1, se P = PIR; e os fracamente transientes intervalarmente, ou seja, aqueles que são transientes com respeito da probabilidade crisp Pa e

Capítulo 3. Teoria de Probabilidade Intervalar a, b ∈ I com ∑r i=1 ai= r ∑ i=1 bi= 1, se P = PIR.

As propriedades de recorrência e transiência intervalar são propriedades solidárias, no se- guinte sentido:

Proposição 3.6.4 Se i↔ j então

(1) i é recorrente intervalarmente se, e somente se, j também é.

(2) i é fortemente transiente intervalarmente se, e somente se, j também é.

(3) i é fracamente transiente intervalarmente se, e somente se, j também é.

Prova: O item(3) é uma consequência imediata dos itens anteriores, assim será provado apenas os itens (1) e (2).

Foi visto que i é recorrente (resp. fortemente transiente) intervalarmente se, e somente se, i é recorrente (resp. transiente) com respeito da probabilidade crisp Papara todo a ∈ I, se P = PI, ou

para todo a ∈ I com ∑r

i=1ai

= 1, se P = PIR. Logo, o resultado segue de [127] [Proposition 2.8.1]. Segue desta proposição que se i é um estado recorrente intervalarmente, então o conjunto de estados AI(i) que são acessíveis intervalarmente de i formam uma classe de comunicação interva- lar, a qual é recorrente intervalarmente, no sentido que todos os estados em AI(i) são recorrentes intervalarmente. Além disso, segue também que um estado transiente intervalarmente não pode ser acessível intervalarmente de um estado recorrente intervalarmente, ou seja, se i é recorrente intervalarmente e i → j então, j é recorrentes intervalarmente.

Com o intuito de entender o comportamento a longo prazo das cadeias de Markov intervalares é importante entender o que acontece com cadeias que consistem somente de uma classe recorrente de comunicação intervalar. Por este motivo, é importante caracterizar as classes recorrentes de comunicação intervalar de acordo com a presença ou ausência de padrões de periodicidade nos tempos que um estado é visitado. Por isto, diz-se que uma classe recorrente de comunicação intervalar é periódica intervalarmente se seus estados podem ser agrupados em d > 1 subconjuntos disjuntos S1, . . . , Sd de tal forma que todas as transições intervalares de um subconjunto levam ao

seguinte subconjunto. Matematicamente, Se i ∈ Sk e Pi j> 0 então

(

j∈ Sk+1, se k = 1,...,d − 1,

j∈ S1, se k = d.

Uma classe recorrente de comunicação intervalar que não é periódica é chamada de aperiódica intervalarmente, ou seja, em uma classe recorrente de comunicação intervalar periódica os estados se visitam intervalarmente seguindo a sequência de subconjuntos e, depois de d passos, termina no mesmo subconjunto.

Capítulo 3. Teoria de Probabilidade Intervalar

É interesse desse trabalho o estudo dos estados estacionários de uma cadeia de Markov interva- lar. Os estados estacionários representam uma característica crucial das cadeias de Markov pois, como será visto, elas controlam em vários aspectos o comportamento a longo prazo da cadeia. Mais precisamente, é interesse desse trabalho estudar as probabilidades intervalares de transição de n-passos Pi j(n) quando n é suficientemente grande.

Se a cadeia de Markov intervalar possue duas ou mais classes de estados recorrentes é claro que o valor intervalar limite de Pi j(n) dependerá do estado inicial i, pois visitar j a longo prazo

vai depender se j está ou não na mesma classe recorrente de comunicação intervalar que i. Por esta razão, será restringido nesse trabalho o estudo a cadeias de Markov que consistem somente de uma classe recorrente de comunicação intervalar e possivelmente alguns estados transientes intervalarmente.

Note que, a sequência intervalar Pi j(n) pode não convergir, mesmo que a cadeia de markov

intervalar possua uma única classe recorrente de comunicação intervalar. Por exemplo, considere a classe recorrente com dois estados, 1 e 2, tais que P12= P21= [1], ou seja a partir do estado

1 somente pode-se ir para o estado 2, e vice-versa. Portanto, se começar em um desses estados, estará no mesmo estado após um número par de transições e no outro estado após um número ímpar de transições. O que está por trás deste fenômeno é que a classe de comunicação intervalar é periódica e, para esta classe, Pi j(n) oscila. Será provado a seguir que para qualquer estado j, as

probabilidades intervalares de transição de n-passos Pi j(n) aproximam-se de um valor intervalar

limite, o qual é independente do estado inicial i, desde que exclua-se as duas situações descritas acima: classes recorrentes múltiplas e/ou classes periódicas.

Teorema 3.6.5 (Teorema da Convergência Estacionária Intervalar) Considere uma cadeia de Markov intervalar com uma única classe recorrente de comunicação intervalar, a qual é ape- riódica. Então, dado qualquer estado j existe um único intervalo πj = [πj, πj] que satisfaz as

seguintes propriedades: (1) lim n→∞Pi j(n) = πj, para todo i, j ∈ S. (2) πj⊆ m ∑ k=1 πkPk j para todo j∈ S. (3) m ∑ k=1 πk≤ 1 ≤ m ∑ k=1 πk. (4) Têm-se que

(a) πj= [0], se j é fortemente transiente intervalarmente.

(b) πj= [0, πj], com πj> 0, se j é fracamente transiente intervalarmente.

Capítulo 3. Teoria de Probabilidade Intervalar

Prova: Com o intuito de colocar os argumentos de forma mais claros, a demonstração será feita apenas no caso em que P = PI. O caso em que P = PIR é totalmente análogo.

Como

Pi j(n) = {Pi ja(n) : a ∈ I}

e esta é uma igualdade entre intervalos fechados de números reais, tem-se que lim n→∞Pi j(n) = n lim n→∞P a i j(n) : a ∈ I o . (3.17) Por outro lado, como a cadeia de Markov intervalar possui uma única classe recorrente de comunicação intervalar, têm-se que todas as cadeias de Markov crisp, com respeito das probabili- dades crisp Pa, induzidas por esta cadeia de Markov intervalar também possuem uma única classe

recorrente, a qual também é aperiódica. Portanto, pelo Teorema da Convergência de estados esta- cionários crisp ([127] Theorem 2.13.2 and Corollary 2.13.4), tem-se que para cada a ∈ I existe πa j tal que (i) lim n→∞P a i j(n) = π a j para todo i, j ∈ S; (ii) πa j = m ∑ k=1 πakPk ja para todo j ∈ S; (iii) ∑m k=1 πak = 1;

(iv) tem-se que

πaj = 0, se j é transiente; πaj > 0, se j é recorrente. Defina πj= [πj, πj], onde πj= inf{πaj : a ∈ I} e πj= sup{πaj : a ∈ I}.

Os itens (1) e (4) seguem diretamente da igualdade (3.17) e da discussão acima. Pelo Teorema 3.6.2 sabe-se que

Pi j(n + 1) ⊆

m

k=1

Pik(n) · Pk j.

Aplicando o limite quando n tende a infinito em ambos os membros, tem-se que πj= lim n→∞P a i j(n + 1) ⊆ m

k=1 lim n→∞Pik(n) · Pk j= m

k=1 πk· Pk j,

Capítulo 3. Teoria de Probabilidade Intervalar

o que prova (2).

Resta provar o item (3). Como πj = inf{πaj : a ∈ I} e πj = sup{πaj : a ∈ I} têm-se, pela

compacidade de I, que existem a( j),b( j) ∈ I tais que πj= π a( j) j e πj= π b( j) j . Assim, π a( j) j ≤ π a j e

πb( j)j ≥ πaj para todo a ∈ I. Em particular, πa( j)j ≤ πa(1)j e πb( j)j ≥ πa(1)j para todo j = 1,...,m. Logo,

m

j=1 πj= m

j=1 πa( j)j ≤ m

j=1 πa(1)j = 1 e m

j=1 πj= m

j=1 πb( j)j ≥ m

j=1 πa(1)j = 1.

Capítulo 4

Teoria Fuzzy

4.1

Considerações Iniciais

A teoria dos conjuntos introduzida por Georg Cantor em torno de 1870, baseada na noção de pertinência de elementos a conjuntos provou ser uma das mais poderosas ferramentas da Matemá- tica Moderna que permitiu estudar e modelar o desenvolvimento de outras ciências. No entanto, esta teoria clássica de conjuntos é muito rigorosa pois admite duas possibilidades: que um objeto pertença ou que não pertença ao conjunto, ou seja, esta teoria só permite valores "exatos", 0 (não há pertinência) e 1 (há pertinência) e não permite outras possibilidades que, no entanto, têm sido estudados nas áreas de modelos lógicos.

Embora a teoria dos conjuntos clássicos seja a base de toda a matemática moderna, ela apre- senta problemas para modelar uma enorme classe de problemas reais. Como por exemplo, o paradoxo de sorites (que em grego significa feixe ou monte), é atribuído a Eubulides de Mileto, um dialético adversário de Aristóteles. O paradoxo foi enunciado originalmente como segue:

"Quando um monte de areia deixa de ser um monte de areia, caso seja retirado um grão de areia de cada vez?"A tradução da palavra inglesa fuzzy em português admite diversas possibilidades, entre elas: Incerto, difuso, nebuloso, vago, impreciso, felpudo, indistinto, entre outras. Porém, segundo Barros e Bassanezi [12] nenhuma dessas traduções é completamente fiel ao sentido am- plo dado à palavra fuzzy em inglês. Isto tem dificultado um consenso sobre qual a tradução usa no contexto de lógica fuzzy, o que tem motivado que a grande maioria dos trabalhos sobre lógica fuzzy em português incorporem o anglicismo "fuzzy"em detrimento de suas traduções (as tradu- ções de fuzzy mais usadas são difusa e nebulosa). Observe que um fenômeno similar ocorre com outras linguagens como Francês e Espanhol (castelhano).

Em 1965, Loft A. Zadeh, devido à necessidade de ferramentas mais flexíveis a certos termos linguísticos subjetivos, como "aproximadamente", "em torno de", dentre outros, sugeriu uma teo- ria alternativa de conjuntos, onde a passagem da pertinência para a não pertinência fosse gradual e não abrupta, assim Zadeh publicou o seu 1◦trabalho sobre conjuntos fuzzy, baseado na lógica

multinível. Com este trabalho foi possível obter uma formalização matemática de um conjunto fuzzy, generalizando a teoria convencional dos conjuntos.

Capítulo 4. Teoria Fuzzy

Desta forma, dados numéricos fuzzy podem ser representados por meio de subconjuntos re- ais fuzzy, chamados de números fuzzy com o tratamento dos aspectos imprecisos e ambíguos apresentados na lei da contradição. E a partir deste trabalho surge a expressão lógica fuzzy.

Com a incorporação do conceito "grau de verdade", a teoria dos conjuntos fuzzy estende a te- oria de conjuntos clássicos. Os grupos são rotulados qualitativamente (usando termos linguísticos, tais como: alto, morno, ativo, pequeno, perto, etc.) e os elementos deste conjuntos são caracteri- zados variando o seu grau de pertinência (valor que indica o grau em que um elemento pertence a um conjunto). Por exemplo, um homem de 1,80 metro e um homem de 1,75 metro pertencem ao conjunto dos "alto", embora o homem de 1,80 metro tenha um grau de pertinência maior neste conjunto.

Os números fuzzy foram introduzidos em 1978 com os trabalhos de Steven Nahmias [112] e Didier Dubois e Henry Prade [48], porém o primeiro texto a abordar de forma profunda e rigorosa a aritmética fuzzy foi o livro de Arnald Kaufmann e Madan M. Gupta [77]. Desde então, esta área tem sido alvo de intensas pesquisas com aplicações nas mais diversas áreas, tais como: em Geologia [14], em eletricidade [47], em engenharia [64], administração financeira [41], etc.

Existem diversas noções, sutilmente diferentes, para o conceito de números fuzzy (veja por exemplo [13, 64, 79, 95, 114]). Já para as operações aritméticas entre números fuzzy, há dois métodos equivalentes de se definir, uma via α-níveis e outra via princípio da extensão de Zadeh [79, 13]. No primeiro caso como os α-níveis de um número fuzzy são intervalos, as operações aritméticas se reduzem a operações da aritmética intervalar. No caso do princípio da extensão de Zadeh o grau de pertinência do número fuzzy resultante de uma operação aritmética ⊕ sobre números fuzzy

A

e

B

, tem como graus de pertinência

µA⊕B(x) = sup

y⊕z=xmin(µA

(y),

B

(z))

Considerando que podem existir infinitos y e z tais que y + z = x, esta forma de calcular não é um método prático de ser implementado [64, p.53]. Por esta razão, em geral é mais usada a abordagem de α-níveis. Operações aritméticas sobre números fuzzy, além de ser uma estrutura algébrica pobre [37], não são simples de determinar. Porém, existem algumas subclasses de números fuzzy que são mais simples de manipular, tais como: números fuzzy triangulares, trapezoidais, L-R, quadráticos, etc. [64]. Mas, essas classes de números fuzzy não são fechadas sobre a multiplicação definida em termos de α-níveis, ou equivalente em termos do princípio da extensão de Zadeh [64]. Porém, essas definições de operações aritméticas, embora bem embasadas e justificadas, são muito específicas para uma teoria tão aberta e vaga como a teoria fuzzy.

Há inúmeras aplicações da lógica fuzzy, dentre elas: O funcionamento de ar-condicionado onde o sistema fuzzy controla o aparelho de acordo com a temperatura e as preferências do usuário; as indústrias automobilísticas os sistemas fuzzy controlam a força com que os freios são acionados para evitar derrapagens. os elevadores que reduzem o tempo de espera baseado no tráfego; em

Capítulo 4. Teoria Fuzzy

jogos de golfe na escolhas de tacos; etc.

Documentos relacionados