• Nenhum resultado encontrado

Tradicionalmente, a incerteza era considerada, por parte da comunidade técnico-científica, indesejável, não havendo interesse no seu estudo (Klir, 2001). Esta realidade sofreu alguma alteração no início do século XX, resultante de vários desenvolvimentos relacionados, por exemplo, com a estatística mecânica e o princípio da incerteza proposto por Heisenberg na mecânica quântica. Contudo, e apesar dos desenvolvimentos ocorridos, pouco mudou durante a primeira metade do século XX. Embora se reconhecesse que a incerteza era relevante em algumas áreas, foi considerado que a única forma de a avaliar era através da teoria das probabilidades.

Segundo Klir (2004) existem, actualmente, duas teorias reconhecidas como teorias clássicas de incerteza, as quais emergiram na primeira metade do século XX, e que foram formalizadas em termos dos conjuntos clássicos. A teoria mais antiga é baseada na noção de possibilidade e, a mais recente, e que se tornou consideravelmente mais visível, é baseada na noção de

probabilidade.

Na segunda metade do século XX, surgiram duas importantes generalizações na Matemática que provocaram uma grande alteração no reconhecimento e estudo da incerteza abrindo novas perspectivas (Klir, 2001). Uma delas foi a generalização da teoria dos conjuntos clássicos para a teoria dos conjuntos fuzzy, introduzidos por Zadeh (1965). A outra foi, segundo Klir (2001), a generalização da teoria das medidas clássicas para a teoria das medidas monótonas, introduzidas por Choquet em 1953.

A teoria dos conjuntos fuzzy, proposta por Zadeh (1965), teve como intuito caracterizar a capacidade do cérebro humano em lidar com situações vagas. Oferece uma alternativa à teoria das probabilidades, no que diz respeito à modelação da incerteza, tendo sido encarada inicialmente como uma concorrente da teoria das probabilidades (Pal e Bezdek, 1994). A motivação de Zadeh (1965) resultou do facto de, muito frequentemente, as classes de objectos existentes no mundo real como, por exemplo, “alto”, “declive elevado” ou conceitos como “Urbano” e “Não urbano”, não apresentarem critérios de pertença definidos com precisão. Na teoria clássica de conjuntos, a pertença de cada objecto ou elemento a um conjunto é apresentada como uma questão de veracidade ou falsidade, não permitindo uma transição gradual entre a pertença e a não pertença. Pelo contrário, na teoria dos conjuntos fuzzy, a pertença de um elemento a um conjunto fuzzy é apresentada como uma questão de grau.

Na teoria clássica de conjuntos, a cada conjunto

F

está associada uma função característica

)

(x

c

, definida no conjunto universal

X

, e que pode apenas tomar os valores zero ou um, sendo:

=

F

x

se

F

x

se

x

c

1

0

)

(

Na teoria dos conjuntos fuzzy é feita uma generalização da função característica, dando origem à chamada função de pertença de um elemento

x

do conjunto universal a um conjunto

F

,

)

(x

F

µ

, que permite associar a cada elemento do conjunto universal

X

graus de pertença a

F

.

Nestas condições, o conjunto

F

é denominado conjunto fuzzy, sendo constituído pelos pares ordenados

(x

F

(x))

e caracterizado pela função de pertença que lhe está associada (Klir e Yuan, 1995). O contradomínio da função de pertença pode ser qualquer um mas, normalmente, por simplicidade e convenção, é considerado o intervalo [0,1] tendo-se:

]

1

,

0

[

:

)

(x

X

→

F

µ

(2.2)

Esta teoria tem sido aplicada com sucesso em áreas como controlo industrial (e.g. Sousa e Bose, 1994; Bonissone et al., 1995; Reznik et al., 2000), classificações de padrões e processamento de imagem (e.g. Ishibuchi et al., 1999; Zhang e Foody, 2001).

Na literatura, são apresentados vários significados para os graus de pertença a um conjunto

fuzzy. Dubois e Prade (1997), por exemplo, apresentam três interpretações para os graus de

pertença: graus de semelhança, graus de preferência e graus de incerteza.

A interpretação de graus de pertença como graus de semelhança significa que

µ

F

(x)

pode ser considerado como o grau de proximidade de

x

aos elementos ideiais de

F

. Esta interpretação baseia-se no conceito de agrupar elementos em conjuntos caracterizados pelas propriedades de um ou vários elementos, considerados ideais, sendo assumido que existe pelo menos um elemento ideal, cujo grau de pertença ao conjunto é 1, ou por propriedades representativas do conjunto. Os graus de pertença dos outros elementos ao conjunto são determinados avaliando a semelhança das suas propriedades com as propriedades do elemento ideal ou as propriedades

do conjunto (Fonte, 2003). Esta interpretação é usada na classificação de padrões, análises de regressão, análise de cluster, entre outras(Dubois e Prade, 1997).

A interpretação de graus de pertença como graus de preferência significa que

F

representa o conjunto dos objectos preferidos, ou valores de decisão de uma variável

u

, e

µ

F

(x)

representa a intensidade da preferência a favor do objecto

x

, ou a viabilidade de seleccionar

x

como um valor de

u

.

A interpretação como graus de incerteza foi proposta por Zadeh (1978) quando introduziu a teoria das possibilidades em termos de conjuntos fuzzy . Segundo esta interpretação,

µ

F

(x)

é o grau de possibilidade de uma variável

u

tomar o valor

x

, dado o incompleto estado de conhecimento “

u

é

F

” (considera-se que o conjunto de valores que a variável

u

pode tomar é representado por um conjunto fuzzy

F

). Esta interpretação tem sido usada em sistemas inteligentes e na inteligência artificial. De notar que a palavra possibilidade, ligada aos conjuntos

fuzzy nesta última interpretação, pode transmitir um significado lógico em que possível significa

“compatível com a informação disponível” ou um significado físico em que possível significa “fácil de alcançar”. Dubois e Prade (1997) consideram que a interpretação de

µ

F

(x)

como um grau de incerteza apenas se refere à interpretação lógica.

A partir dos anos 70 do século XX, foram propostas várias teorias de incerteza, começando a existir um reconhecimento crescente de que o conceito de incerteza é demasiado vasto para ser apenas avaliado pela teoria das probabilidades (Klir, 2001). Entre as várias abordagens existentes para a modelação e tratamento de incerteza encontram-se, por exemplo, a teoria das possibilidades (Zadeh, 1978) e a teoria da evidência Dempster-Shafer (Dempster, 1967; Shafer, 1976). A ideia de medir a incerteza sem recorrer às probabilidades foi proposta por Deluca e Termini (1972). Zadeh (1978) foi quem primeiro reconheceu que a teoria das possibilidades é a ferramenta natural para representar e manipular informação expressa em termos de proposições

fuzzy, tendo iniciado o desenvolvimento da teoria das possibilidades em termos dos conjuntos

fuzzy (Klir e Yuan, 1995).

Na teoria das possibilidades, uma medida de possibilidade

Π

num conjunto

Χ

(e.g. o conjunto dos números reais) é caracterizada pela distribuição de possibilidade

π

:Χ→[0,1]

, sendo definida por (Dubois et al., 2004):

}

),

(

sup{

)

(A

=

x

xA

Π

π

A⊆Χ

(2.3)

Para conjuntos finitos, é definida por:

Π(A)=max{π(x),xA}∀A⊆Χ

(2.4)

e satisfaz os seguintes axiomas,

Π

(Ø)=0 (2.5)

=

Π(A

B)

max (

(Π(A),Π(B))

(2.6)

Na teoria das possibilidades, uma distribuição de possibilidade

π

, associada a uma variável

u

que toma valores

x

no universo

Χ

, representa o que se conhece sobre o valor da variável, sendo associado aos vários elementos de

Χ

um valor no intervalo [0,1].

Quando

π(x)=0

, significa que

u

=x

é impossível, ou seja, que

x

é um valor impossível da variável

u

à qual

π

está associado. Quando

π(x)=1

, apenas significa que

x

é um dos valores mais plausível dessa variável (Dubois et al., 2004). De notar que pode associar-se a diferentes elementos

Χ

um grau de possibilidade igual a 1.

A teoria das possibilidades permite modelar a incerteza de uma forma flexível, captura perfeitamente a ignorância, permitindo que a possibilidade de qualquer evento seja igual a 1 (Dubois et al., 2004).

Pode estabelecer-se uma ligação entre a teoria das possibilidades e a teoria dos conjuntos fuzzy

quando se considera que o conjunto de valores que a variável

u

pode tomar é representado por um conjunto fuzzy

F

, podendo interpretar-se

µ

F

(x)

como o grau de possibilidade da variável

u

tomar o valor

x

, i.e., considerar para todo o

x∈Χ

,

π

u

(x)=µ

F

(x)

. Segundo Dubois e Prade (1993), o facto da distribuição de possibilidade poder ser determinada pela função de pertença de um conjunto fuzzy não significa que os dois conceitos (graus de pertença e distribuição de possibilidade) sejam coincidentes. De notar que

π

u

(x)

estima a possibilidade da variável

u

ser igual a

x

, sabendo o estado incompleto de conhecimento “

u

é

F

” e

µ

F

(x)

estima o grau de compatibilidade da informação

u

=

x

com a afirmação que se pretende avaliar “

u

é

F

”.

Nos últimos anos têm sido demonstradas várias ligações entre as probabilidades, a teoria das possibilidades e a teoria dos conjuntos fuzzy que sugerem que estas teorias são complementares e não antagónicas (Dubois e Prade, 1993). Uma análise comparativa entre a teoria das probabilidades, a teoria das possibilidades e a teoria dos conjuntos fuzzy pode ser encontrada, por exemplo, em Klir e Yuan (1995), Dubois et al. (2000) e Fonte (2003). Neste trabalho não se desenvolve este assunto, sendo apenas referidas algumas diferenças básicas entre as diferentes teorias.

Uma confusão frequente que ocorre entre funções de pertença e medidas de probabilidade deve-se à forma como as definições são entendidas (Dubois e Prade, 1993). Segundo Zadeh (1965) um conjunto fuzzy

F

num universo

Χ

é definido por uma função de pertença, conforme acima exposto, em que

µ

F

(x)

é o grau de pertença do elemento

x

a

F

. Em contraste, uma medida de probabilidade

P

atribui um número

P( A)

a cada subconjunto de U (conjunto finito) e satisfaz os axiomas:

1

)

(U

=

P

;

P

(Ø)=0; (2.7)

Se

AB=

Ø

P(AB)=P(A)+P(B)

(2.8)

em que

P( A)

é a probabilidade de um determinado valor da variável

u

, que toma valores no universo

X

, tomar os valores do conjunto

A

bem conhecido. Uma confusão habitual entre conjuntos fuzzy e probabilidades consiste em confundir

P( A)

com um grau de pertença. Segundo Dubois e Prade (1993), quando se considera um grau de pertença

µ

F

(x)

, o elemento

Χ

x

é fixo e conhecido, não sendo o conjunto

F

bem definido. Pelo contrário, quando se considera

P( A)

, o conjunto A é bem definido, sendo desconhecido o valor da variável

u

, a que a probabilidade está ligada. A função de pertença

µ

F

(x)

tem mais semelhança com uma distribuição de probabilidade

P({x})=

p(x)

, apresentando, no entanto, a diferença de ser

=

X x

x

p(

)

1

, enquanto que

(x)

X x F

µ

pode assumir qualquer valor não negativo (Dubois e Prade, 1993).

Outro ponto que distingue as probabilidades dos graus de pertença dos conjuntos fuzzy é que a teoria das probabilidades é a teoria dos acontecimentos aleatórios, enquanto que a teoria dos conjuntos fuzzy não está relacionada com acontecimentos, mas sim com conceitos não quantificados, como por exemplo, “perigoso”, “ alto” ou “quente”, quantificando-se apenas até

que ponto determinado elemento está de acordo com o conceito em questão (Fonte, 2003).

Uma diferença fundamental entre a teoria das probabilidades e a teoria das possibilidades é que, na primeira, a incerteza de um acontecimento é representada por uma única medida, a medida de probabilidade

P( A)

, a qual apresenta a seguinte propriedade:

1

)

(

)

(A

+P

A

=

P

(2.9)

o que significa que a probabilidade de um acontecimento determina a probabilidade do acontecimento contrário em que

A

é o complementar de

A

.

Na teoria das possibilidades a incerteza de um acontecimento

A

é representada utilizando duas medidas: uma medida de possibilidade,

Π( A)

, que representa o grau de possibilidade de ocorrência de um acontecimento; e uma medida de necessidade

N( A)

, que representa o grau de impossibilidade de ocorrência do acontecimento contrário,

N(A)=1−∏(A)

, i.e., a certeza de

A

reflecte a impossibilidade do seu complementar. Estas medidas apresentam as seguintes propriedades:

1

)

(

)

(

+∏

A

A

(2.10)

1

)

(

)

(A

+N

A

N

(2.11)

Quando existe uma total ignorância acerca de um fenómeno

A

, tem-se

Π(A)=Π(A)=1

(e

)

0

)

(

)

(A

=

N

A

=

N

enquanto

Π(AA)=0

e

N(AA)=1

. Esta capacidade para modelar a ignorância (falta de conhecimento) é uma característica típica da teoria das possibilidades (Dubois e Prade, 1993; Dubois et al., 2004).

Outra diferença fundamental entre as duas teorias é o facto do axioma da aditividade da teoria das probabilidades:

)

(

)

(

)

(A

B

P

A

P

B

P

=

+

(2.12)

para todos os conjuntos

A

e

B

tais que

AB=

Ø, ser substituído, na teoria das

)}

(

),

(

sup{

)

(AB

=

Π

A

Π

B

Π

(2.13)

o qual é um axioma menos exigente (Klir e Yuan, 1995).

As teorias das probabilidades e das possibilidades têm papéis distintos ao descrever a incerteza. Há fenómenos que podem ser representados pela teoria das probabilidades e não o podem ser pela teoria das possibilidades, sendo igualmente verdade o inverso (e.g. uma distribuição de probabilidade não expressa ignorância e uma distribuição de possibilidade não expressa fenómenos aleatórios) (Dubois e Prade, 1993). Segundo Dubois et al. (2004), a teoria das probabilidades disponibiliza um modelo quantitativo para modelar fenómenos aleatórios

(randomness) e indecisão (indecisiveness); ao passo que a teoria das possibilidades disponibiliza

um modelo qualitativo para modelar conhecimento incompleto (Dubois et al., 2004). O facto de a teoria das possibilidades e da teoria das probabilidades modelarem diferentes facetas da incerteza leva a que sejam consideradas, por vários autores (e.g. Klir, 2001; Dubois et al., 2004), como teorias complementares da incerteza.