CAMPINAS
Instituto de Matemática, Estatística e
Computação Científica
RICARDO AUGUSTO WATANABE
Um Estudo sobre um Método de Defuzzificação
para Eventos Fuzzy em Sistemas Baseados em
Regras
Campinas
2016
Um Estudo sobre um Método de Defuzzificação para
Eventos Fuzzy em Sistemas Baseados em Regras
Dissertação apresentada ao Instituto de Mate-mática, Estatística e Computação Científica da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Matemática Aplicada.
Orientador: Estevão Esmi Laureano
Coorientador: Laécio Carvalho de Barros
Este exemplar corresponde à versão
final da Dissertação defendida pela
aluna Ricardo Augusto Watanabe e
orientada pelo Prof. Dr. Estevão Esmi
Laureano.
Campinas
2016
Ficha catalográfica
Universidade Estadual de Campinas
Biblioteca do Instituto de Matemática, Estatística e Computação Científica Ana Regina Machado - CRB 8/5467
Watanabe, Ricardo Augusto,
W29e WatUm estudo sobre um método de defuzzificação para eventos fuzzy em sistemas baseados em regras / Ricardo Augusto Watanabe. – Campinas, SP : [s.n.], 2016.
WatOrientador: Estevão Esmi Laureano. WatCoorientador: Laécio Carvalho de Barros.
WatDissertação (mestrado) – Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica.
Wat1. Sistemas fuzzy. 2. Lógica fuzzy. 3. Biomatemática. I. Esmi,
Estevão,1982-. II. Barros, Laécio Carvalho de,1954-. III. Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica. IV. Título.
Informações para Biblioteca Digital
Título em outro idioma: Study on the defuzzification method for fuzzy events in rule-based systems
Palavras-chave em inglês: Fuzzy systems
Fuzzy logic Biomathematics
Área de concentração: Matemática Aplicada Titulação: Mestre em Matemática Aplicada Banca examinadora:
Estevão Esmi Laureano [Orientador] Magda da Silva Peixoto
Marcos Eduardo Ribeiro do Valle Mesquita Data de defesa: 25-02-2016
e esposa
Agradeço à minha família. Agradeço à minha mãe, Edina Aparecida Pinto, pelo incentivo desde criança e por ter me educado para ser o homem que sou hoje. Agradeço à esposa, Cibele Cristina Trinca, pelo amor, apoio, carinho e paciência.
Agradeço aos Professores Estevão Esmi Laureano e Laécio Carvalho de Barros pelo incentivo, dedicação e tempo investido. Aprendi muitas lições tanto em matemática quanto para a vida.
Agradeço aos Professores Aurélio, Jhonny, Marcos, Peter, Jayme, Samuel e a tantos outros professores que ajudaram a minha formação. Agradeço aos funcionários do IMECC. Com particular reconhecimento ao delicioso café da dona Zefa.
Agradeço ao convívio com os amigos, parceiros e colegas do MILAB.
Também devo agradecer ao CNPq, Capes e Fapesp, e ainda a todas agências de fomento do Brasil pelo incentivo à ciência.
Este trabalho trata de sistemas baseados em regras fuzzy (SBRF) cujos antecedentes e os consequentes são eventos fuzzy, isto é, subconjuntos fuzzy de um espaço amostral. Devido à incorporação de aspectos probabilísticos, cada um dos módulos, fuzzificação, inferência e defuzzificação, com ênfase principalmente neste último, de um SBRF foram estudados. Neste contexto, os métodos de inferência do tipo Mamdani produzem eventos fuzzy como saídas. Com o objetivo de obter um número real na saída geral do SBRF, foram adotados defuzzificadores que consideram a distribuição de probabilidades dos universos envolvidos. Tal abordagem surge naturalmente na modelagem de fenômenos em que informações específicas, observadas em uma certa população, são agregadas ao SBRF, que por sua vez traduz o conhecimento fenomenológico do especialista. Aplicamos tal metodologia para estudar a evolução da doença de Chagas em uma população especifica. Também discutimos essa abordagem em problemas de valor inicial (PVI) cujo campo de direções é dado por um SBRF.
This work considers systems based on fuzzy rules (SBRF) whose antecedents and consequent are fuzzy events, that is, fuzzy subsets of a sample space. Due to probabilistic aspects, each of the modules, fuzzification, inference and, with particular emphasis, defuzzification, of a SBFR were studied. In this context , methods of Mamdani inference produce fuzzy events as outputs. In order to get a real number in the overall output of SBFR, it was adopted a defuzzification method which considers the probability distribution of the universes involved. Such an approach comes naturally in modeling phenomena where specific information, observed in a certain population are aggregated to SBRF, which in turn translates the phenomenological knowledge of the expert. We apply this methodology to study the evolution of Chagas disease in a specific population. We also discussed this approach in initial value problems (IVP) whose direction field is given by a SBRF .
Figura 1 – Arquitetura do Sistema Baseado em Regras Fuzzy (BARROS; BASSA-NEZI, 2010). . . 32 Figura 2 – Arquitetura de um SBRF do tipo Mamdani com defuzificador fuzzy
para evento fuzzy com função de densidade de probabilidade pZ. . . 60
Figura 3 – Superfície da função Λp�, υq obtida pelas regras R1 com defuzzificador COG . . . 64 Figura 4 – Superfície da função Λp�, υq obtida pelas regras R2 com defuzzificador
COG . . . 65 Figura 5 – Gráfico Λp�, υq obtida pelas regras R3 com defuzzificador COG. . . 66 Figura 6 – Saída Λ “ 0, 667 produzida por um SBRF do tipo Mandami com as
regras R3 e defuzzificador COG para IL ´ 10 “ 0, 249 e IFN ´ γ “ 0, 2. 67 Figura 7 – Saída Λ “ 0, 153 produzida por um SBRF do tipo Mandami com as
regras R3 e defuzzificador COG para IL´10 “ 0, 588 e IFN ´γ “ 0, 0399. 67 Figura 8 – Saída Λ “ 0, 668 produzida por um SBRF do tipo Mandami com as
regras R3 e defuzzificador COG para IL´10 “ 0, 249 e IFN ´γ “ 0, 205. 68 Figura 9 – Saída do sistema SISO do tipo Mandami com defuzzificador COG para
entrada IL ´ 10 “ 0.512. . . . 68 Figura 10 – Saída do sistema SISO do tipo Mandami com defuzzificador COG para
entrada IL ´ 10 “ 0.499. . . . 68 Figura 11 – Saída do sistema SISO do tipo Mandami com defuzzificador COG para
entrada IL ´ 10 “ 0.192. . . . 69 Figura 12 – Saída do sistema SISO do tipo Mandami com defuzzificador para eventos
fuzzy com distribuição Beta para entrada IL ´ 10 “ 0.512. . . . 69 Figura 13 – Saída do sistema SISO do tipo Mandami com defuzzificador para eventos
fuzzy com distribuição Beta para entrada IL ´ 10 “ 0.499. . . . 69 Figura 14 – Saída do sistema SISO do tipo Mandami com defuzzificador para eventos
fuzzy com distribuição Beta para entrada IL ´ 10 “ 0.192. . . . 70 Figura 15 – Distribuição Beta com α “ 2, β “ 8 . . . 71 Figura 16 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
baseado em eventos fuzzy com ditribuição Beta α “ 2 e β “ 8. . . . 71 Figura 17 – Distribuição Beta com α “ 8, β “ 2 . . . 72 Figura 18 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
baseado em eventos fuzzy com ditribuição Beta α “ 8 e β “ 2. . . . 72 Figura 19 – Distribuição Beta com α “ 3, β “ 9. . . . 73 Figura 20 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
baseado em eventos fuzzy com ditribuição Beta α “ 126 e β “ 876. . . 74 Figura 23 – Distribuição Exponencial com λ “ 0.5 . . . 74 Figura 24 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
para eventos fuzzy com ditribuição Exponêncial λ “ 0, 5. . . . 74 Figura 25 – Distribuição Exponencial com λ “ 1 . . . 75 Figura 26 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
para eventos fuzzy com ditribuição Exponêncial λ “ 1. . . . 75 Figura 27 – Distribuição Exponencial com λ “ 5 . . . 75 Figura 28 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
para eventos fuzzy com ditribuição Exponêncial λ “ 5. . . . 76 Figura 29 – Distribuição Exponencial com λ “ 10 . . . 76 Figura 30 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
para eventos fuzzy com ditribuição Exponêncial λ “ 10. . . . 76 Figura 31 – Distribuição Exponencial com λ “ 100 . . . 77 Figura 32 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
para eventos fuzzy com ditribuição Exponêncial λ “ 100. . . . 77 Figura 33 – Distribuição Exponencial com λ “ 1000 . . . 77 Figura 34 – Gráfico de Λp�, υq produzido pela Eq. (4.8) com base R2 e defuzzificador
Tabela 1 – Comparação entre Defuzzificadores . . . 45
Tabela 2 – Caracterização da forma cardíaca pela dilatação e quantidade de pacientes 58 Tabela 3 – Frequência de indivíduos produtores de citosinas por grupo. . . 58
Tabela 4 – Intervalos que definem a produção de IL ´ 10 e IFN-γ. . . . 63
Tabela 5 – Funções de Pertinência usadas em (SILVA, 2015) . . . 63
COG Centróide ("Center of Gravity") FC1 Forma Cardíaca com dilatação FC2 Forma Cardíaca sem dilatação
FI Forma Indeterminada
FOM Primeiro dos Máximos ("First of Maxima")
ICOG Centro de Massa Indexado ("Indexed Center of Gravity") IFN-γ Interferão-gama
IL-10 Interleucina 10
LOM Último dos Máximos ("Last of Maxima") MeON Média de Máximos ("Mean of Maxima")
MIMO Múltiplas entradas e múltiplas saídas ("Multiple Inputs, Multiple Out-puts")
MISO Múltiplas entradas e uma saída ("Multiple Inputs, Single Output") MOM Média dos Máximos ("Middle of Maxima")
SBRF Sistemas Baseados em Regras Fuzzy
SISO Uma entrada e uma saída ("Single Input, Single Output") SLIDE Defuzzificador Semi-Linear ("Semi-Linear Defuzzification")
Introdução . . . 17
1 CONCEITOS BÁSICOS NA TEORIA DE CONJUNTOS E EVEN-TOS FUZZY . . . 19 1.1 Conjunto Fuzzy . . . 19 1.2 Conectores Lógicos . . . 19 1.2.1 Conjunção e t-norma . . . 20 1.2.2 Disjunção e t-conorma . . . 20 1.2.3 Negação Fuzzy . . . 21 1.2.4 Implicação Fuzzy . . . 22
1.3 α-níveis de Conjuntos Fuzzy . . . 22
1.4 Número Fuzzy . . . 24
1.4.1 Exemplos de Números Fuzzy . . . 24
1.4.1.1 Número Real . . . 24
1.4.1.2 Intervalo Real . . . 24
1.4.1.3 Número Fuzzy Triangular . . . 24
1.4.1.4 Número Fuzzy Trapezoidal . . . 25
1.4.1.5 Número Fuzzy Gaussiano . . . 25
1.5 Relações Fuzzy . . . 25
1.5.1 Composição de Relações Fuzzy . . . 26
1.6 Noções Básicas de Probabilidade . . . 26
1.6.1 Eventos Fuzzy . . . 29
2 SISTEMAS BASEADOS EM REGRAS FUZZY. . . 31
2.1 Introdução . . . 31
2.2 Sistemas Baseados em Regras Fuzzy: Arquitetura . . . 31
2.3 Módulo de Fuzzificação . . . 32
2.4 Módulo de inferência: . . . 33
2.4.1 Base de Regras Fuzzy . . . 33
2.4.2 Método de Inferência . . . 34 2.5 Módulo de Defuzzificação: . . . 36 2.5.1 Propriedades do Defuzzificador . . . 37 2.5.1.1 Seleção Nuclear . . . 37 2.5.1.2 Escalas Invariantes . . . 37 2.5.1.3 Monotocidade . . . 38 2.5.1.4 Critério de t-conormas . . . 38
2.5.2.2 Escalonamento-x: . . . 39
2.5.3 Exemplos de Defuzzificadores. . . 39
2.5.3.1 FOM, LOM e MOM . . . 39
2.5.3.2 Centróide (ou Centro de Massa) . . . 41
2.5.3.3 Variações do Defuzzificador Centróide. . . 41
2.5.3.4 Centro da Área . . . 43
2.5.4 Comparação entre os defuzzificadores . . . 44
2.6 Defuzzificador Para Eventos Fuzzy . . . 44
2.6.1 Correspondência entre Defuzificadores . . . 46
2.6.1.1 DEF corresponde a COG. . . 46
2.6.1.2 DEF corresponde a MeOM . . . 46
2.6.1.3 DEF corresponde a ICOG . . . 47
2.6.1.4 DEF corresponde a SLIDE . . . 47
2.7 Aproximação de funções contínuas via SBRF. . . . 48
3 SISTEMAS P-FUZZY . . . 51
3.1 Introdução . . . 51
3.2 Sistemas Parcialmente Fuzzy . . . 51
3.3 Sistemas Baseados em Regras fuzzy como campo de direções . . . 52
3.4 Teoremas sobre Sistemas P-Fuzzy . . . 53
3.5 Método de Euler para sistemas p-Fuzzy. . . 54
3.6 Novo método para aproximar soluções de sistemas p-Fuzzy . . . 55
4 SISTEMA BASEADO EM REGRAS FUZZY COM EVENTOS FUZZY E SIMULAÇÕES . . . 57
4.1 Introdução . . . 57
4.2 Modelagem sobre a Evolução da Doença de Chagas . . . 57
4.2.1 Dados e Modelagem . . . 58
4.3 Metodologia para Obter Λ . . . 60
4.4 Base de Regras Presente em (SILVA, 2015) . . . 63
4.5 Base de Regras Proposta . . . 65
4.5.1 Defuzzificador para Eventos Fuzzy no caso SISO . . . 66
4.6 Simulação . . . 70
4.6.1 PARTE A: Distribuição Beta . . . 71
4.6.2 PARTE B: Distribuição Exponencial . . . 73
4.7 Discussão . . . 76
APÊNDICES
83
Introdução
De maneira concisa, a modelagem matemática de fenômenos descrita por funcionais considera alguns parâmetros, os quais se referem à situações específicas do estudo. Via de regra, tais parâmetros são “ajustados” a partir de amostras da população em questão. A motivação para nosso estudo considera esse procedimento em que o funcional é dado por um sistema baseado em regras fuzzy. Assim, como veremos, não temos uma fórmula explícita para o funcional nem da influência do parâmetro. Conforme apresentaremos adiante (Capítulo 4), ficará claro na nossa metodologia que o funcional, descrito por uma base de regras fuzzy, “captura” o conhecimento do especialista a respeito do fenômeno em questão. Por outro lado, a população especificamente estudada ajusta a base de regras fuzzy e fornece “pesos” para a saída do sistema. Tais pesos é que dá origem ao que chamamos de eventos fuzzy.
Em 2015 celebrou-se meio século do marco inicial da Teoria de conjuntos fuzzy feito por Lotfi Zadeh (ZADEH, 1965). No mesmo ano celebrou-se 40 anos do trabalho de Mandani e Assilian (MAMDANI; ASSILIAN, 1975) voltado para aplicação de variáveis linguísticas modeladas por conjuntos fuzzy em teoria de controle. Tais sistemas de controle são conhecidos atualmente como Sistemas Baseados em Regras Fuzzy (SBRF). Devido a aplicabilidade em diversas áreas da ciência e setores industriais, flexibilidade de atuação e funcionabilidade, sistemas baseados em regras fuzzy vêm se consolidando na matemática e tecnologia. No presente trabalho apresentaremos algumas noções básicas sobre sistemas baseados em regras fuzzy.
Em geral, SBRF são compostos por 3 módulos distintos: Módulo de Fuzzificação, Módulo de Inferência (que é subdividido em dois submódulos: Base de Regras e Método de Inferência) e Módulo de Defuzzificação. As principais características de cada módulo serão estudadas. Enfatizaremos o estudo de propriedades matemáticas interessantes de alguns dos defuzzificadores mais empregados na literatura.
Embora a teoria de controle lide com alguns aspectos de natureza determinísticos (GUERRA A. SALA, 2015), devido a avanços em áreas como processos estocásticos e sistemas dinâmicos, uma das tendências proeminentes é a aplicação de teoria de controle envolvendo características incertas. Neste contexto, Lotfi Zadeh introduz em (ZADEH, 1968) a noção de eventos cujo reconhecimento é apenas parcial, os chamados eventos fuzzy. De porte de tal análise, visamos contrapor abordagens distintas, porém não exclusivas, no tratamento de modelagem de incerteza: uma estabelicida na Teoria de Probabilidade e baseada na ocorrência de eventos, e a outra estabelecida na Teoria da Lógica Fuzzy e baseada na indentificação de eventos. Assim, propomos um defuzzificador
baseado no cálculo do valor médio de um evento fuzzy de uma variável aleatória, sendo capaz de associar dados estatísticos ao conhecimento parcial do especialista. Como veremos adiante, tal defuzzificador generaliza, ainda que de forma implícita, outros defuzzificadores presentes na literatura.
Aplicaremos o defuzzificador baseado em eventos fuzzy em um modelo relativo a temática da evolução da população contaminada com a doença de Chagas. Estudaremos a evolução da doença em sua fase aguda, através da análise da produção das citocinas do tipo IL-10 e IF N ´ γ dos indivíduos infectados. Tais citosinas estão relacionadas à evolução da população de pacientes em estágio assintomáticos para o estágio sintomático (SILVA, 2015). Simulamos a taxa de transição da doença, que é associada a uma densidade de probabilidade. Com isto, comparamos estudos prévios da literatura que modelam a evolução da doença de Chagas por SBRF com a metodologia proposta no presente trabalho da qual se utiliza de um defuzzificador capaz de associar informações do especialista com informações estatísticas. A classificação do estágio inicial da doença de Chagas através de SBRF pode, no futuro, auxiliar o diagnóstico prévio do paciente uma vez que diversos sintomas moderados não são exclusivos da doença de Chagas.
1 Conceitos Básicos na Teoria de Conjuntos
e Eventos Fuzzy
Em 1965, Lotfi A. Zadeh estendeu a noção clássica de um conjunto, também referido como um conjunto crisp, introduzindo conjuntos fuzzy (ZADEH, 1965). Este capítulo visa fixar algumas definições, notações e teoremas básicos da teoria de conjuntos fuzzy.
1.1 Conjunto Fuzzy
Seja U, denominado como universo de discurso, um conjunto não vazio, um subconjunto A de U pode ser associado biunivocamente a uma função χA : U Ñ t0, 1u,
chamada de função característica de A, dada por:
χApxq “
#
1 , x P A, 0 , x R A,
onde o valor χApxq indica a pertinência de x em A. Nesse caso, dizemos que A é um
(sub)conjunto crisp de U.
Definição 1.1. Seja U um conjunto não vazio. Um (sub)conjunto fuzzy A de U é
carac-terizado por uma função de pertinência
ϕA: U Ñ r0, 1s (1.1)
onde o valor ϕApxq P r0, 1s denota a pertinência de x P U ao conjunto fuzzy A.
Denotaremos por FpUq a coleção de todos os conjuntos fuzzy do universo U. Por simplicidade, alternativamente, denotaremos ϕApxq por Apxq para A P FpUq.
Note que a noção de conjuntos fuzzy estende a noção de conjuntos crisp de U. Sejam A, B P FpUq, a intersecção e a união de A e B são os conjuntos fuzzy AXB P FpUq e A Y B P FpUq dados, respectivamente, por
AX Bpxq “ mintApxq, Bpxqu e A Y Bpxq “ maxtApxq, Bpxqu @x P X.
1.2 Conectores Lógicos
Esta seção visa definir os principais conectivos lógicos fuzzy da literatura (BARROS; BASSANEZI,2010;BEDE, 2012;KLIR; YUAN,1995; PEDRYCZ; GOMIDE,
2007). Os conectores fuzzy de conjunção, disjunção, negação e implicação consistem de extensões da álgebra booleana para o domínio fuzzy.
1.2.1 Conjunção e t-norma
Definição 1.2. Uma conjunção fuzzy CF é uma função CF : r0, 1s ˆ r0, 1s Ñ r0, 1s monótona crescente em ambos os argumentos tal que
1. CFp0, 0q “ CFp1, 0q “ CFp0, 1q “ 0 2. CFp1, 1q “ 1
Definição 1.3. Uma t-norma é uma conjunção fuzzy � : r0, 1s ˆ r0, 1s Ñ r0, 1s que
satisfaz as seguintes propriedades:
1) (elemento neutro): �p1, xq ” 1�x “ x;
2) (comutativa): �px, yq ” x�y “ y�x ” �py, xq
3) (associativa):�px, �py, zqq ” x�py�zq “ px�yq�z ” �p�px, yq, zq
O conectivo lógico e pode ser modelado por t-normas. • Exemplos:
1. t-norma do mínimo: �Mpx, yq “ x ^ y;
2. t-nomra do produto: �Ppx, yq “ x.y;
3. t-norma de Lukasiewicz: �Lpx, yq “ 0 _ x ` y ´ 1. 4. t-norma drástica: �Dpx, yq “ $ ’ & ’ % x se y “ 1 y se x “ 1 0 caso contrário.
1.2.2 Disjunção e t-conorma
Definição 1.4. Uma disjunção fuzzy DF é uma função DF : r0, 1s ˆ r0, 1s Ñ r0, 1s monótona crescente em ambos os argumentos tal que
1. DFp1, 1q “ DFp1, 0q “ DFp0, 1q “ 1 2. DFp0, 0q “ 0
Definição 1.5. Uma t-conorma é uma disjunção fuzzy � : r0, 1s ˆ r0, 1s Ñ r0, 1s que
satisfaz as seguintes propriedades:
1) (elemento neutro): �p0, xq ” 0�x “ x;
3) (associativa):�px, �py, zqq ” x�py�zq “ px�yq�z ” �p�px, yq, zq;
O conectivo lógico ou pode ser modelado por t-conormas. • Exemplos:
1. t-conorma do máximo: �Mpx, yq “ x _ y
2. t-conorma da soma probabilística: �Ppx, yq “ x ` y ´ xy
3. t-conorma de Lukasiewicz: �px, yq “ x ` y ^ 1 4. t-conorma drástica: �Dpx, yq “ $ ’ & ’ % x se y “ 0 y se x “ 0 1 caso contrário.
Adotaremos a seguinte convenção: nos referiremos a t-normas do mínimo e t-conormas do máximo utilizamos, respectivamente, os símbolos ^ e _; alternativamente, quando conviniente, utilizaremos "inf"e "sup".
1.2.3 Negação Fuzzy
Definição 1.6. Uma negação fuzzy η é uma função η : r0, 1s Ñ r0, 1s que satisfaz as
seguintes propriedades:
1) (fronteira): ηp0q “ 1 e ηp1q “ 0 2) (monotocidade): η é decrescente
Definição 1.7. Uma negação fuzzy é dita forte se é involutiva:
ηpηpaqq “ a, @a P r0, 1s
O conectivo lógico não pode ser modelado pela negação fuzzy. • Exemplos:
1. Negação padrão: ηpxq “ 1 ´ x (negação fuzzy forte); 2. Negação de Sugeno: ηλpxq “ 1 ´ x
1 ` λx, λ P p´1, `8q • Observaçãos:
1. É possível relacionar t-normas, t-conormas e negação através da lei de De Morgan (BARROS; BASSANEZI, 2010).
1.2.4 Implicação Fuzzy
Definição 1.8. Uma implicação fuzzy I é uma função I : r0, 1s ˆ r0, 1s Ñ r0, 1s que
satisfaz as seguintes propriedades:
1. Ip0, 0q “ Ip0, 1q “ Ip1, 1q “ 1 e Ip1, 0q “ 0;
2. é decrescente no primeiro argumento: se 1 ě a ě b ě 0, Ipa, xq ď Ipb, xq, @x P r0, 1s; 3. é crescente no segundo argumento: se 1 ě a ě b ě 0, Ipx, aq ě Ipx, bq, @x P r0, 1s
O conectivo lógico então pode ser modelado pela implicação fuzzy.
• Observação: É possível utilizar t-normas para produzir certos tipos de implicações
fuzzy conhecidas como residuais (também encontra-se na literatura a denominação R-implicação) (consulte (BARROS; BASSANEZI, 2010)).
• Exemplos: 1. Implicação de Gödel: IMpx, yq “ # 1, x ď y, y, xą y 2. Implicação de Goguen: IPpx, yq “ # 1, x ď y, y x, xą y 3. Implicação de Lukasiewicz: ILpx, yq “ 1 ^ py ´ x ` 1q.
Obviamente as funções definidas acima reproduzem as respectivas tabelas verdades da lógica clássica.
1.3 α-níveis de Conjuntos Fuzzy
Definição 1.9. Dado A P FpUq, o suporte de A é dado por:
SupppAq “ tu P U : Apuq ą 0u
Isto é, SupppAq é o conjunto de todos os elementos que possuem um certo grau (não-nulo) de pertinência em A.
Definição 1.10. Sejam U um espaço topológico não vazio e A P FpUq um conjunto fuzzy
de U, o α-nível de A, denotado pelo símbolo rAsα, é dado por:
rAsα “ tu P U : Apuq ě αu, α P p0, 1s (1.2)
rAs0 “ SupppAq (1.3)
• Observação:
1. U ser espaço topológico garante a existência de SupppAq.
2. Note que o conjunto tu P U : Apuq ě 0u não necessariamente equivale a definição rAs0, vide (BARROS; BASSANEZI, 2010);
Teorema 1.1. Seja A P FpUq. Se 0 ď α ď β ď 1 então rAsβ Ď rAsα.
Demonstração. Vide (KLIR; YUAN, 1995).
Teorema 1.2. Sejam A, B P FpUq. Uma condição necessária e suficiente para que A=B
é que rAsα
“ rBsα, @α P r0, 1s.
Demonstração. Vide (BARROS; BASSANEZI, 2010).
Teorema 1.3. Sejam A, B P FpUq. Se A Ď B, então rAsα Ď rBsα,@α P r0, 1s.
Demonstração. Vide (BARROS; BASSANEZI, 2010).
Teorema 1.4. Teorema de Representação de Negoita-Ralescu
Sejam Aα, αP r0, 1s, uma família de subconjuntos crisp de U de modo que se
verifiquem: i) ďAα Ă A0 com α P r0, 1s ii) Aα Ă Aβ se β ď α iii) Aα “ č kě0
Aak se ak convergir para α com αkď α
Nessas condições, existe um único conjunto fuzzy A P FpUq cujos α-níveis são exatamente os subconjuntos clássicos Aα, ou seja, rAsα “ Aα para todo α P r0, 1s.
Demonstração. Vide (KLIR; YUAN, 1995).
Definição 1.11. Dado A P FpUq, a altura de A (do inglês "height") é dada por:
hpAq “ sup
uPU Apuq
Definição 1.12. Dizemos que um conjunto fuzzy é normal se Du P Utal queApuq “ 1.
Neste caso, obviamente, temos que hpAq “ 1.
Definição 1.13. Dado A P FpUq, o Cerne de A (do inglês "core") é dado por:
CernepAq “ tu P U : Apuq “ 1u
Isto é, é o conjunto formado por todos os elementos de U cuja pertinência à A é 1. Por fim, note que CernepAq “ rAs1 e que CernepAq Ď SupppAq.
1.4 Número Fuzzy
Definição 1.14 ((BARROS; BASSANEZI, 2010)). Um subconjutno fuzzy A é chamado
de número fuzzy quando o conjunto universo no qual a função de pertinência de A está definida, é o conjunto dos números reais R e satisfaz as condições:
• Todos os α-níveis de A são não vazios, com 0 ď α ď 1; • todos os α-níveis de A são intervalos fechados de R; • supp A = tx P A : Apxq ą 0u.
1.4.1 Exemplos de Números Fuzzy
Alguns exemplos de números fuzzy são: 1.4.1.1 Número Real
Qualquer número real a P R é um número fuzzy cuja função de pertinência é dada por sua função característica:
χapxq “
#
1 , x “ a
0 , x ‰ a. (1.4)
Por abuso de notação denotaremos a P FpRq. 1.4.1.2 Intervalo Real
Números fuzzy também generalizam o intervalo unidimensional fechado (BEDE, 2012). De fato, o intervalo ra, bs Ď R com a ď b pode se identificado com o conjunto fuzzy cuja função de pertinência é dada por sua função característica:
χra,bspxq “
#
1 , x P ra, bs
0 , x R ra, bs (1.5)
Desse modo, temos que I Ă FpRq, onde I denota o conjunto de todos intervalos reais fechados.
1.4.1.3 Número Fuzzy Triangular
Definição 1.15. Um número fuzzy A é dito triangular se sua função de pertinência é
da seguinte forma: Apxq “ $ ’ ’ ’ & ’ ’ ’ % x´ a u´ a , xP pa, us x´ b u´ b , xP pu, bs 0 caso contrário (1.6)
A notação para o número fuzzy triangular A empregada será: pa; u; bq. Os α-níveis do o número fuzzy triangular são:
raα
1, aα2s “ rpu ´ aqα ` a, pu ´ bqα ` bs @α P r0, 1s.
1.4.1.4 Número Fuzzy Trapezoidal
Definição 1.16. Um número fuzzy A é dito trapezoidal se sua função de pertinência é
da seguinte forma: Apxq “ $ ’ ’ ’ ’ ’ ’ & ’ ’ ’ ’ ’ ’ % x´ a b´ a , xP ra, bq 1 , xP rb, cs d´ x d´ c , xP pc, ds 0 caso contrário (1.7)
A notação para o número fuzzy trapezoidal A empregada será: pa; b : c; dq. Os α-níveis do o número fuzzy trapezoidais são:
raα
1, aα2s “ rpb ´ aqα ` a, pc ´ dqα ` ds @α P r0, 1s.
1.4.1.5 Número Fuzzy Gaussiano
Definição 1.17. Um número fuzzy A é dito gaussiano se sua função de pertinência é
da seguinte forma: Apxq “ $ & % expˆ´´x´ u a ¯2˙ xP ru ´ δ, u ` δs 0 caso contrário (1.8)
Os α-níveis do número fuzzy gaussiano são:
raα 1, aα2s “ $ ’ ’ & ’ ’ % « u´ d lnˆ 1 αa2 ˙ , u` d lnˆ 1 αa2 ˙ff , αě α “ exp´pδaq2 ru ´ δ, u ` δs , αă α “ exp´pδaq2
1.5 Relações Fuzzy
Definição 1.18. Sejam U1, . . . , Un universos arbitrários. Uma relação (crisp) R é qualquer
Relações podem ser caracterizadas pela função característica uma vez que nada mais são do que subconjuntos crisp:
χR : U1ˆ U2 ˆ . . . ˆ Un Ñ t0, 1u
χRpx1, x2, . . . , xnq “
#
1 se px1, x2, . . . , xnq P R
0 se px1, x2, . . . , xnq R R
Tal conceito pode ser estendido de maneira natural para o caso fuzzy como se segue.
Definição 1.19. Sejam U1, . . ., Un universos arbitrários, uma relação fuzzy R é qualquer
subconjunto fuzzy de U1ˆ U2ˆ . . . ˆ Un.
Seja R uma relação fuzzy, o valor ϕRpx1, x2, . . . , xnq pode ser interpretado
como o grau de relacionamento entre x1, x2, . . . , xn (BEDE,2012).
1.5.1 Composição de Relações Fuzzy
Definição 1.20. Seja Ai subconjunto fuzzy de Ui para i “ 1, . . . , n. Definimos o produto
cartesiano fuzzy como sendo a relação fuzzy A1ˆ . . . ˆ An cuja função de pertinência é
dada por:
A1ˆ . . . ˆ Anpx1, . . . , xnq “ A1px1q ^ . . . ^ Anpxnq
Definição 1.21. Seja � uma t-norma, a composição sup-T de R P FpX ˆ Y q e S P
FpY ˆ Zq é a relação fuzzy R ˝�SP FpX ˆ Zq cuja função de pertinência é dada por: R˝�Spx, zq “ł
yPY
�´Rpx, yq , Spy, zq¯@px, zq P X ˆ Z. (1.9) Similarmente, a composição sup-T de R P FpX ˆ Y q e S P FpY q é o conjunto fuzzy R˝�S P FpXq cuja função de pertinência é dada por:
R˝�Spxq “ł
yPY
�´Rpx, yq , Spyq¯@x P X. (1.10)
No caso em particular onde a t-norma considerada acima é a t-norma do mínimo, utilizamos o símbolo R ˝ S ao invés de R ˝^S.
1.6 Noções Básicas de Probabilidade
Definição 1.22. Seja Ω um conjunto não vazio, uma família A de subconjuntos de Ω é
1. ∅ P A 2. A P A ñ A1 “ ΩzA P A 3. A1, A2, . . . , Ai, . . . P A ñ ď iPN Ai P A
Como consequência dos axiomas da σ-álgebra: 1. Ω P A
2. A1, A2, . . . , Ai, . . . P A ñ
č
iPN
Ai P A.
• Exemplo: O conjunto das partes de Ω, denotado por PpΩq, i.e, o conjunto de todos os subconjuntos de Ω, PpΩq “ tA : A Ă Ωu é uma σ-álgebra.
Definição 1.23. Uma função P : A Ñ r0, 1s é uma medida de probabilidade em A
se satisfazer os axiomas: 1. @A P A ñ 0 ď PpAq ď 1; 2. P pΩq “ 1 ; 3. Se A1, A2, . . . , Ai, . . . P A e AiX Aj “ ∅, i ‰ j, então P ˜ ď iPN Ai ¸ “ÿ iPN PpAiq
O último axioma é conhecido como σ-aditividade.
Definição 1.24. A terna (Ω, P, A) é denominada espaço de probabilidade.
• Observações: Como consequência direta dos axiomas acima segue que:
1. P p∅q “ 0; isso porque Ω “ ΩY∅ e ∅ “ ΩX∅ . Daí, segue que PpΩq “ PpΩq`Pp∅q; 2. Se A Ď B então PpAq ď PpBq (monotonicidade);
3. @A P A, PpA1q “ 1 ´ P pAq (complementar), onde A1 é o complementar de A;
4. @A, B P A, PpA Y Bq “ PpAq ` PpBq ´ PpA X Bq (aditividade); Uma medida de probabilidade P deve ser contínua:
Teorema 1.5. Uma medida de probabilidade P em uma σ-álgebra satisfaz:
1. Se A1 Ď A2 Ď . . . Ď Ai Ď . . . então P pŤiPNAiq “ lim
2. Se A1 Ě A2 Ě . . . Ě Ai Ě . . . então P pŞiPNAiq “ lim
iÑ8PpAiq. Demonstração. Vide (SAHOO, 2003)
Definição 1.25. Dado um espaço de probabilidade (Ω, P, A), uma variável aleatória
(v.a.) é uma função X : Ω Ñ R tal que para cada intervalo I de R tem-se tω P Ω | Xpωq P Iu P A.
Nota-se que se X é uma variável aleatória e g é uma função de R para R, então a composição de g e X é também uma variável aleatória, denotada pelo símbolo gpXq, sob o mesmo espaço de probabilidade.
Definição 1.26. O conjunto RX “ tx P R|Xpωq “ x, ω P Ωu é denominado espaço da
variável aleatória X.
Uma variável aleatória X pode ser caracterizada por sua função distribuição acumulada F : R Ñ r0, 1s dada para todo x P R por:
Fpxq “ P pX ď xq “ P ptω P Ω | Xpωq ď xuq.
Definição 1.27. Seja X uma variável aleatória, se RX é contável, então X é dita
va-riável aleatória discreta. Agora, se a respectiva função de distribuição acumulada F é
diferenciável em R, então X é dita contínua.
Além da função de distribuição acumulada também podemos associar à X uma outra função denominada de densidade de probabilidade (f.d.p.) como se segue.
Definição 1.28. Seja X uma variável aleatória. Se X é discreta, então definimos a função densidade de probabilidade de X como sendo a função f : R Ñ R dada por
fpxq “ P pX “ xq “ P ptω P Ω | Xpωq “ xuq.
Agora, se X é contínua, então definimos a função densidade de probabilidade de X como sendo a função f : R Ñ R dada por
fpxq “ F1pxq donde F denota a distribuição acumulada de X.
Como consequencia, toda função densidade de probabilidade satisfaz: ż8
´8fpxqdx “ 1
A partir de agora, a menos que se diga o contrário, vamos considerar apenas variáveis aleatórias que possuem funções de densidade de probabilidades. Dito isto, podemos definir o operador esperança E como se segue.
Definição 1.29. Se X é uma variável aleatória com função de densidade de probabilidade
f e g : R Ñ R. A esperança matemática da variável aleatória gpXq é dada por
• caso discreto: EpgpXqq “ ÿ
iPIĎN
gpxiqfpxiq;
• caso contínuo: EpgpXqq “ ż
R
gpxqfpxqdx.
De posse do operador esperança podemos definir diversas medidas estatísticas sobre a uma variável aleatória X. Por exemplo, a esperança matemática da variável aleatória X, ou o valor médio de X, é dada por EpXq (ou seja, tomando g como a função identidade na Definição 1.29).
Definição 1.30 (Probabilidade e Valor Médio de Eventos). Se X é uma variável aleatória
com função de densidade de probabilidade f. Dado um evento A, isto é, A P A, a probabilidade do evento A é definida como sendo
PpAq “ EpχApXqq.
Adicionalmente, o valor médio do evento A é definido como EpXχApXqq
PpAq .
Diversas outras medidas estatísticas podem ser formuladas em termos do operador esperança, por exemplo o n-ésimo momento de X é definido por EpXnq, n ą 0.
Contudo, para o propósito desta dissertação é suficiente os conceitos de probabilidade e valor médio de eventos introduzidos acima. Para maiores informações sobre o tema o leitor pode consultar (SAHOO,2003).
1.6.1 Eventos Fuzzy
Definição 1.31. Seja Ω um espaço amostral. Um evento fuzzy A em Ω é
simples-mente um subconjutno fuzzy de Ω tal que todos α-níveis estão na σ-álgebra A (BARROS; BASSANEZI, 2010).
Note que estamos fazendo uso da noção de conjunto fuzzy para definir eventos cujo o processo de identificação da ocorrência de um certo evento é imprecisa ou incerta. É exatamente nesse ponto que há sobreposição de incertezas: a fuzzy, ligada à identificação de
A(uma vez que sua fronteira não é “nítida”); e a probabilística, proveniente da “ocorrência”
do evento.
De posse do conceito de evento fuzzy, podemos extender de maneira natural a Definição 1.32 para lidar também com probabilidade e valor médio de evento fuzzy (BARROS; BASSANEZI,2010).
Definição 1.32 (Probabilidade e Valor Médio de Eventos Fuzzy). Se X é uma
variá-vel aleatória com função de densidade de probabilidade f. Dado um evento fuzzy A, a probabilidade do evento A é definida como sendo
PpAq “ EpϕApXqq.
Adicionalmente, o valor médio do evento A é definido como EpXϕApXqq
2 Sistemas Baseados em Regras Fuzzy
2.1 Introdução
A condição humana impele a realizarmos as mais diversas tarefas dispondo apenas de informações imprecisas. A operabilidade do cérebro humano permite decodificar signos e processar informações semânticas para então escolher a possibilidade de ação. Justamente este raciocínio aproximado inspirou a ciração dos chamados Sistemas Baseados em Regras Fuzzy (SBRF).
Desde meados da década de 90 o número de publicações a respeito de sistemas baseados em regras fuzzy vêm crescendo. Isto se deve, em parte, a fácil implementação e interoperabilidade entre diversas áreas da ciência e também em parte pela necessidade do setor industrial em criar sistemas de controles facilmente ajustáveis ao processamento de dados imprecisos (PEDRYCZ; GOMIDE, 2007).
No presente trabalho apresentaremos algumas noções básicas sobre sistemas baseados em regras fuzzy, elencando cada um de seus módulos e suas propriedades durante as seções2.3à2.5. Em particular, focamos no estudo de defuzzificadores e suas propriedades. Por fim, propomos um defuzzificador baseado no cálculo do valor médio de um evento fuzzy de uma variável aleatória.
2.2 Sistemas Baseados em Regras Fuzzy: Arquitetura
A arquitertura de um Sistema Baseado em Regras Fuzzy é composto de três módulos interconectados tal como indicado na Figura 1(BARROS; BASSANEZI,2010). O módulo de Fuzzificação é responsável por transformar dados crisp em fuzzy. O módulo de
Inferência é responsável por traduzir o conhecimento do fênomeno/sistema armazenado em
uma base de regras fuzzy para uma função matemática. Por fim, quando a saída produzida pelo módulo de Inferência é um conjunto fuzzy, o módulo de Defuzzificação se encarrega de converter a saída fuzzy para uma saída crisp adequada. Devido as semelhanças do fluxograma da Figura 1 com fluxogramas da teoria de controle, veja por exemplo (BAU-MEISTER; LEITÃO, 2008), também é comum encontrar literatura o termo "controlador fuzzy".
Existem diversos tipos de SBRF: múltiplas entradas e múltiplas saídas (MIMO do inglês "multiple input multiple output"), tipo MISO múltiplas entradas e uma saída ("multiple input single output"), ou do tipo SISO ("single input single output") (BARROS;
Figura 1 – Arquitetura do Sistema Baseado em Regras Fuzzy (BARROS; BASSANEZI, 2010).
Nas próximas seções estudaremos detalhadamente cada um desses módulos.
2.3 Módulo de Fuzzificação
Esta etapa do processamento do SBRF é devotada ao tratamento da infor-mação, isto é, os dados de entrada do sistema são convertidos em conjuntos fuzzy. Mais precisamente, este módulo corresponde a um mapa F : Rn Ñ FpRnq, isto é, um mapa
que associa valores de entrada x P Rn a um conjunto fuzzy F pxq P FpRnq. Em particular,
para SBRF do tipo SISO temos:
F : R Ñ FpRq (2.1)
Um dos métodos mais tradicionais de fuzzificação é via inclusão canônica (BEDE, 2012): se x0 P X é um valor de entrada crisp então o conjunto fuzzy associado ao
mesmo é o singleton fuzzy do conjunto tx0u dado pela função característica: Apxq “ χtx0upxq “
#
1, x “ x0
0, x ‰ x0 (2.2)
Por fim vale ressaltar a importância do especialista nesta etapa (BARROS; BASSANEZI,2010;KLIR; YUAN,1995): o especialistas desempenha o papel de caracteri-zar a incerteza do fenômeno e portanto formular as funções de pertinência de acordo com cada conjunto fuzzy envolvido no processo estudado.
2.4 Módulo de inferência:
Este módulo é composto de dois submódulos. O primeiro submódulo é conhecido como Base de Regras Fuzzy e o segundo de Método de Inferência. A seguir detalharemos cada um deles.
2.4.1 Base de Regras Fuzzy
Base de regras fuzzy corresponde a um sistema ordenado de regras “Se-Então” que nada mais são do que proposições compostas por antecedentes, consequentes e conec-tivos lógicos da seguinte forma:
R1: "Se x1 é A11 e x2 é A12 e . . . e xn é A1n então y1 é B11 e y2 é B12 e . . . e yn é B1n. " ou R2: "Se x1 é A21 e x2 é A22 e . . . e xn é A2n então y1 é B21 e y2 é B22 e . . . e yn é B2n." ou ... ou Rt: "Se x1 é At1 e x2 é At2 e . . . e xn é Atn então y1 é Bt1 e y2 é Bt2 e . . . e yn é Btn"
Aqui, tanto antecedentes quanto consequentes são considerados conjuntos fuzzy. Vale notar que há casos onde o consequente não é um conjunto fuzzy tal como no caso do SBRF do tipo Takagi-Sugeno-Kang, contudo, nesta dissertação, trataremos apenas do caso onde os consequentes são conjuntos fuzzy.
Nas regras acimas, os conectivos lógicos são modelados por conectiovs lógicos fuzzy. Por exemplo:
• O conectivo lógico e pode ser modelado por:
operador t-norma � : r0, 1s ˆ r0, 1s Ñ r0, 1s. • O conectivo lógico ou pode ser modelado por:
• A negação pode ser modelado por: operador negação η : r0, 1s Ñ r0, 1s.
Cada regra fuzzy descreve o comportamento do fenômeno de interesse para um caso particular. A base de regras fuzzy é composta por uma coleção de regras fuzzy e representa a informação parcial sobre o fenômeno de interesse. Resumidamente, a base de regras estabelece a conexão entre o conhecimento de um especialista e a modelagem por funções e conjuntos fuzzy.
Suponha que se deseja projetar um SBRF para aproximar uma função contínua. Como a base de regras representa o conhecimento parcial da função a ser aproximada, para se obter uma aproximação adequada é essencial que está tenha sido bem elaborada no sentido de conter informação suficiente para atingir o objetivo, contudo, levando em conta que a complexidade do SBRF está intimamente ligada ao número de regras da base de regras. Dito isto, a definição a seguir de uma base de regras bem ordenada traz uma lista de propriedades interessantes que podem ser bem úteis durante a etapa de construção da base de regras para um SBRF do tipo SISO.
Definição 2.1. Uma base de regras bem ordenada se satisfazer as propriedades:
1. Os Universos de discurso considerados são intervalos compactos sobre os reais; 2. Os conjuntos fuzzy da base de regras devem ser números fuzzy;
3. A base de regras deve ser uma cobertura dos universos, no sentido que cada elemento dos universos tem pertinência não nula a pelo menos um dos números fuzzy da base de regras;
4. No máximos duas regras devem ser ativadas, isto é, cada elemento do universo não pode ter pertinência não-nula a mais que dois antecedentes;
5. Elementos de pertinência máxima (igual a 1) pertencem só a um dos números fuzzy da base de regras;
6. A base de regras deve ser ordenada monotonicamente, isto é, o maior elemento do suporte do antecedente da regra "Ri"deve ser menor que o antecedente da regra Ri`1.
2.4.2 Método de Inferência
O método de inferência é responsável por generalizar o conhecimento parcial descrito na base de regras fuzzy para todo o domínio fuzzy utilizando-se de relações fuzzy
e composições relacionais fuzzy para tal fim.
As informação parcial do fenômeno contida na base de regras é condensada em relação fuzzy. Suponha que dispomos de uma base com n regras fuzzy da forma “Se
x P Ai então y P Bi ” para i “ 1, . . . , n, onde x P X e y P Y . Seja b uma t-norma ou uma
t-conorma e seja ‹ um conector lógico fuzzy binário tal como uma t-norma, t-conorma ou implicação fuzzy. Uma relação fuzzy M de Y ˆ X pode ser construída em termos da base de regras dada como se segue:
Mpy, xq “
n
â
i“1‹pB
ipyq, Aipxqq “ r‹pB1pyq, A1pxqqs b . . . b r‹pBnpyq, Anpxqqs .
Neste contexto, o operador b denota o operador com modela o conectivo ou enquanto que o operador ‹ modela a relação se-então. Assim as escolhas de b e ‹ definem a maneira como o conhecimento do especialista é traduzido para o domínio fuzzy. Por exemplo, a regra de Mamdani para construir M consiste em tomar b e ‹, reespectivamente, como a t-conorma do máximo e a t-norma do mínimo (BARROS; BASSANEZI,2010; BEDE, 2012). Outro exemplo é a regra de Gödel que consiste em considerar b como a t-norma do mínimo e ‹ como a implicação residual do produto (BEDE,2012).
Uma vez obtido uma relação fuzzy M a partir da base de dados, a saída do método de Fuzzificação para uma entrada x P X, que consiste de um conjunto fuzzy
A “ F pxq P FpXq, é então combinada com a relação fuzzy M afim de se obter uma saída B apropriada. Em geral, essa combinação se dá por uma metodologia chamado de regra (composicional) de inferência que é baseada na clássica regra de Modus Ponens (BARROS;
BASSANEZI, 2010; BEDE, 2012). Sejam b uma t-norma ou uma t-conorma e ‹ um conector lógico fuzzy binário, a regra de inferência b ´ ‹ produz a seguinte saída B:
Bpyq “ â
zPX‹ pMpy, zq, Apzqq .
Logo uma vez determinado a relação fuzzy a partir da base de regras, dada uma entrada A P FpRnq, uma saída B P FpRmq pode ser produzida aplicando-se uma
composição relacional fuzzy b ´ ‹. Consequentemente, podemos entender tal submódulo como um mapa:
I : FpRnq Ñ FpRmq. (2.3)
os indíces ”n” e ”m” apenas enfatizam a possibilidade de diferentes tipos de SBRF. No caso SISO temos:
I : FpRq Ñ FpRq. (2.4)
Por exemplo, para o método de inferência de Mamdani empregamos a composi-ção max-min (˝) entre a relacomposi-ção fuzzy M e o subconjunto fuzzy A, isto é, B “ M ˝ A.
Devemos enfatizar ainda que a Inferência fuzzy é o “coração” do controlador fuzzy, isto é, o controlador fuzzy é tão adequado para determinada tarefa quanto for a Inferência fuzzy adotada uma vez que a mesma fornecerá a saída fuzzy (e portanto o controle fuzzy) para cada entrada fuzzy.
2.5 Módulo de Defuzzificação:
Pretendemos estudar esta etapa detalhadamente pois é aqui que nosso trabalho apresenta contribuição nesse tema de sistemas baseados em regras fuzzy. No estudo dinâmico que faremos a partir dos SBRF, diferentes métodos de defuzzificação pode “gerar” diferentes dinâmicas no modelo estudado, vide (GLAS, 1983).
Boa parte desta seção é baseada principalmente nos trabalhos de (LEEKWIJCK; KERRE,1999) e nas idéias de Runkler em (RUNKLER; GLESNER,1993) que visam criar um conjunto de axiomas que incorporem todas as propriedades conhecidas de todos os defuzzificadores conhecidos. Em particular, na Subseção 2.5.1revisaremos algumas dessas propriedades.
O módulo de defuzzificação deve ser entendido como um operador no sentido de que dado um subconjunto fuzzy A P FpXq o defuzzificador associada um valor crisp
DpAq P X. Quando necessário explicitarmos o domínio e contra-domínio de atuação
utilizaremos o termo operador de defuzzificação, caso contrário quando estiver subentendido o universo de discurso , genericamente X, utilizaremos apenas o termo defuzzificador. Este
processo é dado por:
D: FpXq Ñ X (2.5)
AP FpXq ÞÑ DpAq P X.
No contexto de Controladores fuzzy em geral utilizaremos o subconjunto fuzzy sobre os reais:
D: FpRnq Ñ Rn (2.6)
AP FpRnq ÞÑ DpAq P Rn.
A respeito de SBRF do tipo SISO o mapa será unidimensional:
D: FpRq Ñ R AP FpRq ÞÑ DpAq P R.
Devido a grande variedade de defuzzificadores presentes na literatura estamos interessados em analisar alguns critérios que permitem escolher certos defuzzificadores apro-priados para determinados problemas. Tais critérios foram estudados em (LEEKWIJCK; KERRE,1999;RUNKLER; GLESNER,1993), permitindo classificar propriedades mate-máticas inerentes ao conjunto X que permitam escolher o defuzzificador mais conveniente. A seguir, pelos trabalhos (LEEKWIJCK; KERRE, 1999; RUNKLER; GLESNER, 1993), listaremos algumas propriedades.
2.5.1 Propriedades do Defuzzificador
2.5.1.1 Seleção Nuclear
Também encontrarmos o termo defuzzificação semanticamente correta para Seleção Nuclear na literatura. O processo de defuzzificação via Seleção Nuclear basicamente consiste em selecionar um elemento com maior grau de pertinência no conjunto fuzzy:
DpAq P CernepAq @A P FpRq. (2.7)
2.5.1.2 Escalas Invariantes
O operador defuzzificação pode ter a propriedade de ser invariante sobre algumas das possíveis transformações de escala do universo de discurso. Abaixo elencamos alguns tipos de transformações encontrados na literatura. Para o que se segue considere uma função D definida no conjuntos das funções X Ñ R, onde X é um universo qualquer, que associa cada função f : X Ñ R a um valor Dpfq P R. Note que tal função pode atuar como um operador de defuzificação se restringirmo seu domínio para a classe de conjuntos fuzzy.
1) Escala Ordinária:
Seja f : R Ñ R monótona crescente. Considere a função fA formada pela composição de f com um conjunto fuzzy A de X:
f A: X Ñ R xÞÑ fpApxqq,
então tal critério é expresso como:
DpfAq “ DpAq. (2.8)
2) Escala de Intervalos Invariantes
Dado um conjunto fuzzy A P FpXq, considere a transformação pa.A ` bq : R Ñ r0, 1s
xÞÑ a.Apxq ` b, @a P R`zt0u, @b P R.
Então o critério de Escala de Intervalos Invariantes será:
3) Razões de Escala
Considerando as definições do item anterior, o critério de Razões de Escala é satisfeito se:
Dpa.Aq “ DpAq, @a P R`. (2.10)
4) Invariante por Escala Relativa
Considerando as definições dos itens anteriores, o critério de Invariante por Escala Relativa é satisfeito se:
DpA ` bq “ DpAq, @b P R. (2.11)
2.5.1.3 Monotocidade
O critéiro de monotocidade é satisfeito se para todo A, B P FpXq tais que
Bpxq ď Apxq, @x P X
tem-se
DpBq ď DpAq (2.12)
2.5.1.4 Critério de t-conormas
Neste critério, se A, B P FpRq são tais que satisfazem DpAq ď DpBq, então, espera-se que a defuzzificação da união A e B baseada em uma certa t-conorma � seja limitada ao intervalo dos valores defuzzificados de A e B. Mais precisamente,
DpAq ď DpCq ď DpBq (2.13)
onde Cpxq “ Apxq�Bpxq para todo x P X.
2.5.2 Defuzzificação sobre FpRq
As propriedades apresentadas a seguir assumem X “ R. Como a defuzzificação atua sobre conjuntos fuzzy, adotamos a nomenclatura de Defuzzificação sobre FpRq.
2.5.2.1 Translação-x
Esse critério ocorre quando a defuzzificação de um conjunto fuzzy B resultante da translação de um conjunto fuzzy A por um elemento b P R fixo é igual a soma da defuzzificação de A com b. Mais especificamente, se o conjunto fuzzy B dado por
B : X Ñ r0, 1s xÞÑ Apx ´ bq, @b P R,
então, para que este critério seja satisfeito deve se ter
DpBq “ DpAq ` b. (2.14)
Tal critério é análogo a propriedade de translação da reta. 2.5.2.2 Escalonamento-x:
Dizemos que um defuzzificador possui essa propriedade se para todo conjunto fuzzy A dado e para cada conjunto fuzzy B P FpRq dado por Bpxq “ Apx
aq, @x P R, com a P R fixo, tem-se
DpBq “ aDpAq. (2.15)
Tal critério é análogo a propriedade de escalonamento da reta.
Enceramos esta seção citando ainda que existem outros critérios de defuzzifica-ção como o critério de eficiência computacional que tenta encontrar o menor número de operações necessária para realizar o processo de defuzzificação ou o critério de navalha de Occan para defuzzificadores, também encontrado na literatura como transparência de
designer, que afirma que um operador de defuzzificação simples e mais facilmente
compre-ensível deve ser preferível do que um operador de defuzzificação demasiadamente mais complexo e menos intuitivo. Todavia estes critérios não serão abordados neste trabalho.
2.5.3 Exemplos de Defuzzificadores
O foco desta seção é analisarmos alguns dos defuzzificadores mais difundidos na literatura pela ótica dos critérios apresentados na seção anterior. Ressaltamos que ao longo deste trabalho todos defuzzificadores possuiem suporte limitado.
2.5.3.1 FOM, LOM e MOM 1) FOM
O método de defuzzificação O Primeiro dos Máximos (FOM), do inglês "First of Maxima", requer que exista um elemento infímo presente no cerne de A; este método de defuzzificação seleciona o seguinte elemento como valor crisp:
F OMpAq “ min CernepAq. (2.16)
2) LOM
Em contra partida ao métdo acima, o método de defuzzificação O Último dos Máximos (LOM), do inglês "Last of Maxima", requer a existência de um elemento maximal no cerne de A; basicamente, este método de defuzzificação seleciona o seguinte elemento como valor crisp:
LOMpAq “ max CernepAq. (2.17)
3) MOM
Basicamente, este método de defuzzificação consiste em selecionar o elemento presente no meio do núcleo (do inglê "Middle of Maxima"). A formulação discreta desse defuzzificador é dada a seguir.
Vamos introduzir a seguinte notação, para um conjunto crips S e xo P S seja:
Săx0 :“ tx|x P S, x ă x0u
e
Sąx0 :“ tx|x P S, x ą x0u .
Se a cardinalidade de |CernepAq| for impar, então MOMpAq é tal que:
|CernepAqăMOMpAq| “ |CernepAqąMOMpAq|. (2.18)
Se a cardinalidade de |CernepAq| for par, dependendo da escolha de implementação,
M OMpAq é tal que:
|CernepAqăMOMpAq| “ |CernepAqąMOMpAq| ˘ 1. (2.19)
Um ponto importante que foi destacado em (BANDO,2002) é que uma limitação destes métodos reside no fato de não considerar a forma do conjunto fuzzy. dois conjuntos fuzzy com formas distintas porém com cernes iguais produziriam, ao serem defuzzificados, os mesmos valores crisp. Logo, dependendo do modelo adotado, estes métodos pode produzir valores inesperados.
2.5.3.2 Centróide (ou Centro de Massa)
Um exemplo de defuzzificador muito utilizado na literatura é o defuzzificador via o método do centroide, denotado aqui por COG, que no caso discreto é obtido via a média aritmética ponderada pelas pertinência de cada elemento do conjunto fuzzy. Dado um conjunto fuzzy B P FpUq, U Ď R, definimos COGpBq P R como se segue:
• Caso discreto: COGpBq “ řn i“1uiϕBpuiq řn i“1ϕBpuiq (2.20) onde U “ tu1, . . . , unu Ă R. • Caso contínuo: COGpBq “ ş RuϕBpuqdu ş RϕBpuqdu . (2.21)
Este será o principal defuzzificador usado neste trabalho. Em diversas metodo-logias de aproximação, por exemplo o método de Mamdani com o Defuzzificador de centro de massa. Este defuzzificador será denotado particularmente por DCM.
2.5.3.3 Variações do Defuzzificador Centróide
Existem ainda variações do defuzzificador do centróide. Nesta seção apresenta-remos brevemente algumas delas.
1) MeOM:
O defuzzificador da Média de Máximos (MeOM, do inglês "Mean of Maxima") consiste em calcular a média de todos os elementos no cerne (ou núcleo) do conjunto fuzzy que claramente é o centro de massa do núcleo.
• Caso discreto: M eOMpAq “ ř xPCernepAqx |CernepAq| ; (2.22) • Caso contínuo: M eOMpAq “ ş CernepAqxdx ş CernepAqdx . (2.23)
Note que o defuzzificador MeOM satisfaz o critério de Seleção Nuclear somente para conjuntos fuzzy convexos. Diferentemente do centróide, a continuidade não pode ser sempre garantida.
2) ICOG
O defuzzificador Centro de Massa Indexado (ICOG, do inglês "Indexed Center of Gravity") foi proposto em (JAGER, 1995) e tal método consiste em fixar-se um indíce
α e calcular o centro de massa do conjunto fuzzy com grau de pertinência maior ou igual
a este indíce, logo temos: • Caso discreto: ICOGpA, αq “ ř xPrAsαxApxq ř xPrAsαApxq ; (2.24) • Caso contínuo: M eOMpAq “ ş rAsαxdx ş rAsαdx . (2.25)
Note que tal método de defuzzificação contém como caso particulares os métodos MeOM e centróide pois:
ICOGpA, 0q “ COGpAq (2.26)
e
ICOGpA, heightpAqq “ MeOMpAq. (2.27)
3) SLIDE
O defuzzificador Semi-Linear (SLIDE, do inglês "Semi-Linear Defuzzification") foi proposto em (YAGER; FILEV, 1993) e tal método cosiste em realizar combinações semi-lineares da seguinte forma:
• Caso discreto: SLIDEpA, α, βq “ p1 ´ βq ř xPrAs0zrAsαxApxq ` ř xPrAsαxApxq p1 ´ βqřxPrAs0zrAsαApxq ` ř xPrAsαApxq (2.28)
• Caso contínuo: SLIDEpA, α, βq “ p1 ´ βq ş rAs0zrAsαxApxqdx ` ş rAsαxApxqdx p1 ´ βqşrAs0zrAsαApxqdx ` ş rAsαApxqdx (2.29) onde α P r0, heightpAqs e β P r0, 1s.
Tal método é caracterizado pelos parâmetros α que representa o nível de confiança e β que representa o nível de rejeição. Claramente, para β “ 1 todos os graus de pertiência abaixo de α são rejeitados. Note que caso α “ heightpAq, então o parâmetro β permite variar continuamente do centróide que ocorre quando β “ 0, para o MeOM que ocorre quando β “ 1. Assim:
SLIDEpA, 0, βq “ COGpAq, @β P r0, 1s, (2.30) SLIDEpA, α, 0q “ COGpAq, @α Ps0, heightpAqr, (2.31) SLIDEpA, α, 1q “ ICOGpA, αq, @α Ps0, heightpAqr, (2.32) SLIDEpA, heightpAq, 1q “ MeOMpA, αq. (2.33)
Portanto, pelas equações acima, vimos que facilmente outros métodos de defuzzificação podem ser obtidos apartir da comparação entre os parâmetros de nível de confiança e rejeição. Ao compararmos com a Teorioa de Probabilidade, em que o evento favorável admite uma margem de confiança dada por uma medida de probabilidade (e reciprocamente para o evento não-favorável com a medida complementar), nota-se a proximidade com a visão da Teoria de Possibilidade, em que eventos distintos se contrapõe em diferentes graus de pertinência frente a uma distribuição de possibilidade.
2.5.3.4 Centro da Área
Alguns autores (LEEKWIJCK; KERRE, 1999; RUNKLER; GLESNER, 1994) subdividem o estudo dos defuzzificadores através de grupos, por exemplo, o grupo dos métodos específicos de distribuição contém os defuzzificadores de média fuzzy (e suas variações) e o método de qualidade (e suas variações). Tal grupo não será estudado no presente trabalho.
Outro grupo importante é o grupo de defuzzificadores baseados na análise da área do gráfico da função de pertinência. Neste grupo encontramos o defuzzificador de Centro de Área, tal defuzzificador atua em universos ordenados e consiste, para o caso discreto, em encontrar o minimizador COApAq do seguinte problem de minimização:
min yPX ˇ ˇ ˇ ˇ ˇ y ÿ x“infpXq Apxq ´ supÿpXq x“y Apxq ˇ ˇ ˇ ˇ ˇ. (2.34)
O caso contínuo é análogo ao discreto, bastando substituir os somatórias acima por integrais.
Embora comumente a nomeclatura em português de Centro de Massa e Centro de Área seja similar, não devemos confundir os defuzzificadores uma vez que a interpretação é bem distinta: no defuzzificador de centro da área o grau de pertinência é tratado como um pacote de informação e assim o defuzzificador de centro da área subdivide a área abaixo do gráfico da função de pertinência em duas ou mais partes iguais contendo igual quantidade de informação.
Existem ainda variações deste método como Centro da Área Extendido.
1) ECOA
O método de defuzzificação Centro da Área Extendido (ECOA, do inglês "Extended center of area") consiste basicamente em substituir Apxq pelo conjunto fuzzy Aγ
dado por Aγpxq “ pApxqqγ para todo x P X. O parâmetro γ pode ser interpretado como
um fator de confiança. Como casos particulares temos:
ECOApA, 1q “ COApAq (2.35)
e
lim
γÑ8ECOApA, 1q “ MeOMpAq. (2.36)
Note que, para γ ą 1, quanto maior for o grau de pertinência de x P X em A, maior será a “relevância” do elemento x no resultado da defuzzificação A.
2.5.4 Comparação entre os defuzzificadores
A Tabela 2.5.4 resume quais propriedades são cumpridas para cada um dos defuzzificadores discutidos aqui (LEEKWIJCK; KERRE,1999).
Note que FOM, MOM e LOM satisfazem os seis primeiros critérios de defuzzi-ficação. Por outro lado, COG e COA são os únicos que satisfazem o último critério.
2.6 Defuzzificador Para Eventos Fuzzy
Suponha que tenhamos em mãos um o módulo de Inferência descrito por uma função I : FpRq Ñ FpUq, U Ď R. Suponha ainda que para todo conjunto fuzzy de entrada
A dado a saída B “ IpAq seja um evento fuzzy de um espaço amostral associado a uma
Tabela 1 – Comparação entre Defuzzificadores
Propriedades FOM/LOM MOM COG COA
Seleção Nuclear � � ˆ ˆ
Escala Ordinária � � ˆ ˆ
Escala Inv. Intervalos � � ˆ ˆ
Razão de Escala � � � �
Inv. Escala Relativa � � ˆ ˆ
Monotocidade � � � �
Crit. t-conorma vale para � “ _ ˆ ˆ ˆ
Translação-x � � � �
Escalonamento-x ˆ ˆ � �
tomar como a defuzzificação de B como sendo o valor DEFpB, pq P R dado pelo valor
médio do evento fuzzy B segundo a função de densidade de probabilidade p (BARROS; BASSANEZI, 2010;ZADEH, 1965), isto é,
DEFpB, pq “
EpY ϕBpY qq
PpBq . (2.37)
Quando a função de densidade de probabilidade p depender do evento fuzzy B, utilizaremos, altenartivamente, a seguinte notação:
DEFpB, pq “ DppBq.
Recorde do Capítulo 1, que a noção de evento fuzzy consiste em uma maneira viável de se computar a estatística de uma variável aleatória envolvendo conceitos da teoria de conjuntos fuzzy. A seguir relembraremos explicitamente a expressão de DEFpB, pq tanto
para o caso discreto como para o caso contínuo: • Caso discreto: DEFpB, pq “ řn i“1uiBpuiqppuiq řn i“1Bpuiqppuiq (2.38) onde U “ tu1, . . . , unu; • Caso contínuo: DEFpB, pq “ ş RuBpuqppuqdu ş RBpuqppuqdu . (2.39)
Nota-se ainda que o centróide, um dos principais defuzzificadores da litera-tura, passa a ser um caso particular do defuzzificador acima quando a distribuição p é uniforme. Todavia não se trata apenas de um caso isolado, na seção seguinte exploraremos correspondências entre outros defuzzificadores.
2.6.1 Correspondência entre Defuzificadores
Nesta seção veremos que diversos defuzificadores conhecidos da literatura correspondem, mesmo que implicitamente, a exemplos particulares das Equações (2.38) e (2.39). Cada subseção será dedicada a um defuzzificador apresentado na forma de lema
apenas para o caso contínuo, sendo o caso discreto totalmente análogo. 2.6.1.1 DEF corresponde a COG
Lema 2.1. Dado um conjunto fuzzy B. Se p : R Ñ R é uma distribuição de probabilidade
dada por ppxq “ $ & % 1 b´ a xP ra, bs 0 caso contrário, com supppBq Ď ra, bs, então DppBq “ COGpBq.
Demonstração. Basta notar que se supppBq Ď ra, bs, então
DppBq “ ş RuϕBpuqppuqdu ş RBpuqppuqdu “ şb auBpuq 1 b´adu şb aBpuq 1 b´adu “ şb auBpuqdu şb aBpuqdu “ COGpBq.
Portanto, se p é dada como na equação acima, então (2.39) coincide com (2.21).
2.6.1.2 DEF corresponde a MeOM
Lema 2.2. Dado um conjunto fuzzy B. Se p : R Ñ R é uma distribuição de probabilidade
dada por ppxq “ $ ’ & ’ % 1 ş CernepBqdx xP CernepBq 0 caso contrário, então DppBq “ MeOMpBq.