• Nenhum resultado encontrado

Estatística e a teoria de conjuntos fuzzy

N/A
N/A
Protected

Academic year: 2021

Share "Estatística e a teoria de conjuntos fuzzy"

Copied!
97
0
0

Texto

(1)

Jos´

e Alejandro Gonz´

alez Campos

Estat´ıstica e a teoria de conjuntos fuzzy

CAMPINAS 2015

(2)

i

(3)

UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE MATEMÁTICA, ESTATÍSTICA

E COMPUTAÇÃO CIENTÍFICA

José Alejandro González Campos

Estatística e a teoria de conjuntos fuzzy

Tese apresentada ao Instituto de Matemática, Estatística e Computação Científica da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Doutor em estatística.

Orientador: Víctor Hugo Lachos Dávila Coorientador:Alexandre Galvão Patriota

ESTE EXEMPLAR CORRESPONDE À VERSÃO FINAL DA TESE DEFENDIDA PELO ALUNO

José Alejandro González Campos, E ORIENTADA PELO PROF.DR Víctor Hugo Lachos Dávila.

Assinatura do(a) Orientador(a)

_______________________

CAMPINAS 2015

(4)

Ficha catalográfica

Universidade Estadual de Campinas

Biblioteca do Instituto de Matemática, Estatística e Computação Científica Ana Regina Machado - CRB 8/5467

González Campos, José Alejandro,

1979-G589e GonEstatística e a teoria de conjuntos fuzzy / José Alejandro González Campos. – Campinas, SP : [s.n.], 2015.

GonOrientador: Víctor Hugo Lachos Dávila.

GonCoorientador: Alexandre Galvão Patriota.

GonTese (doutorado) – Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica.

Gon1. Conjuntos fuzzy. 2. Números fuzzy. 3. Estatística matemática. 4. Análise de intervalos (Matemática). I. Lachos Dávila, Víctor Hugo,1973-. II. Patriota,

Alexandre Galvão. III. Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica. IV. Título.

Informações para Biblioteca Digital

Título em outro idioma: Statistic and fuzzy set theory Palavras-chave em inglês:

Fuzzy sets Fuzzy numbers

Mathematical statistics

Interval analysis (Mathematics) Área de concentração: Estatística Titulação: Doutor em Estatística Banca examinadora:

Víctor Hugo Lachos Dávila [Orientador] Ronaldo Dias

Jacek Leskow Manuel Galea Rojas

Filidor Edilfonso Vilca Labra Data de defesa: 06-03-2015

Programa de Pós-Graduação: Estatística

(5)
(6)

Para Ram´on Robres

Para Ram´on Robres

(7)

Abstract

”The fuzzy sets theory is a new theory introduced by Zadeh in 1965. Lately has been a fruitful massification, reaching diverse fields of science. This work distinguishes three dimensions: A fuzzy set theory in a pure way, connections between statistical and fuzzy set theory (interpretation and visualization) and finally statistics for fuzzy data. The basic definitions of the fuzzy sets theory are presented, such as fuzzy number, core and normal fuzzy sets, the way to make the thesis self-contained. Based on the first dimen-sion was defined a new order in the LR-type fuzzy numbers. It is characterized by its simplicity in calculations where the order of the real numbers is a particular situation when they are considered fuzzy numbers. This proposal overcomes many of the limi-tations of other order proposed, such as the indetermination and indefiniteness. The definition of an order will allow to get statistical tools such as median and variability measures. In the second dimension is presented a new tool for the interpretation of confidence regions after the sample were observed. Is defined a function of membership that representing the parametric space of fuzzy way depending of each confidence re-gion. Also is presented a new form of visualization of an infinite sequence of confidence regions. Finally, in the third dimension is studied the generalization of the Kaplan-Meier estimator, in which the lifetime is considered as fuzzy number, starting with a line of research around their asymptotic properties. In this section a typical example of survival analysis is used. This thesis work presents the basic theoretical foundations to a new line of research, given our human nature and to escape of Platonic assumptions. This work shows how to analyze a set of confidence without resorting to interpretation frequency. This is possible through the use of fuzzy set theory developed by Zadeh (1965,1995).”

Resumo

”A teoria de conjuntos fuzzy ´e uma teoria nova introduzida por Zadeh no ano 1965. Estes ´ultimos anos tem tido uma frut´ıfera massifica¸c˜ao, atingindo variados campos da

(8)

ciˆencia. Neste trabalho s˜ao distinguidas trˆes dimens˜oes: A teoria de conjuntos fuzzy de maneira pura, conex˜oes da estat´ıstica e a teoria dos conjuntos fuzzy (interpreta¸c˜ao e visualiza¸c˜ao) e finalmente a estat´ıstica aplicada em dados fuzzy. S˜ao apresentadas as defini¸c˜oes elementares da teoria de conjuntos fuzzy, tais como: n´umero fuzzy, core e conjuntos fuzzy normais, de maneira a se fazer a tese autocontida. Baseada na primeira dimens˜ao foi definida uma nova forma de ordem dos n´umeros fuzzy LR-type, caracte-rizada pela sua simplicidade nos c´alculos onde a ordem dos n´umeros reais fica como uma situa¸c˜ao particular quando estes s˜ao considerados n´umeros fuzzy. Esta proposta supera muitas das limita¸c˜oes de outras propostas de ordem, como a indetermina¸c˜ao e indefini¸c˜ao. A defini¸c˜ao de uma ordem permitir´a obter ferramentas estat´ısticas como a mediana e medidas de variabilidade. Na segunda dimens˜ao ´e apresentada uma nova ferramenta de interpreta¸c˜ao das regi˜oes de confian¸ca depois de observada a amostra. ´

E definida uma fun¸c˜ao de membership que representa de maneira fuzzy o espa¸co pa-ram´etrico dependendo de cada regi˜ao de confian¸ca. Tamb´em ´e apresentada uma nova forma de visualiza¸c˜ao de uma sequencia infinita de regi˜oes de confian¸ca. Finalmente, na terceira dimens˜ao ´e estudada a generaliza¸c˜ao do estimador de Kaplan-Meier na si-tua¸c˜ao que os tempos de vida s˜ao considerados como n´umeros fuzzy, abrindo uma linha de pesquisa baseada nas suas propriedades assint´oticas. Nesta se¸c˜ao ´e utilizado um exemplo t´ıpico de analises de sobrevivˆencia. Este trabalho de tese apresenta as bases te´oricas elementares para dar in´ıcio a uma nova linha de pesquisa, atendendo a nossa natureza humana e tentar escapar de supostos platˆonicos. Este trabalho mostra como analisar um conjunto de confian¸ca, sem recorrer ´a interpreta¸c˜ao de frequˆencia. Isto ´e poss´ıvel atrav´es da utiliza¸c˜ao da teoria dos conjuntos fuzzy desenvolvida por Zadeh (1965,1995).”

(9)

Conte´

udo

Abstract vii

Lista de Figuras xviii

Lista de Tabelas xix

1 Introdu¸c˜ao 1

1.1 Motiva¸c˜ao . . . 1

1.2 Preliminares . . . 2

1.3 Objetivos e organiza¸c˜ao da pesquisa . . . 7

2 Uma an´alise de conjuntos de confian¸ca para amostras observadas: uma abordagem desde conjuntos fuzzy 9 2.1 Introdu¸c˜ao . . . 9

2.2 Conjuntos de confian¸ca e fun¸c˜oes de membership . . . 11

2.3 Exemplos . . . 21

2.4 Aplica¸c˜oes . . . 30

2.5 Conclus˜oes e observa¸c˜oes finais . . . 37

3 Uma nova ordem para os n´umeros fuzzy LR-type 39 3.1 Introdu¸c˜ao . . . 39

3.2 A proposta . . . 41

3.3 Compara¸c˜ao com outros m´etodos de ordem . . . 46

3.4 Exemplos . . . 48

3.4.1 Vida ´util do pneu . . . 48

(10)

3.5 Conclus˜ao . . . 49

4 Generaliza¸c˜ao do estimador de Kaplan-Meier para tempos de vida fuzzy 53 4.1 Introdu¸c˜ao . . . 53

4.2 M´etodo . . . 54

4.2.1 O estimador de Kaplan-Meier . . . 54

4.2.2 Frequˆencia relativa fuzzy . . . 55

4.3 Kaplan-Meier fuzzy e comportamento assint´otico . . . 59

4.3.1 Comportamento assint´otico . . . 61

4.4 Aplica¸c˜ao . . . 63

4.5 Conclus˜oes . . . 65

5 Considera¸c˜oes finais 67 5.1 Trabalhos futuros . . . 68

Referˆencias 68

(11)
(12)

Para Ram´on Robres

(13)

Agradecimentos

Na medida que avan¸ca nossa idade, escrever um agradecimento ´e cada vez mais dif´ıcil e emocionante, porque o caminhar pela vida nos ajuda em descobrir novas qualidades das pessoas, que evidenciam a existˆencia de uma divinidade rica em bondade. Vou come¸car meu agradecimento por minha esposa, ela entregou quatro anos da sua vida para me acompanhar no logro de meu sonho e ser meu fˆolego nos momentos de fra-queza. Tamb´em vou agradecer aos meus pais pela confian¸ca e suas ora¸c˜oes que de meu pa´ıs alegravam meu cora¸c˜ao. Quero agradecer meu professor orientador V´ıctor Hugo Lachos, pela confian¸ca que me deu, por acreditar em uma linha de trabalho diferente do convencional, pela sua simpicidade e humildade. Tamb´em vou agradecer meu professor coorientador Alexandre Patr´ıota Galv˜ao, pela sua entrega em meu trabalho de tese e me ensinar um jeito diferente de olhar a estat´ıstica. Come¸car um doutorado foi uma etapa dif´ıcil, mas afortunadamente existem pessoas de bom cora¸c˜ao que de maneira generosa e desisteressada aparecem para estender uma m˜ao, por isso eu quero agradecer aos professores Filidor Vilca Labra e Caio Azevedo, pela grande ajuda que deram na etapa inicial do doutorado. Tamb´em gostaria de agradecer meu aluno, colega e amigo Nicolas Moreno, por ser uma ´otima companhia nestes anos compartilhando grandes momentos. De maneira similar vou agradecer a minha turma e todos os colegas que conheci no de-correr do doutorado, particularmente Diana, Larissa, Tatiana, Marcos, Roberto, Diego, Carlos, Luis e Rocio, Julian. Tamb´em vou agradecer a meu amigo Cristian Carvajal, por estar constantemente preocupado comigo e minha situa¸c˜ao e seguir tamb´em o caminho do doutorado. Quero agradecer tamb´em meus profesores do doutorado que me guiaram em meu processo de forma¸c˜ao, que al´em de serem boms professores s˜ao boas pessoas: Nancy, Marina, Hildete e Mauricio, particularmente vou agradecer ao professor Ronaldo Dias pela sua boa disposi¸c˜ao para resolver minhas infinitas perguntas e sempre ter um tempo para compartilhar de sua rica cultura estat´ıstica. Quando o caminho come¸ca ser dif´ıcil, Deus sempre apresenta boas pessoas que d˜ao luz nesse caminhar e fazem voltar

(14)

as esperan¸cas, por isso est˜ao presente em meus agradecimentos nossos amigos Mauricio Castro e Jenny. Tamb´em vou agradecer a meus professores e colegas da Universidade de Playa Ancha, particularmente Eduardo Cabrera, Eduardo Montenegro, Alejandro Nettle, Jos´e Rubio e Rolando Tiemann. Tamb´em vou agradecer a meu amigo V´ıctor Leiva, pela constante preocupa¸c˜ao e conselhos. A distˆancia muitas vezes tem algumas implica¸c˜oes dif´ıceis, mas sempre soube que estavam presentes em seus cora¸c˜oes, mas se foram antes de meu regresso, muito obrigado aos meus 4 av´os. Tamb´em vou agradecer minha sogra que foi um pilar muito importante, primeiro pela gera¸c˜ao da esposa mais bonita do mundo e por ser o fˆolego para ela nos momentos dif´ıceis. Tamb´em vou agra-decer as agˆencias de fomento, CAPES (2011-2012) e BECASCHILE (2013-2014) pela entrega das bolsas de estudo.

Finalmente dou Gra¸cas ao meu Deus, porque cada segundo da minha vida enviou anjos para me acompanhar neste caminhar.

Muito Obrigado.

(15)

”N˜ao tenho explicado que, o mundo seja finito ou que seja infinito.” Buda (580 . 480 a.c.)

(16)

Para Ram´on Robres

(17)

Lista de Figuras

1.1 Representa¸c˜oes de (a) um conjunto fuzzy geral, (b) um intervalo fuzzy e (c) um n´umero fuzzy. . . 6 1.2 Diagrama Resumo da proposta . . . 8 2.1 Fun¸c˜ao de membership para a m´edia da popula¸c˜ao normal, θ. . . 13 2.2 (a) Fun¸c˜ao de membership para o parˆametro θ quando n = 3 e bθ = 1/3.

(b) Fun¸c˜ao de membership para o parˆametro θ quando n = 3 e bθ = 2/3. 15 2.3 (a) Fun¸c˜oes de membership para a m´edia da popula¸c˜ao de uma

distri-bui¸c˜ao normal quando a variˆancia ´e conhecida (linha s´olida) e quando a variˆancia ´e desconhecida (linha pontilhada);(b) Operador integral r-down para as respectivas memberships; (c) O operador integral r-up para as respectivas memberships. S˜ao considerados n = 5, ¯x = 5, σ2 = s2 = 5. . 23

2.4 (a) Fun¸c˜oes de membership para a taxa exponencial com base na quan-tidade pivotal (linha s´olida) e com base na aproxima¸c˜ao normal (linha pontilhada);(b) O operador integral r-down para as respectivas mem-berships; (c) O operador integral r-up para as respectivas memberships. S˜ao considerados n = 5 e ¯x = 1. . . 25 2.5 (a) Fun¸c˜oes de membership para a taxa Poisson com base na

quanti-dade pivotal (linha s´olida) e com base na aproxima¸c˜ao normal (linha pontilhada); (b) O operador integral r-down para as respectivas mem-berships; (c) O operador integral r-up para as respectivas memberships. S˜ao considerados n = 5 e ¯x = 4. . . 27 2.6 (a) Superf´ıcie de membership para a m´edia e variˆancia de uma

po-pula¸c˜ao normal; (b) o operador integral r-down e r-up para a mem-bership. Considerando-se n = 5, ¯x = 5 e s2 = 5. . . . . 29

(18)

2.8 (a) Fun¸c˜oes de membership com base no m´etodo de Wald, com e sem ajuste Bonett-Price Laplace. (b) Operador integral r-down para as mem-berships. (c) Operador integral r-up para as memmem-berships. . . 35 2.9 (a) Fun¸c˜oes de membership com base no m´etodo do Wald com e sem

ajuste pseudo-frequˆencia Agresti-Min. (b) Operador integral r-down para as memberships. (c) Operador integral r-up para as memberships. 36

3.1 Valores de f ( eA) (linha s´olida) e f ( eB) (linha pontilhada) para diferentes valores de λ. . . 44 3.2 Valores de f ( eA) (linha s´olida) e f ( eB) (linha pontilhada) para diferentes

valores de λ. . . 45 3.3 Valores de f ( eA) (linha s´olida), f ( eB) (linha a tracejado) e f ( eC) (linha

pontilhada) para diferentes valores de λ. . . 47 4.1 Esta figura apresenta uma amostra de n´umeros fuzzy triangulares n˜ao

sim´etricos. Foram destacados os valores m´ınimo e m´aximo. . . 57 4.2 Conjunto fuzzy do intervalo ou classe. . . 58

(19)

Lista de Tabelas

2.1 Tabela de Contingˆencia de 2 × 2. . . 30

2.2 Status Hiperresponsividade das vias a´ereas (AHR), antes e ap´os o trans-plante de c´elulas-tronco (SCT) em 21 crian¸cas (dados obtidos de Bentur et al., 2009). . . 32

3.1 Valores da fun¸c˜ao f (·) para os n´umeros fuzzy eA, eB e eC.. . . 46

3.2 Compara¸c˜ao de m´etodos para ordenar n´umeros fuzzy. . . 50

3.3 Tempo de vida do pneu. . . 51

3.4 Conjunto de dados fuzzy para o Exemplo 3.4.1. . . 51

3.5 Quartis amostral. . . 51

3.6 Grau de felicidade de casado vs solteiro . . . 52

3.7 Compara¸c˜ao da mediana: Casado vs Solteiro . . . 52

3.8 Compara¸c˜ao da variabilidade: Casado vs Solteiro. . . 52

4.1 Frequˆencia absoluta fuzzy .. . . 58

4.2 Kaplan-Meier para o grupo de ester´oide. . . 64

4.3 Estimativas de Kaplan-Meier para o grupo de ester´oide com tempos fuzzy. 64 4.4 Estimativas de Kaplan-Meier para os grupos de ester´oides de maneira convencional e com tempos de vida fuzzy. . . 65

(20)

Para Ram´on Robres

(21)

Cap´ıtulo 1

Introdu¸

ao

1.1

Motiva¸

ao

A teoria de conjuntos fuzzy proporciona um tratamento matem´atico de alguns ter-mos ligu´ısticos vagos tais como “aproximado”, “em torno de”, “perto”, “curto”, entre outros. Por exemplo, desde o ponto de vista da teoria fuzzy, os n´umeros s˜ao idea-liza¸c˜oes de informa¸c˜oes imprecisas expressas por meio de um valor num´erico. Logo, quando a altura de um indiv´ıduo ´e medida, o valor num´erico registrado inclui algumas imprecis˜oes. Tais imprecis˜oes podem ter sido causadas pelos instrumentos de medi¸c˜ao, limita¸c˜oes humanas, ou informa¸c˜oes tendenciosas pr´evias entre muitas outras causas. Se o valor “real” da altura ´e representado pelo n´umero h, talvez fosse mais correto dizer que o valor da altura ´e de aproximadamente e n˜ao exatamente h (de Barros and Bassa-nezi, 2006), a palavra “ aproximadamente” ´e imprecisa e pode ser modelada pela teoria fuzzy. Como foi observado por Coppi et al. (2006), a teoria fuzzy pode fornecer um valor adicional aos m´etodos estat´ısticos, pois a incerteza inerente ao mundo observ´avel e suas fontes de informa¸c˜ao associados s˜ao combinados para al´em da teoria da probabi-lidade tradicional. Por exemplo,Tanaka (1982) introduziu o conceito de regress˜ao fuzzy enquanto W¨unsche and Naether (2002) caracterizaram o m´etodo dos m´ınimos quadra-dos para vari´aveis aleat´orias fuzzy. Al´em disso, Choi and Kim (2006) estenderam o modelo de regress˜ao fuzzy para um sistema de censura. Dubois (2006) discute algumas

(22)

quest˜oes sobre a teoria de possibilidades e racioc´ınio estat´ıstico e, mais recentemente,

Arabpour and Tata (2008) desenvolveram alguns elementos te´oricos sobre estimativa de parˆametros em modelos de regress˜ao fuzzy. A conex˜ao entre a estimativa de parˆametros e teoria fuzzy tem sido estudada por v´arios autores. Cheng and Mon (1993) estudaram sistemas fuzzy usando intervalos de confian¸ca e Chiang (2001) analisou problemas de programa¸c˜ao linear usando conjuntos de confian¸ca. Geyer and Meeden (2005) esta-beleceram uma rela¸c˜ao entre o conceito de p-valor e estruturas fuzzy, enquanto que

Parchami et al. (2006) introduziram o conceito de intervalos de confian¸ca fuzzy. Por outro lado,Casals et al. (1986) estudaram problemas de decis˜ao fuzzy, relacionando os conceitos de testes de hip´oteses e informa¸c˜ao de natureza fuzzy. Saade and Schwarzlan-der (1990); Saade (1994) propuseram uma caracteriza¸c˜ao dos testes de hip´otese fuzzy enquanto Watanabe and Imaizumi (1993) conectaram os conceitos de estat´ısticas de teste de hip´oteses e hip´oteses fuzzy. Arnold (1996) eArnold (1998) relacionaram com o conceito de teste de hip´oteses fuzzy com m´etodos convencionais de an´alise de dados re-ais. Taheri and Behboodian (1999) generalizaram a abordagem Neyman-Pearson para o teste de hip´oteses sob o ponto de vista fuzzy eFilzmoser and Viertl (2004) introduzeram o conceito de valor-p fuzzy para hip´oteses estat´ısticas usando dados fuzzy. Parchami et al. (2010) apresentaram uma variante do p-valor para o teste de hip´oteses fuzzy de conjuntos de n´umeros reais. Recentemente, Patriota (2013) forneceu uma medida de evidˆencia para testar hip´oteses nulas que est˜ao intrinsecamente relacionadas com a teoria fuzzy. Esta descri¸c˜ao hist´orica e evolutiva mostra como come¸ca a rela¸c˜ao da es-tat´ıstica com a teoria de conjuntos fuzzy. A teoria de conjunto fuzzy ´e uma teoria nova, formulada porZadeh (1965) e posteriormente aritmeticamente enriquecida por Dubois and Prade (1978). Na seguinte se¸c˜ao s˜ao apresentados conceitos te´oricos preliminares da teoria de conjuntos fuzzy, obtendo uma proposta autocontida, para posteriormente entregar a descri¸c˜ao de cada cap´ıtulo da tese.

1.2

Preliminares

´

E importante ressaltar que usaremos alguns conceitos e terminologia da teoria dos conjuntos fuzzy baseados principalmente nos trabalhos de Zadeh (1965), Dubois and Prade (1978) e Nasseri et al. (2012).

(23)

Defini¸c˜ao 1 Conjunto fuzzy. Seja Ω ⊆ Rk um subconjunto n˜ao vazio do espa¸co Euclidiano k-dimensional. Um conjunto fuzzy eA ´e um conjunto de pares ordenados

e

A =  ω, µAe(ω): ω ∈ Ω , onde µAe : Ω → [0, 1] ´e chamada fun¸c˜ao de membership para o conjunto fuzzy eA. Adicionalmente, o conjunto fuzzy vazio e∅´e caracterizado por µ∅e(ω) = 0 para todo ω ∈ Ω ⊆ Rk.

Nota-se que, a teoria dos conjuntos fuzzy estende a teoria dos conjuntos tradicionais, relaxando o conceito de pertinˆencia de elementos de seus respectivos conjuntos. Por um lado, na teoria dos conjuntos convencional considera-se que ω ∈ A (membership um) ou ω 6∈ A (membership zero), ou seja, ´e uma opera¸c˜ao bin´aria. Por outro lado, a teoria dos conjuntos fuzzy considera um grau de pertinˆencia que varia no intervalo [0, 1], ou seja, ω ´e um membro de A com um certo grau e este mesmo elemento ω ´e tambem um membro de Ac com outro grau. A teoria da probabilidade ´e constru´ıda sobre a teoria

dos conjuntos usuais e fornece um n´umero no intervalo [0, 1] para descrever o grau de incerteza que ω ∈ A. A principal diferen¸ca entre a teoria da probabilidade e teoria fuzzy encontra-se na defini¸c˜ao de um conjunto: a primeira considera os conjuntos tradicionais e o outro considera conjuntos fuzzy. Como veremos nesta se¸c˜ao, as propriedades dos conjuntos fuzzy s˜ao muito diferentes das tradicionais. A aplicabilidade dos conjuntos fuzzy ´e enorme na modelagem l´ınguistica (Zadeh, 1975), an´alise de imagem (Sonka et al., 2008), desenho de dispositivos eletrˆonicos (Egusa et al., 1995) e assim por diante. Desde a Defini¸c˜ao1, podemos representar um conjunto comum, usando uma nota¸c˜ao fuzzy. Note-se que se Ω = Rk, qualquer subconjunto usual B ⊆ Rk ´e representado por

defini¸c˜ao por µBe(ω) = 1 para todo ω ∈ B e µBe(ω) = 0 para todo ω 6∈ B. Por exemplo,

seja Ω = R e B = (a, b) um intervalo na linha real com a < b. Ent˜ao, B pode ser escrito em termos de um conjunto fuzzy como eB = {(ω, 1) : ∀ ω ∈ B} ∪ {(ω, 0) : ∀ ω 6∈ B}.

´

E importante ressaltar que fun¸c˜oes de membership e de densidade de probabilidade s˜ao intrinsecamente diferentes. Por exemplo, se π(ω) ´e uma fun¸c˜ao de densidade com π(ω) ≥ 0 para todo ω ∈ Ω e RΩπ(ω)dω = 1, podemos obter uma fun¸c˜ao de

mem-bership, definindo µAe(ω) = C−1π(ω), desde que C = sup

ω∈Ωπ(ω) < ∞. No entanto, o

inverso n˜ao ´e necessariamente verdadeiro, uma vez que uma fun¸c˜ao de membership n˜ao precisa ser integr´avel sobre Ω.

Para as fun¸c˜oes de densidade de probabilidade, ´e comum definir um suporte para caracterizar o conjunto de todos os pontos com uma densidade positiva. Para a fun¸c˜ao de membership, temos a mesma defini¸c˜ao para representar o conjunto de todos os pontos

(24)

com membership positiva no conjunto fuzzy. A Defini¸c˜ao2 formaliza este conceito.

Defini¸c˜ao 2 O suporte de um conjunto fuzzy eA ´e definido como supp( eA) = ω ∈ Ω : µAe(ω) > 0 .

Nota-se que, um elemento ω tem pertinˆencia plena no seu respectivo conjunto fuzzy, quando sua pertinˆencia ´e um. Neste contexto, o elemento ω cont´em completamente todos os recursos exigidos pelo conjunto fuzzy. A Defini¸c˜ao 3 formaliza o conjunto de todos os pontos com a pertinˆencia plena, ou seja, todos os pontos onde as suas fun¸c˜oes de membership s˜ao iguais a um.

Defini¸c˜ao 3 O core de um conjunto fuzzy eA ´e definido como core( eA) = {ω ∈ Ω : µAe(ω) = 1}.

Quando o core tem pelo menos um elemento, temos um conjunto fuzzy normal, (ver Defini¸c˜ao4).

Defini¸c˜ao 4 Um conjunto fuzzy eA ´e chamado normal se seu core ´e n˜ao vazio. Em outras palavras, existe, pelo menos, um ponto ω ∈ Rk com µ

e

A(ω) = 1.

Seja eA um conjunto fuzzy normal, em seguida quanto mais perto µAe(ω0) est´a de

um, mais acreditamos que ω0 encontra-se no core( eA) e quanto mais perto µAe(ω0) esta

de zero, mais acreditamos que ω0 n˜ao esta no core( eA). Ou seja, o grau de ades˜ao de

um elemento pode tamb´em ser visto como uma medida de incerteza (Zadeh, 1975). Seja eA e eB dois conjuntos fuzzy com fun¸c˜ao de membership µAe(ω) e µBe(ω), respec-tivamente, de acordo com Zadeh (1965) (ver t´ambem Wang, 1999), se Ω ⊆ Rk, ent˜ao

as opera¸c˜oes comuns s˜ao definidas da seguinte forma:

1. A ⊆ ee B ⇐⇒ µAe(ω) ≤ µBe(ω), para todo ω ∈ Ω. 2. A ≡ ee B ⇐⇒ µAe(ω) = µBe(ω), para todo ω ∈ Ω. 3. Aec ´e o complementar de eA ⇐⇒ µ

e

Ac(ω) = 1 − µAe(ω), para todo ω ∈ Ω.

4. C = ee A ∪ eB ⇐⇒ µCe(ω) = max{µAe(ω) , µBe(ω)}, para todo ω ∈ Ω.

5. D = ee A ∩ eB ⇐⇒ µDe(ω) = min{µAe(ω) , µBe(ω)}, para todo ω ∈ Ω. 4

(25)

A partir das defini¸c˜oes acima, se considerarmos eΩ = {(ω, 1) ; ω ∈ Ω ⊆ Rk} como

o conjunto fuzzy universal, ent˜ao para qualquer conjunto fuzzy eA com fun¸c˜ao de mem-bership µAe(ω) para todo ω ∈ Ω, temos que eA ⊆ eΩ. Al´em disso, se existe ω0 ∈ Ω

tal que max{µAe(ω0) , µAec(ω0)} < 1 temos que eA ∪ eAc 6= eΩ. Por outro lado, se existe

ω0 ∈ Ω tal que min{µAe(ω0) , µAec(ω)} > 0, temos que eA ∩ eAc 6= e∅. Como o leitor pode ver, estas propriedades n˜ao atendem as leis do terceiro exclu´ıdo e de contradi¸c˜ao da teoria dos conjuntos cl´assicos (para mais informa¸c˜oes ver Goguen, 1967; Wang, 1999;

Lee, 2005).

O conceito de um conjunto fuzzy ´e muito amplo e dif´ıcil de lidar, sem algumas es-pecifica¸c˜oes adicionais. Neste contexto, a pr´oxima defini¸c˜ao nos permite especificar um n´umero fuzzy, que ´e uma extens˜ao natural dos n´umeros reais. No entanto, esta ´ultima defini¸c˜ao depende da convexidade no contexto fuzzy, o qual ´e definido no seguinte.

Defini¸c˜ao 5 (Zadeh, 1965) Um conjunto eA ´e convexo, se e somente se µAe(λω1+ (1 −

λ)ω2) ≥ min{µAe(ω1), µAe(ω2)} para todo ω1, ω2 ∈ Ω e λ ∈ [0, 1].

Nota-se que o conceito de convexidade sob a abordagem fuzzy difere da defini¸c˜ao cl´assica de convexidade em an´alise funcional. Um intervalo fuzzy eA ´e um conjunto fuzzy que satisfaz a condi¸c˜ao de convexidade e normalidade, de modo que o intervalo ´e constitu´ıdo por todos os elementos com fun¸c˜ao de membership um. Um intervalo fuzzy

e

A ´e um n´umero fuzzy quando a cardinalidade do core( eA) ´e igual que 1 (Nasseri et al., 2012). Os n´umeros e intervalos fuzzy s˜ao ´uteis para representar imprecis˜ao e medidas de intervalos, respectivamente. Estes conceitos tˆem m´ultiplas aplica¸c˜oes, por exemplo, na inteligˆencia artificial, processamento de imagem, reconhecimento de voz, ciˆencias biol´ogicas e m´edicas, pesquisa operacional, an´alise de decis˜ao e processamento da in-forma¸c˜ao, economia, geografia, psicologia, lingu´ıstica, etc. Mais aplica¸c˜oes podem ser encontradas emZimmermann (1992) eDubois (1980). Figuras1.1(a), (b) e (c) ilustram um conjunto geral fuzzy, um intervalo fuzzy e um n´umero fuzzy, respectivamente.

Dubois and Prade (1978) definiram a classe das fun¸c˜oes de membership LR (left e right) definidas sobre Ω = R, ´e dizer, a classe de fun¸c˜oes de membership que podem ser inteiramente caracterizadas por trˆes parˆametros, a saber, (m, α, β), e duas fun¸c˜oes L e R. A pr´oxima defini¸c˜ao est´a relacionada com o conceito de n´umeros fuzzy LR-type.

Defini¸c˜ao 6 O n´umero fuzzy eA ´e dito LR-type se existem duas fun¸c˜oes decrescentes L, R : [0, +∞) → [0, 1] com L(0) = R(0) = 1, lim

(26)

0 1 2 3 4 0.0 0.2 0.4 0.6 0.8 1.0 θ Função de Membership (a) 0.0 1.0 2.0 3.0 0.0 0.2 0.4 0.6 0.8 1.0 θ Função de Membership (b) 0.0 0.5 1.0 1.5 2.0 0.0 0.2 0.4 0.6 0.8 1.0 θ Função de Membership (c) F ig u ra 1.1 : R ep re se n ta ¸c˜o es d e (a ) u m co n ju n to fu zz y ge ra l, (b ) u m in te rv alo fu zz y e (c ) u m n ´u m er o fu zz y. 6

(27)

reais positivos m ≥ 0, α > 0, β > 0 tal que µAe(ω) =          L  m − ω α  , para ω ≤ m, R  ω − m β  , para ω ≥ m,

onde m ´e chamado centro de eA, α e β s˜ao chamados de propaga¸c˜oes esquerda e direita, respectivamente.

Se α = β, eA ´e chamado n´umero fuzzy sim´etrico. ´E importante ressaltar que, para uma fun¸c˜ao de membership sim´etrica, tem-se a igualdade L m−ωα  = Rω−mβ  para todo ω ∈ R. Se L e R s˜ao segmentos que come¸cam nos pontos (al, 0) e (ar, 0),

respec-tivamente, e termina em (am, 1), ent˜ao dizemos que eA ´e um n´umero fuzzy triangular.

1.3

Objetivos e organiza¸

ao da pesquisa

Baseado nos conceitos da se¸c˜ao anterior, nossa proposta carateriza trˆes linhas de pes-quisa ou dimens˜oes de estudo:

1. Teoria fuzzy como ferramenta de visualiza¸c˜ao e interpreta¸c˜ao de procedimentos estat´ısticos. Nesta dimens˜ao nosso objetivo ´e usar algumas das ferramentas da teoria fuzzy para enriquecer a analise estat´ıstica, particularmente na an´alise dos conjuntos de confian¸ca depois de obtida a amostra.

2. Teoria fuzzy desde uma perspectiva matem´atica. Nesta dimens˜ao nosso obje-tivo ´e gerar uma ferramenta especifica na area da teoria de conjuntos fuzzy com proje¸c˜oes estat´ısticas, particularmente na defini¸c˜ao de uma ordem.

3. Extens˜oes estat´ısticas para conjuntos de dados fuzzy. Nesta dimens˜ao nosso ob-jetivo ´e extender algumas ferramentas estat´ısticas para a analise de conjuntos de dados fuzzy, particularmente na generaliza¸c˜ao do estimador de Kaplan-Meier para tempos de vida fuzzy.

Baseado nestas trˆes dimens˜oes, caracterizamos trˆes cap´ıtulos da tese, no Cap´ıtulo 2 utilizamos os elementos da teoria de conjuntos fuzzy para resumir, visualizar e inter-pretar conjuntos de confian¸ca depois de obtida a amostra. No Cap´ıtulo 3 ´e apresentada

(28)

Figura 1.2: Diagrama Resumo da proposta

uma proposta de ordem de n´umeros fuzzy. Este cap´ıtulo nasceu como uma necessidade de compara¸c˜ao de dados fuzzy. S˜ao definidos conceitos elementares da estat´ıstica em conjuntos de dados fuzzy, como ´e o caso de frequˆencias, mediana e medidas de variabili-dade. No Cap´ıtulo 4 ´e apresentada uma proposta de an´alise de sobrevivˆencia, baseada no estimador de Kaplan-Meier quando os tempos de vida s˜ao considerados n´umeros fuzzy. Por fim, o Cap´ıtulo 5 ´e dedicado aos coment´arios finais e dire¸c˜oes para trabalhos futuros.

(29)

Cap´ıtulo 2

Uma an´

alise de conjuntos de

confian¸

ca para amostras observadas:

uma abordagem desde conjuntos

fuzzy

2.1

Introdu¸

ao

Como foi mencionado por R.A. Fisher em 1922, o principal objetivo dos m´etodos es-tat´ısticos, ´e a redu¸c˜ao de dados. Em geral, considera-se que as quantidades de inte-resse a partir da popula¸c˜ao alvo podem ser modeladas por medidas de probabilidade, que s˜ao especificadas por relativamente poucas quantidades desconhecidas chamadas parˆametros. Al´em disso, Fisher (1922) apontou que os dados observados constituem toda a informa¸c˜ao relevante sobre os parˆametros desconhecidos. Neste contexto, um dos principais desafios da modelagem estat´ıstica ´e inferir sobre esses parˆametros com base nas informa¸c˜oes fornecidas pelos dados observados. A fim de formalizar o processo infe-rencial, um modelo estat´ıstico ´e tipicamente definido, a saber: (X , F, P), onde X ⊆ Rn

´e o espa¸co amostral, F ´e a σ-´algebra associada e P = {P θ : θ ∈ Θ} ´e uma fam´ılia de medidas de probabilidades amostrais indexadas por um parˆametro θ, onde Θ ⊂ Rk,

(30)

com k < ∞, ´e um conjunto n˜ao vazio chamado espa¸co param´etrico (ver Fisher, 1922;

Basu, 1975; Cox and Hinkley, 1974; Lehmann, 1957; Bernardo et al., 1996; McCul-lagh, 2002). Portanto, a afirma¸c˜ao de Fisher pode ser resumida em encontrar qual probabilidade amostral P θ modela adequadamente os dados observados, ou em outras palavras, encontrar um possivel valor para θ (estimativa pontual) ou subconjunto de Θ (estimativa por conjuntos de confian¸ca) que contenham medidas de probabilidade que ajustam-se adequadamente aos dados observados. Normalmente, o processo inferencial sobre θ envolve um resumo das informa¸c˜oes fornecidas pelo dados observados atrav´es de estat´ısticas suficientes (m´ınimal) que concentram a informa¸c˜ao relevante dos dados. Em geral, em condi¸c˜oes de regularidade, procedimentos estat´ısticos dependem dessas estat´ısticas suficientes, a saber: m´axima verossimilhan¸ca para estimativa pontual, quan-tidade pivotal para conjuntos de confian¸ca ou a teoria de Neyman-Pearson para testes de hip´oteses. No paradigma frequentista, as ferramentas te´oricas s˜ao derivadas de ter um bom desempenho a longo prazo (por exemplo, baixas probabilidades de erro tipo I e tipo II), ou seja, os m´etodos frequentistas devem se comportar bem, em m´edia, sobre todo o espa¸co amostral. Se um experimento for repetido e um conjunto de confian¸ca ´e calculado para cada experimento, ent˜ao o parˆametro do modelo de probabilidade que ajusta-se adequadamente a os dados observados espera-se ser contido em uma percen-tagem desses conjuntos de confian¸ca. Essa percenpercen-tagem ´e determinada pelo n´ıvel de confian¸ca (ver Sec¸c˜ao 2.2 para uma defini¸c˜ao formal de conjuntos de confian¸ca). No entanto, na pr´atica, o experimento ´e repetido uma vez e apenas um conjunto de con-fian¸ca ´e observado. Este conjunto de concon-fian¸ca observado cont´em valores n˜ao aleat´orios, assim, a probabilidade de este conjunto de confian¸ca observado conter qualquer ponto espec´ıfico ou regi˜ao sempre ser´a zero ou um. Portanto, depois de observar a amostra a interpreta¸c˜ao dos conjuntos de confian¸ca n˜ao podem ser feitas em termos de frequˆencias (ver Hoff, 2009, na Se¸c˜ao 3.1.2, p´agina 41, para mais detalhes). Este trabalho mostra como analisar um conjunto de confian¸ca, sem recorrer `a interpreta¸c˜ao de frequˆencia. Isto ´e poss´ıvel atrav´es da utiliza¸c˜ao da teoria dos conjuntos fuzzy desenvolvida por

Zadeh (1965, 1999).

(31)

2.2

Conjuntos de confian¸

ca e fun¸

oes de membership

Como foi mencionado na introdu¸c˜ao, nosso principal objetivo ´e estabelecer uma conex˜ao entre os conceitos cl´assicos de conjuntos de confian¸ca com a teoria dos conjuntos fuzzy. Come¸camos esta sec¸c˜ao apresentando a defini¸c˜ao de um conjunto de confian¸ca geral.

De acordo com um modelo estat´ıstico param´etrico (X , F, P) com P = {P θ, θ ∈ Θ}, onde Θ ⊂ Rk e k < ∞, um conjunto de confian¸ca (1 − α) ´e uma fun¸c˜ao C

α : X → 2Θ,

onde 2Θ ´e a familia de todos os subconjuntos de Θ (conjunto potencia) satisfazendo

P θ(Cα(X) = ∅) = 0, P θ(Cα(X) ∋ θ) ≥ 1 − α e inf

θ∈Θ

P θ(Cα(X) ∋ θ) = 1 − α,

(2.1) para cada θ ∈ Θ, onde X ´e um vetor aleat´orio, (ver Schervish, 1997, p´agina 315). Quando P θ(Cα(X) ∋ θ) = 1 − α para todo θ ∈ Θ, ent˜ao o conjunto de confian¸ca

Cα ´e exato. Procedimentos para a constru¸c˜ao de conjuntos de confian¸ca podem ser

encontrados emBoes et al. (1974);Lehmann and Romano (2006);Beran (1988);Casella and Berger (1990);Cepeda-Cuervo et al. (2008) entre outros. Esses procedimentos s˜ao, em geral, baseados nas quantidades pivotais e estat´ısticas de raz˜ao de verossimilhan¸ca. Aqui, 1 − α ´e chamado n´ıvel de confian¸ca e α ´e chamado n´ıvel de significˆancia (Fisher, 1955). Intuitivamente, a amplitude do intervalo depende do n´ıvel de confian¸ca, isto ´e, quanto maior o n´ıvel de confian¸ca, maior ´e a amplitude do intervalo (ver Henderson and Meyer, 2001).

Nota-se que, depois de observar a amostra, o conjunto de confian¸ca Cα(x) ´e um

conjunto fixo e P θ(Cα(x) ∋ θ) ´e zero ou um, onde x ´e a amostra observada, assim as

declara¸c˜oes de probabilidade em (2.1) s˜ao usadas apenas para atingir um conjunto de confian¸ca adequado. Uma vez que a amostra ´e observada este conjunto de confian¸ca ´e fixo.

Portanto, uma interpreta¸c˜ao p´os-experimento de conjuntos de confian¸ca n˜ao pode ser efetuada em termos de probabilidades sem repeti¸c˜oes experimentais (verHoff, 2009, Se¸c˜ao 3.1.2, p´agina 41, para mais detalhes). Nesta se¸c˜ao, veremos que, embora n˜ao seja poss´ıvel fazer afirma¸c˜oes probabil´ısticas sobre conjuntos de confian¸ca observados, podemos interpretar os conjuntos de confian¸ca observados em termos de conjuntos fuzzy. Mostramos a existˆencia de uma fun¸c˜ao geral de membership que fornece todas as informa¸c˜oes contidas num conjunto de confian¸ca observado Cα(x), para todo n´ıvel

(32)

α ∈ [0, 1]. O seguinte resultado estabelece que a fun¸c˜ao de membership pode ser expressa em termos de um conjunto de confian¸ca observados.

Lema 1 Seja Cα um conjunto de confian¸ca de n´ıvel α ∈ [0, 1] para algum subconjunto

de Θ, onde x ∈ X . Seja C = {Cα(x)}α∈I a fam´ılia que cont´em o respectivo conjunto de

confian¸ca para I ⊂ [0, 1] n˜ao vazio. Definir, para cada θ ∈ Θ,

µΘ,Ce (θ) = max{0, sup{α ∈ I : Cα(x) ∩ {θ} 6= ∅}}, (2.2)

onde sup{∅} = −∞. Usamos a nota¸c˜ao curta µΘe quando a fam´ılia C n˜ao ´e o foco.

Ent˜ao, µΘe ´e uma fun¸c˜ao de membership, isto ´e, µΘe : Θ → [0, 1].

Prova Seja θ ∈ Θ, ent˜ao temos duas situa¸c˜oes: (1) θ ∈ Cα(x) para algums valores de α ∈ I e (2) θ 6∈ Cα(x) para todo α ∈ I. Para a primeira situa¸c˜ao, a prova ´e

simples por constru¸c˜ao, isto ´e, µΘe(θ) ´e ´unica para cada θ ∈ Θ e 0 ≤ µΘe(θ) ≤ 1. Para

a segunda situa¸c˜ao, temos que µΘe(θ) = max{0, sup{α ∈ I : Cα(x) ∩ {θ} 6= ∅}} =

max{0, sup (∅)} = 0. Isto ´e, para cada θ ∈ Θ, temos µΘe(θ) ´e ´unica e 0 ≤ µΘe(θ) ≤ 1.

Nota-se que, um outro caso extremo tamb´em acontece quando θ ∈ Cα(x) para todo

α ∈ I, caso em que temos que µΘe(θ) = max{0, sup{α ∈ I : Cα(x) ∩ {θ} 6= ∅}} =

max{0, sup(I)} = sup(I) ≤ 1.

Para cada regi˜ao de confian¸ca proposta, podemos representar o espa¸co de parˆametros pelo conjunto fuzzy

e

Θ = {(θ, µΘe(θ)); θ ∈ Θ},

onde µΘe(θ) ´e dada na Equa¸c˜ao (2.2). Nota-se que para diferentes conjuntos de confian¸ca

C1,α e C2,α temos diferentes membership, ou seja, µΘ,Ce 1 ≡ µΘe1 e µΘ,Ce 2 ≡ µΘe2, respec-tivamente, onde C1 = {C1,α(x)}α∈I1 e C2 = {C2,α(x)}α∈I2 com I1 ∪ I2 ⊂ [0, 1]. Como consequˆencia disso, os conjuntos fuzzy resultantes ter˜ao diferentes representa¸c˜oes, ou seja,

e

Θ1 = {(θ, µΘe1(θ)); θ ∈ Θ} e eΘ2 = {(θ, µΘe2(θ)); θ ∈ Θ},

respectivamente. Informa¸c˜oes adicionais com rela¸c˜ao `a Equa¸c˜ao (2.2) pode ser encon-trada em Mauris et al. (2001) e mais recentemente, em Patriota (2013). O exemplo a seguir mostra uma aplica¸c˜ao do resultado indicado no Lema1.

(33)

Exemplo 1 Seja X = (X1, X2, . . . , Xn)⊤ uma amostra aleat´oria de uma popula¸c˜ao

normal com m´edia θ e variˆancia conhecida σ2 e seja x a amostra observada. Aqui,

Θ = R e um conjunto de confian¸ca de (1 − α) para θ, usando o m´etodo da quantidade pivotal, ´e dado pelo Cα(x) =

 ¯ x − zα/2σ/√n, ¯x + zα/2σ/√n  , para α ∈ I = [0, 1], onde ¯

x ´e a m´edia amostral e zq ´e o qth-quantil de uma distribui¸c˜ao normal padr˜ao. Assim,

desde o Lema 1 temos que

µΘe(θ) =      2 Φ√n(θ−¯σ x), para θ ≤ ¯x, 2 Φ√n(¯σx−θ), para θ ≥ ¯x,

onde Φ denota a distribui¸c˜ao acumulativa da distribui¸c˜ao normal padr˜ao.

Nota-se que eΘ ´e um n´umero fuzzy LR-type onde L(θ) = 2Φ(√n(θ − ¯x)/σ) para θ ≤ ¯x e R(θ) = 2Φ(√n(¯x − θ)/σ) para θ ≥ ¯x. Figura2.1 mostra a representa¸c˜ao gr´afica da fun¸c˜ao de membership, considerando n = 5, ¯x = 5 e σ2 = 5. Esta figura cont´em

intervalos de confian¸ca para todos os n´ıveis α, isto ´e, para cada α fixo, podemos obter um intervalo de confian¸ca para θ com n´ıvel de confian¸ca (1 − α)100%.

0 2 4 6 8 10 0.0 0.2 0.4 0.6 0.8 1.0 θ Função de Membership

(34)

Exemplo 2 Seja X = (X1, X2, . . . , Xn)⊤ uma amostra aleat´oria de uma popula¸c˜ao

Bernoulli com m´edia θ e seja x a amostra observada. Aqui, Θ = [0; 1] e seja Cα(x) =

h b

θ(1 − κα), bθ(1 + κα)

i

um conjunto de confian¸ca de (1 − α) para θ, onde α ∈ I, bθ ´e a propor¸c˜ao amostral e κq ´e definida como:

κq ∈                      {0}, se q = 1, (0; 1) , se q = 5 8, [1; 2) , se q = 1 8, {2}, se q = 0, Assim, desde o Lema 1, temos que

µΘe(θ) =      κ−11 − θ b θ  , para θ ≤ bθ, κ−1θ b θ − 1  , para θ ≥ bθ,

onde κ−1 denota o inverso de κ q.

Nota-se que eΘ ´e um n´umero fuzzy LR-type onde L(θ) = κ−11 −θ b θ  para θ ≤ bθ e R(θ) = κ−1θ b θ − 1 

para θ ≥ bθ. Al´em disso, I = 0,1 8,

5 8, 1

. Figura 2.2 (a) mostra a representa¸c˜ao gr´afica da fun¸c˜ao de membership, considerando n = 3 e bθ = 1/3. Esta figura apresenta intervalos de confian¸ca para todos os n´ıveis α ∈ I, isto ´e, para cada α fixo, podemos obter um intervalo de confian¸ca de (1 − α) para θ. Figura2.2 (b) retrata a mesma fun¸c˜ao de membership, considerando n = 3 e bθ = 2/3.

Observa¸c˜ao 1 Se o conjunto de confian¸ca Cα(x) ´e centrado no estimador ML, bθ, ent˜ao

temos que µΘe(bθ) = 1. Isto significa que a estimativa ML ´e parte do core do conjunto

fuzzy eΘ. Podemos interpretar o Core( eΘ) como o conjunto de todos os valores dos parˆametros para os quais a distribui¸c˜ao de probabilidade relacionada explica os dados observados de acordo com C. Com efeito, quanto mais pr´oximo θ esta do Core(eΘ), mais acreditamos que o modelo P θ ´e o melhor modelo, conforme C e os dados observados.

O pr´oximo resultado caracteriza o core do eΘ.

(35)

0.0 0.4 0.8 0.0 0.2 0.4 0.6 0.8 1.0 θ Função de Membership (a) 0.0 0.4 0.8 0.0 0.2 0.4 0.6 0.8 1.0 θ Função de Membership (b)

Figura 2.2: (a) Fun¸c˜ao de membership para o parˆametro θ quando n = 3 e bθ = 1/3. (b) Fun¸c˜ao de membership para o parˆametro θ quando n = 3 e bθ = 2/3.

(36)

Teorema 1 Seja µΘe(θ) e I = [0, 1] as quantidades definidas em (2.2), ent˜ao core( eΘ) =

{θ ∈ Θ : θ ∈ Cα(x) ∀α ∈ I}.

Prova 1 Desde a Defini¸c˜ao 3, temos que core( eΘ) = {θ ∈ Θ : µΘe(θ) = 1}. Agora,

temos que µΘe(θ) = 1 se, e so se, sup{α ∈ I : Cα(x) ∩ {θ} 6= ∅} = 1. Este ´ultimo fato

ocorre quando θ ∈ Cα(x) para todo α ∈ I concluindo a prova.

O Teorema 1 caracteriza a forma funcional do core para a fun¸c˜ao de membership definida em (2.2), isto ´e, esses valores em Θ produzem plena pertinˆencia. Por exemplo, no caso do Exemplo 1, core( eΘ) = {¯x} porque µΘe(θ) = 1 so para θ = ¯x. Assim eΘ ´e

chamado conjunto fuzzy normal (ver Defini¸c˜ao 4). Assumindo que existe uma medida de probabilidade Pθ que gera os dados e com base na Defini¸c˜ao 3, Lema 1 e Teorema 1, a interpreta¸c˜ao de θ ∈ Core(eΘ) ´e o valor do parˆametro com o qual a distribui¸c˜ao de probabilidade tem m´axima credibilidade de ter gerado os dados, em termos de C. Em seguida, definimos conjuntos de confian¸ca n˜ao-crescentes em termos do n´ıvel de significˆancia α.

Defini¸c˜ao 7 Seja C = {Cα(x)}α∈I uma fam´ılia de conjuntos de confian¸ca para um

vetor de parˆametros. Dizemos que C ´e uma fam´ılia de conjuntos de confian¸ca n˜ao-crescentes se Cα1(x) ⊆ Cα2(x) para todo 0 ≤ α2 < α1 ≤ 1.

O pr´oximo resultado refere-se `a propriedade de monoticidade de conjuntos de con-fian¸ca com as fun¸c˜oes de membership.

Teorema 2 Seja C = {Cα(x)}α∈I uma fam´ılia de conjuntos de confian¸ca n˜ao crescente. Se θǫ ⊆ θγ onde θν = {θ ∈ Θ; kθ − θ∗k ≤ ν} e core(eΘ) = {θ∗} com ǫ, γ ∈ R+ e ǫ ≤ γ.

Ent˜ao µΘe(θ) ≥ µΘe(θ +

), para todo θ ∈ θǫ e θ+ ∈ (θγ∩ θcǫ).

Prova 2 Se Cα(x) ´e n˜ao crescente, temos que

{α ∈ I : Cα(x) ∩ {θ+} 6= ∅} ⊆ {α ∈ I : Cα(x) ∩ {θ} 6= ∅}.

Usando o supremo desses conjuntos, temos que µΘe(θ) ≥ µΘe(θ

+), concluindo a prova.

Outro resultado importante para conjuntos de confian¸ca n˜ao crescente ´e a rela¸c˜ao entre o conceito de convexidade da Defini¸c˜ao 5, apresentada por Zadeh (1965), e a

(37)

propriedade de monotonicidade. Esta rela¸c˜ao ´e baseada no Teorema 2 concluindo que µΘe(λθ++ (1 − λ)θ) ≥ min{µΘe(θ+), µΘe(θ)}, para todo θ+, θ ∈ Θ e λ ∈ [0, 1] e portanto e

Θ ´e convexa no contexto fuzzy.

O Teorema 2 pode ser usado para comparar fun¸c˜oes de membership. Por exemplo, baseado na seguinte defini¸c˜ao.

Defini¸c˜ao 8 Seja µΘe1, µΘe2 : Θ → [0, 1] duas fun¸c˜oes de membership com o mesmo core. Dizemos que µΘe1 tem supremacia total sobre µΘe2 se µΘe1(θ) ≤ µΘe2(θ) para todo θ ∈ Θ. Eles s˜ao totalmente equivalentes se µΘe

1(θ) = µΘe2(θ) para todo θ ∈ Θ. N´os denotamos a supremacia total por µΘe1 T µΘe2 e equivalencia total por µΘe1 ∼T µΘe2.

A Defini¸c˜ao 8 nos permite comparar dois conjuntos de confian¸ca diferentes, por exemplo, podemos determinar se um conjunto de confian¸ca ´e mais conservativo do que o outro para todos os n´ıveis de confian¸ca. ´E importante ressaltar que a Defini¸c˜ao 8

´e similar `a defini¸c˜ao de superioridade apresentada por Xie and Singh (2013). Note tamb´em que se U ´e uma familia de todas as fun¸c˜oes de membership ent˜ao ≪ estabelece uma rela¸c˜ao de ordem em U e esta rela¸c˜ao ´e uma rela¸c˜ao de ordem da inclus˜ao de conjuntos fuzzy, ver, por exemplo, Fra¨ıss´e (2000). Note-se que, a Defini¸c˜ao 8 ´e forte e n˜ao aplic´avel em muitas situa¸c˜oes, especialmente, se duas fun¸c˜oes de membership tˆem diferentes conjuntos core, em seguida, esta defini¸c˜ao n˜ao funciona. A fim de tornar menos restritivo o conceito supremacia, e portanto incluir mais situa¸c˜oes, definimos as seguintes integrais.

Defini¸c˜ao 9 Sejam µΘe : Θ → [0, 1] uma fun¸c˜ao de membership continua e

Er(µΘe) = Z Θr µΘe(θ) dθ e Θr= {θ ∈ Θ : µΘe(θ) ≥ r}, dizemos que:

1. µΘe1 tˆem r-up-supremacia sobre µΘe2 se E r

e

Θ1) ≤ E r

e

Θ2), que denotamos por µΘe1 ≪Er µΘe2. Elas s˜ao r-up-equivalentes quando E

r e Θ1) = E r e Θ2), que ´e denotado por µΘe1 ∼Er µΘe2 e r ∈ [0, 1] tal que a integral resultante est´a bem definida.

(38)

2. Se µΘe ´e integr´avel com respeito `a medida de Lebesgue em dimens˜ao k = dim(Θ),

µΘe1 temos r-down-supremacia sobre µΘe2 se Er(µΘe1) ≤ Er(µΘe2), que notamos por µΘe1 Er µΘe2. Elas s˜ao r-down-equivalentes quando Er(µΘe1) = Er(µΘe2), que denotamos por µΘe1 ∼Er µΘe2, onde

Er(µΘe) =

Z

Θc r

µΘe(θ) dθ.

Chamamos Er o r-up operador integral e E

r o r-down operador integral.

Nota-se que, se µΘe ´e integr´avel, ent˜ao por Defini¸c˜ao 9, ´e simples que

E0(µΘe) = Er(µΘe) + E r

e

Θ) = E1(µΘe), (2.3)

para todo r ∈ [0, 1]. Adicionalmente, se dim({θ ∈ Θ : µΘe(θ) = 1}) < k, tamb´em

temos que E1 e

Θ) = E0(µΘe) = 0. O Exemplo 3 descreve como calcular as

quantida-des analiticamente Er e E

r. No entanto, para os modelos mais complexos, solu¸c˜oes

anal´ıticas s˜ao praticamente imposs´ıveis de modo que essas integrais devem ser compu-tados numericamente usando qualquer software (por exemplo, MAPLE, MATLAB, Ox, R, SAS).

Exemplo 3 Considere o contexto do Exemplo 1 com variˆancia conhecida σ2. Aqui,

Θr = µ−1Θe ([r, 1]) = [c1r, c2r], onde µΘe(c1r) = µΘe(c2r) = r e c1r ≤ ¯x ≤ c2r. Ent˜ao, c1r = ¯x + σ √ nΦ −1  r 2  , c2r = ¯x − σ √ nΦ −1  r 2  e Er(µΘe) = Z Θc r µΘe(θ) dθ = 4 Z c1r −∞ Φ √ n(θ − ¯x) σ  dθ,

onde Φ(·) a fun¸c˜ao de distribui¸c˜ao cumulativa de uma vari´avel normal padr˜ao. Fazendo uma mudan¸ca de vari´avel u =√n(θ − ¯x)/σ, temos a express˜ao.

Z c1r −∞ Φ √ n(θ − ¯x) σ  dθ = σ n Z √ n(c1r−¯x)/σ −∞ Φ(u) du.

Agora usando a identidadeR Φ(x) dx = xΦ(x)+φ(x), onde φ(·) ´e a fun¸c˜ao densidade de probabilidade de uma vari´avel normal padr˜ao (verJeffrey and Zwillinger, 2007, p. 629),

(39)

temos Er(µΘe) = 4σ √ n √ n(c1r− ¯x) σ Φ √ n(c1r− ¯x) σ  + φ √ n(c1r− ¯x) σ  .

Similarmente, temos que

Er(µΘe) = 4 Z x¯ −∞ Φ √ n(θ − ¯x) σ  dθ − 4 Z c1r −∞ Φ √ n(θ − ¯x) σ  dθ, ent˜ao Er(µΘe) = 4σ n  φ(0) − √ n(c1r− ¯x) σ Φ √ n(c1r− ¯x) σ  − φ √ n(c1r− ¯x) σ  .

A Defini¸c˜ao9ser´a usada para identificar conjuntos de confian¸ca mais conservadores. ´

E poss´ıvel demonstrar que ≪Er, ≪Er e ≪T satisfaz o requisito de ser rela¸c˜ao de ordem (reflexividade, antisimetria e transitividade) e ∼Er, ∼Er e ∼T satisfaze o requisito de ser rela¸c˜ao de equivalˆencia (reflexividade, simetr´ıa e transitividade).

O Teorema 3 estabelece algumas rela¸c˜oes entre os trˆes tipos de supremacias.

Teorema 3 Seja µΘe1, µΘe2 : Θ → [0, 1] duas fun¸c˜oes de membership cont´ınuas e inte-graveis. Ent˜ao,

[∀r ∈ [0, 1], µΘe1 ≪Er µΘe2] ⇐⇒ [∀r ∈ [0, 1], µΘe1 ≪Er µΘe2]. (2.4)

Al´em disso, se core( eΘ1) = core( eΘ2),

[∀r ∈ [0, 1], µΘe1 ≪Er µΘe2] ⇐⇒ [µΘe1 ≪T µΘe2], (2.5)

onde eΘi = {(θ, µΘei) : θ ∈ Θ}.

Prova 3 Seja θ∗ ∈ Θ e k ∈ R e definir µ e

Θ1,k,∗(θ) = µΘe1(θ + kθ

). Nota-se que

Er(µ1) ≤ Er(µ2), para todo r ∈ [0, 1], se e s´o se existe θ∗ ∈ Θ e k ∈ R tal que

e

Θ1,k,∗ ⊆ eΘ2, onde isto ´e a inclus˜ao de conjuntos fuzzy e eΘ1,k,∗ depende de µΘe1,k,∗. Isto implica que Er

1) ≤ Er(µ2) para todo r ∈ [0, 1]. A prova do inverso ´e semelhante. Se

k = 0, temos eΘ1 ⊆ eΘ2 se e s´o se µΘe1 ≪T µΘe2.

(40)

do intervalo ´e maior do que o outro para um n´ıvel de significˆancia espec´ıfico. Um procedimento para identificar um intervalo de confian¸ca mais conservativo do que outro ´e comparando as amplitudes dos intervalos para todos os n´ıveis de significˆancia. Abaixo, vamos definir o conceito conservativo para conjuntos de confian¸ca geral.

Defini¸c˜ao 10 Seja C1 = {C1,α(x)}α∈I1 e C2 = {C2,α(x)}α∈I2 duas fam´ılias de conjuntos de confian¸ca, dizemos que C2 ´e mais conservativo que C1 se as respectivas membership

µΘ,Ce 2 ≡ µΘe2 e µΘ,Ce 1 ≡ µΘe1 satisfazem µΘe1 Er µΘe2 para todo r ∈ [0, 1]. Dizemos que a regi˜ao C2,α(x) ´e up-mais conservativa que C1,α(x) se µΘe1 ≪Eα µΘe2 e down-mais conservativa se µΘe1 ≪Eα µΘe2.

A pr´oxima proposi¸c˜ao estabelece algumas propriedades de eΘ. A prova ´e simples desde Lema 1, Defini¸c˜ao 3e Defini¸c˜ao 8 e por conseguinte, ´e omitida.

Proposi¸c˜ao 1 Seja eΘ = {(θ, µΘe(θ)); θ ∈ Θ} com µΘe(θ) como em (2.2). Ent˜ao, os

seguintes items s˜ao v´alidos.

1. Core( eΘ) = µ−1e

Θ ({1}), onde µ −1

e

Θ ({1}) = {θ ∈ Θ : µΘe(θ) = 1}. Tamb´em, se

core( eΘ) ´e a singleton ent˜ao eΘ ´e um n´umero fuzzy.

2. Se a cardinalidade µ−1Θe ({1}) ´e maior que 1, ent˜ao eΘ ´e um conjunto fuzzy normal.

3. Se µ−1 e

Θ ({1}) = Θ, ent˜ao eΘ = {(θ, 1); θ ∈ Θ}.

4. Seja eΘ1 e eΘ2 duas representa¸c˜oes fuzzy sobre o espa¸co paramˆetrico Θ associados

com C1,α(x) e C2,α(x) respectivamente. Se C1,α(x) ⊆ C2,α(x) para todo α ∈ [0, 1],

ent˜ao µΘe1 ≪ µΘe2 e C2,α(x) ´e mais conservativo que C1,α(x) para todo α ∈ [0, 1]. As Defini¸c˜oes8,9e10s˜ao ferramentas para comparar conjuntos de confian¸ca atrav´es de suas respectivas fun¸c˜oes de membership. As fun¸c˜oes de membership utilizadas s˜ao definidas no mesmo espa¸co param´etrico. No entanto, h´a situa¸c˜oes em que estamos interessados em comparar conjuntos de confian¸ca a partir de um vector de parˆametros parcial com conjuntos de confian¸ca a partir de um vector de parˆametros completo (ver Exemplo 4). Portanto, uma fun¸c˜ao de membership para o vetor de parˆametros parcial ´e definido a seguir.

Seja θ = (λ⊤, ψ⊤)⊤, onde λ e ψ s˜ao vetores com dimens˜ao k

1 e k2 com k = k1+ k2.

Sem perda de generalidade, seja C∗

α(x) un conjunto de confian¸ca para λ e seja Λ o 20

(41)

conjunto onde λ varia. Ent˜ao, a fun¸c˜ao de membership para λ pode ser definida simplesmente por µΛe : Λ → [0, 1] tal que

µeΛ(λ) = max{0, sup{α ∈ [0, 1] : Cα∗(x) ∩ {λ} 6= ∅}}. (2.6)

As mesmas propriedades da membership (2.2) e as defini¸c˜oes acima s˜ao v´alidos para esta fun¸c˜ao parcial de membership.

2.3

Exemplos

Nesta se¸c˜ao, apresentaremos alguns exemplos cl´assicos para conjuntos de confian¸ca. Cada exemplo apresenta a rela¸c˜ao entre conjunto de confian¸ca e fun¸c˜ao de membership associada. Al´em disso, s˜ao computados os operadores integrais r-up e down.

Nosso primeiro exemplo considera a compara¸c˜ao dos intervalos de confian¸ca para a m´edia de uma popula¸c˜ao normal em duas situa¸c˜oes: (a) quando a variˆancia da po-pula¸c˜ao ´e conhecida (Cα(x)), onde λ ´e a m´edia da popula¸c˜ao; e (b) quando a variˆancia

da popula¸c˜ao ´e desconhecida (C∗

α(x)), com θ = (λ, σ2)⊤ ∈ Θ ≡ R × R+, onde λ ´e a

m´edia da popula¸c˜ao, σ2 ´e a variˆancia populacional e Λ ≡ R. Em ambos os casos, o m´etodo para a constru¸c˜ao de intervalos de confian¸ca baseia-se na quantidade pivotal.

Exemplo 4 (Distribui¸c˜ao Normal) Seja X = (X1, X2, . . . , Xn)⊤uma amostra aleat´oria

desde uma popula¸c˜ao normal e seja x a amostra abservada, ¯x a m´edia amostral e s2 a

variˆancia amostral.

(a1) Para o caso da variˆancia conhecida: θ ´e a m´edia populacional, Θ = R e um

conjunto de confian¸ca de n´ıvel (1 − α) para θ usando o m´etodo da quantidade pivotal ´e dado por C1,α(x) =

 ¯ x − zα/2 √ 2/√n, ¯x + zα/2 √ 2/√n, onde zq ´e o

qth-quantil da distribui¸c˜ao normal padr˜ao.

(a2) Para o caso da variˆancia desconhecida: θ = (λ, σ2), onde λ ´e a m´edia da

po-pula¸c˜ao e σ2 ´e a variˆancia populacional, Θ = R × R+, Λ = R e o conjunto de

confian¸ca de n´ıvel (1 − α) para a m´edia populacional λ usando o m´etodo da quan-tidade pivotal ´e dado por C2,α(x) =

 ¯

x − tα/2,νs/√n, ¯x + tα/2,νs/√n



, onde tq ´e o

q th-quantil da distribui¸c˜ao t-Student com ν graus de liberdade. Assim, desde o Lema 1 temos o seguinte:

(42)

(a1) A fun¸c˜ao de membership para o caso da variˆancia conhecida ´e µΘe : R → [0, 1] tal que µΘe(θ) =      2 Φ√n(θ−¯σ x), para θ ≤ ¯x, 2 Φ√n(¯σx−θ), para θ ≥ ¯x.

(a2) A fun¸c˜ao de membership parcial para o caso da variˆancia desconhecida ´e µΛe :

R→ [0, 1] tal que µΛe(λ) =      2 T √n(λ−¯s x); n − 1, para λ ≤ ¯x, 2 T √n(¯x−λ)s ; n − 1, para λ ≥ ¯x,

onde T (·; ν) denota a fun¸c˜ao de distribui¸c˜ao acumulativa (fdc) da distribui¸c˜ao t-Student com ν graus de liberdade.

Na Figura 2.3 representa as quantidades relacionadas com o Exemplo 4: (a) apre-senta as fun¸c˜oes de membership, (b) apreapre-senta o gr´afico de (r, Er) para r ∈ [0, 1] e (c)

apresenta o gr´afico de (r, Er) para r ∈ [0, 1] para ambos os intervalos de confian¸ca.

Considera-se que n = 5, ¯x = 5 e σ2 = s2 = 5. As linhas cont´ınuas e tracejadas

re-presentam casos (a1) e (a2), respectivamente. Para este exemplo temos que µΘe ≪T µΛe

(ver Figura 2.3(a)). Portanto, pelo Teorema 3, concluimos que C2 = {C2,α(x)}0≤α≤1 ´e

mais conservativo que C1 = {C1,α(x)}0≤α≤1. Desde Figuras 2.3(b)–(c) observamos que

µΘe tem r-down(up)-supremacia sobre µΛe para todo r ∈ [0, 1], ´e dizer, µΘe ≪Er µΛe e µΘe ≪Er µeΛ para todo r ∈ [0, 1]. N˜ao sempre existe r-up ou r-down supremacia para

todo r ∈ [0, 1]. Os exemplos a seguir apresentam situa¸c˜oes onde a supremacia total n˜ao ocorre.

Exemplo 5 (Distribui¸c˜ao exponencial) Seja X = (X1, . . . , Xn)⊤uma amostra aleat´oria

de uma distribui¸c˜ao exponencial com taxa θ, seja x a amostra observada e ¯x a m´edia amostral. Ent˜ao, o intervalo de confian¸ca de n´ıvel 1 − α para θ ´e:

(a1) Usando o m´etodo da quantidade pivotal (verRoss, 2009, p. 267)

C1,α(x) = " χ2 2n;1−α/2 2n¯x ; χ2 2n;α/2 2n¯x # . 22

(43)

0 2 4 6 8 10 0.0 0.2 0.4 0.6 0.8 1.0 θ Funções de Membership (a) µΘ µΛ 0.0 0.4 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 r Oper ador Er Er(µΘ) Er(µΛ) (b) 0.0 0.4 0.8 0 1 2 3 4 r Oper ador E r Er(µΘ) Er(µΛ) (c)

Figura 2.3: (a) Fun¸c˜oes de membership para a m´edia da popula¸c˜ao de uma distribui¸c˜ao normal quando a variˆancia ´e conhecida (linha s´olida) e quando a variˆancia ´e desconhe-cida (linha pontilhada);(b) Operador integral r-down para as respectivas memberships; (c) O operador integral r-up para as respectivas memberships. S˜ao considerados n = 5, ¯

(44)

(a2) Utilizando a aproxima¸c˜ao assint´otica (Guerriero, 2012) C2,α(x) =  1 ¯ x − zα/2 ¯ x√n; 1 ¯ x+ zα/2 ¯ x√n  , onde χ2

ν;q ´e o q-th quantil da distribui¸c˜ao qui-quadrado com ν graus de liberdade.

Assim, desde o Lema 1 temos o seguinte.

(a1) A fun¸c˜ao de membership para C1 = {C1,α}0≤α≤1 ´e µΘe1 : R → [0, 1] tal que

µΘe1(θ) =      2  1 − χ2 2nθ¯x; n − 1  , para θ ≤ 1/¯x, 2 χ2 2nθ¯x; n − 1, para θ ≥ 1/¯x.

(a2) A func¸c˜ao de membership para C2 = {C2,α}0≤α≤1 ´e µΘe2 : R → [0, 1] tal que

µΘe2(θ) =      2 Φ(√n(¯xθ − 1)), para θ ≤ 1/¯x, 2 Φ(√n(1 − ¯xθ)) para θ ≥ 1/¯x,

onde χ2(·; ν) ´e a fun¸c˜ao de distribui¸c˜ao acumulativa qui-quadrado com ν graus de

liberdade.

A Figura2.4representa as quantidades relacionadas com o Exemplo5: (a) apresenta as fun¸c˜oes de membership, (b) apresenta o gr´afico de (r, Er) para r ∈ [0, 1] e (c)

apresenta o gr´afico de (r, Er) para r ∈ [0, 1] para ambos os intervalos de confian¸ca.

considerando-se n = 10 e ¯x = 1. Em todos os casos, as linhas cont´ınuas e pontilhadas representam casos (a1) e (a2), respectivamente.

A Figura 2.4(a) mostra que para alguns θ ∈ Θ⊂ Θ temos µ e

Θ1(θ) ≤ µΘe2(θ) e para alguns θ ∈ Θ′

⊂ Θ temos µΘe2(θ) ≤ µΘe1(θ). Isto ´e, a rela¸c˜ao de ordem n˜ao ´e a mesma para todos θ ∈ Θ. No entanto, Defini¸c˜ao 8 afirma que a rela¸c˜ao de ordem deve ser cumprida para todos θ ∈ Θ. Na Figura 2.4(b) podemos observar que a desigualdade Er(µΘe1) ≤ Er(µΘe2) vale para r ∈ [0.81; 1.00]. Consequentemente µΘe1 tem r-down-supremacia sobre µΘe2 para todo r ∈ [0.81; 1] (ver Defini¸c˜ao 9). Para r = 0.81, temos Er(µΘe1) = Er(µΘe2) = 0.55, enquanto que para valores de r ≤ 0.81 observamos que Er(µΘe1) e Er(µΘe2) tˆem entrela¸camentos. Na Figura 2.4(c) observa-se que a rela¸c˜ao

(45)

Er e

Θ2) ≤ E r

e

Θ1) ´e verdadeira para r ∈ [0.40; 0.84], ent˜ao observamos que µΘe2 tem r-up-supremacia sobre µΘe1 para todo r ∈ [0.4; 0.84]. Para r = 0.4 e r = 0.84, temos Er e Θ1) = E r e Θ2) = 0.41 e E r e Θ1) = E r e Θ2) = 0.14, respectivamente. Para r ≥ 0.84 observa-se que µΘe1 tem r-up-supremacia sobre µΘe2.

−1 0 1 2 3 0.0 0.2 0.4 0.6 0.8 1.0 θ Funções de Membership µΘ1 µΘ2 (a) 0.0 0.4 0.8 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 r Oper ator Er Er(µΘ1) Er(µΘ2) (b) 0.0 0.4 0.8 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 r Oper ador E r Er(µ Θ1) Er(µΘ2) (c)

Figura 2.4: (a) Fun¸c˜oes de membership para a taxa exponencial com base na quanti-dade pivotal (linha s´olida) e com base na aproxima¸c˜ao normal (linha pontilhada);(b) O operador integral r-down para as respectivas memberships; (c) O operador integral r-up para as respectivas memberships. S˜ao considerados n = 5 e ¯x = 1.

Exemplo 6 (Distribui¸c˜ao Poisson) Seja X = (X1, . . . , Xn)⊤ uma amostra aleat´oria

de uma distribui¸c˜ao de Poisson com taxa θ, e seja x a amostra observada e ¯x a m´edia amostral. Ent˜ao, o intervalo de confian¸ca de n´ıvel 1 − α para θ ´e:

(a1) usando a quantidade pivotal (Sahai and Khurshid, 1993)

C1,α(x) = " χ2 2n¯x;1−α/2 2n ; χ2 2n¯x+2;α/2 2n # ,

(46)

(a2) utilizando a aproxima¸c˜ao assint´otica (Correa, 2007) C2,α(x) =  ¯ x −zα/2 √ ¯ x √ n ; ¯x + zα/2√x¯ √ n  .

Assim, desde o lema 1 temos o seguinte.

(a1) A fun¸c˜ao de membership para C1 = {C1,α}0≤α≤1 ´e µΘe1 : R → [0, 1] tal que

µΘe1(θ) =      2  1 − χ2 2nθ; 2n¯x  , para θ ≤ ¯x, 2 χ2(2nθ; 2n¯x + 2), para θ ≥ ¯x.

(a2) A fun¸c˜ao de membership para C2 = {C2,α}0≤α≤1 ´e µΘe2 : R → [0, 1] tal que

µΘe2(θ) =          2  1 − Φ  n(¯x−θ) ¯ x  , para θ ≤ ¯x, 2  1 − Φ  n(θ−¯x) √ ¯ x  para θ ≥ ¯x.

A Figura2.5representa as quantidades relacionadas com o Exemplo6: Figura2.5(a) apresenta as fun¸c˜oes de memberships, Figura2.5(b) apresenta o gr´afico de (r, Er) para

r ∈ [0, 1] e Figura 2.5(c) apresenta o gr´afico de (r, Er) para r ∈ [0, 1] para ambos os

intervalos de confian¸ca. Considerando n = 5 e ¯x = 4. Em todos os gr´aficos, as linhas cont´ınuas e pontilhadas representam os casos (a1) e (a2), respectivamente. Desde a

Figura2.5(a), observa-se que a supremacia total n˜ao ocorrer (ver Defini¸c˜ao8). Figuras

2.5(b)–(c) mostram que µΘe1 tem r-down(up)-supremacia sobre µΘe2 para todo r ∈ [0, 1].

Exemplo 7 Seja X1, . . . , Xn uma amostra aleat´oria de uma distribui¸c˜ao normal com

m´edia θ1 e variˆancia θ2. O conjuntos de confin¸ca de n´ıvel de significancia α para

θ = (θ1, θ2)⊤ ´e dado por:

Cα(x) = h x − tα1/2,n−1 p s2/n; x − t α1/2,n−1 p s2/ni× " (n − 1)s2 χ2 α2/2,n−1 ; (n − 1)s 2 χ2 1−α2/2,n−1 # ,

onde 1 − α = (1 − α1)(1 − α2), tq,ν ´e o qth quantil da distribui¸c˜ao t-Student com ν grau

de liberdade e χ2

q,ν ´e o qth quantil da distribui¸c˜ao qui-quadrada com ν grau de liberdade. 26

(47)

0 2 4 6 8 0.0 0.2 0.4 0.6 0.8 1.0 θ Funções de Membership µΘ1 µΘ2 (a) 0.0 0.4 0.8 0.0 0.5 1.0 1.5 r Oper ador Er Er(µΘ1) Er(µΘ2) (b) 0.0 0.4 0.8 0.0 0.5 1.0 1.5 r Oper ador E r Er(µ Θ1) Er(µΘ2) (c)

Figura 2.5: (a) Fun¸c˜oes de membership para a taxa Poisson com base na quantidade pivotal (linha s´olida) e com base na aproxima¸c˜ao normal (linha pontilhada); (b) O operador integral r-down para as respectivas memberships; (c) O operador integral r-up para as respectivas memberships. S˜ao considerados n = 5 e ¯x = 4.

(48)

Desde o Lema1 temos a seguinte superf´ıcie µΘe(θ) =      4 T √n(θ1−x) s ; n − 1   1 − χ2(n−1)s2 θ2  ; n − 1, para θ2 ≤ s2 e θ1 ≤ x, 4 T √n(x−θ1) s ; n − 1  χ2(n−1)s2 θ2 ; n − 1  , para θ2 ≥ s2 e θ1 ≥ x,

onde χ(·; ν) denota a fdp da distibui¸c˜ao qui-quadrado com ν grau de liberdade. Aqui, Θr = µ−1Θe ([r, 1]) = [c11r, c12r] × [c21r, c22r], onde µΘe(c11r) = µΘe(c12r) = µΘe(c21r) = µΘe(c22r) = r, c11r ≤ ¯x ≤ c12r e c21r ≤ s2 ≤ c22r. Ent˜ao, c11r = ¯x − s √ nT −1  r 2, n − 1  , c12r = ¯x + s √ nT −1  r 2, n − 1  , c21r = (n − 1)s 2 χ−2  r 2, n − 1 , c22r = (n − 1)s 2 χ−2  1 − r2, n − 1  e Er(µΘe) = Z Θc r µΘe(θ) dθ = 8 Z c11r −∞ Z c21r −∞ T √ n(x − θ1) s ; n − 1  χ2  (n − 1)s2 θ2 ; n − 1  dθ1dθ2,

onde T (·; ν) e χ2(·; ν) s˜ao as fun¸c˜oes de distribui¸c˜ao acumulativas da t-Student e

qui-quadrado com ν grau de liberdade, respectivamente. Similarmente, temos que

Er e Θ) = 8 Z x¯ −∞ Z s2 −∞ T √ n(x − θ1) s ; n − 1  χ2  (n − 1)s2 θ2 ; n − 1  dθ1dθ2− 8 Z c11r −∞ Z c21r −∞ T √ n(x − θ1) s ; n − 1  χ2  (n − 1)s2 θ2 ; n − 1  dθ1dθ2,

Estas integrais podem ser calculadas numericamente utilizando um software (por exem-plo, MAPLE, MATLAB, Ox, R, SAS). Figura 2.6 apresenta a fun¸c˜ao de membership com n = 5, ¯x = 5, s2 = 5 e o r-down e o r-up operador integral para as respectivas fun¸c˜oes

de membership.

Na Figura 2.6(a) dois planos s˜ao tra¸cados, com altura de 0,3 e 0,8 para mostrar as mudan¸cas das regi˜oes de confian¸ca. Na Figura 2.6(b) o gr´afico de (r, Er) e (r, Er) s˜ao

apresentados. Neste caso, pode ser observado que Er = Er quando r = 0.253, como

indicado pela linha vertical s´olida.

(49)

(a) (b)

Figura 2.6: (a) Superf´ıcie de membership para a m´edia e variˆancia de uma popula¸c˜ao normal; (b) o operador integral r-down e r-up para a membership. Considerando-se n = 5, ¯x = 5 e s2 = 5.

Basicamente, quando o profissional quer comparar conjuntos de confian¸ca gerais, ´e suficiente tra¸car gr´aficos de (r, Er(µΘe)) e (r, Er(µΘe)) a fim de analisar os

comporta-mentos. Al´em disso, para os conjuntos de confian¸ca uni ou bidimensionais, o gr´afico de (θ, µΘe(θ)) pode ser utilizado em lugar dos habituais conjuntos de confian¸ca com um n´ıvel de confian¸ca pr´e-fixo, obtendo muito mais informa¸c˜oes.

(50)

2.4

Aplica¸

oes

Nesta se¸c˜ao apresentaremos uma aplica¸c˜ao baseada no conjunto de dados reais, mos-trando a rela¸c˜ao entre um conjunto de confian¸ca e a fun¸c˜ao de membership associada. Os operadores integrais r-up e down s˜ao tamb´em calculados. Baseado em Fagerland et al. (2014), considerarmos um experimento onde s˜ao observados N pares de eventos Bernoulli designados por A e B. Neste caso, os resultados s˜ao registados como 1 (su-cesso) e 2 (fracasso), e a ith par observado ´e denotado por (Yi1, Yi2). Os resultados do

experimento podem ser resumidos numa tabela de contingˆencia de 2 × 2 (ver Tabela

4.2). Note-se que, cada nkl corresponde ao n´umero de pares (Yi1, Yi2) com resultados

Yi1= k e Yi2 = l.

Tabela 2.1: Tabela de Contingˆencia de 2 × 2.

Evento B

Sucesso Falha Total

Evento Sucesso n11 n12 n1+

A Falha n21 n22 n2+

Total n+1 n+2 N

Nesta aplica¸c˜ao, estamos interessados num intervalo de confian¸ca de (1 − α) para a diferen¸ca das probabilidades de sucesso dadas pelas propor¸c˜oes marginais, isto ´e, θ = p1+ − p+1, onde p1+ ´e a probabilidade de sucesso para o evento A e p+1 ´e a

probabilidade de sucesso para o evento B. Para isso, usamos os seguintes m´etodos: Wald, Wald com corre¸c˜ao de continuidade, Wald com ajuste pseudo-frequˆencia Agresti-Min e Wald com ajuste Bonett-Price Laplace. Para mais detalhes destes m´etodos, ver

Fagerland et al. (2014);Newcombe (1998a,b).

Usando a mesma nota¸c˜ao que noFagerland et al. (2014), os intervalos de confian¸ca para θ s˜ao os seguintes:

1. M´etodo de Wald C1,α(x) = bθ ± zα/2 N p n12+ n21− (n12− n21)2/N.

2. M´etodo de Wald com corre¸c˜ao de continuidade

C2,α(x) = bθ ± zα/2 N p n12+ n21− (|n12− n21| − 1)2/N. 30

(51)

3. M´etodo de Wald com ajuste pseudo-frequˆencia Agresti-Min C3,α(x) = e n12− en21 e N ± zα/2 e N q en12+ en21− (en12− en21)2/ eN , onde en12= n12+ 1/2, en21= n21+ 1/2 e eN = N + 2. 4. M´etodo de Wald com ajuste Bonett-Price Laplace

C4,α(x) = ep12− ep21± zα/2

q

(ep12+ ep21− (ep12− ep21)2)/( eN + 2),

onde ep12 = (n12+ 1)/(N + 2) e ep21 = (n21+ 1)/(N + 2).

Para cada m´etodo α ∈ I = [0, 1] e zq ´e o qth-quantil da distribui¸c˜ao normal padr˜ao.

Portanto, as fun¸c˜oes de membership para cada m´etodo s˜ao dadas por:

1. M´etodo de Wald: µΘe1(θ) =            2Φ p (θ − bθ)N n12+ n21− (n12− n21)2/N ! , para θ ≥ bθ, 2Φ p (bθ − θ)N n12+ n21− (n12− n21)2/N ! , para θ ≤ bθ.

2. M´etodo de Wald com corre¸c˜ao de continuidade:

µΘe2(θ) =            2Φ p (θ − bθ)N n12+ n21− (|n12− n21| − 1)2/N ! , para θ ≥ bθ, 2Φ p (bθ − θ)N n12+ n21− (|n12− n21| − 1)2/N ! , para θ ≤ bθ.

3. M´etodo de Wald com ajuste pseudo-frequˆencia Agresti-Min:

µΘe3(θ) =                2Φ   (θ − ((en12− en21)/ eN) eN q en12+ en21− (en12− en21)2/ eN   , para θ ≥ (en12− en21)/ eN, 2Φ  q (bθ − θ)N en12+ en21− (en12− en21)2/ eN   , para θ ≤ (en12− en21)/ eN.

Referências

Documentos relacionados

In this study clay mineral assemblages, combined with other palaeoenvironmental data, were studied in a core recovered from the outer sector of the Ria de Vigo, a temperate

Dessa forma, a partir da perspectiva teórica do sociólogo francês Pierre Bourdieu, o presente trabalho busca compreender como a lógica produtivista introduzida no campo

O termo extrusão do núcleo pulposo aguda e não compressiva (Enpanc) é usado aqui, pois descreve as principais características da doença e ajuda a

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

Os principais objectivos definidos foram a observação e realização dos procedimentos nas diferentes vertentes de atividade do cirurgião, aplicação correta da terminologia cirúrgica,

psicológicos, sociais e ambientais. Assim podemos observar que é de extrema importância a QV e a PS andarem juntas, pois não adianta ter uma meta de promoção de saúde se

O CES é constituído por 54 itens, destinados a avaliar: (a) cinco tipos de crenças, a saber: (a1) Estatuto de Emprego - avalia até que ponto são favoráveis, as