• Nenhum resultado encontrado

Uma Introdução à Teoria Axiomática dos Conjuntos

N/A
N/A
Protected

Academic year: 2021

Share "Uma Introdução à Teoria Axiomática dos Conjuntos"

Copied!
155
0
0

Texto

(1)

Uma Introdução à Teoria Axiomática dos Conjuntos

Renan Maneli Mezabarba

(versão pessoal)

São Carlos - SP

2012

(2)

Renan Maneli Mezabarba

Uma Introdução à Teoria Axiomática dos Conjuntos

Monografia apresentada ao Curso de Matemática da UFMS, como requisito parcial para obtenção do grau de LICENCIADO em Matemática.

Orientador: Elias Tayar Galante Mestre em Matemática pela Unicamp

Aquidauana - MS

2011

(3)

versão pessoal: margens e capa alteradas.

(4)
(5)

Aos meus pais, Nadir e Antonio, E à minha tia, Nilda.

(6)

Agradecimentos

Primeiramente, agradeço aos meus pais, Nadir e Antonio, sem os quais eu não existiria em qualquer esfera de interpretação.

Aos professores Marcelo Dias Passos e Rodrigo Roque Dias, pela inspiração, suporte bibliográfico e conselhos, não apenas para a realização deste trabalho, mas para a vida acadêmica de modo geral.

Pelas horas de discussão, leituras, sugestões e paciência desprendidas pelos demais vértices da Santíssima Trindade, Fernando da Silva Batista e Thales Fernando Vilamaior Paiva.

Ao Professor Elias Tayar Galante, pela orientação, pelos pertinentes avisos e por suas lições de humanidade e cosmo-ética, meus sinceros cosmo-agradecimentos.

A todos os amigos, supracitados ou não, que ajudaram direta ou indiretamente,

(7)

In re mathematica ars proponendi quaestionem pluris facienda est quam solvendi

(Na Matemática, a arte de propor questionamentos é mais importante do que a arte de resolvê-los).

(8)

Resumo

A Teoria dos Conjuntos ocupa papel de destaque como fundamentação teórica das disciplinas matemáticas. Neste trabalho, faz-se uma breve contextualização dos principais aspectos do desenvolvimento da Teoria dos Conjuntos ao longo da História, enfocando os trabalhos de Cantor, Dedekind e Zermelo. Os nove axiomas do sistema Zermelo-Fraenkel-Choice (ZFC) são postulados e discutidos. As principais operações entre conjuntos são definidas e suas propriedades elementares são demonstradas. Números ordinais, cardinais e naturais são estabelecidos em ZFC, bem como suas características básicas. Questões de consistência e independência de axiomas são tratadas suscintamente e de maneira informal. Demonstra-se a equivalência lógica entre o Axioma da Escolha e algumas proposições na Matemática, bem como prova-se que a Hipótese Generalizada do Continuum implica o Axioma da Escolha.

Palavras-chave: Teoria dos Conjuntos; Axiomática Zermelo-Fraenkel-Choice; Equivalências do Axioma da Escolha.

Abstract

The Set Theory occupies an important role as theoretic foundation of mathematics disciplines. This work makes a brief contextualization about the main features of the development of Set Theory along the History, centering the efforts of Cantor, Dedekind and Zermelo. The nine axioms of Zermelo-Fraenkel-Choice system (ZFC) are postulated and discussed. The main operations between sets are defined and their elementary properties are proved. Ordinal, cardinal and natural numbers are founded in ZFC, as well their basics properties. Topics about consistency and independence of axioms are suddenly argued in an informal way. It’s proved the logical equivalence among the Axiom of Choice and some mathematical propositions, as well is proved that the Generalized Continuum Hypothesis implies the Axiom of Choice.

Key-words: Set Theory; Zermelo-Fraenkel-Choice Axiomatic System; Equivalences of Axiom of Choice.

(9)

Sumário

Introdução... 7

Capítulo 1 — O Paraíso Criado por Cantor ... 9

Capítulo 2 — Desenvolvimentos Iniciais em ZFC ... 27

2.1 . Preliminares: Alfabeto e Definições... 27

2.2 . O Sistema de Axiomas Zermelo-Fraenkel-Choice ... 32

2.3 . Operações Básicas Entre Conjuntos ... 45

Capítulo 3 — Relações e Funções... 63

3.1 . Relações... 63

3.2 . Relações de Equivalência ... 70

3.3 . Funções ... 75

Capítulo 4 — Conjuntos Bem Ordenados e Números Ordinais... 92

4.1 . Conjuntos Bem Ordenados ... 92

4.2 . Números Ordinais e a Recursão Transfinita... 102

4.3 . Números Naturais e Conjuntos Finitos... 119

Capítulo 5 — O Axioma da Escolha ... 129

5.1 . Consistência e Independência... 129

5.2 . Formulações Equivalentes do Axioma da Escolha ... 131

5.3 . A Hipótese Generalizada do Continuum ... 139

Conclusão ... 142

Apêndice A — Leis do Cálculo Proposicional ... 143

Apêndice B — Conjuntos Bem Fundados ... 145

Bibliografia... 147

(10)

Introdução

Esta monografia tem por objetivo desenvolver os tópicos básicos da Teoria dos Conjuntos de acordo com o sistema de axiomas Zermelo-Fraenkel-Choice (ZFC). Para tanto, seguimos Hrbacek & Jech (1999) e Suppes (1972) como referência principal para a elaboração do texto e da teoria. No entanto, como existem muitas formulações equivalentes de ZFC, não abandonamos a visão de outros autores, como Kunen (1980), Fraenkel, Bar-Hillel & Levy (1973) e Levy (1979), que foram exaustivamente consultados durante a elaboração deste trabalho, principalmente na preparação dos tópicos sobre cardinais, ordinais e o Axioma da Escolha.

Intuitivamente, um conjunto é uma coleção de objetos. Tomado de maneira mais abstrata, podemos considerá-lo como uma coletânea de elementos que possuem alguma propriedade em comum. Se nos restringirmos apenas às relações de pertinência e inclusão, veremos que a noção de conjuntos é quase tão primitiva quanto à própria ideia de número — numa manada de mamutes, por exemplo, temos o conjunto dos mamutes que pertencem a esta manada.

Por muito tempo, matemáticos utilizaram tal conceito puramente intuitivo na formulação dos muitos ramos da matemática que brotaram e chegaram até nós nos dias de hoje. Contudo, no início do século XX, uma série de paradoxos estremeceu as bases da imensa árvore da Matemática. Felizmente, tais tremores levaram os matemáticos a abandonarem a abordagem intuitiva e “ingênua” e assumirem o rigor e a lógica formal como bases para a reconstrução de toda a Matemática: a axiomatização.

O primeiro capítulo desta monografia dedica-se a uma breve contextualização sobre a História da Teoria dos Conjuntos, desde seus primórdios ingênuos ou intuitivos até sua axiomatização. Destacamos os papéis fundamentais de Georg Cantor e Richard Dedekind, no estabelecimento da Teoria dos Conjuntos como disciplina matemática. Posteriormente, citamos as contribuições de Ernst Zermelo, Abraham Fraenkel e Thoralf Skolem pela “construção” do primeiro sistema axiomático que estabilizou as bases da Teoria dos Conjuntos após a sucessão de paradoxos descobertos entre o final do século XIX e início do século XX, sobre os quais também discutimos.

No segundo capítulo desenvolvemos os tópicos básicos da teoria axiomática dos conjuntos de Zermelo-Fraenkel-Choice. Estabelecemos a linguagem básica a ser utilizada ao

(11)

longo do texto e postulamos os nove axiomas de ZFC. Definimos também as relações entre conjuntos, como inclusão, interseção, união, produto cartesiano, etc. e demonstramos suas propriedades elementares.

O terceiro capítulo destina-se à fundamentação em ZFC do conceito de relação binária. Definimos domínio, imagem e contradomínio de relações e provamos alguns resultados concernentes às relações de equivalência. Também discorremos sobre funções e abordamos alguns problemas de equipotência, como o Teorema de Cantor-Bernstein.

Versamos sobre conjuntos bem ordenados e seus representantes canônicos, os números ordinais, no quarto capítulo. Focamos rapidamente nosso estudo para os números naturais, donde segue uma rápida discussão concernente a conjuntos finitos, infinitos enumeráveis e não enumeráveis.

O quinto capítulo dedica-se exclusivamente ao Axioma da Escolha, isto é, debatemos os “prós” e “contras” em assumi-lo como verdadeiro ou falso, ou seja, sobre a ocorrência ou não de inconsistências na teoria. Demonstramos algumas equivalências entre o Axioma da Escolha e outros princípios da Teoria dos Conjuntos, como o Lema de Zorn e a Lei da Tricotomia. Por fim, provamos que a Hipótese Generalizada do Continuum implica o Axioma da Escolha.

O Apêndice A consiste de uma lista de leis lógicas utilizadas ao longo deste trabalho, como a contrapositiva, a transitividade da implicação, etc. No Apêndice B tratamos concisamente de Conjuntos Bem Fundados, de maneira informal e introdutória. Julgamos necessários tais apêndices por considerarmo-los muito importantes no contexto geral da Matemática, apesar de não serem os focos deste trabalho.

(12)

Capítulo 1 — O Paraíso Criado por Cantor

Unter einer ‘Meng’ verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objek ten m unserer Anschauung oder unseres Denk ens (welche die Elemente von M genannt werden) zu einem Ganzen. (CANTOR,

1895/97, p. 282 apud FERREIRÓS, 2007, p. 292).

Com as palavras acima1, num de seus trabalhos realizados na segunda metade do século XIX, o matemático Georg Cantor inaugurou uma das teorias mais importantes de toda a Matemática, sobre a qual esta se fundamenta e se projeta: a Teoria dos Conjuntos. Da nossa intuição, um conjunto é uma coleção de objetos. No entanto, ao adotarmos tal noção na Matemática, devemos nos precaver, isto é, precisamos ter em mente que conjuntos de objetos concretos não são necessariamente conjuntos matemáticos. Com efeito,

Conjuntos não são objetos do mundo real, como mesas ou estrelas; eles são criados por nossa mente, não por nossas mãos. Um saco de batatas não é um conjunto de batatas, um conjunto de moléculas numa gota d’água não é o mesmo objeto que tal gota d’água. A mente humana possui a habilidade de abstrair, pensar numa variedade de diferentes objetos ligados por alguma propriedade comum e assim formar um conjunto dos objetos que possuem essa propriedade. (HRBACEK & JECH, 1999, p. 1, tradução nossa).

Dessa forma, ao nos referirmos à Teoria dos Conjuntos, podemos entendê-la como sendo o ramo da Matemática dedicado exclusivamente ao estudo dos conjuntos e de suas propriedades, inseridos dentro de um contexto matemático. Por sua vez, tal teoria tem por objetivo servir como fundação para as demais disciplinas matemáticas, haja vista que durante séculos a Teoria dos Conjuntos — ou a noção intuitiva do que vem a ser um conjunto — foi usada tacitamente por matemáticos e filósofos.

Na era clássica da matemática grega, os silogismos2 de Aristóteles já se baseavam na noção intuitiva dos conjuntos, evidenciando que tais ideias fazem parte das raízes históricas da Lógica e da Matemática. Um exemplo de tais silogismos é dado a seguir. Suponha que todos os homens sejam mortais, se Sócrates é um homem, então Sócrates é

1

“Por conjunto, entendemos qualquer reunião 𝑀 bem definida de objetos distintos 𝑚 de nossa intuição ou pensamento (que são chamados os elementos de 𝑀)” (FERREIRÓS, 2007, tradução nossa).

2

São regras de argumentação desenvolvidas por Aristóteles, que tratam de relações do tipo “todo 𝐴 é 𝐵” e “algum 𝐴 é 𝐵”. Para uma discussão mais aprofundada, sugerimos Bourbaki (1968) e Boyer (1996).

(13)

mortal. Na linguagem moderna da Teoria dos Conjuntos temos o conjunto dos mortais 𝑀 contendo o subconjunto dos homens 𝐻, isto é, 𝐻 ⊂ 𝑀; assim, se Sócrates ∈ 𝐻, então Sócrates ∈ 𝑀 (BOYER, 1996).

Mais recentemente, em meados do século XIX, George Boole também “se apropriou” dos conjuntos em sua lógica simbólica, utilizando-os para representar coleções de pontos, números ou ideias, isto é, como extensões de conceitos lógicos. Sobre o “conjunto universo” — conjunto de todos os objetos, que ele chamou de 1 — ele considerava como operações a interseção e a união disjunta de conjuntos, denotados respectivamente por 𝑥𝑦 e 𝑥 + 𝑦, onde 𝑥 e 𝑦 são conjuntos. Boole também definiu o conjunto vazio — conjunto que não possui objetos, denotado por 0 —, bem como o complementar de um conjunto 𝑥, isto é, o conjunto dos objetos não pertencentes a 𝑥, e chamou-o de 1 − 𝑥. O filósofo e matemático Bertrand Russell, ao se referir à Matemática Pura como a maior descoberta do século XIX, defendeu Boole como sendo o seu descobridor, um título considerado justo por muitos historiadores e matemáticos.

Se levarmos em consideração o fato de que as operações definidas por Boole atuavam sobre conjuntos, podemos até mesmo pensar que fora ele o “pai” da Teoria dos Conjuntos. No entanto, tal inferência não é verdadeira. De fato, como citamos acima, desde Aristóteles os conjuntos eram ferramentas costumeiras da Lógica. Fossem eles tomados de maneira intuitiva como na era clássica grega ou como extensões de conceitos lógicos no século XIX, as únicas operações consideradas sobre os conjuntos tratavam na verdade de operações envolvendo os conceitos que formavam tais conjuntos, como exemplificamos com o silogismo de Aristóteles. Assim, se restringíssemo-nos a essa visão de conjunto como ferramenta da Lógica, poderíamos inferir que “um pai” da Teoria dos Conjuntos seria Aristóteles ou então alguém que se encontra nalgum ponto da História anterior a este.

Ao referirmo-nos à Teoria dos Conjuntos, as propriedades inerentes aos conjuntos e seus elementos não se restringem apenas às relações de pertinência, inclusão e afins, onde Boole e os lógicos, de maneira geral, se limitaram. É neste ponto que se encontram as grandes inovações dadas por Cantor, Dedekind e outros: eles estenderam a visão sobre os conjuntos, aumentando de maneira significativa o leque de propriedades e relações existentes entre eles, principalmente no que se refere aos conjuntos infinitos.

(14)

Obviamente o infinito já fora alvo de investidas intelectuais bem antes do século XIX. Zenão de Eléia, com seus paradoxos sobre o movimento, como, por exemplo, o Paradoxo de Aquiles3, foi certamente um dos primeiros filósofos gregos a questionar as implicações do infinito. Aristóteles também ponderou sobre a natureza do infinito, chegando à conclusão de que há dois tipos de infinito: o completo, também chamado de atual, e o

potencial. O infinito completo seria aquele em que infinitos objetos distintos existem

simultaneamente, enquanto o infinito potencial seria alguma coleção que pode ser arbitrariamente estendida, isto é, cujo número de elementos pode ser aumentado de acordo com a necessidade em questão, como o comprimento de um dado segmento ou o sucessor de um número qualquer. Aristóteles defendia a existência do infinito potencial em detrimento do infinito completo, e tal visão ecoou no pensamento filosófico e matemático durante os séculos seguintes.

Em 1638, no livro Discorsi e Dimostrazioni Matematiche Intorno a Due Nuove

Scienze (Discursos e Demonstrações Matemáticas Sobre Duas Novas Ciências), Galileu

Galilei encontrou uma “estranha” propriedade do conjunto dos números naturais (inteiros não nulos). Ele notou que na correspondência 𝑛 ⟶ 𝑛2, onde 𝑛 é um número natural, todo número 𝑛 possui um quadrado perfeito; por outro lado, existem números naturais, como o número 2, por exemplo, que não são quadrados perfeitos de algum outro número, ou seja, cujas raízes não são números naturais. Seguiria daí, por um axioma de Euclides, o qual afirma que “o todo

é maior que a parte”, que o conjunto dos quadrados perfeitos deveria ser menor que o

conjunto dos naturais, pois o primeiro é subconjunto próprio do último. No entanto, pela correspondência estabelecida por Galileu, todo número inteiro positivo deve possuir um quadrado perfeito, donde se conclui, neste caso, que o todo é igual à parte, no que concerne a quantia de elementos, um “absurdo”. Entretanto, em vez de impulsionar o estudo de conjuntos infinitos, tal conclusão serviu apenas para afastar os estudiosos deste conceito, que viram na estranha propriedade não uma característica de tais conjuntos, mas sim uma aberração intuitiva, um paradoxo que contrariava o bom senso euclidiano e mais um motivo para rejeitar tais conjuntos completamente infinitos (BOURBAKI, 1968).

3

Resumidamente, o Paradoxo de Aquiles se baseia na subdivisão infinita do trajeto a ser percorrido por Aquiles numa hipotética corrida contra uma tartaruga. Para percorrer um comprimento 𝑛, Aquiles teria que, antes disso, percorrer metade deste comprimento 𝑛, porém, para tanto ele deveria percorrer metade deste último e assim sucessivamente, resultando na impossibilidade do movimento, pois as subdivisões infinitas implicariam a estagnação de Aquiles, como pretendia Zenão (BOYER, 1996).

(15)

Sabe-se, por exemplo, que o grande matemático Friedrich Gauss escreveu num de seus trabalhos:

“Eu protesto… Contra o uso de magnitudes infinitas como algo consumado, tal uso nunca é admissível na Matemática. O infinito é apenas um façon de parler [modo de falar]: tem-se em mente limites para os quais certas razões aproximam-se tanto quanto desejarmos, enquanto outras aumentam indefinidamente.” (1860 apud FRAENKEL, 1953, itálico do autor, tradução nossa).

É frequentemente aceito que o horror infiniti de Aristóteles permaneceu entre cientistas e matemáticos até ser encerrado pela vigorosa defesa de Cantor em aceitar a existência e a necessidade do infinito atual. No entanto, o mérito pela difusão do infinito completo no meio científico não pertence exclusivamente a Cantor. Na Alemanha havia uma forte tendência filosófica em aceitar o infinito completo bem antes dos trabalhos de Cantor, e tal comportamento facilmente se propagou no meio matemático. Ainda em 1714, o filósofo e matemático alemão Gottfried Leibniz, em seu trabalho intitulado Monadologie4, defendeu a plausibilidade do infinito completo e influenciou as gerações vindouras de pensadores alemães. Matemáticos como Bernhard Riemann e Richard Dedekind, que tiveram grande importância para o desenvolvimento da Teoria dos Conjuntos, foram direta ou indiretamente influenciados pelas ideias de Leibniz e, em ambos os casos, independentemente de Cantor. (FERREIRÓS, 2007).

Uma importante contribuição posterior à Leibniz foi dada pelo filósofo, teólogo e matemático Bernard Bolzano, não apenas em seu livro Paradoxien des Unendlichen (Paradoxos do Infinito, publicado em 1851, três anos após sua morte), mas também num trabalho anterior, Wissenchaftslehre (Teoria da Ciência, publicado em 1837). Bolzano introduziu a noção de conjunto em muitas abordagens diferentes. Em geral, ele tratava de coleções ou extensões de conceitos, mas distinguia aquelas nas quais a ordem dos elementos era arbitrária, chamando-as de Mengen (quantidades) e, dentre estas, ele destacava as coleções cujos elementos eram unidades, denominando-as multiplicidades. Para Bolzano, uma multiplicidade é infinita se é maior que qualquer multiplicidade finita, isto é, se qualquer

Menge finito é apenas uma parte dele. Bernard Bolzano defendeu vigorosamente o infinito

4

Um dos mais conhecidos trabalhos de Leibniz, no qual ele defende uma concepção de universo composto por “unidades metafísicas” (FERREIRÓS, 2007).

(16)

completo, afirmando que os “paradoxos” encontrados em conjuntos infinitos não eram de fato paradoxos, mas sim características próprias de tais conjuntos (FERREIRÓS, 2007).

Não apenas os desenvolvimentos da Análise e da Lógica no século XIX impulsionaram o surgimento da Teoria dos Conjuntos, mas também a formalização presente em praticamente todos os ramos da matemática neste período foram fatores marcantes para que a Teoria dos Conjuntos se fizesse necessária. Segundo Ferreirós:

[…] durante a segunda metade do século XIX, a noção de conjuntos foi crucial para o surgimento de novas concepções na álgebra, nos fundamentos da aritmética e mesmo na geometria. Sobretudo, todo esse desenvolvimento antecedeu as mais antigas investigações de Cantor sobre a teoria dos conjuntos e, provavelmente, tal desenvolvimento motivou o seu trabalho. A concepção conjuntística [set-theoretical

conception] dos diferentes ramos da matemática está, portanto, inscrita nas origens

da teoria dos conjuntos. (FERREIRÓS, 2007, p. xvii, tradução nossa).

Ao se referir à “concepção conjuntística”, Ferreirós faz menção à tendência já presente no século XIX de definir os objetos matemáticos com a utilização de termos e ideias semelhantes àqueles pertencentes a atual Teoria dos Conjuntos. As definições dadas por Jakob Steiner em 1832 num de seus trabalhos mais importantes sobre Geometria5 servem como exemplo. Nele, “Steiner enfatiza as concepções de linha, plano, feixe de retas, etc. como agregados de infinitos elementos” (FERREIRÓS, 2007, p. 22, tradução nossa) tratando, dessa forma, não apenas de conjuntos ou “agregados”, mas também de conjuntos infinitos, dois conceitos inerentes à Teoria dos Conjuntos.

Conforme lembrado por Ferreirós (2007), na mesma “concepção conjuntística”, devemos citar a contribuição de Bernhard Riemann com suas variedades. Em 1854, numa palestra (public lecture) na ocasião de seu Habilitation6 como professor de Göttingen e publicado postumamente em 1868 por Dedekind, Riemann definiu “variedade” como sendo a totalidade de “determinações” de um conceito genérico. Por exemplo, tomando como conceito a cor, teríamos que cada cor particular em cada variação possível de tonalidade seria uma determinação e, por conseguinte, a totalidade de tais cores formaria uma variedade. Riemann utilizou tal conceituação conjuntística de variedade como uma generalização da ideia de

5

Systematische Entwick lung der Abhängigk eit geometrischer Gestalten von einander (Desenvolvimento Sistemático da Interdependência Entre as Configurações Geométricas, publicado em 1832) (FERREIRÓS, 2007).

6

Habilitation é o mais alto grau acadêmico que uma pessoa pode adquirir em certos países da Europa e da Ásia.

(17)

magnitude e abriu caminho para definir rigorosamente a noção de número pela utilização de abordagens igualmente conjuntísticas, passagem na qual se destacou Richard Dedekind.

Deve-se a Dedekind a criação de um dos principais métodos para a construção dos números reais pela utilização explícita de conjuntos. Aliás, muito de seu trabalho em números algébricos baseou-se em conjuntos, os quais ele chamou de sistemas (FERREIRÓS, 2007). De fato, seu uso foi tão forte que Dedekind chegou a definir tais conceitos, como podemos ver abaixo:

[…] Eu entendo por objeto [thing] todas as coisas de nosso pensamento […]. Um objeto é completamente determinado por tudo o que pode ser afirmado ou pensado com respeito a ele. Um objeto 𝑎 é o mesmo que um objeto 𝑏 (idêntico à 𝑏), e 𝑏 é idêntico à 𝑎 se tudo o que puder ser pensado a respeito de 𝑎 puder também ser pensado a respeito de 𝑏 […]. É muito comum ocorrer que objetos distintos 𝑎, 𝑏, 𝑐 … por alguma razão sejam considerados comuns sob algum ponto de vista, podendo ser associados em nossa mente, e dizemos que eles formam um sistema 𝑆; nós chamamos os objetos 𝑎, 𝑏, 𝑐 … de elementos do sistema 𝑆 […]. (DEDEKIND, 1901, p. 44, itálico do autor, tradução nossa)7.

Na “teoria dos sistemas” de Dedekind o conceito de função (mappings) não se baseou sobre a noção de conjuntos, mas foi tomado como um ente primitivo, de modo que ele desenvolveu significativamente a teoria abstrata das funções. Seus escritos ainda fizeram menção ao princípio da extensionalidade, o qual afirma que dois conjuntos 𝑆1 e 𝑆2 são iguais se, e somente se, todos os objetos que pertencem a 𝑆1 pertencem a 𝑆2 e todos os objetos pertencentes a 𝑆2 também pertencem a 𝑆1. Dedekind também definiu o que seriam as partes e partes próprias de um sistema — o que atualmente chamamos de subconjuntos e subconjuntos próprios de um conjunto, respectivamente (FERREIRÓS, 2007).

Com tais conceitos formulados, Dedekind definiu de maneira clara o que é um conjunto infinito completo, utilizando a anomalia encontrada por Galileu como uma caracterização para tais conjuntos. Para Dedekind, “um sistema 𝑆 é dito infinito quando é similar a uma parte própria de si mesmo [quando existe uma injeção de 𝑆 sobre uma parte própria de 𝑆]; caso contrário, 𝑆 é dito um conjunto finito.” (1901, p. 63, tradução nossa).

7

Essays On The Theory Of Numbers (Ensaios sobre a Teoria dos Números), publicado em 1901 é uma tradução inglesa das obras Stetigk eit und irrationale Zahlen (Continuidade e Números Irracionais) de 1872 e Was sind und was sollen die Zahlen? (O Que São os Números e O Que Poderiam Ser?) de 1888, ambas de autoria de Richard Dedekind.

(18)

Dada à importância do infinito completo para a atual Teoria dos Conjuntos, julgamos interessante transcrever a demonstração do “Teorema 66” de Dedekind, no qual ele argumenta favoravelmente à existência de conjuntos infinitos:

Prova: Meu próprio reino dos pensamentos, isto é, a totalidade 𝑆 de todas as coisas que podem ser objetos de meu pensamento, é infinita. Seja 𝑠 um elemento de 𝑆, então o pensamento 𝑠′ de que ‘𝑠 é um elemento de 𝑆’ é ele próprio um elemento de 𝑆. Se considerarmos isso como a transformação 𝜙(𝑠) do elemento 𝑠, então a transformação 𝜙 de 𝑆 [a imagem direta de 𝑆] tem, conforme determinamos, a propriedade de que 𝑆′ é uma parte de 𝑆; e 𝑆′ é certamente uma parte própria de 𝑆, pois existem elementos em 𝑆 (por exemplo, meu próprio ego) que são diferentes de quaisquer pensamentos 𝑠′ e, portanto, não estão contidos em 𝑆′. Finalmente é claro que se 𝑎, 𝑏 são elementos distintos de 𝑆, então as imagens 𝑎′ e 𝑏′ são também diferentes, e portanto a transformação 𝜙 é uma transformação distinta [injetora]. Dessa forma, 𝑆 é infinito, como queríamos provar. (DEDEKIND, 1901, p. 64, tradução nossa).

Em outras palavras, Dedekind considerou a função injetora 𝜙: 𝑆 ⟶ 𝑆 que associa cada pensamento 𝑠 ao pensamento 𝜙(𝑠) = 𝑠′ de que “𝑠 é um elemento de 𝑆”, na qual tem-se 𝜙(𝑆) como subconjunto próprio de 𝑆. Devemos ressaltar que embora a prova de Dedekind seja interessante devido aos seus questionamentos filosóficos, “[…] de forma nenhuma essa demonstração satisfaz os padrões modernos.” (SUPPES, 1972, p. 138, tradução nossa).

Sem dúvidas, o aprofundamento da Análise e a obtenção de resultados patológicos e não intuitivos motivaram o grande ímpeto, presente no século XIX, de aritmetizá-la. Tal processo consistia em formalizar o conceito de número real de uma forma aritmética independentemente das noções geométricas, pois até então números reais eram concebidos como magnitudes, o que não condizia com a crescente formalização da Matemática. Como exemplo de tais patologias, temos: a existência de uma função contínua em todos os pontos, mas não derivável em todos eles, mostrada por Bolzano; Riemann exibiu uma função 𝑓 descontínua em infinitos pontos que ainda assim é integrável, o que o motivou a definir uma nova e mais rigorosa noção de integral, que hoje recebe seu nome. Ambos os resultados acima contrariavam a noção intuitiva de continuidade, mas estavam de acordo com as noções vagas da época sobre números reais. (BOURBAKI, 1968).

Ferreirós (2007) também observa que concernente a tal formalização, não apenas Dedekind, mas também Karl Weierstrass e Georg Cantor tiveram contribuições notáveis — não obstante outros matemáticos tenham também desenvolvido métodos próprios — e, em todos os casos, de uma forma ou de outra, concepções conjuntísticas foram utilizadas:

(19)

Weierstrass utilizou séries infinitas, Cantor empregou sequências de Cauchy e Dedekind recorreu a sistemas de números racionais — os quais ele denominou de cortes8.

Georg Cantor começou como analista, trabalhando com séries trigonométricas, o que provavelmente motivou seu interesse por problemas sobre equipotência. Em 1873, ele provou que o conjunto dos números racionais é contável ou enumerável9, bem como o conjunto dos números algébricos — números que são raízes de polinômios cujos coeficientes são inteiros. Isto significa, grosso modo, que existe “a mesma quantidade” de números naturais e de números algébricos. Por algum tempo, chegou-se a imaginar que a cardinalidade do infinito fosse única, isto é, que conjuntos infinitos possuíssem sempre a mesma “quantia” de elementos, mas logo Cantor chegou à conclusão contrária: o conjunto dos números reais é incontável. Prosseguindo com suas pesquisas, Cantor tentou por três anos demonstrar a impossibilidade de uma bijeção entre ℝ e ℝ𝑛, para 𝑛 > 1, quando em 1877, para seu espanto10, provou que estava errado: ℝ e ℝ𝑛 são equipotentes para 𝑛 > 1 (BOURBAKI, 1968).

Ainda segundo Bourbaki (1968), munido de tais resultados, Cantor devotou-se inteiramente à sua Mengelehre (Teoria das Coleções). Entre 1878 e 1884, numa série de seis artigos publicados no periódico alemão Mathematische Annalen, dedicado à divulgação de pesquisas matemáticas desde 1868, Cantor tratou de questões de topologia de ℝ e ℝ𝑛, de problemas sobre equipotência, da Teoria dos Conjuntos totalmente ordenados, entre outros tópicos.

Com o desenvolvimento da teoria sobre boas ordenações, Cantor pensou em iterações “transfinitas” de conjuntos derivados de outros, gerando assim conjuntos cada vez maiores. Para tanto, ele se baseou num teorema que havia provado11, o qual afirma que se 𝐴 for um conjunto então a cardinalidade de 𝐴 é estritamente menor do que a cardinalidade de ℘(𝐴), onde ℘(𝐴) é o conjunto cujos membros são os subconjuntos de 𝐴. Seguiu-se então um detalhado estudo sobre as propriedades dos números cardinais, culminando na Hipótese do

8

Embora Dedekind tenha desenvolvido sua teoria dos números reais em 1858, ele só a publicou em 1872, mesmo ano em que Cantor publicou um artigo sobre séries trigonométricas, no qual ele expôs seu método. Weierstrass nunca chegou a publicar sua teoria sobre os números reais, o que se sabe a respeito de suas ideias corresponde a análises de redações de seus estudantes, que se difundiram rapidamente na comunidade matemática alemã por volta de 1860 (FERREIRÓS, 2007).

9

Ver Capítulo 4, Seção 4.3.

10

Numa carta escrita para Dedekind, Cantor pediu para que este verificasse sua prova da equipotência e, referindo-se à própria descoberta, escreveu: “Eu vejo isso, mas não acredito.” (CANTOR & DEDEKIND, 1937, p. 34 apud FERREIRÓS, 2007, p. 171, tradução nossa).

11 Ver Capítulo 3, Teorema 3.13.

(20)

Continuum, que afirma não existir conjunto cuja cardinalidade seja estritamente menor do que a cardinalidade dos números reais e maior do que a cardinalidade dos naturais.

Os números transfinitos marcam o ponto crucial dos trabalhos de Cantor rumo a uma teoria abstrata dos conjuntos, onde esta se torna uma disciplina voltada para si mesma. Ele republicou seus artigos sobre a Teoria dos Conjuntos no livro Grundlagen einer allgeimen

Mannigfaltigkeitslehre (Fundações de uma Teoria Geral das Multiplicidades, publicado em

1883), no qual ele também discute as implicações filosóficas e teológicas de suas “inovações” matemáticas, motivado pela consciência de que suas novas ideias iam contra as visões prevalentes de número e infinito, como ressaltado por Ferreirós (2007).

Portanto, conforme sintetizado por Ferreirós, Cantor e Dedekind contribuíram para o desenvolvimento da Teoria dos Conjuntos em duas frentes distintas, pois

Durante o último quarto do século XIX, Dedekind e Cantor publicaram contribuições cruciais para a teoria abstrata dos conjuntos. Dedekind tentou elaborar uma base abstrata para uma fundação rigorosa da matemática pura — aritmética, álgebra e análise. Por sua vez, Cantor deu o passo radical de começar a explorar o reino dos conjuntos infinitos e, em tal processo, criou o que é usualmente chamado de teoria dos conjuntos no senso estrito. (FERREIRÓS, 2007, p. 170, tradução nossa).

Diz-se geralmente que a Teoria dos Conjuntos desenvolvida por Cantor não foi bem acolhida em sua época. Entretanto, há muitos exemplos que revelam uma boa recepção de suas ideias. Matemáticos como Henri Poincaré e Karl Weierstrass e Mittag-Leffer aceitaram e fizeram uso das contribuições Cantorianas na Topologia Geral (point-set

topology). (FERREIRÓS, 2007).

Mas, obviamente, nem todas as suas ideias foram facilmente recebidas, haja vista suas grandes inovações. O grande desacordo, vindo principalmente da velha guarda matemática, residiu principalmente sobre os números transfinitos. O principal opositor a tais conceitos foi Leopold Kronecker. Ele defendia a construção da Matemática tendo como base os números naturais, mas rejeitava o infinito completo e, por conseguinte, desprezou todas as definições de números irracionais, uma vez que tais definições exigiam a aceitação do infinito completo e, pelo mesmo motivo, rejeitou os números transfinitos. Uma típica reação negativa aos trabalhos de Cantor pode ser exemplificada pelo texto de Charles Hermite, que qualifica suas pesquisas como “desastrosas […], [de tal maneira que julga ser] impossível encontrar, dentre os resultados que podem ser compreendidos, apenas um que possua um interesse real e presente.” (FERREIRÓS, 2007, p. 283, tradução nossa). Tal visão, segundo Ferreirós,

(21)

“corresponde à visão da maioria dos matemáticos contemporâneos a ele [Hermite] […]” (op.

cit. p. 283) para com as ideias de Cantor. No entanto, foi o apoio da nova geração — dentre os

quais se destaca Poincaré — que contribuiu para convencer a “velha guarda” da importância da Teoria dos Conjuntos.

Assim, entre o final do século XIX e o início do século XX, após enfrentar muitas ressalvas da comunidade matemática, as concepções essenciais das ideias de Cantor haviam ganhado o reconhecimento da comunidade matemática, quando a Teoria dos Conjuntos passou a ser aplicada à Geometria e à Análise. Justamente nesse período, paradoxos começaram a surgir dentro da Teoria dos Conjuntos, abalando assim a recém-nascida confiança que o mundo havia lhe depositado (FRAENKEL, BAR-HILLEL, & LEVY, 1973).

Antes de prosseguirmos, devemos tentar enxergar de maneira mais clara o que vem a ser um paradoxo, também chamado de antinomia, uma contradição lógica. Em 1926, Frank Ramsey foi provavelmente o primeiro a dividir os paradoxos em dois tipos: os paradoxos lógicos ou matemáticos, e os paradoxos linguísticos ou semânticos. Grosseiramente falando, a primeira classe surge de construções puramente matemáticas que resultam em contradições; o segundo decorre de considerações da linguagem que usamos para falar sobre as construções matemáticas e lógicas. Um exemplo de paradoxo semântico pode ser dado pelo Paradoxo do Mentiroso, de Epimênides. Epimênides, o Cretense, disse: “eu estou mentindo”. Se essa sentença for verdadeira então ele está mentindo e daí decorre que a afirmação é falsa; se a sentença for falsa então ele não está mentindo e, portanto, ele está mentindo, logo a afirmação é verdadeira (SUPPES, 1972).

Os paradoxos que abalaram a Teoria dos Conjuntos no final do século XIX fazem parte da primeira classe de Ramsey, isto é, são paradoxos lógicos. Supõe-se que um dos primeiros tenha sido encontrado por Cantor, ainda em 1899. Na teoria ingênua dos conjuntos, não baseada explicitamente sobre axiomas, mas sim sobre a intuição, era comum aceitar como válida a existência de um conjunto universo 𝑈, cujos membros são todos os objetos e conjuntos que existem. Naturalmente, se denotarmos por 𝔠 o número cardinal de 𝑈, tem-se que 𝔠 é o maior cardinal que existe. Porém, decorre de um teorema provado por Cantor, que se ℘(𝑈) tem como número cardinal 𝔭, então 𝔭 > 𝔠, o que contraria o fato de ser 𝔠 o maior cardinal. Outro paradoxo semelhante, envolvendo o maior número ordinal existente também

(22)

foi encontrado nessa época, por Burali-Forti12. Ainda assim, tais antinomias não destruíram a confiança na Teoria dos Conjuntos, principalmente por fazerem parte de contextos avançados da teoria. A esperança, nesse caso, era que uma revisão nas demonstrações encerrasse os paradoxos. No entanto, tal esperança morreu com a chegada do paradoxo de Russell.

O Paradoxo de Russell, observado pela primeira vez por Bertrand Russell, reside num conceito fundamental da teoria ingênua dos conjuntos, chamado de Princípio (ou Axioma) da Abstração: dada qualquer propriedade\condição 𝜙, existe um conjunto 𝐴 formado por todos os elementos que possuem\satisfazem 𝜙 e, reciprocamente, todos os elementos que satisfazem 𝜙 pertencem a 𝐴. A primeira formulação explícita de tal princípio parece ter sido feita por Gottlob Frege em 1893, no primeiro volume de seu livro Grundgesetze der

Arithmetik (Fundamentos da Aritmética), no qual o autor elaborou de maneira extremamente

formal, entre outras coisas, a conceituação de número como sendo a cardinalidade de conjuntos (SUPPES, 1972).

Para obter o paradoxo, basta considerarmos o conjunto 𝑅 formado pelos elementos que possuem a propriedade de “não pertencer a si mesmo”. Nestas condições, se 𝑅 pertencer a si mesmo, então 𝑅 possui a propriedade e, portanto, não pertence a si mesmo, absurdo. Logo, deve-se ter que 𝑅 não pertence a 𝑅, mas daí decorre que 𝑅 possui a propriedade e então 𝑅 pertence a si mesmo.

Na linguagem simbólica que usaremos no Capítulo 2, podemos formular o Axioma da Abstração como:

(1) (∃𝑦)(∀𝑥)�𝑥 ∈ 𝑦 ⟺ 𝜑(𝑥)�,

onde entende-se que 𝜑(𝑥) é uma fórmula na qual “𝑦” não é uma variável livre13. Para obter o Paradoxo de Russell, tomamos 𝜑(𝑥) ≡ 𝑥 ∉ 𝑥. Então, temos garantido, por (1), que:

(2) (∃𝑅)(∀𝑥)(𝑥 ∈ 𝑅 ⟺ 𝑥 ∉ 𝑥).

Como (2) é verdadeiro para quaisquer “𝑥”, tomamos 𝑥 = 𝑅, donde segue que: (3) 𝑅 ∈ 𝑅 ⟺ 𝑅 ∉ 𝑅.

De (3), obtemos:

12

Ver demonstração do item (vi) do Teorema 4.6, no Capítulo 4.

13 Ver Capítulo 2, Seção 2.1.

(23)

(𝑅 ∈ 𝑅 ⟺ 𝑅 ∉ 𝑅) ⟹ 𝑅 ∈ 𝑅 ∧ 𝑅 ∉ 𝑅,

um absurdo, pois viola o Princípio da Não Contradição: uma sentença não pode ser verdadeira e falsa simultaneamente.

Deve-se frisar que a contradição não se encontra no fato de perguntarmos se 𝑅 pertence ou não a si mesmo, pois “exemplos” corriqueiros de ambos os casos abundam: o conjunto dos números naturais, por exemplo, não é um número natural, da mesma forma que o “conjunto” dos homens não é um homem; na outra vertente, temos o “conjunto” das abstrações que é uma abstração, ou ainda a ideia intuitiva do conjunto de todos os conjuntos que é um conjunto e, portanto, pertence a si mesmo. Frisamos apenas que tal situação de um conjunto universo não ocorre em ZFC, como provamos no Teorema 2.1 do Capítulo 2.

A contradição se encontra em tomar como plausível a existência de um conjunto cujos membros são exatamente todos os conjuntos que não pertencem a si mesmos. Nas palavras de Hrbacek e Jech,

A lição contida no Paradoxo de Russell e outros exemplos similares é que meramente definir um conjunto não prova sua existência (da mesma forma que definir um unicórnio não prova que o unicórnio existe). Existem propriedades que não definem conjuntos, isto é, não é possível coletar todos os objetos com tais propriedades num único conjunto. Tal observação deixou para os estudiosos da teoria dos conjuntos a tarefa de determinar quais propriedades são capazes de definir conjuntos. Infelizmente, não se conhece atualmente como fazer isso, e alguns resultados de lógica — como o conhecido Teorema da Incompletude de Gödel — parecem indicar que uma resposta nem sequer é possível. (HRBACEK & JECH, 1999, p. 3, grifo nosso, tradução nossa).

O Paradoxo de Russell foi historicamente importante, dentre outras razões, por motivar o desenvolvimento de novas e mais restritas formulações da Teoria dos Conjuntos. Uma das questões que surgiu deste paradoxo foi, como visto acima, “quais propriedades são capazes de definir conjuntos?” e, neste sentido, Miraglia traça uma interessante linha entre duas importantes abordagens:

Uma resposta é, na realidade, ‘sei lá’. Concebe-se o universo como tendo dois tipos de entes: classes e conjuntos. A diferença entre eles é que conjuntos podem ser elementos de outros conjuntos e classes, mas uma classe não pode ser elemento de nada, a não ser que se exiba uma demonstração de que essa classe é, na realidade, um conjunto […]. Há variantes nessa linha de desenvolvimento, mas as teorias mais conhecidas são as de Von Neumann-Bernays-Gödel e Kelley-Morse. Outra resposta à mesma pergunta é ‘todas, se tomarmos certas precauções’. Essa é a característica da teoria de conjuntos desenvolvida por E. Zermelo e A. Fraenkel […]. (MIRAGLIA, 1991, p. 13).

(24)

A primeira tentativa de axiomatizar a Teoria dos Conjuntos após o descobrimento e publicação dos paradoxos foi realizada em 1908 e se deve a Ernst Zermelo, em seu artigo

Untersuchungen über die Grundlagen der Mengenlehre (Estudos sobre os Fundamentos da

Teoria dos Conjuntos), publicado em 1908, na 65ª edição do Mathematische Annalen (EBBINGHAUS & PECKHAUS, 2007).

É interessante frisar os aspectos marcantes que permeavam a atmosfera matemática do início do século XX, pois eles nos auxiliam a vislumbrar pretextos implícitos que levaram ao primeiro sistema axiomático da Teoria dos Conjuntos.

Como vemos em Bourbaki (1968), a História nos conta ser dos antigos gregos a criação do método axiomático, remontando aos axiomas expostos por Euclides em “Os Elementos”. Tal método consiste em assumir afirmações verdadeiras, os axiomas, e deduzir delas a validade ou falsidade das proposições matemáticas.

O desenvolvimento das Geometrias Não Euclidianas, ainda no século XIX, desencadeou uma nova análise sobre o papel dos axiomas na fundação das teorias matemáticas. O trabalho de David Hilbert, que em seu livro Grundlagen der Geometrie (Fundamentos da Geometria, publicado em 1899) formalizou a Geometria Euclidiana sobre uma série de axiomas, foi o marco inicial do moderno método axiomático e estabeleceu a posição formalista no contexto da filosofia matemática, sobre a qual discutimos brevemente.

Ao final do século XIX e início do século XX três “escolas de pensamento” se distinguiram como as principais na filosofia matemática: os logicistas, os intuicionistas e os

formalistas. Uma discussão aprofundada sobre filosofia matemática foge ao escopo deste

trabalho, mas a fim de esclarecimento, resumidamente: os logicistas defendem que as verdades Matemáticas são verdades da Lógica, considerando, grosso modo, a Matemática como um subconjunto da Lógica; os intuicionistas pregam que os objetos matemáticos são criações da mente humana que não podem ser expressos de maneira adequada por qualquer tipo de linguagem e, além disso, a veracidade de alguma proposição prova-se apenas com sua construção; os formalistas defendem a tomada de axiomas de natureza arbitrária, donde se deriva a validade das proposições matemáticas por relações pré-estabelecidas que obedeçam às leis da Lógica — notemos que, neste caso, a Lógica é usada como ferramenta matemática e não como base desta, ao contrário do caso logicista (FRAENKEL, BAR-HILLEL, & LEVY, 1973).

O papel de destaque desempenhado por Hilbert no cenário da matemática mundial certamente favoreceu a difusão de suas ideias e ideais, dentre os quais se destaca a proposta

(25)

de solucionar seus 23 problemas14, sendo que o primeiro deles se referia à Hipótese do Continuum de Cantor. Ao propor a comprovação ou refutação desta proposição, Hilbert adicionou outro questionamento, a respeito da possibilidade da boa ordenação do continuum. Foi a este último problema que Zermelo respondeu, afirmativamente, em 1904, na 59ª edição do Mathematische Annalen, com seu Teorema da Boa Ordenação e o debatido Axioma da Escolha, base de sua demonstração (EBBINGHAUS & PECKHAUS, 2007).

As críticas da comunidade matemática ao Teorema da Boa Ordenação pousaram rápida e precisamente sobre o Axioma da Escolha e seu caráter não construtivo que, numa de suas muitas formulações, postula que “para qualquer conjunto 𝐴 existe uma função 𝑓 tal que, para qualquer subconjunto não vazio 𝐵 de 𝐴, 𝑓(𝐵) ∈ 𝐵” (SUPPES, 1972, p. 239, tradução nossa). O caráter “não construtivo” que fora alvo das críticas reside na ausência de uma caracterização ou de um método sobre como conseguir tal função 𝑓, haja vista que o Axioma da Escolha apenas postula sua existência.

No entanto, como Zermelo afirmou nos anos seguintes ao defender-se das críticas, tal axioma fora usado tacitamente por outros matemáticos em diversas situações anteriores, de modo que sua única inovação fora enunciar este princípio que até então fora tomado como intuitivo. Um exemplo clássico é a prova de que todo conjunto infinito contém um subconjunto infinito enumerável, dada por Dedekind anos antes. Assim, após muitos debates e críticas, Ernst Zermelo formalizou seu sistema axiomático da Teoria dos Conjuntos, motivado em parte pelo surgimento dos paradoxos na Teoria dos Conjuntos no início do século XX, embora, como frisam Ebbinghaus & Peckhaus (2007), ele também possa ter objetivado criar um sistema no qual o seu Axioma da Escolha fosse essencial.

Originalmente, Zermelo propôs oito axiomas que, segundo seus intuitos, deveriam ser fortes o suficiente para deduzir toda a teoria criada por Cantor e Dedekind, obviamente excetuando-se as antinomias descobertas no início do século. Além do Axioma da Escolha, sua grande inovação foi aplicar uma restrição ao Axioma da Abstração, obtendo o que ele chamou de Axioma da Separação (Axiom der Aussonderung), com o qual ele evitou paradoxos lógicos como o de Russell (EBBINGHAUS & PECKHAUS, 2007).

14

Os “23 Problemas de Hilbert”, como ficaram conhecidos, foram propostos por David Hilbert, em Paris, no ano de 1900, durante o Segundo Congresso Internacional de Matemática. Tais problemas abordam questões importantes sobre os fundamentos da Matemática, como a Hipótese do Continuum e a consistência dos axiomas da Aritmética, Geometria, Física, Teoria dos Números e Topologia (BOYER, 1996).

(26)

Zermelo formulou o Axioma-Esquema da Separação em termos de questões ou sentenças que têm a propriedade de ser “definida”. Ele dizia que uma sentença é definida se for possível de um modo não arbitrário decidir se um objeto satisfaz ou não a sentença. Algo consideravelmente vago e que, de certa forma, ainda deixava brechas suficientes para paradoxos semânticos (SUPPES, 1972).

Um exemplo trivial de tais “paradoxos semânticos” pode ser dado pelo paradoxo de Grelling-Nelson: chamemos de heterológico qualquer adjetivo, em português, que não possua a característica que ele denota. Por exemplo, “monossílaba” é uma palavra polissílaba e “francês” é uma palavra portuguesa, logo “monossílaba” e “francês” são adjetivos heterológicos, ao passo que adjetivos como “polissílabo” e “português” não são. Pelo critério de Zermelo exposto anteriormente, a propriedade “ser heterológico” está bem definida. Contudo, decorre da definição desta propriedade que “heterológico” é heterológico se, e somente se, não for heterológico, uma contradição. Isso evidencia a necessidade de se aprimorar o conceito de boa definição a fim de evitar paradoxos (FRAENKEL, BAR-HILLEL, & LEVY, 1973).

Segundo Suppes (1972), o primeiro esclarecimento significativo da noção do que vem a ser a propriedade de ser “bem definido”, ou do que vem a ser uma “sentença bem definida”, foi dado por Thoralf Skolem em 1922. Ele restringiu a linguagem matemática apenas ao uso de símbolos, diminuindo significativamente o alfabeto com a qual as sentenças são exprimíveis, e caracterizou-as como definidas apenas quando satisfazem sua definição de fórmula em Lógica de Primeira Ordem. Uma vez que os paradoxos semânticos existentes em expressões de linguagem referem-se a outras expressões na própria linguagem, podemos inferir que qualquer linguagem com meios ilimitados de expressão é necessariamente inconsistente15. Dessa forma ao “empobrecer” a linguagem objeto16 utilizada na Teoria dos Conjuntos, Skolem impediu a autorreferência e, consequentemente encerrou os paradoxos semânticos.

Ainda assim, os axiomas de Zermelo de 1908 não eram suficientes para abranger satisfatoriamente a teoria dos números ordinais, de modo que foi necessária a concepção de um axioma mais forte: o Axioma da Substituição, que fora formulado independentemente por

15

A esse respeito é curioso citar uma frase creditada ao matemático e lógico Kurt Gödel: “Quanto mais reflito sobre a linguagem, tanto mais me admiro que as pessoas consigam se entender umas as outras.” (apud. ÁVILA, 2000, p. 12).

16 Ver Capítulo 2, Seção 2.1.

(27)

Abraham Fraenkel e Thoralf Skolem em 1922. Com a adição do Axioma da Fundação, que basicamente impede situações como 𝑆 ∈ 𝑆, feita por Zermelo em 1930, o sistema de axiomas de Zermelo, Fraenkel e Skolem tomou praticamente a forma que conhecemos hoje, que é conhecido como Sistema Axiomático de Zermelo-Fraenkel-Choice17, ou simplesmente ZFC (SUPPES, 1972).

Atualmente, ZF designa os axiomas de Zermelo-Fraenkel de 1930 excetuando-se o Axioma da Escolha, mas incluindo o Axioma do Infinito, haja vista que àquela altura Zermelo o considerava como um “princípio lógico” (EBBINGHAUS & PECKHAUS, 2007). ZFC representa a adição do Axioma da Escolha (Axiom of Choice, em inglês) a este último grupo de postulados atuais, daí o nome Zermelo-Fraenkel-Choice. No próximo capítulo, postularemos os axiomas de ZFC.

Uma sistematização bem mais recente para a Teoria dos Conjuntos foi desenvolvida pelo professor Lotfi Zadeh na década de 1960, a qual não considera apenas situações de verdade ou falsidade absoluta. Na Teoria dos Conjuntos Difusos (Fuzzy Set

Theory), para um conjunto 𝑋 qualquer, consideramos uma função de pertinência 𝜇𝑋: 𝑋 ⟶

[0, 1], de modo que 𝜇𝑋(𝑥) indica a possibilidade de 𝑥 pertencer a 𝑋. Uma exposição mais detalhada e axiomática dos Conjuntos Fuzzy é feita por Dadam & Hein (2009).

Apesar de ZFC ser o sistema de axiomas mais utilizado como fundação para a Teoria dos Conjuntos, devemos ressaltar a existência de outros sistemas de axiomas bem sucedidos, apesar de não nos aprofundarmos no estudo teórico de tais sistemas. Na mesma posição formalista, temos os sistemas de Von Neumann-Bernays-Gödel e de Morse-Kelley, abreviadamente chamados de NBG e MK, respectivamente, cuja principal diferença com ZFC reside na existência de classes próprias e de uma “classe Universo” cujos membros são todos os conjuntos.

Em ambos os casos, todos os conjuntos são classes, mas a recíproca é falsa. Nelas, 𝑥 é um conjunto se, e somente se, existe 𝑦 tal que 𝑥 ∈ 𝑦; se, porém, não houver tal 𝑦, então 𝑥 é uma classe própria. Nos dois sistemas, os conjuntos “propriamente ditos” satisfazem os axiomas usais de ZF. No sistema NBG existe o Axioma-Esquema da Abstração das Classes

17

Alguns autores defendem que, por rigor histórico, deveríamos chamá-lo de sistema axiomático Zermelo-Skolem-Fraenkel, em alusão às grandes contribuições de Thoralf Skolem para a formalização dos axiomas (SUPPES, 1972).

(28)

— “o mesmo” que na teoria Ingênua dos Conjuntos leva ao Paradoxo de Russell —, como segue abaixo:

(∃𝑋)(∀𝑦)�𝑦 ∈ 𝑋 ⟺ 𝜙(𝑦)�,

onde 𝜙 pode ter outros conjuntos e classes como variáveis livres, mas as variáveis ligadas de 𝜙 são apenas conjuntos, pois, caso houvesse uma classe própria 𝑦′ ligada a 𝜙, então 𝑦∈ 𝑋 e

daí 𝑦′ não seria uma classe própria. A proximidade entre NBG e ZF é tão grande que o primeiro diz-se ser uma extensão conservativa do segundo: se 𝜓 é uma sentença cujas variáveis são apenas conjuntos, 𝜓 pode ser provada em NBG se, e somente se, 𝜓 pode ser provada em ZF. Por outro lado, NBG é finitamente axiomatizável18, o que não ocorre em ZF. Já o sistema MK pode ser considerado mais forte que NBG por permitir que classes próprias “apareçam” em 𝜙, embora não seja uma extensão conservativa de ZF e também não possa ser finitamente axiomatizável.

Contudo, nenhuma dessas três teorias (ZF, NBG e MK) pode reivindicar o título de “a teoria correta”, conforme ressaltado por Kunen (1980), pois todas elas possuem limitações em alguma instância: ZF não admite classes próprias, como a classe de todos os conjuntos; NBG admite classes próprias, mas seu uso é restringido em 𝜙 no axioma da abstração das classes; MK não possui a limitação de NBG no axioma da abstração, no entanto, certas relações sobre classes próprias não podem ser definidas de maneira formal. Ainda assim, essas três teorias estão todas fundadas nos mesmos conceitos básicos, de modo que a maioria das proposições demonstrações em ZF pode ser também demonstrada nas outras duas teorias, dadas as devidas modificações.

A escola logicista também se preocupou com a reformulação da Teoria dos Conjuntos, mas, seguindo sua própria filosofia, tal processo partiu dos fundamentos da Lógica. A teoria dos tipos, desenvolvida por Bertrand Russell e Alfred Whitehead teve basicamente o intuito de evitar os chamados ciclos viciosos, isto é, situações em que temos um conjunto 𝑥 pertencendo a si mesmo, pois de tais ciclos surgem os principais paradoxos. Para tanto, eles formalizaram de maneira profunda o conceito de hierarquia de conjuntos, criando uma teoria intrincada e de difícil compreensão, geralmente preferida por lógicos e não por matemáticos (BOURBAKI, 1968).

18

Isto é, os axiomas de NBG decorrem de um número finito de fórmulas atômicas — fórmulas atômicas são as sentenças básicas da linguagem formal, que definiremos no Capítulo 2 (KUNEN, 1980).

(29)

Fossem formalistas ou logicistas, a maioria dos matemáticos do início do século XX recusou-se a abandonar a Teoria dos Conjuntos ao se depararem com os paradoxos, dada a sua grande capacidade de generalização e abrangência à praticamente toda a Matemática: da construção dos números à conceituação formal de 𝑛-úplas ordenadas e consequentemente às funções reais, analíticas, etc. Certamente, o apreço da comunidade matemática para com a Teoria dos Conjuntos é evidenciado por David Hilbert que, apesar de superestimar o papel de Cantor como pai da Teoria dos Conjuntos, eternizou a expressão: “[…] Ninguém nos expulsará do paraíso criado por Cantor.” (HILBERT, 1926 apud FERREIRÓS, 2007, p. 365, tradução nossa).

(30)

Capítulo 2 — Desenvolvimentos Iniciais em ZFC

Neste capítulo, desenvolvemos os conceitos básicos da Teoria dos Conjuntos segundo o sistema axiomático Zermelo-Fraenkel-Choice, isto é, a partir dos axiomas de ZFC. Definimos e provamos as principais propriedades das relações entre conjuntos: inclusão, interseção, união, potência e produto cartesiano. Tal desenvolvimento deve embasar o estudo subsequente realizado nos capítulos seguintes.

2.1. Preliminares: Alfabeto e Definições

Os axiomas de ZFC são expressos numa “linguagem objeto” limitada a fim de evitar inconsistências semânticas que permitam derivar paradoxos na teoria. Em nosso contexto, a linguagem objeto é a linguagem na qual falamos sobre conjuntos, enquanto a

metalinguagem é a linguagem na qual discutimos a linguagem objeto. Em outras palavras, a

linguagem objeto é a linguagem formal e simbólica descrita a seguir, enquanto a metalinguagem é, neste contexto, o português que será utilizado para descrever exatamente o que se pretende com a simbologia utilizada. Salvo menção contrária, nesta seção baseamo-nos em Suppes (1972).

Classificamos os símbolos utilizados na linguagem objeto — o “Alfabeto” — em cinco grupos: (i) constantes, (ii) variáveis, (iii) conectivos lógicos, (iv) quantificadores e (v) símbolos de pontuação, onde:

(i) As duas constantes primitivas de linguagem são o símbolo da relação de pertinência “∈” e o predicado constante “=”, símbolo da identidade;

(ii) As variáveis genéricas são as letras “𝑥”, “𝑦”, “𝑧”,…, com ou sem subscritos ou sobrescritos, maiúsculas ou minúsculas;

(31)

(iii) Os conectivos lógicos usuais: ∧, ∨, ⟹, ⟺, ¬ que indicam, respectivamente, conjunção, disjunção, implicação, equivalência e negação, de modo a obedecerem as leis do cálculo proposicional de primeira ordem1;

(iv) Os quantificadores existenciais (∃) e (∃!), e universal (∀);

(v) Parênteses esquerdo “(” e direito “)” são os únicos símbolos de pontuação.

Expressões de linguagem objeto são sequências finitas das cinco classes de

símbolos de linguagem definidas acima. Algumas destas expressões são chamadas de

fórmulas primitivas, devido à sua simplicidade estrutural, o que motiva a definição seguinte.

Definição 2.1. Uma fórmula atômica primitiva é uma expressão da forma (𝑣 ∈ 𝑤), ou da forma (𝑣 = 𝑤), onde 𝑣 e 𝑤 são ambas variáveis genéricas.

Tais fórmulas denominam-se atômicas, pois todas as fórmulas da teoria devem ser expressas por meio delas, isto é, por meio de combinações de fórmulas atômicas, cujas regras gramaticais de composição (ou regras gramaticais do alfabeto), estabelecemos abaixo.

(i) Toda fórmula atômica primitiva é uma fórmula primitiva;

(ii) Se 𝑃 é uma fórmula primitiva, então ¬𝑃 é uma fórmula primitiva;

(iii) Se 𝑃 e 𝑄 são fórmulas primitivas, então (𝑃 ∧ 𝑄),(𝑃 ∨ 𝑄),(𝑃 ⟹ 𝑄) e (𝑃 ⟺ 𝑄) são fórmulas primitivas;

(iv) Se 𝑃 é uma fórmula primitiva e 𝑣 é qualquer variável genérica, então (∀𝑣)𝑃, (∃𝑣)𝑃 e (∃! 𝑣)𝑃 são fórmulas primitivas2

;

(v) Nenhuma expressão de linguagem objeto é uma fórmula primitiva a menos que siga as regras estabelecidas acima.

Dessa forma, como (𝑣 ∈ 𝑤) e (𝑎 = 𝑏) são fórmulas atômicas primitivas, elas próprias são fórmulas primitivas, bem como (𝑣 ∈ 𝑤) ∨ (𝑎 = 𝑏), (𝑣 ∈ 𝑤) ⟹ (𝑎 = 𝑏) e ¬(𝑎 = 𝑏).

Todos os axiomas e teoremas da Teoria dos Conjuntos que estabeleceremos podem ser escritos como fórmulas primitivas de linguagem objeto. Aliás, nossa linguagem objeto oficial deve consistir unicamente de fórmulas primitivas. No entanto, para fins de

1

Ver Apêndice A.

2 As expressões (∀𝑣)𝑃, (∃𝑣)𝑃 e (∃! 𝑣)𝑃 se leem respectivamente como “para todo 𝑣, tal que 𝑃”,

“existe 𝑣 tal que 𝑃” e “existe um único 𝑣 tal que 𝑃”.

(32)

trabalho, será comum e conveniente introduzir “por definição” consideráveis notações/simbologias adicionais e, eventualmente, utilizar a metalinguagem para enunciar e demonstrar determinados teoremas.

As expressões construídas com símbolos não presentes originalmente no alfabeto serão denotadas simplesmente por fórmulas; notemos que tais fórmulas não são primitivas exatamente por serem expressas por meio de símbolos exteriores ao alfabeto. A fim de definir formalmente tais expressões na teoria, esperamos que nossas definições obedeçam a alguns critérios.

Critério da Eliminabilidade. Uma fórmula 𝑃 introduzindo um novo símbolo

satisfaz o critério da eliminabilidade se, e somente se, sempre que 𝑄1 é uma fórmula na qual o novo símbolo ocorre, então existe uma fórmula primitiva 𝑄2, tal que 𝑃 ⟹ (𝑄1 ⟺ 𝑄2) é derivável dos axiomas.

Critério da Não Criatividade. Uma fórmula 𝑃 introduzindo um novo símbolo

satisfaz o critério da não criatividade se, e somente se, não há fórmula primitiva 𝑄 tal que 𝑃 ⟹ 𝑄 é derivável dos axiomas, mas 𝑄 não é.

Vejamos o significado de tais critérios. O primeiro estabelece que o novo símbolo que acrescentamos ao alfabeto precisa ser exprimível no próprio alfabeto. Por exemplo, a fim de facilitar as notações futuras, adotamos a seguinte definição.

Definição 2.2.

(i) 𝑥 ∉ 𝑦 ⟺ ¬(𝑥 ∈ 𝑦); (ii) 𝑥 ≠ 𝑦 ⟺ ¬(𝑥 = 𝑦).

Assim, por exemplo, (i) introduz o símbolo “∉” para indicar a “não pertinência”. Qualquer fórmula que o utilize, digamos √2 ∉ ℚ, equivale a uma fórmula que não o utiliza, isto é, ¬�√2 ∈ ℚ�. Neste caso, (𝑥 ∈ 𝑦) é uma fórmula atômica primitiva, ¬(𝑥 ∈ 𝑦) é uma fórmula primitiva e 𝑥 ∉ 𝑦 é uma fórmula.

O segundo critério tem por objetivo evitar que definições permitam derivar fórmulas primitivas que não possam ser derivadas dos axiomas da teoria.

Antes de prosseguirmos, precisamos distinguir o que são variáveis livres e ligadas. Uma variável é uma variável ligada numa fórmula 𝜑 se ela estiver no interior do

(33)

escopo de um quantificador; ela é dita uma variável livre se não for ligada. Por exemplo, na fórmula (∃𝑥)(𝑥 < 𝑦), “𝑥” é uma variável ligada, enquanto “𝑦” é uma variável livre. Uma fórmula 𝜑 que possui variáveis livres é uma fórmula aberta, caso contrário, 𝜑 é uma fórmula

fechada.

Denotamos uma fórmula 𝜑 em que 𝑥 ocorre como variável livre por 𝜑(𝑥). Tal fórmula é dita uma condição em 𝑥. Se existir em 𝜑 uma variável livre 𝑦 distinta de 𝑥, simbolicamente escrevemos 𝜑(𝑥, 𝑦) e dizemos que 𝜑 é uma condição em 𝑥 e 𝑦 ou ainda que 𝜑 é uma condição em 𝑥 com parâmetro 𝑦 (FRAENKEL, BAR-HILLEL, & LEVY, 1973).

Se 𝑧 for tal que 𝜑(𝑥) seja falso quando 𝑥 = 𝑧, escrevemos ¬𝜑(𝑧), caso contrário, escrevemos apenas 𝜑(𝑧) para indicar que (𝜑(𝑥) ∧ 𝑥 = 𝑧) é verdadeiro3 e dizemos que 𝑧

satisfaz a condição 𝜑 ou que 𝜑 é uma propriedade de 𝑧. Assim, por exemplo, se 𝜑(𝑥) ≡ 𝑥 +

3 < 4, temos 𝜑(0) e ¬𝜑(2).

Além dos critérios supracitados, devemos estabelecer regras para as definições que introduzem novos símbolos por meio de equivalências ou identidades.

Critério da definição por equivalência. Uma equivalência 𝑃 introduzindo um

novo símbolo de operação 𝑛-ária 𝑂 é uma definição adequada se, e somente se, 𝑃 é da forma: 𝑂(𝑣1,…, 𝑣𝑛) = 𝑤 ⟺ 𝑄

���������������

𝑃

,

de tal maneira que as restrições a seguir sejam satisfeitas: (i) 𝑣1,…, 𝑣𝑛, 𝑤 são variáveis distintas;

(ii) As únicas variáveis livres de 𝑄 são 𝑣1,…, 𝑣𝑛, 𝑤;

(iii) 𝑄 é uma fórmula na qual as únicas constantes não lógicas4 são as primitivas ou símbolos previamente definidos da Teoria dos Conjuntos;

(iv) A fórmula (∃! 𝑤)𝑄 é derivável dos axiomas e definições precedentes.

Critério da definição por identidade: Uma identidade 𝑃 introduzindo um novo

símbolo de operação 𝑛-ária 𝑂 é uma definição adequada se, e somente se, 𝑃 é da forma:

3

O contexto geralmente deixa claro quando “𝜑(𝑥)” se refere à “condição em 𝑥” e quando “𝜑(𝑥)” se refere ao valor lógico de 𝜑 com a variável 𝑥.

4 As únicas constantes lógicas são os conectivos lógicos. As demais constantes são não lógicas.

(34)

𝑂(𝑣1,…, 𝑣𝑛) = 𝜏(𝑣1,…, 𝑣𝑛) �������������������

𝑃

,

de tal maneira que as restrições a seguir sejam satisfeitas: (i) 𝑣1,…, 𝑣𝑛 são variáveis distintas;

(ii) O termo 𝜏 não possui variáveis livres que não sejam 𝑣1,…, 𝑣𝑛;

(iii) As únicas constantes não lógicas no termo 𝜏 são símbolos primitivos ou símbolos previamente definidos na Teoria dos Conjuntos.

Não definimos neste trabalho o que é o termo 𝜏(𝑣1,…, 𝑣𝑛), mas esperamos que os exemplos a seguir possibilitem um entendimento básico sobre como eles são. O termo 𝜏(𝑣1, 𝑣2) ≡ 𝑣1∩ 𝑣2 é tal que 𝜏(𝑥, 𝑦) = 𝑥 ∩ 𝑦, o termo 𝜏(𝑣1, 𝑣2) ≡ �{𝑣1}, {𝑣1, 𝑣2}� é tal que 𝜏(𝑥, 𝑦) = �{𝑥}, {𝑥, 𝑦}�. Grosso modo, 𝜏 é uma regra que nos fornece uma lista de operações definidas na Teoria dos Conjuntos para se realizarem com conjuntos quaisquer.

A importância de (iv) no Critério da Equivalência resume-se na restrição de que uma operação deve fornecer um único objeto. Por exemplo, consideremos a pseudo-operação 𝑂, onde:

(1) 𝑂(𝑥, 𝑦) = 𝑧 ⟺ 𝑥 < 𝑧 ∧ 𝑦 < 𝑧.

Obviamente, (1) viola (iv), e tal violação implica uma contradição lógica. É claro que 1 < 3 e 2 < 3, logo, pode-se dizer, por (1), que:

(2) 𝑂(1, 2) = 3.

Contudo, também é evidente que 1 < 4 e 2 < 4, donde, por (1), concluímos que: (3) 𝑂(1, 2) = 4.

Logo, de (2) e (3), vem que 3 = 4, absurdo.

Contudo, nem todas as definições obedecem simultaneamente aos critérios estabelecidos acima, haja vista que são dadas, em sua maioria, sob a forma de condicionais. Neste caso, também há regras bem estabelecidas.

Critério da definição condicional. Uma implicação 𝑃 introduzindo um novo

(35)

𝑄 ⟹ [𝑂(𝑣1,…, 𝑣𝑛) = 𝑤 ⟺ 𝑅] ���������������������

𝑃

,

de tal maneira que as restrições a seguir sejam satisfeitas: (i) A variável 𝑤 não é livre em 𝑄;

(ii) As variáveis 𝑣1,…, 𝑣𝑛, 𝑤 são distintas;

(iii) 𝑅 não possui variáveis livres além de 𝑣1,…, 𝑣𝑛, 𝑤;

(iv) 𝑄 e 𝑅 são fórmulas nas quais as únicas constantes não lógicas são os símbolos primitivos ou símbolos previamente definidos na Teoria dos Conjuntos;

(v) A fórmula 𝑄 ⟹ (∃! 𝑤)𝑅 é derivável dos axiomas e definições precedentes.

Uma vez estabelecidos tais critérios, podemos iniciar o desenvolvimento axiomático da Teoria dos Conjuntos.

2.2. O Sistema de Axiomas Zermelo-Fraenkel-Choice

Nesta seção postulamos os nove axiomas de Zermelo-Fraenkel-Choice (ZFC) e discutimos brevemente cada um deles. Também provamos a existência e a unicidade de um conjunto que não possui elementos e a inexistência de um conjunto ao qual tudo pertença. Além disso, definimos alguns conceitos que contribuem para uma melhor compreensão dos demais axiomas.

Originalmente desenvolvido por Ernst Zermelo, Abraham Fraenkel e Thoralf Skolem, os axiomas de ZFC admitem diversas formulações. Em alguma delas, por exemplo, postula-se a existência de um conjunto que não possua elementos, o Axioma do Conjunto Vazio — tal abordagem é feita por Miraglia (1991) e Hrbacek & Jech (1999). Noutras, postulam-se apenas sete axiomas, pois deles é possível derivar os axiomas da Separação e do Par como teoremas — como encontramos em Levy (1979). Há ainda formulações que permitem a existência de diversos indivíduos, isto é, objetos que não possuem elementos, mas que podem pertencer a algum conjunto, denominados por Zermelo de urelementos — Suppes (1972) trata de tais situações.

Referências

Documentos relacionados

No dia do batismo, quando Ele recebeu o Espírito Santo no dia em que João batizou, João disse: “Eu observei e vi o Espírito de Deus descendo como uma pomba do céu, e uma Voz

O presente artigo tem como objetivos relatar e discutir a experiência docente do exercício da mentoria para uma turma de graduação em Medicina durante o período de seis anos (de

[r]

[r]

O diretor da Agência Nacional de Energia Elétrica (Aneel), Edvaldo Santana, disse ontem que o atual cenário de turbulências no setor elétrico “está caminhando para

 Wished for level of service quality that customer believes can and should be delivered. 

O autor reconhece nesse caso o problema do anacronismo, designado por ele como “discordância de tempo”, que fornece, entre a encenação da peça pelos King’s Men e hoje,

De fato, a aplicação das propriedades da regra variável aos estudos lingüísticos além da fonologia não constitui assunto tranqüilo, seja porque a variável passa a ser