• Nenhum resultado encontrado

Neste capítulo versamos sobre o papel do Axioma da Escolha na Teoria dos Conjuntos e na Matemática de modo geral. Provamos algumas equivalências entre ele e outras sentenças, dentre as quais destacamos o Lema de Zorn. Por fim, demonstramos que a Hipótese

Generalizada do Continuum é suficiente para o Axioma da Escolha.

5.1. Consistência e Independência

Discutimos ao longo deste trabalho algumas características do Axioma da Escolha, o qual, grosso modo, nos garante que num conjunto 𝑋 qualquer sempre podemos escolher um único elemento de cada subconjunto não vazio de 𝑋. Alguns conjuntos possuem uma estrutura que nos permite escolher tal elemento sem a necessidade do Axioma da Escolha; uma boa ordem é o exemplo mais natural de tal situação: se 𝑋 é bem ordenado, escolha o menor elemento de cada subconjunto não vazio de 𝑋.

Como bem exemplificado por Russell (1920, p. 126), não precisamos do Axioma da Escolha para escolher uma bota em cada par de botas numa coleção infinita de pares de botas: basta que de cada par escolhamos o pé direito (ou esquerdo). Contudo, o axioma será necessário caso queiramos escolher uma meia de cada par de meias numa coleção infinita de pares de meias, pois num par de meias não se pode distinguir entre a meia direita e a esquerda. Ou seja, a estrutura de alguns conjuntos não nos permite realizar escolhas infinitas.

Mas obviamente, a relutância que existiu em assumir o Axioma da Escolha como um princípio válido na Matemática se deveu a questões bem mais profundas do que sua aplicação em patologias informais. A preocupação principal concerne à consistência e

independência do Axioma da Escolha. Os exemplos a seguir, adaptados de Aurichi (2011b),

esclarecem bem o significado de tais conceitos.

Para desenvolver a Teoria dos Conjuntos neste trabalho, fixamos uma linguagem simbólica, com suas “regras semânticas” e em seguida postulamos uma lista de axiomas expressos nesta linguagem. Tal método estende-se para qualquer teoria matemática, como a Teoria dos Corpos, na Álgebra, por exemplo.

Chamemos de teoria 𝑇 à “coleção” de todas as implicações de uma lista de axiomas postulados ℒ. Informalmente, um conjunto 𝑀 é um “modelo” para a teoria 𝑇 se 𝑀 satisfaz a teoria 𝑇. Assim, por exemplo, ℝ e ℚ, munidos das operações usuais, são modelos para a Teoria dos Corpos.

Uma teoria diz-se consistente se ela não contém uma proposição da forma 𝑃 ∧ (¬𝑃). Conforme provado por Gödel, uma teoria 𝑇 é consistente se, e somente se, admite um modelo. A questão de independência se refere a uma fórmula particular da teoria: 𝜑 expressa na linguagem de 𝑇 diz-se independente se 𝑇 + 𝜑 e 𝑇 + (¬𝜑) forem ambas consistentes, onde 𝑇 + 𝜑 e 𝑇 + (¬𝜑) indicam respectivamente, assumir a veracidade e a falsidade de 𝜑.

Apesar de não soar natural a princípio, casos de independência ocorrem frequentemente na Matemática. Na Teoria dos Corpos, por exemplo, considerando a fórmula 𝜑 ≡ (∃𝑥)(𝑥 ⋅ 𝑥 = 1 + 1), ℝ é um modelo para a Teoria dos Corpos + 𝜑, enquanto ℚ é um modelo para a Teoria dos Corpos +(¬𝜑), o que mostra a independência de 𝜑 em relação aos axiomas da Teoria dos Corpos.

Assim, questionar se o Axioma da Escolha é consistente com ZF basicamente significa questionar-se se em ZFC é possível derivar alguma contradição. Um dos modos de se responder a essa questão é encontrar um modelo para ZFC. O próprio Gödel desenvolveu um modelo para ZFC, de modo que supondo a consistência de ZF, provou que assumir o Axioma da Escolha não gera paradoxos. Anos depois, Paul Cohen também provou, por outro método, que assumir a negação do Axioma da Escolha em ZF também é consistente.

Dessa forma, o Axioma da Escolha independe dos axiomas de ZF, ou seja, é

independente. Existem outras proposições independentes e consistentes, como é o caso da

Hipótese do Continuum, consistente e independente em ZFC. Sua versão generalizada, a Hipótese Generalizada do Continuum, também é consistente em ZFC. Contudo, neste último caso não temos sua independência em ZFC, pois como provamos na última seção, a Hipótese Generalizada do Continuum implica o Axioma da Escolha.

Para uma discussão mais aprofundada sobre a consistência e a independência do Axioma da Escolha, bem como de outras sentenças, recomendamos Kunen (1980) e Jech (2003).

5.2. Formulações Equivalentes do Axioma da Escolha

Provamos nesta seção algumas formulações equivalentes em ZF ao Axioma da Escolha. Fica implícito, portanto, que não assumimos a princípio a validade do Axioma da Escolha durante as demonstrações. Salvo menção contrária, baseamo-nos em Hrbacek & Jech (1999).

Teorema 5.1. As seguintes afirmações são equivalentes em ZF:

(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para

qualquer família não vazia de conjuntos;

(ii) Toda partição possui um conjunto de representantes;

(iii) Se 𝑋 = 〈𝑋𝑖|𝑖 ∈ 𝐼〉 é um sistema indexado tal que 𝑋𝑖 ≠ ∅ para todo 𝑖 ∈ 𝐼, então existe uma função 𝑓: 𝐼 ⟶ ⋃ 𝑋𝑖∈𝐼 𝑖 tal que 𝑓(𝑖) ∈ 𝑋𝑖, para todo 𝑖 ∈ 𝐼 (em outras

palavras, ∏ 𝑋 ≠ ∅). Demonstração.

((i) ⟹ (ii)). No Teorema 3.8 provamos que os axiomas de ZF, aliados ao Axioma da Escolha, garantem que para toda relação de equivalência sobre um conjunto não vazio existe um conjunto de representantes. Por sua vez, toda partição determina uma relação de equivalência na qual as classes de equivalência são os membros da partição.

((ii) ⟹ (iii)). Para cada 𝑖 ∈ 𝐼, definamos 𝐶𝑖 = {𝑖} × 𝑋𝑖. Claramente 𝑆 = {𝐶𝑖|𝑖 ∈ 𝐼} é uma partição de 𝑋: como 𝑋𝑖 ≠ ∅ para todo 𝑖, vale 𝐶𝑖 ≠ ∅; para 𝑖 ≠ 𝑖′ é imediato que 𝐶𝑖∩ 𝐶𝑖′ = ∅; se 〈𝑎, 𝑏〉 ∈ 𝑋 então 〈𝑎, 𝑏〉 = 〈𝑎, 𝑋𝑎〉 ∈ 𝐶𝑎= {𝑎} × 𝑋𝑎, pois 𝑋𝑎= 𝑋(𝑎) = 𝑏, donde segue que 𝑋 ⊆ ⋃ 𝑆. Devido a (ii), existe 𝔉 ⊆ 𝑋 de maneira que para todo 𝑖 ∈ 𝐼 existe um único 𝑥𝑖 ∈ 𝑋𝑖 tal que 𝔉 ∩ 𝐶𝑖 = {〈𝑖, 𝑥𝑖〉}. Definindo 𝑓 = ⋃{𝔉 ∩ 𝐶𝑖|𝑖 ∈ 𝐼} = {〈𝑖, 𝑥𝑖〉|𝑖 ∈ 𝐼}, temos 𝑓 ∈ ∏ 𝑋.

((iii) ⟹ (i)). Seja 𝑆 ≠ ∅. Chamemos 𝐼 = 𝑆 ∖ {∅} e 𝑋𝑖 = 𝑖 para todo 𝑖 ∈ 𝐼. Então 〈𝑋𝑖|𝑖 ∈ 𝐼〉 é um sistema indexado de conjuntos não vazios, donde segue por (iii) que existe 𝑓: 𝐼 ⟶ ⋃ 𝐼 tal que 𝑓(𝑖) ∈ 𝑖 para todo 𝑖 ∈ 𝐼. Se ∅ ∉ 𝑆 então 𝑓 é uma função escolha para 𝑆; se ∅ ∈ 𝑆 então 𝑓̅ = 𝑓 ∪ {〈∅, ∅〉} é uma função escolha para 𝑆. Q.E.D.

A demonstração do teorema acima evidencia claramente a semelhança das sentenças. Por (ii), em qualquer partição pode-se eleger um representante de cada membro da partição e construir um conjunto com tais elementos. De (iii) segue que o produto cartesiano de conjuntos não vazios é necessariamente não vazio; tal elemento que garante a não vacuidade do produto cartesiano é justamente a função escolha.

A noção de produto cartesiano tornar-se-ia mais clara se 𝐼 fosse um conjunto bem ordenado, pois assim 𝑓 ∈ ∏ 𝑆𝑖∈𝐼 𝑖 seria da forma 〈𝑓𝛼|𝛼 < 𝛼𝐼〉, para algum ordinal 𝛼𝐼 isomorfo a 𝐼: se 𝛼𝐼 fosse natural, 𝑓 seria uma 𝛼𝐼-úpla finita; caso 𝛼𝐼 = 𝜔, teríamos 𝑓 = 〈𝑓0, 𝑓1,…, 𝑓𝑛,…〉 uma sequência infinita na qual a 𝑖-ésima coordenada pertenceria a 𝑆𝑖, e assim por diante. De fato, o axioma da escolha garante que 𝐼 é bem ordenável; mais do que isso, qualquer conjunto admite uma boa ordenação.

Teorema 5.2 (Teorema da Boa Ordenação de Zermelo). As seguintes afirmações

são equivalentes em ZF:

(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para

qualquer família não vazia de conjuntos;

(ii) (O Princípio da Boa Ordem) Todo conjunto é bem ordenável.

Demonstração.

((i) ⟹ (ii)). Seja 𝐴 um conjunto e 𝑎 ∉ 𝐴. Consideremos então uma função escolha 𝑓: ℘(𝐴) ⟶ 𝐴. Por recursão transfinita, definamos para todo ordinal 𝛼,

𝐹(𝛼) = �𝑓(𝐴 ∖ 𝐹[𝛼])𝑎 , ,se se 𝐴 ∖ 𝐹[𝛼] ≠ ∅𝐴 ∖ 𝐹[𝛼] = ∅,

onde 𝐹[𝛼] denota por simplicidade ℑ(𝐹 ↾ 𝛼), em alusão à notação utilizada para imagem direta.

Isto é, 𝐹 é tal que 𝐹(0) é algum elemento de 𝐴 escolhido por 𝑓 caso 𝐴 ≠ ∅, ou 𝐹(0) = 𝑎 caso 𝐴 = ∅; 𝐹(1) é algum elemento de 𝐴 ∖ {𝐹(0)} caso este seja não vazio, ou 𝐹(1) = 𝑎 caso contrário, e assim por diante. Intuitivamente, 𝐹 lista os elementos de 𝐴 enquanto eles existem; após listar o último elemento, 𝐹 assume o valor 𝑎.

Sejam 𝛼 e 𝛽 ordinais tais que 𝛼 < 𝛽. Se 𝐹(𝛽) ≠ 𝑎, então 𝐹(𝛽) ∈ 𝐴 ∖ 𝐹[𝛽] e, como 𝛼 ∈ 𝛽 temos 𝐹(𝛼) ∈ 𝐹[𝛽], donde segue que 𝐹(𝛽) ≠ 𝐹(𝛼). Disso, decorre que existe 𝜆 < ℎ(𝐴) tal que 𝐹(𝜆) = 𝑎: de fato, se 𝐹(𝛼) ≠ 𝑎 para todo 𝛼 < ℎ(𝐴), 𝐹 ↾ ℎ(𝐴) seria uma injeção de ℎ(𝐴) sobre um subconjunto de 𝐴, contrariando a definição do Número de Hartogs.

Seja então 𝜇 o menor número ordinal tal que 𝐹(𝜇) = 𝑎. Mostremos que 𝐹[𝜇] = 𝐴. Obviamente 𝐹[𝜇] ⊆ 𝐴, pois 𝐹(𝛼) ∈ ℑ(𝑓) ⊆ 𝐴 para todo ordinal 𝛼 < 𝜇. Se, por absurdo, 𝐹[𝜇] ≠ 𝐴, existiria 𝑥 ∈ 𝐴 ∖ 𝐹[𝜇], donde pela definição de 𝐹 teríamos 𝐹(𝜇) ≠ 𝑎. Portanto, a função 𝐹 ↾ 𝜇: 𝜇 ⟶ 𝐴 é uma bijeção. Definindo

≺𝐹= {〈𝐹(𝛼), 𝐹(𝛽)〉|𝛼 < 𝛽 < 𝜇},

segue pela Proposição 4.6 que 〈𝐴, ≺𝐹〉 é um conjunto bem ordenado isomorfo a 𝜇.

((ii) ⟹ (i)). Seja 𝐴 ≠ ∅ um conjunto qualquer e consideremos ⋃ 𝐴. Como todo conjunto é bem ordenável por hipótese, existe uma relação de boa ordem < sobre ⋃ 𝐴. Para 𝑋 ∈ 𝐴 qualquer, se 𝑥 ∈ 𝑋 então 𝑥 ∈ ⋃ 𝐴. Logo, todo membro de 𝐴 é subconjunto de ⋃ 𝐴. Enfim, como 〈⋃𝐴 , <〉 é uma boa ordem, todo subconjunto 𝑆 ≠ ∅ de ⋃ 𝐴 possui um (único) menor elemento; assim a função 𝑓: 𝐴 ⟶ ⋃ 𝐴 dada por 𝑓(𝑋) = min(𝑋), para todo 𝑋 ∈ 𝐴, é uma função escolha de 𝐴. Q.E.D.

Deve-se frisar que a boa ordenação garantida pelo Axioma da Escolha nada tem a ver necessariamente com alguma ordem pré-existente num dado conjunto. Assim, por exemplo, ao dizermos que ℝ pode ser bem ordenado, não podemos supor que a boa ordem seja a mesma da relação de ordem usual da reta.

Dentre outras consequências importantes, garantir que todo conjunto é bem ordenável nos permite afirmar que para todo conjunto existe um único número cardinal equipotente a ele, isto é, todo conjunto possui um número cardinal. Em particular, para um ordinal 𝛼 qualquer, temos pelo Teorema de Cantor e pelo Teorema 4.20 que existe 𝛽 > 𝛼 tal que ℵ𝛼 < |℘(ℵ𝛼)| = |2ℵ𝛼| = ℵ𝛽, ou seja, |2ℵ𝛼| ≥ ℵ𝛼+1.

Como cardinais são números ordinais, para dois cardinais 𝜅 e 𝜆 quaisquer, vale exatamente um dentre os três casos: 𝜅 < 𝜆, 𝜆 < 𝜅 ou 𝜅 = 𝜆. Por outro lado, como vimos no Teorema 4.10, números cardinais estão inteiramente relacionados ao conceito de equipotência. Dessa forma, uma consequência natural do Axioma da Escolha é que para quaisquer conjuntos 𝑋 e 𝑌, tem-se necessariamente 𝑋 ≺ 𝑌, 𝑌 ≺ 𝑋 ou 𝑋 ≈ 𝑌. Essa é a chamada Lei da Tricotomia. Como vemos abaixo, a Lei da Tricotomia e o Princípio da Boa Ordenação são logicamente equivalentes; adaptamos a demonstração de Suppes (1972, p. 247).

(i) (O Princípio da Boa Ordem) Todo conjunto é bem ordenável;

(ii) (Lei da Tricotomia) Para quaisquer conjuntos 𝑋 e 𝑌, tem-se exatamente

um dos casos: 𝑋 ≺ 𝑌, 𝑌 ≺ 𝑋 ou 𝑋 ≈ 𝑌;

(iii) (∀𝐴)�𝐴 ≺ ℎ(𝐴)�.

Demonstração.

((i) ⟹ (ii)). Sejam 𝑋 e 𝑌 conjuntos quaisquer. Decorre de (i) que 𝑋 e 𝑌 são bem ordenáveis. Então, do Teorema 4.9 e da Definição 4.19, segue que existem únicos cardinais 𝜅 e 𝜆 tais que |𝑋| = 𝜅 e |𝑌| = 𝜆. Da tricotomia dos ordinais, temos necessariamente um dos seguintes casos: 𝜅 < 𝜆, 𝜆 < 𝜅 ou 𝜅 = 𝜆. O resultado segue então do Teorema 4.10.

((ii) ⟹ (iii)). Seja 𝐴 um conjunto qualquer. Por definição, o Número de Hartogs de 𝐴 é tal que ¬(ℎ(𝐴) ≾ 𝐴). Daí, a lei da tricotomia implica em 𝐴 ≺ ℎ(𝐴).

((iii) ⟹ (i)). Para um conjunto 𝐴 qualquer, se 𝐴 ≺ ℎ(𝐴), então 𝐴 é bem ordenável, conforme mostrado na Proposição 4.6. Q.E.D.

Outro importante resultado utilizado na Matemática é o Lema de Zorn, cuja importância consiste na relativa simplicidade em utilizá-lo para demonstrações de existência, que antes de sua formulação eram feitas por meio de indução transfinita. (KURATOWSKI & MOSTOWSKI, 1976). Provamos a seguir que o Lema de Zorn é equivalente ao Axioma da Escolha (AC3).

Definição 5.1. Seja 〈𝐴, ≤〉 um conjunto parcialmente ordenado e 𝐵 ⊆ 𝐴. 𝐵 é uma

cadeia de 𝐴 se, e somente se, 〈𝐵, ≤〉 é uma ordem total.

Teorema 5.4. As seguintes afirmações são equivalentes em ZF:

(i) (O Axioma da Escolha — (AC3)) Existe uma função escolha para

qualquer família não vazia de conjuntos;

(ii) (O Lema de Zorn) Se toda cadeia num conjunto parcialmente ordenado

possui um limite superior, então o conjunto parcialmente ordenado possui um elemento máximo.

Demonstração.

((i) ⟹ (ii)). Seja 〈𝐴, ≼〉 um conjunto parcialmente ordenado e assuma que toda cadeia possua um limite superior. Fixemos 𝑏 ∉ 𝐴 e 𝑔: ℘(𝐴) ⟶ 𝐴 uma função escolha. Por recursão transfinita, definamos para todo ordinal 𝛼, o termo 𝑎𝛼, tal que

𝑎𝛼 = �

𝑔(𝐴𝛼), se 𝑏 ∉ 𝑎[𝛼] ∧ 𝐴𝛼 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝛼) ⟹ 𝑎𝜉 < 𝑎�� ≠ ∅

𝑏 , se 𝐴𝛼 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝛼) ⟹ 𝑎𝜉< 𝑎�� = ∅ ∨ 𝑏 ∈ 𝑎[𝛼]

,

onde 𝑎[𝛼] = �𝑎𝜉�𝜉 é ordinal ∧ 𝜉 < 𝛼�. Notemos que para 𝛼 = 0, temos

𝐴0 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 0) ⟹ 𝑎𝜉 < 𝑎�� = 𝐴,

e assim 𝑎0 é algum elemento de 𝐴; para 𝛼 = 1,

𝐴1= �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 1) ⟹ 𝑎𝜉 < 𝑎�� = {𝑎 ∈ 𝐴|𝑎 > 𝑎0},

e daí 𝑎1 é algum elemento maior do que 𝑎0, e assim sucessivamente: cada 𝑎𝛼 é um membro de 𝐴 maior do que todos os 𝑎𝛽 anteriores. Claramente, deve existir algum ordinal 𝜆 < ℎ(𝐴) para o qual 𝑎𝜆 = 𝑏, caso contrário 𝑎 ↾ ℎ(𝐴): ℎ(𝐴) ⟶ 𝐴 seria uma função injetora, contrariando a definição de ℎ(𝐴); fixemos o menor ordinal 𝜆 tal que 𝑎𝜆 = 𝑏.

Então, �𝑎𝜉�𝜉 < 𝜆� é uma cadeia em 𝐴 por construção, pois todos os seus membros são comparáveis. Logo, pela hipótese que assumimos sobre 𝐴, existe 𝑐 ∈ 𝐴 tal que 𝑐 ≽ 𝑎𝜉, para todo 𝜉 < 𝜆. Se existisse 𝑣 ∈ 𝐴 tal que 𝑣 ≻ 𝑐, teríamos 𝑣 ≻ 𝑎𝜉 para todo 𝜉 < 𝜆 e, consequentemente,

𝑣 ∈ 𝐴𝜆 = �𝑎 ∈ 𝐴�(∀𝜉) �(𝜉 é ordinal ∧ 𝜉 < 𝜆) ⟹ 𝑎𝜉 < 𝑎�� ≠ ∅

acarretando 𝑎𝜆 = 𝑔(𝐴𝜆) ≠ 𝑏. Portanto, 𝑐 é um elemento máximo de 𝐴.

((ii) ⟹ (i)). Seja 𝐴 ≠ ∅. Provemos que existe 𝑓: 𝐴 ⟶ ⋃ 𝐴 tal que 𝑓(𝑎) ∈ 𝑎, para todo 𝑎 ∈ 𝐴, com 𝑎 ≠ ∅. Consideremos o conjunto

𝐹 = �𝑓 ∈ ℘�𝐴 × (⋃𝐴)��𝑓: 𝔇(𝑓) ⟶ ⋃𝐴 ∧ (∀𝑎)(𝑎 ∈ 𝔇(𝑓) ⟹ 𝑓(𝑎) ∈ 𝑎)�,

isto é, 𝐹 é o conjunto das funções 𝑓 cujo domínio está contido em 𝐴 e tais que 𝑓(𝑎) ∈ 𝑎 para todo 𝑎 ∈ 𝔇(𝑓). Tomando ⊆𝐹= {〈𝑥, 𝑦〉 ∈ 𝐹 × 𝐹|𝑥 ⊆ 𝑦}, é evidente que 〈𝐹, ⊆𝐹〉 é parcialmente ordenado. Suponha então que 𝐹0 seja uma cadeia em 𝐹. Afirmamos que 𝑓̅ = ⋃ 𝐹0 é um limite superior de 𝐹0. Obviamente 𝑓 ⊆ 𝑓̅, para qualquer 𝑓 ∈ 𝐹0; como 𝐹0 é totalmente ordenado pela ⊆𝐹, para quaisquer 𝑓, 𝑔 ∈ 𝐹0, 𝑓 ⊆ 𝑔 ou 𝑔 ⊆ 𝑓, donde segue que 𝐹0

é um sistema de funções compatíveis e daí, pelo Teorema 3.14, 𝑓̅ ∈ 𝐹, o que mostra que 𝑓̅ é um limite superior de 𝐹0.

Como 𝐹0 é uma cadeia arbitrária de 𝐹, segue que toda cadeia em 𝐹 tem limite superior e, pelo Lema de Zorn, existe 𝔉 ∈ 𝐹 tal que para qualquer função 𝑓 ∈ 𝐹, 𝔉 ⊄ 𝑓. Se provarmos que 𝔇(𝔉) = 𝐴, garantiremos que 𝔉 é uma função escolha de 𝐴. De fato, se por absurdo 𝔇(𝔉) ≠ 𝐴, então existe 𝑎 ∈ 𝐴 ∖ 𝔇(𝔉). Se 𝑎 ≠ ∅, existe 𝑎� ∈ 𝑎, daí basta tomarmos 𝔉� = 𝔉 ∪ {〈𝑎, 𝑎�〉} ∈ 𝐹; se 𝑎 = ∅, fixemos 𝑥 ∈ ⋃ 𝐴 qualquer e façamos 𝔉� = 𝔉 ∪ {〈∅, 𝑥〉} ∈ 𝐹. Em ambos os casos, 𝔉� é tal que 𝔉 ⊂ 𝔉�, contrariando a maximalidade de 𝔉 garantida pelo Lema de Zorn. Q.E.D.

Existem ainda várias sentenças equivalentes ao Axioma da Escolha em ZF. A maioria dos autores consultados discute as equivalências tratadas aqui, bem como tantas outras — principalmente Jech (1973). Um resultado por vezes citado unicamente como consequência do Axioma da Escolha, a existência de uma base para todo espaço vetorial, é na verdade equivalente a este, conforme provado em 1984, por Andreas Blass. Encerramos esta seção com a demonstração de tal fato; assumimos conhecidos os conceitos de Álgebra utilizados abaixo, os quais podem ser encontrados, por exemplo, no trabalho de Coelho & Lourenço (2007) e Rotman (2005).

Teorema 5.5. As seguintes afirmações são equivalentes em ZF:

(i) (O Lema de Zorn) Se toda cadeia num conjunto parcialmente ordenado

possui um limite superior, então o conjunto parcialmente ordenado possui um elemento máximo;

(ii) Todo espaço vetorial admite uma base;

(iii) Para qualquer família disjunta 𝐴 = {𝐴𝑖|𝑖 ∈ 𝐼} de conjuntos não vazios, existe 𝑓: 𝐼 ⟶ ℘(⋃ 𝐴) tal que 𝑓(𝑖) ⊆ 𝐴𝑖 é um subconjunto finito não vazio de 𝐴𝑖, para todo 𝑖 ∈ 𝐼;

(iv) (O Axioma da Escolha — (AC3)) Existe uma função escolha para

qualquer família não vazia de conjuntos. Demonstração.

Devido às equivalências já vistas, basta provarmos que (i) ⟹ (ii) ⟹ (iii) ⟹ (iv). Assumimos como fato que (iii) ⟹ (iv); sua demonstração se baseia em conceitos abordados apenas superficialmente no Apêndice B. Uma prova detalhada pode ser encontrada em Komjáth & Totik (2006, p. 477). Mostraremos então que (i) ⟹ (ii) ⟹ (iii).

((i) ⟹ (ii)). Seja 𝑉 um 𝕂-espaço vetorial não nulo. Logo, existe um subconjunto 𝒞 ⊆ 𝑉 linearmente independente (l.i.) em 𝑉. Consideremos então o conjunto

𝐹 = {𝐿 ∈ ℘(𝑉)|𝒞 ⊆ 𝐿 ∧ 𝐿 é l.i.}.

Obviamente, 〈𝐹, ⊆𝐹〉 é parcialmente ordenado. Tomemos uma cadeia em 𝐹, que seja 𝐹′. Provar que existe um limite superior para 𝐹′ consiste em exibir um subconjunto 𝐹� linearmente independente em 𝑉 tal que, para todo 𝐴 ∈ 𝐹′, 𝐴 ⊆ 𝐹�. Afirmamos que 𝐹� = ⋃ 𝐹′ é um limite superior para 𝐹′.

De fato, se 𝐴 ∈ 𝐹′ então 𝐴 ⊆ 𝐹�. Seja então 𝐹�𝑛 = {𝑣0,…, 𝑣𝑛} ⊆ 𝐹� um subconjunto finito de 𝐹�. Para cada 𝑖 ≤ 𝑛, existe 𝐴𝑖 ∈ 𝐹′ tal que 𝑣𝑖 ∈ 𝐴𝑖. Segue do fato de 𝐹′ ser uma cadeia que existe 𝑗 ≤ 𝑛 tal que 𝑣𝑖 ∈ 𝐴𝑗, para todo 𝑖 ≤ 𝑛 e, como 𝐴𝑗∈ 𝐹′, decorre que 𝐹�𝑛 é l.i. Como 𝐹�𝑛 é um subconjunto qualquer de 𝐹�, conclui-se que 𝐹� é um limite superior para 𝐹′.

Segue do Lema de Zorn que existe 𝔅 ∈ 𝐹 um elemento maximal de 𝐹, isto é, para o qual não é válido 𝐴 ⊂ 𝔅, para qualquer 𝐴 ∈ 𝐹. Se, por absurdo, 𝔅 não fosse um conjunto gerador de 𝑉, existiria 𝑣 ∈ 𝑉 ∖ [𝔅] e, consequentemente, 𝔅′ = (𝔅 ∪ {𝑣}) ∈ 𝐹 seria tal que 𝔅 ⊂ 𝔅′, contrariando a maximalidade de 𝔅. Portanto, 𝔅 é um conjunto gerador de 𝑉

linearmente independente, ou seja, 𝔅 é uma base de 𝑉.

((ii) ⟹ (iii)) 1. Seja 𝐴 = {𝐴𝑖|𝑖 ∈ 𝐼} ≠ ∅ uma família de conjuntos não vazios dois a dois disjuntos, 𝕜 um corpo qualquer e 𝑋 = ⋃ 𝐴𝑖∈𝐼 𝑖. Seja 𝕜[𝑋] o anel de polinômios cujas

indeterminadas são os membros de 𝑋 e 𝕜(𝑋) o corpo das funções racionais de 𝑋, isto é, das

funções da forma 𝑝

𝑞 com 𝑝, 𝑞 ∈ 𝕜[𝑋] e 𝑞 ≠ 0𝕜[𝑋]. Notemos que 𝑋 ⊆ 𝕜[𝑋].

Para um polinômio 𝑝 ∈ 𝕜[𝑋], chamemo-lo de 𝑖-homogêneo de grau 𝑑 se a soma dos expoentes das variáveis de 𝐴𝑖 for 𝑑 em cada monômio de 𝑝. Analogamente, chamemos a função racional 𝑝

𝑞 ∈ 𝕜(𝑋) de 𝑖-homogênea de grau 𝑑 se 𝑝 for 𝑖-homogêneo de grau 𝑛 + 𝑑 e 𝑞

for 𝑖-homogêneo de grau 𝑛. O conjunto 𝐾 das funções 𝑖-homogêneas de grau 0, para todo 𝑖 ∈ 𝐼, constitui um subcorpo de 𝕜(𝑋) e, portanto, 𝕜(𝑋) é um espaço vetorial sobre 𝐾.

Consideremos então 𝑉 = [𝑋] ⊆ 𝕜(𝑋), o subespaço vetorial de 𝕜(𝑋) gerado por 𝑋. Por hipótese, existe uma base 𝔅 ⊆ [𝑋] de 𝑉. Para cada 𝑖 ∈ 𝐼 e 𝑥 ∈ 𝐴𝑖, 𝑥 pode ser unicamente representado como uma combinação 𝐾-linear finita

1 Adaptamos de Blass (1984) a demonstração de tal implicação.

�†1� 𝑥 = � 𝛼𝑏(𝑥)𝑏 𝑏∈𝐵(𝑥)

,

onde 𝐵(𝑥) ⊆ 𝔅 é um subconjunto finito e 𝛼𝑏(𝑥) ∈ 𝐾 ∖ {0𝐾}, para todo 𝑏 ∈ 𝐵(𝑥). Para outro 𝑦 ∈ 𝐴𝑖 qualquer, temos

�†2� 𝑦 = � 𝛼𝑏(𝑦)𝑏 𝑏∈𝐵(𝑦)

.

Como 𝑥, 𝑦 ∈ 𝐴𝑖, segue que 𝑦

𝑥 ∈ 𝕜(𝑋) é uma função 𝑖-homogênea de grau 0 para

todo 𝑖, e daí 𝑦 𝑥 ∈ 𝐾. Multiplicando �†1� por 𝑦 𝑥, obtemos �†3� 𝑦 = � 𝑦 𝑥𝛼𝑏(𝑥)𝑏 𝑏∈𝐵(𝑥) ,

daí, por �†2�, �†3� e da unicidade dos coeficientes envolvidos na representação de 𝑦, 𝐵(𝑥) = 𝐵(𝑦) e 𝛼𝑏(𝑦) =𝑦𝑥𝛼𝑏(𝑥), para todo 𝑦 ∈ 𝐴𝑖. Logo,

𝑐𝑏 = 𝛼𝑏(𝑥)

𝑥 =

𝛼𝑏(𝑦) 𝑦 .

Como 𝑥 e 𝑦 são elementos arbitrários de 𝐴𝑖, segue que 𝑐𝑏 e 𝐵(𝑥) independem da escolha dos elementos de 𝐴𝑖, dependendo apenas de 𝑖. Dessa forma, podemos dizer que para cada 𝑖 ∈ 𝐼, existe um subconjunto finito não vazio 𝐵(𝑖) ⊆ 𝔅 e escalares 𝑐𝑏(𝑖) ∈ 𝐾, para cada 𝑏 ∈ 𝐵(𝑖), tais que para qualquer 𝑥 ∈ 𝐴𝑖,

𝑥 = � 𝑥𝑐𝑏(𝑖)𝑏 𝑏∈𝐵(𝑖)

,

daí, como 𝑐𝑏(𝑖) = 𝛼𝑏(𝑥)

𝑥 e 𝛼𝑏(𝑥) ∈ 𝐾, segue que 𝑐𝑏(𝑖) é 𝑖-homogêneo de grau −1.

Consequentemente, quando expresso sob a forma reduzida, devem ocorrer (finitas) variáveis de 𝐴𝑖 no denominador de 𝑐𝑏(𝑖); tais variáveis são, por construção, elementos de 𝐴𝑖. Chamemos de 𝐵�𝑖 o conjunto das variáveis de 𝐴𝑖 que ocorrem no denominador de 𝑐𝑏(𝑖) para todo 𝑏 ∈ 𝐵(𝑖); pelo o que discutimos, 𝐵�𝑖 é um subconjunto finito não vazio de 𝐴𝑖, para todo 𝑖 ∈ 𝐼. Daí, claramente a função 𝑓: 𝐼 ⟶ ℘(⋃𝐴) dada por 𝑓(𝑖) = 𝐵�𝑖 satisfaz (iii). Q.E.D.

5.3. A Hipótese Generalizada do Continuum

Encerramos este capítulo com a demonstração de que a Hipótese Generalizada do Continuum (HGC) implica o Axioma da Escolha. Em outras palavras, assumir HGC como um axioma em ZF permite derivar (AC3) como um teorema. Tal resultado se mostra interessante

por evidenciar a enorme gama de resultados que se pode obter ao trabalharmos com proposições independentes. Julgamos pertinentes alguns comentários preliminares.

Vimos na seção anterior que, em ZFC, |2ℵ𝛼| = ℵ𝛽 ≥ ℵ𝛼+1, para algum 𝛽 > 𝛼.

Não podemos determinar em ZFC, de modo geral, qual “o valor” do ordinal 𝛽. Sabe-se apenas que 𝛽 > 𝛼. A formulação mais comum de HGC estabelece que 𝛽 = 𝛼 + 1.

HGC1 — |2ℵ𝛼| = ℵ𝛼+1.

Em outras palavras, HGC1 afirma que para qualquer ordinal 𝛼, ℘(ℵ𝛼) ≈ ℎ(ℵ𝛼),

pois ℵ𝛼+1 = ℎ(ℵ𝛼) por definição. Claro que, como em ZFC todo conjunto infinito possui um cardinal transfinito, poderíamos considerar HGC como sendo a afirmação:

HGC2 — Se 𝐴 é infinito então ℘(𝐴) ≈ ℎ(𝐴),

ou equivalentemente,

HGC2’ — Se 𝐴 é infinito então 2𝐴 ≈ ℎ(𝐴).

Por outro lado, como vimos no Corolário 4.9, para qualquer ordinal 𝛼 não existe cardinal transfinito 𝜅 tal que ℵ𝛼 < 𝜅 < ℵ𝛼+1, donde se conclui (em ZFC) que se 𝑋 é infinito, então não existe conjunto 𝑌 tal que |𝑋| < |𝑌| < |℘(𝑋)|, ou equivalentemente, se |𝑋| ≤ |𝑌| ≤ |℘(𝑋)|, então |𝑋| = |𝑌| ou |𝑌| = |℘(𝑋)|. É essa última formulação que adotamos como

oficial para HGC, que encontramos no trabalho de Miraglia (1991).

Hipótese Generalizada do Continuum (HGC). Se 𝑋 é um conjunto infinito e o

conjunto 𝑌 é tal que 𝑋 ≾ 𝑌 e 𝑌 ≾ 2𝑋, então 𝑋 ≈ 𝑌 ou 𝑌 ≈ 2𝑋.

Grosso modo, dado um conjunto infinito 𝑋, HGC estabelece que não existe

qualquer conjunto 𝑌 que admita injeções 𝜑: 𝑋 ⟶ 𝑌 e 𝜓: 𝑌 ⟶ ℘(𝑋), e não seja equipotente a 𝑋 ou a ℘(𝑋). A demonstração de que HGC implica (AC3) dada por Miraglia requer alguns

pré-requisitos, os quais são dados a seguir; as demonstrações podem ser encontradas em (MIRAGLIA, 1991).

Teorema 5.6.

(i) HGC ⟹ Se 𝛼 é ordinal tal que 𝜔 ≤ 𝛼, então 2𝛼 ≈ ℎ(𝛼);

(ii) ℎ(𝑋 × 𝑌) ≈ ℎ(𝑋) × ℎ(𝑌) ≈ max{ℎ(𝑋), ℎ(𝑌)} para 𝑋 e 𝑌 infinitos (em

particular, ℎ(𝑋 × 𝑌) = max{ℎ(𝑋), ℎ(𝑌)});

(iii) Denotemos 𝑋 + 𝑌 = ({0} × 𝑋) ∪ ({1} × 𝑌); se 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋), então 𝑋 é bem ordenável, para qualquer conjunto 𝑋 infinito;

(iv) Se 𝑋 é infinito, então 2𝑋× 2ℎ(𝑋) ≈ 2𝑋+ℎ(𝑋). Em posse de tais resultados, provamos o teorema seguinte. Teorema 5.7. HGC ⟹ (AC3).

Demonstração.

Seja 𝑋 um conjunto infinito qualquer e fixemos 𝑥 ∈ 𝑋. As funções 𝑓1: 𝑋 + ℎ(𝑋) ⟶ 𝑋 × ℎ(𝑋), 𝑓2: 𝑋 × ℎ(𝑋) ⟶ ℘(𝑋) × ℘�ℎ(𝑋)� e

𝑓3: ℘(𝑋) × ℘�ℎ(𝑋)� ⟶ ℘�𝑋 × ℎ(𝑋)� dadas respectivamente por

𝑓1(〈𝛼, 𝑦〉) = �〈𝑦, 𝛼〉 , se 𝛼 = 0〈𝑥, 𝑦〉 , se 𝛼 = 1, para quaisquer〈𝛼, 𝑦〉 ∈ 𝑋 + ℎ(𝑋), 𝑓2(〈𝑥, 𝛼〉) = 〈{𝑥},{𝛼}〉, para todo 〈𝑥, 𝛼〉 ∈ 𝑋 × ℎ(𝑋) e

𝑓3(〈𝑆, Ω〉) = 𝑆 × Ω, para qualquer 〈𝑆, Ω〉 ∈ ℘(𝑋) × ℘�ℎ(𝑋)�, são injetoras, e mostram que

𝑋 + ℎ(𝑋) ≾ 𝑋 × ℎ(𝑋) ≾ 2𝑋× 2ℎ(𝑋),

donde segue pelo item (iv) do Teorema 5.6 que

𝑋 + ℎ(𝑋) ≾ 𝑋 × ℎ(𝑋) ≾ 2𝑋+ℎ(𝑋),

Se provarmos que 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋), seguirá pelo item (iii) do Teorema 5.6 que 𝑋 é bem ordenável, donde concluiremos que todo conjunto é bem ordenável, o que equivale ao Axioma da Escolha.

Devido a HGC, basta mostrarmos que não podemos ter 𝑋 × ℎ(𝑋) ≈ 2𝑋× 2ℎ(𝑋). Se, por absurdo, tal equipotência fosse verdadeira, teríamos ℎ�𝑋 × ℎ(𝑋)� = ℎ�2𝑋 × 2ℎ(𝑋)�. Então, pelo item (ii) do Teorema 5.6, obteríamos, por um lado

ℎ�𝑋 × ℎ(𝑋)� = max�ℎ(𝑋), ℎ�ℎ(𝑋)�� = ℎ�ℎ(𝑋)�, e, por outro lado,

ℎ�2𝑋 × 2ℎ(𝑋)� = max�ℎ(2𝑋), ℎ�2ℎ(𝑋)�� ≥ ℎ�2ℎ(𝑋)�.

Logo, ℎ�2ℎ(𝑋)� ≤ ℎ�ℎ(𝑋)� e, consequentemente, ℎ�2ℎ(𝑋)� ≾ ℎ�ℎ(𝑋)�. Porém, pelo item (i) do Teorema 5.6, temos ℎ�ℎ(𝑋)� ≈ 2ℎ(𝑋), donde concluímos que

ℎ�2ℎ(𝑋)� ≾ 2ℎ(𝑋).

Absurdo. Portanto, 𝑋 + ℎ(𝑋) ≈ 𝑋 × ℎ(𝑋). Q.E.D.

Assim, HGC implica (AC3). Logo, ao assumirmos HGC, para todo conjunto

infinito 𝐴 existe um ordinal 𝛼 tal que 𝐴 ≈ ℵ𝛼. Observemos então que ℵ𝛼+1 = ℎ(𝐴) e também que 2ℵ𝛼 ≈ 2𝐴. Por termos 2ℵ𝛼 ≈ ℵ𝛼+1, segue que ℎ(𝐴) ≈ 2𝐴. Ou seja, HGC ⟹ HGC2.

Por outro lado, HGC2 ⟹ HGC. De fato, se ℘(𝐴) ≈ ℎ(𝐴) para todo conjunto 𝐴

infinito, então ℘(𝐴) é bem ordenável, donde consequentemente 𝑃 = �{𝑥}�𝑥 ∈ 𝐴� é um subconjunto bem ordenado de ℘(𝐴). Como 𝐴 ≈ 𝑃, inferimos que 𝐴 é bem ordenável, o que mostra a validade do Princípio da Boa Ordem e, por conseguinte, do Axioma da Escolha. Logo, para todo conjunto infinito 𝐴, existe um ordinal 𝛼 tal que ℵ𝛼 ≈ 𝐴. Como HGC2 afirma

que ℘(𝐴) ≈ ℎ(𝐴) e ℘(𝐴) ≈ 2𝐴 conforme já provamos, temos 2ℵ𝛼 ≈ ℵ𝛼+1 e, do Corolário

Conclusão

Como vimos, a Teoria dos Conjuntos mostra-se altamente adaptada à generalização e à abstração, peças fundamentais para o desenvolvimento da Matemática Pura. Vemos hoje que não apenas sua linguagem, mas também seus conceitos fundamentais encontram-se intrinsecamente ligados a praticamente todos os ramos da Matemática. Neste sentido, ZFC pode ser visto como uma fundamentação para as principais áreas da Matemática, uma vez que permite o desenvolvimento da Teoria dos Conjuntos, a qual engloba a formalização dos números e das funções.

Como os números naturais são a base para o desenvolvimento dos demais conjuntos numéricos, o que se faz por meio de operações definidas em ZFC, podemos ver que os principais tópicos da Álgebra, da Topologia e da Análise encontram-se sustentados pelos axiomas que postulamos. Apenas temas mais avançados, os quais eventualmente podem requerer a Teoria das Categorias e a existência de classes próprias, podem não encontrar fundamentação formal suficiente em ZFC. Ainda assim, existem outros sistemas de axiomas, bem próximos de ZFC, que preenchem tal lacuna.

No que concerne à própria Teoria dos Conjuntos, ainda existem grandes questões a serem estudadas. As pesquisas referentes à consistência e independência de muitas sentenças em ZFC abrem caminhos para muitos questionamentos interessantes: Quais outras hipóteses implicam o Axioma da Escolha? Alguma delas o nega? Quais os efeitos em negar algum dos axiomas de ZFC no desenvolvimento subsequente da Matemática? O que se pode fazer na Topologia, na Álgebra, na Análise, etc., ao negarmos, por exemplo, o Axioma do Infinito, ou o Axioma das Partes?

No mesmo sentido do que ocorreu com a Geometria no advento da discussão sobre o postulado das paralelas, o avanço das pesquisas sobre os axiomas da Teoria dos Conjuntos pode culminar no desenvolvimento de diferentes “Teorias dos Conjuntos” de

Documentos relacionados