Grupos Universidade do Norte Jairo Castañeda, Bernarda Gómez

(1)

Fundamentos, Grupos, Anillos,

Cuerpos y Teor´ıa de Galois

Jairo A. Charris Casta˜neda

Academia Colombiana de Ciencias Exactas, F´ısicas y Naturales

Bernarda Aldana G´omez

Escuela Colombiana de Ingenier´ıa

(2)

(3)

El texto que sigue es una elaboración y ampliación por los dos últimos autores de las notas de clase presentadas por el primero a estudiantes de los cursos de Algebra Abstracta (I y II) del Programa de Pregrado en Matemáticas de la Universidad Sergio Arboleda de Bogotá durante el per´ıodo 2001/2002. Los Cap´ıtulos 1 a 12 del presente volumen corresponden al material publica-do por los autores en [9], corregipublica-do y actualizapublica-do, está básicamente dedicapublica-do a la teor´ıa elemental de los grupos.

De hecho, sólo la segunda parte, Cap´ıtulos 2 a 8, fué presentada detallada-mente en las clases del curso Álgebra Abstracta I. La primera parte, Cap´ıtulo 1, fué redactada para los propósitos de referencia, y contiene las nociones bási-cas indispensables para el resto del trabajo sobre la teor´ıa de los conjuntos y los sistemas numéricos clásicos (números naturales, enteros, racionales, reales y complejos), incluyendo nociones elementales de aritmética. Esta primera parte suministra, además de instrumentos, ejemplos concretos del material más abstracto de las segunda y tercera partes, y puede constituir de por si la base para un curso de un semestre sobre los temas citados arriba y sobre la generación de estructuras abstractas. Es razonable suponer, sin embargo, que su contenido es suficientemente bién conocido por los estudiantes del pri-mer curso de Algebra. La tercera parte, Cap´ıtulos 9 a 12, dedicada a grupos y resultados especiales, es de un nivel más elevado que el de las otras dos y fué incluida para beneficio de los estudiantes más sobresalientes del curso, que pueden encontrar en ella técnicas y resultados relativamente avanzados que, sin embargo, constituyen aún material indispensable para una

(4)

sión aceptable de los métodos de la teor´ıa moderna de los grupos, y que, de ser cubierto totalmente en un curso, har´ıa de éste un primer curso al nivel de posgrado.

La segunda parte pretende familiarizar al estudiante con las nociones y desa-rrollos básicos de la teor´ıa de los grupos (grupos, subgrupos, subgrupos nor-males, grupos producto y grupos cociente, homomorf´ıa e isomorf´ıa), con al-gunas consideraciones sobre el problema de la existencia y las propiedades estructurales de los grupos abelianos finitos, y con un examen más o menos detallado de los grupos finitos de permutaciones, que no sólo suministran ejemplos significativos de grupos no abelianos, sino que son indispensables en cualquier estudio serio tanto de estos últimos objetos como de muchas otras partes del álgebra moderna. También incursionamos en esta parte en la teor´ıa de Sylow en el caso conmutativo, más accesible de lo que lo es en el caso general. La exposición de esta segunda parte es, dados sus objeti-vos, pausada, detallada y rigurosa: todos los resultados que se mencionan, y sobre todo aquellos que son indispensables en desarrollos posteriores, se demuestran cuidadosamente. Hemos procurado que cada cap´ıtulo conten-ga al menos un resultado significativo y no del todo trivial, pues un primer curso de álgebra, y especialmente uno dedicado a la teor´ıa de los grupos, es un marco excelente para ir familiarizando a los estudiantes con el poder y omnipresencia del método deductivo en matemáticas y con algunas de sus caracter´ısticas más relevantes. Asimilar las nociones y resultados básicos de esta parte es, como lo hemos mencionado, indispensable para cualquier estudio posterior de la teor´ıa de los grupos y, de hecho, para el de muchas otras partes del álgebra. En particular, es indispensable para una buena comprensión de la tercera parte.

(5)

ingeniosas de los teoremas de isomorf´ıa) como en su significado y objetivos (describir en forma precisa cualquier grupo en términos de los llamados gru-pos simples, algo que los principiantes pueden no estar listos para apreciar en toda su dimensión), y del segundo, no tanto en su significado y objetivos (construir, o lo que es equivalente, establecer la existencia de grupos sobre medidas), como en su desarrollo (notablemente abstracto: alfabetos, pala-bras, generadores y relaciones, etc.). De usarse el presente documento como base para un curso de posgrado, algo habr´ıa que hacer con respécto a estas omisiones.

La cuarta parte contiene una presentación clásica de la teor´ıa de cuerpos, por lo que se hace en el contexto de los cuerpos numéricos y se omite, en lo posible, el uso del Álgebra Lineal. En la quinta parte se estudian las estructu-ras abstractas básicas, anillos y cuerpos generales, as´ı como sus propiedades aritméticas, generalizando y unificando temas ya explorados para las estruc-turas numéricas. Se introducen los espacios vectoriales y se muestra cómo su uso permite simplificar notablemente la demostración de muchos de los re-sultados precedentes. Se termina con la teor´ıa de Galois de los cuerpos finitos.

Como iniciativa del segundo y tercer autores, siguiendo los lineamientos del texto, se incluye un ap´endice sobre la teor´ıa de Galois diferencial desde un punto de vista b´asico, el cual puede ser entendido por los lectores sin recurrir a otro texto.

(6)

un primer contacto con tal material.)

La presentación que hacemos (y que esperamos que ocupe un justo medio entre un texto divulgativo y un tratado sobre las estructuras algebraicas abstractas, compartiendo las virtudes pero no los defectos de tal tipo de do-cumentos) ha sido altamente influida por la de los excelentes libros de I. N. Herstein [18] y[19]. De hecho, puede decirse que la nuestra es en esencia una elaboración del material de estas obras, presentándolo en forma algo más de-tallada, con el f´ın de adaptarlo a las necesidades de nuestros estudiantes y al estilo de los cursos en nuestras universidades. Esperamos as´ı haber comunica-do suficientes conocimientos técnicos sobre el tema para permitir autonom´ıa de pensamiento en el mismo sin pretender crear un erudito. Otros textos han tenido también influencia, como es fácilmente detectable, aunque de una manera más local. Esto es evidente de los magn´ıficos libros de T. W. Hun-gerford [20], S. Lang [24], J. Rotman [27] y [28], E. Artin [4], I. Kaplansky [22] y B. L. Van der Waerden [32], aunque todos ellos son de un nivel más avanzado que el nuestro. También se han consultado, con grán beneficio, el texto de J. F. Caycedo [8] y las notas del curso que sobre la teor´ıa de los gru-pos imparte el Profesor V. S. Albis en la Universidad Nacional en Bogotá [3], a quien agradecemos habernos puesto a nuestra disposición el contenido total de las mismas, incluyendo material aún no publicado.

Hemos procurado que tanto la notación como la terminolog´ıa sean las más usuales. En cuanto a la primera, tal vez sólo las expresiones A := B o

B =: A, que indican que A se define en términos de B, son algo exóticas. En cuanto a la segunda, hemos preferido el lenguaje clásico, tal vez un poco anticuado, de los años 30 y 40 del Siglo XX, antes de la Teor´ıa de las Cate-gor´ıas y el Álgebra Homológica hicieran su impacto (a comienzos de los años 50).

(7)

Introducci´on III

I

Fundamentos

1

1. Conjuntos, funciones y sistemas num´ericos 3

1.1. Conjuntos y funciones . . . 3

1.2. Los n´umeros reales . . . 13

1.3. Los n´umeros naturales . . . 19

1.4. N´umeros enteros y aritm´etica elemental . . . 23

1.5. Los n´umeros racionales . . . 32

1.6. Dos notaciones ´utiles . . . 34

1.7. Los n´umeros irracionales . . . 35

1.8. Los n´umeros complejos . . . 38

1.9. Conjuntos finitos e infinitos . . . 48

II

Teor´ıa elemental de los grupos

69

2. Grupos 71

3. Subgrupos 89

(8)

4. Subgrupos Normales 103

5. Homomorf´ıa e isomorf´ıa 111

6. Los teoremas de isomorf´ıa 121

7. Productos finitos de grupos 137

8. El grupo sim´etrico 149

III

Grupos y resultados especiales

173

9. Grupos de operadores 175

10.La teor´ıa de Sylow 189

11.Grupos del tipo (p, q) y grupos diedros 201

12.Nilpotencia y resolubilidad 217

IV

Teor´ıa elemental de cuerpos num´

ericos

241

13. Extensiones algebraicas de los cuerpos num´ericos 243

14.Constructibilidad: Extensiones y objetos construibles 297

15.El grupo de Galois de una extensi´on num´erica 311

16.Extensiones Normales 321

17.El Teorema de Galois 329

18.Extensiones Ciclot´omicas y Relacionadas 333

19.Extensiones Radicales. Teorema de Abel 339

V

Anillos, cuerpos y t´

opicos especiales

349

(9)

21.Ideales 369

22.Propiedades aritm´eticas.

Anillos Factoriales, Principales y eucl´ıdeos 389

23.Dos ejemplos notables de anillos y cuerpos 407

24.Espacios Vectoriales y M´odulos 415

25.Cuerpos Conmutativos 431

26.Cuerpos finitos 449

(10)

(11)

Fundamentos

(12)

(13)

Conjuntos, funciones y sistemas num´ericos

En este cap´ıtulo fijaremos el lenguaje fundamental, el de los conjuntos, y revisaremos las propiedades básicas de los sistemas numéricos clásicos. Tra-taremos de ser breves, pues suponemos que las nociones aqu´ı introducidas son en alguna medida conocidas por los lectores, pero no sacrificaremos la precisión necesaria.

La presentación que daremos se inspira en diversas fuentes, que no excluyen el Libro I del tratado de Bourbaki [7] (véase también [14]), pero es mucho más informal y muy cercana a la dada en [10], aunque más elaborada en ciertos puntos.

1.1. Conjuntos y funciones

La noción matemática básica es la de conjunto. Los conjuntos son agru-paciones o colecciones de objetos que deseamos considerar a su vez como objetos autónomos. Los representaremos usualmente con letras mayúsculas

A, B, C, D, E, F, G, X, Y, Z, etc. Es tambi´en frecuente referirse a ellos como clases. Si X es un conjunto,a _∈X significar´a que a es un objeto, un elemento, o un miembro de X, y se dice que a pertenece a X. Si a no es un objeto de X, escribiremos a /∈X. SiX, Y son conjuntos, X ⊆Y,que se

(14)

lee X está contenido en Y, significará que todo objeto de X es también un objeto de Y. Se dice entonces queX es unsubconjunto deY,es usual escribir también Y ⊇ X, y expresarlo diciendo que Y contiene a X. La notación

X *Y,o lo que es lo mismo, laY +X,indicar´a queX no es un subconjunto deY, y ser´a equivalente a afirmar que existe a∈X tal que a /∈Y.

Aunque a veces se les da un significado diferente (véase, al respecto, [23], Apéndice), y aunque preferiremos el término conjunto, nosotros considera-remos que los términos clase y conjunto son sinónimos. Sólo usaremos es-porádicamente el término clase y usualmente en el contexto de conjunto de conjuntos (parece más elegante hablar de una clase de conjuntos).

Dos conjuntos X, Y son iguales,X =Y , si tienen los mismos elementos, es decir, si X ⊆ Y y Y ⊆ X. Si X y Y no son iguales, es decir, si X * Y o

Y *X, se dice queX y Y son diferentes, y se escribeX 6=Y.

Si a es un objeto, _{a_} denotará el conjunto cuyo único elemento es a. As´ı, si A = _{a_}, x _∈ A si y sólo si x = a. Debe distinguirse entre el objeto a

y el conjunto _{a_}. Si a, b son objetos, denotaremos con _{a, b_} el conjunto cuyos únicos elementos son a y b, as´ı que B = _{a, b_} significará que x _∈ B si y sólo si x = a o x = b. Si a = b y sólo en este caso será _{a, b_} = _{a_}.

De la misma manera, si a1, a2, ..., an son objetos, A = {a1, a2, ..., an}

deno-tar´a el conjunto cuyos elementos sona1, a2, ..., an. Entoncesx∈Asi y s´olo si

x=ai para alg´un i= 1,2, ..., n. SiP (x) es una condici´on sobre una variable

x y existe un conjunto A tal que a ∈ A si y s´olo si P (a) es una afirma-ci´on verdadera, usaremos las notaciones A = {x:P (x)} o A = {x:P (x)}

para representar tal conjunto. Se dice que A es el conjunto de los objetos que verifican P(x) y que P (x) es una relación colectivizante, es decir, que forma conjunto. Véase, al respecto, la notarelación colectivizante 1.5. As´ı,

{a_}=_{x:x=a_}, _{a, b_}=_{x:x=a ox=b_}, de tal manera que “x=a” y “x = a o x= b” son colectivizantes. Si P (x) es una condici´on en x y X

(15)

Denotaremos con ∅ el conjunto vac´ıo, el cual es un conjunto sin elementos. La razón de introducir un conjunto vac´ıo es en muchos aspectos análoga a la de introducir el número 0 en la aritmética elemental. Permite además in-terpretar 0, en forma semejante a 1, 2, 3, etc., como el número de elementos (cardinal) de un conjunto: 0 es el número de elementos de∅. Evidentemente

∅ es un subconjunto de cualquier conjunto A (pues de no ser as´ı, existir´ıa

a _∈∅ tal que a /_∈A, lo cual es absurdo). Esto asegura que existe un ´unico conjunto vac´ıo (pues si hay dos, ∅ y∅′_, _{con el mismo argumento anterior se}

verifica que∅⊆∅′_y_∅′ _⊆_∅_{). Decir que}_A₌_∅_{es equivalente a decir que}_no

existe ning´un objeto atal que a_∈A. A su vez,A₆=∅garantiza la existencia de un a_∈A. Claramente A=∅ si y s´olo siA _⊆∅. Si no existe un objeto

a tal que P(a) sea verdadera, admitiremos que P (x) es colectivizante y que

{x:P (x)} = ∅. Por ejemplo, {x:x6=x} = ∅. Si A y B son conjuntos,

A∪B (la unión deA yB)será el conjunto de los objetos que están al menos en uno de AoB, esto esA∪B ={x:x∈A ox∈B},y x∈A∪B si y sólo six∈Aóx∈B. A su vez,A∩B (la intersección de AyB) será elconjunto de los elementos comunes a A y B, esto esA∩B ={x:x∈A y x∈B}, y

x_∈A_∩B si y s´olo six_∈A y x_∈B. SiA_∩B =∅,se dice que A y B son

conjuntos disyuntos. Claramente A _⊆ A_∪B y B _⊆ A_∪B, A_∩B _⊆ A y

A_∩B _⊆B.

Otras propiedades son:

1. A_∪A=A, A_∩A=A, A_∪B =B _∪A, A_∩B =B_∩A, A_∪∅=A, A_∩∅=∅,

2. A_∪B =A si y s´olo si B _⊆A, A_∩B =B si y s´olo si B _⊆A,

3. A_∪(B_∪C) = (A_∪B)_∪C, A_∩(B_∩C) = (A_∩B)_∩C,

4. A∪(B∩C) = (A∪B)∩(A∪C), A∩(B∪C) = (A∩B)∪(A∩C).

(1.1)

SiA y B son conjuntos,ArB, ladiferencia deA yB, el conjunto A menos B, o el complemento de B en A,será el conjunto de los elementos de A que no están en B, esto es ArB =_{x_∈A:x /_∈B_}, y x _∈ ArB si y sólo si

(16)

si y s´olo si A⊆XrB. Adem´as,

1. Xr(A_∪B) = (XrA)_∩(XrB),

2. Xr(A_∩B) = (XrA)_∪(XrB). (1.2)

Verificaremos la segunda de tales igualdades: si x _∈ X r(A_∩B) enton-ces x _∈ X y x /_∈ (A_∩B), as´ı que x _∈ X y x /_∈ A o x /_∈ B; esto es

x_∈XrAo x_∈XrB, y entoncesx_∈(XrA)_∪(XrB) ; rec´ıprocamen-te, si x∈(XrA)∪(XrB), se tendr´a que x∈XrA o x∈XrB,de lo cual x ∈ X y x /∈ A o x /∈B; esto implica que x ∈X y x /∈ (A∩B), de lo cual x∈Xr(A∩B).

Definici´on 1.1. Si a y b son objetos,

(a, b) :=_{{a_},_{a, b_}} (1.3)

ser´a la pareja ordenada de primera coordenada a y segunda coordenada b.

Teorema 1.1. (a, b) = (c, d) si y s´olo si a=c y b=d.

Demostraci´on. La condici´on es obviamente suficiente. Para ver que es nece-saria, supongamos primeroa=b, as´ı que (a, b)={{a}}. Como{c, d} ∈(a, b),

ser´a _{c, d_} = _{a_}, as´ı que c = d = a. Esto implica a = c y b =d. Supon-gamos ahora a ₆= b. Claramente _{a_} = _{c_}, as´ı que a = c. Por otra parte

{a, b_} = _{c, d_}, as´ı que d = a o d = b. Pero, si fuera d = a se tendr´ıa que

d =c, de lo cual, por el argumento anterior, ser´ıa a =b =c=d. Entonces

d₆=a, y deber´a serd=b.

Se deduce que, en general, (a, b)₆= (b, a). De hecho, (a, b) = (b, a) si y s´olo si a=b.

Definici´on 1.2. Si X y Y son conjuntos, el conjunto

X_×Y :=_{(x, y) :x_∈X, y _∈Y_} (1.4)

se denomina el producto cartesiano deX y Y.

(17)

Si a1,a2, ..., an son objetos, n >2, se define “inductivamente”

(a1, a2, ..., an) = ((a1, a2, ..., an−1), an). (1.5)

El conjunto (a1, a2, ..., an) se denomina la n−pla ordenada de coordenadas

a1, a2, ..., an. En particular, (a, b, c) = ((a, b), c) ser´a la tripla ordenada de

coordenadas a, b, c. Como es natural, diremos que la pareja (a, b) ser´a la du-pla ordenada de coordenadas a, b. Se tiene que (a1, a2, ..., an) = (b1, b2, ..., bn)

si y s´olo si a1 = b1, a2 = b2, ..., an = bn. Si X1, X2, ..., Xn, n ≥ 2, son

conjuntos, X1 × X2 ×... ×Xn ser´a el conjunto de las n−plas ordenadas

(x1, x2, ..., xn) donde xi ∈ Xi, i = 1,2, ..., n. Si n > 2, podemos considerar

que X1×X2×...×Xn = (X1×X2 ×...×Xn−1)×Xn.

Definici´on 1.3. Un subconjunto G de X×Y se denomina una gr´afica. Si

G⊆X×Y es una gr´afica yx∈X, el corte de G con x, G(x),es

G(x) :={y∈Y : (x, y)∈G}. (1.6)

Definici´on 1.4. Si G ⊆ X × Y es una gr´afica, se dice que la tripla

R = (X, G, Y) es una relación entre elementos de X y de Y. Se dice en-tonces que G es la gráfica de R. El conjunto X se denomina el conjunto de definición o de partida de R y Y, el de llegada. Si (x, y) _∈ G, es usual escribir xRy y decir quex y y están relacionados por R.

Los conjuntos

Dom (R) := _{x_∈X :G(x)₆=∅}, Cod (R) := [

x∈X

G(x) (1.7)

(as´ı que Dom(R) = _{x_∈X : existey_∈Y con (x, y)_∈G_}y Cod(R) = _{y_∈ Y : existex_∈X con (x, y)_∈G_}),se denominan respectivamente el dominio

y el codominio de R. Si para todo x _∈ X, G(x) es vac´ıo o se reduce a un punto, se dice que G es una gr´afica funcional y que R es una relaci´on fun-cional. Esto equivale a decir que no existen enGdos parejas distintas con la misma primera coordenada, o, lo que es lo mismo, que sixRyyxRy′ _entonces

y =y′_. _{Puede suceder, sin embargo, que exista}_x_∈_X _{que no figure en}

(18)

Definición 1.5. Sif = (X, G, Y) es una relación funcional y Dom (f) = X, se dice que f es una aplicación o una función deX enY.

Si f = (X, G, Y) es una funci´on de X en Y, es usual escribir simplemente

f :X −→Y, sin mencionar a G. La razón para esto radica en queG puede describirse fácilmente en términos de f. En efecto, para todo x_∈ X, G(x) tiene un único elemento, el cual se denominala imagen de xpor f y se deno-ta con f(x), as´ı que G(x) = _{f(x)_}, y entonces G =_{(x, f(x)) : x_∈X_}. Intuitivamente,una función f :X _−→Y es una ley que a cada x_∈X asigna un único elementof(x)_∈Y (una máquina que transforma axenf(x)). La noción de función que hemos dado, aunque menos “dinámica” que esta in-terpretación intuitiva, contiene, sin embargo, toda la información pertinente acerca de ésta: conjunto de definición, conjunto de llegada, gráfica, dominio, codominio, etc. De hecho, cuando a una persona se le pide que hable de una función, su primer impulso es generalmente el de fijar su dominio y dibujar su gráfica.

SiA _⊆X, B _⊆Y y f :X _→Y es una funci´on,

f(A) := _{f(x)_∈Y :x_∈A_}, f−1(B) :=_{x_∈X :f(x)_∈B_}

se denominan respectivamente la imagen directa de A y la imagen rec´ıproca de B por f. Obviamentey_∈f(A) si y s´olo si existex_∈Atal que y=f(x) (lo cual no excluye que existax′ _∈_/_A _{tal que}_y₌_f₍_x′₎_,_{as´ı que}_f₍_x₎_∈_f₍_A₎

no garantiza que x∈A), yx∈f−1₍_B_{) si y s´olo si} _f₍_x₎_∈_B_.

Es claro que Dom (f) = f−1₍_Y_{) y Cod (}_f_{) =} _f₍_X₎_. _{Es costumbre en este} ´

ultimo caso denominar tambi´en a f(X) la imagen o el recorrido de f y denotarlos con Im (f). Si Im (f) = Y, se dice que f es sobreyectiva. Decir quef es sobreyectiva equivale entonces a decir que todo elemento de Y es la imagen de alg´un elemento de X, es decir, que para todo y _∈Y existe x_∈X tal que y=f(x).

(19)

Si a ∈Dom (f), se dice que f est´a definida en a; si A ⊆ Dom (f), que f est´a definida en A o sobre A.

Si f :X −→Y y g :Y −→Z, g◦f :X −→Z es la funci´on dada por

g◦f(x) := g(f(x)), x∈X. (1.8)

Si f = (X, G, Y) y g = (Y, G′_{, Z}_{), la gr´afica de} _g _◦_f _{se denota con} _G′ _◦_G_.

N´otese que

G′_◦G=_{(x, g(f(x))) : x_∈X_}

y g◦f = (X, G′_◦_{G, Z}_{). Se dice que} _g_◦_f _{es la} _{funci´on compuesta} _de_g _y

f y que G′ _◦_G_{es la} _{gr´afica compuesta} _{de sus respectivas gr´aficas.}

Si G_⊆X_×Y es una gr´afica,

G−1 :=_{(y, x) : (x, y)_∈G_{} ⊆}Y _×X (1.9) es también una gráfica, denominada lagráfica inversadeG. SiR = (X, G, Y), R−1 _{:= (}_{Y, G}−1_{, X}_{) se denomina la} _{relación inversa} _de_R. _Si_f _{= (}_{X, G, Y}₎ es una función y G−1 _{es una gráfica funcional, o sea, si (}_{y, x}₎_,₍_{y, x}′₎_∈ _G−1 implican x = x′_{, o, lo que es lo mismo, si} _f₍_x_{) =} _f₍_x′_{) implica} _x ₌ _x′_{, se}

dice que f es una aplicación o unafunción inyectiva de X en Y. Aún si f es inyectiva, puede ser que f−1 _{= (}_{Y, G}−1_{, X}_{) no sea una función, pues puede} suceder que Dom (f−1_{) =}_f₍_X₎₆₌_Y_.

Si tanto f como f−1 _{son funciones,} _{lo cual ocurre si y s´olo si} _f _{es tanto}

sobreyectiva como inyectiva, en cuyo caso se dice que f es biyectiva, f−1 _se denomina la función inversa def. Nótese que entoncesy=f(x) es equiva-lente a f−1₍_y_{) =} _x_{. Además,}_f−1_◦_f₍_x_{) =}_x _y _f_◦ _f−1₍_y_{) =} _y, _cualesquiera que sean x_∈X, y _∈Y.

SiZ es un conjunto, ∆Z ={(z, z) :z∈Z}se denomina la diagonal deZ (o,

m´as precisamente, de Z _×Z). Evidentemente ∆Z es un gr´afica funcional,

e iZ = (Z,∆Z, Z) es una función, que se denomina la función idéntica de

Z. N´otese que iZ(x) = x para todo x ∈ Z. Como es claro, ∆−Z1 = ∆Z e

i−_Z1 = iZ. Si f : X −→ Y es biyectiva, as´ı que f−1 : Y −→ X es tambi´en

una funci´on, se tiene entonces quef−1_◦_f ₌_i

(20)

f−1 _{es tambi´en biyectiva y (}_f−1₎−1 ₌_f_.

Nota 1.1. Al definirlos, hemos admitido impl´ıcitamente que garantizada la existencia de los conjuntos X, Y y de los objetos a, b, podemos garantizar la existencia de los conjuntos X _∪Y, X _∩ Y, X rY, _{a_}, _{a, b_}, (a, b),

X_×Y, etc. También hemos admitido, menos evidentemente, que si X y Y son conjuntos no vac´ıos y existe alguna regla que a cada elemento x _∈ X asocia un único elemento τ(x) de Y, existe entonces f : X _−→ Y tal que f(x) = τ(x). En efecto, podemos formar, según lo dicho en el cuar-to parágrafo de esta sección, el conjuncuar-to G = {(x, y) : (x, y) ∈ X ×Y y

y=τ(x)}={(x, y)∈X×Y :y=τ(x)} y la tripla (X, G, Y).

Nota 1.2. La notación f−1 _{para la función inversa de} _f _{puede ser} cau-sa de alguna confusión. Por ejemplo, de acuerdo con la práctica usual, si

b _∈ Y, f−1₍_b_{) denota a la vez el conjunto} _f−1₍_b_{) y a su ´}_{unico elemento.} Espe-ramos que el contexto evite siempre esta posible confusión. Análoga-mente, es quizá más natural llamar corte de una gráfica G _⊆ X _× Y con un punto x ∈ X al conjunto {x} ×G(x) que al G(x) (hágase un dibujo), pero las convenciones de lenguaje son dif´ıciles de cambiar. Además, G(x) es más útil que {x} ×G(x). Si X es un conjunto, f = (∅,∅, X) es una aplicación inyectiva de ∅ enX (pues no existen x, x′ _∈_∅_, _x₆₌_x′ _{tales que}

f(x) = f(x′_{)). Si} _X ₌ _∅_, _f ₌ _f−1 ₌ _i

∅ es la ´unica aplicaci´on de ∅ sobre

s´ı mismo, y es biyectiva.

Nota 1.3. SiR= (X, G, Y) es una relación yR−1 _{= (}_{Y, G}−1_{, X}_{) es su} rela-ción inversa, es claro que Dom (R−1_{) = Cod (}_R_{) y que Cod (}_R−1_{) = Dom (}_R_). Para una relación R = (X, G, Y) puede suceder que G(x) = ∅ para algún

x ∈ X (en cuyo caso x /∈ Dom (R) y Dom (R) 6= X) o que G(x) contenga más de un punto. En general Cod (R)6=Y, aún si R es una función. Si R

es una relaci´on funcional, (Dom (R), G, Y) es una funci´on.

(21)

Xi =∅para alg´un i= 1,2, ..., n.

Nota 1.5. La noción intuitiva de conjunto, tal como la hemos presentado hasta el momento (véase [17] para un tratamiento similar) puede conducir a inconsistencias (contradicciones) desagradables . Por ejemplo, el suponer descuidadamente que cualquier relación es colectivizante implica en particu-lar que la relación x /∈ x lo es, lo cual nos lleva a hablar del “conjunto”

A ={x:x /∈x}, el cual conduce a la contradicciónA∈As´ı y sólo si A /∈A. Naturalmente, podemos salir del impase diciendo simplemente que x /∈x no es colectivizante, as´ı que no existe un conjunto A tal que a ∈ A si y sólo si

a /_∈a. Pero entonces ¿es colectivizante la relación x=x? Es decir, ¿existe un conjunto A tal que A = _{x:x=x_}? El admitirlo, de hecho, nos lleva también a contradicciones. Para evitar esta incertidumbre, lo más convenien-te esimponer ciertas limitaciones a la noción intuitiva de conjunto, lo cual se hace exigiendo que éstos satisfagan ciertas restricciones, llamadas axiomas o postulados de los conjuntos. _{Uno de estos axiomas es el siguiente, que no}

sólo evita ciertas contradicciones, sino que tiene otras consecuencias útiles (véase el Ejercicio 1.11):

Axioma de los conjuntos (A.C.). Si X es un conjunto, X ₆= ∅, existe A _∈X tal que A_∩X =∅.

Por ejemplo, del axioma (A.C.) se deduce que si A es un conjunto entonces A /_∈ A. En efecto, si A _∈ A y X = _{A_}, no podr´ıa existir B _∈ X tal que

B _∩X =∅, pues necesariamente ser´ıan B = A y B _∩X =_{A_{} 6}= ∅. Tal axioma implica de paso que dado un conjunto A siempre existe un objeto a

tal que a /_∈ A (t´omese a = A), lo cual puede ser importante. Del Axioma (A.C.) se deduce que la relaci´on x /∈ x no es colectivizante. En efecto, si

A ={x:x /∈ x} fuera un conjunto, dado que A /∈A, se tendr´ıa que A ∈A, lo cual es absurdo. De la misma manera se verifica (Ejercicio 1.11) quex=x

no es colectivizante. Nosotros no proseguiremos esta discusión, la cual es el objeto de las teor´ıas axiomáticas de los conjuntos (véanse [7], [12], [23], [30].

Definici´on 1.6. Si X es un conjunto, el conjunto de los subconjuntos de X

es

(22)

Claramente ∅, X ∈ ℘(X), con ℘(∅) = {∅}. El conjunto ℘(X) se conoce tambi´en como el conjunto de las partes de X.

Definici´on 1.7. Una familia de conjuntos con ´ındices en el conjunto I es un aplicaci´on f : I → C, donde C es un conjunto (clase) de conjuntos. Si

Ai =f(i), es usual escribir f = (Ai)i∈I.

Si (Ai)i∈I es una familia de conjuntos,

S

i∈IAi (la uni´on de los Ai) ser´a el

conjunto de los elementos que est´an al menos en uno de losAi(conSi∈I Ai =

∅siI =∅). Decir entonces quex_∈S_i_∈_I Ai es equivalente a decir que existe

i _∈ I tal que x _∈ Ai. A su vez, si I 6= ∅, T_i_∈_IAi (la intersecci´on de los

Ai) ser´a el conjunto de aquellos objetos que est´an en todos los Ai, y decir

que x _∈ T_i_∈_IAi es equivalente a afirmar que x ∈ Ai para todo i ∈ I. Las

relaciones

1. XrSi∈IAi =Ti∈I(XrAi),

2. XrTi∈IAi =Si∈I(XrAi),

(1.11)

válidas si I ₆= ∅, y conocidas como leyes de De Morgan, serán útiles en el futuro. Verificaremos la primera de ellas. El argumento es t´ıpico de los usados para este tipo de comprobación: sea x ∈ X rS_i_∈_IAi; entonces

x ∈ X y x /∈ Si∈IAi, as´ı que x ∈ X y, para todo i ∈ I, x /∈ Ai; entonces

x ∈ X rAi para todo i ∈ I, y ser´a x ∈ Ti∈I(XrAi); rec´ıprocamente, si

x∈Ti∈I(XrAi), ser´a x∈XrAi para todo i∈I, y, por lo tanto, x∈ X

y, para todo i ∈ I, x /∈ Ai; se concluye que x ∈ X y x /∈ Si∈IAi, as´ı que

x_∈XrSi∈IAi.

Nota 1.6. Tal como en la Nota 1.1,admitimos que al definir un conjunto a partir de ciertos objetos o de otros conjuntos, este conjunto existe (aunque puede ser vac´ıo). As´ı, si X es un conjunto, ℘(X) existe y es un conjunto, y si I y losAi, i∈I, son conjuntos, tambi´en S_i_∈_IAi y T_i_∈_IAi son conjuntos,

éste último si I ₆= ∅. Si I = ∅, T_i_∈_IAi no está definido; sin embargo,

frecuentemente se conviene en darle cierto significado: por ejemplo, si todos losAi son subconjuntos de un mismo conjuntoX,es usual (y en cierta forma

(23)

1.2. Los n´

umeros reales

Supondremos que el lector está familiarizado en alguna medida con las pro-piedades básicas delsistema (R ,+,_·,R+) delos números reales. Este sistema se define pidiendo en primer lugar que la adición (+) y la multiplicación (_·) sean leyes de composición interna en R, el llamado conjunto de los números reales (es decir, que sean aplicaciones de R×R en R). As´ı que x+y y x_·y

(es tambi´en costumbre escribir xy en lugar de x_·y) son n´umeros reales si

x y y lo son. Se pide adem´as que existan en R dos elementos privilegiados distintos 0 y 1 tales que

x+ 0 =x, x_·1 =x, x_∈R; (1.12)

que para todo x_∈R exista (₋x)_∈R tal que

x+ (₋x) = 0 (1.13)

y tambi´en, cuando x₆= 0, exista x−1 _{tal que}

x_·x−1 = 1. (1.14)

Se pide finalmente que tales leyes satisfagan las relaciones

1. x+ (y+z) = (x+y) +z,

2. x+y =y+x, (1.15)

3. x_·(y_·z) = (x_·y)_·z,

4. x_·y=y_·x, (1.16)

5. x_·(y+z) = x_·y+x_·z. (1.17)

Se dice entonces que 0 es el elemento neutro aditivo y que (−x) es el inver-so aditivo de x. La ecuación a+x = b tendrá entonces la única solución x = b+ (₋a) (la cual se denota también con b₋a), pues a+ (b+ (₋a)) = (a+ (₋a)) +b = 0 +b = b, de lo cual c = b₋a es solución. La unicidad resulta de observar que si también a+c = a+c′_, _entonces _c ₌ _c′_, _{ya que}

c = (₋a) + (a+c) = ((₋a) +a) +c′ _{= 0 +}_c′ ₌ _c′_, _{lo cual se conoce como}

ley de cancelaci´on de la adici´on. Se deduce que si a+x=a,necesariamente

(24)

De a·(0 + 0) =a·0 +a·0 =a·0 se deduce que a·0 = 0 cualquiera que sea

a∈R(pues ambos, a·0 y 0 resuelven la ecuación a·0 +x=a·0). Entonces (−a)b=−ab, ya que ambos (−a)b y −ab son soluciones deab+x= 0. De la misma maneraa(−b) =−ab,y también (−a) (−b) = ab, ya que ambos re-suelven (−a)b+x= 0. Por otra parte,x·y6= 0 six6= 0 yy6= 0, puesx·y= 0 implica, si y ₆= 0, que (x_·y)_·y−1 _{= 0}_·_y−1 _{= 0 =} _x_·₍_y_·_y−1_{) =} _x_·_{1 =} _x_. Esto garantiza que (_·) es una ley de composición interna en R∗ ₌ _Rr_{₀_}

(es decir, una aplicaci´on de R∗ _×_R∗ _en _R∗_{). Si} _a _∈_R∗_, _{la ecuaci´on} _ax ₌_b

tendrá entonces la solución única x = ba−1 ₌ _a−1_b _{(escrita también} _c ₌ b

a

o c = b/a). En efecto, a(a−1_b_{) = (}_aa−1₎_b _{= 1}_b ₌ _b_{, y si tambi´en} _ac ₌ _ac′

entonces c=a−1₍_ac′_{) = (}_a−1_a₎_c′ ₌_c′ _(propiedad _{cancelativa de la}

multipli-cación). Nótese que si a 6= 0 entonces a/a = 1 y 1/a = a−1_. _{Además, si}

a6= 0 entonces a−1 ₆_{= 0 (pues} _a_·_a−1 _{= 1}₆_{= 0) y (}_a−1₎−1 ₌_a, _{pues ambos} re-suelvena−1_x_{= 1; y si tambi´en} _b₆_{= 0, entonces (}_ab₎−1 ₌_b−1_a−1_{, pues}_b−1_a−1 y (ab)−1 son ambos soluci´on de (ab)x = 1. Se dice que 1 es el elemento neutro multiplicativo y, si a₆= 0, que a−1 _{es el} _{inverso multiplicativo} _de_a_. Las relaciones (1.12) a (1.17) se conocen como los axiomas algebraicos de

R. Laestructura de orden deR est´a determinada por el conjunto R+ de los

n´umeros reales positivos. Si para A, B _⊆Rdefinimos

A+B :=_{x+y:x_∈A, y_∈B_}, AB :={xy:x∈A, y∈B},

−A :={−x:x∈A},

se pide que el conjuntoR+ tenga las propiedades fundamentales siguientes: 1. R+∩(−R+) = {0},

2. R=R+∪(−R+), 3. R++R+⊆R+, 4. R+R+ ⊆R+.

(1.18)

Estas relaciones se conocen como los axiomas algebraicos del orden de R

(posteriormente daremos otro axioma de orden, de naturaleza más compleja). Sia, b_∈R, la notación a_≤b (léasea es menor o igual que b) significará que

(25)

decir que a=−b, b∈R+, o, lo que es lo mismo, a que −a ∈R+; esto ´ultimo equivale, dado que −a= 0−a, a que a≤0, y se dice en tal caso que aes un

n´umero real negativo. R−:= (−R+) se denomina el conjunto de los n´umeros

reales negativos. Es ´util recordar quesi a∈R entonces a∈R+ o a∈R−, y

que a∈R− si y s´olo si (−a)∈R+, a∈R+ si y s´olo si (−a)∈R−. Las dos

primeras propiedades en (1.18) se traducen en

1. Sia_≤0 y a_≥0, entonces a= 0.

2. Sia_∈R, entonces a_≤0 ´o a_≥0. (1.19)

Las dos ´ultimas se sintetizan en

Sia≥0 y b ≥0, entonces a+b≥0, ab≥0. (1.20)

Las afirmaciones en (1.19) son a´un respectivamente equivalentes a las

Sia ≤b y b≤a, entoncesa=b, (1.21)

y

Dadosa, b∈R, a≤b ´o b≤a, (1.22)

lo cual se verifica inmediatamente.

Teorema 1.2. La relaci´on ≤ tiene adem´as las siguientes propiedades:

1. a_≤a,

2. Si a_≤b y b _≤c, entonces a_≤c, (1.23)

cualesquiera que sean a, b, c en R.

Demostración. (1) es clara, pues a−a = 0 ∈ R+. Ahora, las hipótesis de (2) garantizan queb₋ayc₋b están enR+, y comoc−a= (c−b) + (b−a), (1.20) asegura que c₋a_∈R+.

(26)

Nota 1.8. Para un n´umero real a se tiene que a∈R+ o (−a)∈R+. Esto implica que a2 ₌ _a_·_a _∈ _R_{+, pues} _a2 ₌ _a_·_a _{= (}₋_a_{) (}₋_a_{). En particular,} 1 = 1·1 ∈ R+. N´otese que si a ∈ (−R+) y b ∈ R+ entonces a ≤ b (pues

a≤0 y 0≤b).

Nota 1.9. Sia, b_∈R,a < b(léaseaes estrictamente menor que b) significa quea≤b y a6=b. Como es claro, a≤b si y sólo si a < boa =b. En lugar de a < b es también corriente escribir b > a (léase b es estrictamente mayor que a). Si a >0, se dice que a esestrictamente positivo. Si a <0, que a es

estrictamente negativo.

Si A es un subconjunto de R, un elemento a de R tal que a _≥ x para todo

x _∈A se denomina una cota superior deA (si a_≤ x para todo x _∈A, a es una cota inferior de A). Si a∈ A y es cota superior de A, se dice que a es un máximo de A (un m´ınimo si a ∈ A y es cota inferior de A). Si a, b son ambos máximos o m´ınimos de A, a≤b y b≤a, as´ı que a=b. Es decir,un conjunto A tiene, si lo tiene, un único máximo: máxA (y, también un único m´ınimo: m´ınA). Si a, b ∈ R, es claro que máx{a, b} = a o máx{a, b} = b.

De igual manera, m´ın{a, b}=a o m´ın{a, b}=b.

Si A ⊆R, A+ _{denotar´a el conjunto de las cotas superiores de} _A _y _A− _{el de}

sus cotas inferiores. Decir que a ∈ A+ _{(respectivamente,} _a _∈ _A−_{) es}

equi-valente a decir que no existe b ∈ A tal que a < b (respectivamente, b < a). Por ejemplo, R+₌_R+

+=∅(sia∈R, no puede sera ≥x para todox∈R+, pues ser´ıan a ∈R+, a+ 1 ∈R+ y a+ 1≤ a, lo cual es absurdo). Tambi´en

R− ₌_∅_{, y} _∅+₌_∅− ₌_R _{(pues dado} _a_∈_R_{, no existe} _b_∈_∅ _{tal que} _{a < b} _o

b < a). Por otra parte, (₋R+)+ =R+,R−+=−R+, y 0 es m´aximo de (−R+) y m´ınimo de R+.

Definici´on 1.8. Si A ⊆ R y A+ ₆₌ _∅_{, se dice que} _A _es _acotado

superior-mente (respectivamente, inferiormente, si A− ₆₌ _∅_{). Si} _A+ ₆₌ _∅ ₆₌ _A−_{, se}

dice que A esacotado.

Teorema 1.3. Un subconjunto A de R es acotado si y s´olo si existe a_≥0

(27)

Demostraci´on. Sup´ongase que A es acotado. Si A = ∅, sea a = 1 (como no existe x ∈ A tal que x > 1 o que x < −1, entonces −1 ≤ x ≤ 1 para todo x ∈ A). Si existe x∈ A, sean c ∈A+_, _d_∈ _A−_. _Como _d _≤ _x _y _c_≥ _x

entonces d ≤ c. Sea entonces a el m´aximo de {−d, c} : a = m´ax{−d, c}.

Como c≤a, es claro que x ≤a para todo x ∈ A. A su vez, −x ≤ −d ≤ a

para todo x_∈A, as´ı que x_{≥ −}a para tales x. Lo rec´ıproco es trivial.

Definición 1.9. Si a_∈R, el valor absoluto de a es_|a_|:= máx_{a,₋a_}. Nótese que sia_∈R,a_≤máx_{a, b_}, b_≤máx_{a, b_}. Como_|a_|= máx_{a,₋a_},

es claro entonces que a _{≤ |}a_| y ₋a_{≤ |}a_|. Por lo tanto,

1. − |a| ≤a ≤ |a|.

De 1, se deduce que |a| ≥ − |a|, de modo que

2. _|a_{| ≥}0.

Evidentemente _|0_| = m´ax_{0,0_} = 0. Por otra parte, de 1, se tiene que si

|a_|= 0 entonces 0_≤a _≤0, de modo que que a= 0. En resumen,

3. |a|= 0 si y s´olo si a = 0.

Como m´ax{−(−a),−a}= m´ax{a,−a}, se tiene que

4. _|−a_|=_|a_|.

Si _|a_{| ≤} b entonces m´ax_{−a, a_{} ≤} b, as´ı que ₋a _≤ b y a _≤ b, o sea ₋b _≤ a _≤ b. Por otra parte, si ₋b _≤ a _≤ b entonces ₋a _≤ b y a _≤ b, de lo cual

|a|= m´ax{−a, a} ≤b. Luego

5. |a| ≤b si y s´olo si−b ≤a≤b.

Como evidentemente, de (1), ₋(_|a_|+_|b_|)_≤a+b _{≤ |}a_|+_|b_|,se obtiene que

6. _|a+b_{| ≤ |}a_|+_|b_|,

y de 6, se deduce _|a_|=_|(a₋b) +b_{| ≤ |}a₋b_|+_|b_|,as´ı que_|a_{| − |}b_{| ≤ |}a₋b_|.

(28)

7. ||a| − |b|| ≤ |a−b|.

Como es obvio, a_≥0 si a=_|a_|. Por otra parte, si a_≥0 entonces ₋a _≤0,

as´ı que −a≤a y |a|= m´ax{−a, a}=a. Es decir,

8. _|a_|=a si y s´olo sia _≥0.

De 8, se deduce, en particular, que _||a_|| = a. Como _|−a_| = _|a_|, se tiene tambi´en que

9. _|a_|=₋a si y s´olo sia _≤0.

Teniendo en cuenta entonces que (₋a) (₋b) =ab, se concluye que si ab_≥ 0 entonces _|ab_| = ab = (₋a) (₋b) = _|a_{| |}b_|. Y si ab < 0, de (₋a)b > 0 se obtiene tambi´en que _|ab_|=_|(₋a)b_|=_|−a_{| |}b_|=_|a_{| |}b_|. En consecuencia,

10. _|ab_|=_|a_{| |}b_|.

Nótese finalmente que _|a_|2 =_|a_{| |}a_|=a_·a =a2 _{y que} _|_a₊_b_|₌_|_a_|₊_|_b_| _{si y} sólo si_|a+b_|2 = (_|a_|+_|b_|)2,lo cual ocurre si y sólo siab=_|a_{| |}b_|,es decir, si y sólo si ab_≥0. También se comprueba fácilmente que, _|a₋b_|=_||a_{| − |}b_||

si y s´olo si ab_≥0.

Es claro que A _⊆R es acotado si y s´olo si existe b _∈ R tal que _|a_{| ≤} b para todoa ∈A

Las propiedades (axiomas) tanto algebraicas como de orden que hemos su-puesto hasta ahora paraRson intuitivas y muy razonables para describir un sistema del cual se espera que sea tan rico como los números reales de nues-tra experiencia cotidiana. Hay, sin embargo, muchos sistemas numéricos que satisfacen todas las propiedades anteriores y que pueden ser muy distintos deR. El sistema (R, +, _·,R+) tiene, sin embargo, una última propiedad que lo caracteriza (véase, al respecto, el Ejercicio 1.32), y cuya naturaleza es algo más sutil que la de las otras.

(29)

El axioma (A.C.R.) se conoce también como elaxioma de completez del orden de los reales. No es un axioma algebraico, pues no es una afirmación sobre una operación binaria, ni sobre el resultado de efectuar una tal operación sobre los elementos deR. Sus implicaciones, incluyendo las algebraicas, son, sin embargo, múltiples.

Si A+ _{tiene un m´ınimo y} _a _{= m´ın}_A+_, _{se dice que} _a _{es el} _{extremo superior} de A : a = supA := m´ınA+_{. Claramente} _a _≥ _x _{para todo} _x _∈ _A, _{es decir,}

a es cota superior de A; y si b < a, debe existir x_∈A tal que b < x. Estas dos propiedades caracterizan completamente a supA. An´alogamente si A−

tiene un m´aximo a, se dice que tal m´aximo es el extremo inferior de A :

a = ´ınfA := m´axA−_.

Nota 1.10. Si A 6= ∅ y A− ₆₌ _∅_{, de} _A− ₌ ₋₍₋_A₎+

se deduce que (−A)+ 6=∅. Tambi´en (−A)=6 ∅, y como −m´ın (−A)+ = m´ax (A−_{), se}

de-duce quesi Ay A− _{son no vac´ıos,}_A− _{tiene un m´aximo}_{. Es decir,}_A_{tiene un}

extremo inferior. Se tiene adem´as que ´ınf (A) = m´ax (A−_{) =} ₋_{m´ın (}₋_A₎+₌

−sup (₋A).

Nota 1.11. En el axioma de caracterizaci´on de los reales es necesario hacer dos hip´otesis sobre A, A ₆= ∅, A+ ₆₌ _∅_{, para poder asegurar la existencia} de supA Por ejemplo, ∅+ ₌_R _y _R _{no tiene un m´ınimo, as´ı que sup}_∅ _no existe. Tampoco existen supR y supR+, pues R+ ₌ _R+

+ = ∅. A su vez, para asegurar la existencia de ´ınfA hay que suponer que A₆=∅ y A− ₆₌_∅_.

Para garantizar la existencia simult´anea de ´ınfA y supA se debe entonces suponer que A es acotado y no vac´ıo.

1.3. Los n´

umeros naturales

Definici´on 1.10. Un subconjunto A deR es (finitamente)inductivo si 1. 0_∈A, y

2. Si a_∈A, entonces a+ 1_∈A. (1.24)

Los conjuntos R y R+ son inductivos. Si (Ai)_i_∈_I es una familia de

(30)

Definición 1.11. El conjunto intersección de todos los subconjuntos induc-tivos deRse denomina el conjunto de losnúmeros naturales y se denota con

N.

Evidentemente N⊆R+. De hecho N⊆A si A es inductivo, y si A es induc-tivo y A ⊆ N, necesariamente A = N. Como N contiene, por ejemplo, el conjunto N′ _{formado por 0 y por los n´}_{umeros de la forma} _n_{+ 1 con} _n _∈ _N_,

y este conjunto es inductivo (0 ∈N′_{, y si} _n _∈_N _y _m ₌_n_{+ 1}_∈_N′ _entonces

m + 1 = (n+ 1) + 1 ∈ N′_{, pues} _n _{+ 1} _∈ _N₎_, _{se deduce que} _N₌_N′_. _Es

decir, N={0} ∪ {n+ 1 : n ∈ N}, y como n + 1 = 0, n ∈ N, implica que 1_∈(₋N)_⊆R−,de lo cual 1∈R+∩R−,y as´ı 1 = 0,que es absurdo, se deduce

que la unión es disyunta. Esta observación se debe a G. Peano, y se expresa usualmente diciendo que todo número naturalm ₆= 0 es el sucesor de algún otro (m=n+ 1),pero 0 no es el sucesor de ningún otro natural. Algunos ele-mentos deNson entonces 0,1 = 0+1,2 := 1+1,3 := 2+1, 4 := 3+1, ...,etc.

Se obtiene entonces el siguiente teorema.

Teorema 1.4. Si m es un n´umero natural entonces m _≥ 0 y si m > 0, necesariamente m_≥1. Es decir, no existen n´umeros naturales m tales que

0< m <1.

Demostraci´on. La primera afirmaci´on es clara, pues N⊆R+. Si m > 0 entonces m₆= 0, as´ı que m=n+ 1, n_∈N, de lo cual m₋1_∈R+ y m ≥1.

Teorema 1.5. Si my nson n´umeros naturales,m+nes un n´umero natural.

Demostraci´on. Sea N′′ _{el conjunto de los n´}_{umeros naturales} _m _{tales que}

m+n ∈ N para todo n ∈N. Evidentemente 0∈ N′′_{, y si} _m _∈_N′′_{, tambi´en}

m+ 1∈N′′_{, pues (}_m_{+ 1) +}_n_{= (}_m₊_n_{) + 1}_∈_N_{para todo}_n _∈_N_{. Entonces} N′′ _⊆_N_y _N′′ _{es inductivo, as´ı que} _N₌_N′′_.

Teorema 1.6. Si m≥n son naturales, m−n es un natural.

Demostraci´on. Sea N′′′ _{el conjunto de los naturales} _n _{tales que si} _m _∈ _N _y

(31)

n+ 1 ≤m, m ∈ N, dado que m =p+ 1, p ∈ N (pues m 6= 0), se tiene que

n ≤p. Existir´a entoncesq∈N tal quen+q=p, de lo cual (n+ 1) +q=m.

Entonces N′′′ ₌_N_{, pues} _N′′′ _{es inductivo.}

Corolario 1.1. Si m < n son naturales entonces m+ 1≤n. Lo mismo, si m < n+ 1, entonces m≤n.

Demostraci´on. Si fuera n < m+ 1, ser´ıa 0< n−m <1, lo cual es absurdo, pues n−m∈N.

Teorema 1.7. (Principio de buena ordenaci´on de N). Si A _⊆ N es no vac´ıo, A tiene un m´ınimo. De hecho,´ınfA= m´ınA.

Demostraci´on. Como 0 _∈ A−_{, A}− ₆₌ _∅_{. Sean} _a _{= ´ınf}_A _y _m _∈ _A _{tal que}

m < a+ 1. Entonces m₋1< a, de lo cualm₋1< npara todo n_∈A, osea

m ≤n para todo n∈A, as´ı quem= m´ınA. Adem´as m=a, puesa≤m ya que m∈A, ym ≤a, pues m∈A− _y _a_{= m´ax}_A−_.

Teorema 1.8. (Arqu´ımedes). El conjunto N no es acotado superiormente. Si a, b son reales y a >0, existe n ∈N tal que na > b.

Demostraci´on. Si fuera N+₆₌_∅_{, existir´ıa} _a_{= sup}_N_{. Esto es absurdo, pues} existir´ıa n ∈N tal que a−1< n, de lo cual a < n+ 1 ∈N. Ahora, si fuera

na≤b para todo n∈N, se tendr´ıa que b/a∈N+_.

Nota 1.12. Del Teorema 1.8 se deduce que si a_∈R y a >0, existe n_∈N, n > 0, tal que 1/n < a. Si A ⊆ N es superiormente acotado y no vac´ıo, y si a = supA, necesariamente a ∈ A; es decir, a = máxA. En efecto, exis-tirán ∈A, n > a−1, as´ı quen ≥mpara todom ∈A. Entonces,n = máxA,

y como n ∈A, n≤a. Por otra parte, comon ∈A+ _y _a _{= m´ın}_A+_, _tambi´en

a ≤n.

Un método frecuente de demostración está basado en el siguiente teorema.

(32)

1. P (0) es verdadera, y

2. P (n+ 1) se deduce de P(n) para todo n_∈N, entonces P (n) es verdadera para todo n en N.

Demostración. Sea Ne = _{n _∈N:P (n)_}. Claramente 0 _∈ Ne, y si n _∈ Ne, de modo que P (n) es verdadera, también P (n+ 1), al deducirse de P (n), lo será. Entoncesn+ 1_∈Ne, y será Ne =N.

Ejemplo 1.1. Como aplicación del teorema anterior demostraremos que si m ∈ N entonces mn ∈ N para todo n ∈ N. Sea m ∈ N arbitrario pe-ro fijo, y sea P (x) la condición “mx ∈ N”. Entonces P (0) es verdadera (pues m0 = 0 ∈ N), y si suponemos que P (n) es verdadera también lo será P (n+ 1), puesto que m(n+ 1) =mn+m _∈N se deduce del Teorema 1.5.

La siguiente forma del Teorema 1.9 ser´a tambi´en usada en lo que sigue.

Corolario 1.2. Sean P(x) una afirmaci´on sobre una variable x, m _∈ N. Sup´ongase que

1. P (m) es verdadera.

2. De la validez de P (k) para todo los k _∈ N, m _≤ k < n, se deduce la validez de P (n).

Entonces, P (n) es v´alida para todo n ∈N, n≥m.

Demostraci´on. Sea X el conjunto de los k _∈ N, k _≥ m, tales que P (k) es falsa (es decir, que “no P (k)” es verdadera). Demostraremos que X = ∅. En efecto, si fuera X ₆=∅,existir´ıan = m´ınX (puesX _⊆N). Comon _∈X,

P (n) es falsa. Adem´asm < n, puesP (m) es verdadera. De hecho,P (k) es verdadera para todo m _≤k < n. Pero esto implica que P (n) es verdadera, lo cual es absurdo. Entonces X =∅, yP (k) es verdadera para todok _∈N,

k _≥m.

(33)

1.4. N´

umeros enteros y aritm´

etica elemental

Definici´on 1.12. El conjunto Z=N∪(₋N) se denomina el conjunto de los

n´umeros enteros. Si a_∈Z, se dice que a es un n´umero entero.

Como es claro, decir que m_∈Zes equivalente a decir que m_∈No₋m_∈N. Por lo tanto, m_∈Z si y s´olo si m_∈R y _|m_{| ∈}N.

Una de las propiedades más notables e importantes del conjunto Z de los enteros se establece en el siguiente teorema, conocido como el Algoritmo de la división que se atribuye a Euclides, quien lo estableció en el caso de los enteros positivos.

Teorema 1.10. (Euclides). Si m, n∈Z, n6= 0, existen q, r ∈Z, 0≤ r <

|n|, ´unicos, tales que m=nq+r.

Demostración. Nótese que r es siempre un número natural. Podemos su-poner también que n es un natural, pues si m = nq +r, también m = (−n) (−q) +r. Supongamos primero que m es un natural y razonemos por inducción. Si m= 0, la afirmación es evidente con q=r = 0. Supongamos entonces que m =nq+r, 0 ≤r < n, as´ı que 0 < r+ 1≤ n. Si r+ 1< n, la afirmación en m+ 1 es clara, pues m+ 1 = nq+ (r+ 1). Si r+ 1 = n, entonces m+ 1 = n(q+ 1) + 0, es también de la forma deseada. Esto de-muestra la afirmación para todo m_∈N. Ahora, si m <0 y (₋m) = nq+r, 0 _≤ r < n, será m = n(₋q) si r = 0 y m = n (₋q₋1) + (n₋r) si r > 0.

Esto completa la demostraci´on de existencia, pues 0 < n₋r < n. La unici-dad resulta de observar que si m, n > 0 son enteros entoncesnm _≥n, de lo cual nq +r = nq′ ₊_r′_{, que equivale a} _n₍_q₋_q′_{) =} _r′ ₋_{r < n}_{, es imposible}

con q > q′_. _.

Se concluye que todo n´umero entero m es de una y s´olo una de las formas m = 2k o m = 2k+ 1,donde k∈Z. _{En el primer caso se dice que} _m _es_par_;

en el segundo, que es impar.

Sim, n∈Zy q, r∈Zson tales que m=qn+rcon 0 ≤r < m, se dice queq

(34)

escribirq =q(m, n) y r=r(m, n). Nótese que sim, n∈N, tambiénq ∈N. Sia, b∈Zentonces a+b ∈Z. Esto es claro sia, b∈N; y sia, b∈(−N) en-tonces−(a+b) = (−a) + (−b)∈N, de lo cual a+b∈(−N). Por último, si

a, b∈N entonces a+ (−b) =a−b∈Nsia≥b ya+ (−b) =−(b+ (−a)) =

−(b₋a)_∈ (₋N) si a < b. Tambi´en ab_∈Z si a, b_∈ Z, como resulta de las relacionesab= (₋a) (₋b) y₋ab= (₋a)b=a(₋b). Como es claro, 0,1_∈Z.

Definici´on 1.13. Seana, b_∈Z. Se dice quea divide b, quea esun divisor

deb, o que a es un factor deb, y se escribe a_|b, si

1. a₆= 0.

2. Existe c∈Z tal que b=ac.

Se dice tambi´en que b es un m´ultiplo dea.

Como se verifica inmediatamente, ab es equivalente a cualquiera de las afir-maciones siguientes: a_|b_|, _|a_|_|b_|, _|a_|b, a(₋b), (₋a)b, (₋a)(₋b).

Sia = 0 o siano es un divisor deb,escribiremosa∤b(ano divide b). Es cla-ro que sia₆= 0 entoncesa_|0 (puesa_·0 = 0) y quea_|bsi y s´olo sir(b, a) = 0.

Es evidente que si a, b, c_∈Z, entonces 1. a_|a (si a₆= 0).

2. Sia_|b y b ₆= 0 entonces _|a_{| ≤ |}b_|.

3. Sia_|b y b _|a entonces _|a_|=_|b_|.

4. Sia_|b y b _|centonces a_|c.

Definici´on 1.14. Sean a, b_∈ Z tales que a2 ₊_b2 _> ₀_. _{Se dice que} _d _{es el}

m´aximo com´un divisor dea y b, si

1. d > 0,

2. d|a y d|b,

3. c|a y c|b implica c|d.

(35)

cual el nombre dado a d.

Si a, b_∈Z, no es evidente que exista un d_∈Z, m´aximo com´un divisor d de

a y b. Sin embargo, de lo dicho anteriormente se deduce que, si existe, es ´

unico. En efecto, si d′ _{es otro, entonces} _d_|_d′ _y _d′ _|_d, _{de lo cual} _d₌_d′_.

Teorema 1.11. (Bezout). Si a, b_∈Z y a2₊_b2 _>₀_, _existe _d_∈_Z_{, el cual es}

máximo común divisor de a y b. Más aún

d=ma+nb, (1.25)

donde m, n∈Z.

Demostraci´on. Sea A = {xa+yb > 0 : x, y ∈ Z}. Es claro que A ⊆ N, y tomando x = a, y = b se deduce que A 6= ∅ (pues a2 ₊_b2 _> ₀₎_. _Sea

d = m´ınA (Teorema 1.7). Comod∈A,es claro qued >0,y existen adem´as

m, n ∈ Z tales que d = ma+nb, relaci´on que asegura que si c | a y c | b

entonces c|d. Veamos qued|a y d|b, lo cual completar´a la demostraci´on. Si suponemos, por ejemplo, d ∤ a, se tiene que a = qd+r con 0 < r < d,

as´ı quer = (1₋qm)a+ (₋qn)b, lo cual es absurdo, pues implica quer_∈A.

De la misma manera se razona si d∤b. Esto demuestra el teorema. En vista de su existencia y unicidad, denotaremos con mcd(a, b) el máximo común divisor de a y b (cuando a2₊_b2 _>_{0). La relación}

mcd(a, b) = ma+nb

dada en el Teorema 1.11 se denomina una relaci´on de Bezout para mcd(a, b).

En general m y n no son ´unicos (v´ease el Ejercicio 1.28).

N´otese que si a, b, q, r _∈ Z, a =bq +r, b ₆= 0 y r ₆= 0 entonces mcd(a, b) = mcd(b, r). En efecto, consideremos c = mcd(a, b), como a₋ bq = r tene-mos que c _| r. Si c′ _| _b _y _c′ _| _r _entonces _c′ _| _a _{y por lo tanto} _c′ _| _c_,

(36)

mismo proceso tenemos que rk−1 =qkrk+rk+1, 0≤rk+1 < rk y sirk+1 6= 0, mcd(rk−1, rk) = mcd(rk, rk+1). Como 0≤rk+1 < rk <· · ·< r2 < r1 se tiene querk+1= 0 para alg´un k, teniendo as´ı que mcd(rk−1, rk) =rk y por lo tanto

mcd(a, b) = rk. El procedimiento anteriormente descrito se conoce como el

Algoritmo de Euclides y es un m´etodo efectivo para calcular el mcd de dos n´umeros enteros.

Corolario 1.3. Si a, b∈Z, a2₊_b2 _>₀ _y _{d >} ₀_{, d} _{= mcd (}_{a, b}₎ _{si y s´olo si}

d es un divisor com´un de a y b y existen m, n∈Z tales que d=ma+nb. Demostraci´on. Del Teorema 1.11 sabemos que si d =mcd(a, b) entonces

d > 0, d es un divisor común de a y b y existen m,n _∈ Z que verifican (1.25). Sólo resta por demostrar que si d >0 es un divisor común de a y b,

y d=ma+nb, m, n∈Z, entoncesd= mcd (a, b). Pero esto es obvio, pues si c|a y c|b, ded =ma+nb se deduce que c|d.

Nota 1.13. Si a, b_∈Z, el solo hecho de que d=ma+nb > 0, m, n_∈ Z, no asegura que d = mcd (a, b). Se necesita que d _| a y d _| b. Por ejem-plo, 2 = 3_·5 + (₋1)_·13, pero 2 ₆=mcd(5,13) = 1. Mas generalmente, si mcd(a, b) = 1, en cuyo caso 1 =ma+nb, m, n_∈Z, para todod >0 se tiene qued= (md)a+ (nd)b,y ning´un reald >1 puede ser mcd(a, b). Obs´ervese, sin embargo, que si 1 = ma+nb, m, n ∈ Z, entonces 1 = mcd (a, b), pues 1|a y 1|b.

Nota 1.14. Sia2₊_b2 _>_{0 y} _{d >} _{0 es un divisor com´}_{un de} _a _y _b, _entonces

d _≥c para todo divisor com´un c de a y b si y s´olo si d = mcd(a, b) (pues si

d_≥cpara todo divisor c, entonces mcd(a, b)_≤d,y como d_|mcd (a, b), por ser un divisor, tambi´en d ≤ mcd (a, b). Por otra parte, ya hemos visto que si d= mcd (a, b) entoncesd ≥c para todo divisor cdea y b).

(37)

Teorema 1.12. Si d = mcd(a, b) y c > 0, entonces mcd(ca, cb) = cd. Si adem´as c|a y c|b, entonces d/c = mcd(a/c, b/c).

Demostraci´on. En efecto, d = ma+nb, m, n ∈ Z, y cd = m(ca) +n(cb). Como obviamente cd | ca y cd | cb, entonces cd = mcd(ca, cb). Tambi´en

d/c = m(a/c) +n(b/c), y como d/c ∈ Z, d/c | a/c y d/c | b/c, entonces

d/c = mcd(a/c, b/c).

Corolario 1.4. Si a2₊_b2 _>₀ _y _d_{= mcd(}_{a, b}₎_{, entonces} _mcd(_{a/d, b/d}_{) = 1.}

Definici´on 1.15. Si mcd(a, b) = 1, se dice que a y b son n´umeros primos relativos.

Nota 1.15. Como es claro, a yb son primos relativos si y s´olo si existen m,

n ∈ Z tales que 1 = ma+nb. En tal caso se deduce que si c | a, tambi´en

mcd(c, b) = 1 (pues 1 = (mq)c+nb para alg´un q∈Z).

Por ejemplo, 3 y 5 son primos relativos, y lo mismo es cierto de 8 y 21, pues 2 · 3 + (−1)· 5 = 1 y 8 ·8 + (−3)· 21 = 1. Tambi´en 4 y 21 son primos relativos, pues 16 · 4 + (−3)· 21 = 1. N´otese que 7 | 21 y que 1 = 16·4 + (−9)·7 = 2·4 + (−1)·7.

Nota 1.16. Es claro que si d6= 0 entoncesd|a si y s´olo si mcd(d, a) =|d|.

En particular, mcd(1, a) = 1.

Los siguientes resultados son de gran importancia en la teor´ıa elemental de los n´umeros, y a lo largo de todo este curso.

Teorema 1.13. Si a |bc y mcd(a, b) = 1, entonces a|c.

Demostraci´on. Evidentemente existen m, n, q _∈ Z tales que 1 = ma+

nb y bc=qa,de lo cual c= (mc)a+n(bc) = (mc+nq)a.

(38)

Demostraci´on. Si d = mcd (a, bc) entonces d | bc, y como tambi´en

d | a, entonces mcd(d, b) = 1 (Nota 1.15). Se concluye que d | c, as´ı que

d=mcd(d, c) = 1 (pues d|a y mcd(a, c) = 1).

El corolario anterior se puede generalizar.

Corolario 1.6. Si mcd(a, ai) = 1, i= 1, ..., n, entonces mcd(a1, a2, . . . , an)

= 1. Si _|a_|>1, entonces a∤a1a2· · ·an.

Demostraci´on. La afirmaci´on es evidente si n= 1,2. Y sin >2,resulta de un argumento inductivo, observando que a1· · ·an= (a1· · ·an−1)an.

Nota 1.17. Se deduce que si a | (a1· · ·an)an+1, y mcd (a, ai) = 1,

i = 1,2, ..., n, entonces a | an+1 (pues mcd(a, a1a2· · ·an) = 1, y basta

aplicar el Teorema 1.13).

Teorema 1.14. Si a|c, b|c y mcd(a, b) = 1, entonces ab|c.

Demostraci´on. Sean a′_{, b}′ _{tales que} _c ₌ _aa′_{, c} ₌ _bb′ _y _{m, n} _∈ _Z _{tales que}

1 =ma+nb. Entonces c=mac+nbc = (mb′₊_na′_{) (}_ab₎_.

Definici´on 1.16. Sea p_∈Z tal que 1. p >1.

2. Si q|p entonces |q|=po |q|= 1.

Se dice entonces que pes unnúmero primo. Es decir, pes un primo si y sólo si p > 1 ysus únicos divisores son _±1 y _±p.

Teorema 1.15. Si p > 1, entonces p es un primo si y s´olo si para todo entero a, p _|a ´o mcd(p, a) = 1, y las dos posibilidades son mutuamente ex-cluyentes. Por otra parte, si p > 1 no es primo, existen m > 1 y n >1 en

Z tales que p=mn.

Demostraci´on. Si p > 1 es primo y a ∈ Z entonces p | a ´o p ∤ a. Si p ∤ a