Anda di halaman 1dari 91

Matemáticas I

Cristian Reyes R.

Otoño 2002
Índice General

1
Capı́tulo 1

Introducción

En este curso introduciremos algunos conceptos matemáticos, algunas ideas


que han sido utilizadas desde siglos y formalizadas desde hace no tanto; estas
ideas y conceptos si bien son ocupados en casi todas las carreras que usan
matemáticas no son tan importantes en sı́ como el método que usaremos
para desarrollar nuetras teorias, es probable que las definiciones que dare-
mos se olviden luego de acabado el curso, y es probable que, como armas,
las construcciones que haremos no se ocupen nunca o tal vez, a priori, no se
entienda del todo que se quiere hacer o a que se quiere llegar; sin embargo, lo
que queremos lograr es que los estudaintes puedan ser originales en la forma
de abordar los problemas en cualquier área o en la vida cotideana, que sean
ordenados mentalmente, que logren encontrar la escencia de los problemas,
que en cada instancia se bucee hasta encontrar lo realmente importante y
poder relacionar aquello con otros problemas en otras áreas que en un prin-
cipio no tiene nada que ver con el contexto en cuestión.
Las matemáticas para muchos es un lenguaje preciso, exacto e ideal ( ideal
en el sentido de Platón), que permite modelar situaciones de la vida cotideana
y resolver problemas en Biologı́a, Quı́mica, Fı́sica, Ingenierı́a, Economı́a, in-
cluso en Antropologı́a, Psicologı́a, Sociologı́a, Filologı́a y otros. Para otros es
una ciencia, que tiene sus fundamentos, sus métodos y sus resultados.
En Biologia (el estudio de los seres vivos) aún no existe un consenso en
decidir que es un “ser vivo, de hecho la Facultad de Ciencias de nuestra
Universidad tiene una de las más reconocidas definiciones de ser vivo dada
por Humberto Maturana; sin embargo se hace Biologı́a y se avanza y se logran
resultados que tal vez permitan despejar algunas dudas. El origen de lo vivo
es también un asunto no resuelto,“imaginarse las condiciones en que ocurrió

2
eso es un tema que a los biólogos apasiona, la forma en que lo vivo surge de
lo no-vivo es una pregunta fundamental, pero aún no resuelta.
En Fı́sica han habido varias teorı́as para explicar el origen del universo,
las revoluciones no han sido pocas en Fı́sica. En Quı́mica los modelos para
explicar la teorı́a atómica tampoco ha sido única.
Es decir, se suponen cosas ciertas para todos a modo de convenio y se tra-
baja en ese contexto asumiendo que son “leyes básicas sin explicación, pero
que la intuición acepta sin mayores reparos. Cuando uno busca una palabra
en el diccionario ocuure algo similar, por ejemplo la palabra: Rubefacción:
Rubicundez producida en la piel por un medicamento irritante. En este ejem-
plo el diccionario está suponiendo que conocemos las palabras: Rubicundez,
producida, en ,la ,piel, por, un, medicamento, irritante. Entonces alguien po-
drı́a decir que podemos ir al diccionario de nuevo y buscar las palabras que
no conocemos ; OK, vamos. Rubicundez: Calidad de Rubicundo. Y sigamos,
Rubicundo: Dı́cese de la persona de rostro muy colorado. En ese punto uno
puede hacerse una idea de lo que se trata y este método funciona bien, pero
sin duda que suponemos un conocimiento básico de la lengua castellana. De
hecho el diccionario no define muchas palabras o se “pisa la cola definiendo
palabras a partir de sinónomos que nunca aparecen como conceptos indepen-
dientes.
En matemáticas también hay conceptos básicos que no se definen y se
aceptan como obvios, porque la intuición dice que ası́ es como debe ser, sin
embargo nadie lo puede demostrar, ni tampoco probar que son falsos. Los
matemáticos a esas leyes básicas para las cuales no hay demostración les
llaman Axiomas, y a aquellas leyes que se deducen a partir de esos axiomas
les llama Teoremas o Proposiciones y a las concecuencias inmediatas de esos
teoremas les llaman Corolarios.
Por ejemplo, uno de los teoremas mas famosos en la enseñanza media es
el Teorema de Pitágoras, ( que ni siquiera se sabe si ese resultado se debe
efectivamente a Pitágoras o a uno de sus discipulos) dice lo siguiente:

Teorema 1.0.1 (Teorema de Pitágoras) La suma de las áreas de los cuadra-


dos en los catetos es igual al área del cuadrado formado en la hipotenusa.

¿Por qué eso es cierto? ¿Por qué siempre lo hemos ocupado, asumiendo
que nuestro profesor no nos mintió? ¿Cómo convencernos de eso? ¿Cómo
demostrar esto?
Demostración:

3
Consideremos un triángulo rectángulo de catetos a, b e hipotenusa c, como
muestra la figura

ahora dispongámos cuatro triángulos congruentes a él, como muestra la figu-


ra, formando un cuadrado de lado a + b encerrando un cuadrado de lado c,
como muestra la figura

Ahora bien, el área de la figura achurada es por un lado el área del cuadrado
exterior menos el área del cuadrado interior, y por otra parte es cuatro veces
el área del triángulo en cuestión. Es decir,
ab
(a + b)2 − c2 = 4( )
2

4
desarrollando el cuadrado resulta

a2 + 2ab + b2 − c2 = 2ab

sumando a ambos lados c2 − 2ab resulta:

a2 + b2 = c2

que es exactamente lo que querı́amos probar.2


Eso es una demostración del teorema de Pitágoras, pero para eso asum-
imos que el área de un cuadrado es el cuadrado del lado, que el área de un
triángulo es la mitad de la base por la altura, que a, b, c son números reales
los cuales se suman, se multiplican, y tienen una ley distrubutiva que nos per-
mite desarrollar el cuadrado del binomio, también suponemos que conocemos
algunas propiedades de ecuaciones,. . . , etc.
Este ejemplo, espero que muestre la necesidad de suponer algunas cosas
básicas, y desde allı́ desarrollar algunas ideas más interesantes. Esos axiomas
serán los cimientos sobre los cuales edificaremos nuestro castillo. Algunos de
los conceptos que no definiremos son: Conjunto, pertenencia, inclusión, las
otras cosas las nombraremos en el camino y les llamaremos axiomas, y en su
momento las comentaremos.
Esperamos que este curso sea aprovechado al máximo y que la discución
sea enriquecedora para todos.

5
Capı́tulo 2

Números Naturales

En este capı́tulo estudiaremos a los números naturales, sus propiedades más


importantes, inducción matemática, aplicaciones en combinatoria, estudiare-
mos algunas propiedades del binomio de Newton, del triángulo de Pascal, y
algunas ideas de probabilidades.

2.1 Inducción Matemática


Uno de los cimientos abstractos a cuales nos referimos en la introducción es
la exixstencia de los números naturales cumpliendo una de las propiedades
más importantes que se llama Principio de Inducción Matemática, que una
vez que se la mostremos les parecerá una trivialidad, que en realidad lo es.
Para nosotros, los números naturales es el conjunto:

N = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, . . . . . .}

que supondremos por todos conocido. Cuyos elementos están ordenados de


menor a mayor y cada elemento tiene un sucesor inmediato salvo el primer
elemento (1).

1 < 2 < 3 < 4 < 5 < 6 < 7 < 8 < 9 < 10 < 11 < 12 < 13 < 14 < . . .

Como cada elemento tiene un sucesor inmediato, resulta que nuestro conjun-
to es infinito, nunca se acaba. Una propiedad algebraica importante es que
los elementos de N se pueden sumar, es decir, dados dos números naturales la
suma entre ellos es de nuevo un número natural, esta suma también la supon-
dremos conocida. Esta suma es conmutativa y asociativa como sabemos. En

6
sı́mbolos :
a + b = b + a, a + (b + c) = (a + b) + c
También existe una multiplicación en N, esto es, para cualesquiera par de
elementos de N, el producto entre ellos es de nuevo un número natural,
esta multiplicación tiene buenas propiedades: conmutatividad, asociatividad,
tiene un elemento neutro, y distribuye con respecto a la suma. En sı́mbolos:

ab = ba, (ab)c = a(bc), 1a = a, a(b + c) = ab + ac.

Existe una propiedad, que es la que nos ocupará en esta sección, que
aparecerá muy natural y obvia y resultará muy util, y es la siguiente: Supong-
amos que tenemos un subconjunto A de N con las siguientes propiedades:
i) 1 ∈ A
ii) Cada vez que un número está en A implica que su sucesor está en A.

Entonces ¿Que podemos decir de A? Veamos, por i) tenemos que 1 ∈ A, por

ii) 2 ∈ A, pues 1 ya está en A, ahora como 2 ∈ A por ii) 3 ∈ A, ahora como


3 ∈ A por ii) 4 ∈ A y ası́ sucesivamente todos los elementos de N están en
A, entonces A = N. Esta conclusión que no se vé tan complicada es lo que
llamamos el principio de inducción matemática o quinto postulado de Peano.
Formalicemos esto.

Axioma 2.1.1 (Principio de Inducción Matemática, primera versión)


Sea A un subconjunto de los números naturales tal que:
i) 1 ∈ A
ii) Si cada vez que un número natural n está en A implica que su sucesor
n + 1 está en A.
Entonces A = N.

Veamos algunas aplicaciones:

1=1

1 + 3 = 4 = 22
1 + 3 + 5 = 9 = 32
1 + 3 + 5 + 7 = 16 = 42
1 + 3 + 5 + 7 + 9 = 25 = 52

7
1 + 3 + 5 + 7 + 9 + 11 = 36 = 62
Al parecer la suma de los primeros n impares resulta el cuadrado de n.
Probemos esto por inducción. Ordenemos un poco y escribamos formal-
mente lo que queremos probar.
Ejemplo 2.1.1 La suma de los primeros n números impares es el cuadrado
de n. En sı́mbolos: Para cualquier n ∈ N se tiene

1 + 3 + 5 + 7 + · · · + 2n − 1 = n2

Demostremos la proposición anterior por inducción.


Demostración:
Sea A = {n ∈ N/1+2+3+· · ·+2n−1 = n si logramos probar que A tiene las
dos propiedades de (2.1.1) entonces A = N y en ese caso todo número natural
satisfacerı́a la proposición en cuestión. Entonces basta probar que A satisface
i) y ii). Que 1 está en A es obvio, pues la suma del primer impar es igual
al primer cuadrado, resulta de la igualdad trivial 1 = 1. Ahora supongamos
que n está en A y debemos demostrar que n + 1 está en A. Que n está en A
significa que
1 + 3 + 5 + 7 + · · · + 2n − 1 = n2
eso es lo que estamos suponiendo (la llamaremos hipótesis inductiva). Y lo
que queremos probar es que n + 1 está en A, esto es,

1 + 3 + 5 + 7 + · · · + 2n − 1 + 2(n + 1) − 1 = (n + 1)2 .

Notemos que

1 + 3 + 5 + 7 + · · · + 2n − 1 + 2(n + 1) − 1 = 1 + 3 + 5 + 7 + · · · + 2n − 1 + 2n + 1

por hipótesis inductiva tenemos que

1+3+5+7+· · ·+2n−1+2(n+1)−1 = [1+3+5+7+· · ·+2n−1]+2n+1 = n2 +2n+1

pero n2 + 2n + 1 = (n + 1)(n + 1) = (n + 1)2 . Luego juntando el principio


con el final de nuestra cadena de igualdades se tiene:

1 + 3 + 5 + 7 + · · · + 2n − 1 + 2(n + 1) − 1 = (n + 1)2

que es lo que querı́amos probar, entonces lo que hemos probado es que A = N,


es decir, para cualquier número natural n la suma de los primeros n números
naturales impares es igual al cuadrado de n. 2

8
Una forma distinta de ver el principio de inducción es la siguiente: Con-
sideremos una proposición P que involucra a los números naturales, si esa
proposición P es satisfecha por n entonces diremos que n cumple P , ası́ por
ejemplo, para fijar ideas, podemos pensar en la proposición: 2n + 1 es un
número primo. Entonces, 1 cumple P , 2 cumple P , 3 NO cumple P , y ası́
sucesivamente. Si necesitasemos decidir si P es falsa o cierta para todos los
números naturales, podemos hacerlo por inducción sin necesidad de usar el
lenguaje de teoria de conjuntos, del siguiente modo:
Teorema 2.1.1 (Principio de Inducción, segunda versión) Si P es una
proposición para los números naturales, tales que:
i) 1 cumple P .
ii) Cada vez que n cumple P también n + 1 lo cumple.
Entonces P es cierto para todo n ∈ N
La demostración del teorema resulta de definir A = {n ∈ N/n cumple P },
se deja al estudiante los detalles.
Esta nueva versión, que es lo mismo que antes escrito de otro modo, a
algunas personas le es más cómoda que la anterior, pues no se necesita el
lenguaje de teoría de conjuntos.
Ejemplo 2.1.2 El producto de un número natural por su sucesor es un
número par.
Probaremos la afirmación anterior por inducción. La proposición es la
siguiente: Para cualquier n ∈ N se tiene n(n + 1) es par. Recordemos que
un número es par si se puede escribir como el producto de 2 por un número
natural.
Demostración:
i) 1 cumple P , pues 1(2)=2 que obviamente es par. ii) Supongamos que n
cumple P esto es n(n + 1) es par. (Hip. inductiva) Debemos demostrar que
n + 1 cumple P asumiendo cierta la hipótesis inductiva. Es decir, debemos
probar que (n + 1)(n + 2) es par, sabiendo que n(n + 1) es par. Notemos
que (n + 1)(n + 2) = (n + 1)n + 2(n + 1) ,el primer sumando es par por hip.
inductiva y el segundo por que evidentemente es un multiplo de 2 y la suma
de números pares es par, luego (n + 1)(n + 2) es par. Luego n + 1 cumple P
cada vez que n la cumple. Luego todo número natural multiplicado por su
sucesor es par.2
Muchos ejercicos de divisibilidad se pueden resolver por inducción, pero
antes de mostrar un ejemplo, recordemos ese concepto.

9
Definición 2.1.1 Diremos que n es divisible por m, o m divide a n, o m es
un factor de n,o n es un multiplo de m, si existe k ∈ N tal que n = mk.

Ejemplo 2.1.3 Para cualquier número natural n se cumple que 7n − 4n es


divisible por 3.

i) 1 cumple la proposición, de hecho, 71 − 41 = 7 − 4 = 3 = 3(1), que es


claramente divisible por 3.
ii) Supongamos que n cumple la proposición, esto es, existe k ∈ N tal que
7 − 4n = 3k y debemos demostrar que 7n+1 − 4n+1 = 3(algo). Notemos que
n

7n+1 − 4n+1 = 7(7n ) − 4(4n ) = (6 + 1)7n − (3 + 1)4n


pero (6 + 1)7n − (3 + 1)4n = 6(7n ) − 3(4n ) + [7n − 4n ] = 3(27n − 4n ) + 3k
pero 3(2(7n ) − 4n ) + 3k = 3(2(7n ) − 4n + k)
Luego uniendo el principio con el fin de nustra cadena de igualdades se obtiene
7n+1 − 4n+1 = 3(2(7n ) − 4n + k)
que es lo que queı́amos probar. Luego para cualquier número natural n se
tiene que 7n − 4n es divisible por 3. 2
Veamos un último ejemplo antes de introducir nuevos conceptos.

Ejemplo 2.1.4 La suma de los primeros n números naturales es igual a la


mitad del producto entre n y su sucesor.

Lo que queremos probar es que, para cualquier valor de n se tiene que


n(n + 1)
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · · · · + n =
2
Demostración:
i)1 = 1(2)
2
, luego 1 cumple la proposición.
ii) Supongamos que n cumple la proposición, esto es,
n(n + 1)
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · · · · + n = ,
2
y debemos probar que n + 1 cumple la proposición, es decir, basta probar
que
(n + 1)(n + 2)
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · · · · + n + (n + 1) = .
2

10
Notemos que

n(n + 1)
[1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · + n] + (n + 1) = + (n + 1)
2
por hipótesis inductiva y factorizando por (n + 1) se tiene que

n(n + 1) n n+2 (n + 1)(n + 2)


+ (n + 1) = (n + 1)( + 1) = (n + 1) =
2 2 2 2
Uniendo el final y el comienzo de nuestra cadena de igualdades se tiene:

(n + 1)(n + 2)
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · · · · + n + (n + 1) = .
2
que es lo que querı́amos probar.2
Este resultado también demuestra la proposición del ejemplo (2.1.2).

2.2 Sumatorias
Queremos notar que se vuelve un poco molesto escribir sumas del estilo

1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · · · · + n o

1 + 3 + 5 + 7 + 9 + 11 + 13 + 15 + · · · + (2n − 1) + (2n + 1)
de forma tal que escribiremos esas sumas de un modo mas abreviada, pero
solo será eso, un diminutivo para un nombre más largo, no habrá nada ocul-
to ni misterioso, del mismo modo que a José Emilio Ignacio Del Carmen
Irarrazaval Fernandez de Castro le llamamos Pepe.

Definición 2.2.1 Si tenemos una colección finita de números, digamos


{a1 , a2 , a3 , . . . , an }, el símbolo
n
X
ai
i=1

significará la suma
a1 + a2 + a3 + · · · + an

11
Ası́ por ejemplo,

1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + · · · · · · + n

se escribirá n
X
i
i=1

la suma
1 + 4 + 9 + 16 + 25 + · · · + n2
Xn
se escribirá k2.
k=1

P Algunas propiedades claras de la sumatoria, ası́ le llamaremos al símbolo


, que en realidad es la letra sigma mayuscula del alfabeto griego, son las
siguientes: (las demostraciones se dejan al estudiante.)

Propiedades 2.2.1 Si {a1 , a2 , a3 , . . . , an } y {b1 , b2 , b3 , . . . , bn } son dos con-


juntos de números y c es un número fijo cualquiera. Entonces:
n
X n
X n
X
1) (aj + bj ) = aj + bj
j=1 j=1 j=1

n
X n
X
2) c(al ) = c al
l=1 l=1

n
X N
X n
X
3)Si 1 ≤ N ≤ n, entonces am = am + am .
m=1 m=1 m=N +1

n−1
X
4)(Propiedad Telescópica) (ai+1 + ai ) = an − a1
i=1
n
X
5) c = nc
k=1

12
Usemos propiedades de la sumatoria para calcular algunas sumas, comence-
mos con unas conocidas: Recordemos que
n
X n(n + 1)
k= .
k=1
2

Calculemos ahora la misma suma, pero ahora de otro modo. Sabemos que
(k + 1)2 − k 2 = 2k + 1, entonces la suma:
n
X n
X
2 2
(k + 1) − k = 2k + 1
k=0 k=0

por propiedades de la sumatoria y reconociendo en el lado izquierdo de la


igualdad una suma telescópica se tiene:
n
X n
X
(n + 1)2 = 2 k+ 1
k=0 k=0

n
X
(n + 1)2 = 2 k + (n + 1)
k=0
n
X
2
(n + 1) − (n + 1) = 2 k
k=0
n
X
(n + 1)((n + 1) − 1) = 2 k
k=0
n
X
(n + 1)n = 2 k
k=0
n
(n + 1)n X
= k
2 k=0
y como
n
X n
X
k= k por qué?
k=0 k=1

se tiene lo que se querı́a probar.

13
Recordemos también que por inducción probamos que
n
X
2n − 1 = n2 ,
t=1

veamos ahora lo fácil que resulta usando propiedades de sumatoria:


n
X n
X n
X
2n − 1 = 2 n− 1 = n(n + 1) − n = n2 .
t=1 t=1 t=1

En la guı́a de ejercicios encontrarán ejercicios suficientes para resolver.

2.3 Combinatoria
Otra de las aplicaciones de los números naturales, es que sirven para contar,
ası́ de simple, es por eso que se llaman números naturales, por cuentan las
cosas que están en la naturaleza. Sin embargo contar, mas especı́ficamente
contar en forma ordenada no es un problema fácil. Por ejemplo, ¿Cuántas di-
agonales tiene un hexágono regular?, ¿Cuantás diagonales hay en un polı́gono
regular de n lados? ¿Cuál es el número máximo de patentes que se puede
crear en Chile, con el actual formato? ¿Cuántos subconjuntos de k elementos
tiene un conjunto de n elementos?. Estas son las preguntas que intentaremos
responder en esta sección.

Un problema clásico es el siguiente: Hay 7 personas con las cuales se


formarán comités del siguiente modo: i) Dos personas están en un único
comité. ii)Dos comités tienen solo a una persona en común. iii) Existen cuatro
personas tal que cada tres no están en un mismo comité.
¿Existe tal confuguración?
¿Todos los comités tendrán la misma cantidad de personas? ¿Cuántos
comités resultaron? Si tal configuración existe, ¿cuántas existen?
Las respuestas ya se conocen y son las siguientes:
Si las personas son Anastacio(A), Beatriz(B), Carmela(C), Diógenes(D),
Eetela(E), Filordina(F) y Guillermina(G), una posible configuración es la
siguiente:

{A, E, C}, {A, F, B}, {A, D, G}, {B, E, D}, {B, G, C}, {C, E, F }, {F, E, G}

14
Invitamos a los estudiantes a verificar que efectivamente cumple con las
propiedades requeridas. No es difı́cil comprobar que escencialmente es la
única configuración posible, cualquier otra difiere de la nuestra solo en un
cambio de nombre de las personas. Además se puede probar que 7 es el
menor número para el cual existe una tal configuración, se invita al estu-
diantado a verificar esta afirmación, el siguiente número posible es 13. Sin
embargo, aún no se sabe con absoluta certeza para cuales existe y para cuales
no, de hecho es un problema abierto en matemáticas si para 111 existe una
tal configuración, existe una prueba computacional, pero aún ninguna con
lápiz y papel. Si alguno de uds. lo resuelve el resultado se puede publicar en
una de las más prestigiosas revistas matemáticas del orbe.
Sin embargo, no nos detendremos en problemas tan difı́ciles, sino que en
aquellos que podamos atacar próntamente.
Supongamos que queremos llegar a la azotea de un edificio, el edificio
tiene 4 puertas de acceso y 3 ascensores . ¿De cuántas maneras distintas
puedo llegar hasta la azotea? Para responder a esto, podemos describir todas
las formas posibles y eso haremos, al menos una vez en la vida. Si las puertas
son {P1 , P2 , P3 , P4 } y los ascensores {A1 , A2 , A3 }, si anotamos (Pi , Aj ) cuando
se entra por la puerta i y se sube por el ascensor j nos damos cuenta que
todas las formas distintas de llegar a la azotea son las siguientes:

(P1 , A1 ), (P1 , A2 ), (P1 , A3 ),

(P2 , A1 ), (P2 , A2 ), (P2 , A3 ),


(P3 , A1 ), (P3 , A2 ), (P3 , A3 ),
(P4 , A1 ), (P4 , A2 ), (P4 , A3 )
que en total suman 12. Un diagrama, llamado diagrama de árbol, permite
contar las posibles formas de un modo mas simple:

Si uno cuenta las puntas finales de las flechas del último paso se tiene que
son 12. El diagrama de árbol muestra gráficamente, lo que los matemáticos
llaman El Principio Fundamental del Conteo, que dice lo siguiente: Si una
acción, o un resultado cualquiera, se puede obtener luego de realizadas dos
etapas, si la primera etapa se puede realizar de n formas distintas y la segunda

15
de m formas distintas, entonces el resultado se puede obtener de nm formas
distintas.
Esto ultimo se puede generalizar: Si una acción, o un resultado cualquiera,
se puede obtener luego de realizadas n etapas, si la primera etapa se puede
realizar de m1 formas distintas y la segunda de m2 formas distintas, la tercera
etapa de m3 formas distintas, y ası́ sucesivamente, hasta llegar a la n−esima
etapa que se puede realizar de mn formas distintas, entonces el resultado se
puede obtener de m1 m2 m3 · · · mn formas distintas.

Por ejemplo, si tenemos un abecedario de 26 letras y un conjunto de 10


dı́gitos, {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, se quiere hacer patentes para automóviles
con 6 casilleros, donde los 2 primeros están formados por letras y los 4
restantes por dı́gitos.¿ Cuántos patentes se pueden crear?
Respuesta:
Para la primera letra tenemos 26 posibilidades.
Para la segunda letra tenemos 26 posibilidades.
Para el primer dı́gito tenemos 10 posibilidades.
Para el segundo dı́gito tenemos 10 posibilidades.
Para el tercer dı́gito tenemos 10 posibilidades.
Para el cuarto dı́gito tenemos 10 posibilidades.
En total tenemos 26 × 26 × 10 × 10 × 10 × 10 patentes distintas, esto es,
6.560.000 patentes diferentes.

16
Otro ejemplo: ¿De cuántas maneras distintas podemos ordenar, n per-
sonas en una fila?
Respuesta Empecemos estudiando los casos, cuando n es pequeño, para tener
una idea como hacer el caso general. Si n = 1, solo existe una forma de
hacerlo, es un caso muy fácil, pero no indica nada. Si n = 2, tambien es fácil,
solo hay dos posibilidades AB y BA. Si n = 3 las posibilidades son ABC,
ACB, BAC, BCA, CAB y CBA. Son 6 posibles formas, pero contemos
ordenadamente ahora para obtener un método que nos alumbre en el caso
general, tenemos tres elementos para ubicar en tres casilleros (∗, ∗, ∗), para
el primer lugar tengo 3 posibilidades , pues cualquiera de ellos puede ocupar
el primer lugar, para el segundo solo tengo dos posibilidades, pues el primero
ya se fijó, y para el último solo una posibilidad pues los dos anteriores ya
están fijos. Por el principio fundamental del conteo, tenemos 3 × 2 × 1 = 6
formas distintas de ordenar tres personas en una fila. Si n = 4, contaremos
directamente las posibilidades, sin determinarlas, debo ubicar 4 elementos
en 4 casilleros (∗, ∗, ∗, ∗), para el primer casillero tenemos 4 posibilidades y
fijamos cualquiera de ellos en el primer lugar, notemos que ya utilizamos un
elemento, para el segundo solo me quedan 3 posibilidades, entonces fijemos
uno de ellos en las segunda posición, notemos que ya hemos utilizado 2, para
el tercero solo me que dan 2 posibilidades, y notemos que ya hemos ocupado
3 de los cuatro elementos, por fin para la cuarta posición solo nos queda 1
posibilidad; es decir, en total tenemos 4 × 3 × 2 × 1 = 24 posibles formas de
ordenar 4 personas el una fila. Ahora, parece que ya encontramos la forma
de generalizar nuestro resultado, si queremos ordenar a n personas en una
fila, lo podemos hacer de

n × (n − 1) × (n − 2) × (n − 3) × (n − 4) × · · · × 3 × 2 × 1 maneras

a ese número le llaman el factorial de n y se anota n!. Por ejemplo,

1! = 1
2! = 2
3! = 6
4! = 24
5! = 120
6! = 720

17
.. ..
. .
30! = 265252859812200000000000000000000 aproximadamente

Hagamos una pequeña variación del problema anterior. Supongamos que


tenemos un conjunto de n objetos y las quiero ordenar en una fila de k
casilleros, con k ≤ n. Usando el mismo método que en el problema anterior
tenemos que para el primer casillero tenemos n posibilidades, para el segundo
casillero (n − 1) posibilidades, para el tercero (n − 2) posibilidades, y ası́
sucesivamente hasta llegar al k-esimo casillero para el cual hay (n − (k − 1))
posibilidades,pues ya hemos llenado k − 1 casilleros; en total tenemos:

n × (n − 1) × (n − 2) × (n − 3) × · · · × (n − (k − 1)) posibilidades

a ese número le llaman las permutaciones de n sobre k, y se anota P (n, k) o


también Pkn ; en particular P (n, n) = n!.

Notemos que P (n, k) no es otra cosa que n! truncado en el k−esimo


factor, es decir, es el factorial de n al cual se le quitó la cola final, es decir,
si a P (n, k) le pegamos la cola final se obtiene el factorial de n, esto es:

n! = P (n, k)(n−k)×(n−(k +1))×(n−(k +2))×(n−(k +3))×· · ·×3×2×1

esto es:
n! = P (n, k)(n − k)!
entonces
n!
P (n, k) =
(n − k)!
notar que esta última relación no tiene sentido cuando n = k, pues estamos
dividiendo por 0!, pero para que esta relación sea cierta siempre y por otras
razones que ya veremos es bueno convenir, es un convenio no hay una buena
razón para esto, definir 0! = 1, y para el resto de este curso ası́ será.

Por ejemplo, ¿De cuantas formas se puede escoger una directiva de un


curso de 32 alumnos, que cuente de un presidente, de un secretario y un
tesorero. El resultado es

P (32, 3) = 32 × 31 × 30 = 29.760

formas distintas.

18
Notar que esa pregunta es distinta a la siguiente: ¿De cuantas formas se
puede escoger un comité de tres estudiantes de un curso de 32 para discutir
sobre la adhesión al próximo paro?
En el caso anterior, no es lo mismo escoger a Jacinto de presidente, a Mireya
de secretaria y a Mallén de tesorera, o a Jacinto de presidente, a Mallén
de secretaria y a Mireya de tesorera, o a Mireya de presidenta, a Jacinto de
secretario y a Mallén de tesorera, o a Mireya de presidenta, a Mallén de secre-
taria y a Jacinto de tesorero, o a Mallén de presidenta, a Mireya de secretaria
y a Jacinto de tesorero, o a Mallén de presidenta, a Jacinto de secretario y
a Mireya de tesorera; son todos caso distintos, pero en nuestro caso todos
ellos se confunden en uno solo, a saber, el comité formado por Marı́a, Juan y
Mallén. En este caso, el de los comités, hay claramente menos que en el caso
anterior. ¿Cuántos menos? o mejor dicho ¿Cuántas veces menos?
Notemos que por cada trı́o escogido en el problema de los comités hay 6
posibles directivas distintas, o dicho de otro modo, las 29760 posibles direc-
tivas se pueden agrupar en saquitos de 6 en los cuales se repiten los nombres
pero no el orden y esos 6 se confunden en un solo comité, es decir, si C denota
el número de posibles comités entonces

6C = 29760,

es decir,
C = 29760 : 6 = 4960
o también
P (32, 3)
C= .
3!

¿De cuantas formas se puede escoger un subconjunto de k elementos de


un conjunto de n elementos? Al número que es el resultado a esa respuesta
n
se le llama las combinaciones
¡n¢ de n sobre
¡n¢ k, y se anota C(n, k) o bien Ck
o más popularmente k ; por ejemplo¡ ¢ 0
= 1, pues el único subconjunto
con cero elementos es el vacı́o, n1 = n, pues hay n formas distintas de
escoger un elemento de un total de n. ¡Intentemos
¢ responder a la pregunta
n
general, para eso intentemos comparar k con P (n, k). Para eso calculemos
P (n, k) de una forma distinta como lo hicimos antes. Recordemos que P (n, k)
cuenta las posibles manera de poner k objetos de un total de n en una fila
de k casilleros. Entonces primero escojamos k personas, y luego contamos ¡las¢
distintas formas distintas de ordenarlas. Para la primera etapa tenemos nk

19
formas distintas, y k objetos se ordenan de k! formas distintas en k casilleros,
por el principio fundamental del conteo se tiene:
µ ¶
n
P (n, k) = × k!,
k
es decir, µ ¶
n! n
= × k!,
(n − k)! k
es decir, µ ¶
n n!
=
k (n − k)!k!
En este punto también es necesario que 0! = 1 para no descartar casos
triviales.

Por ejemplo, si se imprimieran todos los posibles cartones de Kino solo


una vez, Cuántos cartones se imprimirı́an? La respuesta se deja al lector.

2.4 Binomio de Newton


Consideremos un cuadrado de lado a+b, y dividamoslo como muestra la figura

20
Notemos que el área del cuadrado es la suma del área del cuadrado de
lado a del cuadrado de lado b y de dos rectángulos conguentes de lados a y
b. Es decir:
(a + b)2 = a2 + ab + ba + b2 = a2 + 2ab + b2
que no es otra cosa que el ya famoso desarrollo del cuadrado del binomio.
Con un cubo de arista a + b se puede hacer lo mismo y se obtendrı́a, un
cubo de arista a, tres paralelepipedos de aristas a, a y b, tres paralelepipedos
de aristas a, b y b y un cubo de arista b, es decir, calculando volúmenes se
obtiene:
(a + b)3 = a3 + 3a2 b + 3ab2 + b3
se invita al estudiante de convenserse de esta última relación. En cuatro
dimensiones es un poco dificil imaginarse el resultado, pero algebraicamente
se puede hacer con ayuda de los números combinatorios. Calculemos (a + b)4 ,
para eso lo podemos hacer de muchas formas distintas, lo podemos hacer
(a + b)3 (a + b) o también (a + b)2 (a + b)2 o también

(a + b)(a + b)(a + b)(a + b).

Elijiremos esta última. El resultado será la suma de las posibles formas de


multiplicar un elemento del primer paréntesis, otro del segundo, otro del ter-
cero y otro del cuarto, por ejemplo puedo escoger una a del primer paréntesis,
una b del segundo paréntesis, una a del tercero y una a del cuarto, y aparecerá
el sumando abaa = a3 b, la pregunta es ¿Cuántas veces aparece ese mismo
sumando? La respuesta
¡4¢ es 4 pues es la forma de escoger tres a de un total
de 4, es decir 3 = 4, o lo que es lo mismo escoger una b de un total de
4. Entonces los factores que aparecen son: a4 , a3 b, a2 b2 , ab3 , b4 . La pregunta a
reponder es ¿ Cuántas veces aparece cada uno de ellos?
a4 → ¿ De cuantas formas puedo escoger cuatro a de un total de cuatro?
o equivalentemente
¡4¢ ¡4¢ ¿ De cuantas formas puedo escoger cero b de un total de
cuato?→ 4 = 0 = 1.
a3 b → ¿ De cuantas formas puedo escoger tres a de un total de cuatro?
o equivalentemente
¡ ¢ ¡ ¢ ¿ De cuantas formas puedo escoger una b de un total de
cuato?→ 43 = 41 = 4.
a2 b2 → ¿ De cuantas formas puedo escoger dos a de un total de cuatro?
o equivalentemente
¡¢ ¿De cuantas formas puedo escoger dos b de un total de
cuato?→ 42 = 6.

21
ab3 → ¿ De cuantas formas puedo escoger una a de un total de cuatro?
o equivalentemente
¡ ¢ ¡ ¢ ¿ De cuantas formas puedo escoger tres b de un total de
cuato?→ 41 = 43 = 4.
b4 → ¿ De cuantas formas puedo escoger cero a de un total de cuatro? o
equivalentemente
¡4¢ ¡4¢¿ De cuantas formas puedo escoger cuatro b de un total de
cuato?→ 0 = 4 = 1.
Entonces:
(a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
o equivalentemente
µ ¶ µ ¶ µ ¶ µ ¶ µ ¶
4 4 4 4 3 4 2 2 4 3 4 4
(a + b) = a + a b+ ab + ab + b
0 1 2 3 4
o equivalentemente
4 µ ¶
X
4 4
(a + b) = a4−i bi
i=0
i
Del mismo modo, se puede calcular (a + b)n . El resultado será la suma
de los productos que resulten de escoger un elemento del primer paréntesis,
uno del segundo, uno del tercero, uno del cuarto, . . . , y uno del n−esimo. Los
monomios que aparecerán son an , an−1 b, an−2 b2 , an−3 b3 , . . . , an−k bk , . . . , abn−1 , bn ,
la pregunta ahora es: ¿ Cuántas veces aparece an−k bk para todos los posibles
k? o equivalentemente ¿ De cuantas formas puedo escoger (n − k) a de un
total de n? o equivalentemente ¿ De cuantas ¡maneras ¢ puedo escoger k b de
un total de n? y la respuesta es inmediata de nk maneras distintas. Es decir

(a + b)n =
µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ µ ¶
n n n n−1 n n−2 2 n n−k k n n−1 n n
a + a b+ a b +· · ·+ a b +· · ·+ ab + b
0 1 2 k n−1 n
o equivalentemente
n µ ¶
X
n n
(a + b) = an−k bk
k=0
k
Invitamos a los estudiantes a que pruben esta última relación por induc-
ción. A esta última relación se le llama la formula del Binomio de Newton.

Por ejemplo:¿ Cuál es el término central del desarrollo de (2x2 − 3y)4 ?


Solución

22
4 µ ¶
X
2 4 4
(2x − 3y) = (2x2 )4−1 (−3y)i
i=1
i
no es difı́cil darse cuenta que este desarrollo cuenta de 5 sumandos, que son
cuando i toma el valor: 0, 1, 2, 3 o 4 y entonces el término central se logra
cuando i = 2, luego el término central es:
µ ¶
4
(2x2 )2 (−3y)2 = 6 × 4x4 × 9y 2 = 216x4 y 2 . 2
2

Notemos que para conocer el desarrollo de (a + b)n es necesario conocer


los monomios que aparecen y los coeficientes que los acompañan. Pero los
monomios son conocidos y es fácil de memorizarlos, solo aparecen a y b, la
suma de las potencias es siempre n y las potencias de a van en decenso y las
de b en ascenso, esto es:
an b0 = an , an−1 b1 = an−1 b, an−2 b2 , an−3 b3 , . . . , a2 bn−2 , a1 bn−1 = abn−1 , a0 bn = bn
si esto ya está claro, estaremos de acuerdo que para conocer el desarrollo del
Binomio de Newton, basta conocer los coeficientes. La verdad es que ya los
conocemos son las combinaciones de n sobre k, pero queremos conocer esos
números de forma más simple. Observemos lo siguiente:

(a + b)0 = 1
(a + b)1 = 1a + 1b
(a + b)2 = 1a2 + 2ab + 1b2
(a + b)3 = 1a3 + 3a2 b + 3ab2 + 1b3
(a + b)4 = 1a4 + 4a3 b + 6a2 b2 + 4ab3 + 1b4
(a + b)5 = 1a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + 1b5
(a + b)6 = 1a6 + 6a5 b + 15a4 b2 + 20a3 b3 + 15a2 b4 + 6ab5 + 1b6
(a + b)7 = 1a7 + 7a6 b + 21a5 b2 + 35a4 b3 + 35a3 b4 + 21a2 b5 + 7ab6 + 1b7

Tenemos un espléndido triángulo donde cada fila tiene exactamente un


elemento mas que el anterior. Si estamos de acuerdo que los coeficientes son
los que tienen la información necesaria para desarrollar el binomio, como lo
comentamos en el párrafo anterior, basta que consideremos el triángulo de
los coeficientes:

23
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1

Viendo este último triángulo hagamos algunas observaciones:

Observación 1: Al comienzo y al final de cada


¡ ¢fila aparece
¡ ¢ un 1, lo cual era
de esperar pues esos númros corresponden a n0 y a nn respectivemente.

Observación 2: El triángulo es totalmente simétrico respecto a la altura que


baja desde el vértice superior hasta la base. ¿Eso era de esperar?

Observación 3: Si numeramos la fila, comenzando por la fila 0 aquella que


tiene solo al 1, la fila 1 aquella que tiene 1 1, y ası́ sucesivamente. Entonces
n
la suma d elos terminos de la fila n es 2 . ¿Es claro por qué pasa eso?

Observación 4: Las diagonales que están a los lados de la primera y la última


indican la numeración de la fila que hicimos en la observación anterior.¿Por
qué?

Observación 5: Si n es primo todos los elementos de la fila n son divisibles


por n.¿Por qué?

Observación 6: Cada elemnto de cada fila, salvo los extremos, es la suma de


los término de la fila superior que están exactamente sobre el. ¿Era claro, a
priori, que ası́ ocurrirı́a?

Existen otras particularidades bastante interesantes de este triángulo


que invitamos a los estudiantes a descubrir. Este triángulo se conoce co-
mo Triángulo de Pascal en honor al genial matemático y fı́sico francés Blaise

24
Pascal (1623-1662). Probaremos que las observaciones 2 y 6 son ciertas en
general.

Demostración de la observación 2: Lo que debemos probar es que:


µ ¶ µ ¶
n n
=
k n−k

para cualquier n y para cualquier k ≤ n. Esto se podrı́a probar por induc-


ción, o también explicitando los respectivos valores de esos n’umeros; pero
en cualquiera de esos casos no se sabe que es lo que está pasando en escen-
cia. De modo que aquı́ lo haremos contando ordenadamente. Cada vez que
escojemos un subconjunto de k elementos de un total de n estamos dejando
n − k sin elejir, es decir, da lo mismo pedir que se escoja k de un total de n
y dejelos dentro de un saco o escoja n − k elementos y dejelos fuera del saco,
es decir: µ ¶ µ ¶
n n
= .
k n−k
2

La observación 6, lo que está diciendo es que:


µ ¶ µ ¶ µ ¶
n−1 n−1 n
+ = ,
k k−1 k

esta última relación es muy importante y se llama Fórmula de Pascal y


que aquı́ la damos en forma de teorema.De nuevo esto se puede probar por
inducción o simplemente calculando esos valores explicitamente y luego com-
parándolos, pero nosotros lo haremos contando ordenadamente.

Teorema 2.4.1 (Formula de Pascal) Para cualquier n ∈ N y para cualquier


k ∈ N tal que 1 ≤ k ≤ n − 1, se tiene:
µ ¶ µ ¶ µ ¶
n−1 n−1 n
+ = (2.1)
k k−1 k

Demostración:¡ ¢
Recordemos que nk cuenta la cantidad de subconjuntos de k elementos de
un conjunto con n. Escribamos a nuestro conjunto A = {a1 , a2 , . . . , an−1 , an },

25
para contar los subconjuntos de k elementos que tiene A lo haré en forma
separada, primero a aquellos que no contienen a an y luego los que si lo
contienen.
¿Cuantos subconjuntos de k elementos de A no contienen a an ? La re-
spuesta es: basta contar los subconjuntos de k elementos que puedo formar
de {a1 , a2 , . . . , an−1 } pero ese conjunto tiene n − 1 elementos, entonces ¡n−1¢ el
número de subconjuntos de k elementos que no contienen a an son k
Ahora contemos aquellos subconjuntos de A con k elementos que con-
tienen a an Cualquiera de aquellos subconjuntos contienen necesariamente a
an luego cada uno de ellos necesita a otros k − 1 elementos para formar un
conjunto con k elementos, pero esos k − 1 elementos que debo elejir los debo
escojer de entre {a1 , a2 , . . . , an−1 }, entonces
¡ la¢cantidad de subconjuntos con
k elementos de A que contienen a an son n−1 k−1
¡n−1¢Luego cualquier subconjunto con k elementos
¡n−1¢de A esta contado en los
k
primeros que no contienen a an o en los k−1
últimos que si contienen
a an , luego tenemos que:
µ ¶ µ ¶ µ ¶
n−1 n−1 n
+ = 2
k k−1 k
Notemos que como la última observación es cierta, es muy fácil obtener
la siguiente fila, aquella que aparece en el desarrollo de (a + b)8 . Al principio
y al final ponemos un 1 :

1 1

los siguientes elementos de la fila son:

1+7=8

7 + 21 = 28
21 + 35 = 56
35 + 35 = 70
35 + 21 = 56
21 + 7 = 28
7+1=8
ası́ tenemos la siguiente fila, que es:

26
1 8 28 56 70 56 28 8 1
del mismo modo podemos construir la siguiente, y la siguiente, y la siguiente,
. . . etc. Y tenemos un triángulo un poco más grande:

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
1 9 36 84 126 126 84 36 9 1
.. .. .. .. .. .. .. .. ..
. . . . . . . . .

Dejemos por un momento el triángulo de Pascal en abstracto, y veámoslo


de un modo distinto. Consideremos un enrejado como el que muestra la figura,

y supongamos que en el vértice superior hay 512 hormigas que bajarán por
el enrejado hasta llegar a los puntos de abajo

{A, B, C, D, E, F, G, H, I, J}

que están llenos de miel. Las hormigas no tienen preferencias entre izquierda
y derecha de modo que en cada nodo, se reparten: la mitad de ellas bajan por
la izquierda y las otras por la derecha. ¿Cuántas llegarán a cada nodo de la
base?, ¿ Que tienen en común las hormigas que llegaron a un mismo nodo?
¿Que tiene que ver esto con el triángulo de Pascal? Si agregamos una fila al
enrejado y doblamos la cantidad de hormigas ¿Qué esperarı́as que ocurriese?

Calculemos, solo por ocio, las potencias e 11 hasta la cuarta potencia:

27
110 = 1
111 = 1 1
112 = 1 2 1
113 = 1 3 3 1
114 = 1 4 6 4 1
De nuevo aparecen nuestros viejos conocidos. ¿Por qué aparecieron acá
también? ¿Qué tiene que ver las potencias de 11 con el triángulo de Pascal?
¿Podré usar el triángulo de Pascal para calcular las potencias siguientes de
11

Por último apreciemos el triángulo de Pascal jugando al cara o sello.


Lanza una moneda y cuenta las posibles formas que aparezca una cara y
cero caras.

Una cara Cero cara


c s
1 1

28
Lanza dos monedas distinas, anota y cuenta las posibles formas de obten-
er dos caras, una cara o cero cara.

Dos caras Una cara Cero caras


cc cs,sc ss
1 2 1

Lanza 3 monedas distitas, anota y cuenta las posibles maneras de obtener


tres caras, dos caras, una cara, cero caras.

Tres caras Dos caras Una cara Cero caras


ccc ccs,csc,scc ssc,scs,css sss
1 3 3 1

Lanza cuatro monedas. . .


¿Qué se obtiene? Nuestro viejo y majadero amigo, pero ¿Qué tiene que
ver el cara o sello con el triángulo de Pascal o con las hormigas?

Dejemos de lado a Pascal y a su triángulo para pasar a una nueva sección.

2.5 Probabilidades
La teoria de Probabilidades se ha desarrollado enormemente, y constituye
un área independiente dentro de las matemáticas junto a la Estadı́stica, su
hermana, con gran cantidad de aplicaciones en Fı́sica, Quı́mica, Biologı́a,
Antropologı́a, Historia, Sociologı́a, Psicologı́a y otras. Existen revistas espe-
cializadas en el tema y se requiere un fuerte conocimiento matemático para
lograr hacer avances en el tema, interactúa fuertemente con análisis, álgebra,
geometrı́a, ecuaciones diferenciales,. . . , etc. La teorı́a de probabilidades nació
formalmente, durante la primera mitad del siglo XV II, cuando un jugador
empedernido, el Chevalier de Mere, le presenta a un genial matemático de
su tiempo los problemas que tenı́a para elegir, entre todos los juegos que le
ofrecı́an, cual era el más conveniente. El matemático era Pascal, que mode-
lando teoricamente los problemas del Chevalier, comenzó a reflexionar sobre

29
el azar y las probabilidades. En ese instante Pascal comenzó a contar sus
reflexiones y dudas a un amigo, otro gran matemático, Pierre de Fermat, con
quien terminó por construir los fundamentos del cálculo de probabilidades.
Quizás el más famoso de los problemas que quitaban el sueño al Chevalier
de Mere era el siguiente:

Dos jugadores, de igual destreza, llamados A y B, se miden en un torneo


de tenis. Se lleva el premio aquel que entera primero 7 juegos ganados. Pero
sucede que cuando hiba ganando A 5 a 4 a B se debe concluir el torneo por
fuerza mayor.¿Cuál es la repartición justa del premio entre A y B?

Todos están de acuerdo que A debe recibir un porcentaje mayor que B,


pero ?Cuánto mas?

Esperamos que una vez finalizada esta sección podamos responder a esta
pregunta. La verdad, es que ese problema ya se conocı́a desde el siglo XIV
y varios matemáticos italianos ya le habian hincado el diente, pero cada uno
de ellos refutaba la solución de su antecesor y proponı́a otra nueva, ası́ se
pasaron bastante tiempo, incluso la solución que propuso Pascal fue refutada
por Roverbal; después de eso el propio Pascal desconfió de su resultado,
Fermat leyó la solución de Pascal y llegó a la misma conclusión y le dio
tranquilidad a Pascal y se pusieron a formalizar sus razonamientos y ası́
nació el cálculo de probabilidades.

Los matemáticos ya definieron “probabilidad , pero esa definición es de-


masiada técnica y requiere un conocimiento previo de teorı́a de la medida
que se estudia en tercer año de una carrera de matemáticas, sin embargo
todo el mundo entiende cuando se dice que la probabilidad de obtener cara
en un lanzamiento de la moneda es 21 . Y experimentalmente sucede que si se
lanza 100000 veces la moneda, las veces que marcó cara fueron alrededor de
50000, es decir, un 50% del total. Sin embargo, esto no quiere decir, y nadie
lo cree ası́, que después de lanzar la moneda y resulta cara y lanzarla otra
vez resulte sello. De hecho en 10 lanzamientos, nadie espera que el resultado
sea: cscscscscs ni tampoco scscscscsc.
Hagamos algunas definiciones:

Definición 2.5.1 Se realiza un experimento, (por ejemplo: lanzar un dado


y queremos observar el número que muestra la cara superior) a los posibles
resultados observables les llamaremos “eventos ( en nuestro ejemplo, 1 es un

30
evento, 8 no es un evento) al conjunto de todos los eventos les llamaremos
“espacio muestral(en nuestro ejemplo el espacio muestral es {1, 2, 3, 4, 5, 6}
y un “suceso será un subconjunto del espacio muestral ( en nuestro ejemplo,
“ el número que aparece es par={2,4,6}).

Definición 2.5.2 Si un experimento se realiza n veces, el total de veces que


resulto el evento i se llama la frecuencia total de i y se anota fi , al cuociente
fi
n
se le llama la frecuencia relativa de i.

En el caso de la moneda, decimos que la frecuencia relativa que aparezca


cara es aproximadamente 21 , cuando n es 100000.
Una definición intuitiva de probabilidad, y es la que ocuparemos ahora,
será:

La probabilidad que ocurra un suceso, es la frecuencia relativa de ese


suceso cuando n es muy grande.

Observación 2.5.1 Notemos que si un suceso no ocurre nunca, se tiene


que su frecuencia es cero, por lo tanto su frecuencia relativa también es cero,
y por lo tanto su probabilidad es nula, es decir, si consideramos el espacio
muestral como un conjunto, que lo es, y a un suceso como un subconjunto
del espacio muestral, un suceso que no ocurre nunca es el conjunto vacı́o, es
decir, lo que queremos decir es que:

P [φ] = 0

Ejemplo: Si el experimento es lanzar un dado y estudiamos el valor de la cara


que muestra, entonces la probabilidad de que aparezca 8 es cero.

Observación 2.5.2 Notemos que si un suceso ocurre siempre, se tiene que


su frecuencia es n para n veces que se realiza el experimento, por lo tanto
su frecuencia relativa es 1 independientemente del valor de n, y por lo tanto
su probabilidad es 1, es decir, si consideramos el espacio muestral como un
conjunto, que lo es, digamos Ω y a un suceso como un subconjunto del espacio
muestral, un suceso que ocurre siempre es el propio espacio muestral, es decir,
lo que queremos decir es que:

P [Ω] = 1

31
Ejemplo: Lanzo una piedra con la mano al aire, la probabilidad que la piedra
no llegue al sol es 1.

Observación 2.5.3 Notemos que si consideramos un suceso A, cualquiera,


una vez que se ha realizado n veces el experimento, su frecuencia relativa
será un número entre 0 y n, y por lo tanto su frecuencia relativa será un
número entre 0 y 1, independiente del valor de n, entonces su probabilidad es
un número entre 0 y n, esto es:

0 ≤ P [A] ≤ 1

Cuando el experimento realizado, arroja un número finito de resultados


igualmente posibles, digamos m tenemos que f1 = f2 = f3 = · · · = fm , y
por ende las frecuencias relativas también son iguales y como la suma de las
frecuencias es m entonces todos tienen la misma probabilidad m1 , entonces la
probabilidad que ocurra el suceso S es:
Número de resultados favorables a S
P [S] =
Número total de resultados
Esta fórmula de conoce comunmente como “Ley de Laplace, y muchas
veces se confunde con la definición de probabilidad, pero hay que notar que
coinciden solo en un caso particular.

Veamos algunos ejemplos:

¿Cuál es la probabilidad que al lanzar un dado dos veces la suma de los


números que aparecen sea 8?

Solución:
Primero que nada, debemos reconocer en total de los casos, el espacio
muestral. Anotemos en un par ordenado, el valor de las posibles pares de
números que aparecen, en la primera coordenada, el primer lanzamiento, y
en la segunda el resultado del segundo lanzamiento, por ejemplo si en la
primera lanzada resultó 1 y en la segunda 4 lo anotaremos: (1, 4). De este
modo el ewspacio muestral está formado por:

(1, 1); (1, 2); (1, 3); (1, 4); (1, 5); (1, 6)
(2, 1); (2, 2); (2, 3); (2, 4); (2, 5); (2, 6)

32
(3, 1); (3, 2); (3, 3); (3, 4); (3, 5); (3, 6)
(4, 1); (4, 2); (4, 3); (4, 4); (4, 5); (4, 6)
(5, 1); (5, 2); (5, 3); (5, 4); (5, 5); (5, 6)
(6, 1); (6, 2); (6, 3); (6, 4); (6, 5); (6, 6)
que suman 6 × 6 = 36 posibles resultados. De ellos reconozcamos los favor-
ables:

(2, 6); (3, 5); (4, 4); (5, 3) y (6, 2)


que si contamos suman 5. Como los 36 casos son igualmente probables (los
dados no están cargados) según la formula de Laplace, se tiene que la prob-
abilidad de que la suma de las caras que muestran dos dados sea 8 es:
5
≈ 0, 138. 2
36

Antes de seguir con los ejemplos haremos dos observaciones importanes.

Observación 2.5.4 En un experimento donde los eventos que puedan ocur-


rir son igualmente probables, consideremos un suceso en particular S y el
suceso complementario, que no ocurra S, denotémoslo por S̄, en un espacio
muestral Ω, luego cualquiera de todos los casos posibles es o bien favorable a
S o no es favorable a S, es decir, el conjunto de todos los posibles casos es
la unión de los casos favorables a S y los que no, y ningún caso está a la vez
en S y en S̄, es decir y abusando de la notación:

#Total de casos = #Casos favorables a S + #Casos no favorables a S

es decir,
#Casos favorables a S + #Casos no favorables a S
1=
#Total de casos
escrito de otro modo:
#Casos favorables a S #Casos no favorables a S
1= +
#Total de casos #Total de casos

33
pero el primer sumando de la derecha es la probabilidad de S y el segundo
la probaibilidad que no ocurra S, es decir, el primer sumando es P [S] y el
segundo es P [S̄] ası́ se tiene la relación:

1 = P [S] + P [S̄]

o mejor aún
P [S̄] = 1 − P [S].
Notar que S ∪ S̄ = Ω y S ∩ S̄ = φ y la formula de arriba dice entonces
que:
P [Ω] = P [S] + P [S̄]
Esto es mas general: Si Γ = U ∪ V y U ∩ V = φ entonces

P [Γ] = P [U ] + P [V ]

y se conoce como la propiedad aditiva de la probabilidad. Se invita al estudi-


ante a probar esto último. Cuando dos sucesos como U y V son tales que no
pueden pasar ambos a la vez se llaman sucesos mutuamente excluyentes. Por
ejemplo en el lanzamiento de un dado, que aparezca un número par y que
aparezca un número divisible por 5 son sucesos mutuamente excluyentes.(La
verdad es que esta relación es general, no es necesaria la suposición que se
trata de un experimento donde los resultados son igualmente probables, y se
invita al estudiante a verificar esto.)

Observación 2.5.5 Si un experimento, donde todos los resultados son igual-


mente probables y finitos, se realiza en dos etapas y un suceso S ocurre siem-
pre y cuando en la primera etapa ocurre S1 y luego en la segunda etapa ocurre
S2 , entonces la probabilidad que ocurra S es el producto de la probabilidad
que ocurra S1 y la probabilidad que ocurra S2 , es decir

P [S] = P [S1 ] × P [S2 ],

de hecho si suponemos que los casos totales en la primera etapa son n y los
casos favorables a S1 son a y los casos totales en la segunda etapa son m y
los favorables a S2 son b, entonces por el principio fundamental del conteo, el
experimento tiene nm posibles resultados, y los favorables a S son los que se
logran de empezar por uno de los casos favorables a S1 seguido de cualquiera

34
de los favorables a S2 que en total son ab, es decir la probabilidad que ocurra
S son:
ab a b
P [S] = = ×
nm n m
y esto último de la derecha no es otra cosa que P [S1 ] × P [S2 ].
(Esto se puede generalizar a un experimento en n etapas, donde n es
cualquier número natural, se invita al estudiante a hacer esta generalización)

Haciendo un resumen de algunas de las observaciones que hemos hecho es


que dado un experimento y su espacio mustral Ω, tenemos que la probabilidad
es una forma de asignar valores numéricos a los subconjuntos de Ω tal que:

i) 0 ≤ P [A] ≤ 1, para cualquier suceso A ⊆ Ω

ii) P [Ω] = 1
iii)Si Γ = U ∪ V y U ∩ V = φ, entonces P [Γ] = P [U ] + P [V ]
Para un matemático cualquier forma de asignar valores a los subconjuntos
de un conjunto Ω, de forma tal que cumple con i), ii)yiii) es una probaili-
dad. El asunto que muchas de ellas no son interesantes, pero para estudiar
probabilidades en total generalidad es necesario definir de este modo prob-
abilidad. Antes de esta definición hubo un número importante de paradojas
y de problemas de fondo que no tenı́an solución, los primeros en formalizar
estas ideas fueron Emile Borel (1871-1956) y Henri Lebesgue (1875-1941).
Otro ejemplo:
En una urna hay 5 bolitas rojas, 4 bolitas blancas y 6 bolitas negras. Se
introcuce la mano y a ciegas se cogen 3 bolitas. ¿Cuál es la probabilidad que
en la muestra aparezca al menos una bolita blanca?

Solución 1:
Primero, reconozcamos el espacio muestral, el total de posibles resultados,
notemos que el espacio muestral en este caso no es el conjunto de las 15
bolitas, porque nuestro experimento no es sacar una bolita al azar si no que
tres. De modo que nuestro espacio muestral es el total de posibles muestras
de 3 bolas de un total de 15, y aunque no las describiremos las podemos
contar y son: µ ¶
15 15 × 14 × 13
= = 455,
3 3×2×1

35
de esa cantidad ¿cuantos son favorables a nuestro suceso?. Por lo visto an-
teriormente, también podemos preguntarnos: ¿Cuales son los casos NO fa-
vorables a nuestro suceso? y luego hacer la resta correspondiente. Los casos
no favorables son aquellos en no sale ninguna bolita blanca en nuestra mues-
tra.¿Cuantos son esos casos? Del total de las 455 muestras, las que NO son
favorables son µ ¶
11
= 165
3
que indica la cantidad de formas distintas de sacar 3 bolas de un total de 11
que suman las bolas que no son blancas. Entonces la probabilidad de que en
la muestra aparezca al menos una blanca es:
165 33 58
P =1− =1− = ≈ 0, 637
455 91 91

Solución 2: El experimento arroja los mismos resultados que el siguiente: De


la misma urna se saca una bolita, luego otra y luego otra sin ir devolviendo
a la urna las ya sacadas. Se ve el color de las bolitas que se sacó. ¿Cuál es
la probabilidad que al menos una de las bolitas sea blanca? Nuevamente cal-
cularemos la probabilidad de que ninguna bolita sea blanca y luego haremos
la resta correspondiente. Pero ahora lo haremos de otro modo. ¿Cuál es la
probabilidad de que la primera bolita no sea blanca? La respuesta es clara:
11
,
15
si la primera bolita no es blanca ¿Cuál es la probabilidad que la segunda
bolita tampoco sea blanca? La respuesta es:
10
,
14
pues de las 11 bolitas no blancas que habı́a en un principio solo quedan 10
y en la urna en total solo quedan 14. Si la primera y la segunda bolitas no
fueron blancas ¿Cuál es la probabilidad que la tercera bolita tampoco sea
blanca? Del mismo modo que antes podemos decir que es :
9
13

36
según la observación de antes tenemos que la probabilidad que no salga ningu-
na blanca es :
11 10 9 33
P [S̄] = × × = ,
15 14 13 91
entonces la probabilidad que al menos una de ellas sea blanca es:
33 58
P [S] = 1 − = .
91 91

Esto último sugiere introducir un nuevo concepto que es el de probabilidad


condicional, ¿Cál es la probabilidad que ocurra B sabiendo que ya ocurrió
A? Al resultado a esa pregunta se anota

P (B|A)

y se lee “la probabilidad que ocurra B bajo la condición que A ya ocurrió.


Por ejemplo: Se tienen en total 100 artı́culos de los cuales 20 son defec-
tuosos. Se sacan dos artı́culos al azar, uno después de otro, si el primero es
defectuoso ¿Cuál es la probabilidad que el segundo sea defectuoso?

Solución:
Como ya saqué un artı́culo, me quedan solo 99 de los 100 artı́culos ini-
ciales, como el primero ya fue defectuoso, me quedadn para elegir solo 19
defectuosos, entonces la probabilidad que el segundo artı́culo sea defectuoso
es:
19
P = .
99

Notar que lo único que hacemos es reducir el espacio muestral, debido a la


información “ya ocurrió A. Conjuntistamente tenemos el siguiente diagrama:

A y B son los sucesos en cuestión y Ω el espacio muestral de nuestro experi-


mento. P [B|A] es la probabilidad de estar en B sabiendo que estamos en A,
es decir, debo comparar A ∩ B con B.

Numéricamente:Si los resultados son igualmente probables y si #Ω = n,


#A = a, #B = b, y #A ∩ B = i. Entonces:
i
i n P [A ∩ B]
P [B|A] = = a =
a n
P [A]

37
del mismo modo
i
i n P [A ∩ B]
P [A|B] = = b
=
b n
P [B]
o también
P [B|A]P [A] = P [A ∩ B] = P [A|B]P [B]

Por ejemplo si dos sucesos, A y B, son mutuamente excluyentes, entonces

P [B|A] = 0 = P [A|B] = P [A ∩ B]

Definición 2.5.3 Dos sucesos, A y B, se dicen independientes si: P [B|A] =


P [B] y P [A|B] = P [A], es decir, a A no le importa nada si ocurrió o no B
y viceversa. Equivalentemente, A y B son independientes si P [B]P [A] =
P [A ∩ B]

Un ejemplo:Se lanzan dos dados uno después de otro ?Cual es la probabil-


idad de obtener dos números pares si se sabe que el primero marcó un número
mayor que el primero? ?Cuál es la probabilidad que el segundo muestre un
5 si el primero muestra un 3?

solución:
Para la primera pregunta tenemos

A = {(2, 2); (2, 4); (2, 6); (4, 2); (4, 4); (4, 6); (6, 2); (6, 4); (6, 6)} y

38
B = {(2, 1); (3, 1); (3, 2); (4, 1); (4, 2); (4, 3); (5, 1); (5, 2); (5, 3); (5, 4); (6, 1); (6, 2)
(6, 3); (6, 4); (6, 5)}
y necesitamos calcular P [A|B], y esos son: #A∩B
#B
3
, y eso es igual a 15 .
Para la segunda pregunta tenemos que los sucesos son independientes.
Luego la probabilidad que el segundo dado muestre 5 si el primero muestra
3 es igual a la probabilidad que al lanzar el segundo dado muestre 5, y eso
es 61 2

Otro ejemplo: Un borrachito, llamado Kike, tiene un llavero con 6 llaves


de las cuales solo una es la que abre la puerta de su casa. Pone una llave en la
cerradura, con el mayor cuidado posible por temor al uslero de su mujer , si
falla deja la llave libre en el llavero, producto del alcohol en su cerebro, elige
otra llave pero no se sabe si es la misma llave que antes o es otra nueva.Y así
continúa hasta que logra abrir la puerta.¿ Cuál es la probabilidad que abra
la puerta nuestro amigo Kike exactamente en el tercer intento?

Solución:
Notemos que estamos calculando la probabilidad que logre su objetivo
en su tercera oportunidad suponiendo que falló los dos anteriores, es decir,
si B es acierta en el tercer intento y A falla en los dos primeros intentos,
entonces lo que estamos calculando es:

P (B|A)

Para calcular esto haré un diagrama. Supongamos que tenemos un litro de


un fluido probabilı́stico, como dirı́a Jorge Soto, de ese litro 61 se vá a un frasco
que corresponde a la probabilidad de acertar en el primer intento, y 56 se vá a
otro frasco, que corresponde a la probabilidad de no acertar en el primer in-
tento; entonces nos preocupamos de aquel frasco. De aquel frasco, 16 de él, es
decir, 16 de 56 , es decir, 36
1
del litro inicial,se vá a otro frasco que corresponde
a la probabilidad de acertar en el segundo intento habiendo fallado en el
primero, y los otros 56 del frasco en cuestión, es decir, 56 de 56 , es decir, 36 25
del
litro inicial, se vá a otro frasco, que corresponde a la probabilidad de fallar
en los dos primeros intentos . De aquel frasco, 61 de él, es decir, 16 de 36 25
, es
25
decir, 216 ,se vá a otro frasco que corresponde a la probabilidad de acertar en
el tercer acierto habiendo fallado en los dos primeros, y los otros 65 del frasco
en cuestión, es decir, 56 de 25
36
, es decir, 125
216
del litro inicial, se vá a otro frasco,
que corresponde a la probabilidad de fallar en los tres primeros intentos .La

39
figura siguiente muestra el proceso anterior.

Entonces la probabilidad de que el borrachito acierte en el tercer intento es:


25
P (B|A) = ≈ 0, 115
216
?Desde que intento es bueno apostar a que Kike logra abrir la puerta?

Otro ejemplo: Uno de los problemas que tenı́a intrigado al Chevallier de Mere,
era el siguiente. ?A partir de cuantas tiradas es bueno apostar que sale doble
seis en el lanzamiento de dos dados?

Solución:
Nadie apostarı́a a que en el primer lanzamiento aparece un doble seis,
ni en los dos primeros tampoco, pero que aparezca al menos un doble seis

40
en la tirada número 30 tal vez si e incluso antes. Estudiemos. Para cada
lanzamiento, el espacio muestral es:

(1, 1); (1, 2); (1, 3); (1, 4); (1, 5); (1, 6)

(2, 1); (2, 2); (2, 3); (2, 4); (2, 5); (2, 6)
(3, 1); (3, 2); (3, 3); (3, 4); (3, 5); (3, 6)
(4, 1); (4, 2); (4, 3); (4, 4); (4, 5); (4, 6)
(5, 1); (5, 2); (5, 3); (5, 4); (5, 5); (5, 6)
(6, 1); (6, 2); (6, 3); (6, 4); (6, 5); (6, 6)
que muestra en la primera coordenada el resultado del primer dado, y en la
segunda coordenada el valor que muestra el segundo dado, como ya lo hemos
hecho antes. La probabilidad de obtener doble seis en un lanzamiento es:
1
36
y de fallar es
35
.
36

La probabilidad de acertar en el segundo lanzamiennto habiendo fallado


en el primero es
35
.
362
y la probabilidad de fallar en el segundo lanzamiento habiendo fallado el
primero es
352
.
362

41
Y ası́ sucesivamente se tiene que la probabilidad de acertar en el tercer intento
2
habiendo fallado en los anteriores es 35363
y la probabilidad de acertar en el
353
cuarto intento habiendo fallado en los anteriores es 36 4 y la probabilidad de
354
acertar en el quinto intento habiendo fallado en los anteriores es 36 5 y ası́

sucesivamente. Luego la probabilidad de acertar, por ejemplo, al menos una


vez antes del lanzamiento número 6 es:
4
1 35 352 353 354 X 35j
+ 2 + 3 + 4 ++ 5 = , pero
36 36 36 36 36 j=0
36j+1

4 4 4 5
X 35j 1 X 35j 1 X 35 j 1 1 − 35
36
= = ( ) = ≈ 0, 131
j=0
36j+1 36 j=0 36j 36 j=0 36 36 1 − 35
36

No es dificil darse cuenta que la probabilidad de acertar al menos una vez


antes del k−esimo lanzamiento es
35 k−1
1−( ) ,
36
entonces es más probable ganar que perder antes del k−esimo lanzamiento,
cuando el número de arriba sea mayor que 21 y el primer número k para el

42
cual eso ocurre es 26, de hecho, la probabilidad que salga doble seis al menos
una vez antes de la vigésima sexta lanzada es:
35 25
1−( ) ≈ 0, 505 > 0.5
36

Una pregunta curiosa: ¿Cuál es el valor de la suma infinita


1 35 352 353 354 355 356
+ 2 + 3 + 4 + 5 + 6 + 7 + · · ·?
36 36 36 36 36 36 36

Esta suma denota la probabilidad que gane alguna vez en la vida, suponien-
do además que nuestro amigo es inmortal, luego la probabilidad que gane
alguna vez es cierta, luego esta suma debiera ser 1, si sumar infinitamente
tuviese algún sentido.

Para terminar con esta sección y este capı́tulo, comentaremos brevemente


un concepto muy estudiado en teorı́ de probabilidades, pero que escapa al
contenido de este curso, que es solo una introducción a las matemáticas.

43
Muchas veces, cuando se realiza un experimento el espacio muestral no es
necesariamente un conjunto de números, pueden ser conjunto de muestras de
bolitas, pares ordenados, posibles desarrollos de un partido de tenis,. . . etc.
Sin embargo, podemos asignar a esos elementos un valor numérico en cada
caso; y esto lo que queremos definir ahora:

Definición 2.5.4 Dado un experimento, donde el conjunto de los resultados


observables posibles es Ω, cualquier asignación de valores numéricos a los
elementos de Ω la llamaremos una Variable Aleatoria. Es decir, una variable
aleatoria X toma un elemento ω ∈ Ω y le asigna un número X(ω).

Ejemplo: Lanzamos un par de dados una vez y estudiamos el valor que


ellos muestran. El espacio muestral está formado por los elementos:

(1, 1); (1, 2); (1, 3); (1, 4); (1, 5); (1, 6)

(2, 1); (2, 2); (2, 3); (2, 4); (2, 5); (2, 6)
(3, 1); (3, 2); (3, 3); (3, 4); (3, 5); (3, 6)
(4, 1); (4, 2); (4, 3); (4, 4); (4, 5); (4, 6)
(5, 1); (5, 2); (5, 3); (5, 4); (5, 5); (5, 6)
(6, 1); (6, 2); (6, 3); (6, 4); (6, 5); (6, 6)
Una variable aleatoria para este experimento puede ser: X(a, b) = a+b. ¿Cuál
es el conjunto de posibles valores de X? La respuesta es: {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
¿Cuántos pares (a, b) son tales que X(a, b) = 8? La respuesta es cinco y son:

(2, 6); (3, 5), (4, 4); (5, 3) y (6, 2)

¿Cuál es la probabilidad que la variable aleatoria X tome el valor 8?


5
P [X = 8] =
36
que corresponde a los cinco casos posibles en que X tome el valor 8 dividido
por el total de casos.
Ası́ tenemos:
1
P [X = 2] =
36

44
2
P [X = 3] =
36
3
P [X = 4] =
36
4
P [X = 5] =
36
5
P [X = 6] =
36
6
P [X = 7] =
36
5
P [X = 8] =
36
4
P [X = 9] =
36
3
P [X = 10] =
36
2
P [X = 11] =
36
1
P [X = 12] =
36
Ademaás
12
X 1+2+3+4+5+6+5+4+3+2+1
P [X = k] = = 1 como era de esperar
k=2
36

Es importante notar que si consideramos como espacio muestral los posi-


bles valores que puede tomar X en vez de los posibles pares ordenados. En-
tonces los posibles resultados, a saber, {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} no son
equiprobables, como acabamos de ver.

Otro ejemplo: ¿Cuál es la probabilidad que al lanzar un par de dados la


suma sea menor que 7?

45
Solución: Consideremos la misma variable aleatoria X que en el ejemplo
anterior, entonces lo que estamos buscando es:P [X ≤ 6]. Como los casos
X = 2, X = 3, X = 4, X = 5, X = 6 son mutuamente excluyentes se tiene
que
15 5
P [X ≤ 6] = P [X = 2]+P [X = 3]+P [X = 4]+P [X = 5]+P [X = 6] = = 2
36 12

Espero que estos comentarios y observaciones les permita tener una idea
de que se trata el cálculo de probabilidades y les permita responder a algunas
preguntas. En la guı́a de ejercicios número 4 hay ejercicios que uds. debieran
realizar.

46
Capı́tulo 3

Números Reales

En el capı́tulo anterior vimos escencialmente propiedades de los números


naturales, pero no en su estructura algebraica, mas bien lo que estudiamos
fue su ley de orden y algunas aplicaciones en combinatoria. En este capı́tulo lo
que veremos es que los números naturales no son tan buenos algebraicamente,
ni mucho menos sirven para medir. Entonces lo que haremos es completar
a los números naturales para que sirvan para resolver ecuaciones lineales y
para que podamos medir con total libertad.

3.1 Los Numeros Naturales No Resuelven Ecua-


ciones
Habı́amos dicho que los números naturales tienen una suma y un producto.
La suma es asociativa y conmutativa, sin embargo no hay neutro aditivo en
N ni tampoco inversos aditivos. Esta carencia de N no nos permite resolver
ecuaciones del tipo:

3x + 8 = 2x + 6 ni tampoco 2x + 4 = x + 4,

pues si x es un número natural 3x + 8 es siempre mayor que 2x + 6, lo


mismo que 2x + 4 es mayor que x + 4. Para resolver la segunda ecuación
necesitamos un “número tal que x + x = x o mejor aún, un “número tal
que x + a = a para caulquier valor de a. Ese elemento no vive en N, de
modo que lo inventaremos y le llamaremos originalmente cero, y lo anotamos
por 0. Sin embargo, la primera ecuación aún no la podemos resolver. Lo

47
que necesitamos es un “número x tal que x + 8 = 6 o equivalentemente un
“número x tal que x + 2 = 0, ese elemento como ya vimos no vive en N de
modo que lo inventamos y le llamamos el inverso aditivo de 2 y lo denotamos
por −2. En general si n es un númrero natural, no existe x ∈ N tal que
x + n = 0, como no existe lo inventamos y lo llamamos el inverso aditivo de n
y lo anotamos −n. Entonces después de estos inventos tenemos un conjunto
mas grande formado por N y nuestros inventos recientes, a la unión de esos
conjuntos le llamamos el conjunto de los números enteros y lo denotamos por
Z.
Z = N ∪ −N ∪ {0}
donde −N = {−n/n ∈ N}.
Entonces en Z tenemos neutro aditivo y opuestos aditivos para los enteros
respecto de la suma que supondremos conocida. La multiplicación tambien la
supondremos conocida en Z. Y también concordaremos que la multiplicación
no es tan buena como la suma, si bien también es conmutativa y asociativa,
tiene neutro (1), y distribuye con respecto a la suma, no tiene inversos mul-
tiplicativos, es decir en Z, el siguiente problema no tiene solución:¿Cuanto
mide el lado de un cuadrado de perı́metro 2? Si la medida del lado lo deno-
tamos por x, buscamos un número x tal que 4x = 2. Si tal x viviese en Z
necesariamente vivirı́a en N, pero para cualquier número natural x, 4x ≥ 4
luego es imposible que 4x = 2. En realidad buscamos un número x tal que
2x = 1. Al igual como hicimos de N a Z, a tal número lo inventamos y lo
denotamos por 2−1 , y en general si 0 6= a ∈ Z, el sı́mbolo a−1 denota el
inverso multiplicativo de a, es decir, lo único que sabemos de a−1 es que
aa−1 = a−1 = 1, . pero en el nuevo conjunto que inventemos debieramos
sumar por ejemplo 2−1 + 2−1 + 2−1 a ese número obviamente lo denotamos
por 3 · 2−1 , entonces lo que inventamos es el conjunto
Q = {b−1 a = ab−1 /a ∈ Z y 0 6= b ∈ Z}.
Sin embargo, por ejemplo la ecuación 3x = 4 tiene a x0 = 3−1 4 como solución,
de hecho, 3×3−1 4 = 1×4 = 4, pero tambien es cierto que x1 = 9−1 12 también
es solución de esta ecuación, de hecho, 3 × 9−1 12 = 3−1 9 × 9−1 12 = 3−1 12 =
3−1 3 × 4 = 1 × 4 = 4. Sin embargo, nosotros esperamos que esa ecación tenga
una única solución, es decir, esperamos que x0 y x1 sean distintas formas de
escribir la misma cosa. Entonces en Q hay elementos que están escritos de
muchas formas distintas. Entonces diremos que
ab−1 = cd−1 ⇔ ad = bc.

48
Por convención al elemento ab−1 también lo anotamos como ab , de este modo
se tiene:
a c
= ⇔ ad = bc.
b d
A Q con esta identificación de elementos se le llama el conjunto de los números
racionales.

Supondremos conocida la suma y producto en Q, pero de todos modos


aquı́ los recordamos:
a c ad + bc
+ = y
b d bd
a c ac
× = .
b d bd
Ası́ tenemos que Q algebraicamente es todo lo bueno que esperásemos que
fuese. Los matemáticos dicen que Q, con la suma y el producto antes definido
es un Cuerpo. Esto es en Q hay una suma y un producto bien definidos para
las cuales se cumplen las siguientes propiedades:

Asociatividad para la suma:

Para cualquier trio de elementos, a, b y c, de Q se tiene:(a+b)+c = a+(b+c).


(3.1)

Conmutatividad para la suma:

Para cualquier par de elementos, a y b de Q se tiene:a + b = b + a. (3.2)

Neutro aditivo:

Existe 0 en Q tal que para cualquier elemento a en Q se tiene:a + 0 = a.


(3.3)

Inverso aditivo:

Para cualquier elemento a en Q, existe −a en Q tal que:a + −a = 0. (3.4)

Asociatividad para la multiplicación:

Para cualquier trio de elementos, a, b y c de Q se tiene:a(bc) = (ab)c.


(3.5)

49
Conmutatividad para la multiplicación:
Para cualquier par de elementos, a y b de Q se tiene:ab = ba. (3.6)

Neutro para la multiplicación:


Existe 1 en Q tal que para cualquier a en Q se tiene:1a = a. (3.7)

Inverso multiplicativo:
Para cualquier a no nulo en Q existe a−1 no nulo en Q tal que:aa−1 = 1.
(3.8)
Distributividad del producto co respecto a la suma:
Para cualquier trio de elementos, a, b y c, de Q se tiene:a(b + c) = ab + ac.
(3.9)
Estas nueve propiedades se pueden probar usando las propiedades de Z
y las definiciones que hicicimos en el párrafo anterior a la enumeración de
propiedades del cuerpo Q. Se invita al estudiante a probar estas cosas.
Los matemáticos se dieron cuenta que dados dos racionales distintos, dig-
amos x < y, existe un racional entre medio, es decir, existe t ∈ Q tal que
x < t < y, por ejemplom el promedio puede ser uno de esos t, de hecho x <
x+y
2
< y. Pero también notaron que si podemos encontra un racional entre
dos racionales distintos podemos encontrar infinitos repitiendo varias veces
el mismo proceso. Por ejemplo entre 0, 0000000000000000000000001 = 10124
y 0, 0000000000000000000000002 = 10224 hay infinitos números racionales. Lo
que pensaron fue entonces que los racionales estan muy juntos y que si los
ponemos distribuidos en 1una recta no habrá ningún punto de la reca sin
que le corresponda algún racional. Entonces midieron todas las distancias
con “huinchas racionales. Sin embargo, no todas las distancias se pueden
medir con huinchas que solo tienen medidas racionales. Por ejemplo, consid-
eremos el cuadrado de lado 1.

Por el Teorema de Pitágoras tenemos que la medida d de la diagonal


cumple con:
d2 = 12 + 12 ,
es dedcir, d es tal que: d2 = 2.La pregunta es ¿Existe un número racional d
tal que su cuadrado sea 2.? Y la respuesta es:

50
Proposición 3.1.1 No existe número racional que su cuadrado sea 2.

Demostración:
Supongamos que existe d en Q tal que d2 = 2, podemos escribird = ab con
a, b ∈ Z, b 6= 0, sin restricción podemos suponer que a y b no tienen factores
en común, pues si los tuviesen simplifico hasta que ya no tengan factores
comunes. Pues bien, tenemos:
³ a ´2 a2
d2 = 2 = =
b b2
2b2 = a2
Esto significa que a2 espar, pero esto implica que a es par pues si fuese im-
par también lo serı́a a2 . Entonces tenemos que a = 2k para cierto k ∈ Z
rremplazando esto en nuetra última igualdad tenemos:

2b2 = (2k)2

2b2 = 4k 2
b2 = 2k 2
Esto último muestra que b2 es par del mismo modo que antes b es par. Pero
esto es una contradicción pues no pueden ser ambos, a y b, pares, ya que en
ese caso a y b tendrı́an a 2 como factor común. Luego suponer que existe
d ∈ Q tal que d2 = 2 es un error, luego lo correcto es No existe ningún
número racional tal que su cuadrado es 2. 2

Como este ejemplo hay muchas (infinitas) medidas que una huincha racional
no se da cuenta que existen. Este ejemplo tal vez podrı́a distraer a un lector

51
desatento y hacerlo creer que la carencia de soluciones de ecuaciones es la
falla que tiene Q, pero seremos enfáticos en decir que aquello no es correcto.
Por ejemplo si consideramos un cı́rculo de diámetro 1. La longitud de
la circunferencia no la podemos medir con una huincha racional. A aquella
medida los griegos le llamaron π y recién en el siglo ?? un matemático alemán,
Lindermman, logró probar que no existe ninguna ecuación del tipo:
an xn + an−1 xn−1 + · · · + a1 x + a0 = 0 (∗)
que tenga a π como solución, donde {ak }nk=1 es un conjunto de números
racionales. Es decir, este es un ejemplo que muestra que hay medidas que
no son soluciones de ecuaciones. Existen muchos ejemplos, como la diagonal
del cubo, que no se pueden medir con una huincha racional y entre aquellas
hay muchas (infinitas) que no son soluciones de ecuaciones del tipo (∗). De
hecho en comparación son mas las que no son soluciones de ecuaciones que
las que sí. Además hay muchas (infinitas) ecuaciones que no encuentran sus
soluciones en el conjunto de todas las medidas, por ejemplo x2 + 1 o también
x2 + x + 1. Ahora bien, si consideramos el conjunto de todas las medidas
y le llamamos M y a y b viven M ¿Por qué ab vive también en M? Por
2
ejemplo:¿
√ (π) √
es la medida de que? O podemos ser mucho más drásticos ¿Que
2
mide ( 2) .? Otra pregunta es: Si logramos inventar un conjunto que logre
juntar a todas las medidas ¿Por qué razón este nuevo conjunto no perderá
las propiedades algebraicas que con tanto esfuerzo logramos encontrar en Q?
O equivalentemente ¿Por qué este nuevo conjunto es un cuerpo?

3.2 Números Reales


Para dar una definición formal y rigurosa de números reales se necesitan al-
gunas herramientas que aún no tenemos. A partir de N nosotros construimos
Z, y a partir de Z construimos Q. A partir de Q se construye R, el conjun-
to de los números reales, una de esas construcciones se llama El método de
las cortaduras de Dedekind y se puede consultar en un apéndice del libro
de M.Spivak “Cálculo Infinitesimal. Otro método es el de “Completación de
Cauchy que es mucho más claro e intuitivo que el anterior y se puede encon-
trar en cualquier libro de Análisis Matemático o de Topologı́a en el capı́tulo
de espacios métricos. Nosotros supondremos 1 que el estudiante conoce algo
1
Suponer que conocemos a los números reales es una afirmación bastante ambiciosa,
pues si conociéramos realmente a este conjunto habrı́a muchos problemas del análisis

52
de los números reales o que está algo familiarizado con esa idea. El estudiante
puede pensar que el conjunto de los números reales es el conjunto de todas
la “medidas y sus inversos aditivos. Puede pensar que son los puntos de una
recta o que es el conjunto de todos lo números decimales, y no serı́an malos
pensamientos. De hecho esta última, aquella de los números decimales, es una
buena idea. Pongámonos de acuerdo. Primero que nada R es un cuerpo, esto
es, satisface las propiedades (3.1) hasta (3.9) cambiando R por Q. Además
contiene a Q . Además cumple con

Propiedades 3.2.1 (Densidad de Q) Dados dos elementos distintos en R


siempre existe un número racional entre ellos.

Además en R existe un subconjunto P que satisface las siguientes propiedades:

1. Si a y b son elementos de P entonces a + b ∈ P y además ab ∈ P.(


Clausura de P bajo suma y producto).

2. Si a ∈ P entonces a ∈ P o bien a = 0 o bien −a ∈ P y esas tres


condiciones son excluyentes. (Ley de Tricotomı́a)

Hagamos algunas observaciones:

Observación 3.2.1 El neutro aditivo y el neutro multiplicativo son únicos.


De hecho si existiesen dos neutros aditivos distintos , digamos 0 y 00 , se
tendrı́a que
0 = 0 + 00 = 0
luego 0 = 00 lo cual es una contradicción. Luego el neutro aditivo es único. Y
si existiesen dos neutros multiplicativos distintos , digamos 1 y 10 , se tendrı́a
que
1 = 1 × 10 = 10
luego 1 = 10 lo cual es una contradicción. Luego el neutro aditivo es único.
que podrı́amos resolver, y muchas preguntas que han interesado a matemáticos de to-
dos los tiempos que podrı́iamos responder, además si conociésemos a los números reales
conocerı́amos a todos sus subconjuntos, a todos los cuerpos reales a todos los números
trascendentes que contiene, a Q en particular y a N y la teorı́a de números no tendría
secretos para nosotros, lo cual está muy lejos de ser cierto. En realidad lo que queremos
decir es que tenemos una idea intuitiva de lo que estamos hablando

53
Observación 3.2.2 El inverso aditivo y el inverso multiplicativo (cuando
existe) son únicos .
De hecho si x ∈ R tuviese dos inversos aditivos distintos , digamos −x y
y, se tendrı́a que

−x = (x + y) + −x = (x + −x) + y = y

por asociatividad de la suma, luego −x = y lo cual es una contradicción.


Luego el inverso aditivo es único. Y si x 6= 0 tuviese dos inversos multiplica-
tivos distintos , digamos x−1 y y, se tendrı́a que

x−1 = (xy)x−1 = (xx−1 )y = y

luego x−1 = y lo cual es una contradicción. Luego el inverso multiplicativo


es único.

Observación 3.2.3 Para cualquier número real x se tiene x × 0 = 0. (Se


deja la prueba de esto como ejercicio para el estudiante.)

Observación 3.2.4 El inverso aditivo del inverso aditivo de x es x. En


sı́mbolos: −(−x) = x.
De hecho 0 = −(−x) + (−x) y además x + (−x) = 0 luego x = [−(−x) +
(−x)] + x = −(−x) + [−x + x] = −(−x).

Observación 3.2.5 El inverso multiplicativo del inverso multiplicativo de x


es x. En sı́mbolos: (x−1 )−1 = x. (Se deja al estudiante la prueba de esto.)

Observación 3.2.6 El producto del inverso aditivo de x por y es igual al


producto del inverso aditivo de y por x y es igual al inverso aditivo del pro-
ducto de x por y es x. En sı́imbolos: (−x)y = x(−y) = −(xy).
De hecho xy + x(−y) = x(y + −y) = x × 0 = 0 luego x(−y) es el
inverso aditivo de (xy), luego x(−y) = −(xy). Del mismo modo xy+(−x)y =
(x + −x)y = 0 × y = 0 luego (−x)y es el inverso aditivo de (xy), luego
(−x)y = −(xy).

Observación 3.2.7 Si x ∈ P y 0 6= y 6∈ P entonces xy 6∈ P.


De hecho si 0 6= y 6∈ P entonces −y ∈ P entonces se tiene que x(−y) =
−(xy) ∈ P, luego concluimos que xy 6∈ P.

54
Observación 3.2.8 Si 0 6= x 6∈ P y 0 6= y 6∈ P entonces xy ∈ P.
De hecho si 0 6= x 6∈ P y 0 6= y 6∈ P entonces −x ∈ P −y ∈ P entonces
se tiene que (−x)(−y) = (xy) ∈ P, luego concluimos que xy ∈ P.

Observación 3.2.9 1 ∈ P. Mas generalmente si x 6= 0 entonces x2 ∈ P.


Además N ⊆ R.
De hecho como 0 6= x 6∈ P entonces x ∈ P o −x ∈ P entonces si x ∈ P
entonces x × x = x2 ∈ P, y si −x ∈ P se tendrı́a que (−x)(−x) = (x × x) =
x2 ∈ P, luego en cualquiera de los casos se tiene que x2 ∈ P. En particular
1×1 = 1 ∈ P.Además como P es cerrado bajo la suma se tiene que 1+1 ∈ P y
ası́ inductivamente se tiene que n ∈ P, para cualquier n ∈ N, es decir N ⊆ P.

Al conjunto P se le llama el conjunto de los números positivos. Al con-


junto de los inversos aditivos de elementos de P se les llama el conjunto de
los números negativos.
El conjunto P define un orden en R como sigue:

Definición 3.2.1 Si x y y son números reales tales que y − x ∈ P entonces


diremos que x es menor que y. Y anotamos x < y. O también decimos que y
es mayor que x y anotamos y > x.

Por ejemplo 1 < 0 pues 1 − 0 = 1 ∈ P. Del mismo modo x < x + 1, para


cualquier número real.

Observación 3.2.10 Si x < y y y < z entonces x < z. (Transitividad)


De hecho como x < y y y < z entonces y − x ∈ P y z − y ∈ P entonces
(y − x) + (z − y) ∈ P lo cual implica que z − x ∈ P lo cual a su vez implica
por definición que x < z.

Observación 3.2.11 Si x < y y c ∈ R entonces x + c < y + c. Es decir


cuando sumamos un número real a cada lado de una desigualdad, el sentido
de la desigualdad se mantiene.
De hecho como x < y se tiene que y −x ∈ P entonces (y −x)+(c−c) ∈ P
lo cual implica que (y +c)−(x+c) ∈ P lo cual a su vez implica por definición
que x + c < y + c.

Observación 3.2.12 Si x < y y c ∈ P entonces xc < yc. Notar que c ∈ P


es equivalente a c − 0 ∈ P en nuestro nuevo lenguaje es equivalente a decir
c > 0. Entonces nuestra última observación es equivalente a la siguiente: Si

55
x < y y c > 0 entonces xc < yc. Es decir, cuando multiplicamos por un
número positivo ambos lados de una desigualdad el sentido de la desigualdad
se mantiene.

De hecho como x < y se tiene que y − x ∈ P y como c ∈ P entonces


se tiene que c(y − x) ∈ P lo cual implica que yc − xc ∈ P lo cual a su vez
implica por definición que xc < yc.

Observación 3.2.13 Si x < y y 0 6= c 6∈ P entonces xc > yc. Notar que


−c ∈ P es equivalente a 0 − c ∈ P en nuestro nuevo lenguaje es equivalente a
decir c < 0. Entonces nuestra última observación es equivalente a la siguiente:
Si x < y y 0 < c entonces xc > yc. Es decir, cuando multiplicamos por un
número negativo ambos lados de una desigualdad el sentido de la desigualdad
se invierte.

De hecho como x < y se tiene que y − x ∈ P y como −c ∈ P entonces se


tiene que −c(y − x) ∈ P lo cual implica que −yc + xc ∈ P lo cual a su vez
implica por definición que xc > yc.

Ejemplo: Como 1 < 2 y −1 < 0 se tiene que −1 > −2.

Mas definiciones y notaciones:

Definición 3.2.2 Si x y y son números reales , x ≤ y significará que x < y


o x = y. Note que las tres últimas observaciones siguen siendo ciertas si
cambiamos < por ≤ .

Definición 3.2.3 Si a, b son números reales y a < b. Al conjunto I = {x ∈


R/a ≤ x ≤ b} se le llama el intervalo cerrado a b. Y se anota I = [a, b].

Definición 3.2.4 Si a, b son números reales y a < b. Al conjunto J = {x ∈


R/a < x < b} se le llama el intervalo abierto a b. Y se anota J = (a, b).

Definición 3.2.5 Si a, b son números reales y a < b. Al conjunto K = {x ∈


R/a ≤ x < b} se le llama el intervalo semi-cerrado por la izquierda a b. Y se
anota K = [a, b).

Definición 3.2.6 Si a, b son números reales y a < b. Al conjunto L = {x ∈


R/a < x ≤ b} se le llama el intervalo semi-cerrado por la derecha a b. Y se
anota L = (a, b].

56
Definición 3.2.7 Si a ∈ R al conjunto M = {x ∈ R/x ≥ a} lo anotamos
por M = [a, ∞).
Definición 3.2.8 Si b ∈ R al conjunto N = {x ∈ R/x ≤ b} lo anotamos
por N = (−∞, b].
Definición 3.2.9 Si a ∈ R al conjunto O = {x ∈ R/x > a} lo anotamos
por O = (a, ∞).
Definición 3.2.10 Si b ∈ R al conjunto T = {x ∈ R/x < b} lo anotamos
por T = (−∞, b).
Definición 3.2.11 R = (−∞, ∞).
A los números reales se les suele dibujar como puntos de una recta. En
alguna parte se ubica al 0. A la derecha de el a los números positivos y a la
izquierda de el a los números negativos. En general si x < y a y si dibuja a
una distancia y − x a la derecha de x.

Ası́ por ejemplo el intervalo (1, 5] se dibuja del siguiente modo:

Por ejemplo: Encuentre todos los números reales x tales que 3x + 5 <
7x − 3.

Solución: Se trabaja igual que en ecuaciones teniendo cuidado que al mul-


tiplicar por un negativo el sentido de la desigualdad se invierte. Suponiendo
que x es una solución se simplifica la expresión que debe cumplir, por ejemplo
3x + 5 < 7x − 3/ − 5

57
3x < 7x − 8/ − 7x
−1
−4x < −8/
4
x>2
Luego el conjunto de todas las solucioes es: (2, ∞). Generalmente, hay mas
de una solución y hablamos del conjunto solución de la desigualdad (o in-
ecuación).

Otro ejemplo: Encuentre todos los números reales x tales que x2 −6x+6 <
x.

Solución 1:
x2 − 6x + 6 < x/ − x
x2 − 7x + 6 < 0
(x − 6)(x − 1) < 0
Tenemos que el producto de dos números reales,(x − 6) y (x − 1), es un
número negativo. Por las observaciones que hicimos antes, se tiene que eso
se logra si (x − 6) < 0 y (x − 1) > 0 o bien (x − 6) > 0 y (x − 1) < 0.
Estudiemos el primer caso: (x − 6) < 0 y (x − 1) > 0 es equivalente a x < 6
y x > 1 luego este caso tiene por solución al intervalo S1 = (1, 6).
Estudiemos ahora el segundo caso: (x−6) > 0 y (x−1) < 0 es equivalente
a x > 6 y x < 1.¿ Cuál número real es menor que 1 y mayor que 6? La
respuesta es ninguno. Luego este caso tiene por solución al conjunto S2 = Φ.
Entonces el conjunto de los x ∈ R tal que x2 − 6x + 6 < x es el intervalo
(1, 6).
Solución 2:
x2 − 6x + 6 < x/ − x

58
x2 − 7x + 6 < 0
(x − 6)(x − 1) < 0
Estudiemos la recta real en tres intervalos: (−∞, 1), (1, 6) y (6, ∞)
Si x ∈ (−∞, 1) entonces (x−6) < 0 y (x−1) < 0 entonces (x−6)(x−1) >
0. Luego no hay ninguna solución de nuestro problema en ese intervalo.
Si x ∈ (1, 6) entonces (x−6) < 0 y (x−1) > 0 entonces (x−6)(x−1) < 0.
Luego todo el intervalo (1, 6) es solución de nuestro problema .
Si x ∈ (6, ∞) entonces (x−6) > 0 y (x−1) > 0 entonces (x−6)(x−1) > 0.
Luego no hay ninguna solución de nuestro problema en ese intervalo.
Luego la solución general a nuestro problema es el intervalo (1, 6)

Un concepto importante es el de valor absoluto de un número real, a la


hora de medir distancias, y de formalizar esta idea.

Definición 3.2.12 Si x ∈ R definimos el valor absluto de x por:


½
x si x ≥ 0
|x| =
−x si x < 0

Algunas propiedades del valor absoluto son las siguientes:

Propiedades 3.2.2 1. Para cualquier par de números reales x, y se tiene:


|xy| = |x||y|

2. Para cualquier número real x se tiene: | − x| = |x|

3. Para cualquier número real x se tiene: |x| ≥ 0.

4. Si c > 0 entonces se tiene que {x ∈ R/|x| < c} = (−c, c).

5. Si c > 0 entonces se tiene que {x ∈ R/|x| ≤ c} = [−c, c].

6. Para cualquier par de números reales x, y se tiene: |x + y| ≤ |x| + |y|.


(Desigualdad Triangular)
¯ ¯
|x| ¯ ¯
7. Para cualquier par de números reales x, y, con y 6= 0, se tiene: |y| = ¯ xy ¯

59
Las demostraciones de la veracidad de esas propiedades se deja al lector
a modo de ejercicio.

Un error muy común es pensar que −x denota siempre un número neg-


ativo, y en realidad lo que denota es el inverso aditivo de x y solo eso. Por
ejemplo, si x está a la izquierda de 0 entonces −x es un número positivo. Del
mismo modo muchas personas creen que el valor absoluto de un número real
x es “sacarle el signo a x. Lo cual también es un error pues, por ejemplo si x
está a la izquierda de 0 entonces |x| = −x y en este caso le pusimos un signo.

Ejemplo: Encuentre todos los números reales x tales que

|x + 2| + |3x − 1| > 4

Solución:
Para hacer este tipo de ejercios necesitamos dividir nuestra recta real, en
intervalos para obtenr desigualdades equivalentes a la del problema, donde
no aparezaca el valor absoluto.

Los puntos que tenemos marcados son exactamente los valores donde los
valores absolutos que aparecen se anulan.

Caso 1: Si x < −2. En este caso x + 2 < 0 y 3x − 1 < 0, luego en este


caso se tiene que |x + 2| = −(x + 2) y |3x − 1| = −(3x − 1), entonces nuestra
desigualdad en este caso es equivalente a:

−(x + 2) − (3x − 1) > 4

−4x − 1 > 4/ + 1

60
−1
−4x > 5/
4
−5
x< ,
4
−5
luego si x < −2 y x satisface nuestra desigualdad se tiene que x < 4
. Los x
que son solución viven en el intervalo S1 = (−∞, −2).

Caso 2: Si −2 ≤ x ≤ 31 . En este caso x + 2 ≥ 0 y 3x − 1 ≤ 0, luego en


este caso se tiene que |x + 2| = x + 2 y |3x − 1| = −(3x − 1), entonces nuestra
desigualdad en este caso es equivalente a:

x + 2 − (3x − 1) > 4

−2x + 3 > 4/ − 3
−1
−2x > 1/
2
−1
x< ,
2
luego si −2 ≤ x ≤ 13 y x satisface nuestra desigualdad se tiene que x < −1
2
.
Los x que son solución viven en el intervalo S2 = [−2, −1
2
).

Caso 3: Si x ≥ 13 . En este caso x + 2 ≥ 0 y 3x − 1 ≥ 0, luego en este caso


se tiene que |x + 2| = x + 2 y |3x − 1| = 3x − 1, entonces nuestra desigualdad
en este caso es equivalente a:

x + 2 + 3x − 1 > 4

4x + 1 > 4/ − 1
1
4x > 3/
4
3
x> ,
4
luego si x ≥ 3 y x satisface nuestra desigualdad se tiene que x > 34 . Los x
1

que son solución viven en el intervalo S3 = ( 43 , ∞).

Luego la solución total de nuestro problema es:


−1 3 −1 3
S = S1 ∪ S2 ∪ S3 = (−∞, ) ∪ ( , ∞) = R − [ , ]
2 4 2 4

61
Definición 3.2.13 Si x y y son números reales, la distancia entre x y y se
define como |x − y|.

Se invita al estudiante decir por qué esta es una buena definición. En


particular |x| es la distancia de x a 0.

Si ² > 0 y a ∈ R entonces el conjunto de todos los números reales x que


están a distancia menor que ² de a es {x ∈ R/|x − a| < ²} = (a − ², a + ²).
Hay quienes a ese conjunto le llaman el vecindario de centro a y radio ². El
estudio de aquellos conjuntos será muy importante en los capı́tulos venideros,
ya que dan cuenta de la noción de cercanía, de aproximación. Por ejemplo,
dibuja en una misma recta real los intervalos abiertos In = {x ∈ R/|x − 2| <
1
n
} = (2 − n1 , 2 + n1 ), para cada n ∈ N. Son vecindarios cada vez mas pequeños
al rededor de 2. ¿Podrı́as decir que conjunto es la interseccion de todos los
conjuntos In ası́ definidos?

3.3 Conjuntos Acotados:Ínfimo y Supremo


Consideremos el siguiente conjunto A = {q ∈ Q/q 2 ≤ 2}. Este conjunto es
un subconjunto no vacı́o de Q, además para cualquier elemento q de A se
tiene que q ≤ 2. De hecho puedo ser más preciso y decir que
3
q≤ ∀q ∈ A.
2
De hecho puedo ser aún más preciso y decir
7
q≤ ∀q ∈ A.
5
De hecho puedo ser aún más preciso y decir
141
q≤ ∀q ∈ A.
100
De hecho puedo ser aún más preciso y decir
707
q≤ ∀q ∈ A.
500
Ası́ sucesivamente podemos encontrar números racionales que están a la
derecha de A, sin embargo no podemos encontrar el número racional mas

62
pequeño que está a la dercha de A ni tampoco podemos encontrar el mas
grande dentro de A. Esa es la verdadera razón formal por la cual es nece-
sario construir los números reales. Antes que nada pongámonos de acuerdo
en algunos nombres, que a estas alturas ya forman un diccionario.

Definición 3.3.1 Un subconjunto A de R se dice acotado superiormente, si


existe M ∈ R tal que para cualquier a ∈ A se tiene que a ≤ M, a M se llama
una cota superior de A. Se dice acotado inferiormente, si existe m ∈ R tal
que para cualquier a ∈ A se tiene que m ≤ a, a m se llama una cota inferior
de A. A se dice acotado si es acotado inferiormente y superiormente a la vez.

Ejemplo: El conjunto X = (0, 1) es acotado. Pues para cualquier elemento


de x ∈ X se tiene que 0 ≤ x ≤ 1.

Notar que si M es una cota superior de A, y si N ≥ M entonces N es


una cota superior de A también. Del mismo modo si m es una cota inferior
para A y n ≤ m entonces n es también una cota inferior de A.

Definición 3.3.2 Si A es un conjunto acotado superiormente y s es una


cota superior de A tal que si t es otra cota superior de A siempre se cumple
que s ≤ t, entonces s se llama Supremo de A. Y anotamos sup(A) = s. Si A
es un conjunto acotado inferiormente e i es una cota inferior tal que si j es
otra cota inferior siempre se cumple que j ≤ i entonces i se llama Infimo de
A. Y anotamos inf (A) = i.

Ejemplo: sup((0, 1)) = 1 e inf ((0, 1)) = 0.

La siguiente es una propiedad muy importante de los números reales,


que si los hubiésemos construido la podrı́amos demostrar, pero como nuestra
presentación fue axiomática la presentamos como

Axioma 3.3.1 (Axioma del Supremo) Todo conjunto no vacı́o de números


reales que es acotado superiormente tiene un supremo.

Como concecuencia de este axioma se tiene el siguiente

Teorema 3.3.1 Todo conjunto no vacı́o de números reales que es acotado


inferiomente tiene un ı́nfimo.

63
Demostración:
Si A es un conjunto acotado inferiormente entonces −A = {−a/a ∈ A}
es un conjunto acotado superiormente por axioma del supremo existe s =
sup(−A) esto es s es la menor de las cotas superiores de −A. Como en
particular s es cota superior de −A se tiene que
s ≥ −a, ∀ − a ∈ −A
o equivalentemente
−s ≤ a, ∀a ∈ A
es decir −s es cota inferior de A. Ahora bien si −s no fuese el ı́nfimo de A
se tendrı́a que existe j ∈ R cota inferior de A, pero mayor que −s, esto es
−s < j ≤ a, ∀a ∈ A
o equivalentemente
s > −j ≥ −a, ∀ − a ∈ −A
lo cual es una contradicción pues s = sup(−A), es decir suponer que −s no
es el ı́nfimo de A es un error, es decir inf (A) = −s, en particular el inf (A)
existe. 2

Lo que tenemos que tener claro es que el supremo de un conjunto acotado


superiormente no vacı́o es la menor de las cotas superiores. Cuando el supre-
mo de un conjunto A es un elemento de A, entonces al supremo en ese caso
se le llama Máximo y se anota M ax(A). Cuando el supremo de un conjunto
no es un elemento del conjunto en cuestión, es un punto que está pegado al
conjunto, está adherido al conjunto. Es decir, no lo podemos separar de nue-
stro conjunto, es decir, si sup(A) = s entre A y s no existe ningún intervalo.
Es decir, cualquier vecindario de la forma (s − ², s + ²) contiene elementos
de A.
Otra forma de entender el concepto de supremo es la siguiente: s = sup(A)
si y solamente si s es una cota superior de A y cada vez que nos movemos
un poco a la izquierda de s se nos cuela un elemento de A. De otro modo,
Para cualquier ² > 0 existe a ∈ A tal que s − ² < a.

Lo mismo podemos decir del ı́nfimo: i = inf (A) si y solamente i es una


cota inferior de A y para cualquier ² > 0 existe a ∈ A tal que i + ² > a.
En el caso en que A es acotado inferiormente y i = inf (A) y además i ∈ A
decimos que i es el mínimo de A y anotamos i = min(A)

64
Algunas observaciones:

Observación 3.3.1 El supremo y e ı́nfimo cuando existen son únicos. Por


eso le llamamos “el supremo y “el ı́nfimo.

Observación 3.3.2 Un conjunto A es acotado si y solamente si existe un


número positivo M tal que para cualquier a ∈ A se tiene que |a| ≤ M.

Observación 3.3.3 Si s es cota superior de A y además s ∈ A, entonces


s = sup(A). Mejor aún s = M ax(A)

Observación 3.3.4 Si i es cota inferior de A y además i ∈ A, entonces


i = inf (A). Mejor aún i = min(A)

Observación 3.3.5 Si s = sup(A), entonces −s = inf (−A).Es decir, −sup(A) =


inf (−A).

Observación 3.3.6 El vacı́o es un conjunto acotado para el cual todo número


real es una cota superior y por lo tanto no tiene supremo.

Observación 3.3.7 Si A es un conjunto finito entonces es acotado y existe


el mínimo y el máximo del conjunto.

Observación 3.3.8 Si φ 6= A ⊆ Z es acotado superiormente entonces tiene


máximo, en particular sup(A) ∈ Z.

Una concecuencia interesante de la observación anterior es la siguiente:

Observación 3.3.9 Si φ 6= A ⊆ N entonces min(A) = inf (A) ∈ N. Todo


subconjunto no vacı́o de números naturales tiene un menor elemento.

65
Se invita al estudiante a probar la veracidad de estas observaciones. O al
menos que se convenza de algún modo.
Una propiedad importante:

Propiedad 3.3.1 (Propiedad Arquimedeana) Para cualquier número re-


al R existe un número natural N tal que R < N.

Esta propiedad dice entre otras cosas que el conjunto de los números
naturales no es acotado superiormente. No es una gran novedad, pero es
bueno dejarlo establecido.
La propiedad arquimedeana es equivalente a la siguiente:

Proposición 3.3.1 El ı́nfimo de A = { n1 /n ∈ N} es 0.

Demostración:
Que el conjunto A es acotado inferiormente es claro pues A es un conjunto
de números positivos, por lo tanto 0 < a ∀a ∈ A. Luego 0 es una cota inferior
de A.
Para probar que 0 es el ı́nfimo de A tenemos que probar que si me muevo
un poco a la derecha de 0 hay un elemento del conjunto que se cuela entre
medio. Es decir, debemos probar que para cualquier ² > 0 se tiene que existe
a ∈ A tal que 0 + ² > a. O equivalentemente: Para cualquier ² > 0 existe
n ∈ N tal que ² > n1 .
Pues bien, sea ² > 0 cualquiera, pero desde ahora fijo, por propiedad
arquimedeana existe N ∈ N tal que 1² < N multiplicando esta última de-
sigualdad por N² que es un número positivo, por lo tanto el sentido de la
desigualdad se mantiene, se obtiene que
1
< ² que es lo que queremos probar. 2
N

n
Un ejemplo: Consideremos el conjunto A = { n+1 /n ∈ N} ¿Es el conjunto A
acotado? ¿Qué podemos decir acerca del supremo y el ı́nfimo?
Solución:
El conjunto A es acotado, pues todos los elementos de A son positivos por
lo tanto 0 es una cota inferior. Por otra parte, sabemos que n < n+1 ∀n ∈ N,
1 n
luego multiplicando por n+1 se tiene que n+1 < 1, luego 1 es una cota superior

66
de A. Luego A es acotado. Notemos que n2 + 2n + 1 > n2 + 2n, es decir
(n + 1)2 > n(n + 2) o equivalentemente
n+1 n
> ∀n ∈ N
n+2 n+1
Es decir, los elementos de A están ordenados
1 2 3 4 5 6 7 8 9 10 11
< < < < < < < < < < < ···
2 3 4 5 6 7 8 9 10 11 12
Por lo tanto 21 ≤ a ∀a ∈ A y como 12 ∈ A se tiene que inf (A) = 12 =
n
min(A). Por otra parte notamos que a medida que n crece n+1 también
10
crece y cada vez mas se parece a 1. Por ejemplo, para n = 10 se tiene que
n
n+1
= 0, 999999999. En general:

n 1
∀n ∈ N se tiene =1−
n+1 n+1
y como sabemos por la proposición anterior que n1 es tan pequeño como
n 1
queramos, podemos afirmar que n+1 = 1 − n+1 está tan cerca de 1 como
queramos aunque menor que 1. Es decir, afirmamos que sup(A) = 1, de
hecho si ² > 0, cualquiera, existe N ∈ N tal que N1 < ², o equivalentemente
− N1 > −², o equivalentemente 1− N1 > 1−², o equivalentemente NN−1 > 1−²,
y sabems que NN+1 > NN−1 > 1 − ², es decir acabamos de probar que para
cualquier ² > 0 existe a ∈ A, a saber a = NN+1 tal que 1 − ² < a. Es decir,
sup(A) = 1 2

Un último ejemplo antes de ver una pequeña aplicación es la siguiente:

Proposición 3.3.2 Si 0 < r < 1 entonces A = {rn /n ∈ N} es un conjunto


acotado tal que sup(A) = r e inf (A) = 0.

Indicación de Demostración:
Notemos que 1 > r implica que r > r2 , multiplicando por r. Inductiva-
mente podemos probar que para cualquier n ∈ N se tiene que rn > rn+1 .
Mas generalmente, se puede probar que rn > rm siempre y cuando m > n.
De este modo para cualquier n ∈ N se tiene que r = r1 ≥ rn , es decir, r ≥ a
para cualquier a ∈ A. Luego M ax(A) = sup(A) = r.

67
Notamos que a medida que n crece rn decrece, se hace cada vez mas
pequeño. Mostraremos que se hace tan pequeño como queramos. Observa-
mos que 1r > 1, es decir, existe c > o tal que 1r = 1 + c, (¿Por qué?) o
1 1
equivalentemente, existe c > 0 tal que r = 1+c . Luego rn = (1+c) n , pero

notamos que:
Xn µ ¶ Xn µ ¶
n n k n k
(1 + c) = c = 1 + nc + c ≥ 1 + nc (¿Por qué?)
k=0
k k=2
k

(Esta última desigualdad se conoce como desigualdad de Bernoulli.)


Pues entonces tenemos que si ² > 0:
1 1 1 1 1
rn = n
≤ ≤ = × ,
(1 + c) 1 + nc nc c n

pero por Proposición(3.3.1) se tiene que existe N ∈ N tal que N1 < c², luego
1
Nc
< ², resumiendo existe N ∈ N tal que rN < ², es decir para caulquier ² >
existe a ∈ A, a saber a = rN , tal que 0 + ² > a, luego inf (A) = 0 2

Antes definimos el valor absoluto de un número, y era algo ası́ como aso-
ciarle a cada número real x un único número positivo del “mismo tamaño
que x. Ahora a cada número real le asociaremos un único número entero,
pero para ello ocuparemos la Observación(3.3.8), de modo que ahora la pro-
baremos.

Prueba de Obs.(3.3.8) Si φ 6= A ⊆ Z acotado superiormente en R, por


axioma del supremo existe sup(A) = s ∈ R. En particular se tiene que
s ≥ a, ∀a ∈ A. Afirmamos que existe un único elemento α ∈ A tal que
0 ≤ s − a < 1. Que s − a ≥ 0 es claro pues s es cota superior de A. Si tal α no
existiese se tendrı́a que s − a ≥ 1, ∀a ∈ A, lo cual es equivalente a decir que
s − 1 ≥ a, ∀a ∈ A, lo cual quiere decir que s − 1 es cota superior lo cual es
una contradicción pues (s = sup(A). Luego existe α ∈ A tal que s − α < 1.
Si existiesen al menos dos elementos distintos de A con la propiedad de
α, digamos α y β tales que s − α < 1 y s − β < 1 y supongamos α < β,
entonces

β − α = |β − α| = |β − s + s − α| ≤ |β − s| + |s − α| < 1 + 1 = 2,

luego como α y β son números enteros se tiene que β − α = 1, o equiva-


lentemente β = α + 1, luego s − α = s − β + 1 = 1 + (s − β) ≥ 1, lo cual

68
contradice el hecho que s − α < 1. Luego tal α existe y es único. Luego
s ≥ a ∀a ∈ A − {α}, consideremos s − α = t, entonces si t =
6 0 tenemos que
t
2
> 0.

En este caso s > s − 2t > a, ∀a ∈ A lo cual contradice el hecho que


s = sup(A) luego t = 0. Luego s = α. Luego s ∈ A. Luego sup(A) =
M ax(A) ∈ A. 2

Ahora si x ∈ R cualquiera, consideremos el conjunto Ax = {a ∈ Z/a ≤ x}


que depende de x, y que es un conjunto no vacı́o (¿Por qué?) de números
enteros acotado superiormente por x. Por lo tanto, y por lo visto anterior-
mente sup(Ax ) = M ax(Ax ) ∈ Ax ⊆ Z a tal número entero se le llama la
Parte entera de x y se anota [x] = M ax(Ax ). Por ejemplo si n ∈ Z se tiene
[n] = n. Hay que tener en mente que [x] es el mayor entero menor o igual que
x. Si x 6∈ Z entonces [x] es el entero que está “inmediatamente a la izquierda
de x.
Por ejemplo: [ 21 ] = 0, [ −1
2
] = −1.
Por ejemplo: Si n ∈ N se tiene que [n + x] = n + [x], ∀x ∈ R. (¿Esto
último sigue siendo cierto si cambiamos N por Z?)
¿Es cierto que [x + y] = [x] + [y] ∀x, y ∈ R?

La parte entera es otro ejemplo de un asignación de valores numéricos


a los elementos de ciertos conjuntos, que a su vez pueden ser números. El
valor absoluto también es un ejemplo de ello, a cada punto de la recta real le
asociamos un número real positivo o cero. En el prx́imo capı́tulo estudiaremos
esas asociaciones en total generalidad.

69
Capı́tulo 4

Funciones

4.1 Ejemplos y Conceptos Básicos


Como ya vimos existen formas de asociar a cada elemento de un conjunto
un elemento de otro conjunto (que puede ser el mismo). Por ejemplo el valor
absoluto de un número real asocia a cada número x la distancia que hay
entre x y 0. Por ejemplo, cuando a cada número positivo x asociamos el área
del cuadrado de lado x, decimos que el área está en función del lado. La
relación F = ma dice que a masa constante, la fuerza está en función de la
aceleración. En la relación E = mc2 decimos que la energı́a está en función
de la masa. Y ası́ tenemos muchos ejemplos:
La posición de un movil es una función del tiempo.
La presión de un gas en un recipiente es una función de la temperatura.
El volumen de una esfera es una función del radio dela esfera.
La fuerza de atracción entre dos cuerpos es una función de la distancia
que los separa.
El número de habitantes de una comunidad es una función de la natalidad.
La velocidad de la sangre en una arteria es una función de la distancia
de la sangre al eje central de la arteria.(Ley dePoiseuille).
La rapidez con que se propaga un chisme es función de la cantidad de
gente que ya lo sabe.
La cantidad de palabras que quedan del Latı́n en el castellano es una
función del tiempo.
La firmeza con que se mantiene un hábito en una persona es una función
de la cantidad de estı́mulos favorables al hábito.

70
La probabilidad que un suceso ocurra es una función de la cantidad de
casos favorables al suceso.
La propagación de una epidemia es una función de la cantidad de pa-
cientes ya infectados.

Pues bién, esa palabra , función, es sin duda el objeto más estudiado en
matemáticas, es tanto o más importante conocer las funciones que actúan en
un conjunto que el propio conjunto. Entonces hagamos una definición para
saber de que estamos hablando, o al menos para tener un consenso:
Definición 4.1.1 Dados dos conjuntos A y B una función de A en B es
una relación, una asignación, que a cada elemento a de A le asocia un único
elemento b en B.Y anotamos f : A → B. f (a) = b denota que f asocia al
elemento a ∈ A el elemento b ∈ B, y decimos que b es la imagen de a vı́a
f, o también a es una preimagen de b vı́a f. Al conjunto A le llamamos el
conjunto de salida de f, o también le llamamos el dominio de f, y anotamos
Dom(f ) = A (hay libros en que Dom(f ) denota otra cosa). Al conjunto B le
llamamos el conjunto de llegada de f, o también el recorrido de f y anotamos
Rec(f ) = B. (hay libros en que Rec(f ) denota otra cosa).Al conjunto de
elementos de B que son la imagen de algún elemento a ∈ A vı́a f le llamamos
el conjunto de las imágenes de f, y anotamos
Im(f ) = {b ∈ B/ existe a ∈ A tal que f (a) = b}
o más sucintamente
Im(f ) = {f (a) ∈ B/ a ∈ A}.
Ejemplo:id : R → R definida por id(x) = x, es la función que no hace nada.
A cada elemento lo deja fijo. A esa función le llamamos la función identidad.
Y tiene la particularidad que Im(f ) es todo el conjunto de llegada.

Otro ejemplo: Si c ∈ R, fijo, consideramos la función que a cada número real


x le asocia el mismo número c, independiente del valor de x. A tal función
le llamamos la función constante de valor c, o también la función constante
igual a c, o simplemente la función c. Anotamos f : R → R definida por
f (x) = c. Y se tiene que Im(f ) = {c}.

Otro ejemplo:La relación que a cada elemento de R le asocia su inverso mul-


tiplicativo, No es una función. Pues el elemento 0 no tiene una imagen. Esto
es f : R → R definida por f (x) = x1 no es función.

71
Otro ejemplo:La relación que a cada elemento x de R le asocia un número real
r tal que r2 = x. No es una función. Pues el elemento 1 tiene dos imágenes,
a saber, 1 y −1. Además el elemento −1 no tiene imagen. Si asumimos que
todo número real no negativo es el cuadrado de un número real no negativo 1 ,
podrı́amos restringir el dominio y el recorrido de nuestra relación para obtener
una función. Entonces la relación que a cada número real x no negativo le
asocia un número r no negativo tal que r2 = x, es una función y se conoce
como la√función raı́z cuadrada. Anotamos f : [0, ∞) → [0, ∞) definida por
f (x) = x. En este caso Im(f ) = [0, ∞) que es todo el conjunto de llegada.

Si tenemos una función f : A → B tal que Im(f ) = B, diremos que f es


una función Epiyectiva o también Sobreyectiva. Por ejemplo la función raı́z
cuadrada, como la definimos en el ejemplo anterior es epiyectiva. La función
identidad es una función epiyectiva. La función constante no es epiyectiva. La
función f : R → R definida por f (x) = x2 no es epiyectiva, pues −1 6∈ Im(f ).

Una observación inmediata es que si f : A → B es una función, entonces


si restringimos el recorrido obtenemos una función epiyectiva, esto es: f :
A → Im(f ) definida por f (x) = f (x) es una función epiyectiva.

Ejemplo: La función f : R → [0, ∞), definida por f (x) = |x| es epiyectiva.


Y además cada elemento del conjunto de llegada salvo el 0 tiene dos preima-
genes. Esto es, si y 6= 0 en el conjunto de llegada, entonces f (y) = f (−y) = y.
Para ciertos propósitos esta propiedad no es muy bienvenida, en muchos casos
quisieramos que puntos distintos del conjunto de salida sean transformados
vı́a f en elementos distintos en el conjunto de llegada.

Una función f : A → B tal que si a 6= a0 en A entonces f (a) 6= f (a0 ) en


B, se llama función inyectiva o función uno a uno. Por ejemplo la función
valor absoluto del ejemplo anterior NO es inyectiva. La función identidad
es inyectiva y ya sabı́amos que es epiyectiva. La función f : R − {0} →
R − {0} definida por f (x) = x1 es inyectiva y epiyectiva a la vez. La función
g : [0, ∞) → R definida por f (x) = x2 es inyectiva pero no epiyectiva.
Una caracterización de las funciones inyectivas es la siguiente: Una función
f : A → B es inyectiva si y solamente si cada vez que f (a) = f (a0 ) en B, se
tiene que a = a0 en A. Si asumimos que todo número real no negativo es el
1
Aún no estamos preparados para probar esa afirmación, pero pronto lo estaremos.

72
cuadrado de un número real no negativo 2 , entonces las siguientes funciones
son distintas:

f1 : [0, ∞) → [0, ∞) definida porf1 (x) = x2 ,

f2 : [0, ∞) → R definida porf2 (x) = x2 ,


f3 : R → R definida porf3 (x) = x2 ,
pues la primera es inyectiva y epiyectiva a la vez, la segunda es inyectiva
pero no epiyectiva y la tercera no es inyectiva ni tampoco epiyectiva, de
modo que no pueden ser iguales. Hay libros que no hacen diferencias entre
esas funciones, en particular entre f1 y f2 , pero en este curso si haremos esta
diferencia. Resumiendo una función es un triple, un conjunto de salida A,
un conjunto de llegada B y una relación f entre ellos, con la condición que
todos los elementos de A tengan una imagen en B vı́a f y que esa imagen sea
única. Si cambiamos uno de esos tres ingredientes la función que se obtiene
es distinta a la anterior.

Una función que es a la vez inyectiva y epiyectiva se llama Biyectiva.

4.2 Composición de Funciones


Dadas dos funciones, f : A → B y g : B → C, podemos definir una función
de A en C. Lo que haremos es poner a B como puente entre A y C, del
siguiente modo:
A→B→C
¿Cómo podemos ir de A a B? La respuesta es simple, tomamos un elemento
a en A y lo mandamos a B vı́a f, digamos f (a) = b ∈ B, ahora bien, como
b está en B sabemos mandarlo a C vı́a g, es decir, g(b) = c ∈ C. Luego
c = g(f (a)), es decir, hemos construido una función de A en C tal que a
cada elemento a en A lo manda a g(f (a)) ∈ C, a tal función se llama la
función composición de g con f, y se anota:

g ◦ f : A → C definida por g ◦ f (x) = g(f (x)).

Por ejemplo: Cosideremos las funciones f, g : R → R definidas por: f (x) = x2


2
idem

73
y g(x) = 2x + 3 entonces g ◦ f : R → R es la función

g(f (x)) = g(x2 ) = 2x2 + 3,

como en nuestro caso A = B = C = R tiene sentido considerar f ◦g : R → R,


que es la función

f (g(x)) = f (2x + 3) = (2x + 3)2 = 4x2 + 12x + 9,

que como vemos son distintas, de hecho, por ejemplo g ◦ f (0) = 3 y f ◦ g(0) =
9. Hay casos en que f ◦ g tiene sentido y g ◦ f no tiene ningún sentido.

Por ejemplo:Cosideremos las funciones f : R → R definida por: f (x) = x2


y g : R − {0} → R definida por g(x) = x1 , entonces f ◦ g : R − {0} → R, que
es la función µ ¶2
1 1 1
f (g(x)) = f ( ) = = 2,
x x x
lo cual tiene sentido pues x = 0 no pertenece al dominio f ◦ g está bien
definida, sin embargo, g ◦ f : R → R, no tiene sentido pues g ◦ f (0) no existe.

Un caso particular es el siguiente: Supongamos que f : A → B y g : B →


A son funciones tales que f ◦ g : B → B es la función identidad de B, es
decir, f ◦ g = idB , es decir f (g(b)) = b ∀b ∈ B y además g ◦ f : A → A es la
función identidad de A, es decir, g ◦ f = idA , es decir g(f (a)) = a ∀a ∈ A. Es
decir, f deshace lo que g hace y viceversa. Es decir, f (a) = b si y solamente
si g(b) = a. En ese caso, decimos que f y g son funciones inversas entre
si, o también decimos que f es la inversa de g y que g es la inversa de f,
y anotamos f −1 = g y g −1 = f. Cuando una función f tiene una función
inversa decimos que f es invertible.

Un ejemplo: Consideremos la función f : R − {0} → R − {0} definida por


f (x) = x1 , notemos que si x 6= 0 entonces

1 1
f ◦ f (x) = f (f (x)) = f ( ) = 1 = x,
x x

es decir, f ◦ f = idR−{0} .(Note que la composición en el otro sentido no es


necesaria hacerla en este caso). Luego f es invertible y f es su propia inversa.

74
Si f : A → B es biyectiva, entonces para todo elemento b en B existe
un elemento a en A tal que f (a) = b (epiyectividad), además tal a es único
(inyectividad). Luego definamos g : B → A por g(b) = a si y solamente si
f (a) = b. No es difı́cil darse cuenta que g −1 = f. Fue exactamente lo que
hicimos cuando definimos la función raı́z cuadrada. Es decir, f : [0, ∞) →
[0, ∞) definida por f (x) = x2 es biyectiva y definimos g : [0, ∞) → [0, ∞)
g(x) = r donde r es el único numero real no negativo tal que r2 = x, es decir,
g(x) = r si y solamente si f (r) = x, es decir g −1 = f.
La pregunta que algún estudiante curioso se pudiese hacer es: ¿ Si f es in-
vertible es necesariamente biyectiva? La respuesta es Si, pero no es tan obvio,
ası́ que la prueba de eso la daremos como la demostración de la siguiente

Proposición 4.2.1 Toda función invertible es biyectiva.

Demostración:
Si f : A → B es invertible, entonces por definición existe g : B → A tal
que f ◦ g = idB , es decir f (g(b)) = b ∀b ∈ B y además g ◦ f = idA , es decir,
g(f (a)) = a ∀a ∈ A. Si dos elementos a y a0 en A tales que f (a) = f (a0 ) = b,
en ese caso g(f (a)) = g(b), pero por otra parte g(f (a)) = a, del mismo modo
g(f (a0 )) = g(b), pero por otra parte g(f (a0 )) = a0 , luego a = g(b) = a0 , Luego
f es inyectiva. Ahora sea b ∈ B, sabemos que f (g(b)) = b, luego si a = g(b),
entonces se tiene que para cualquier b ∈ B existe a ∈ A tal que f (a) = b,
luego f es epiyectiva. Luego f es Biyectiva.2
La demostración sugiere los siguientes ejercicios para el estudiante:
1. Si g ◦ f es biyectiva entonces f es inyectiva y g es epiyectiva.

2. Si f y g son biyectivas entonces si g ◦ f existe es biyectiva.

3. Im(f ◦ g) ⊆ Im(f )
La función f : R → [0, ∞) no es biyectiva, por lo tanto no tiene inversa,
sin embargo√podemos considerar la función g : [0, ∞) → [0, ∞), definida
por g(x) = x y componer con f en el único sentido que se puede, a saber
g ◦ f : R → [0, ∞), y obtenemos

g ◦ f (x) = g(f (x)) = x2

esta función se confunde comunmente con la función identidad, sin embargo


no lo es, de hecho, si x ≥ 0 se tiene que g ◦ f (x) = x por definición de la

75
función raı́z cuadrada, pero si x < 0 se tiene que g ◦ f (x) = −x, es decir,
g ◦ f (x) = |x|, es decir, √
x2 = |x|
y notar además que f ◦g(x) no√tiene sentido en general. Es decir, hay números
para los cuales la expresión ( x)2 ni siquiera tiene sentido.

4.3 Función Afı́n


Como ya vimos la función identidad id : R → R es biyectiva . ¿Qué podemos
decir ahora de la función f : R → R definida por f (x) = 2x? Es fácil darse
cuenta que también es biyectiva. De hecho, si y es un número real existe x
en R, a saber x = y2 tal que f (x) = y, luego la función es epiyectiva. Además
si f (a) = f (a0 ), esto es 2a = 2a0 , implica que a = a0 , entonces f es inyectiva.
Luego la función f es biyectiva.¿Qué podemos decir de f (x) = 2x + 3? Dar
la respuesta a esta pregunta es un ejercicio para los estudiantes. Antes de

seguir con ejemplos, daremos una definición general.

Definición 4.3.1 Sea D ⊆ R y sea f : D → R una función. Al conjunto de


puntos del plano de la forma (x, f (x)) se llama el gráfico de f y anotamos,
Γf = {(x, y) ∈ R2 /y = f (x)}.

Por ejemplo Γid = {(x, y) ∈ R2 /y = x} = {(x, x)/x ∈ R}

El gráfico de f : R → R definida por f (x) = 2x y el de f : R → R


definida por f (x) = 2x + 3, son los que damos a continuación, el primero en
rojo y el segundo en azul.

Notamos que ambos gráficos, al igual que el gráfico de la identidad, ge-


ométricamente representan lı́neas rectas. Recordemos ahora ese concepto.

Definición 4.3.2 Una recta L es el lugar geométrico de todos los puntos del
plano tal que para cada par de puntos P1 = (x1 , y1 ) y P2 = (x2 , y2 ) en L se
tiene que x1 = x2 o bien el cuociente xy22 −x
−y1
1
= m es constante. A tal constante
m se llama la pendiente de la recta L.

76
Las rectas del primer tipo, L= {(a, y)/y ∈ R}, no las estudiaremos en
este curso, escencialmente por que no representan el gráfico de función algu-
na, ya que a tendrı́a infinitas imágenes distintas. El siguiente es el gráfico de
L= {(1, y)/y ∈ R}.

En lo sucesivo cuando diga ”recta” me estaré refiriendo a las rectas del


segundo tipo. Si de una recta L conocemos su pendiente, digamos m, y un

punto por el cual la recta pasa, digamos P1 = (x1 , y1 ) entonces podemos


conocer todos los otros puntos de la recta. De hecho, P = (x, y) pertenece a
la recta L si y solamente si
y − y1
=m
x − x1
o equivalentemente si y solamente si los números x y y satisfacen la ecuación:

y = mx + (y1 − mx1 ), si a y1 − mx1 le llamamos n, obtenemos:

y = mx + n, La cual se conoce como la ecuación principal de la recta


Entonces tenemos que L= {(x, mx + n)/x ∈ R}. La pregunta ahora es
inmediata ¿ Es L el gráfico de alguna función f ? La respuesta es igual de
inmediata y es Si. De hecho es claro que es el gráfico de f : R → R definida
por f (x) = mx + n. Reciprocamente, dada una función del tipo f : R → R

77
definida por f (x) = ax + b, para ciertos a y b números reales fijos. ¿Es
Γf = {(x, ax + b)/x ∈ R} una recta? Tomemos dos puntos cualesquiera en
Γf , digamos P = (p, ap + b) y Q = (q, aq + b), como son puntos distintos
p 6= q, hagamos el cuociente xy22 −y
−x1
1
en nuestro caso particular y si resulta ser
constante, independiente de p y de q estaremos en presencia de una recta.
Ası́ tenemos:

aq + b − (ap + b) a(q − p)
= = a pues p 6= q
q−p q−p
Luego la función f : R → R definida por f (x) = ax + b, tiene por gráfico
una recta de pendiente a. A tales funciones les llamaremos funciondes afines,
también les llaman funciones lineales, pero nosotros reservaremos ese nombre
a otro tipo de funciones que veremos en un curso de Algebra Lineal.
Como por un par de puntos pasa una única recta, para graficar una fun-
ción afı́n basta conocer dos puntos del gráfico y trazar la recta que por
ellos pasa. E inversamente si dos puntos pasan por la recta L, digamos
P1 = (x1 , y1 ) y P2 = (x2 , y2 ), se tiene que xy22 −x
−y1
1
= m es la pendiente de la
recta. Luego la ecuación de la recta es: y − y1 = m(x − x1 ), luego la ecuación
principal de la recta que pasa por los puntos dados es: y = mx + (y1 − mx1 );
Luego la función cuyo gráfico es la recta que pasa por los puntos P1 = (x1 , y1 )
y P2 = (x2 , y2 ), es f : R → R definida por f (x) = mx + n, donde m = xy22 −y −x1
1

78
y n = y1 − mx1

Observemos los siguientes gráficos:

Vemos una familia de varias (21) rectas del tipo y = ax, con a variando.
La recta que es más inclinada coresponde a a = 10, es decir, la recta más
inclinada corresponde a y = 10x y la menos inclinada corresponde a y = 15 x.
Es decir la pendiente de la recta es un nombre acertado, e indica la inclinación
de la recta.

Observemos ahora el siguiente gráfico:

Vemos una familia de varias (21) rectas del tipo y = x + a donde a varı́a
desde a = 10 la recta que está más hacia la derecha, es decir la recta de
más hacia la derecha es y = x + 10 y la que está más hacia la izquierda
es y = x − 10. Entonces notamos que rectas que tienen igual pendiente son
paralelas. Probemos ese hecho, que conocemos desde el colegio, como una:

Proposición 4.3.1 Dos rectas son paralelas si y solamente si tienen la mis-


ma pendiente.

Demostración:

79
Si tenemos dos rectas L y L0 , como vemos en el gráfico:

ellas son paralelas si y solo si los ángulos a y a0 son iguales, o equivalen-


temente los triángulos OP Q y O0 P 0 Q0 son semejantes, o equivalentemente
|OP | |O0 P 0 |
los lados de los triángulos son proporcionales. Es decir, |OQ| = |O 0 Q0 | .Si
0 0 0 0 0 0
P = (x1 , y1 ). Q = (x2 , y2 ),P = (x1 , y1 ) y Q = (x2 , y2 ), entonces la última
igualdad es equivalente a:

y2 − y1 y 0 − y10
= 20 ,
x2 − x1 x2 − x01

pero el cuociente de la izquierda por definición es la pendiente de L y el de


la derecha es la pendiente de L0 , que es lo que queremos probar.2

Por ejemplo: ¿Cuál es la ecuación de la recta L que pasa por (1, 1) y es


paralela a la recta L0 que pasa por (−2, 0) y (0, 3)?

80
Solución:La pendiente de la recta L0 es 32 , luego la ecuación de la recta L
es (y − 1) = 32 (x − 1), o equivalentemente y = 23 x − 12 . 2

Un ejercicio para los estudiantes:Pruebe que dos rectas son perpendicu-


lares si y solo si el producto de sus pendientes es −1(Ayuda: Use el teorema
de Euclides, para triángulos rectángulos.)
Estudiemos ahora a las funciones afines con respecto a la biyectividad.
Sea aR − {0} y bR fijos, y consideremos la función afı́n: f : R → R definida
por f (x) = ax + b. Esta función es inyectiva, de hecho si f (x) = f (x0 ) se
tiene que ax + b = ax0 + b, o equivalentemente ax = ax0 y como a 6= 0 se
tiene que x = x0 , luego es inyectiva. Además si y ∈ R entonces y−b es un
¡ y−b ¢ a
número real pues a 6= 0 luego f a = y, luego f es epiyectiva, por lo tanto
f es biyectiva. Por lo tanto f tiene una función inversa, es decir una función
g : R → R tal que f (g(x)) = x, es decir,

ag(x) + b = x

81
ag(x) = x − b
x−b
g(x) =
a
Falta comprobar que la composición en el otro sentido es también la función
iedentidad, pero eso se deja de ejercicio para el estudiante. Luego la inversa
de f es una función afı́n, a saber f −1 (x) = a1 x − ab .

En el caso en que a = 0 lo que obtenemos es una función constante igual


a b, en ese caso no es invertible, obviamente.

Antes de pasar a estudiar las funciones cuadráticas, quiero hacer notar


que los procesos en la vida que son modelados por rectas, por ejemplo, un
movil que se mueve con velocidad constante, no son infinitos es decir, no
está todo el tiempo con velocidad constante, pues a veces puede acelerar
o frenar, puede pasar que en un momento se detenga tome un descanso y
luego de un rato continúe. Por ejemplo: del segundo 0 al 1800 se mueve con

82
velocidad constante igual a 2 ms , en el minuto 30 se detiene a comer algo
durante 5 minutos y luego sigue con velocidad constante igual a 4 ms durante
una hora que es cuando llega a su destino final. Lo que tenemos entonces es
una función, definida por tramos, ası́:

 2x si 0 ≤ x ≤ 1800
f : [0, 5400] → R, definida por:f (x) = 3600 si 1800 ≤ x ≤ 2100

3600 + 4x si 2100 ≤ x ≤ 5400

Un ejemplo, de las funciones descritas en el párrafo anterior es la función


valor absoluto. f : R → R definida por:
½
x si x ≥ 0
f (x) =
−x si x < 0
cuyo gráfico es :

Existen procesos en los cuales los tramos son constantes. Por ejemplo,
cuando uno toma un taxi, los primeros 200m uno paga una tarifa constante
$250 y por cada 200m aumenta el precio en $80 y ası́ sucesivamente. El
gráfico de la función plata que depende del desplazamiento es algo ası́ como:

83
Un ejemplo teórico de lo antes descrito es la función parte entera.

f : R → R definida por:f (x) = sup{n ∈ Z/n ≤ x}

Se invita al estudiante a graficar esta función.

4.4 Función Cuadrática


La función f : R → R definida por f (x) = x2 ha sido un objeto que hemos
mencionado bastante en este capı́tulo, y ya sabemos varias cosas de ella. Por
ejemplo, sabemos que no es inyectiva ni tampoco epiyectiva, sin embargo, la
función f1 : R → [0, ∞) definida por f (x) = x2 si es epiyectiva, es decir, todo
elemento de [0, ∞) es el cuadrado de algún número real. Además sabemos
que f (x) = f (−x). En honor a ella las funciones f : R → R tales que
f (x) = f (−x) se les llama funciones pares. Es decir, basta conocer f (x) para
x no negativo para conocer f completamente. Geométricamente el gráfico de
f será simétrico con respecto al eje de la abcisas. Entonces, estudiaré f (x)
para x ∈ [0, ∞). Notemos primero que si x, y ∈ [0, ∞) y x < y entonces
y − x > 0 y como y + x > 0 se tiene que (y − x)(y + x) > 0, es decir,
y 2 − x2 > 0, equivalentemente x2 < y 2 , es decir f (x) < f (y), es decir f en
[0, ∞) preserva el orden. Es decir, si 0 ≤ x < y entonces f (x) < f (y).

84
En general, a las funciones f : D → R tales que cada vez que x < y se
tiene que f (x) < f (y) se les llama funciones crecientes. Lo que dice el párrafo
anterior es que f en [0, ∞) es creciente.
Notemos también que si 0 ≥ x < 1 se tiene que x2 < x, multiplicando
la desigualdad anterior por x. Es decir, el gráfico de f está por debajo de la
diagonal en el intervalo (0, 1). En el caso en que x > 1 se tiene que x2 > x,
es decir, el gráfico de f está sobre la diagonal.Además x2 = x si y solamente
si x2 − x = 0 si y solamente si x = 0 o bien x = 1, es decir, el gráfico de
f intersecta a la diagonal en (0, 0) y en (1, 1) solamente. El gráfico de f lo
podemos mostrar ası́ , después de las consideraciones anteriores.

Ahora bien, que podemos decir de las funciones f : R → R definidas


por f (x) = ax donde a es una constante. Nosotros acabamos de hacer el
caso a = 1. El caso a = 2 es muy parecido al anterior, con la diferencia
que crece más rápido que la función vista anteriormente. Es decir, el gráfico
será de la misma manera, pero la curva que aparece será más cerrada. Ahora
mostramos varias funciones del tipo f (x) = ax para a > 0.

La curva que tiene los brazos más abiertos corresconde a f (x) = 51 x y la


más cerrada corresponde a f (x) = 10x.
En el caso en que a < 0 lo que se obtendrá será el mismo gráfico que

85
antes reflejado hacia abajo.
Ahora bien, consideremos el caso en que la curva no pasa por el origen.
Por ejemplo las funciones del tipo f R → R definidas por f (x) = ax2 + bx + c.
Por supuesto que estoy considerando a no nulo de lo contrario estarı́amos en
frente de una funcón afı́n que ya conocemos bien. En este caso
Γf = {(y, x) ∈ R2 /y = ax2 + bx + c}
b
Γf = {(y, x) ∈ R2 /y = a(x2 + x) + c}
a
b b2 b2
Γf = {(y, x) ∈ R2 /y = a(x2 + x + 2 − 2 ) + c}
a 4a 4a
2
b b
Γf = {(y, x) ∈ R2 /y = a(x + )2 − ) + c}
2a 4a
2 b 2 4ac − b2
Γf = {(y, x) ∈ R /y = a(x + ) + )}
2a 4a
2 4ac − b2 b
Γf = {(y, x) ∈ R /y − = a(x + )2 }
4a 2a
2 2 4ac−b2 b
Γf = {(Y, X) ∈ R /Y = aX } donde Y = y − 4a y X = x + 2a
Lo único que tenemos que entender, para conocer el gráfico de f es ¿Qué
significa un cambio de coordenadas del tipo Y = y −k y X = x−h? Notemos

86
primero que Y = 0 siempre y cuando y = k y X = 0 cuando x = h. Ahora
bien si el punto P = (a, b) está en el plano, escrito en las coordenadas xy
¿Cómo se escribirá en las coordenadas XY ? Si x = a y y = b entonces
X = a − h y Y = b − k, es decir en las coordenadas XY el punto P se escribe
(a − h, b − k). Es decir, lo que hacemos es trasladar rı́gidamente hasta que el
origen coincida con (h, k). Por ejemplo la recta Y = X en el plano XY es la
diagonal, pero en el plano xy corresponde a la recta y = x + k − h.
Luego el gráfico de f se ve ası́:
b 2
donde h = − 2a y k = 4ac−b
4a
al punto V = (h, k) se le llama vértice y
corresponde al punto más bajo de la curva en el caso en que a > 0 y al punto
más alto de la curva en el caso en que a < 0.
Por ejemplo el gráfico de la función f : R → R definida por f (x) =
x2 − 2x + 4, corresponde a todos los puntos (x, y) del plano que satisfacen:

y = x2 − 2x + 4

y − 3 = x2 − 2x + 1

87
y − 3 = (x − 1)2
y se ve ası́, donde el vértice es (1, 3).

88
89
90