Anda di halaman 1dari 69

Notas de Cálculo III

Licenciatura en Matemáticas

Universidad Autónoma de Yucatán

Dr. José Matı́as Navarro Soza

1
INTRODUCCIÓN

Este curso trata de generalizar algunos de los conceptos y técnicas del cálculo
de una variable para funciones de varias variables, un esfuerzo que comenzó en
el curso de Cálculo II. Para lograr una comprensión de los conceptos, al mismo
tiempo que se obtienen las habilidades para calcular derivadas e integrales en
varias variables, resulta de mucha utilidad observar las similitudes y
diferencias con los conceptos y técnicas correspondientes en una variable. Con
el objetivo de suavizar el camino, primero se desarrollan los temas en
dimensiones bajas, para después generalizar a cualquier número de
dimensiones. Se muestran ejemplos y aplicaciones en el plano y el espacio
tridimensional que ayuden a desarrollar tanto la intuición geométrica como las
habilidades para determinar los cálculos necesarios en la solución de un
problema especı́fico. También se enuncian algunos teoremas importantes,
dando las pruebas de aquellos teoremas que resultan accesibles en este nivel,
que pueden servir para lograr una evolución paulatina de la madurez
matemática del estudiante y que forman parte de los conocimientos necesarios
para desarrollar temas más avanzados de cálculo y sus aplicaciones.

2
CONTENIDO

1. Derivación.
1.1. Curvas.
1.1.1. Curvas parametrizadas.
1.1.2. Derivada y vector tangente.
1.1.3. Propiedades de la derivada.
1.2. Campos escalares.
1.2.1. Curvas y superficies de nivel.
1.2.2. Conjuntos abiertos y cerrados.
1.2.3. Derivadas parciales.
1.2.4. Ejemplos en dos y tres dimensiones.
1.2.5. Gradiente.
1.2.6. Diferenciabilidad.
1.2.7. Regla de la Cadena.
1.2.8. Planos tangentes a superficies de nivel.
1.2.9. Planos tangentes a gráficas de funciones.
1.2.10. Derivadas direccionales.
1.2.11. Derivadas de orden superior.
1.2.12. Máximos y mı́nimos de funciones de dos variables.
1.3. Campos Vectoriales.
1.3.1. La derivada de un campo vectorial.
1.3.2. La matriz Jacobiana.
1.3.3. Ejemplos en dimensiones 1, 2 y 3.
1.3.4. Regla de la Cadena.
1.3.5. Ejemplos en dimensiones 1, 2 y 3.
1.3.6. Funciones inversas y funciones implı́citas.
1.3.7. Ejemplos en dimensiones 1, 2 y 3.
1.3.8. Divergencia y Rotacional.
1.4. Ejercicios y problemas.
2. Integración en dos y tres variables.
2.1. Integral de Riemann.
2.1.1. Definiciones básicas.

3
2.2. Existencia de la integral.
2.2.1. Integrabilidad.
2.2.2. Medida cero y contenido cero.
2.2.3. Criterio de integrabilidad para funciones discontinuas.
2.3. Propiedades básicas de la integral.
2.3.1. Linealidad y aditividad.
2.3.2. Teorema del Valor Medio.
2.4. El Teorema de Fubini.
2.5. Integrales dobles y triples.
2.5.1. Integrales dobles sobre regiones elementales.
2.5.2. Cambio del orden de integración.
2.5.3. Integrales triples.
2.5.4. Teorema del cambio de variables.
2.6. Ejercicios y problemas.
3. Integrales sobre Curvas y Superficies.
3.1. Integrales de lı́nea.
3.1.1. Integral de lı́nea de campos escalares.
3.1.2. Integral de lı́nea de campos vectoriales.
3.1.3. Teorema de Green.
3.2. Integrales de superficie.
3.2.1. Superficies parametrizadas y orientadas.
3.2.2. Integrales de superficie.
3.3. Ejercicios y problemas.

4
1: Derivación
1.1. Curvas.
1.1.1. Curvas parametrizadas.
Sea I un intervalo abierto de números reales. Una curva parametrizada en
Rn es una función que a cada número real t en I le asocia un vector de Rn . Si
α denota una curva definida en I, usamos α (t) para denotar el vector asociado
a t por la función α : I → Rn y se escribe la regla de correspondencia como

α (t) = (x1 (t) , . . . , xn (t)) ,

donde cada xi (t) es una función de una variable del cálculo elemental.

1.1.2. Derivada y vector tangente.


Se dice que esta curva es diferenciable en t = t1 si cada una de las funciones
componentes xi : I → R es diferenciable en t = t1 . Si la curva es diferenciable
definimos su derivada por
 
dα dx1 dxn
= ,..., ,
dt dt dt

la cual también se denota por α0 (t). Ver las referencias [1] y [2].

Ejemplo. La curva α : R → R3 definida por

α (t) = (cos t, sen t, t)

le asigna a cada número real t el vector (cos t, sen t, t), el cual se puede
identificar con el punto del espacio tridimensional que describe una hélice, pues
como x21 (t) + x22 (t) = 1 para todo valor de t, resulta que la proyección del punto
(cos t, sen t, t) sobre el plano xy es una circunferencia de radio 1 y como
z (t) = t, la altura crece conforme t aumenta. La derivada para cada t ∈ R es

α0 (t) = (−sen t, cos t, 1) .

A la derivada de una curva también se le denomina vector tangente o vector


velocidad, dependiendo si se quiere ver con los ojos del geómetra o con los del
fı́sico. En cualquier caso representa la razón de cambio de la función α(t).

La lı́nea tangente a una curva α en un punto correspondiente a t = t1 se


define como la lı́nea recta que pasa por el punto α (t1 ) en la dirección del

5
vector α0 (t1 ), si se cumple que α0 (t1 ) 6= 0. En los puntos de la curva donde la
derivada se anula, la lı́nea tangente no existe.

Ejemplo. Encontrar ecuaciones paramétricas para la lı́nea tangente a la


curva α : R → R2 definida por α(t) = (sen t, cos t) en t = π/3.

La derivada es α0 (t) = (cos t, −sen t). Por lo tanto la dirección es el vector



0 1 3
α (π/3) = ( , − ).
2 2

3 1
Como α(π/3) = ( 2 , 2) es el punto de la curva por donde pasa esta lı́nea
tangente, su ecuación es

r(t) = α(π/3) + t α0 (π/3),


√ ! √ !
3 1 1 3
= , +t , − ,
2 2 2 2
√ √ !
3 1 1 3
= + t, − t ,
2 2 2 2

de ahı́ que las ecuaciones paramétricas buscadas son:


√ √
3 1 1 3
x(t) = + t, y(t) = − t.
2 2 2 2

1.1.3. Propiedades de la derivada.


Como la derivada de una curva se define por las derivadas de sus funciones
componentes, las reglas de la derivación resultan ser similares a las del cálculo
ordinario en una variable.

Reglas de derivación de curvas. Sean α, α1 y α2 curvas diferenciables


definidas en el mismo intervalo I de números reales y f (t) una función
diferenciable real definida en I. Entonces la suma α1 (t) + α2 (t) y los
productos f (t)α1 (t), α1 (t) · α2 (t) son diferenciables en I y se cumplen las
siguientes reglas:
d dα1 (t) dα2 (t)
(α1 (t) + α2 (t)) = + ,
dt dt dt

d dα(t) df (t)
(f (t)α(t)) = f (t) + α(t),
dt dt dt
d dα2 (t) dα1 (t)
(α1 (t) · α2 (t)) = α1 (t) · + · α2 (t).
dt dt dt

6
Las demostraciones de todas las reglas de derivación anteriores son similares y
se basan en las correspondientes propiedades de la derivación de funciones de
una variable. Por ejemplo, para la segunda regla procedemos como sigue. Sean
f (t) una función real valuada diferenciable y

α (t) = (x1 (t) , . . . , xn (t))

una curva diferenciable, ambas definidas en un intervalo I de números reales.


Entonces por definición,

f (t)α(t) = (f (t)x1 (t), . . . , f (t)xn (t)) .

Derivando cada componente con respecto a t y aplicando la regla de la


derivada de un producto de funciones de una variable, resulta que
 
d dx1 (t) df (t) dxn (t) df (t)
(f (t)α(t)) = f (t) + x1 (t), . . . , f (t) + xn (t) .
dt dt dt dt dt
Usando ahora la regla de la suma de dos vectores, podemos expresar el lado
derecho como
   
dx1 (t) dxn (t) df (t) df (t)
f (t) , . . . , f (t) + x1 (t), . . . , xn (t) ,
dt dt dt dt
lo cual es
 
dx1 (t) dxn (t) df (t)
f (t) ,..., + (x1 (t), . . . , xn (t)),
dt dt dt
o bien,
dα(t) df (t)
f (t) + α(t).
dt dt

Si f (t) = c, una constante, entonces claramente se tiene que


d dα(t)
(c α(t)) = c .
dt dt

1.2. Campos escalares


1.2.1. Curvas y superficies de nivel.
Se define un campo escalar como una función de varias variables f : Rn → R,
definida por alguna regla de correspondencia que a cada punto (x1 , . . . , xn ) del
n-espacio Euclidiano le asocia un número real f (x1 , . . . , xn ). El conjunto de
nivel c de f se define por la imagen inversa de c, esto es,

f −1 (c) = {(x1 , . . . , xn ) ∈ Rn | f (x1 , . . . , xn ) = c} .

7
Para funciones de dos variables, los conjuntos de nivel son curvas en R2
definidas por ecuaciones del tipo

f (x1 , x2 ) = c,

mientras que para funciones de tres variables los conjuntos de nivel son
superficies en R3 definidas por ecuaciones de la forma

f (x1 , x2 , x3 ) = c.

Ver las referencias [1], [2] y [3].

Ejemplo. Las curvas de nivel de la función f (x, y) = x2 + y 2 son


circunferencias para c > 0, un punto (el origen) para c = 0 y no existen para
c < 0.

Ejemplo. Las superficies de nivel para f (x, y, z) = x2 + y 2 − z 2 son


hiperboloides para todo valor de c.

Ahora comenzaremos a estudiar la diferenciabilidad de funciones de varias


variables. Para definir la derivada de una función f (x1 , . . . , xn ) necesitamos el
concepto de subconjunto abierto de Rn , el cual generaliza la idea de ”cercanı́a”
en dimensiones superiores.

1.2.2. Conjuntos abiertos y cerrados.


Definición. Sea p un punto de Rn y ε > 0. La bola abierta de radio ε y
centro p es el subconjunto de Rn definido por

Bε (p) = {q ∈ Rn | kp − qk < ε} .

Ver las referencias [1] y [2].

Se puede imaginar a Bε (p) como el conjunto de todos los puntos de Rn que


están cercanos a p hasta una distancia menor que ε. Si cambiamos la
desigualdad kp − qk < ε en la definición de bola abierta por kp − qk ≤ ε,
obtenemos el concepto de bola cerrada. La esfera de radio ε con centro en p es
el conjunto

Sεn−1 (p) = {q ∈ Rn | kp − qk = ε} ,

donde el superı́ndice n − 1 es una indicación de la dimensión del conjunto, un


concepto de la topologı́a. Por ejemplo, la 2-esfera de radio 1 con centro en el
origen

Sε2 (0) = (x, y, z) ∈ R3 | x2 + y 2 + z 2 = ε2




8
es bidimensional en el sentido que los puntos que la conforman viven en una
superficie. La noción de conjunto abierto en Rn generaliza la idea de que
todos los puntos suficientemente cercanos a cada uno de sus puntos también
pertenecen al conjunto abierto.

Definición. Sea U un conjunto de puntos de Rn . Se dice que U es abierto, si


para cada uno de sus puntos p ∈ U existe una bola abierta Bε (p) con centro en
p de algún radio ε > 0 contenida en U .

Definición. Un conjunto de puntos A de Rn es cerrado si su complemento


Rn − A es abierto.

Definición. Un conjunto de puntos B de Rn es acotado si para todo punto


p ∈ B existe un número a > 0 tal que kpk ≤ a. En otras palabras: B es
acotado si existe una bola de radio a con centro en el origen que contiene al
conjunto B.

Ver las referencias [1], [2], [3] y [6].

Ejemplo. En el plano R2 , el primer cuadrante sin el eje x y sin el eje y es un


conjunto abierto. El eje x no es abierto como subconjunto de R2 , pues dado
cualquier punto del eje x no se puede encontrar un disco abierto con centro en
dicho punto y que esté contenido en el eje x. Similarmente, el intervalo de
números reales

(−1, 1) = {x ∈ R | −1 < x < 1}

es abierto en R, pero no es abierto en R2 .

Ejemplo. Sea U la bola abierta en Rn de radio a > 0 con centro en el origen.


Veamos que U es abierto en Rn . Para demostrarlo, tomemos cualquier punto
p de esta bola. Tenemos que kpk < a por definición. Ahora llamemos c a la
diferencia

c = a − kpk .

Si q es cualquier punto de Rn tal que kq − pk < c, es decir, q ∈ Bc (p), entonces


la desigualdad del triángulo y la ley transitiva implican lo siguiente:

kqk ≤ kq − pk + kpk < a − kpk + kpk = a,

es decir, q pertenece a la bola de radio a con centro en el origen, U . Por lo


tanto Bc (p) ⊂ U , probando con esto que U es un conjunto abierto de Rn .

1.2.3. Derivadas parciales.


Para una función f : U ⊂ Rn → R, definida en un conjunto abierto U por una
regla de correspondencia que le asocia a un punto (x1 , . . . , xn ) ∈ U un número

9
f (x1 , . . . , xn ), podemos tomar h suficientemente pequeño para tener
(x1 + h, x2 , . . . , xn ) contenido en U de manera que f esté definida en
(x1 + h, x2 , . . . , xn ) y ası́ tenga sentido formar el cociente

f (x1 + h, x2 , . . . , xn ) − f (x1 , x2 , . . . , xn )
.
h
Si existe el lı́mite de este cociente cuando h → 0, le llamaremos la derivada
parcial respecto a x1 y la denotaremos por cualquiera de los siguientes
sı́mbolos:
∂f
D1 f, , fx1 , Dx1 f,
∂x1
como mejor convenga a la claridad dependiendo del contexto.

En general, para cualquier variable xi , se define

∂f f (x1 , . . . , xi + h, . . . , xn ) − f (x1 , . . . , xi , . . . , xn )
= lim ,
∂xi h→0 h
de donde podemos obtener la siguiente interpretación: una derivada parcial
respecto a una de las variables es una derivada ordinaria cuando se consideran
como constantes las otras variables. En el caso bidimensional, tenemos que

∂f f (x + h, y) − f (x, y)
= lim ,
∂x h→0 h
∂f f (x, y + h) − f (x, y)
= lim ,
∂y h→0 h
si existen estos lı́mites.

Ver [1], [3], [4] y [6].

Ejemplo. Sea f (x, y) = sen xy. Entonces

∂f
(x, y) = (cos xy) x,
∂y
y de ahı́ que, por ejemplo,
∂f
(1, π) = (cos π) · 1 = −1.
∂y
Similarmente, es fácil ver que
∂f  π  3
3, = −√ .
∂y 4 2

10
Por otro lado,
∂f
(x, y) = (cos xy) y,
∂x
y
∂f
(1, π) = (cos π) · π = −π.
∂x

1.2.5. Gradiente.
Para una función de n variables, f (x1 , . . . , xn ), si existen todas las derivadas
parciales respecto a cada una de las variables x1 , . . . , xn , podemos formar un
vector con todas ellas. El vector
 
∂f ∂f ∂f
, ,...,
∂x1 ∂x2 ∂xn

es llamado el gradiente de f y se denota por gradf , o también por ∇f . Para


una función de dos variables,
 
∂f ∂f
∇f (x, y) = , .
∂x ∂y

Ver [1] y [2].

Ejemplo. Sea f (x, y) = x2 y 3 . Entonces

∇f (x, y) = 2xy 3 , 3x2 y 2 ,




ası́, por ejemplo,

∇f (1, 2) = (16, 12) .

El gradiente es un ejemplo de campo vectorial, pues le asocia un vector a cada


punto del dominio.

Usando las propiedades de la derivación en una variable es fácil ver que se


tiene el siguiente teorema.

Teorema. Sean f y g dos funciones definidas en un abierto U ⊂ Rn tales que


sus derivadas parciales respecto a todas las variables existen en cada punto de
U . Entonces

∇ (f + g) = ∇f + ∇g,

11
y

∇ (cf ) = c∇f

para todo número real c.

1.2.6. Diferenciabilidad.
Se conocen funciones que son discontinuas en un punto a pesar de que sı́
existen todas sus derivadas parciales respecto a todas sus variables en ese
punto. Por eso es necesario un concepto más fuerte de diferenciabilidad que la
mera existencia de las derivadas parciales, de manera que la diferenciabilidad
implique la continuidad. Las siguientes consideraciones van encaminadas hacia
esa meta. Sea f una función definida en un conjunto abierto U ⊂ Rn . Sea X
un punto de U . Para todos los vectores H tales que la norma kHk es pequeña,
con H 6= 0, el punto X + H también pertenece a U . Sin embargo, no tiene
sentido escribir
f (X + H) − f (X)
H
debido a que no existe la división por un vector. Veamos una manera de
definir diferenciabilidad que cumple con nuestra meta. Analicemos primero el
caso de una variable. En el primer curso de cálculo se define la derivada por

f (x + h) − f (x)
f 0 (x) = lim ,
h→0 h
si es que existe este lı́mite. En tal caso, hagamos

f (x + h) − f (x)
g(h) = − f 0 (x).
h
Entonces g(h) no está definida para h = 0, sin embargo,

lim g(h) = 0.
h→0

Se puede escribir

f (x + h) − f (x) = f 0 (x) h + hg (h) .

La ecuación anterior tiene sentido solamente cuando h 6= 0. Sin embargo, si


definimos g(0) = 0, entonces dicha ecuación es cierta también para h = 0. La
ventaja de esa ecuación es que ya no estamos dividiendo entre h y se vale para
toda h ∈ R, si la función es diferenciable. Vamos al caso multidimensional. Sea
f : U ⊂ Rn → R, donde U es abierto. Sean X ∈ U y H = (h1 , . . . , hn ) tal que
kHk es suficientemente pequeña como para que X + H ∈ U . Obsérvese que

X + H = (x1 + h1 , . . . , xn + hn )

12
es un punto cercano a X. Podemos decir que f es continua si la diferencia

f (X + H) − f (X)

tiende a cero cuando H tiende a cero. La condición adicional que hay que
pedir además de la existencia de todas las derivadas parciales respecto a todas
las variables se da en la siguiente definición.

Diferenciabilidad de campos escalares. Una función f : U ⊂ Rn → R es


diferenciable en un punto X del abierto U si existen todas las derivadas
parciales D1 f (X), . . . , Dn f (X) y si existe una función g (H) definida para
vectores H con kHk pequeña tal que lim g(H) = 0 y
H→0

f (X + H) − f (X) = ∇f (X) · H + kHk g(H).

Si f es diferenciable para cada punto de U decimos que f es diferenciable en U .

Ver [1], [2], [3], [4], [5] y [6].

En dos variables la ecuación de la definición anterior puede escribirse como


∂f ∂f
f (x + h, y + k) = f (x, y) + (x, y) h + (x, y) k + kHk g(H).
∂x ∂y

lo cual puede pensarse como una aproximación al valor de f (x + h, y + k)


mediante

∂f ∂f
f (x, y) + (x, y) h + (x, y) k
∂x ∂y

para pequeños valores de (h, k) ya que lim g(H) = 0.


(h,k)→(0,0)

Ahora podemos expresar la diferenciabilidad usando el hecho de que


lim g(H) = 0 para escribir tal condición en la siguiente forma: f es
H→0
diferenciable en X si existe ∇f (X) y

f (X + H) − f (X) − ∇f (X) · H
lim = 0.
H→0 kHk

1.2.7. Regla de la Cadena.


Dada una función f : U ⊂ Rn → R y una curva X(t) en Rn podemos formar
la composición

(f ◦ X) (t) = f (X (t))

13
obteniendo una función real de variable real, f ◦ X : R → R.

Ejemplo. Sean f (x, y) = ex sen(xy) y X(t) = t2 , t3 . Entonces
2
f (X(t)) = et sen(t5 ).

La regla de la cadena para este tipo de composiciones se enuncia y prueba a


continuación.

Regla de la Cadena (primera versión). Sean f : U ⊂ Rn → R


diferenciable en el abierto U y X : I ⊂ R → R una curva diferenciable en el
intervalo abierto I tal que X(t) ∈ U para toda t ∈ I. Entonces
f ◦ X : I ⊂ R → R es diferenciable y
d dX
(f ◦ X) (t) = ∇f (X(t)) ·
dt dt

Demostración. Consideremos la diferencia

K = K(t, h) = X(t + h) − X(t).

En términos de esta función K observemos primero que


f (X(t + h)) − f (X(t)) f (X(t) + K) − f (X(t))
= .
h h
Como f es diferenciable tenemos que, por definición,

f (X + K) − f (X) = ∇f (X) · K + kKk g(K),

donde

lim g(K) = 0.
K→0

Sustituyendo K obtenemos:
f (X(t + h)) − f (X(t)) ∇f (X (t)) · K + kKk g(K)
= ,
h h
X(t + h) − X(t) X(t + h) − X(t)
= ∇f (X (t)) · ±
g(K),
h h

y tomando el lı́mite cuando h → 0, resulta lo siguiente


d
f (X (t)) = ∇f (X (t)) · X 0 (t) ± kX 0 (t)k lim g(K).
dt h→0

Ahora, cuando h → 0 se tiene que K = [X(t + h) − X(t)] → 0, por lo tanto

lim g(K) = lim g(K) = 0.


h→0 K→0

14
De ahı́ que
d dX
(f ◦ X) (t) = ∇f (X(t)) ·
dt dt
tal como querı́amos demostrar. 

Notación: El final de una demostración será simbolizado (como arriba) por


.

Pongamos esta regla de la cadena en términos de las coordenadas. Si


X = (x1 , . . . , xn ), entonces

d(f (X(t))) ∂f dx1 ∂f dxn


= + ··· + .
dt ∂x1 dt ∂xn dt
Si f es una función de dos variables (x, y) lo anterior se escribe más
frecuentemente como

d(f (X(t))) ∂f dx ∂f dy
= + .
dt ∂x dt ∂y dt
Esto puede aplicarse a situaciones más generales donde x, y dependan de más
de una variable. Por ejemplo, si

x = ϕ(t, u), y = ψ(t, u)

son funciones diferenciables de las dos variables t, u, entonces la composición


de f (x, y) con ϕ, ψ puede escribirse como una función

g(t, u) = f (ϕ(t, u), ψ(t, u)).

Si mantenemos fija la variable u podemos calcular la derivada parcial de g


respecto a t utilizando la regla de la cadena:
∂g ∂f ∂x ∂f ∂y
= + .
∂t ∂x ∂t ∂y ∂t

Ejemplo. Sea f (x, y) = x2 + 2xy, y sean x = r cos θ, y = r sen θ. La


composición es

g (r, θ) = f (x (r, θ) , y (r, θ)).

Entonces

∂x ∂y
= cos θ, = sen θ,
∂r ∂r

15
∂x ∂y
= −r sen θ, = r cos θ,
∂θ ∂θ
y de ahı́ que
∂g ∂f ∂x ∂f ∂y
= + = (2x + 2y)(cos θ) + 2x(sen θ),
∂r ∂x ∂r ∂y ∂r
∂g ∂f ∂x ∂f ∂y
= + = (2x + 2y)(−r sen θ) + 2x(r cos θ).
∂θ ∂x ∂θ ∂y ∂θ
Si quisiéramos estas derivadas solamente en términos de r y θ, tendrı́amos que
sustituı́r x = r cos θ y y = r sen θ en las expresiones obtenidas.

Ejemplo. Puede ocurrir que x, y no se usen para denotar la primera y


segunda variables de una función f . Por ejemplo, si

u = f (x2 − y, xy),

∂u
entonces, para encontrar pongamos
∂x
s = x2 − y, t = xy.

Entonces, u = f (s(x, y), t(x, y)) y ası́,

∂u ∂f ∂s ∂f ∂t
= + ,
∂x ∂s ∂x ∂t ∂x
∂f ∂f
= 2x +y .
∂s ∂t
Similarmente,
∂u ∂f ∂s ∂f ∂t
= + ,
∂y ∂s ∂y ∂t ∂y
∂f ∂f
= − +x .
∂s ∂t
∂f ∂f
De las dos ecuaciones anteriores se pueden despejar las funciones ∂s y ∂t
resolviendo el sistema para obtener, por ejemplo,
 
∂f 1 ∂u ∂u
= + 2x .
∂t y + 2x2 ∂x ∂y

Ejemplo. Sea f (x, y, z) = g(x2 − 3zy + xz), donde g es una función


diferenciable de una variable. Entonces se puede escribir
∂f
= g 0 x2 − 3zy + xz (2x + z) ,

∂x

16
donde hemos denotado la derivada de g por g 0 como es usual en cálculo de una
dg
variable. No escribimos porque la letra x ya tiene otro significado en la
dx
expresión g x2 − 3zy + xz . Si queremos expresar la derivada de g como un
cociente diferencial en lugar de la ”prima”, podemos hacer

u = x2 − 3zy + xz

para tener f (x, y, z) = g(u(x, y, z)), y de ahı́,


∂f dg ∂u
= ,
∂x du ∂x
dg
= (2x + z) .
du

En general, si h(x, y, z) es una función de x, y, z, y g es una función de una


variable, podemos formar la composición

f (x, y, z) = g(h(x, y, z)),

y de ahı́,
∂f ∂h
= g 0 (h(x, y, z)) .
∂x ∂x


Ejemplo. Sea g(t, x, y) = f t2 x, ty . Haciendo

u = t2 x, v = ty,

podemos escribir

g(t, x, y) = f (u(t, x, y), v(t, x, y)),

y de ahı́ que
∂g ∂f ∂u ∂f ∂v
= + ,
∂t ∂u ∂t ∂v ∂t
= 2tx fu + y fv ,

donde hemos denotado las derivadas parciales de f con subı́ndices.

1.2.8. Planos tangentes a superficies de nivel.


Sea f (X) una función diferenciable de X = (x, y, z) ∈ R3 y sea c un número
real.

Definición. El conjunto de puntos Sc = X ∈ R3 | f (X) = c donde
∇f (X) 6= 0 es una superficie. En otras palabras: una superficie es un

17
conjunto de nivel de una función diferenciable de 3 variables donde no se anula
el gradiente.

Ver [2].
Decimos que una curva diferenciable X(t) vive en la superficie Sc si
f (X(t)) = c. Esto significa que todos los puntos de la curva satisfacen la
ecuación que define la superficie de nivel c. Para cualquier curva que vive en
una superficie de nivel, la regla de la cadena nos asegura que

∇f (X(t)) · X 0 (t) = 0.

Lo anterior tiene la siguiente consecuencia inmediata si X 0 (t) 6= 0: el gradiente


en un punto X(t 0 ) es ortogonal a cualquier vector tangente X’(t 0 ) de cualquier
curva X(t) que vive en una superficie de nivel. Lo anterior motiva la siguiente
definición.

Definición. Para una función diferenciable de tres variables f se define el


plano tangente a una superficie de nivel de f en un punto P por el plano que
pasa por P y es ortogonal al vector ∇f (P ), si este gradiente no se anula. Para
los puntos donde ∇f (P ) = 0, el plano tangente no está definido.

Ver [2] y [6].

La ecuación del plano tangente a una superficie de nivel en uno de sus puntos
P es entonces de la forma siguiente:

∇f (P ) · (X − P ) = 0.

Ejemplo. Encontrar el plano tangente a la superficie

x2 + y 2 + z 2 = 3

en el punto (1, 1, 1) .

Sea f (x, y, z) = x2 + y 2 + z√
2
. Entonces la superficie dada es el nivel 3 de f ,
una esfera de radio 3 con centro en el origen de R3 . Como
∇f (x, y, z) = (2x, 2y, 2z), vemos que en el punto P = (1, 1, 1) de esta esfera,
∇f (P ) = (2, 2, 2), luego la ecuación del plano tangente buscado es

(2, 2, 2) · (x − 1, y − 1, z − 1) = 0,
2x + 2y + 2z − 6 = 0.

1.2.9. Planos tangentes a gráficas de funciones.

18
Si z = g(x, y) define una función de dos variables, la gráfica de g se puede ver
como una superficie de nivel de la función de tres variables f definida por
f (x, y, z) = g(x, y) − z, y el plano tangente a la gráfica de g es el plano
tangente de la superficie de nivel cero de f .

Ejemplo. Encontrar el plano tangente a la superficie

z = x2 + y 2

en el punto (1, 2, 5).

Sea f (x, y, z) = x2 + y 2 − z. Entonces ∇f (x, y, z) = (2x, 2y, −1), y por lo


tanto, ∇f (1, 2, 5) = (2, 4, −1). Ası́ que la ecuación pedida es

(2, 4, −1) · (x − 1, y − 2, z − 5) = 0,
2x + 4y − z − 5 = 0.

Se puede dar una fórmula general para la ecuación del plano tangente a la
gráfica de una función de dos variables definida por z = f (x, y) como sigue.
Sea

F (x, y, z) = f (x, y) − z.

Entonces la gráfica es la superficie de nivel cero de F y ası́, el plano tangente


en un punto

(x0 , y0 , z0 ) , z0 = f (x0 , y0 )

de la gráfica de f está dado por:

∇F (x0 , y0 , z0 ) · (x − x0 , y − y0 , z − z0 ) = 0,

esto es,

(fx (x0 , y0 ), fy (x0 , y0 ), −1) · (x − x0 , y − y0 , z − z0 ) = 0,


fx (x0 , y0 ) (x − x0 ) + fy (x0 , y0 ) (y − y0 ) − (z − z0 ) = 0,

o bien,
∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 ) (x − x0 ) + (x0 , y0 ) (y − y0 ),
∂x ∂y
de donde se puede interpretar al plano tangente como la aproximación de
primer orden a la gráfica en el punto de tangencia, esto significa que el plano
tangente representa al polinomio de primer grado en dos variables que mejor
se aproxima a la gráfica de la función en dicho punto. Si la función es lineal,
ambas cosas coinciden. Si la función no es lineal y se quiere obtener una mejor
aproximación que la de primer orden, es necesario desarrollar un polinomio

19
cuadrático en dos variables. Haremos eso en una sección posterior cuando
hablemos del polinomio de Taylor de segundo orden. Podemos decir que el
plano tangente es el polinomio de Taylor de primer orden de la función.

La útima ecuación puede desarrollarse en la forma

ax + by + cz + d = 0,

donde los coeficientes son:


∂f ∂f
a = (x0 , y0 ) , b = (x0 , y0 ) , c = −1,
∂x ∂y
∂f ∂f
d = z0 − x0 (x0 , y0 ) − y0 (x0 , y0 ) .
∂x ∂y

También es posible obtener la ecuación del plano tangente usando derivadas


parciales respecto a otros pares de variables distintos del par (x, y).

Ejemplo. Encontrar el plano tangente a la superficie

x = e2y−z

en el punto (1, 1, 2).

Sea g(y, z) = e2y−z . Entonces la ecuación del plano tangente está dada por

∂g ∂g
x = g(y0 , z0 ) + (y0 , z0 ) (y − y0 ) + (y0 , z0 ) (z − z0 ),
∂y ∂z

donde (y0 , z0 ) = (1, 2). Luego,

∂g
= 2e2y−z ,
∂y
∂g
(1, 2) = 2e0 = 2,
∂y
∂g
= −e2y−z ,
∂z
∂g
(1, 2) = −e0 = −1,
∂z
y de ahı́ que el plano pedido sea

x = 1 + 2 (y − 1) + (−1) (z − 2) ,

o bien,

x − 2y + z − 1 = 0.

20
1.2.10. Derivadas direccionales.
Sea f una función diferenciable definida en un conjunto abierto U ⊂ Rn . Dado
un punto P ∈ U y un vector unitario V , la lı́nea recta que pasa por P con
dX
dirección V está parametrizada por X(t) = P + tV . Como = V , la regla
dt
de la cadena implica que
d
f (P + tV ) = ∇f (P + tV ) · V,
dt
luego, para t = 0 resulta
d
|t=0 f (P + tV ) = ∇f (P ) · V.
dt
Esta derivada representa la razón de cambio de la restricción de la función f a
la lı́nea recta que pasa por P con dirección V . Lo anterior nos induce a definir
el siguiente concepto.

Definición. La derivada direccional de una función f : U ⊂ Rn → R en un


punto P del abierto U en la dirección de un vector unitario V se define por
d
DV f (P ) = |t=0 f (P + tV ).
dt

Ver [1] y [2].


Por lo visto arriba resulta que esta derivada direccional se puede calcular por el
producto punto del vector dirección por el gradiente de la función en el punto.
Obsérvese que las derivadas parciales son las derivadas direccionales en las
direcciones de los vectores básicos unitarios ortogonales ei = (0, . . . , 1, . . . , 0),
donde el 1 se encuentra en el lugar i y los demás son ceros. Por ejemplo,
d
De1 f (P ) = |t=0 f (P + te1 ),
dt
d
= |t=0 f ((p1 , . . . , pn ) + t (1, 0, . . . , 0))
dt
d
= |t=0 (f (p1 + t, p2 , . . . , pn )) ,
dt
f (p1 + h, p2 , . . . , pn ) − f (p1 , p2 , . . . , pn )
= lim ,
h→0 h
∂f
= (p1 , . . . , pn ).
∂x1
∂f
En general, Dei f (P ) = (p1 , . . . , pn ).
∂xi

21
Ejemplo. Sean f (x, y) = x2 + y 3 , W = (1, 2). Encontrar la derivada

direccional de f en el punto (−1, 3) en la dirección de W . Como kW k = 5, el
vector unitario en la dirección de W es
 
1 1 2
V = √ W = √ ,√ .
5 5 5
El gradiente es

∇f (x, y) = 2x, 3y 2 ,


luego ∇f (−1, 3) = (−2, 27), por lo tanto


 
1 2
DV f (−1, 3) = (−2, 27) · √ , √ ,
5 5
−2 54 52
= √ +√ =√ .
5 5 5

Si la derivada direccional de una función f mide la razón de cambio de f en un


punto y en una dirección, ¿cuál es la dirección de máximo crecimiento de f a
partir de un punto? La respuesta es el gradiente en ese punto, si es que no se
anula, por lo siguiente. La derivada direccional está dada por

DV f (P ) = ∇f (P ) · V,

y como V es unitario,

DV f (P ) = k∇f (P )k kV k cos θ,
= k∇f (P )k cos θ,

donde θ es el ángulo entre ∇f (P ) y V . De ahı́ resulta que DV f (P ) alcanza su


mayor valor posible cuando cos θ es máximo. Como −1 < cos θ < 1, este
máximo es 1 y se alcanza cuando θ = 0◦ , es decir, cuando V está en la
dirección de ∇f (P ). Cuando θ = 180◦ se tiene la dirección de mı́nimo
crecimiento de la función, V = −∇f (P ). También se dice que −∇f (P ) es la
dirección de máximo decrecimiento de la función en P . Entonces la razón de
máximo crecimiento en P es la norma del gradiente en P y su negativo es la
razón de máximo decrecimiento. Por ejemplo, si T (x, y, z) mide la
temperatura en un espacio determinado, un mosquito que sienta calor en un
punto de su vuelo y quiera enfriarse lo más rápido posible, deberá moverse en
la dirección opuesta al gradiente de la temperatura en dicho punto, −∇T (P ).

1.2.11. Derivadas de orden superior.


Sea f : U ⊂ R2 → R una función de dos variables definida en un abierto U del
plano de coordenadas (x, y). Supóngase que existen sus derivadas parciales
respecto a x y a y en todo punto de U . Entonces Dx f y Dy f son funciones

22
definidas en el mismo abierto U , y como tales podemos preguntarnos si existen
sus derivadas parciales. En caso afirmativo las llamaremos derivadas parciales
de segundo orden, o también, segundas derivadas parciales. Puede haber
cuatro, las cuales se pueden denotar por:

∂2f
 
∂ ∂f
Dx Dx f = = = fxx ,
∂x ∂x ∂x2
∂2f
 
∂ ∂f
Dy Dx f = = = fxy ,
∂y ∂x ∂y ∂x
∂2f
 
∂ ∂f
Dx Dy f = = = fxy ,
∂x ∂y ∂x ∂y
∂2f
 
∂ ∂f
Dy Dy f = = = fyy ,
∂y ∂y ∂y 2
o también por D11 f, D12 f, D21 f, D22 f .

Ejemplo. Sea f (x, y) = sen(xy). Entonces


∂f ∂f
= y cos(xy), = x cos(xy),
∂x ∂y
y de ahı́ que
∂2f
= −y sen (xy) y = −y 2 sen (xy),
∂x2
∂2f
= −y sen (xy) x + cos(xy) = −xy sen(xy) + cos(xy),
∂y∂x
∂2f
= −x sen (xy) y + cos(xy) = −xy sen(xy) + cos(xy),
∂x∂y
∂2f
= −x sen (xy) x = −x2 sen (xy).
∂y 2
Obsérvese que las derivadas parciales mixtas son iguales, esto es,
∂2f ∂2f
= . Se puede demostrar que lo anterior se cumple siempre que
∂y∂x ∂x∂y
dichas derivadas parciales de segundo orden existan y sean continuas.

Similarmente, para una función de tres variables f (x, y, z) se puede hablar de


derivadas parciales de orden superior como por ejemplo,
∂2f
 
∂ ∂f
Dz Dx f = = = fzx ,
∂z ∂x ∂z ∂x
∂3f
  
∂ ∂ ∂f
Dx Dz Dx f = = = fxzx ,
∂x ∂z ∂x ∂x ∂z ∂x
etc...

23
Si existen todas las derivadas parciales hasta orden 3 y son continuas, entonces
también resultan iguales las mixtas, como por ejemplo,

∂3f ∂3f
= Dx Dz D z f = D z Dx D z f = D z Dz Dx f = ,
∂x ∂z 2 ∂z 2 ∂x
etc...
Se dice que una función es de clase C r para r = 0, 1, 2, . . . , si existen todas las
derivadas parciales hasta orden r y son continuas. La clase C 0 está formada
por las funciones continuas. Uno de los teoremas conocidos es que si una
función es de clase C k , entonces es de clase C r para toda r ≤ k. En particular,
si una función f es de clase C 1 (existen las primeras derivadas parciales y son
continuas) entonces es continua. Lo anterior se debe a dos hechos conocidos:

(1) si f es de clase C 1 entonces es diferenciable,


(2) la diferenciabilidad implica la continuidad.

Las pruebas de estos hechos requieren algunos conocimientos de álgebra lineal


que aún no han sido expuestos a los estudiantes de este curso. Por tal razón
no se dan aquı́. El lector interesado puede encontrar demostraciones en [1], [3]
y [4].

1.2.12. Máximos y mı́nimos de funciones de dos


variables
Definición. Para una función f definida en un abierto U del n-espacio
Euclidiano Rn , un punto p ∈ U se dice crı́tico si todas las primeras derivadas
parciales de f se anulan en p:
∂f ∂f ∂f
(p) = (p) = · · · = (p).
∂x1 ∂x2 ∂xn

Ver [1], [2], [3], [4] y [5].


2
+y 2 )
Ejemplo. Encontrar los puntos crı́ticos de f (x, y) = e−(x .

∂f 2 2 ∂f 2 2
Como = −2xe−(x +y ) , y = −2ye−(x +y ) , entonces el único punto
∂x ∂y
crı́tico es el (0, 0), ya que las exponenciales nunca se anulan.

Del cálculo I sabemos de la existencia de puntos donde la derivada es cero sin


que eso implique un máximo o un mı́nimo. Por ejemplo, el origen es un punto
crı́tico de f (x) = x3 , siendo este un punto de inflexión. Algo similar ocurre en
varias variables. Por ejemplo, para f (x, y) = x2 − y 2 tenemos que las primeras
derivadas parciales fx = 2x, fy = 2y, se anulan en el origen (0, 0). Sin

24
embargo, en la dirección x (cuando y = 0) se tiene un mı́nimo, mientras que en
la dirección y (cuando x = 0) se tiene un máximo. Luego no existe una bola
abierta Bε (0, 0) con centro en el origen tal que todos los valores de la función
sean positivos para todo punto de Bε (0, 0) ni tampoco son negativos para todo
punto de la misma bola. Se dice que el origen es un punto de inflexión de la
función f .

Definición. Sea f : U ⊂ Rn → R definida en un abierto U . Decimos que un


punto p ∈ U es un máximo local de f si existe una bola abierta Bε (p) de algún
radio ε > 0 tal que

f (p) ≥ f (x) ∀x ∈ Bε (p).

Análogamente, decimos que p es un mı́nimo local de f si existe alguna bola


abierta Bε (p) de algún radio ε > 0 tal que

f (p) ≤ f (x) ∀x ∈ Bε (p).

Si las anteriores desigualdades se cumplen para toda x en el dominio de f


entonces les llamaremos máximo global y mı́nimo global, respectivamente.

Ver [1], [2], [3], [4] y [5].

Ejemplo. Para f (x, y) = x2 + y 2 el origen es un mı́nimo global, mientras que


para f (x, y) = −x2 − y 2 , el origen es un máximo global.

Como ya sabemos, no todo punto crı́tico es un extremo (máximo o mı́nimo)


local, lo que sı́ se cumple siempre en dominios abiertos es que un extremo local
es un punto crı́tico, como vamos a demostrar enseguida.

Teorema. Sea f : U ⊂ Rn → R una función diferenciable definida en un


abierto U del n-espacio Euclidiano. Si p ∈ U es un máximo o mı́nimo local de
f , entonces p es un punto crı́tico.

Demostración. Sea v un vector distinto de cero. Para p ∈ U y t ∈ R


pequeño, p + tv pertenece al abierto U . Supongamos que p es un máximo local
de f . Entonces existe ε > 0 tal que para toda t ∈ (−ε, ε),

f (p) ≥ f (p + tv)

en cualquier dirección v. Sea g : (−ε, ε) → R definida por

g(t) = f (p + tv).

Como g es la composición de una función diferenciable con una curva


diferenciable (la recta p + tv), la regla de la cadena implica que g es
diferenciable y

g 0 (t) = ∇f (p + tv) · v,

25
además, g(0) = f (p) ≥ g(t) para toda t ∈ (−ε, ε), luego g tiene un máximo
local en t = 0. Por cálculo I sabemos que g 0 (0) = 0 y de ahı́ que

∇f (p) · v = 0

para todo vector v. Por lo tanto ∇f (p) es el vector cero, es decir, todas las
derivadas parciales de f se anulan en el punto p. Lo mismo ocurre si p es un
mı́nimo local de f . 

Una consecuencia inmediata del teorema anterior es la siguiente: si existen


máximos o mı́nimos locales de una función en un abierto, se encuentran entre
los puntos crı́ticos.

Ahora, un criterio que ayude a determinar la naturaleza de los puntos crı́ticos


dentro de un dominio abierto de una función de dos variables se basa en el
polinomio de Taylor de segundo orden. En el cálculo de funciones de una
variable el teorema de Taylor afirma que una función diferenciable de clase C r
se puede aproximar en un punto interior a de su dominio abierto por
(r−1)
0 f (2) (a) 2 f (a) r−1
f (a + h) = f (a) + f (a)h + h + ··· + h + R,
2! (r − 1)!

donde R es llamado el residuo en esta aproximación a f por un polinomio de


grado r − 1 en la vecindad de un punto a. Veamos cómo podemos generalizar
esta fórmula para funciones de dos variables. Sean p = (a, b) y H = (h, k), con
p en un abierto U ⊂ R2 donde está definida una función f de clase C r , r ≥ 3.
Sea

g(t) = f (p + tH) = f (a + th, b + tk)

para t ∈ [0, 1], suponiendo que p + tH ∈ U para estos valores de t. Entonces

g(1) = f (p + H) y g(0) = f (P ).

Podemos aplicar el teorema de Taylor en una variable a la función g para


obtener:
g 00 (0)
g(1) = g(0) + g 0 (0) + + · · · + R.
2!
Hagamos ahora

x = a + th, y = b + tk.

Por la regla de la cadena,


∂f ∂x ∂f ∂y ∂f ∂f
g 0 (t) = + = h+ k.
∂x ∂t ∂y ∂t ∂x ∂y

26
Para la segunda derivada, debemos encontrar la derivada respecto a t de cada
una de las funciones fx y fy . Aplicando nuevamente la regla de la cadena,
∂ 2 f dx ∂ 2 f dy
 
d ∂f
= +
dt ∂x ∂x2 dt ∂y ∂x dt
2
∂ f ∂2f
= h + k.
∂x2 ∂y ∂x
Similarmente,
∂2f ∂2f
 
d ∂f
= h + 2 k.
dt ∂y ∂x ∂y ∂y
Usando lo anterior, resulta:
 2
∂2f
 2
∂2f
 
∂ f ∂ f
g 00 (t) = h h + k + k h + k
∂x2 ∂y ∂x ∂x ∂y ∂y 2
∂2f ∂2f ∂2f
= h2 2 + 2hk + k2 2 .
∂x ∂x ∂y ∂y
En consecuencia,

1
fxx (a, b)h2 + 2fxy (a, b)hk + fyy (a, b)k 2 +R,

f (a+h, b+k) = f (a, b)+fx (a, b)h+fy (a, b)k+
2
donde R es el residuo.

Si p = (a, b) es un punto crı́tico, las primeras derivadas parciales se anulan, de


ahi que
1
fxx (a, b)h2 + 2fxy (a, b)hk + fyy (a, b)k 2 + R.

f (a + h, b + k) − f (a, b) =
2
De lo anterior vemos que la forma cuadrática
Q = fxx (a, b)h2 + 2fxy (a, b)hk + fyy (a, b)k 2
es importante para determinar el signo de la diferencia
f (a + h, b + k) − f (a, b), lo cual puede dar información acerca de la naturaleza
del punto crı́tico (a, b). Por ejemplo, si
f (a + h, b + k) ≤ f (a, b)
para todo punto (h, k) suficientemente cercano al punto crı́tico (a, b), entonces
(a, b) es un máximo local de f . Si la desigualdad es ≥ en lo anterior, (a, b) es
un mı́nimo local de f .

Pongamos las segundas derivadas parciales en un arreglo matricial de 2 × 2


como sigue:
 
fxx fxy
.
fyx fyy

27
Si f es de clase C 3 al menos, fxy = fyx . En tal caso llamemos ∆ al
determinante de esta matriz:
2
∆ = fxx fyy − fxy fyx = fxx fyy − fxy .

Esta función, llamada el hessiano de f es muy útil en el siguiente criterio para


determinar la naturaleza de los puntos crı́ticos de una función de dos variables.

Criterio de Máximos y Mı́nimos. Sea f : U ⊂ R2 → R una función de


clase C r , r ≥ 3, definida en un abierto U y sea p ∈ U un punto crı́tico de f .
Entonces:

(i) fxx (p) < 0 y ∆(p) > 0 =⇒ p es un máximo local de f,


(ii) fxx (p) > 0 y ∆(p) > 0 =⇒ p es un mı́nimo local de f,
(iii) ∆(p) < 0 =⇒ p es un punto de inflexión de f.

Cuando ∆(p) = 0 este criterio no da información.

Demostración. Hagamos a11 = fxx (p), a12 = fxy (p) = fyx (p), a22 = fyy (p).
Entonces, como ya vimos, para cualquier punto (h, k) suficientemente cercano
a p = (a, b), podemos decir que
1
f (a + h, b + k) − f (a, b) ∼ a11 h2 + 2a12 hk + a22 k 2 ,

=
2
y de ahi que el signo de la diferencia f (a + h, b + k) − f (a, b) está determinado
por el signo de la forma cuadrática Q = a11 h2 + 2a12 hk + a22 k 2 . Ahora,
factorizando y completando cuadrados,
 
2a12 a22 2
a11 h2 + 2a12 hk + a22 k 2 = a11 h2 + hk + k ,
a11 a11
a2 a2 2 a22 2
 
2a12
= a11 h2 + hk + 212 k 2 − 12 k + k ,
a11 a11 a211 a11
" 2 #
a12 2 k2
= a11 h+ k + (a11 a22 − a12 ) 2 .
a11 a11

De donde vemos que Q > 0 si a11 > 0 y a11 a22 − a212 > 0, mientras que Q < 0
si a11 < 0 y a11 a22 − a212 > 0. Esto prueba los incisos (i) y (ii). Dejamos como
ejercicio el resto de la prueba. 

Para finalizar esta sección vamos a enunciar un teorema importante para


completar la teorı́a de máximos y mı́nimos en varias variables, cuya prueba
requiere algunos conocimientos de topologı́a por lo cual no la daremos aquı́.

Teorema. Sea f : A ⊂ Rn → R una función continua definida en un conjunto


cerrado y acotado A. Entonces f alcanza su máximo y su mı́nimo globales en
A.

28
Ası́, cuando se están buscando los extremos de una función dada, primero se
deben encontrar los puntos crı́ticos en el interior abierto del dominio de la
función. Si un máximo o mı́nimo locales ocurre en este interior abierto,
sabemos que debe estar entre estos puntos crı́ticos. Luego, se deben investigar
los puntos de la frontera del dominio de la función. Generalmente, el número
de variables en la frontera puede reducirse mediante alguna parametrización.
Entonces puede aplicarse la técnica de puntos crı́ticos a la frontera en un
problema de menos dimensiones.
2 2
Ejemplo. Sea f (x, y) = e−(x +y ) . Esta función tiende a cero cuando (x, y) se
aleja cada vez más del origen. Considérese alguna 2-bola cerrada B̄R (0, 0) del
plano del dominio de f con centro en el origen (0, 0) y radio R grande. Por el
criterio de máximos y mı́nimos sabemos que f alcanza su máximo en esta bola
cerrada (y acotada por R). Como los valores de la función en la frontera de la
bola son pequeños, se deduce que este máximo debe ser un punto del interior,
esto es, de la bola abierta BR (0, 0). De ahı́ que este máximo debe ser un
punto crı́tico. Como
∂f 2
+y 2 )
= −2xe−(x ,
∂x
∂f 2
+y 2 )
= −2ye−(x ,
∂y

resulta que el único punto crı́tico es el origen (0, 0). Por lo tanto la función
alcanza su máximo global en el (0, 0) y vale f (0, 0) = 1. El mı́nimo global en
esta bola cerrada de radio R es, debido a la simetrı́a de la función respecto al
2
origen, el valor en cualquier punto de la frontera, esto es, e−R . Si extendemos
el dominio a todo el plano R2 , vemos que esta f no tiene mı́nimo, pues
2
lim e−R = 0.
R→∞

1.3. Campos Vectoriales.


1.3.1. La derivada de un campo vectorial.
Comenzaremos esta sección dando una interpretación distinta de la
diferenciación de una función real-valuada definida en un conjunto abierto del
n-espacio, f : U ⊂ Rn → R, como sigue. Anteriormente usamos el gradiente
∇f en un punto X ∈ U para decir que f es diferenciable en X si se cumple que

f (X + H) − f (X) = ∇f (X) · H + kHk g(H)

para H pequeño donde lim g(H) = 0.


H→0
Ahora, el producto punto ∇f (X) · H se puede interpretar, si se escribe al
vector H = (H1 , . . . , Hn ) como vector columna, como el siguiente producto de
matrices:

29
 
H1
(D1 f (X) · · · Dn f (X))  ...  ,
 

Hn
∂f
donde Di f =
.
∂xi
Con esta interpretación podemos decir que f es diferenciable si existe una
matriz A de 1 × n y una función g de manera que, para vectores H de norma
pequeña, se puede escribir
f (X + H) − f (X) = AH + kHk g(H),
donde lim g(H) = 0, y A = (D1 f (X) · · · Dn f (X)).
H→0

En el caso más general de una función F : U ⊂ Rn → Rm , que es llamado un


campo vectorial se da la siguiente

Diferenciabilidad de campos vectoriales. Una función


F : U ⊂ Rn → Rm de un abierto U de Rn es diferenciable en X ∈ U si
existe una matriz A de m × n y existe una función G definida para vectores H
de norma pequeña, tales que
F (X + H) − F (X) = AH + kHk g(H),
donde lim G(H) = 0.
H→0

Ver [2], [3], [4] y [6].

1.3.2. La matriz Jacobiana.


En cursos más avanzados de cálculo se ve que la matriz A que entra en la
definición de diferenciabilidad de campos vectoriales, está determinada de
manera única por lo que se llama la Jacobiana de F , la cual es la matriz de
las derivadas parciales de todas las m funciones componentes de F respecto a
todas las n variables. Si se escribe F como
F (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ) , . . . , fm (x1 , . . . , xn )) ,
entonces la matriz Jacobiana de F se define por:
∂f1 ∂f1 ∂f1
 
 ∂x1 ···
 ∂x2 ∂xn  
 
 ∂f ∂f2 ∂f2   
 = ∂fi
2
···
 
JF (X) = 
 ∂x1 ∂x2 ∂xn 
 . ∂xj 1≤i≤m,
 .. .. ..  1≤j≤n
 . . 
 ∂fm ∂fm ∂fm 
···
∂x1 ∂x2 ∂xn

30
donde cada una de las derivadas parciales está evaluada en X. En el caso de
un campo vectorial de R2 en R2 , definido por F (x, y) = (f (x, y) , g(x, y)), la
matriz Jacobiana es
∂f ∂f
 
 ∂x ∂y 
JF (x, y) =  .
 
 ∂g ∂g 
∂x ∂y

1.3.3. Ejemplos en dimensiones 1, 2 y 3.


Ejemplo. Sea F : R2 → R2 definida por

F (x, y) = x2 + y 2 , exy = (f (x, y), g(x, y)) .




La matriz Jacobiana JF (x, y) es

∂f ∂f
 
 ∂x ∂y   
2x 2y
= .
 
x
ye xey

 ∂g ∂g 
∂x ∂y

Ası́, por ejemplo, para X = (1, 1), encontramos


 
2 2
JF (1, 1) = .
e e

Ejemplo. Sea F : R2 → R3 definida por

F (x, y) = xy, sen x, x2 y .




La matriz Jacobiana JF (x, y) es


 
y x
 cos x 0  .
2xy x2

Luego, para X = (π, π/2), tenemos


 
π/2 π
JF (π, π/2) =  −1 0  .
π2 π2

31
Ejemplo. Sea F : R3 → R3 definida por

F (x, y, z) = (x + y + z, xy + xz + yz, xyz) .

La matriz Jacobiana JF (x, y, z) es


 
1 1 1
 y + z x + z x + y .
yz xz xy

Luego, para X = (1, −1, 0), tenemos


 
1 1 1
JF (1, −1, 0) =  −1 1 0  .
0 0 −1

A la matriz Jacobiana de una función f : Rn → Rm se le llama también la


derivada de f y se denota por Df . Se puede decir que la derivada, en el caso
más general, es una matriz de m × n. Para campos escalares es la matriz de
1 × n representada por el vector gradiente. Para funciones reales de variable
real es la matriz de 1 × 1 definida por el número real asociado a la derivada del
cálculo elemental.

1.3.4. Regla de la Cadena.


En la sección de campos escalares vimos la regla de la cadena para la
composición f ◦ c de una curva c : I ⊂ R → Rn seguida de un campo escalar
f : Rn → R, y encontramos fórmulas a partir de ahı́ para expresar derivadas de
composiciones más generales. Dichas fórmulas se deducen del caso más
general, que puede enunciarse como sigue.

Regla de la Cadena General. Sean f : U ⊂ Rn −→ Rm y


g : V ⊂ Rm −→ Rp dos funciones tales que f (U ) ⊂ V de tal manera que g ◦ f
está definida. Si f es diferenciable en x0 y g es diferenciable en f (x0 ),
entonces g ◦ f es diferenciable en x0 y se cumple que:

D (g ◦ f ) (x0 ) = Dg (f (x0 )) Df (x0 ),

donde el lado derecho es el producto de las matrices jacobianas


correspondientes.

1.3.5. Ejemplos en dimensiones 1, 2 y 3.


Corolario. Sea g (x, y, z) = (u (x, y, z) , v (x, y, z) , w (x, y, z)) una
transformación diferenciable de un conjunto abierto de R3 en R3 y sea

32
f : R3 −→ R diferenciable. Si h(x, y, z) = f (u (x, y, z) , v (x, y, z) , w (x, y, z)),
entonces
∂h ∂f ∂u ∂f ∂v ∂f ∂w
= + + ,
∂x ∂u ∂x ∂v ∂x ∂w ∂x
∂h ∂h
con fórmulas similares para , . Es común abusar de la notación y
∂y ∂z
∂f ∂h
escribir para , por ejemplo.
∂x ∂x
Demostración. La prueba se sigue de la Regla de la Cadena y del producto
de las matrices jacobianas correspondientes a las funciones involucradas:

Dh(x, y, z) = Df (u, v, w)Dg(x, y, z),

que es el producto de matrices siguiente:


∂u ∂u ∂u
 
 ∂x ∂y ∂z 
 
    
∂h ∂h ∂h ∂f ∂f ∂f  ∂v ∂v
 ∂v 
= ,

∂x ∂y ∂z ∂x ∂y ∂z 

∂u ∂v ∂w   
 
 ∂w ∂w ∂w 
∂x ∂y ∂z
de donde resultan las fórmulas. 

El lector puede comprobar que la regla de la cadena estudiada en la sección de


campos escalares es un caso particular de la Regla de la Cadena General.

Ejemplo. Para f (u, v, w) = u2 + v 2 − w, donde u = x2 y, v = y 2 , w = e−xz ,


se tiene que

h (x, y, z) = f (u (x, y, z) , v(x, y, z), w(x, y, z))


= x4 y 2 + y 4 − e−xz .

Ası́,
∂h
= 4x3 y 2 + ze−xz .
∂x
Por otro lado,
∂f ∂u ∂f ∂v ∂f ∂w
+ + = 2u(2xy) + 2v · 0 + ze−xz
∂u ∂x ∂v ∂x ∂w ∂x
2x2 y (2xy) + ze−xz

=
= 4x3 y 2 + ze−xz ,

33
con lo cual verificamos la validez de regla de la cadena para estas funciones.
 
Ejemplo. Dadas f (x, y) = x2 + 1, y 2 y g(u, v) = u + v, u, v 2 , calcular
la derivada de g ◦ f en el punto (1, 1).

∂g1 ∂g1
 
 ∂u ∂v 
   

 ∂g2
 1 1
∂g2 
= 1
Dg(u, v) = 
 ∂u 0 ,
 ∂v  0 2v
 
 ∂g ∂g 
3 3
∂u ∂v
y
 
2x 0
Df (x, y) = .
0 2y

Entonces resulta
   
1 1   2 2
2 0
D(g ◦ f )(1, 1) = Dg(2, 1)Df (1, 1) =  1 0  = 2 0 .
0 2
0 2 0 4

34
1.3.6. Funciones inversas y funciones implı́citas.
Sea F : U ⊂ Rn → Rn una función definida en un abierto U mediante

F (X) = (f1 (X), . . . , fn (X)).

Si todas las derivadas parciales de todas las funciones componentes fi existen


y son continuas, se dice que F es de clase C 1 .

Definición. Una función F : U ⊂ Rn → Rn de clase C 1 en un abierto U se


dice que es invertible en U si la imagen F (U ) es un abierto V y si además
existe una función G : V → U de clase C 1 tal que G es la función inversa de F :

G◦F : U → U es la identidad en U,
F ◦ G : V → V es la identidad en V.

Ver [5] y [6].

Ejemplo. Sea A un vector fijo y sea F : Rn → Rn la traslación por A, esto es,

F (X) = X + A.

Entonces F es invertible con inversa G(Y ) = Y − A.

Ejemplo. Sea U = {(r, θ) | r > 0, 0 < θ < π}. Sea

F (r, θ) = (x, y) = (r cos θ, r sen θ).

La imagen de U es el medio plano superior

H = {(x, y) | y > 0}.

De las ecuaciones x = r cos θ, y = r sen θ podemos encontrar las funciones


componentes de la inversa G:
p
r = x2 + y 2 , θ = cos−1 (x/r) ,

de manera que
p 
F −1 (x, y) = x2 + y 2 , cos−1 (x/r) .

Puede suceder que una función no sea invertible en todo su dominio aunque sı́
lo sea localmente alrededor de un punto P de su dominio U . Se dice que
F : U ⊂ Rn → Rn es localmente invertible en P si existe un conjunto abierto
U1 ⊂ U conteniendo P de tal manera que F sea invertible en U1 .

35
Ejemplo. Si vemos a la función F (r, θ) = (r cos θ, r sen θ) del ejemplo
anterior como una función del plano R2 en sı́ mismo, entonces F no es
invertible en todo R2 , sin embargo, es localmente invertible alrededor de todo
punto distinto del origen.

En muchos casos puede resultar imposible encontrar explı́citamente las


fórmulas que definen a la función inversa, aunque existe una manera de saber
si existe una inversa local, como se enuncia a continuación.

Teorema de la Función Inversa. Sea F : U ⊂ Rn → Rn una función de


clase C 1 . Si el determinante Jacobiano de F en un punto P ∈ U es distinto de
cero, entonces F es localmente invertible en P .

La prueba se da en cursos más avanzados de cálculo. Ver, por ejemplo, [6].


Aquı́ solamente haremos algunas observaciones y veremos algunos ejemplos.
Del álgebra lineal se sabe que si el determinante de una matriz cuadrada es
distinto de cero, entonces la matriz es invertible. En consecuencia, si el
determinante Jacobiano no se anula en P , resulta invertible la matriz
Jacobiana, esto es, la derivada es invertible. Podemos entonces reformular el
Teorema de la Función Inversa diciendo que si la derivada DF (P ) es invertible
en un punto P , entonces F es localmente invertible en P . Normalmente es
muy fácil determinar cuándo se anula un determinante, luego el Teorema de la
Función Inversa nos da un criterio simple para la invertibilidad local.

Aún cuando sea imposible encontrar explı́citamente la función inversa F −1


siempre se puede hallar la derivada de F −1 , si existe, por una sencilla fórmula.

Supongamos que F : U ⊂ Rn → V ⊂ Rn tiene una inversa G : V → U .


Entonces G ◦ F = I, la identidad en U . Como la derivada de la identidad es la
identidad, la regla de la cadena nos permite escribir lo siguiente:

DG(F (X)) · DF (X) = I

para toda X ∈ U . Sea Y = F (X) y multipliquemos ambos lados de la ecuación


anterior por la matriz inversa de la derivada de F en X para obtener que
−1
D(F −1 )(Y ) = (DF (X)) ,

esto es, la derivada de la inversa es la inversa de la derivada.

Ejemplo. Sea F (x, y) = (ex cos y, ex sen y). La matriz Jacobiana es


 x
e cos y −ex sen y

JF (x, y) = ,
ex sen y ex cos y

con determinante

det JF (x, y) = ex 6= 0

36
para toda x, luego F es localmente invertible en (x, y) para toda x, y.

Ejemplo. Sea U ⊂ R2 abierto y sea f : U → R de clase C 1 . Sea (a, b) ∈ U y


∂f
supongamos que (a, b) 6= 0. Sea F : U ⊂ R2 → R2 definida por
∂y

F (x, y) = (x, f (x, y)).

Se tiene que
 
1 0
JF (x, y) =  ∂f ∂f  ,
∂x ∂y

luego la matriz jacobiana


 
1 0
JF (a, b) =  ∂f ∂f 
(a, b) (a, b)
∂x ∂y

tiene determinante
∂f
det JF (a, b) = (a, b) 6= 0.
∂y

Entonces, el Teorema de la Función Inversa nos garantiza que F (x, y) es


localmente invertible en (a, b).

Vamos a usar el resultado del ejemplo anterior para estudiar las funciones
implı́citas.

Sea f : U ⊂ R2 → R de clase C 1 en un abierto U con f (a, b) = c. Nos


preguntamos por la existencia de una función diferenciable y = ϕ(x) definida
alrededor de x = a de modo que ϕ(a) = b y f (x, ϕ(x)) = c para toda x
suficientemente cerca de a. Si tal función existe, decimos que y = ϕ(x) está
determinada implı́citamente por f (x, y).

Teorema de la Función Implı́cita. Sean U ⊂ R2 abierto y f : U → R de


∂f
clase C 1 en U . Sea (a, b) ∈ U y supongamos que (a, b) 6= 0 con f (a, b) = c.
∂y
Entonces existe una función implı́cita y = ϕ(x) de clase C 1 en algún intervalo
abierto conteniendo a tal que ϕ (a) = b y f (x, ϕ(x)) = c.

Demostración. Por un ejemplo anterior ya sabemos que


F (x, y) = (x, f (x, y)) es localmente invertible en (a, b). Obsérvese que
F (a, b) = (a, c). Si la función inversa de F se escribe como

G(u, v) = (x, y),

37
tenemos que

F (x, y) = (u, v) = (x, f (x, y)) ,

de donde

u = x,
v = f (x, y),

son las ecuaciones que definen a F . Como ya sabemos que existe la inversa de
F , estas ecuaciones pueden invertirse, dando lugar a las ecuaciones que definen
a la inversa local G, las cuales podemos escribir ası́:

x = u,
y = g(u, v),

para alguna función g de clase C 1 , obteniendo G(u, v) = (u, g(u, v)) en algún
abierto del plano.
Si definimos ϕ(x) = g(x, c) tenemos, por un lado que

F (x, ϕ(x)) = F (x, g(x, c)) = F (G(x, c)) = (x, c),

mientras que, por otro lado,

F (x, ϕ(x)) = (x, f (x, ϕ(x))).

En consecuencia,

f (x, ϕ(x)) = c

donde ϕ es de clase C 1 en algún intervalo abierto alrededor de a. Además,


como G(a, c) = F −1 (a, c) = (a, b), tenemos que g(a, c) = b = ϕ(a). 

Ejemplo. Sea f (x, y) = x2 + y 2 y sea (a, b) = (1, 1). Entonces


∂f ∂f
c = f (1, 1) = 2. Tenemos (x, y) = 2y, por tanto (1, 1) = 2 6= 0. Por el
∂y ∂y
Teorema de la Función Implı́cita, existe y = ϕ(x) definida implı́citamente
alrededor de x = 1. Aquı́ podemos, además, resolver explı́citamente para
encontrar
p
y = 2 − x2 .

Ejemplo. Sea f (x, y) = x2 y + 3y 3 x4 − 4. Tomemos (a, b) = (1, 1) de modo


∂f
que f (a, b) = 0. Entonces (x, y) = x2 + 9y 2 x4 , y resulta
∂y
∂f
(1, 1) = 10 6= 0,
∂y

38
luego existe una función implı́cita y = ϕ(x), aunque no hay un modo fácil de
hallarla. Sin embargo, derivando la ecuación f (x, y) = 0 sabiendo que y es
una función diferenciable de x, encontramos que

2xy + x2 y 0 + 12y 3 x3 + 9y 2 y 0 x4 = 0,

de donde podemos despejar la derivada y 0 para obtener

2xy + 12y 3 x3
ϕ0 (x) = y 0 = − .
x2 + 9y 2 x4
Entonces, por ejemplo el valor de la derivada se puede hallar en cualquier
punto, aún sin conocer la función explı́cita. Por ejemplo,
7
ϕ0 (1) = − .
5

1.3.8. Divergencia y Rotacional.


Ahora veremos dos operaciones básicas que se pueden hacer con un campo
vectorial F = F1 i + F2 j + F3 k. Una es la divergencia, definida como sigue:
∂F1 ∂F2 ∂F3
divF = + + .
∂x ∂y ∂z
Una notación muy usada en las aplicaciones a las ciencias fı́sicas es la
siguiente. Si denotamos por ∇ (léase nabla) al operador

∂ ∂ ∂
∇=i +j +k ,
∂x ∂y ∂z
entonces la divergencia se puede denotar por ∇ · F , como si fuera un producto
punto. Una de las interpretaciones fı́sicas de la divergencia de un campo
vectorial tiene que ver con la razón a la cual se está expandiendo el flujo
determinado por el campo. Por ejemplo, si F (x, y, z) = xi + yj + zk representa
el campo de velocidad de un fluido, entonces divF = 3, lo cual significa que el
fluido se expande a una razón de 3 unidades cúbicas por unidad de volumen,
por unidad de tiempo.

El otro producto que se puede obtener entre el operador ∇ y un campo


vectorial F = F1 i + F2 j + F3 k es el rotacional, definido por

     
∂F3 ∂F2 ∂F1 ∂F3 ∂F2 ∂F1
rot F = − i+ − j+ − k,
∂y ∂z ∂z ∂x ∂x ∂y

39
el cual se puede recordar más fácilmente si lo escribimos usando al operador ∇
como si se hiciera el producto cruz con el campo:

i j k



∂ ∂ ∂
rot F = ∇ × F = .

∂x ∂y ∂z


F F F
1 2 3

Ejemplo. Sea F (x, y, z) = xi + xyj + k. Entonces

i j k



∂ ∂ ∂
∇×F = = yk.

∂x ∂y ∂z


x xy 1

Existen muchas propiedades que cumplen estas operaciones. Una de ellas la


probamos a continuación.

Teorema. Para toda función f (x, y, z) real-valuada de clase C 2 se cumple que

∇ × (∇f ) = 0,

esto es, el rotacional de un gradiente es cero.

Demostración. Es un cálculo directo:



i j k


∂ ∂ ∂

∇ × (∇f ) = ∂x ∂y ∂z



∂f ∂f ∂f

∂x ∂y ∂z

 2
∂2f
 2
∂2f
 2
∂2f
  
∂ f ∂ f ∂ f
= − i+ − j+ − k,
∂y ∂z ∂z ∂y ∂z ∂x ∂x ∂z ∂x ∂y ∂y ∂x
lo cual se anula debido a la igualdad entre todas las derivadas parciales mixtas
de segundo orden para una función f (x, y, z) de clase C 2 .

Otra propiedades básicas se enlistan a continuación, donde las letras


minúsculas f, g denotan campos escalares y las mayúsculas F, G denotan
campos vectoriales.

40
1. ∇(f + g) = ∇f + ∇g
2. ∇(cf ) = c∇f , para una constante c
3. ∇(f g) = f ∇g + g∇f
4. ∇(f /g) = (g∇f − f ∇g) /g 2 , donde no se anule g
5. ∇ · (F + G) = ∇ · F + ∇ · G
6. ∇ × (F + G) = ∇ × F + ∇ × G
7. ∇ · (f F ) = f (∇ · F ) + F · (∇f )
8. ∇ · (F × G) = G(∇ × F ) − F · (∇ × G)
9. ∇ · (∇ × F ) = 0
10. ∇ × (f F ) = f (∇ × F ) + (∇f ) × F

Ejemplo. Sea r = xi + yj + zk. Si denotamos por r a krk, encontremos ∇r y


∇ · (rr).

Se tiene que
 
∂r ∂r ∂r
∇r = , , .
∂x ∂y ∂z
p
Ahora, como r = krk = x2 + y 2 + z 2 , resulta que para r 6= 0,
∂r x x
=p = .
∂x x2 + y 2 + z 2 r

Entonces
x y z  r
∇r = , , = .
r r r r
Para encontrar ∇ · (rr) usamos la fórmula 7 de arriba para escribir

∇ · (rr) = r (∇ · r) + r · (∇r),
∂x ∂y ∂z
donde ∇ · r = + + = 3. Luego
∂x ∂y ∂z
r
∇ · (rr) = 3r + r ·
r
2
krk
= 3r +
r
r2
= 3r +
r
= 4r.

41
En [1] y [3] se pueden ver diversas aplicaciones de los conceptos anteriores a
las ciencias fı́sicas.

1.4. Ejercicios y problemas.


1. Usando la definición de diferenciabilidad, justifica que si f : U ⊂ Rn → R
es diferenciable en xo ∈ U , entonces

f (x0 + h) − f (x0 ) = ∇f (x0 ) · h + g(h),

donde
g(h)
lim = 0.
h→0 khk

2. Sea f : R2 → R definida por




 0 si (x, y) = (0, 0)

f (x, y) =
x3
si (x, y) 6= (0, 0)


 2
x + y2

(a) Calcular las derivadas parciales de f en el origen, esto es,

∂f ∂f
(0, 0) , (0, 0)
∂x ∂y

(b) Comprueba que la derivada parcial de f respecto a x es la siguiente


función:


 1 si (x, y) = (0, 0)
∂f 
(x, y) =
∂x x4 + 3x2 y 2
si (x, y) 6= (0, 0)


(x2 + y 2 )2

∂f
(c) ¿Es continua la función ∂x : R2 → R en el origen?

3. Para la curva g (t) = (et , cos t, sen t) y para la función

f (x, y, z) = xz + yz + xy

encontrar la siguiente derivada:


d
(f ◦ g) (t) |t=1
dt

42
4. Sea f : R2 → R definida por


 0 si (x, y) = (0, 0)

f (x, y) =
2xy 2
si (x, y) 6= (0, 0)


 2
x + y4

(a) Verifica que existen las derivadas parciales ∂f /∂x, ∂f /∂y en todos los
puntos (x, y) ∈ R2 .

(a) Demuestra que existe la derivada direccional de f en cualquier punto (x, y)


y en cualquier dirección determinada por un vector unitario u ∈ R2 .

(c) Muestra que f no es continua en el origen.

5. Sea f : R2 → R definida por




 0 si (x, y) = (0, 0)

f (x, y) =
x2 − y 2
 xy 2 si (x, y) 6= (0, 0)


x + y2

∂f
(a) Comprueba que (x, 0) = x para toda x.
∂y

∂f
(b) Comprueba que (0, y) = −y para toda y.
∂x

∂2f ∂2f
(c) Verifica que (0, 0) 6= (0, 0).
∂x∂y ∂y∂x

43
2. Integración en dos y tres
variables.
En la teorı́a de integración de funciones de una variable real se pueden
construir pruebas sencillas de la existencia de la integral de una función
continua definida sobre un intervalo usando sumas de Riemann. Para
funciones de varias variables se necesitan algunas técnicas más sofisticadas de
las que disponemos para poder desarrollar pruebas completas de los teoremas.
Por tal razón omitiremos algunas de las demostraciones en esta unidad,
excepto en casos especiales donde las pruebas resulten comprensibles para el
nivel de este curso. Las pruebas rigurosas pertenecen a cursos avanzados de
cálculo y de análisis matemático. Sin embargo justificaremos las pruebas
omitidas con argumentos geométricos cuando sea posible.

2.1. Integral de Riemann.


2.1.1. Definiciones básicas.
Comencemos por analizar los análogos de las sumas superiores e inferiores
asociadas con particiones del dominio de integración.
Sea R un rectángulo cerrado de n dimensiones y sea f : R ⊂ Rn → R una
función acotada, esto es,

|f (x, y)| ≤ M

para todo punto (x, y) ∈ R.


Una partición P de un intervalo cerrado [a, b] es una sucesión to , . . . , tk ,
donde

a = t0 ≤ t1 ≤ · · · ≤ tk = b.

La partición P divide el intervalo [a, b] en k subintervalos [ti−1 , ti ]. Una


partición del rectángulo n-dimensional [a1 , b1 ] × · · · × [an , bn ] es una colección

P = (P1 , . . . , Pn ) ,

donde cada Pi es una partición del intervalo [ai , bi ]. Supóngase, por ejemplo,
que P1 = to , . . . , tk es una partición de [a1 , b1 ] y P2 = so , . . . , sl es una
partición de [a2 , b2 ]. Entonces la partición P = (P1 , P2 ) de [a1 , b1 ] × [a2 , b2 ]
lo divide en k · l subrectángulos, cada uno de la forma [ti−1 , ti ] × [sj−1 , sj ].
En general, si Pi divide [ai , bi ] en Ni subintervalos, entonces P = (P1 , . . . , Pn )
divide [a1 , b1 ] × · · · × [an , bn ] en N = N1 · · · Nn subrectángulos, los cuales
son llamados subrectángulos de la partición P .

Ver [4] y [6].

44
Para un rectángulo n-dimensional, una función acotada f : R ⊂ Rn → R, una
partición P de R y un subrectángulo S de la partición P , se define:

mS (f ) = inf {f (x) | x ∈ S} ,
MS (f ) = sup {f (x) | x ∈ S} .

Ahora, el volumen V (S) de S = [a1 , b1 ] × · · · × [an , bn ] se define por el


producto

(b1 − a1 ) · · · (bn − an )

y también es el volumen del conjunto (a1 , b1 ) × · · · × (an , bn ).


La suma inferior de f respecto a P se define por:
X
L(f, P ) = mS (f ) · V (S),
S

y la suma superior es:

X
U (f, P ) = MS (f ) · V (S).
S

Es claro que L(f, P ) ≤ U (f, P ).

Lema. Supóngase que la partición P 0 es más fina que la partición P (lo cual
significa que cada subrectángulo de P 0 está contenido en un subrectángulo de
P ). Entonces:

L(f, P ) ≤ L(f, P 0 ), y U (f, P 0 ) ≤ U (f, P ).

Demostración. Cada subrectángulo S de P se divide en varios


subrectángulos S1 , . . . , Sα de P 0 , de manera que

V (S) = V (S1 ) + · · · + V (Sα ).

Ahora, mS (f ) ≤ mSi (f ), ya que los valores f (x) para x ∈ S incluyen todos los
valores f (x) para x ∈ Si y posiblemente otros más pequeños. Ası́,

mS (f ) · V (S) = mS (f ) · V (S1 ) + · · · + mS (f ) · V (Sα )


≤ mS1 (f ) · V (S1 ) + · · · + mSα (f ) · V (Sα ).

La suma, para todo S, de los términos del lado izquierdo es L(f, P ), mientras
que la suma de todos los términos del lado derecho es L(f, P 0 ). Por lo tanto
L(f, P ) ≤ L(f, P 0 ). La otra desigualdad se demuestra de manera similar.

Corolario. Si P y P 0 son dos particiones cualesquiera, entonces

L(f, P 0 ) ≤ U (f, P ).

45
Demostración. Sea P 00 una partición más fina que ambas P y P 0 . Por
ejemplo, sea P 00 = (P100 , . . . , Pn00 ) , donde Pi00 es una partición de [ai , bi ] más
fina que ambas Pi y Pi0 . Entonces

L(f, P 0 ) ≤ L(f, P 00 ) ≤ U (f, P 00 ) ≤ U (f, P ). 

De este corolario se deduce que la mı́nima cota superior de todas las sumas
inferiores de f es menor o igual que la máxima cota inferior de todas las sumas
superiores de f .

Definición. Una función f : R → R se dice integrable en el rectángulo R si


f es acotada y se cumple la siguiente igualdad:

sup {L(f, P )} = inf {U (f, P )} .

En caso de que f sea integrable, el número que cumple la igualdad anterior se


denota por:
Z
f
R

y es llamado la integral de f sobre R. Ver [3], [4] y[6].

Con mucha frecuencia se denota la integral de f sobre R por:


Z
f (x1 , . . . , xn ) dx1 · · · dxn ,
R

y si f : [a, b] → R, también suele escribirse


Z b Z
f= f.
a [a,b]

2.2. Existencia de la Integral.


2.2.1. Integrabilidad.
Un criterio simple y útil de integrabilidad se enuncia y prueba a continuación.

Teorema. Una función acotada f : R ⊂ Rn → R es integrable si y sólo si


∀ε > 0 existe una partición P de R tal que

U (f, P ) − L(f, P ) < ε.

46
Antes de ver la demostración, obsérvese que una función continua definida en
un compacto resulta integrable por el teorema anterior.
Demostración. Si se cumple la condición, resulta que

sup {L(f, P )} = inf {U (f, P )}

y de ahı́ que f sea integrable. Por otro lado, si f es integrable, de modo que

sup {L(f, P )} = inf {U (f, P )} ,

entonces para cualquier ε > 0 existen particiones P y P 0 que satisfacen

U (f, P ) − L(f, P 0 ) < ε.

Si P 00 es más finaque ambas P y P 0 , un lema previo implica que

U (f, P 00 ) − L(f, P 00 ) ≤ U (f, P ) − L(f, P 0 ) < ε. 

En lo que sigue vamos a caracterizar las funciones integrables y veremos un


método para calcular integrales. Por ahora consideremos dos ejemplos de
funciones, siendo una integrable y la otra no.

Ejemplo. Sea f : R ⊂ Rn → R una función constante, f (x) = c. Entonces


para cualquier partición P y cualquier subrectángulo S, se tiene que

mS (f ) = MS (f ) = c,

por lo tanto
X
L(f, P ) = U (f, P ) = c · V (S) = c · V (R),
S

luego
Z
f = c · V (R). 
R

Ejemplo. Sea f : R ⊂ Rn → R definida por



0 si x es racional,
f (x) =
1 si x es irracional.

Si P es una partición, entonces todo subrectángulo S contiene puntos (x, y)


con x racional, y también contiene puntos con x irracional. De ahı́ que
mS (f ) = 0 y MS (f ) = 1, por lo tanto
X
L(f, P ) = 0 · V (S) = 0
S

47
y además
X
U (f, P ) = 1 · V (S) = V ([0, 1] × [0, 1]) = 1.
S

En consecuencia, f no es integrable.

2.2.2. Medida cero y contenido cero.


Un subconjunto A de Rn tiene medida cero (n-dimensional), si para cada
ε > 0 existe una cubierta de A por rectángulos cerrados {U1 , U2 , U3 , . . .} tales
que

X
V (Ui ) < ε.
i=1

Ver [1], [4], [6]

Es claro que si A tiene medida cero y B ⊂ A, entonces B tiene medida cero.

Observaciones:

1. Pueden usarse rectángulos abiertos en lugar de rectángulos cerrados en las


definiciones anteriores.
2. Un conjunto que tiene solamente un número finto de puntos tiene medida
cero.
3. Si A tiene infinitos puntos que pueden ponerse en una sucesión a1 , a2 , a3 , . . . ,
entonces A tiene medida cero.

Las pruebas de las observaciones 1 y 2 son inmediatas. Para demostrar la


tercera tomemos cualquier ε > 0. Se puede elegir un rectángulo cerrado Ui
conteniendo ai de manera que

V (Ui ) < ε/2i .

Entonces

X ∞
X
V (Ui ) < ε/2i = ε. 
i=1 i=1

Otro criterio de gran utilidad es el siguiente.

Teorema. Si A = A1 ∪ A2 ∪ A3 ∪ · · · , y cada Ai tiene medida cero, entonces


A tiene medida cero.

48
Demostración. Sea ε > 0 arbitrario. Como Ai tiene medida cero, existe una
cubierta {Ui1 , Ui2 , Ui3 , . . .} de Ai por rectángulos cerrados tales que

X
V (Uij ) < ε/2i .
j=1

Entonces la colección de todos los Uij constituyen una cubierta de A.


Consideremos ahora el siguiente arreglo:
% % %
U11 U12 U13 ···
% % %
U21 U22 U23 ···
% %
U31 U32 U33 ···
%

Obsérvese que esta colección puede colocarse en una sucesión


W1 , W2 , W3 , . . .
y que se cumple lo siguiente:

X ∞
X
V (Wi ) < ε/2i = ε. 
i=1 i=1

Definición. Un subconjunto A ⊂ Rn tiene contenido cero (n-dimensional)


si para todo ε > 0 existe una cubierta finita {U1 , U2 , U3 , . . .} de A por
rectángulos cerrados tales que

X
V (Ui ) < ε.
i=1

Ver [6].

Si A tiene contenido cero, A tiene claramente medida cero. De nuevo, pueden


considerarse rectángulos abiertos en lugar de rectángulos cerrados en la
definición anterior.

2.2.3. Criterio de integrabilidad para funciones


discontinuas.
Si f : A ⊂ Rn → R es acotada y δ > 0 usaremos los siguientes números en lo
que sigue:
M (a, f, δ) = sup {f (x) | x ∈ A & |x − a| < δ} ,
m (a, f, δ) = inf {f (x) | x ∈ A & |x − a| < δ} .

49
Definición. La oscilación de una función f en un punto a se define por:

o (f, a) = lim [M (a, f, δ) − m (a, f, δ)] .


δ→0

Ver [6].

Este lı́mite siempre existe puesto que la diferencia

M (a, f, δ) − m (a, f, δ)

decrece si δ decrece.

Existen dos hechos importantes acerca de la oscilación, que veremos enseguida.


Demostramos el primero y dejamos la prueba del segundo como ejercicio para
el lector.

Teorema. Una función acotada f es continua en a ⇐⇒ o(f, a) = 0.

Demostración. Sea f continua en a. Para todo ε > 0 podemos elegir δ > 0


de manera que

|f (x) − f (a)| < ε

para toda x ∈ A con |x − a| < δ.


Ası́,

M (a, f, δ) − m (a, f, δ) ≤ 2ε.

Como lo anterior es válido para toda ε > 0, se concluye que o(f, a) = 0.


El regreso es similar. 

Teorema. Sea A ⊂ Rn cerrado. Si f : A → R es cualquier función acotada y


ε > 0, entonces el conjunto

{x ∈ A | o(f, a) ≥ ε}

es acotado.

A continuación se enuncia un criterio para decidir cuándo es integrable una


función discontinua. La prueba es muy técnica para el nivel de este curso por
lo cual no la presentamos aquı́. El lector interesado puede ver una
demostración en [6].

Teorema. Sean A ⊂ Rn un rectángulo cerrado, f : A → R acotada y

B = {x ∈ A | f es discontinua en x} .

50
Entonces f es integrable ⇐⇒ B tiene medida cero.

2.3. Propiedades básicas de la Integral.


2.3.1. Linealidad y aditividad.
Teorema. Supóngase que f, g son funciones definidas sobre un rectángulo R,
y que son integrables sobre R. Entonces f + g es integrable. Si λ ∈ R,
entonces λf es integrable. Además se cumple lo siguiente:
Z Z Z
(f + g) = f+ g,
R R R
Z Z
(λf ) = λ f.
R R

En otros términos, la integral es un operador lineal sobre el espacio vectorial


de las funciones integrables.

La demostración depende de propiedades elementales de ı́nfimos y supremos y


se dejan para el lector interesado (ver [2]).

La propiedad de aditividad de la integral es la que se enuncia a continuación.

Teorema. Sea A una región acotada del plano R2 que puede expresarse como
unión de dos regiones A1 , A2 sin puntos en común excepto posiblemente en
puntos frontera. Supóngase que las fronteras de A, A1 , A2 son curvas
diferenciables. Si f es una función definida en A y es continua excepto en un
número finito de curvas diferenciables, entonces
Z Z Z
f= f+ f.
A A1 A2

La idea de la prueba es intuitivamente clara debido a que el área de cualquier


curva es igual a cero.

2.3.2. Teorema del Valor Medio.


Los diversos teoremas del valor medio para integrales dan estimaciones del
cálculo de integrales definidas usando ciertos valores de la función integrando.

Teorema. Si f : [a, b] → R es continua, existe un punto c ∈ (a, b) tal que


Z b
f (x) dx = (b − a)f (c).
a

51
Rx
Demostración. Defı́nase F (x) = a f (t) dt y aplı́quese el teorema del valor
medio para derivadas a esta función F . 

Teorema. Supóngase que f, g : [a, b] → R son continuas y que g es no


negativa (o bien, no positiva).Entonces existe un punto c ∈ (a, b) tal que
Z b Z b
f (x) g(x) dx = f (c) g(x) dx.
a a

Obsérvese que cuando g(x) = 1 para toda x ∈ [a, b], este segundo teorema se
reduce al primero.

Demostración. Consideraremos el caso cuando g es no negativa. El otro caso


se deduce de lo anterior al reemplazar g por −g. Sean
m = min {f (x) | x ∈ [a, b]} ,
M = max {f (x) | x ∈ [a, b]} .
Para toda x ∈ [a, b] se cumple que
mg(x) ≤ f (x)g(x) ≤ M g(x).
Ahora, por definición de integral definida, tenemos que si F : [a, b] → R es
continua y F (x) ≥ 0 siempre, entonces
Z b
F (x) dx ≥ 0,
a

de donde se deduce que si G, H : [a, b] → R son funciones continuas y


G(x) ≥ H(x) para toda x ∈ [a, b], entonces
Z b Z b
G(x) dx ≥ H(x) dx.
a a

Integrando las primeras desigualdades sobre [a, b] y usando la última se


obtiene que
Z b Z b Z b
m g(x) dx ≤ f (x)g(x) dx ≤ M g(x) dx.
a a a

Por simplicidad, denotemos


Z b
I= g(x) dx.
a
Rb
Como g(x) ≥ 0 para toda x ∈ [a, b], la desigualdad a F (x) dx ≥ 0 implica
que I ≥ 0. Si I = 0, entonces las últimas desigualdades nos permiten escribir
que los dos lados de la igualdad
Z b Z b
f (x) g(x) dx = f (c) g(x) dx
a a

52
son cero, estableciendo su validez para cualquier c. Finalmente, si I > 0,
dividimos
Z b Z b Z b
m g(x) dx ≤ f (x)g(x) dx ≤ M g(x) dx
a a a

entre I para obtener que


Z b
1
m≤ f (x)g(x) dx ≤ M.
I a

La continuidad de f en el cerrado [a, b] garantiza la existencia de sus valores


mı́nimo y máximo, lo cual implica la igualdad postulada para alguna
c ∈ (a, b). 

Para integrales sobre regiones bidimensionales el resultado análogo al primer


teorema es el siguiente.

Teorema. Supongamos que f : R ⊂ R2 → R es continua y R es una región


con área A(R). Entonces existe un punto (xo , yo ) ∈ R tal que
ZZ
f (x, y) dx dy = f (xo, yo )A(R).
R

La idea de la demostración es similar a las anteriores y se deja como ejercicio


al lector (ver [1]).

2.4. El Teorema de Fubini.


El problema de calcular integrales se resuelve, en principio, por el teorema de
Fubini que reduce el cálculo de integrales sobre rectángulos en Rn , para n > 1,
al cálculo de integrales sobre intervalos cerrados de números reales. La idea del
teorema para una función continua positiva f : [a, b] × [c, d] → R es la
siguiente. Sea

t0 , . . . , t n

una partición de [a, b] y divı́dase el producto cartesiano [a, b] × [c, d] en n


bandas de la forma

{ti } × [c, d] .

Si gx se define por gx (y) = f (x, y), entonces el área de la región bajo la


gráfica de f y encima de {x} × [c, d] es
Z d Z d
gx = f (x, y) dy.
c c

53
El volumen de la región bajo la gráfica de f encima de
[ti−1 , ti ] × [c, d]
es aproximadamente igual a
Z d
(ti − ti−1 ) · f (x, y) dy,
c

para cada x ∈ [ti−1 , ti ]. Ası́,


Z Xn Z
f= f
i=1
[a, b]×[c, d] [ti−1 , ti ]×[c, d]

es aproximadamente igual a
n
X Z d
(ti − ti−1 ) · f (xi , y) dy,
i=1 c

con xi ∈ [ti−1 , ti ].
Por otro lado, aparecen sumas similares en la definición de la integral
Z b Z d !
f (x, y) dy dx.
a c

Luego, si h se define por


Z d Z d
h(x) = gx = f (x, y) dy,
c c

resulta razonable esperar que h sea integrable en [a, b] y que


Z Z b Z b Z d !
f= h= f (x, y) dy dx
a a c
[a, b]×[c, d]

cuando f es continua.
Hemos hecho intuitivamente claro el hecho enunciado a continuación.

Teorema de Fubini. Sea f una función continua definida sobre un


rectángulo R = [a, b] × [c, d]. Entonces
! !
Z Z b d Z Z d b
f (x, y) dy dx = f (x, y) dy dx.
a c c a

El número definido por cada lado de la igualdad anterior se denota


frecuentemente por
ZZ
f (x, y) dx dy,
R

54
o también por
Z bZ d
f (x, y) dy dx
a c

y por notaciones similares (ver [6]).

2.5. Integrales dobles y triples.


Ahora veremos ejemplos del cálculo de integrales dobles mediante la aplicación
del teorema de Fubini.

Ejemplo. Sea f (x, y) = x2 y. Encontrar la integral doble de f sobre el


rectángulo [1, 2] × [−3, 4].
Debemos calcular
Z 2Z 4
f (x, y) dy dx.
1 −3

Para esto, calculamos primero la integral respecto a y,


Z 4
x2 y dy.
−3

Para un valor fijo de x, ponemos x2 fuera de la integral:


Z 4 2 4
7x2

2 2y
x y dy = x = .
−3 2 −3
2

Al integrar lo anterior respecto a x resulta finalmente


Z 2 2
7x 49
dx = .
1 2 6

2.5.1. Integración sobre regiones elementales.


Sean g1 , g2 dos funciones en [a, b] tales que g1 (x) ≤ g2 (x). Sean c, d tales que

c < g1 (x) ≤ g2 (x) < d

para toda x ∈ [a, b]. Entonces estas funciones determinan una región A entre
las dos rectas

x = a, x = b,

y entre las dos curvas

y = g1 (x), y = g2 (x).

55
Esta región es del tipo denominado región elemental de tipo 1.
Si f es una función continua en A, y definimos f en el rectángulo [a, b] × [c, d]
igual a cero en cualquier punto del rectángulo que no intersecte A, entonces
para toda x ∈ [a, b] la integral
Z d
f (x, y) dy
c

puede escribirse
Z g1 (x) Z g2 (x) Z d
f (x, y) dy + f (x, y) dy + f (x, y) dy.
c g1 (x) g2 (x)

Ahora, como f (x, y) = 0 siempre que

c ≤ y < g1 (x) y g2 (x) < y ≤ d,

la primera integral y la última son iguales a cero. Por lo tanto


Z Z b Z g2 (x)
f= f (x, y) dy dx.
A a g1 (x)

Las regiones elementales de tipo 2 son de la forma

(x, y) ∈ R2 | c ≤ y ≤ d, h1 (y) ≤ x ≤ h2 (y) ,




y las integrales dobles definidas sobre ellas se pueden calcular de acuerdo a la


fórmula
Z Z d Z h2 (y)
f= f (x, y) dx dy,
A c h1 (y)

similarmente al caso anterior.

Ver [1], [2], [3] y [4].

2.5.2. Cambio del orden de integración.


Supongamos que A es una región que puede describirse como del tipo 1 y
también como del tipo 2. En tal caso se puede calcular la integral doble de
una función definida sobre A con cualquiera de las dos fórmulas de la sección
2.5.1. En consecuencia, si una de las dos integrales resulta muy complicada de
calcular se puede cambiar a la otra integral. Esta técnica se llama cambio del
orden de integración.
R a R √a2 −x2 p
Ejemplo. Calcular 0 0
a2 − y 2 dy dx.

56
Obsérvese que x varı́a entre 0 y a, y que para cada x fija,
p
0 ≤ y ≤ a2 − x2 .

Ası́, la región de integración es el conjunto de puntos (x, y) tales que


p
0 ≤ x ≤ a, 0 ≤ y ≤ a2 − x2 ,

la cual es un cuarto del disco de radio a en el primer cuadrante. Por lo tanto


se puede describir también como el conjunto de puntos (x, y) que cumplen:
p
0 ≤ y ≤ a, 0 ≤ x ≤ a2 − y 2 .

De manera que
Z a Z √
a2 −x2 p Z a Z √a2 −y2 p !
a2 − y 2 dy dx = a2 − y 2 dx dy
0 0 0 0
Z a h p ix=√a2 −y2
= 2
x a −y 2 dy
x=0
Z0 a
a2 − y dy 2

=
0
a
y3

= a2 y −
3 0
2a3
= .
3

2.5.3. Integrales triples.


Todo lo dicho para integrales dobles puede generalizarse a tres dimensiones. Si
A denota una región tridimensional y f es una función definida sobre A, se
denota
Z ZZZ
f= f (x, y, z) dz dy dx.
A A

Para calcular integrales triples se tienen situaciones similares al caso


bidimensional. Si

R = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ] ,

entonces
! !
Z Z b1 Z b2 Z b3
f= f (x, y, z) dz dy dx.
R a1 a2 a3

57
Ejemplo. Calcular la integral de la función f (x, y, z) = sen x sobre el
rectángulo definido por

0 ≤ x ≤ π, 2 ≤ y ≤ 3, −1 ≤ z ≤ 1.

La integral es igual a
Z πZ 3Z 1
sen x dz dy dx.
0 2 −1

Si primero integramos respecto a z obtenemos


1
z|−1 = 2.

A continuación, con respecto a y, obtenemos


3
y|2 = 1.

Finalmente,
Z π
π
2 sen x dx = −2 cos x|0 = −2 (cos π − cos 0) = 4.
0

También existen integrales definidas sobre regiones más generales que


rectángulos y que se describen con desigualdades.

Ejemplo. Considérese el tetrahedro T con vértices en los puntos

(0, 0, 0) , (1, 0, 0), (0, 1, 0) , (0, 0, 1) .

La región tridimensional A acotada por T puede describirse por las siguientes


desigualdades:

0 ≤ x ≤ 1,
0 ≤ y ≤ 1 − x,
0 ≤ z ≤ 1 − x − y.

Por lo tanto, si f es una función definida sobre A,


Z Z 1 Z 1−x Z 1−x−y
f= f (x, y, z) dz dy dx.
A 0 0 0

Para la función constante 1, esta integral nos da el volumen del tetrahedro, el


cual resulta ser igual a 1/6.

2.5.4. Teorema del Cambio de Variables.

58
Si g : [a, b] → R es diferenciable con derivada continua y f : R → R es
continua, se sabe del cálculo elemental que
Z g(b) Z b
f= (f ◦ g) · g 0
g(a) a

cuya prueba es como sigue:


0
Si F 0 = f , entonces (F ◦ g) = (f ◦ g) · g 0 , por tanto el lado izquierdo es

F (g (b)) − F (g (a)) ,

mientras que el lado derecho es

F ◦ g(b) − F ◦ g(a) = F (g (b)) − F (g (a)) .

Se deja como ejercicio al lector demostrar que si g es inyectiva, entonces la


fórmula anterior puede escribirse
Z Z
f= f ◦ g · |g 0 |
g((a,b)) (a,b)

La generalización de lo anterior a dimensiones superiores es el siguiente


resultado:

Teorema del Cambio de Variables. Sean A ⊂ Rn abierto, g : A → Rn


inyectiva, diferenciable y con derivada continua tal que det g 0 (x) 6= 0 para toda
x ∈ A. Si f : g(A) → R es integrable, entonces
Z Z
f= (f ◦ g) |det g 0 |
g(A) A

La demostración usa herramientas más avanzadas de las que hasta ahora han
sido expuestas al estudiante normal de este curso, por lo que la omitimos. El
lector interesado puede consultarla en [6].

2.6. Ejercicios y problemas.


R1R1
1. Calcular la integral doble 0 0
(xyex+y ) dy dx.

2. Sea f continua en el rectángulo R = [a, b] × [c, d] y defı́nase


Z xZ y
F (x, y) = f (u, v) dv du.
a c

59
Demostrar que

∂2F ∂2F
= = f (x, y).
∂x∂y ∂y∂x
Utiliza este ejercicio para describir la relación entre el teorema de Fubini y el
teorema siguiente: ”Si F (x, y) es de clase C 2 entonces son iguales las
derivadas parciales mixtas”.

3. Utiliza el principio de Cavalieri para verificar que el volumen del sólido


obtenido al hacer girar alrededor del eje x la gráfica de la parábola

y = −x2 + 2x + 3
512π
en el intervalo −1 ≤ x ≤ 3 es igual a .
15
4. Usar integración doble para encontrar el área de una región del plano
acotada por una elipse con semiejes de longitudes a, b.

5. Sea f : R2 → R definida por f (x, y) = esen(x+y) y sea


R = [−π, π] × [−π, π]. Demuestra que se cumple lo siguiente:
ZZ
1 1
≤ f (x, y) dy dx ≤ e
e 4π 2
R

6. Cambiar el orden de integración en la siguiente integral doble:

Z 1 Z 1
xy dy dx
0 x

7. Calcular el volumen del sólido acotado por el plano XZ, el plano YZ, el
plano XY, los planos x = 1, y = 1, y la superficie z = x2 + y 4 .

8. Calcular la siguiente integral cambiando a coordenadas polares


Z √ Z √ 2 2
a/ 2 a −y
x dx dy.
0 y

9. ¿Cómo podrı́as justificar que


Z ∞Z ∞
2 2
e−(x +y ) dx dy = π?
−∞ −∞

60
10. Calcular el volumen de la región acotada por el cilindro

x2 + y 2 = 16,

por el plano z = 0, y que se encuentra debajo del plano

y = 2z.

11. Usar integración triple para encontrar el volumen de la región del espacio
situada arriba del paraboloide

z = x2 + y 2

y debajo de la esfera

x2 + y 2 + z 2 = 1


12. Sea (u, v) = G (x, y) = x + y, x2 − y . Sea A la región del primer
cuadrante acotada por los ejes y por la lı́nea x + y = 2. Encontrar la integral
sobre G (A) de la función
1
f (u, v) = √
1 + 4u + 4v

13. Sea T : R2 → R2 la transformación lineal representada por la matriz


 
3 0
.
1 5

Si A es el interior del cı́rculo de radio 10, ¿cuál es el área de la imagen de A


bajo la transformación lineal T ?

14. Calcular el volumen acotado por el elipsoide

x2 y2 z2
2
+ 2 + 2 =1
a b c

61
3. Integrales sobre Curvas y
Superficies.
3.1. Integrales de lı́nea.
3.1.1. Integral de lı́nea de campos escalares.
La integral de lı́nea de un campo escalar diferenciable f (x, y, z) sobre una
curva diferenciable C : [a, b] → R3 tales que la composición f ◦ C (t) resulta
continua se define por:
Z Z b
f ds = f (C (t)) kC 0 (t)k dt.
C a

Ver [1], [2], [3], [4], [5].

Ejemplo. Sean f (x, y, z) = x2 + y 2 + z 2 y


C(t) = (cos t, sen t, t) , 0 ≤ t ≤ 2π. Calcular la integral de lı́nea de f sobre C.

Como
p √
kC 0 (t)k = sen2 t + cos2 t + 1 = 2,

f (x(t), y(t), z(t)) = cos2 t + sen2 t + t2 = 1 + t2 ,

entonces
2π
2π √ √ t3
Z Z 
2
f ds = 1+t 2 dt = 2 t+
C 0 3 0

2 2π
3 + 4π 2 .

=
3

3.1.2. Integral de lı́nea de campos vectoriales.


Sea F un campo vectorial continuo en R3 definido sobre una curva
diferenciable C : [a, b] → R3 . Se define la integral de lı́nea del campo F sobre
C por:
Z Z b
F · dr = F (C (t)) · C 0 (t) dt.
C a

62
Ver [1], [2], [3], [4], [5].

Ejemplo. Sean F (x, y, z) = (x, y, z) y C(t) = (sen t, cos t, t) , 0 ≤ t ≤ 2π.


Calcular la integral de lı́nea del campo F sobre C.

Tenemos la composición

F (C (t)) = (sen t, cos t, t) ,

C 0 (t) = (cos t, −sen t, 1) .

Por lo tanto,

F (C(t)) · C 0 (t) = sen t cos t − cos t sen t + t = t,

y de ahi que
Z Z 2π
F · dr = t dt = 2π 2 .
C 0

3.1.3. Teorema de Green.


Sean F1 , F2 dos funciones real-valuadas y diferenciables en una región A, que
es el interior de una curva C definida en el plano R2 , diferenciable a trozos y
orientada positivamente. Entonces
Z ZZ  
∂F2 ∂F1
F · dr = − dy dx,
C ∂x ∂y
A

donde F es el campo vectorial (F1 , F2 ) definido sobre la región A del plano


bidimensional Euclidiano.

Ver [1], [2], [3], [4], [5], [6].


Este teorema puede resultar útil para cambiar el cálculo de una integral de
lı́nea por el cálculo de una integral doble que resulte ser más fácil de realizar y
viceversa.

Ejemplo. Encontrar la integral del campo vectorial

F (x, y) = (y + 3x, 2y − x)

sobre la elipse

4x2 + y 2 = 4.

63
Sean F1 (x, y) = y + 3x, F2 (x, y) = 2y − x. Entonces
∂F2
= −1,
∂x
∂F1
= −1.
∂y
Ahora, por el teorema de Green,
Z ZZ
F · dr = (−2) dy dx = −2 · Area(A),
C
A

donde Area(A) es el área de la elipse, que resulta ser πab, de donde obtenemos
finalmente que
Z
F · dr = 2π.
C

3.2. Integrales de superficie.


3.2.1. Superficies parametrizadas y orientadas.
Una superficie parametrizada S es un subconjunto del espacio tridimensional
que localmente (esto es, en una vecindad de cada uno de sus puntos) resulta
ser la imagen de una función X : R ⊂ R2 → R3 diferenciable sobre una región
R con matriz jacobiana de rango 2 y que tiene inversa continua. Esta función
X es llamada una parametrización de la superficie S.

Ejemplo. La esfera de radio ρ puede parametrizarse por

X (θ, ϕ) = (ρ sen ϕ cos θ, ρ sen ϕ sen θ, ρ cos ϕ) ,

donde

0 ≤ θ ≤ 2π, 0≤ϕ≤π

son los ángulos que definen la longitud y la latitud de cada punto de la esfera
de radio ρ con centro en el origen del espacio tridimensional R3 .

Definición. Una superficie se dice orientada si tiene un campo vectorial


diferenciable unitario que es perpendicular a su plano tangente en cada punto.

Ejemplo. La esfera parametrizada arriba es orientable con vector normal


unitario
Xθ × Xϕ
N= ,
kXθ × Xϕ k

64
donde Xθ , Xϕ son las derivadas parciales de la función X que parametriza la
esfera de arriba.

3.2.2. Integrales de superficie.


Sean R una región del plano, X : R → R3 una parametrización de una
superficie S y f : S → R una función diferenciable definida sobre la superficie.
Se define la integral de f sobre S por
ZZ ZZ
f dS = f (X (u, v)) kXu × Xv k du dv.
S R

Ver [1], [2], [3], [4], [5].

Ejemplo. Calcular la integral de f (x, y, z) = x sobre la superficie S definida


por

z = x2 + y

sobre la región R descrita por

0 ≤ x ≤ 1,
−1 ≤ y ≤ 1.

Resulta que
s  2  2
ZZ ZZ
∂z ∂z
x dS = x 1+ + dx dy
∂x ∂y
S R
Z 1 Z 1 p
= x 1 + 4x2 + 1 dx dy
−1 0
Z 1 Z 1
1 1/2
= 2 + 4x2 (8x) dx dy
8 −1 0
Z h 1 3/2 i1
2 1
= · 2 + 4x2 dy
3 8 −1 0
Z 1
1 
= 63/2 − 23/2 dy
12 −1
1  3/2 
= 6 − 23/2
6 √
√ 2
= 6−
3
√ √
 
1
= 2 3− .
3

65
3.3. Ejercicios y problemas.
1. (a) Demostrar que la integral de lı́nea de una función escalar dada en
coordenadas cartesianas por f (x, y) definida sobre una curva dada en
coordenadas polares por r = r(θ), en un intervalo definido por θ1 ≤ θ ≤ θ2 es
igual a:
s  2
Z θ2
dr
f (r cos θ, r sen θ) r2 + dθ.
θ1 dθ

(b) Calcular la longitud de arco de la curva r = 1 + cos θ, 0 ≤ θ ≤ 2π.

2. Encuentra el valor de la integral de lı́nea


Z
y dx + 3y 3 − x dy + z dz

C

para C(t) = t, t2 , 0 , 0 ≤ t ≤ 1.

3. Usar el teorema de Green para calcular la integral de lı́nea


Z
y 2 dx + x dy
C

para la trayectoria C definida por el perı́metro del cuadrado con vértices en


(±2, 0) , (0, ±2), recorrido contrareloj.

4. Interpreta y demuestra la siguiente identidad:


Z ZZ
f ∇2 f + ∇f · ∇f dx dy

f ∇f · n ds =
∂R R

5. Para la parametrización del paraboloide

X (u, θ) = a u cos θ, a u sen θ, u2 ,




con

0 < u < b, 0 < θ < 2π,

(a) encontrar los vectores tangentes

∂X ∂X
Xu = , Xθ =
∂u ∂θ

66
(b) calcular la norma del vector normal

∂X ∂X
N= ×
∂u ∂θ
(c) obtener una ecuación de la superficie en coordenadas cartesianas y
bosquejar su gráfica.

6. Demuestra que el área de una superficie S definida por la gráfica de una


función z = f (x, y) de clase C 2 sobre una región del plano R está dada por
s  2  2
ZZ
∂f ∂f
Area(S) = 1+ + dx dy
∂x ∂y
R

7. Calcular el área de la parte de la esfera

x2 + y 2 + z 2 = 1

que queda dentro del cono

x2 + y 2 = z 2

8. Calcular el área de la superficie del toro generado al rotar alrededor del eje
z la circunferencia de radio r con centro en (0, a, 0) para a > r.

9. Demostrar que si una superficie se define implı́citamente por una ecuación


de la forma g (x, y, z) = 0,de manera que existe una función f tal que
z = f (x, y) está definida sobre una región R del plano xy y satisface la
ecuación g(x, y, f (x, y)) = 0, entonces el área de dicha superficie está dada
por la siguiente integral:
q
ZZ gx2 + gy2 + gz2
dx dy.
|gz |
R

10. Encuentra el valor de la integral de superficie de la función dada sobre la


superficie indicada en cada inciso:

(a) f (x, y, z) = x2 + y 2 z; sobre el hemisferio superior de una esfera de
radio 1 con centro en el origen.
(b) f (x, y, z) = z; sobre la superficie dada por z = 1 − x2 − y 2 para z ≥ 0.

(c) f (x, y, z) = x2 ; sobre el cilindro x2 + y 2 = 1 para 0 ≤ z ≤ 1.

67
11. Encuentra el valor de la integral de superficie del campo vectorial dado
sobre la superficie indicada en cada inciso:
1
(a) F (x, y, z) = √ (y, −y, 1); sobre el paraboloide
x2 +y 2

z = 1 − x2 − y 2 , 0 ≤ z ≤ 1.

(b) F (x, y, z) = (y, −x, 1); sobre la superficie parametrizada por

X(r; θ) = (r cos θ, r sen θ, θ) , 0 ≤ r ≤ 1, 0 ≤ θ ≤ 2π

(c) F (x, y, z) = (x2 , y 2 , z 2 ); sobre la superficie parametrizada por

X(u; v) = (u + v, u − v, u) , 0 ≤ u ≤ 2, 1≤v≤3

68
Bibliografı́a
[1] Marsden, J. E., Tromba, A. J.; Cálculo Vectorial ; Addison Wesley
Longman de México, 4a. Edición, 2001.

[2] Lang, S.; Cálculo II ; Addison-Wesley, 1974.

[3] Apostol, T. M.; Calculus, Vol. 2 ; Reverté; 1980.

[4] Courant, R., John, F.; Introducción al cálculo y al análisis matemático,


Vol. 2 ; Limusa; 1979.

[5] Dineen, S.; Multivariate Calculus and Geometry; Springer; 2001.

[6] Hubbard, J. H., Hubbard, B. B.; Vector Calculus, Linear Algebra,


and Differential Forms; Prentice Hall; 2002.

[7] Stewart, J.;Multivariable Calculus; Cengage Learning; 2016.

[8] Spivak, M.; Cálculo en Variedades; W. A. Benjamin, Inc; 1965.

69