Anda di halaman 1dari 42

Captulo 1

Introduccin a la Optimizacin
En este captulo estudiaremos algunos hechos bsicos sobre los problemas de
optimizacin que sern necesarios a lo largo de este trabajo. Sern presentados los
resultados de existencia de soluciones y las condiciones necesarias y suficientes de
optimalidad para problemas irrestrictos.
1.1 Definiciones y algunos hechos bsicos
Sean dados un conjunto D c R
n
y una funcin f: D R. El problema principal a
ser considerado en este trabajo es el de hallar un minimizador de f en el conjunto D.
Este problema ser escrito como
min f (x) sujeto a x e D. (1.1)
El conjunto D ser llamado conjunto viable del problema, los puntos de D sern
llamados puntos viables, y f ser llamada funcin objetivo.
Definicin 1.1.1. Decimos que un punto e D es
(a) minimizador global de (1.1), si
f ( ) s f (x) xe D; (1.2)
(b) minimizador local de (1.1), si existe una vecindad U de tal que
f ( ) s f (x) xe D U. (1.3)
De forma equivalente, e D es minimizador local si existe c > 0 tal que f ( ) s f (x)
para todo xe * c +.


Figura 1.1.1: x
1
es el maximizador global ( es el valor ptimo), x
2
es un minimizador global estricto,
,

- es un conjunto de minimizadores locales estrictos.


Por la definicin, es claro que todo minimizador global tambin es local, ms no
recprocamente. Si para todo x = la desigualdad (1.2) o (1.3) es estricta, ser
llamado minimizador estricto (global o local, respectivamente).
Definicin 1.1.2. Decimos que e |-, +) definido por
=
inf
D xe
f(x)
es el valor optimo del problema (1.1).
Una funcin puede admitir varios minimizadores globales, ms el valor ptimo
(global) del problema, naturalmente, siempre es el mismo. Las Definiciones 1.1.1 y
1.1.2 son ilustradas en la Figura 1.1.1.
Es fcil ver que cualquier problema de maximizacin
max f (x) sujeto x e D, (1.4)
puede ser transformado en un problema de minimizacin equivalente:
min - f (x) sujeto x e D.
En particular, las soluciones locales y globales de ambos problemas son las
mismas, con signos opuestos para los valores ptimos, vea la Figura 1.1.2. Por eso, del
punto de vista matemtico, no existe ninguna diferencia relevante entre los problemas
de minimizacin y de maximizacin: todos los resultados obtenidos para una clase de
problemas pueden ser extendidas para la otra clase sin dificultad.
Decimos que un conjunto es poliedral cuando l puede ser representado como el
conjunto de las soluciones de un sistema finito de ecuaciones e inecuaciones lineales.
Por ejemplo:
D = *

+,
Donde A e R (l, n), B e R (m, n), a e R
l
, b e R
m
. En este contexto, decimos que la
funcin h: R
n
R
l
, definida por h (x) = A x a, es una funcin afn.
Una funcin f: R
n
R definida por
f (x) = , (1.5)
donde Q e R (n, n), q e R
n
, es llamada funcin cuadrtica.
Una clase especial de problemas de optimizacin se refiere al caso en que D es
un conjunto poliedral. Si adems de esto f fuera cuadrtica, (1.1) se llama problema de
programacin cuadrtica, y si fuera lineal (Q = 0 en (1.5)), el problema es de
programacin lineal.
Cuando D es un conjunto convexo y f es una funcin convexa, decimos que
(1.1) es un problema de programacin convexo. Cuando la matriz Q es semidefinida
positiva los problemas cuadrticos son convexos (por lo tanto, los problemas lineales
siempre son convexos).
1.2 Existencia de soluciones globales
Cuando en la Definicin 1.1.2 tenemos -, el problema (1.1) no posee
solucin global (en este caso f es ilimitada inferiormente en el conjunto D). Ms
tambin cuando es finito, el minimizador global puede no existir. Ese es el caso en
que no es alcanzado en ningn punto viable, es decir, cuando no existe x e D, tal que
f (x) = . Por ejemplo, sea f: R R, f (x) = e
x
, D = R. Evidentemente, inf
xeR
e
x
= 0.
No obstante, no existe x e R tal que e
x
= 0.


Figura 1.2.1: La funcin f (x) = e
x
no tiene minimizador global en R, no obstante el valor ptimo del
problema es finito: para todo x e R, se tiene que e
x
> 0 = inf
zeR
e
z
.
Teorema 1.2.1 (Teorema de Weierstrass)
Sean D c R
n
un conjunto compacto no vaco y f: D R una funcin continua.
Entonces, los problemas (1.1) y (1.4) tienen soluciones globales.
Demostracin: Por lo observado en pargrafo 1.1, es suficiente probar la existencia de
un minimizador o de un maximizador. Mostraremos la existencia de un minimizador.
Como la imagen de un conjunto compacto por una funcin continua es
compacta, * () + es compacto. En particular, este
conjunto es limitado inferiormente, o sea,
- < =
inf
D xe
f(x).
Por la definicin de nfimo, para todo k e N existe un x
k
e D tal que
s f (x
k
) s + 1/ k.
Pasando al lmite cuando k , concluimos que

) . (1.6)
Como *

+ c D y D es compacto, se sigue que *

+ es una sucesin limitada. Luego,


ella posee una subsucesin {

} que converge a un punto de D:


e D.
Por la continuidad de f,

) = f ( ).
Usando (1.6), tenemos que f ( ) = , es decir, f asume el valor mnimo en D en el punto
e D. En otras palabras, es un minimizador global del problema (1.1).
La hiptesis de que un conjunto viable sea compacto slo puede ser eliminada en
los resultados de existencia de solucin al costo de fortalecimiento de las hiptesis
sobre la funcin objetivo. En este sentido, la nocin de conjunto de nivel es
fundamental.
Definicin 1.2.1. El conjunto de nivel de la funcin f: D R asociado a c e R, es el
conjunto dado por
L
f, D
(c) = * () +.

Figura 1.2.2. Conjunto de nivel L
f, R
(c) = ,

- ,

- ,

-.
Corolario 1.2.1. Sean D c R
n
y f: D R continua en el conjunto D. Supongamos que
existe c e R tal que el conjunto de nivel L
f, D
(c) sea no vacio y compacto.
Entonces el problema (1.1) posee una solucin global.
Demostracin: Por el Teorema de Weierstrass (Teorema 1.2.1), el problema
min f (x) sujeto a x e L
f, D
(c)
tiene una solucin global, digamos . Para todo x e D/ L
f, D
(c), tenemos la siguiente
cadena de desigualdades f (x) > c > f ( ), lo que muestra que es un minimizador
global de f no solo en L
f, D
(c), ms tambin en D.
Definicin 1.2.2. Decimos que una sucesin *

+ c R
n
es crtica en relacin al conjunto
D, si *

+ c D y

o *

+x e cl D/ D (k).
Decimos que una funcin f: D R es coerciva en el conjunto D, cuando para
toda sucesin *

+ crtica en relacin a D, se tiene lim sup


k
f (

) = +.

Figura 1.2.3: f (x) = 1/x no es coerciva en (0, +|, ms es coerciva en (0, t| para t > 0 fijo cualquiera.
La funcin f (x) = x
2
+1/x es coerciva en (0, +|.
Observamos que cuando D es cerrado, la Definicin 1.2.2 puede ser simplificada,
afirmando que

e D y

implican lim sup


k
f (

) = +. Cuando D es
limitado, la definicin puede ser simplificada, afirmando que cuando

e D y *

+x
e cl D/ D, se tiene que lim sup
k
f (

) = +. Finalmente, cuando D es compacto, no


hay sucesiones crticas (y por lo tanto, cualquier funcin f: D R es coerciva en D
trivialmente).
1.3 Condiciones de optimalidad para problemas sin
restricciones
Consideremos el siguiente problema irrestricto
min f (x), x e R
n
, (1.9)
donde f : R
n
R. Estudiaremos las condiciones que deben ser satisfechas cuando un
e R
n
dado es minimizador (local) del problema (1.9). Condiciones de este tipo se
llaman condiciones necesarias de optimalidad. Tambin estudiaremos las condiciones
que garantizan que un punto dado es minimizador local del problema. Las condiciones
de este ltimo tipo se llaman condiciones suficientes de optimalidad.
Cabe notar que todos los resultados presentados a seguir son tambin verdaderos
para un problema con restricciones
min f (x) sujeto a x e D,
desde que el punto de inters e D estuviera en el interior del conjunto viable, es decir,
exista un abola B ( , c) en torno de tal que B ( , c) c D. En particular, ste siempre es
el caso cuando D es un conjunto abierto.
Teorema 1.3.1. (Condicin necesaria de primer orden)
Supongamos que la funcin f : R
n
R sea diferenciable en el punto e R
n
. Si es un
minimizador local del problema (1.9), entonces
Vf ( ) = f ( ) = 0. (1.10)
Demostracin: Sea d e R
n
arbitrario pero fijo. Por la definicin de minimizador local,
existe c > 0 tal que
f ( ) s f ( + t d) t e, c -
Por la diferenciabilidad de f en ,
f ( + t d) = f ( ) + t ( ) + o (t).
Luego,
0 s t ( ) + o (t).
Dividiendo por t > 0, tenemos que
0 s ( ) + o (t)/ t,
y tomando lmite cuando t 0+, obtenemos
0 s ( ) .
Como d e R
n
es arbitrario, podemos escoger d = - f ( ), lo que resulta en la condicin
0 s ( ) = - ( )
2
. Donde se sigue que f ( ) = 0.
Definicin 1.3.1. Decimos que un punto e R
n
es estacionario (o crtico) para el
problema (1.9), si vale la condicin (1.10).
Por lo tanto, si f es diferenciable, las soluciones locales del problema (1.9) deben
ser puntos estacionarios. Claramente, lo mismo vale para los problemas de
maximizacin.
A seguir, presentamos las condiciones de segundo orden.
Teorema 1.3.2. (Condicin necesaria de segundo orden)
Supongamos que f : R
n
R sea dos veces diferenciable en el punto e R
n
.
Si es un minimizador local del problema (1.9), entonces vale (1.10) y la matriz
Hessiana de f en el punto es semidefinida positiva, es decir,
( )

. (1.11)
Demostracin: La condicin (1.10) ya fue obtenida arriba.
Sea d e R
n
arbitrario, pero fijo. Si es minimizador del problema (1.9),
entonces para todo t > 0 suficientemente pequeo
0 s f ( + t d) - f ( )
= ( ) + ( ) o (t
2
)
= t
2
( ) 2 + o (t
2
),
Donde usamos el Teorema 1.3.1 (en particular, la relacin (1.10)). Dividiendo los dos
lados de la desigualdad arriba por t
2
> 0, tenemos que
0 s ( ) 2 + o (t
2
) / t
2
.
Pasando al lmite cuando t 0+, obtenemos (1.11).
Teorema 1.3.3. (Condicin suficiente de segundo orden)
Supongamos que f : R
n
R sea dos veces diferenciable en el punto e R
n
.
Si es un punto estacionario (es decir vale (1.10)) y si la matriz Hessiana de f en es
definida positiva, es decir, si
( )

/ *+, (1.12)
Entonces es minimizador local estricto del problema (1.9).
Demostracin: Supongamos que no sea minimizador local estricto, es decir, que
exista *

+ c R
n
/ * + tal que *

+ (k) y f (

) s f ( ) para todo k. Como la


sucesin *(

+ es limitada, ella posee puntos de acumulacin.


Escogiendo (si fuese necesario) una subsucesin, podemos admitir que *(

+ d

/ *+ (de hecho, ).
Para todo k, tenemos
0 > f (

) - f ( )
= ( )

+ ( )(

o (

)
= ( )(

o (

),
donde usamos (1.10). Diviendo los dos lados de esta desigualdad por

> 0 y
tomando el lmite cuando k , obtenemos
( ) s 0,
en contradiccin con (1.12). Por lo tanto, tiene que ser un minimizador local estricto.

Definicin 1.4.1. Un conjunto K c R
n
llamase cono cuando
D e K t d e K t e R
+
.
Por la definicin, si K es un cono no vacio, necesariamente 0 e K. Algunos ejemplos de
cono son: el espacio R
n
, cualquier subespacio de R
n
, el octante no negativo

.
Informalmente, un cono es un conjunto de direcciones, vea Figura 1.4.1.

Figura 1.4.1: Ejemplos de conos.
Definicin 1.4.2. Decimos que d e R
n
es una direccin viable en relacin al conjunto D
en el punto e D, cuando existe c > 0 tal que
+ t d e D te |0,c|.
Denotamos por V
D
( ) el conjunto de todas las direcciones viables en relacin al
conjunto D en el punto e D.

Figura 1.4.2: Las direcciones d
1
y d
2
son viables en relacin al conjunto D en el punto e D. Por
ejemplo, se tiene que + t d
1
e D para todo te |0,c|.
La Figura 1.4.2: ilustra la definicin de direcciones viables. Es fcil ver que V
D
( ) es un cono no vacio (por lo menos, 0 e V
D
( )).
Definicin 1.4.3. Decimos que d e R
n
es una direccin de descida de f : R
n
R en el
punto e R
n
, si existe c > 0 tal que
f ( + t d) < f ( ) te (0,c|.
Definicin 1.4.4. Decimos que d e R
n
es una direccin tangente en relacin al conjunto
D en el punto e R
n
cuando
dist ( + t d, D) = o (t), t e R
+
.
Denotamos por
D
( ) el conjunto de todas las direcciones tangentes al conjunto D en el
punto .
La Figura 1.4.5 ilustra la Definicin 1.4.4.

Figura 1.4.5: Ilustracin de la Definicin 1.4.4: d es una direccin tangente en relacin a D en . En el
dibujo, = 1 y, por lo tanto, la distancia entre los puntos y + t d es igual a t. Cuando t 0+, dist (
+ t d, D) es de orden menor que t, la longitud de paso en la direccin d a partir de .
Claramente,
V
D
( ) c
D
( ), (1.14)
Es decir, todas las direcciones viables son tangentes (para d e V
D
( )) se tiene que dis
( + t d, D) = 0 para todo t > 0 suficientemente pequeo), ms no recprocamente.
Tambin es claro que el conjunto de todas las direcciones tangentes en relacin al
conjunto D en el punto e D es un cono, llamado el cono tangente (en relacin al
conjunto d en el punto e D). Como 0 e
D
( ), se sigue que el cono tangente siempre
es no vacio.
Observamos que, de forma equivalente, el cono tangente puede ser definido
como

D
( ) = d e R
n
*

+ c R
+
, *

+ 0
+
, *

+ c R
n
, *

+ d, tal que
+

e D para todo k e N
Esta ltima definicin es ilustrada en la Figura 1.4.6.

Figura 1.4.6: +

e D para todo k, *

+ 0
+
, y *

+ d e
D
( ).
Otra nocin til (un poco ms general del cono tangente) es la del cono
(tangente) de Bouligand:

( ) = d e R
n
*

+ c R
+
, *

+ 0
+
, *

+ c R
n
, *

+ d, tales que
+

e D para todo k e N
La Figura 1.4.7 contiene el diseo de un cono tangente tpico cuando el punto est en
la frontera del conjunto, que es la situacin ms interesante. Observamos que el caso en
que est en el interior del conjunto es el caso fcil de analizar: es obvio que
e int D
D
( ) =

( ) = V
D
( ) = R
n
.

Figura 1.4.7: El cono tangente en relacin al conjunto D en el punto e D. En el caso del dibujo, se
tiene que
D
( ) =

( ).
Comparando las definiciones arriba, tenemos que, en general,

D
( ) c

( ). (1.15)

Teorema 1.4.1. (Condicin necesaria en forma primal)
Sean D c R
n
y f: R
n
Runa funcin diferenciable en el punto e D. Si es una
solucin local del problema
min f(x) sujeto a x e D, (1.13)
entonces ( )

( ). (1.16)
Demostracin: Para d = 0 e

( ), la condicin (1.16) vale trivialmente. Fijemos d e

( )*+ arbitrario y las sucesiones asociadas *

+ c R
+
/*+ y *

+ c R
n
tales que
*

+ 0
+
, *

+ d (k) y +

e D para todo k.
Como es un minimizador local de (1.13) y *

+ (k), para
todo k suficientemente grande tenemos que
0 s f ( +

) f ( )
=

( )

+ o (

)
=

( )

+ o (

).
Dividiendo los dos lados de la desigualdad arriba por

> 0 y pasando al lmite cuando


k, obtenemos (1.16).
Definicin 1.4.6. El cono dual de un cono K c R
n
es definido por
K
*
= *

+.
Usando la nocin de cono dual, la condicin de optimalidad (1.16) es
equivalente a
-f( ) e (

( ))
*
. (1.17)
Una ilustracin de cono dual (del cono tangente) y de las condiciones de optimalidad
(1.16) y (1.17) es dada en la Figura 1.4.8.

Figura 1.4.8: El cono dual del cono

( ) y las condiciones de optimalidad (1.16) y (1.17). Se tiene


que ( )

( ) o, equivalentemente, -f( ) e (

( ))
*
.
Proposicin 1.4.1. (Relaciones entre las direcciones viables, tangentes y de
Bouligand)
Sean D c R
n
un conjunto cualquiera y e D. Entonces los conos
D
( ) y

( ) son
cerrados y se tiene que
*+ c cl V
D
( ) c
D
( ) c

( ).
Demostracin: Para la demostracin de este Teorema vea Izmailov, A; Solodov, M. en
Otimizaao- Volume 1, pg. 30.
Definicin 3.2.2. Sea D c R
n
un conjunto cualquiera. El fecho convexo de D, denotado
conv D, es el menor conjunto convexo en R
n
que contiene a D (o equivalentemente, la
interseccin de todos los conjuntos convexos en R
n
que contienen a D).
Definicin 3.2.3. Decimos que d eR
n
es una direccin de recesin del conjunto
convexo D c R
n
cuando
x + t d e D x e D, t e R
+
.
Captulo 2
Elementos de Anlisis Convexa
En este captulo estudiamos conjuntos convexos e funciones convexas.
Convexidad es un concepto muy importante en la teora de optimizacin. Con hiptesis
de convexidad, las condiciones necesarias de optimalidad pasan a ser suficientes. En
otras palabras, todo punto estacionario se convierte en una solucin del problema. En
particular, cualquier minimizador local es global. Adems de esto, en el caso convexo
podemos desarrollar la teora de dualidad en su forma ms completa, es decir, asociar al
problema original (primal) otro problema, llamado dual, que sobre ciertas hiptesis es
equivalente al original y muchas veces es ms fcil de resolver. Finalmente, las
herramientas de anlisis convexa sern necesarios para la caracterizacin del cono dual
y del cono tangente en el caso de restricciones mixtas (de igualdad y desigualdad), lo
que resulta en las condiciones de optimalidad primales-duales de Karush-Kuhn-Tuc ker.
Resaltamos que este captulo no constituye un estudio completo de Anlisis Convexa,
adems de los resultados bsicos presentamos apenas el material que ser necesario a lo
largo de este trabajo, lo que juzgamos indispensable para un curso de optimizacin en
general.
2.1 Definiciones de convexidad. El problema de
minimizacin convexa.
Un conjunto convexo se caracteriza por contener todos los segmentos cuyos
extremos pertenecen al conjunto (Vea la figura 1.1.1).
Definicin 2.1.1. Un conjunto D c R
n
es llamado conjunto convexo si para cualquier
xeD, yeD y oe[0,1|, se tiene o x + (1-o) y eD.
El punto o x + (1-o) y, donde oe[0,1|, se llama la combinacin convexa de x e
y (con parmetro o).
El conjunto vaco, el espacio R
n
, y un conjunto que contiene un solo punto, son
trivialmente convexos. Cualquier conjunto no convexo es trivialmente no convexo.

Figura 2.1.1: El conjunto D
1
es convexo; el conjunto D
2
no es convexo.
Proposicin 2.1.1. Para todo cono | = K c R
n
, el cono dual K
*
siempre es convexo y
cerrado.
Demostracin: Sean x e K
*
, y e K
*
, es decir, <x , d> s 0 y <y , d> s 0 para todo deK.
Sea oe[0,1|. Para cualquier deK, tenemos que
<o x+(1-o) y , d> = o <x , d> + (1-o) <y , d> s 0,
Es decir, o x + (1-o) y e K
*
. Por lo tanto, K
*
es convexo.
Sea {y
k
} c K
*
, {y
k
} y (k). Fijemos d e K arbitrario, y pasando al lmite
cuando k en la relacin <y
k
, d> s 0, obtenemos que <y, d> s 0. Por lo tanto, como d
e K era arbitrario, ye K
*
. Esto muestra que K
*
es cerrado.
Definicin 2.1.2. Dado un conjunto D c R
n
cualquiera, el fecho cnico de D, denotado
por cono D, es el menor cono convexo en R
n
que contiene a D (o equivalentemente, la
interseccin de todos los conos convexos en R
n
que contienen a D).

Figura 2.1.3: Ejemplos de fecho cnico de un conjunto.
Para un conjunto convexo, el fecho cnico es compuesto por todos los mltiplos
no negativos de elementos del conjunto.
Proposicin 2.1.2. (Fecho cnico de un conjunto convexo) Sea D c R
n
un conjunto
convexo. Se tiene que
Cono D = {deR
n
/ d = ox, xeD, oeR
+
}
Demostracin: Denotamos
C = {deR
n
/ d = ox, xeD, oeR
+
}
Como el conjunto cono D es un cono, para todo xeD c cono D, tenemos que ox e
cono D para todo oe R
+
. Luego, C c cono D.
Como C es un cono que contiene a D (basta tomar o = 1 en la definicin de C),
si probamos que C es convexo, la inclusin cono D c C es obvia (por la Definicin
2.1.2). La Figura 2.1.4 ilustra la demostracin a seguir.

Figura 2.1.4: Ilustracin para la demostracin de la Proposicin 2.1.2.
Sean d
i
e C, es decir d
i
= o
i
x
i
, o
i
e R
+
y x
i
e D, i = 1,2.
Sea
d = td
1
+ (1-t) d
2
= to
1
x
1
+ (1-t)o
2
x
2
, t e[0,1|.
Cuando te{0,1} o o
i
= 0 para i e{1,2}, la inclusin de C es obvia (en estos casos,
tenemos que d es un mltiplo no negativo de x
1
o x
2
).
Supongamos entonces que t e(0,1), o
i
> 0, i = 1,2. Definimos
| = (

()

)
-1
e (0,1).
Por la convexidad de d, tenemos que x = |x
1
+ (1-|) x
2
e D. Adems de esto,
d x t x t x x t x
t
= + = + =
2
2
1
1
2 1
1
1
) 1 ( ) ) 1 / 1 ( ( o o | o
|
o
,
Mostrando que d e C. Esto prueba que C es convexo.
A seguir probaremos un resultado importante sobre el cono tangente de un conjunto
convexo. Este resultado es ilustrado en la Figura 2.1.5.

Figura 2.1.5: Las direcciones tangentes y el cono tangente para un conjunto convexo. Relaciones con
las direcciones viables y con el fecho conico de la traslacin D - * + .
Teorema 2.1.1. (Cono tangente de un conjunto convexo)
Sean D c R
n
un conjunto convexo, e D. Entonces

D
( ) = B
D
( )) = cl V
D
( ) = cl cono (D -{ } ).
En particular,
D
(

x ) es convexo y cerrado.
Demostracin: Es fcil ver que el conjunto D -{

x } es convexo. Por lo tanto, por la
Proposicin 2.1.2, tenemos que
Cono (D -{

x } ) = {deR
n
/ d = o(x-

x ), xeD, oeR
+
}. (2.1)
Sea d e Cono (D -{

x }, d = 0 (luego, o > 0). Por la definicin arriba, esto significa que

x + d/o = x e D. Por la convexidad de D, se sigue

x + td e D para todo t e[0,1/o|, es


decir, d e V
D
(

x ) (d es una direccin viable, vea la Definicin 1.4.2). Recprocamente,
para d e V
D
(

x ) tenemos que

x + td e D para todo t e[0,c|, donde c > 0. Por lo tanto,


existe x e D tal que x =

x + td, t > 0. Luego, d = (x-



x )/t, es decir, d e Cono (D -{

x } ).
Acabamos de mostrar entonces que V
D
(

x ) = Cono (D -{

x } ).
Por la Proposicin 1.4.1, tenemos siempre que
cl V
D
(

x ) c
D
(

x ) c B
D
(

x ).
Probamos la afirmacin mostrando que
B
D
(

x ) c cl V
D
(

x ).
Sea d e B
D
(

x ), es decir, existen {t
k
} 0+ y {d
k
}d (k) tales que

x + t
k
d
k
eD
para todo k. Como ya mostramos arriba, esto significa que d
k
e V
D
(

x ). En particular,
concluimos que d =

e cl V
D
(

x ).
A seguir mostraremos que un cono y su fecho tienen el mismo cono dual.
Proposicin 2.1.3. Sea K c R
n
un cono cualquiera. Entonces cl K es un cono y se tiene
que
K
*
= (cl K)
*
.
En particular, si D c R
n
es un conjunto convexo y

x e D, se tiene que
(
D
(

x ))
*
= (V
D
(

x ))
*
= (cono (D -{

x }))
*
.
Demostracin: El hecho que cl K es un cono es fcil de verificar y es dejado como
ejercicio para el lector.
Por la definicin de cono dual, el hecho que K c cl K implica (cl K)
*
c K
*
.
Sean y e K
*
y d e cl K cualesquiera. Existe {d
k
} c K tal que {d
k
} d (k).
Tenemos que <y, d
k
> s 0 para todo k. Pasando al lmite cuando (k), obtenemos que
<y, d

> s 0. Por lo tanto, y e (cl K)
*
, es decir, K
*
c (cl K)
*
.
Ahora, la ltima afirmacin de la Proposicin se sigue del Teorema 2.1.1.
Otra nocin til en Anlisis Convexa es la del cono normal.
Definicin 2.1.3. Sean D c R
n
un conjunto convexo y

x e D. El cono normal (cono de


direcciones normales) en el punto

x

en relacin al conjunto D es dado por

D
(

x ) = {d e R
n
/ <d, x-

x > s 0, x e D}.
A seguir, mostraremos que, en el caso convexo, el dual del cono tangente es
exactamente el cono normal definido arriba (vea Figura 2.1.6)

Figura 2.1.6: Ejemplos del cono normal de un conjunto convexo. Se tiene que
D
(

x ) = (
D
(

x ))
*
.
Teorema 2.1.2. (Cono normal es dual del cono tangente)
Sean D c R
n
un conjunto convexo y

x e D. Entonces
(
D
(

x ))
*
= (V
D
(

x ))
*
= (cono (D -{

x }))
*
=
D
(

x ).
Demostracin: Las primeras dos igualdades ya fueron probadas (vea la Proposicin
2.1.3.).
Supongamos que y e (cono (D -{

x }))
*
, es decir, <y, d

> s 0 para todo d e cono
(D -{

x }). En particular, <y, x-

x > s 0 para todo x e D, es decir, y e


D
(

x ).
Supongamos que y e
D
(

x ) .Tenemos que <y, x-

x > s 0 para todo x e D, es


decir, <y, d

> s 0 para todo d e (D -{

x }).
Luego, <y, d

> s 0 para todo d e cono (D -{

x }).
Concluimos que y e (cono (D -{

x }))
*
.
Como consecuencia de la caracterizacin del cono tangente y de su cono dual,
obtenemos las siguientes condiciones de optimalidad para un problema con conjunto
viable convexo.
Teorema 2.1.3. (Condicin necesaria de primer orden)
Sean D c R
n
un conjunto convexo y f : R
n
R una funcin diferenciable en el punto

x e D.
Si

x es un minimizador local de f en el conjunto D, entonces


<f (

x ), x-

x

> > 0, xe D, (2.2)
O, equivalentemente,
-f ( ) e
D
( ). (2.3)
Demostracin: Por el Teorema 1.4.1, <f (

x ), d

> > 0 para todo d e B
D
(

x ). Por el
Teorema 3.1.1, tenemos que
{d e R
n
/ d = x-

x , x e D } c cono (D -{

x }) c B
D
(

x ), lo que implica (2.2).
Por la Definicin 2.1.3, (2.2) y (2.3) son equivalentes.
Como vamos a probar en & 3.4.2, si la funcin es convexa (vea la definicin a
seguir), la condicin necesaria de optimalidad dada en el Teorema 2.1.3 tambin es
suficiente.
Definicin 2.1.4. Si D c R
n
es un conjunto convexo, se dice que la funcin f: D R es
convexa en D cuando para cualesquier x e D, y e D y o e |0, 1|, se tiene
f (o x + (1 - o) y) s o f (x) + (1 - o) f (y).
La funcin f se dice estrictamente convexa cuando la desigualdad arriba es
estricta para todos x = y, o e (0, 1).
La funcin f se dice fuertemente convexa con mdulo > 0, cuando para
cualesquier x e D, y e D y o e |0, 1|, se tiene
f (o x + (1 - o) y) s o f (x) + (1 - o) f (y) - o (1 - o)
2
y x .

Figura 2.1.7: Ilustracin de la definicin de funcin convexa: se tiene que f (o x + (1 - o) y) s o f (x) +
(1 - o) f (y).
Es obvio que una funcin fuertemente convexa es estrictamente convexa, y una
funcin estrictamente convexa es convexa. La funcin f: R R, f (x) = x
2
, es un
ejemplo de funcin fuertemente convexa con mdulo = 1.
La funcin f : R R, f (x) = e
x
, es estrictamente (mas no fuertemente) convexa. La
funcin f : R R, f (x) = x, es convexa( mas no estrictamente).
En & 3.4 presentaremos algunos criterios que pueden ser usados para reconocer
a qu clase de funcin dada pertenece.
Definicin 2.1.5. El epgrafo de la funcin f: D R es el conjunto
E
f
= {(x, c) e D X R / f (x) s c}.
La relacin entre convexidad de conjuntos y de funciones es dada por el
siguiente teorema.
Teorema 2.1.4. Sea D c R
n
un conjunto convexo. Una funcin f: D R es convexa
en D si, y solamente si, el epgrafo de f es un conjunto convexo en R
n
X R.
Demostracin: Supongamos primero que E
f
sea convexo.
Sean x e D, y e D cualesquiera. Obviamente, (x, f (x)) e E
f
y (y, f (y)) e E
f
. Por la
convexidad de E
f
, para todo o e |0, 1| tenemos que


Figura 2.1.8: Convexidad de la funcin f convexidad del epgrafo de f.
(o x + (1-o) y, o f (x) + (1-o) f (y)) = o (x, f (x)) + (1- o) (y, f (y)) e E
f

Por la definicin de epgrafo, esto es equivalente a decir que
f (o x + (1-o) y) s o f(x) + (1- o) f(y),
es decir, f es convexa.
Supongamos ahora que f sea convexa. Sean (x, c
1
) e E
f
y (y, c
2
) e E
f
. Como
f(x) s c
1
y f(x) s c
2
, por la convexidad de f, para todo o e |0, 1| se tiene
f (o x + (1-o) y) s o f (x) + (1- o) f (y)
s o c
1
+ (1- o) c
2
,
lo que significa que
o (x, c
1
) + (1- o) (y, c
2
) = (o x + (1-o) y, o c
1
+ (1-o) c
2
) e E
f
,
es decir, E
f
es convexo.
Por el Teorema 2.1.4, de forma equivalente podemos definir la clase de funciones
convexas como las funciones cuyos epgrafos son convexos.
Decimos que
min f(x) sujeto a x e D (2.4)
es un problema de minimizacin convexo cuando D c R
n
es un conjunto
convexo y f: D R es una funcin convexa en el conjunto D. La importancia de la
convexidad ya puede ser vista en el resultado siguiente:
Teorema 2.1.5. (Teorema de minimizacin convexa)
Sean D c R
n
un conjunto convexo y f: D R una funcin convexa en D.
Entonces todo minimizador local en el problema (2.4) es global. Adems de
esto, el conjunto de minimizadores es convexo.
Si f es estrictamente convexa, no puede haber ms de un minimizador.
Demostracin: Supongamos que x e D sea un minimizador local que no es global.
Entonces existe y e D tal que f (y) < f ( x ).
Definimos x (o) = o y + (1- o) x . Por la convexidad de D, x (o) e D para todo
o e |0, 1|. Ahora, por la convexidad de f, para todo o e |0, 1|, tenemos
f (x (o)) s o f (y) + (1 - o) f ( x )
= f ( x ) + o (f (y) f ( x )) < f ( x ).
Tomando o > 0 suficientemente pequeo, podemos garantizar que el punto x (o) es
arbitrariamente prximo al punto x , y todava se tiene que f (x (o)) < f ( x ) y x (o) e
D. Esto contradice el hecho de que x

es minimizador local del problema (2.4). Por lo
tanto, cualquier solucin local debe ser global.
Sean S c D el conjunto de los minimizadores (globales) y v e R el valor ptimo
del problema (f (x) = v para cualquier x e S).
Para cualesquier x e S, x e S y o e |0, 1|, por la convexidad de f obtenemos
f (o x + (1-o) x ) s o f (x) + (1- o) f ( x ),
= o v + (1- o) v = v ,
lo que implica que del hecho f (o x + (1-o) x ) = v y , por lo tanto, o x + (1-o) x e S.
Acabamos de mostrar entonces que S es convexo.
Supongamos ahora que f sea estrictamente convexa y que existan x e S y x e S,
x = x . Sea o e (0, 1). Como x y x

son minimizadores globales y o x + (1-o) x e D,
por la convexidad de D, se sigue
f (o x + (1-o) x ) > f (x) = f ( x ) = v .
No obstante, por la convexidad estricta
f (o x + (1-o) x ) < o f (x) + (1- o) f ( x )
= o v + (1- o) v = v ,
lo que resulta en contradiccin. Concluimos que en este caso el minimizador es nico.
Definicin 2.1.6. Si D c R
n
es un conjunto convexo, decimos que f: D R es una
funcin cncava en D, cuando la funcin (- f ) es convexa en D.
Es fcil ver que las afirmaciones del Teorema 2.1.5 son verdaderas si
sustituimos minimizacin de una funcin convexa en un conjunto convexo por
maximizacin de una funcin cncava en un conjunto convexo.
Ejercicios N 01
1. Sea D c R
n
un conjunto convexo. Supongamos que x e int D, y e fr D. Probar
que
e int D, si o e |0, 1),
((1- o) x + o y)
e D, si o > 1.
2. Sea K c R
n
un cono. Probar que K es convexo si, y solamente si, K = K + K.
3. Sean D un conjunto convexo en R
n
, c
1
> 0, c
2
> 0.
Probar que (c
1
+ c
2
) D = c
1
D + c
2
D.
Mostrar que la afirmacin puede ser falsa cuando D es no convexo.
4. Probar que cuando D =
n
R
+
, la condicin de optimalidad en el Teorema 3.1.3 es
equivalente a la siguiente condicin de complementaridad:
i
x > 0, (f( x ))
i
> 0,
i
x ( f( x ))
i
= 0, i = 1,,n.
5. Sea f: R
n
R una funcin (fuertemente) convexa y sean x e R
n
y d e R
n

cualesquiera. Probar que la funcin : R R, (o) = f (x + o d), es
(fuertemente) convexa.
6. Sea f: R
m
R una funcin convexa. Sean A e R (m,n) y a e R
m
. Probar que la
funcin f (x) = f (A x + a) es convexa en R
n
.
7. Probar que la funcin f (x) =
2
x es fuertemente convexa con mdulo = 1.
8. Sea f: R
n
R una funcin convexa y, al mismo tiempo, cncava. Mostrar que
esto implica que f es una funcin afn, es decir, f (x)= < a, x> + c, para todo xe
R
n
, donde a e R
n
y c e R.



2.4 Funciones convexas
2.4.1. Propiedades bsicas de las funciones convexas
Primero mostraremos que una suma de mltiplos no negativos de un nmero
finito de funciones convexas es una funcin convexa.
Proposicin 2.4.1. (Convexidad de la suma de funciones convexas)
Sean D c R
n
un conjunto convexo y f
i
: D R, i = 1,p, funciones convexas en D.
Entonces para cualesquier
i
e R
+
, i = 1,p, la funcin
f : D R, f (x) = ()


es convexa en D.
Demostracin: Para x e D, y e D y o e |0, 1| cualesquiera, tenemos que
f (o x + (1-o)y) = (o ( o))


s ( o( ) ( o)()

)
= o ()

+ ( o) ()


= o f (x) + ( o) f (y),
Donde la desigualdad sigue de la convexidad de f
i
e del hecho de que
i
> 0, i = 1,p.
A seguir mostraremos que el supremo de funciones convexas tambin es una
funcin convexa. La demostracin est basada en el hecho de que el epgrafo del
supremo es la interseccin de los epgrafos de funciones que definen el supremo (vea
Figura 3.4.1).

Figura 2.4.1: El epgrafo de supremo de funciones convexas es un conjunto convexo (en el dibujo, f (x)
= max *

()

()+. Por lo tanto, el supremo de funciones convexas es una funcin convexa.



Proposicin 2.4.2. (Convexidad del supremo de funciones convexas)
Sean D c R
n
un conjunto convexo y f
i
: D R, i e I, funciones convexas en D, donde
I es un conjunto cualquiera (posiblemente finito). Supongamos que exista un | e R tal
que f
i
(x) s | para todo x e D y i e I.
Entonces la funcin
f : D R, f (x) = sup
ieI
f
i
(x)
es convexa en D.
Demostracin: Sea c e R arbitrario. Se tiene que
E
f
= {(x,c) e DxR/ f (x) s c}
= {(x,c) e DxR/ f
i
(x) s c, ie I}
=
ieI
{(x,c) e DxR/ f
i
(x) s c}
=
ieI
E
fi
.
Por la convexidad de f
i
, los epgrafos E
fi
, i eI, son convexos (Teorema 2.1.4). Luego, la
interseccin de ellos es un conjunto convexo (Proposicin 3.2.1). Usando de nuevo el
Teorema 3.1.4, la convexidad de E
f
implica la convexidad de f.
Observemos que en el resultado arriba la condicin de que las funciones que
definen el supremo sean uniformemente limitadas (superiormente) es necesaria
solamente para garantizar que f tenga valores finitos en el conjunto D. En particular,
esta hiptesis no es necesaria cuando I es un conjunto finito.
Otra forma de obtener una funcin convexa es la siguiente.
Proposicin 2.4.3. Sean g : R
n
R una funcin convexa, : R R una funcin
convexa y no decreciente.
Entonces la funcin
f : R
n
R, f (x) = ( g (x) )
es convexa.
Demostracin: Para x e R
n
, y e R
n
y o e |0, 1| cualesquiera, por la convexidad de g,
tenemos que
g (o x + (1-o) y) s o g (x) + (1- o) g (y).
Ahora,
f (o x + (1-o) y ) = ( g ( ox + (1-o) y))
s ( o g (x) + (1-o) g(y))
s o (g (x) ) + (1-o) (g (y))
= o f (x) + (1- o) f(y),
Donde la primera desigualdad se sigue del hecho de que es no decreciente, y la
segunda ocurre de la convexidad de .
Ejercicios N 02
1. Construir un ejemplo mostrando que, para una funcin convexa que no sea no
decreciente, la afirmacin de la Proposicin 3.4.3 puede ser falsa.
2. Sean f
i
: R
n
R, i = 1,,p, funciones convexas en R
n
. Probar que para q > 1, la
funcin
f : R
n
R, f(x) = ( ( ()))


es convexa en R
n
.
3. Sean o
i
> 0, i = 1,,n, 1
1
=

=
n
i
i
o . Probar que la funcin
f (x) =

, x e R
n
,
es cncava en
n
R
+
.
(Esta funcin es importante en Economa Matemtica y se llama funcin de
Cobb- Duglas.)
4. Probar que para a e
n
R
+
y b > 0 cualesquiera, la funcin
f (x) =


es convexa en
n
R
+
.
A continuacin mostraremos que conjuntos de nivel de una funcin convexa son
convexos (vea Figura 2.4.2).
Teorema 2.4.1. (Convexidad de conjuntos de nivel de funciones convexas)
Supongamos que el conjunto D c R
n
sea convexo y la funcin f : D R sea convexa
en D.
Entonces el conjunto de nivel
L
f, D
(c) = * () +
Es convexo para todo c e R.


Figura 2.4.2: Conjuntos de nivel de una funcin convexa son convexos.
Demostracin: Tomamos c e R arbitrario. L
f, D
(c) = |, la conclusin se sigue ( el
conjunto vaco es convexo trivialmente).
Sean x e L
f, D
(c), y e L
f, D
(c), es decir, x, y e D, f (x) s c, f (y) s c. Por la
convexidad de D, (o x + (1-o) y) e D.
Por la convexidad de f en D,
f (o x + (1-o) y ) s o f (x) + (1- o) f (y)
s o c + (1- o) c = c,
lo que muestra que (o x + (1-o) y ) e L
f, D
(c).
Observamos que la convexidad de todos los conjuntos de nivel de una funcin
no es suficiente para decir que ella es convexa. Por ejemplo, la funcin f : R R, f (x)
= x
3
, tiene conjuntos de nivel convexos, mas es obvio que ella no es convexa. La Figura
3.4.3 muestra ms una funcin con la misma propiedad. Funciones de este tipo se
llaman cuasi-convexas.
Definicin 2.4.1. Sea D c R
n
un conjunto convexo. Decimos que f : D R es cuasi-
convexa en D cuando los conjuntos de nivel L
f, D
(c) son convexos para todo c e R.
La funcin f : R R, f (x) = x
3
, es cuasi-convexa en R, as como la funcin en
la Figura 3.4.3. Ms ninguna de estas dos funciones son convexas.
Definicin 2.4.2. Sea D c R
n
un conjunto convexo. Decimos que g: D R
m
es
convexa en D, si todas las funciones g
i
: D R, i = 1,,m, son convexas en D.

Figura 2.4.3: Un ejemplo de una funcin cuasi-convexa.
Como consecuencia del Teorema 2.4.1, obtenemos una condicin suficiente para
garantizar la convexidad de un conjunto definido por restricciones funcionales.
Corolario 2.4.1. Sea O c R
n
un conjunto convexo. Sean g: R
n
R
m
una funcin
convexa y h: R
n
R
l
una funcin afn. Entonces el conjunto
D = *eO / () ()s +
es convexo.
Demostracin: Como es fcil de observar, se tiene que
D = D
1
D
2
D
3

Donde
D
1
= { } ) 0 ( , 0 ) ( /
, 1 1
O = s O e
= = hi
l
i i
l
i
L x h x ,
D
2
= { } ) 0 ( , 0 ) ( /
, 1 1
O = s O e
= = hi
l
i i
l
i
L x h x ,
D
3
= { } ) 0 ( , 0 ) ( /
, 1 1
O = s O e
= = gj
m
j j
m
j
L x g x .
Recordemos que cuando h es afn, h y (-h) son convexas. Por lo tanto, todos los
conjuntos de nivel arriba son convexos (Teorema 2.4.1) y la interseccin de ellos
tambin es un conjunto convexo (Proposicin 3.2.1).
A continuacin dejaremos como tarea que una funcin convexa es continua en
cualquier subconjunto abierto de su dominio. Adems de esto, ella es localmente
Lipschitz-continua en el interior de su dominio.
Teorema 2.4.2. (Continuidad de funciones convexas) Sean D c R
n
un conjunto
convexo y abierto y f : D R una funcin convexa en D. Entonces f es localmente
Lipschitz-continua en D. En particular, f es continua en D.
Demostracin: La demostracin de ste Teorema lo dejamos como ejercicio.
Un caso particular de este teorema es: si f : D R es convexa en el conjunto
convexo D c R
n
, entonces f es continua en el interior de D. Es fcil ver que una
funcin convexa puede no ser continua en la frontera de un conjunto cerrado (en este
caso, ella no est definida en todo el espacio).

Figura 2.4.5: Ilustracin del ejemplo 2.4.1. La funcin f es convexa en D = *e/ > +, mas ella
no es continua en el punto x = -1 de la frontera de D.
Ejemplo 2.4.1. Sean D = *e/ > +, y
f : D R, 2, si x = -1
f (x) =
x
2
, si x> -1
Es fcil ver que f es convexa en D (su epgrafo es convexo), ms f no es continua en el
punto x = -1 (en la frontera de su dominio); vea Figura 2.4.5.
El siguiente resultado es importante del punto de vista computacional, porque
con frecuencia los mtodos numricos son basados en la resolucin de una subsecuencia
de subproblemas con funciones objetivos fuertemente convexas. Como consecuencia
del Teorema 2.4.3 (vea corolario 2.4.2 a seguir), el problema de minimizacin de una
funcin fuertemente convexa en un conjunto cerrado no vaco siempre tiene una
solucin que es nica.
Teorema 2.4.3. (Compacticidad de conjuntos de nivel de una funcin fuertemente
convexa)
Supongamos que la funcin f: R
n
R sea fuertemente convexa en R
n
. Entonces el
conjunto de nivel

L
f, R
n

(c) = *

() +
Es compacto para todo c e R.
Demostracin: Por los Teoremas 2.4.1 y 2.4.2, el conjunto L
f, R
n

(c) es convexo y
cerrado. Supongamos que L
f, R
n

(c) sea ilimitado. En este caso, por la Proposicin
3.2.7, existe una direccin de recesin d e R
Lf, R
n

(c) / *+, es decir, la semi-recta
* e

+ pertenece a L
f, R
n

(c).
Sea > 0 el mdulo de la convexidad fuerte de f. fijemos t > 0. Para todo q > t,
obtenemos que
f (x + td) = f ((t / q) (x + qd) + (1- t/q) x)
s (t/q) f (x + qd) + (1- t/q) f (x) - (t/q) (1- t/q)
2

s (t/q) c + (1- t/q) c - (t/q) (1- t/q) q
2

2

= c - t (q-t)
2
.
Como f (x + td) es un nmero fijo y
c - t (q-t)
2
- cuando q +, tenemos una contradiccin.
Concluimos que L
f, R
n

(c) es ilimitado.
Observemos que el Teorema 2.4.3 tambin dice que una funcin fuertemente
convexa es coerciva (vea definicin 1.2.3).
Corolario 2.4.2. Sea f: R
n
R una funcin fuertemente convexa y | = D c R
n
un
conjunto cerrado cualquiera. Entonces f tiene un minimizador en D y el es nico.
Demostracin: Por el Corolario 1.2.1, tomando en cuenta tambin el Teorema 2.4.3,
concluimos que para D no vacio cerrado cualquiera, f tiene un minimizador en D. Por el
Teorema 2.1.5, el debe ser nico.
Teorema 2.4.4. Sea f : R
n
R una funcin convexa. Supongamos que exista c e R tal
que el conjunto de nivel L
f, R
n

(c) = *

() + es no vaco y limitado.
Entonces L
f, R
n

(t) es limitado para todo t e R.
Demostracin: La demostracin de este teorema es idntica a la demostracin del
Teorema 2.4.3 y lo dejamos como ejercicio.
Concluimos esta seccin con algunos comentarios sobre maximizacin de
funciones convexas. El problema de maximizar una funcin convexa en un conjunto
convexo tiene una naturaleza bien diferente del problema de minimizar esta funcin en
este conjunto. Por ejemplo, sea D un tringulo en R
2
, es decir,
D = conv { }
2 3 2 1
, , R x x x c , donde x
i
, i = 1, 2, 3, son puntos diferentes, y sea
f : R
2
R
+
, f (x) = , es decir, f (x) es la distancia entre ye R
2
fijo y x .
Minimizar f sobre D significa encontrar la proyeccin de y sobre D, que es nica
(Teorema 3.2.4). Ms an, esta proyeccin puede ser cualquier punto de D dependiendo
de la localizacin de y en R
2
; vea Figura 2.4.6.

Figura 2.4.6: Para los puntos y
i
e R
2
, i = 1,2,3, los minimizadores de f
i
(x) =

en D son puntos

i
, i = 1,2,3, respectivamente.
Por otro lado, maximizar f sobre D significa encontrar el punto de D ms
distante de y. Como puede ser visto con facilidad haciendo diseos geomtricos, tal
punto siempre es uno de los puntos extremos de D; vea Figura 2.4.7. Todava, este
problema puede poseer soluciones locales que no sean globales (lo que no puede
suceder en el caso de minimizacin convexa).

Figura 2.4.7: Para los mismos puntos y
i
, i = 1, 2, 3, de la Figura 3.4.6, los maximizadores de f
i
(x) =

en D son los puntos extremos de D:


i
, i = 1, 2, 3, respectivamente.
Teorema 2.4.5. (Maximizacin de una funcin convexa en un conjunto convexo
compacto)
Sean D c R
n
un conjunto convexo compacto e f una funcin convexa en un conjunto
abierto que contiene a D. Entonces el problema
max f (x) sujeto a x e D
tiene una solucin que es un punto extremo de D.
Demostracin: Por el Teorema 2.4.2, f es continua en D. Sea x eD una solucin del
problema, cuya existencia se sigue del Teorema de Weierstrass (Teorema 1.2.1). Por los
Teoremas de Krein-Milman y de Carathodory (Teoremas 3.2.8 y 3.2.2), podemos
escribir x como una combinacin convexa de un nmero finito de puntos extremos de
D:
1 , 1 ,
1 1
+ s = =

= =

n p x x
p
i
i
i
p
i
i
o o ,
. , , 1 , 0 ), ( p i D E x
i
i
= > e o
En esta representacin podemos admitir, sin prdida de generalidad, que o
i
> 0, i =
1,,p. Por la Desigualdad de Jensen (Corolario 3.2.2), tenemos que
f (

x ) s ). (
1
i
p
i
i
x f

=
o
Como f (

x ) > f (x) para todo x e D, se sigue que
f (

x ) s o
1
f(x
1
) + ) (
2

x f
p
i
i
o
= o
1
f(x
1
) + (1- o
1
) f (

x ).
Luego, 0 s o
1
( f(x
1
)- f (

x )). Tomando en cuenta que o
1
> 0, esto implica que
f (

x ) s f(x
1
).
Como

x es un minimizador de f en D, f (

x ) = f (x
1
), es decir, x
1
e ) (D E tambin es un
minimizador de f en D. (observemos que el mismo vale para todos los otros puntos
extremos que participan en la representacin de

x arriba, ya que podramos escoger


cualquiera de uno de ellos en lugar de x
1
.)
El resultado siguiente complementa el Teorema 2.4.5 sobre la maximizacin de
una funcin convexa. En lugar de la Hiptesis de que D sea compacto, suponemos
ahora que D es un conjunto poliedral que no contiene ninguna recta (por eso, el puede
ser ilimitado).
Teorema 2.4.6. (Maximizacin de una funcin convexa en un conjunto poliedral)
Sean D c R
n
un conjunto poliedral que no contiene ninguna recta y f : D R una
funcin convexa. Supongamos que el problema
max f (x) sujeto a x e D
posee una solucin. Entonces existe una solucin de este problema que es un vrtice de
D.
Demostracin: Por el Teorema 3.2.9, D = conv E (D) + R
D
.
Sea

x

una solucin del problema. Cuando

x e conv E (D), el mismo argumento


presentado en la prueba del Teorema 2.4.5 muestra que existe x e E (D), tal que f (x) =
f (

x ), es decir, algn x e E (D) tambin es una solucin.
Supongamos entonces que

x e conv E (D). En este caso, se tiene que

x

= x +
td, donde x e conv E (D), d e R
D
, t > 0. A continuacin mostraremos que f (x) > f (x +
td) = f(

x ), es decir, x e conv E (D) tambin es una solucin.
Como d e R
D
, se tiene que x + qd e D para todo q e R
+
(vea Definicin 3.2.3).
Por lo tanto, f (

x ) > f (x + qd) para todo q e R
+
. Por la convexidad de f, para todo q >
t, obtenemos que
f (

x ) = f (x + td)
= f ((t/q) (x + qd) + (1- t/q) x)
s (t/q) f (x + qd) + (1- t/q) f (x)
s (t/q) f (

x ) + (1- t/q) f (x).
Tomando lmite cuando q en la desigualdad arriba, obtenemos que
f (

x ) s f (x).
De nuevo, estamos en la situacin en que un punto x e conv E(D) es un maximizador
de f en D, por lo tanto, el argumento presentado en el Teorema 2.4.5 verifica el
resultado anunciado.
Como consecuencia del Teorema 2.4.6, cuando un problema de programacin
lineal tiene una solucin y su conjunto viable no contiene ninguna recta, podemos
afirmar que una de las soluciones es un vrtice del conjunto viable.
Corolario 2.4.3. Supongamos que D c R
n
sea un conjunto poliedral que no contiene
ninguna recta, y que el problema de programacin lineal
min x c, sujeto a x e D,
donde c e R
n
, tenga una solucin.
Entonces uno de los vrtices de D es una solucin del problema. En particular,
cuando la solucin es nica, ella es un vrtice de D.
Demostracin: El resultado se sigue aplicando el Teorema 2.4.6 al problema
-max x c, sujeto a x e D,
que tiene a su funcin objetiva cncava, y es equivalente al original.
En particular, si un problema de programacin lineal donde el conjunto viable
viene dado por
D = { } b x B a x A R x
n
s = e
+
, / ,
Posee una solucin, entonces una de las soluciones es vrtice de D (las restricciones x >
0 garantizan que D no contiene ninguna recta). El requerimiento de que las variables
sean no negativas es muy comn en la prctica.
Observamos que las afirmaciones del Corolario 2.4.3 tambin son verdaderas
para un problema de maximizacin de funcin lineal en un conjunto poliedral que no
contiene rectas.

2.4.2 Funciones convexas diferenciables
Cuando una funcin es diferenciable, la convexidad admite varias
caracterizaciones que son muy tiles para determinar si una funcin es convexa o no.
Teorema 2.4.7. (Caracterizaciones de funciones convexas diferenciables)
Sean D c R
n
un conjunto convexo y abierto y f : D R una funcin diferenciable en D.
Entonces las propiedades siguientes son equivalentes:
(a) La funcin f es convexa en D
(b) Para todo x e D y todo y e D,
f (y) > f (x) + x y x f ), (

.
(c) Para todo x e D y todo y e D,
0 ), ( ) (

> x y y f x f
Cuando f es dos veces diferenciable en D, las propiedades arriba tambin son
equivalentes a
(d) La matriz Hessiana de f es semidefinida positiva en todo punto de D:
0 , ) (

> d d x f x e D, d e R
n
.
Demostracin: Mostraremos primero que (a) (b) (c).
Sea f convexa. Para x e D, y e D y o e (0, 1| cualesquiera, definiendo d = y-x,
tenemos que
f (x + od) = f (oy + (1- o) x)
s o f (y) + (1- o) f (x),
Donde
o (f (y)- f (x)) > f (x + od) f (x).
Dividiendo los dos lados de la desigualdad arriba por o > 0, y pasando al lmite cuando
o 0
+
, obtenemos
f (y) - f (x) >
o
(o) ()
o

= . ), ( ), (

x y x f d x f =
Cambiando ahora el papel de x e y en tem (b), tenemos
f (x) > f (y) + y x y f ), (

.
Sumando esta desigualdad con la de (b), inmediatamente obtenemos (c).
Mostraremos ahora que (c) (b) (a).
Sean x e D, y e D. Por el teorema del Valor Medio, existe oe (0,1) tal que
f (y) - f (x) = ) ( )), ( (

x y x y x f +o . (2.36)
Usando (c) para los puntos ( ) ( x y x +o ) y x, obtenemos
) ( )), ( (

x y x y x f +o = o
-1
) ( )), ( (

x y x y x f + o o
> o
-1
) ( ), (

x y x f o
= x y x f ), (

.
Combinando esta desigualdad con (2.36), obtenemos (b).
Definiendo de nuevo d = y-x, tenemos
f (x) > f (x + od) - o , ), (

d d x f o +
f (y) > f (x + od) + (1- o) , ), (

d d x f o +
donde usamos (b) para los puntos x y (x + od); y e (x + od), respectivamente.
Multiplicando la primera desigualdad por (1 - o) > 0 y la segunda por o > 0, y
sumando, obtenemos
(1- o) f (x) + o f (y) > (1- o) (f (x + od) - o ) ), (

d d x f o +
+ o (f (x + od) + (1- o) d d x f ), (

o +
= f (x + od)
= f ((1- o) x + o y),
Lo que muestra que f es convexa.
Supongamos ahora que f sea dos veces diferenciable en D.
Es suficiente mostrar que (b) (d).
Fijemos x e D y d e R
n
cualesquiera. Como D es abierto, x + od e D para todo
o > 0 suficientemente pequeo. Por (b),
f (x + od) f (x) > o d x f ), (

.
Usando todava la diferenciabilidad de f,
0 s f (x + od) f (x) - o d x f ), (


= o
2
/2 ) ( , ) (
2
o o d d x f + .
Dividiendo por o
2
> 0 y tomando el lmite cuando o 0
+
, obtenemos (d).
Sean x e D , y e D cualesquiera. Por el Teorema del Valor Medio, existe oe
(0,1) tal que
f (y) f (x) - x y x f ), (

= 1/2 0 , ) ))( ( (

> + x y x y x y x f o ,
donde la desigualdad sigue de (d). Por lo tanto, (d) (b).

Figura 2.4.8: Ilustracin del Teorema 2.4.7 (b). Para todo y, se tiene que f (y) > f (x) +
x y x f ), (

donde x es fijo, pero arbitrario.
El tem (b) del Teorema 2.4.7 dice que, en todo punto, la aproximacin de
primer orden de una funcin convexa siempre est abajo del grfico de la funcin (vea
Figura 2.4.8). El tem (c) dice que el gradiente de una funcin convexa es montono.
A seguir mostraremos que de hecho todo punto estacionario es minimizador global. En
otras palabras, en el caso convexo las condiciones de optimalidad tambin son
suficientes.
Teorema 2.4.8. (Condiciones necesarias y suficientes para un problema de
minimizacin convexo)
Sean D c R
n
un conjunto convexo y f : C R una funcin convexa y diferenciable en
el conjunto abierto C que contiene a D.
Entonces

x

es un minimizador de f en D si, y solo si,
0 ), (

>

x x x f

x e D, (2.37)
O equivalentemente,
) (


x f e
D
(

x ). (2.38)
Todava, la condicin (3.37) es equivalente a
0 ), (

>

x x x f x e D, (2.39)
Si d es cerrado, (3.37) y (3.39) tambin son equivalentes a la siguiente condicin:

x

= P
D
(

x - o ) (


x f ) para algn o > 0. (2.40)
Demostracin: Las condiciones (2.37) y (2.38) son equivalentes por la convexidad de
D, independientemente de la convexidad de f (vea el Teorema 2.1.3).
Si

x

es un minimizador, (2.37) y (2.40) son satisfechos por los Teoremas 2.1.3 y
3.2.5, respectivamente.
Supongamos que valga (2.37). Usando el Teorema 2.4.7 (b), obtenemos que para
cualesquier x e D,
f (x) > f (

x ) + ) ( ), (


> x f x x x f ,
es decir,

x

es minimizador global.
Supongamos ahora que valga (2.40), es decir,

x

es una solucin del problema
min (x) sujeto a x e D,
donde
(x) =
2

)) ( (
2
1

x f x x o , o > 0.
Por el Teorema 2.1.3, para todo x e D se tiene que
0 s

x x x), (


=

x x x f x x )), ( (

o
= o

x x x f ), (

.
Como o > 0, vale (2.37). Como ya mostramos, esto implica que

x es un minimizador
global.
Finalmente, probaremos la equivalencia entre (2.37) y (2.39).
Supongamos (2.37). Por el Teorema 2.4.7 (c),


s x x x f x x x f x f ), ( ), ( ) (


Donde la segunda desigualdad sigue de (2.37).
Supongamos (2.39). Sean x e D y o e (0, 1| cualesquiera. Tenemos que
0 s

+ + x x x x x f ) ) 1 ( ( ), ) 1 ( (

o o o o


= o

+ x x x x f ), ) 1 ( (

o o

Dividiendo los dos lados de la desigualdad arriba por o > 0 y pasando al lmite cuando
o 0
+
, obtenemos (2.37) (pues los gradientes de una funcin convexa diferenciable
son continuas, como se ver en la Proposicin 3.4.4).
Como consecuencia del resultado arriba, obtenemos que la condicin ) (


x f es
necesaria y suficiente para optimalidad en el caso de minimizacin irrestricta de una
funcin convexa diferenciable.
A seguir, probamos que en un problema de minimizacin convexo no solo el
valor de la funcin objetivo es constante en el conjunto de soluciones (lo que es obvio),
ms tambin el gradiente de la funcin objetivo es constante en este conjunto (lo que no
es obvio en el caso de minimizacin con restricciones).
Teorema 2.4.9. (Invarianza de gradiente de la funcin objetivo en el conjunto de
soluciones de un problema de minimizacin convexo)
Sean f : R
n
R una funcin convexa dos veces diferenciable y D c R
n
un conjunto
convexo cerrado. Sea

x

cualquier minimizador de f en D.
Entonces
.
x e D es un minimizador de f en D, s y solo s,
) (

.
x f = ) (


x f ,
.
x x x f ), (

= 0. (2.41)
Demostracin: Sea

v = f (

x ) el valor ptimo del problema.
Supongamos que valga (2.41). Por el Teorema 2.4.7 (b),

v = f (

x ) > ) (
.
x f +
.
x x x f ), ( = ) (
.
x f .
Tenemos entonces que

v = ) (
.
x f , y como e D por la hiptesis, se sigue que es una
solucin del problema.
Supongamos ahora que
.
x es un minimizador de f en D. Luego,

v = f (

x ) = ) (
.
x f > f (

x ) +
.
x x x f ), (

,
Donde de nuevo hemos utilizado el Teorema 2.4.7 (b). Concluimos que
.
x x x f ), (

s 0 .Por otro lado (vea el Teorema 2.4.8), como e D, vale


.
x x x f ), (

> 0. Esto
prueba la segunda relacin en (2.41).
Intercambiando el papel de
.
x y x en la segunda relacin en (2.41), tenemos
que

. .
x x x f ), ( = 0.
Ahora, combinando esta igualdad con la segunda relacin en (3.41), obtenemos
0 =
. .
x x x f x f ), ( ) (

. (2.42)
Por el Teorema del Valor medio,
) ( ) (

.
x f x f = ( ( ))( )


= Q ( ), (2.43)
Donde
Q = ( ( ))

.
Definimos
: R
n
R, (x) = .
Con esta definicin, tenemos que (vea 2.42)
( ) = 0.
Como f(x) e R (n, n) es una matriz simtrica semidefinida positiva para todo x e R
n

(Teorema 2.4.7 (d)), se sigue que el mismo vale para Q e R (n, n), por la propia
definicin de Q. Por lo tanto,
(x) > 0 x e R
n
.
Concluimos que es un minimizador de en R
n
. Luego,
0 = ( ) = 2 Q ( ).
Ahora (2.43) implica que f( ) f() = 0.
Corolario 2.4.4. El conjunto de soluciones de un problema de programacin cuadrtica
convexa siempre es un conjunto poliedral.
Demostracin: Consideramos el problema
min

sujeto a xeD,
donde Q e R (n,n) es una matriz simtrica semidefinida positiva, q e R
n
, y D es un
conjunto poliedral.
Cuando el conjunto de soluciones es vacio, la afirmacin vale trivialmente. Sea

x una solucin cualquiera. Por el Teorema 2.4.9, cualquier otra solucin


.
x se
caracteriza por
Q
.
x + q = Q

x + q,

x
.
x

x = 0.
O sea,
Q
.
x = Q

x , 0 =
.
x

x

x (
.
x

x )
.
x

x .
Por lo tanto, el conjunto de soluciones del problema viene dado por
D {



x

x },
Que es un conjunto poliedral.
Para las funciones diferenciables fuertemente convexas, tenemos criterios que
son anlogos a aquellos del Teorema 2.4.7 para las funciones convexas.
Teorema 2.4.10 (Caracterizaciones de las funciones fuertemente convexas
diferenciables)
Sean D c R
n
un conjunto convexo y abierto y f : D R una funcin diferenciable en D,
con derivada continua en D.
Entonces las propiedades siguientes son equivalentes:
(a) La funcin f es fuertemente convexa en D con mdulo > 0.
(b) Para todo x, y e D,
f (y) > f (x) + ()
2
.
(c) Para todo x, y e D,
() () >
2
.
Cuando f es dos veces diferenciable en D, las propiedades arriba tambin son
equivalentes a
(d) La matriz Hessiana de f es definida positiva uniformemente en D, es decir,

x e D, () >
2
d e R
n
.
Demostracin: La demostracin de este Teorema es similar a la demostracin del
Teorema 2.4.7 y lo dejamos como ejercicio.

Figura 2.4.9 Ilustracin del Teorema 2.4.10 (b). Para todo y, se tiene que f (y) > f (x) +
()
2
, donde x es fijo, pero arbitrario.
El tem (b) del Teorema 2.4.10 dice que existe una funcin cuadrtica
fuertemente convexa que tiene el mismo valor de f en el punto x y que est abajo del
grfico de f en todo punto y = x; vea la Figura 2.4.9. El tem (c) dice que el gradiente de
una funcin fuertemente convexa es fuertemente montono.
En particular, una funcin cuadrtica
f (x) =

,
donde Q e R (n,n) es una matriz simtrica, q e R
n
, es convexa, si y solo si, Q es
semidefinida positiva; f es fuertemente convexa, si y slo si, Q es definida positiva.
Bibliografa
1. Izmailov, A.,Solodov, M., Otimizaao-volume 1, Condiciones de otimalidade,
Elementos de Anlise convexa e de Dualidade. IMPA (2005).
2. Lima, E. Curso de Anlise, volumen 1, IMPA (2002).
3. Crouzeix, J., Ocaa, E. Anlisis Convexo. IMCA (2003).
4. Crouzeix, J. La convexidad generalizada en economa matemtica. IMCA
(2005).