Anda di halaman 1dari 17

Aproximacin funcional e interpolacin

Laboratori de Clcul Numric (LaCN)


8 de septiembre de 2009

1. Introduccin
Una funcin p(x) definida en un intervalo [a, b] aproxima a una funcin
f (x) en el mismo intervalo si

p(x) ' f (x) (1)

Para describir un mtodo de aproximacin funcional, son necesarios dos


ingredientes fundamentales. En primer lugar, hay que definir el espacio de
funciones donde se elige el aproximante p(x). Es decir, hay que elegir el tipo
de aproximacin.
En segundo lugar, es necesario formalizar matemticamente el significado
de es aproximadamente igual a, '. Es decir, hay que definir el criterio de
aproximacin.
Ambos aspectos sern discutidos a continuacin. Comentemos antes la
utilidad de la aproximacin funcional. Se utiliza en dos situaciones tpicas:
con la funcin dato f (x) conocida a partir de su expresin analtica, o con
f (x) conocida de forma discreta, nicamente en unos puntos base xi (i =
0, . . . , n).
Si se dispone de la expresin de f (x), el objetivo es aproximarla por una
funcin p(x) ms manejable y computable, que habitualmente nos permitir
adems aproximar integrales o derivadas de la funcin original.
Si slo se dispone de valores discretos f (xi ), adems del objetivo reseado,
nos interesa obtener p(x) para poder evaluarlo en puntos distintos a los puntos
base. Las funciones discretas son comunes en muchas reas, desde el diseo
asistido por ordenador (CAD) al tratamiento de seales, pasando por las
medidas experimentales.

1
1.1. Tipo de aproximacin
En la gran mayora de aplicaciones prcticas, se trabaja con espacios
de funciones de dimensin finita, y se expresa el aproximante p(x) como
combinacin lineal de los trminos de una base. De esta forma, una vez elegido
el espacio de funciones y el criterio de aproximacin, la determinacin del
aproximante p(x) se reduce a la obtencin de los coeficientes de combinacin
lineal.
Los espacios de funciones ms utilizados son los siguientes:
1. Polinomios n
X
p(x) = ai x i (2)
i=0

2. Funciones trigonomtricas (series de Fourier):


Xn
p(x) = ai cos(ix) + bi sin(ix) (3)
i=0

3. Funciones exponenciales
n
X
p(x) = ai exp(bi x) (4)
i=0

4. Funciones racionales Pn i
i=0 ai x
p(x) = Pm j
(5)
j=0 bj x

5. Funciones definidas a trozos


Los polinomios son, con diferencia, las funciones ms utilizadas en la
aproximacin funcional. Tienen dos propiedades muy atractivas: son fciles
de calcular, y sus derivadas e integrales son tambin polinomios.
Las funciones trigonomtricas y las exponenciales tienen propiedades in-
teresantes para el tratamiento de seales y en la resolucin numrica de
ecuaciones en derivadas parciales. Son algo ms difciles de tratar que los
polinomios. Sus derivadas e integrales son funciones del mismo tipo.
Las funciones racionales son fciles de calcular, pero sus derivadas e inte-
grales son complicadas. Su principal inters es que, a diferencia de las dems
funciones comentadas, permiten obtener aproximantes p(x) con asntotas ver-
ticales.
Para cualquiera de estas funciones, lo ms habitual es aproximar la fun-
cin f (x) por una nica funcin p(x) en todo el intervalo [a, b]. En algunas
aplicaciones, sin embargo, resultar ms conveniente definir el aproximante
a trozos, dividiendo el intervalo [a, b] en subintervalos.

2
1.2. Criterios de aproximacin
Una vez definido el tipo de aproximacin, tres mtodos permiten escoger
las constantes que determinan el aproximante.

Interpolacin
Una vez fijados n + 1 puntos base {x0 , x1 , . . . , xn }, se exige que

p(xi ) = f (xi ) para i = 0, . . . , n (6)

Esta idea se puede generalizar al caso en que, adems de los valores de la


funcin f (x) en los puntos base, se conozcan algunas de sus derivadas. As
pues, el desarrollo en serie de Taylor puede considerarse un caso particular
de la interpolacin.

Aproximacin por mnimos cuadrados


Definida la norma L2 (eucldea) de forma discreta o continua, se minimiza
la distancia entre el aproximante p(x) y la funcin f (x):

mn (||f (x) p(x)||2 )2 (7)


p(x)

La norma L2 de una funcin g(x) se define como


Z b 1/2
2
||g(x)||2 = [g(x)] dx (8)
a

en forma continua y como


( n )1/2
X
||g(x)||2 = [g(xi )]2 (9)
i=0

en forma discreta (asociada a los n + 1 puntos base {x0 , x1 , . . . , n}).


Tal y como discutiremos ms adelante, en algunos casos puede resultar
interesante incluir una funcin de peso w(x) en la definicin de la norma L2 .

Aproximacin mini-max
La idea es parecida a la aproximacin por mnimos cuadrados, pero se
trabaja con la norma L (norma del mximo), que se define como

||g(x)|| = max |g(x)| (10)


x[a,b]

3
en forma continua y como

||g(x)|| = max |g(xi )| (11)


i=0,...,n

en forma discreta.
El objetivo es, de nuevo, minimizar la distancia entre la funcin f (x) y el
aproximante p(x):

mn ||f (x) p(x)|| = mn {max |f (x) p(x)|} (12)


p(x) p(x)

1.3. Teorema de Weierstrass


Para terminar este apartado de introduccin, enunciaremos el teorema de
Weierstrass, que establece la bondad de los polinomios como funciones de
aproximacin.

Teorema 1. Sea f (x) continua en [a, b]. Para cualquier > 0, existe un
entero n que depende de , n(), tal que

|f (x) pn (x)| < (13)

para cualquier x [a, b], donde pn (x) es un polinomio de grado n.

Es decir, toda funcin continua puede aproximarse uniformemente hasta


una precisin arbitraria deseada mediante un polinomio. Conviene observar
que el teorema no indica el grado del polinomio.

2. Interpolacin polinmica
Uno de los mtodos de aproximacin funcional es la interpolacin polin-
mica. Ntese que el nombre indica tanto el tipo de aproximacin (polinomios)
como el criterio de aproximacin (interpolacin).

2.1. Propiedades bsicas de los polinomios


Empezaremos recordando algunas propiedades bsicas de los polinomios,
que nos resultarn tiles al estudiar las distintas tcnicas de obtencin del
polinomio interpolador p(x).

4
Estructura de espacio vectorial de los polinomios
Sea Pn el conjunto de los polinomios de grado menor o igual a n. Este
conjunto tiene estructura de espacio vectorial. Esto significa que cualquier
polinomio de Pn puede escribirse como combinacin lineal de los elementos
de una base. De hecho, la forma habitual de escribir un polinomio,
n
X
pn (x) = ai x i = a0 + a1 x + a2 x 2 + an x n (14)
i=0

corresponde a expresarlo en la llamada base trivial de los polinomios,

{1, x, x2 , . . . , xn } (15)

El nmero de elementos de la base (n + 1) indica la dimensin del es-


pacio Pn . Ntese que los coeficientes ai del polinomio son, por lo tanto, sus
componentes en la base trivial.
La base trivial de polinomios es una manera muy cmoda y natural de
expresar un polinomio. Sin embargo, en algunos casos resultar preferible
trabajar con otras bases, tal y como discutiremos ms adelante.

Evaluacin de polinomios: regla de Horner


Cuntas operaciones son necesarias para evaluar un polinomio pn (x) en
un cierto punto x? Depende de cmo se organicen las operaciones (sumas y
productos) de la ecuacin (14).
Si se efectan i 1 productos para calcular xi , se realizan n(n + 1)/2
productos y n sumas (comprubese). Est claro que esta manera de evaluar el
polinomio es poco eficiente: si se utiliza una variable auxiliar para almacenar
la potencia xi1 , entonces el clculo de xi implica un nico producto (en
lugar de i 1). De esta forma se consigue reducir el nmero de operaciones
a 2n 1 productos y n sumas (verifquese).
Este nmero de operaciones puede rebajarse ms utilizando la llamada
regla de Horner, que consiste en evaluar pn (x) como
  

pn (x) = a0 + x a1 + x a2 + x + x (an1 + xan ) (16)

La expresin (16) contiene nicamente n productos y n sumas. Esta re-


duccin en el nmero de productos es un aspecto relevante siempre que sea
necesario evaluar un polinomio muchas veces durante un clculo.

5
Desarrollo en serie de Taylor
Una funcin f (x) suficientemente continua puede aproximarse por un
polinomio p(x) en el entorno de un punto mediante un desarrollo en serie de
Taylor.
Si f (x) es de clase C n+1 (continua y con las n + 1 primeras derivadas
continuas) en el entorno de un punto x0 , puede expresarse como

f (x) = pn (x) + Rn (x) (17)

con

0 (x x0 )2 00 (x x0 )n n)
pn (x) = f (x0 ) + (x x0 )f (x0 ) + f (x0 ) + + f (x0 )
2! n!
(18)
n+1
(x x0 )
Rn (x) = f n+1) ((x)) con [x0 , x] (19)
(n + 1)!

La diferencia entre la funcin f (x) y el polinomio aproximante pn (x) es el


resto de Lagrange Rn (x), que puede interpretarse como un caso particular de
error de truncamiento: el desarrollo en serie de Taylor se trunca en un nmero
finito de trminos. Dicho error de truncamiento depende de la derivada (n +
1)-sima de f (x) en un cierto punto (x) desconocido del intervalo [x0 , x].

Observacin 1. Se denota por [x0 , x] el intervalo de extremos x0 y x, ya sea


con x0 < x o con x < x0 .

Puesto que (x) es desconocido, no podremos, en general, evaluar el resto


de Lagrange. A efectos prcticos, sin embargo, ser suficiente obtener una
cota de dicho error:
|x x0 |n+1
|Rn (x)| max |f n+1) ( )| (20)
(n + 1)! [x0 ,x]

2.2. Teorema fundamental del lgebra


En qu condiciones puede garantizarse la existencia y unicidad del poli-
nomio interpolador? El siguiente teorema aborda esta cuestin.

Teorema 2. Sea (xi , f (xi )) con i = 0, . . . , n un conjunto de n + 1 puntos


tales que xi 6= xj para i 6= j (abscisas diferentes). Entonces, existe un nico
polinomio pn (x) de grado menor o igual que n tal que p(xi ) = f (xi ) para
i = 0, . . . , n.

6
Demostracin
La demostracin es constructiva: adems de demostrar que el polinomio
existe y es nico, veremos un posible procedimiento para obtenerlo.
Para ello, resulta til expresar el polinomio pn (x) en la base trivial, ecua-
cin (14):
X n
pn (x) = aj x j
j=0

Se trata simplemente de obtener los coeficientes aj . Impongamos el crite-


rio de interpolacin. Para i = 0, . . . , n, debe verificarse que pn (xi ) = f (xi ) y,
por tanto:
Xn
aj xji = f (xi ) (21)
j=0

Tenemos pues un sistema lineal de orden n + 1:



1 x0 x20 xn0 a 0

f (x 0 )

1 x1 x21 xn1 a f (x )





1
1
1
x2 x22 xn2 a 2 = f (x 2 ) (22)
.. .. .. . . .. .. ..
. . . . . .



.

2 n

1 xn xn xn an f (xn )

La matriz del sistema (22) es una matriz de Vandermonde, cuyo deter-


minante es distinto de cero si todas las xi son distintas. As pues, el sistema
lineal a resolver para obtener los coeficientes ai es compatible y determinado
y, por lo tanto, el polinomio interpolador pn (x) existe y es nico.

Observacin 2. Al resolver el sistema (22), puede ocurrir que el coeficiente


an (y otros) sea nulo. El polinomio pn (x) es entonces de grado menor que n.
En cualquier caso, el teorema garantiza que se trata del nico polinomio de
grado menor o igual que n que interpola los n + 1 puntos dados.

A pesar de responder a una idea muy natural, el procedimiento descrito


plantea dos inconvenientes: la matriz de Vandermonde es mal condicionada
y, adems, no se dispone de ningn tipo de informacin sobre el resto de
Lagrange.
En la prctica se utilizan otros mtodos para obtener el polinomio inter-
polador, que corresponden a trabajar con bases de polinomios distintas a la
trivial.

7
2.3. Interpolacin de Lagrange
En la interpolacin de Lagrange, el polinomio pn (x) se expresa como
n
X
pn (x) = ai Li (x) (23)
i=0

donde
{L0 (x), L1 (x), L2 (x), . . . , Ln (x)} (24)
es la base de polinomios de Lagrange, que enseguida definiremos.
Al imponer el criterio de interpolacin, se obtiene el sistema lineal

L0 (x0 ) L1 (x0 ) Ln (x0 ) a
0
f (x )
0
L0 (x1 ) L1 (x1 ) Ln (x0 )
a1 f (x1 )
= (25)

.. .. .. .. .. ..
. . . . .

.


L0 (xn ) L1 (xn ) Ln (xn ) an f (xn )

La idea de la interpolacin de Lagrange es simplificar al mximo el sistema


lineal a resolver. De hecho, se exige que la matriz sea la identidad. Ello
equivale a imponer que los polinomios de Lagrange verifiquen

Li (xj ) = ij (26)

donde ij es la delta de Kronecker (ij = 1 para i = j, ij = 0 para i 6= j).


Esto se consigue definiendo los polinomios de Lagrange como
Qn
j=0 (x xj )
j6=i (x x0 ) (x xi1 )(x xi+1 ) (x xn )
Li (x) = Qn =
j=0 (xi xj ) (xi x0 ) (xi xi1 )(xi xi+1 ) (xi xn )
j6=i
(27)
Ntese que todos los polinomios Li (x) son de grado n.
Puesto que la matriz del sistema (25) es la identidad, los coeficientes ai
son simplemente las ordenadas f (xi ), y el polinomio interpolador se escribe
como n
X
pn (x) = f (xi )Li (x) (28)
i=0

Tal y como comentbamos en el apartado 2.1, trabajar con una base de


polinomios distinta a la trivial resulta claramente ventajoso, por que los datos
f (xi ) son directamente los coeficientes de combinacin lineal.
Otra ventaja de la interpolacin de Lagrange es que nos proporciona una
expresin del resto de Lagrange.

8
El resto de Lagrange
La ecuacin (19) proporciona el resto de Lagrange para el desarrollo en
serie de Taylor, en el que el polinomio aproximante se obtiene a partir del
valor de la funcin y sus n primeras derivadas en un mismo punto x0 .
Cmo es el resto de Lagrange para la interpolacin polinmica a partir
de n + 1 puntos?
Proposicin 1. Sea f (x) una funcin de clase C n+1 y sea pn (x) el polinomio
interpolador puro que verifica pn (xi ) = f (xi ) para i = 0, . . . , n. Sea Rn (x)
el error de pn (x) como aproximante de f (x), f (x) = pn (x) + Rn (x). Dicho
resto de Lagrange Rn (x) puede expresarse como
f n+1) ()
Rn (x) = L(x) (29)
(n + 1)!
con
[x0 , x1 , . . . , xn , x] (30)
Yn
L(x) = (x xi ) = (x x0 )(x x1 ) (x xn ) (31)
i=0

Demostracin
Comprobemos en primer lugar que la expresin (29) es vlida para los
puntos base de la interpolacin xi . Para ello, basta notar que L(xi ) = 0
(L(x) es precisamente un polinomio de grado n + 1 que tiene como ceros
los puntos base xi ) y, en consecuencia, Rn (xi ) = 0, tal como corresponde al
criterio de interpolacin, pn (xi ) = f (xi ).
Pasemos ahora al caso no trivial: x = x 6= xi . Empezaremos definiendo
una funcin auxiliar g(x) como
g(x) = f (x) pn (x) KL(x) (32)
Puesto que L(x) 6= 0, la constante K puede definirse de tal manera que
la funcin g(x) se anule en el punto x que estamos considerando:

f (x) pn (x)
g(x) = 0 K = (33)
L(x)
De esta forma, podemos asegurar que la funcin g(x) tiene, como mnimo,
n+2 ceros en el intervalo [x0 , x1 , . . . , xn , x] (es decir, el intervalo que contiene
a todos estos puntos): los n + 1 puntos base xi y el punto x.
Si aplicamos reiteradamente el teorema de Rolle, podemos asegurar que,
en el intervalo [x0 , x1 , . . . , xn , x], la funcin g 0 (x) tiene, como mnimo, n + 1
ceros; la funcin g 00 (x), n ceros; . . . ; la funcin g n+1) (x), un cero .

9
Recordando que pn (x) y L(x) son polinomios de grado n y n + 1 respec-
tivamente, la derivada n + 1-sima de g(x) es

g n+1) (x) = f n+1) (x) K(n + 1)! (34)

Puesto que g n+1) () = 0, podemos obtener una nueva expresin para K:

f n+1) ()
g n+1) () = f n+1) () K(n + 1)! = 0 K = (35)
(n + 1)!

Finalmente, basta igualar las dos expresiones de K, ecuaciones (33) y (35)


para obtener que
f n+1) ()
f (x) = pn (x) + L(x) (36)
(n + 1)!
y verificar que la expresin del resto de Lagrange dada por la ecuacin (29)
es efectivamente vlida.

Observacin 3. Ntese que depende de x: al variar el punto x, vara


tambin la funcin auxiliar g(x) y, en consecuencia, tambin lo hace el cero
de su derivada (n + 1)-sima.

10
3. Aproximacin por mnimos cuadrados
3.1. Motivacin
En algunas aplicaciones, el criterio de interpolacin (polinmica o de otro
tipo) no resultar satisfactorio. Puede ocurrir, por ejemplo, que los datos
f (xi ) sean medidas experimentales afectadas por un cierto error inherente;
en ese caso, no tiene demasiado sentido exigir que la funcin aproximante
p(x) pase exactamente por unos puntos que contienen errores.
Por otra parte, al aumentar el nmero de puntos base xi , el polinomio
interpolador puro presenta muchas oscilaciones ya que aumenta su grado
n, y esto dificulta o impide su utilizacin en muchas aplicaciones: dibujo
por ordenador, clculo de derivadas, integracin numrica, etc. Resultar
preferible utilizar una funcin ms suave (por ejemplo, un polinomio de grado
m < n) y renunciar al criterio de interpolacin.
Comentemos, para terminar, una aplicacin muy habitual de la apro-
ximacin por mnimos cuadrados en la que se combinan estas dos ideas.
Supongamos que disponemos de un cierto modelo terico de un fenmeno f-
sico. Por ejemplo, una relacin cuadrtica entre la abscisa x y la ordenada y,
y = f (x) = ax2 +bx+c. Tenemos tambin medidas experimentales, (xi , f (xi ))
con i = 0, . . . , n. Nuestro objetivo es determinar el polinomio p2 (x) (es decir,
los coeficientes a, b y c) ptimo en el sentido de mnimos cuadrados. No nos
interesa obtener el polinomio interpolador puro pn (x) por tres motivos: (1)
los datos experimentales estn afectados por errores de medida y (2) pn (x)
presenta oscilaciones importantes que no se ajustan a la fsica del problema
que, segn hemos supuesto, (3) se describe mejor por un polinomio de grado
2.

3.2. Planteamiento general


Recordemos (vase el apartado 1.2) que la aproximacin por mnimos
cuadrados consiste en minimizar ||f (x) p(x)||, es decir la distancia (medida
en norma eucldea) entre la funcin f (x) y el aproximante p(x). Esta norma
est inducida por un producto escalar, < , >: ||f p||2 =< f p, f p >.
Recordemos en primer lugar las propiedades de las normas y los productos
escalares:

Producto escalar
< , > es un producto escalar si es una forma bilineal simtrica y definida
positiva:

11
1. Linealidad: < f + g, h >= < f, h > + < g, h > para escalares ,
y funciones f , g y h cualesquiera.
2. Simetra: < f, g >=< g, f > para funciones f y g cualesquiera.
3. Definicin positiva: < f, f > 0; < f, f >= 0 f = 0

Norma
|| || es una norma si, para funciones f y g y escalar cualesquiera,
1. ||f || 0; ||f || = 0 f = 0
2. ||f || = ||||f ||
3. ||f + g|| ||f || + ||g||
Es importante observar que disponemos, tanto para el producto escalar
como para la correspondiente norma eucldea inducida, de dos versiones, la
continua y la discreta:
(R b
2 a
f (x)g(x)dx caso continuo
||f || =< f, f > con < f, g >= P n (37)
i=0 f (xi )g(xi ) caso discreto

En ambos casos, puede resultar til incluir una funcin de peso positiva
w(x) > 0 en la definicin del producto escalar:
(R b
a
w(x)f (x)g(x)dx caso continuo
< f, g >= P n (38)
i=0 wi f (xi )g(xi ) caso discreto

Antes de abordar, en el apartado siguiente, la obtencin del aproximante,


hagamos dos consideraciones fundamentales. En primer lugar, resulta equi-
valente y ms cmodo minimizar el cuadrado de la distancia entre la funcin
f (x) y el aproximante p(x) que la distancia,

E = (||f (x) p(x)||)2 =< f (x) p(x), f (x) p(x) > (39)

En segundo lugar, nos restringiremos al caso en que el aproximante p(x)


puede escribirse como combinacin lineal de las funciones de una base

{0 (x), 1 (x), . . . , m (x)} (40)

es decir,
m
X
p(x) = ci i (x) (41)
i=0

12
As pues, determinar el aproximante p(x) se reduce a determinar los co-
rrespondientes coeficientes ci .
El anlisis de combinaciones no lineales de funciones de aproximacin es
considerablemente ms complejo y menos utilizado que el caso lineal que
tratamos aqu.

3.3. Las ecuaciones normales


Gracias a la expresin (41), hemos modificado profundamente el problema
a resolver. Ya no se trata de minimizar el funcional E(f ), ecuacin (39), sino
nicamente de minimizar una funcin E de m + 1 variables reales:

mn E(c0 , c1 , . . . , cm )
cRm+1
( m m
)
X X
= mn
m+1
< f (x) ci i (x), f (x) cj j (x) > (42)
cR
i=0 j=0

La funcin E(c0 , c1 , . . . , cm ) es una funcin continua de los coeficientes


(c0 , c1 , . . . , cm ), vase [?]. Por consiguiente, se puede imponer la condicin
necesaria de extremo, es decir
E
= 0 para i = 0, . . . , m (43)
ci
Para ello, resulta til reescribir la ecuacin (39) como

E =< f (x), f (x) > 2 < p(x), f (x) > + < p(x), p(x) > (44)

Derivemos ahora respecto de ci . Puesto que p(x)/ci = i (x) se llega a

E
= 2 < i (x), f (x) > +2 < i (x), p(x) >= 0 para i = 0, . . . , m (45)
ci
Para la obtencin de las ecuaciones (44) y (45) se ha tenido en cuenta la
linealidad y la simetra del producto escalar.
La ecuacin (45) proporciona dos resultados de inters. En primer lugar,

< i (x), f (x) p(x) >= 0 para i = 0, . . . , m (46)

que establece la ortogonalidad entre la diferencia f (x) p(x) (o sea, el error


de p(x) como aproximacin a f (x)) y cada una de las funciones i (x). As
pues, la aproximacin por mnimos cuadrados puede interpretarse como la

13
proyeccin ortogonal (segn el producto escalar, continuo o discreto, de tra-
bajo) de la funcin f (x) sobre el espacio de aproximacin generado por las
funciones i (x).
En segundo lugar, expresando p(x) como combinacin lineal de las i (x)
llegamos a
m
X
< i (x), j (x) > cj =< (x), f (x) > para i = 0, . . . , m (47)
j=0

o, ms explcitamente, a

< 0 , 0 > < 0 , 1 >
< 0 , m > c 0
< 0 , f >

< 1 , 0 > < 1 , 1 >
< 1 , m > c1 < 1 , f >

=

.. .. .. .. .. ..
. . . . .

.


< m , 0 > < m , 1 > < m , m > cm < m , f >
(48)
Se trata de un sistema lineal de ecuaciones de orden m+1 cuyas incgnitas
son los coeficientes cj denominado ecuaciones normales.

Teorema 3. Si las funciones 0 (x), 1 (x), . . . , m (x) son linealmente inde-


pendientes, el problema de mnimos cuadrados (42) tiene una solucin nica,
m
X
p(x) = ci i (x)
i=0

donde los coeficientes ci verifican las ecuaciones normales (47).

Demostracin
Basta con comprobar que la matriz de las ecuaciones normales es regular
(en otras palabras, que el sistema lineal es compatible determinado). Para
ello, supondremos que la matriz es singular con funciones i (x) linealmente
independientes y llegaremos a una contradiccin.
Si la matriz es singular, el sistema lineal homogneo tiene soluciones dis-
tintas a la trivial,
m
X
< i , j > cj = 0 para i = 0, 1, . . . , m con algn cj 6= 0 (49)
j=0

14
Pm
Calculemos ahora la norma al cuadrado de la funcin j=0 cj j (x):

m
X
|| ci i (x)||2
i=0
m m m
" m #
X X X X
=< ci i (x), cj j (x) >= < i , j > cj ci = 0 (50)
i=0 j=0 i=0 j=0
| {z }
=0

Hemos llegado pues a la conclusin de que la funcin m


P
j=0 cj j (x) es nula
(la norma slo se anula para la funcin cero). Puesto que las funciones j (x)
son linealmente independientes, los coeficientes cj deben ser todos nulos. Esto
lleva a una contradiccin con la hiptesis realizada en la ecuacin (49).

La regresin lineal
Hasta ahora hemos discutido el criterio de aproximacin de mnimos cua-
drados, pero no hemos tratado el tipo de aproximacin, vanse los apartados
1.1 y 1.2.
Veamos un caso concreto de aproximacin por mnimos cuadrados: la
regresin lineal (ajuste de una recta a medidas experimentales). Corresponde
a elegir P1 (el espacio de polinomios de grado menor o igual que uno) como
espacio de aproximacin, la base trivial {0 (x) = 1, 1 (x) = x} y el producto
escalar discreto, ecuacin (37).
Las ecuaciones normales son, en este caso,
    
< 0 , 0 > < 0 , 1 > c0 < 0 , f >
=
< 1 , 0 > < 1 , 1 > c1 < 1 , f >
 Pm     Pm 
m + 1 i=0 x i c 0 f (x i )
= Pm Pm 2 = Pmi=0 (51)
i=0 xi i=0 xi c1 i=0 xi f (xi )

y la recta de regresin es p1 (x) = c0 + c1 x.

Malcondicionamiento de las ecuaciones normales


La matriz de las ecuaciones normales (48) puede ser muy mal condiciona-
da. Para ilustrar este punto, supongamos que el espacio de aproximacin en
Pm (polinomios de grado menor o igual que m), que se trabaja con la base
trivial,

0 (x) = 1 ; 1 (x) = x ; 2 (x) = x2 ;...; m (x) = xm (52)

15
Cuadro 1: Las matrices de Hilbert son muy mal condicionadas
Orden (m + 1) Nmero de condicin
2 1,9 101
3 5,2 102
5 4,8 105
10 1,6 1013
15 6,1 1020

y que el producto escalar es


Z 1
< f, g >= f (x)g(x)dx (53)
0

En estas condiciones, la matriz del sistema es la llamada matriz de Hilbert


de orden m + 1,

1 1/2 1/3 1/(m + 1)
..
1/2 1/3 .



1/3 .
..

(54)

.. ..
. .
1/(m + 1) 1/(2m + 1)

El cuadro 1 muestra la relacin entre el orden y el nmero de condicin


de la matriz de Hilbert.

3.4. Funciones ortogonales


Para eludir los problemas numricos asociados al malcondicionamiento de
las ecuaciones normales, puede optarse por trabajar con una base de funciones
ortogonales,
< i (x), j (x) >= 0 para i 6= j (55)
Se tiene entonces un sistema lineal de ecuaciones con matriz diagonal,

< 0 , 0 >
c0
< 0 , f >

< 1 , 1 > c1 < 1 , f >

=

... .. ..

.




.


< m , m > cm < m , f >
(56)

16
que puede resolverse explcitamente, obteniendo los llamados coeficientes de
Fourier ci ,
< i , f >
ci = para i = 0, . . . , m (57)
< i , i >
Para los aproximantes y productos escalares ms habituales, las corres-
pondientes funciones ortogonales pueden encontrarse tabuladas en manuales
de frmulas matemticas o en la biblioteca de funciones de distintos paquetes
de software matemtico.
Si se trabaja con aproximacin polinmica y el producto escalar continuo
en el intervalo [1, 1], por ejemplo, las funciones ortogonales son los llama-
dos polinomios de Legendre; si el producto escalar es discreto con puntos
equiespaciados en el intervalo [1, 1], los polinomios de Gram.

17

Anda mungkin juga menyukai