A=
(3.1a)
1 1
1
= 1
2 1
1
1 1
1
= 3
2 1
1
1
1
1
son vectores caractersticos, a los que corresponden
1
en este caso 1 = y 2 =
los valores propios 1 y 3, respectivamente. Otros vectores, no paralelos a los dos antes
mencionados, no cumplen la condicin (3.1a):
11 0
=
2 2 3
0
3
1
2
A=B
(3.1b)
El
B-1 A =
(3.2)
3-1
Sin embargo, si A y B son simtricas (como es, por ejemplo, el caso en problemas de
vibracin, en los que esas matrices son respectivamente rigideces y masas) conviene
ms hacer la descomposicin (Cholesky):
B = RT R
(3.3a)
= R-1 z
(3.3b)
-1
(3.3c)
B = B B
= B- z
(3.4)
B AB z=Hz=z
a ij
Donde hij =
.
bi b j
-
Ntese que los valores caractersticos son los mismos que los del problema original; los
correspondientes vectores caractersticos se relacionan mediante (3.4b).
3.1.2 Polinomio Caracterstico y Valores Propios
Las ecuaciones A = B pueden tambin rescribirse como:
(A - B ) = 0
(3.5a)
p( ) = det ( A B ) = 0
(3.5b)
1 2 3 n
s =
c
i
(3.6a)
i =1
Y entonces:
3-2
s =
c i i =
i =1
c
i
(3.6b)
i =1
s = s s =
c
i
(3.6c)
i =1
c (
i
i ) i = 0
i =1
Sin
A i = i B i
A i = i B i
(3.7)
A ( c1 1 + c2 2 + c3 3 + ) = i B ( c1 1 + c2 2 + c3 3 + )
Tenindose n vectores caractersticos linealmente independientes de dimensin n, estos
constituyen una base completa.
v = 1 1 + 2 2 + 3 3 + + n n
(3.8)
1 3 1 1 1
= 2 2
2
1
1
3.1.4 Ortogonalidad de los Vectores Caractersticos
Si las matrices A y B son Hermitianas (o simplemente simtricas) y definidas positivas,
los valores caractersticos de A = B son todos reales y positivos. Para probar
esto basta considerar:
s* r = r s* B r
(3.9a)
r* s = s r* B s
(3.9b)
*s r = *s *s B r
(3.9c)
*s *s B r = 0
(3.9d)
Si r=s, al ser B una matriz definida positiva se tendra *r B r > 0 . Por lo tanto, siendo
3-3
(3.10a)
*s A r = a r rs
(3.10b)
(1
2
1)
1
(1
2
1)
1
(1
2
1)
1
1 1
=2
2 1
1 1
=6
2 1
1 1
=0
2 1
*s B r = rs
(3.11a)
Se dice entonces que los vectores estn normalizados respecto a la matriz B. En tal
caso se tiene tambin:
*s A r = r rs
(3.11b)
( i ) =
Ti i
Ti B i
(3.12)
Esta expresin puede aplicarse tambin con aproximaciones a los vectores propios. Si x
es una aproximacin a un vector caracterstico con un error de orden , el cociente de
Rayleigh, (x), aproxima el correspondiente valor caracterstico con un error de orden .
2
3-4
A i = i i
(3.13a)
v
i = a s1 1
vs
v
+ a s 2 2
vs
v
+ L + a ss + L + a sn n
vs
(3.13b)
y por lo tanto:
i a ss = a s1 + a s 2 + L + 0 + L + a sn
(3.13c)
En consecuencia, cada valor caracterstico i est dentro de por lo menos uno de los
crculos con centro en a ss y radio igual a la suma de los valores absolutos de la
correspondiente fila s.
Por ejemplo, considerando la matriz:
2
A =
1
que es definida positiva, puede asegurarse que sus valores caractersticos (que son
nmeros reales) estn dentro de los intervalos (1,3) y (3,5). Efectivamente, en este caso
=3 2 .
3.1.8 Formas polinmicas
Supngase que se conocen los valores y vectores caractersticos de una matriz, A:
A=
(3.14a)
2
(AA) = A (A ) = A ( ) = (A )= 2
k
Los
vectores caractersticos son los mismos que los de la matriz A, mientras que los
correspondientes valores caractersticos son k:
Ak = k
(3.14b)
Esto es incluso vlido para exponentes negativos. Por ejemplo, multiplicando ambos
miembros de (3.15a) por A se obtiene:
-1
-1
A-1 = -1
(3.14c)
(3.14d)
2
A =
1
5
A 2 = AA =
4
3-5
tiene valores caractersticos 1 y 9 (es decir, los cuadrados de 1 y 3). Los vectores
caractersticos son los mismos para ambas matrices.
B x j +1 = A x j
x j +1 =
(3.15a)
x j +1
(3.15b)
r j +1
x0 = 1 1 + 2 2 + 3 3 + + n-1 n-1 + n n
(3.16a)
A x0 =
A = B
i
(3.16b)
x1 = B 1 Ax 0 = (1 1) 1 + (2 2) 2 + + (n n) n
(3.16c)
y por lo tanto:
x1 =
1
r1
( )
i
(3.16d)
Lim x k = n
(3.17a)
Lim rk = n
(3.17b)
Esto es vlido an cuando n = 0 puesto que, por lo menos al tratar con grandes
matrices, los errores de redondeo (debidos a la aritmtica imperfecta del computador)
introducen siempre una componente segn n.
3-6
A = 2
0
2
3
1
1
1
B = 0
0
0
2
0
0
3
xk
Ax k
x k +1
r k+1
1.00000
5.00000
5.00000
5.00000
0.00000
-2.00000
-1.00000
0.00000
0.00000
0.00000
1.00000
5.40000
5.40000
-0.20000
-2.60000
-1.30000
0.00000
0.20000
0.06667
1.00000
5.48148
5.48148
-0.24074
-2.73457
-1.36728
0.01235
0.25309
0.08436
1.00000
5.49887
5.49887
-0.24944
-2.76370
-1.38185
0.01539
0.26483
0.08828
1.00000
5.50259
5.50259
-0.25130
-2.76994
-1.38497
0.01605
0.26735
0.08912
1.00000
5.50339
5.50339
-0.25169
-2.77128
-1.38564
0.01620
0.26789
0.08930
1.00000
5.50356
5.50356
-0.25178
-2.77156
-1.38578
0.01623
0.26801
0.08934
(xk+1)
5.481481
5.40000
5.502594
5.48148
5.503559
5.49887
5.503603
5.50259
5.503605
5.50339
5.503605
5.50356
5.503605
1.00000
3-7
A x j +1 = B x j
x j +1 =
(3.18a)
x j +1
(3.18b)
r j +1
x0 = 1 1 + 2 2 + 3 3 + + n-1 n-1 + n n
(3.19a)
xk =
1
k1
1 +
2
k2
2 +
3
k3
3 + +
n 1
kn 1
n-1 +
n
kn
(3.19b)
Lim x k = 1
(3.20a)
1
1
(3.20b)
Lim rk =
k
0
x 0 = 1
2
se obtiene el vector asociado al valor caracterstico de menor mdulo, es decir, 1.
Ntese que r es ahora una aproximacin de 1 / 1, mientras que en la iteracin directa lo
era de n. Tambin en este caso se observa que el cociente de Rayleigh es siempre una
mejor aproximacin al valor caracterstico.
3-8
xk
k
0
Bx k
x k +1
r k+1
12.66667
0.00000
0.00000
2.66667
1.00000
2.00000
6.66667
2.00000
6.00000
12.66667
0.21053
0.21053
1.42105
0.52632
1.05263
3.44737
1.00000
3.00000
6.44737
0.22041
0.22041
1.42993
0.53469
1.06939
3.46463
1.00000
3.00000
6.46463
0.22119
0.22119
1.43102
0.53594
1.07187
3.46696
1.00000
3.00000
6.46696
0.22128
0.22128
1.43116
0.53610
1.07221
3.46727
1.00000
3.00000
6.46727
0.22129
0.22129
1.43118
0.53613
1.07225
3.46731
1.00000
3.00000
6.46731
0.22129
0.22129
1.43118
0.53613
1.07226
3.46731
1.00000
3.00000
6.46731
(xk+1)
0.154734
6.44737
0.154625
6.46463
0.154624
6.46696
0.154624
6.46727
0.154624
6.46731
0.154624
6.46731
0.154624
El nmero de operaciones
2
La
3-9
A=B
(3.21a)
(A - B) = () B
(3.21b)
Ntese que el nuevo sistema (3.21b) tiene los mismos vectores caractersticos que el
sistema original (3.21a) y valores caractersticos i - .
p( )
150
100
50
0
0
-50
1
1
<<
1
2 ,
y por tanto:
4.846
A 0.154 B = 2
0
2
2.692
1
1
0.538
xk
Bx k
x k +1
r k+1
0.00000
0.00000
692.29
3129.01
1.00000
2.00000
1677.41
2.00000
6.00000
3129.01
0.22125
0.22125
354.79
0.53608
1.07216
859.55
1.00000
3.00000
1603.26
0.22130
0.22130
354.80
0.53613
1.07226
859.57
1.00000
3.00000
1603.29
(xk+1)
0.000624
1603.26
0.000624
1603.29
0.000624
0.22129
1.00000
(A k B ) x k +1 = y k
H. Scaletti - Mtodos Numricos: Valores y Vectores Caractersticos
3 - 10
y k +1 = B x k +1
k +1 = k +
x Tk +1 y k
(3.22)
x Tk +1 y k +1
y k +1 = x Tk +1 y k +1
1
2
y k +1
Lim y k = B 1
(3.23a)
Lim k = 1
(3.23b)
La convergencia es cbica.
3.2.4 Determinacin de Otros Vectores Caractersticos
En los prrafos precedentes se ha visto cmo mediante iteracin directa o inversa
pueden obtenerse n o 1 respectivamente. Podra determinarse un valor caracterstico
intermedio y su vector asociado por iteracin inversa con una traslacin adecuada; sin
embargo, esto requerira un procedimiento previo para definir la traslacin.
En los que sigue se describe la determinacin de sucesivos vectores caractersticos
aprovechando las condiciones de ortogonalidad para el caso en que las matrices A y B
son simtricas.
previamente obtenidos.
vectores previos y cada nuevo vector se determina siempre con menos precisin que el
anterior. En la prctica se observa que se pierde una cifra significativa por cada nuevo
vector; por tanto, no es factible determinar por este mtodo ms de unos 10 vectores
caractersticos. En algunas aplicaciones esto puede no ser suficiente.
A partir de un vector arbitrario:
v = 1 1 + 2 2 + 3 3 + ... + n n
(3.24a)
iT B v = 1 iT B 1 + 2 iT B 2 + ... + n iT B n
iT B v = i iT B i
(3.24b)
i = ( iT B v ) / ( iT B i )
(3.24c)
es decir:
0.221295029
1 = 0.536128843
1.000000000
3 - 11
0.06548
x0 = v - 1 1 = 0.84136
0.29589
es un vector ortogonal a 1.
xk
Bx k
x k +1
r k+1
-0.06548
-0.06548
0.24319
0.64072
0.84136
1.68272
0.64072
-0.29589
-0.88767
-0.24696
0.37956
0.37956
0.40775
1.00000
2.00000
0.82960
-0.38544
-1.15631
-0.32671
0.49150
0.49150
0.43668
1.00000
2.00000
0.84594
-0.39382
-1.18147
-0.33553
0.51620
0.51620
0.44210
1.00000
2.00000
0.84715
-0.39663
-1.18990
-0.34275
0.52187
0.52187
0.43603
1.00000
2.00000
0.82913
-0.40460
-1.21379
-0.38466
(xk+1)
1.20534
0.82960
1.17649
0.84594
1.17517
0.84715
1.17504
0.82913
1.17113
componentes segn 1:
k
-1.565 x 10-6
-1.580 x 10-5
-0.000123
-0.000941
-0.007188
-0.056063
3 - 12
j 1
xj = v -
(3.25)
i =1
0.52588
0.221295029 0.53829
xk
Bx k
0.52258
k+1
r k+1
0.52258
0.44489
0.85094
1.00000
2.00000
0.85094
-0.39597
-1.18790
-0.33696
0.52282
0.52282
0.44496
1.00000
2.00000
0.85098
-0.39599
-1.18796
-0.33698
(xk+1)
1.17511
0.85098
1.17511
0.52288
1.00000
-0.39599
se obtienen: 2 =
1
= 1.17511 y 2 =
0.85098
0.52288
1.00000
0.39599
3.2.5 Deflacin
P = ( p1 p 2 L p n 1
1 )
(3.26)
PT :
(P
HP z = z .
suponiendo que ese vector haya sido normalizado de modo que 1T 1 = 1 se tiene:
~
H
P HP =
0
T
0
1
(3.27)
Esta matriz tiene los mismos valores caractersticos que la matriz original, H . Lo mismo
3 - 13
Jk =
O
ck
sk
sk
ck
O
columna k
fila k
fila k + 1
(3.28a)
columna k + 1
(3.28b)
se tiene:
sk =
qk
q k +1
(3.28c)
x
c k = k +1
q k +1
H=
1
B 2
1
AB 2
= 1.414214
1.414214
1 .5
0.408248
0.408248
0.333333
0.11625
1 = 0.39827
0.90987
Luego:
q1 = 0.11625
s1 = 0.28019
c1 = 0.95994
q 2 = 0.41489
s 2 = 0.41489
c 2 = 0.90987
q 3 = 1.00000
Con el propsito de observar que, efectivamente, la ltima columna de P es igual a 1
se est evaluando aqu la referida matriz:
0.95994
P = 0.28019
0.28019
0.95994
0
0 1
0 0
1 0
0
0.90987
0.414898
0.41489
0.90987
es decir:
3 - 14
0.95994
P = 0.28019
0.11625
0.39827
0.90987
0.25494
0.87342
0.41489
de donde:
5.48594
P H P = 0.27561
0.27561
1.19271
0
0
0.15462
0
0.27561
son 2 = 1.1751 y 3 = 5.5036 , es decir, iguales a los
1.19271
~ 5.48594
H =
0.27561
0.0638
0.9980
z2 =
y z3 =
0.9980
0.0638
de donde:
k = B
El factor B
1
2
1
2P
z k
0
original.
=Pz
(3.29a)
-1
(3.29b)
Este sistema tiene los mismos valores caractersticos que el sistema original y vectores
propios relacionados por (3.29a).
a1
a2
z1
b1
z2 =
O
M
a n z n
b2
z1
z2
O
M
bn z n
(3.30)
3 - 15
que tiene como vectores caractersticos las columnas de la matriz identidad y como
valores caractersticos los i = a i bi . Los valores caractersticos del sistema original
son los mismos. P es en este caso una matriz ortogonal:
P-1 = PT
(3.31)
(0)
(k) = Pk (k+1)
(3.32a)
(k)
(k+1)
(k+1)
(3.32b)
A(k+1) = PkTA(k) Pk
(3.32c)
Siendo:
Pk =
cos k
sen k
col j
sen k
cos k
O
(3.33)
fila i
fila j
Puede verificarse
(k)
(k )
a ij(k +1 ) = a (kji +1 ) = a (k)
cos 2 k sen 2 k = 0
jj a ii cos k sen k + a ij
(3.34a)
y por tanto:
tg 2 k =
2 a ij( k )
a ii( k )
a (jjk )
0 k
(3.34b)
Slo los elementos de dos filas y de dos columnas (i, j ) se alteran en cada paso.
Adems, como se mantiene la simetra de la matriz A slo deben calcularse los
3 - 16
c = cos k; s = sen k:
2
a ii(k +1 ) = a ii(k) c 2 + 2a ij(k) cs + a (k)
jj s
(3.35a)
(k)
(k )
a ij(k +1 ) = a (kji +1 ) = a (k)
c2 s2 = 0
jj a ii cs + a ij
(3.35b)
En un cierto paso se hacen cero los elementos aij y aji. Sin embargo, las sucesivas
rotaciones reintroducen valores significativos en estas posiciones, por lo que es
necesario repetir el proceso en varios "ciclos" para todos los elementos de fuera de la
diagonal principal. El proceso es convergente. Si en un ciclo dado los cocientes
[a ]
(k ) 2
ij
ij =
(3.36)
a ii( k ) a (jjk )
operaciones.
Desde un punto de vista terico sera ms eficiente hacer cero los elementos aij en
orden decreciente de los ij , definidos por (3.36), pero las comparaciones necesarias
son relativamente lentas. Por eso se prefiere seguir un orden fijo en la seleccin de los
elementos y efectuar las rotaciones slo si ij es mayor que una tolerancia, variable en
funcin del nmero de ciclo, m (por ejemplo 10-2m). La convergencia del proceso se
puede verificar con una medida similar.
Para determinar los vectores caractersticos es suficiente efectuar el producto de las
matrices Pk ya que:
(k) = Pk (k+1)
(3.37a)
y por lo tanto:
= (0) = P1 P2 P3 ... Pm
(3.37b)
A ( 0)
- 3
=
1
-3
-3
-3
1
3
En las expresiones
precedentes:
(0)
(0)
(0)
(0)
a11
= 2 a 22
= 6 a12
= a 21
= 3
3 - 17
tg(2) =
2 ( 3)
26
0.881675
0.471858
P1 =
0
A (1)
-0.471858
0.881675
0.394449
T (0)
= P1 A P1 =
-0.533899
0.471858
0
0
1
0
-0.533899
7.60555
-3.11688
-3.11688
0.881675
-3
0.471858
0.881675
-3
P2 =
0.0939783
A (2)
- 0.0939783
0.995574
0.344051
-0.292919
T (1)
= P2 A P2 =
0
0.187835
0
0
-0.292919
7.60555
-3.10309
-3.10309
6.0504
0.881675
-3.03107
0.187835
0.881675
-3.03107
Ntese que se tienen nuevamente valores significativos en las posiciones 12 y 21. Por
otro lado:
0.877773
0.469770
P1 P2 =
0.0939783
- 0.471858
- 0.0828582
0.881675
- 0.0443444
0.995574
0
0
A ( 3)
0.344051
- 0.23093
T (2)
= P3 A P3 =
- 0.180203
0.187835
- 0.23093
- 0.180203
10.027
3.62895
2.55979
- 1.84721
0.187835
2.55979
- 1.84721
3 - 18
0.877773
0.46977
P1 P2 P3 =
0.0939783
- 0.321026
- 0.355609
0.72237
0.507443
- 0.612474
0.784885
0
0
( 3)
( 3)
( 3)
( 3)
a11
= 0.344051 a 44
= 4 a14
= a 41
= 0.187835
A (4)
0.334426
-0.361627
T (3)
= P4 A P4 =
-0.0854342
0.876622
0.469154
P1 P2 P3 P4 =
0.0938551
- 0.0511758
-0.361627
-0.0854342
10.027
3.62895
2.54462
-1.85401
- 0.321026
- 0.355609
0.722370
0.507443
- 0.612474
0.784885
2.54462
-1.85401
4.00963
0
0.0449207
0.0240408
0.00480941
0.99869
( 4)
(4)
(4)
( 4)
a 22
= 10.027 a 44
= 4.00963 a 24
= a 42
= 2.54462
A ( 5)
0.334426
-0.339576
T (4)
= P5 A P5 =
-0.0854342
0.124345
0.876622
0.469154
P1 P2 P3 P4 P5 =
0.0938551
- 0.0511758
-0.339576
-0.0854342
10.9588
-0.6375
-0.6375
3.62895
-1.74096
- 0.286006
- 0.355609
0.686590
0.507443
- 0.573474
0.784885
0.343398
0.124345
-1.74096
3.07785
0.152566
- 0.225811
0.215115
0.937795
( 5)
( 5)
( 5)
( 5)
a 33
= 3.62895 a 44
= 3.07785 a 34
= a 43
= 1.74096
A (6)
0.334426
-0.339576
T (5)
= P6 A P6 =
-0.145722
0.0390598
-0.339576
-0.145722
10.9588
-0.484737
-0.484737
5.11603
-0.414049
0.876622
0.469154
P1 P2 P3 P4 P5 P6 =
0.0938551
- 0.0511758
0.0390598
-0.414049
1.59076
- 0.286006
- 0.369485
0.686590
0.532507
- 0.573474
0.457089
0.343398
- 0.609087
- 0.114957
0.157878
0.673341
0.713072
3 - 19
A (12 )
0.317649
- 0.007656
=
- 0.0006033
- 0.0003418
- 0.007656
- 0.0006033
11.0268
0.0015155
0.0015155
5.08272
0.0000149
0.856314
0.505117
P1 P2 L P12 =
0.0771368
- 0.0750522
- 0.0003418
0.0000149
1.57279
- 0.275908
- 0.421440
0.619208
0.566580
- 0.640155
0.399623
0.361467
- 0.584532
- 0.11397
0.201062
0.651578
0.722518
A (18)
0.317644
1.57279
11.0269
5.08272
-6
No se muestran los coeficientes con valor absoluto menor que 10 . Los coeficientes
de la diagonal de A
(18)
H ( k +1) = U *k H ( k ) U k
(3.38)
en los que U k es una matriz unitaria, es decir, tal que U k 1 = U *k (el superndice *
denota en este caso la conjugada traspuesta). Para hacer cero el coeficiente hij se
utiliza:
col i
Uk =
col j
cos
e i sen
e sen
cos
fila i
(3.39)
fila j
Suponiendo que:
3 - 20
hii( k ) = a
hij( k ) = b ic
h (jik ) = b + ic
h (jjk ) = d
(3.40a)
tan =
c
b
2 (b cos + c sen )
tan 2 =
ad
(3.40b)
A(k+1) = PkTA(k) Pk
(3.41)
B(k+1) = PkTB(k) Pk
donde Pk es una matriz similar a la utilizada para el proceso clsico:
col i
Pk =
col j
1
k
k
1
O
(3.42)
fila i
fila j
y se determinan de:
a ij(k +1 ) = a (kji +1 ) = k a ii(k) + (1 + k k ) a ij( k ) + k a (k)
jj = 0
bij(k +1 ) = b (kji +1 ) = k bii(k) + (1 + k k ) bij( k ) + k b (k)
jj = 0
(3.43)
a ii(k)
bii(k)
a ij(k)
bij(k)
a (k)
jj
(3.44a)
b (k)
jj
k = 0
k =
a ij(k)
a (k)
jj
(3.44b)
Definiendo:
3 - 21
1
2
(a
(k )
ii
(3.45a)
d = c3 + ( signo c 3 ) c 32 + c1c 2
se obtienen:
k =
c2
k =
c1
(3.45b)
Se
1 1
A =
1 1
2 1
B =
1 2
i=1, j=2
a11 = 1
a22 = 1
a12 = a21 = -1
b11 = 2
b22 = 2
b12 = b21 = 1
c1 = 3
c2 = 3
c3 = 0
d=3
= - k =1
1 1 1 1 1 1 4 0
A(1) = P1TA(0) P1 =
1 1 1 1 1 1 0 0
1 1 2 1 1 1 2 0
B(1) = P1TB(0) P1 =
1 1 1 2 1 1 0 6
de donde:
2 = 4/2 = 2
1 = 0/6 = 0
1 1 1 2
0 0.7071 0.4082
-
= P1 diag (bi ) =
=
1 6 0.7071 0.4082
1 1 0
La post multiplicacin de P1 slo es necesaria para escalar los vectores de modo que
3 - 22
a11
a 21
0
A=
0
a12
a13
a14
a15
a 22
a 23
a 24
a 25
a 32
a 33
a 34
a 35
a 43
a 44
a 45
a 54
a 55
(3.46)
es decir si es casi triangular superior, excepto por una codiagonal inferior. Para el caso
particular en que la matriz A es adems simtrica (y por lo tanto tridiagonal):
a1
b1
A=
b1
a2
b2
b2
a3
b3
b3
a 4 O
O O
(3.47)
Considerando A
descomposicin:
A (k ) = Q k R k
(3.48a)
A ( k +1) = R k Q k
(3.48b)
Q Tk A ( k ) = R k
(3.48c)
y por lo tanto:
A ( k +1) = R k Q k = Q Tk A ( k ) Q k
(3.48d)
3 - 23
A (k ) (k ) = (k )
(3.49a)
( k ) = Q k ( k +1)
(3.49b)
se obtiene:
A ( k ) Q k ( k +1) = Q k ( k +1)
(3.49c)
(Q
(3.49d)
T
(k )
Qk
kA
( k +1)
= ( k +1)
Ambas matrices tienen los mismos valores caractersticos (que en consecuencia son
los de la matriz original) y vectores caractersticos relacionados por (3.49b).
A medida que k crece A ( k ) converge a una matriz triangular superior (cuyos valores
caractersticos son los elementos de la diagonal principal); para el caso simtrico A ( k )
converge a una matriz diagonal.
La
(3.50a)
A ( k +1) = R k Q k k I
(3.50b)
Ntese que los valores caractersticos de esta nueva matriz son iguales a los de la
(k )
matriz original menos la translacin. Cuando se logra que a nn
= 0 puede hacerse una
traslacin:
k = a n( k1) ,n 1
(3.50c)
( 0 ) = Q 1Q 2 Q 3 L
(3.51)
pero este proceso es poco eficiente, siendo ms conveniente obtener estos vectores
por iteraciones inversas con traslaciones iguales a los valores caractersticos ya
determinados. Esto permite tambin mejorar la precisin en los .
La determinacin de Q y R en un paso puede hacerse en diversas formas. El proceso
ms eficiente consiste en transformar A en una matriz triangular superior utilizando
matrices de rotacin plana (como en el mtodo de Jacobi):
3 - 24
(P
T
T
n , n 1 L P31
T
P21
A=R
(3.52a)
y por lo tanto:
Q = P21 P31 L Pn ,n 1
(3.52b)
Pk =
cos k
sen k
col j
sen k
cos k
fila i
(3.53a)
fila j
se obtiene mediante:
cos =
sen =
d=
a ii( k )
d
a (jik )
(3.53b)
(a ) + (a )
(k ) 2
ji
(k ) 2
ii
(0)
2 1 0
= 1 4 1
0 1 2
Esta es una matriz simtrica (lo cual no es un requisito para emplear el mtodo QR) y,
siendo tridiagonal, tiene la forma Hessemberg.
Para transformar A en una matriz triangular superior R se hace primero cero el
coeficiente a21:
(0)
a11
=2
( 0)
a 21
=1
cos = 0.894427
d = 2.236068
sen = 0.447214
.894427 - .447214 0
0
1
0
T
P21
A (0)
=
0
3.130494 .894427
0
1
2
Luego se hace cero a32, con lo que se obtiene una matriz triangular superior:
3 - 25
(0)
a 22
= 3.130494
cos = 0.952579
(0)
a 32
=1
d = 3.286335
sen = 0.304290
0
0
1
0 .304290 .952579
R1 =
T T
P32
P21 A ( 0)
=
0
3.286332 1.460532
0
0
1.632993
(1)
0
3.200000 1.469694
0
.496904 1.555556
.908739 - .417365 0
0
1
0
0
0
1
0 .208150 .978097
R2 =
(2)
T T
P32
P21 A (1)
L
3.521363 2.689686
=
0
2.387242 .765454
0
0
1.427490
0
4.322580 .996351
0
.297132 1.396226
Y en el tercer paso:
.974449 - .224610 0
0
1
0
0
0
1
0 .147017 .989134
R3 =
T T
P32
P21 A ( 2 )
=
0
2.021076 .491663
0
0
1.33850
3 - 26
(3)
0
4.655737 .453953
0
.196780 1.323944
(3)
0
3.331794 .453953
0
.196780
0
(4)
0
3.405209 .088938
0
- .017396 - .055581
4 = -.055581 =
= 1.268362
obtenindose:
(5)
0
3.463559 .018800
0
.000010 - .000413
y nuevamente:
5 = -.000413 =
= 1.267949
obtenindose:
(6)
3.464096 .003973 0
= .003973 .732056 0
0
0
0
Se observa ahora que el coeficiente a33 es menor que 10-6, lo que implica que 1 es
aproximadamente igual a la suma de las traslaciones previamente realizadas.
Conviene luego hacer una traslacin igual al resultado obtenido para a22 a fin de
mejorar la precisin para el segundo valor caracterstico:
6 = .732051 =
(6)
=2
0
2.732050 .003973
0.732051 I = .003973
0
0
0
0
- .732051
2.732050 .003973
A (6) =
0
.003973
3 - 27
(6)
= 2.732050
a11
cos = 1
(6)
= 0.003973
a 21
d = 2.732051
sen = 0.000307
1.000000 - .000307
P21 = Q 7 =
.000307 1.000000
2.732051 .000840
T
R 7 = P21
A ( 6) =
0
.000001
2.73205 0
A ( 7 ) =
0
0
Los coeficientes indicados como 0 son menores que 10-6. Los valores caractersticos
de esta matriz son 0 y 2.732051. Para obtener aquellos de la matriz original deben
sumarse las traslaciones:
1 = -0.732051 + 2 = 1.267949
2 = 0 + 2 = 2
3 = 2.732051 + 2 = 4.732051
3.3.5. Transformacin a la Forma Hessemberg
Si el mtodo QR se aplicara a una matriz cualquiera sera en general poco eficiente,
"Hessemberg" (es decir, una matriz que es casi triangular superior, teniendo adems
coeficientes significativos en la primera codiagonal inferior):
h11 h12
h21 h22
0 h32
H =
0
0
M
M
0
0
h13 h14
h23 h24
h33 h34
h43 h44
hn ,n 1
h1n
h2 n
h3n
h4 n
hnn
(3.54)
En el proceso original de
3 - 28
0
0
1 0
0
0
0 1
0 b32 1
0
B=
0 b
b43 1
42
0 bn 2 b n 3 bn 4
L 0
L 0
L 0
L 0
L 1
(3.55a)
hir = a ir +
a ik bkr
k = r +1
bi ,r +1 =
1
hr +1,r
ik hkr
i = 1, 2, L r + 1
(3.55b)
i = r + 2, L n
(3.55c)
k =1
a ir +
a ik bkr
k = r +1
ik hkr
k =1
P = I 2 w wT
donde
(3.56)
)(
0w
A ( k +1) = Pk A ( k ) Pk
(3.57a)
donde:
Pk = I k w k w Tk
k =
2
w Tk w k
(3.57b)
w k = v k + signo a k( k+)1,k
)v
e k +1
siendo:
3 - 29
0
M
v k = a k( k+)1,k
a ( k )
k + 2, k
M
(k )
a nk
e k +1
0
M
= 1
M
0
Para que el proceso sea ms eficiente, debe observarse que al premultiplicar A , cuyas
columnas son a1 a 2 a 3 L , por la matriz P , cada columna se modifica en forma
independiente. Las columnas de A = PA resultan:
a j = I k w k w Tk a j = a j k w Tk a j w k
(3.58a)
ai = a i I k w k w Tk = a i k ( a i w k ) w Tk
(3.58b)
3
A=
2
1
2
(1)
=A
3
4
0
3
v1 =
2
1
v1 = 3.74166
0
0 0
3
1 6.74166
w 1 = v 1 + v 1 e 2 = + 3.74166 =
2
0 2
1
0 1
1 w 1T A (1) = (1.00000
1.38619
1.23786
1 = 0.03964
0.93096)
3 - 30
P1 A (1)
4.00000
- 3.74166
=
0
- 5.34522
- 5.34522
0.22762
1.52428
0.61381
1.76214
- 4.27618
1.13809
3.06904
1
1.00000
2.02190
(1)
1 P1 A w 1 =
0.22681
0.42543
A (2)
4.00000
- 3.74166
(1)
= P1 A P1 =
0
- 3.74166
8.28571
- 1.30143
- 1.30143
1.07067
- 2.25428
0.91128
- 2.25428
0.91128
2.64362
0
v2 =
1.30143
2.25428
v 2 = 2.60298
0
0
0
0
w 2 = v 2 + v 2 e3 =
2.60298 =
1.30143
1 3.90441
2.25428
0 2.25428
2 w T2 A ( 2 ) = (0
P2 A ( 2)
1.00000
4.00000
- 3.74166
=
0
2 = 0.09840
- 0.93647 )
- 0.61346
- 3.74166
8.28571
- 1.30143
2.60298
- 1.32452
- 0.47162
- 2.25428
- 2.74510
0.53254
0
1
( 2)
2 P2 A w 2 =
1.11774
0.06306
H = A ( 3)
4.00000
- 3.74166
= P2 A ( 2) P2 =
0
- 3.74166
8.28571
2.60298
2.60298
3.03959
- 0.22540
- 0.22540
0.67470
0
3 - 31
2
A=
0
0
2
4
0
B=
0
0
0
1
2
p( ) = det
0
8 2
8 2
0
2
k k 1
p ( k )
k +1 = k
p ( k ) p( k 1 )
1 2
(3.59)
(3.60a)
donde:
det (L ) = l11 l 22 l 33 l 44 L = 1
det (U ) = u11 u 22 u 33 u 44 L
(3.60b)
3 - 32
2 .5
2
A 1 .5 B =
0
0
0 1
0
0
5 2 0 .800 1
0
=
2 5 2 0 .588 1
0 2 2.5 0
0 .523
2 0
0 2 .5 2
0
0
0 0 3.4
2
0
0 0
0 3.824
2
1 0
0
0
1.454
1
2
3
4
p ( k )
1.5
47.25
2.0
2.5
-8.75
3.0
3.5
11.25
4.0
16.00
4.5
11.25
5.0
5.5
-8.75
6.0
6.5
47.25
p vectores
La idea
bsica es que es mucho ms fcil iterar para obtener un subespacio que contenga a
estos vectores que iterar para obtener cada uno de ellos por separado.
Se trabaja con una coleccin de q vectores linealmente independientes ( q > p ). Los
q vectores iniciales definen un subespacio que no necesariamente contiene a los p
H. Scaletti - Mtodos Numricos: Valores y Vectores Caractersticos
3 - 33
sera
suficiente
A = B
proyectar
para
obtener
el
sistema
AX k +1 = BX k
La matriz A debe factorizarse antes de iniciar las iteraciones. Los vectores X k +1
son ms paralelos a los primeros p vectores caractersticos.
b. Proyeccin de A y B en el subespacio definido por los vectores X k +1 :
A ( k +1) = X Tk +1 A X k +1
B ( k +1) = X Tk +1 B X k +1
Las matrices A ( k +1) y B ( k +1) son cuadradas, simtricas, de orden q .
c. Solucin del problema de valores y vectores caractersticos proyectado:
A ( k +1) Q k +1 = B ( k +1) Q k +1 k +1
k +1 es una matriz diagonal, cuyos coeficientes son los valores caractersticos del
problema proyectado. Si los X k +1 definen un subespacio que contiene a los p
X k +1 = X k +1 Q k +1
Como consecuencia de los pasos c y d:
(
(X
)
)Q
X Tk +1 A X k +1 = Q Tk +1 X Tk +1 A X k +1 Q k +1 = Q Tk +1 A ( k +1) Q k +1 = q
X Tk +1 B X k +1 = Q Tk +1
T
k +1
B X k +1
k +1
= Q Tk +1 B ( k +1) Q k +1 = I q
Lim k = diag 1
k
Lim X k = diag 1
k
)
( k +1)
(pk +1)
(pk )
para el mayor
1
2
nm 2 p operaciones adicionales.
Aproximacin Inicial
Para iniciar el proceso se requieren q vectores linealmente independientes, agrupados
en X 0 . Si A y B fueran diagonales, los vectores caractersticos seran las columnas
e k de la matriz identidad. An cuando A y B no sean diagonales, ste puede ser un
buen criterio para construir la aproximacin inicial X 0 . En particular, deberan
escogerse las columnas cuyo ndice k corresponde a los mximos bkk a kk . Con el
propsito de introducir componentes segn todos los vectores caractersticos, se
acostumbra adems considerar dos columnas con componentes arbitrarios (que
podran ser todos iguales a 1, o iguales a los bkk a kk ).
En algunas aplicaciones es fcil obtener una buena aproximacin al primer vector
caracterstico, por ejemplo, como solucin de un sistema de ecuaciones de la forma
A y k = B x k 1
xk = y k
y Tk B x j
T
j =1 x j B x j
k 1
x
j
3 - 35
~
= 0.1 n + 0.9 n +1
n es el ltimo valor caracterstico para el que se ha logrado convergencia;
~
n +1 es la aproximacin al siguiente valor caracterstico.
b. Factorizacin: A B = L U
c. Determinacin de q vectores de aproximacin inicial, X 0 .
La iteracin incluye los pasos siguientes:
a. Eliminacin de las componentes de X k segn los vectores caractersticos
previamente determinados (ver acpite 3.2.4).
b. Iteracin inversa:
Yk +1 = B X k
L U Z k +1 = Yk +1
c. Proyeccin de A B y B en el subespacio definido por los vectores Yk +1 :
A ( k +1) = Z Tk +1 Yk +1
B ( k +1) = Z Tk +1 B Z k +1
Las matrices A ( k +1) y B ( k +1) son cuadradas, simtricas, de orden q .
d. Solucin del problema de valores y vectores caractersticos proyectado:
(A
( k +1)
+ B ( k +1) Q k +1 = B ( k +1) Q k +1 k +1
X k +1 = Z k +1 Q k +1
f. Verificacin de la convergencia
Como en el procedimiento estndar, debe verificarse que se tienen los valores
caractersticos correctos utilizando la propiedad de Sturm.
Ejemplo simple
Supngase que se requieren dos vectores caractersticos de A = B , siendo:
1
A=
0
0
1
2
B=
1
0
En este caso particular la iteracin inversa produce en un solo paso el subespacio que
incluye a los dos primeros vectores caractersticos, ya que dos de los valores
caractersticos son infinitos. Para hacer ms eficiente el proceso debe factorizarse
primero la matriz A :
3 - 36
0 .5
A=
0
0
.6667
0.75
0
Con la aproximacin inicial: X 0 =
0
1
0 2
0 0
0 0
1 0
1
1 .5
0
0
0
1
= LU
1.3333
1
0 1.25
0
0
0
0
B X0 =
0
2
0
0
L U X1 = B X 0
0.4
0.8
X1 =
1.2
1.6
0.6
1.2
0.8
0.4
3 .2
A (1) = X1T A X1 =
0 .8
0 .8
1.2
5.76
B (1) = X1T B X1 =
2.24
2.24
1.76
c1 = 1.28
c 2 = 2.56
c 3 = -0.64
1
P =
d = 2.56
= -0.50
= 1.00
1 0.5
=
1 1
1
6.00
P T A P =
0
1.20
12
P T B P =
0
0.96
de donde:
a b
= 11 11
0
0.288 675
Q =
0.288 675
0
a 22
0.50
=
b2 0
1.25
0.510 310
1.020 621
0.288 675
0.577 350
X 1 = X1 Q =
0.577 350
0.577 350
0.408 248
0.816 497
= (1
0.204 124
0.408 248
2 )
3 - 37