Métodos de La Física Matemática - Hector Hernández&Victor Nuñez PDF

Métodos de la
Física
Matemática
Héctor Hernández
Luis A. Núñez
EDICIÓN 2013
Solo con fines educativos

Formulario de Métodos de Fı́sica
Matemática
Héctor Hernández
Universidad de Los Andes
Mérida Venezuela
Luis A. Núñez
Universidad de Los Andes
Mérida Venezuela
Universidad Industrial de Santander
Bucaramanga Colombia
Índice general
1. Los vectores de siempre 10

1.1. Para comenzar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2. Vectores y escalares y álgebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1. Escalares y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2. Algebra de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Independencia lineal y las bases para vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4. Productos de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.1. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.2. Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.3. Una división fallida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.4. Producto triple o mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5. Componentes, coordenadas y cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.1. Bases, componentes y coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.2. Cosenos directores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6. Algebra vectorial y coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.1. Suma y resta de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.6.2. Dependencia e independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.6.3. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.6.4. Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.5. Triple producto mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7. Algebra vectorial con ı́ndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.7.1. Convención de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.7.2. Los vectores y los ı́ndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7.3. Un par de cálculos ilustrativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.7.4. El escalares, pseudoescalares, vectores y pseudovectores . . . . . . . . . . . . . . . . . 27
1.8. Aplicaciones del álgebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.8.1. Rectas y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.8.2. Planos y vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.9. Un comienzo a la derivación e integración de vectores . . . . . . . . . . . . . . . . . . . . . . 30
1.9.1. Vectores variables, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.9.2. Derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.9.3. Velocidades y aceleraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.9.4. Vectores y funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.9.5. El vector gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.9.6. Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.10. Vectores y números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2
Métodos Matemáticos de la Fı́sica
1.10.1. Los números complejos y su álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

1.10.2. Vectores y el plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.10.3. Fórmulas de Euler y De Moivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.10.4. Algunas Aplicaciones Inmediatas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.11. Algunos Ejemplos Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2. Espacios Vectoriales Lineales 58

2.1. Grupos, Campos y Espacios Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.1.1. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.1.2. Campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.1.3. Espacios Vectoriales Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2. Métricas y Espacios Métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.3. Normas y Espacios Normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.4. Producto Interno y Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.4.1. Producto Interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.4.2. La desigualdad de Cauchy Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.5. Variedades Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.1. Dependencia, independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.2. Bases de un Espacio Vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.5.3. El determinante de Gram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.5.4. Ortogonalidad y Bases Ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.5.5. Ortogonalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.5.6. Complementos Ortogonales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.5.7. Descomposición ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.6. Temas Avanzados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.6.1. Aproximación de Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.6.2. El Método de Mı́nimos Cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.7. Algunos Ejemplos Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3. Vectores Duales y Tensores 88

3.1. Funcionales Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2. Bases Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.3. Paréntesis Tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.3.1. Tensores una definición funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.3.2. Producto Tensorial: Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . 92
3.3.3. La tentación del producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.3.4. Bases para un producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.3.5. Tensores, sus componentes y sus contracciones . . . . . . . . . . . . . . . . . . . . . . 96
3.3.6. Tensor Métrico, Indices y Componentes . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.4. Un par de tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.4.1. El tensor de esfuerzos (stress) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.4.2. El Tensor de Inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
3.5. Repensando los vectores, otra vez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.5.1. Vectores, Covectores y Leyes de Transformación . . . . . . . . . . . . . . . . . . . . . 105
3.5.2. Cartesianas y Polares, otra vez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.5.3. Repensando las componentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.6. Transformaciones, vectores y tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.6.1. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Luis A. Núñez Universidad Industrial de Santander 3

3.7. Teorema del Cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

3.8. Temas avanzados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.8.1. Bases Discretas y Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.8.2. Bases de Ondas Planas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.8.3. Las Representaciones |ri y |pi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4. Coordenadas Curvilineas 124

4.1. Disgreción Derivativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.2. Curvas y parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.3. Coordenadas Curvilı́neas Generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.3.1. Coordenadas generalizadas, vectores y formas . . . . . . . . . . . . . . . . . . . . . . . 130
4.3.2. Velocidades y Aceleraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.3.3. Coordenadas Cartesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.3.4. Coordenadas Cilı́ndricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.3.5. Coordenadas Esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
4.3.6. Otros Sistemas Coordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.4. Vectores, Tensores, Métrica y Transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.4.1. Transformando Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.4.2. Transformando Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5. Campos y Operadores Diferenciales 146

5.1. Campos Tensoriales y el Concepto de Campo . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.2. Campos escalares y superficies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.3. Campos vectoriales y lı́neas de flujo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.3.1. Lı́neas de flujo o curvas integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.3.2. Trayectorias ortogonales a las lı́neas de flujo . . . . . . . . . . . . . . . . . . . . . . . . 153
5.4. Flujo de Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.5. La fauna de los operadores vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.5.1. Derivada direccional, diferencial total y gradiente . . . . . . . . . . . . . . . . . . . . . 155
5.5.2. Divergencia y flujo en campos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . 159
5.5.3. Rotores, lı́neas de torbellino y Circulación . . . . . . . . . . . . . . . . . . . . . . . . . 164
5.5.4. Formulario del Operador nabla, ∇ ~ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
5.5.5. Nabla dos veces y el Laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
5.5.6. Derivadas Direccionales de Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . 172
5.6. Integrales y Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
5.6.1. Resumiendo lo visto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
5.7. Campos Vectoriales y Teoremas integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.7.1. Teorema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.7.2. Teorema de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.8. Teorı́a de Potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.8.1. Potenciales escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.8.2. Potenciales vectoriales y calibres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
5.8.3. Teorema de Green y Potenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
5.8.4. Teorema de Helmholtz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

6. Matrices, Determinantes y Autovectores 190

6.1. Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
6.1.1. Espacio Vectorial de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . 193
6.1.2. Composición de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
6.1.3. Proyectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
6.1.4. Espacio Nulo e Imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
6.1.5. Operadores Biyectivos e Inversos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
6.1.6. Operadores Hermı́ticos Conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6.1.7. Operadores Unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
6.2. Representación Matricial de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
6.2.1. Bases y Representación Matricial de Operadores . . . . . . . . . . . . . . . . . . . . . 205
6.2.2. Algebra de Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
6.2.3. Representación Diagonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
6.2.4. Sistemas de Ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
6.2.5. Operadores Hermı́ticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
6.2.6. Inversa de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
6.2.7. Cambio de Bases para vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
6.3. Traza de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.3.1. Invariancia de la Traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.3.2. Propiedades de la Traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.3.3. Diferenciación de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
6.3.4. Reglas de Diferenciación de Operadores Lineales . . . . . . . . . . . . . . . . . . . . . 212
6.3.5. La Fórmula de Glauber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.4. Un Zoológico de Matrices Cuadradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.4.1. La matriz nula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.4.2. Diagonal a Bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6.4.3. Triangular superior e inferior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6.4.4. Matriz singular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6.4.5. Matriz de cofactores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6.4.6. Matriz Adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6.5. Un Paréntesis Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.5.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.5.2. Propiedades Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.6. Autovectores y Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.6.1. Definiciones y Teoremas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.6.2. Algunos comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
6.6.3. Algunos Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
6.6.4. Autovalores, autovectores e independencia lineal . . . . . . . . . . . . . . . . . . . . . 222
6.7. Autovalores y Autovectores de un operador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
6.7.1. El polinomio caracterı́stico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
6.7.2. Primero los autovalores, luego los autovectores . . . . . . . . . . . . . . . . . . . . . . 224
6.8. Autovalores y Autovectores de Matrices Importantes . . . . . . . . . . . . . . . . . . . . . . . 227
6.8.1. Autovalores y Autovectores de Matrices Similares . . . . . . . . . . . . . . . . . . . . . 227
6.8.2. Autovalores y Autovectores de Matrices Hermı́ticas . . . . . . . . . . . . . . . . . . . . 230
6.8.3. Autovalores y Autovectores de Matrices Unitarias . . . . . . . . . . . . . . . . . . . . 232
6.9. Conjunto Completo de Observables que conmutan . . . . . . . . . . . . . . . . . . . . . . . . 235

7. Serie de Series 242

7.1. Series por todos lados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
7.1.1. La Suma de la Serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
7.1.2. Algebra Elemental de Series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
7.1.3. Criterios de Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
7.2. Series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
7.2.1. Convergencia de una serie de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 251
7.2.2. Covergencia uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
7.2.3. Algebra y convergencia de series de potencias . . . . . . . . . . . . . . . . . . . . . . . 254
7.2.4. Series de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
7.3. Series y Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
7.3.1. Completitud de E ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
7.3.2. Conjunto completo de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
7.4. Series de Polinomios Ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
7.4.1. Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
7.4.2. Polinomios de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
7.4.3. MAPLE y los polinomios ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
7.4.4. Planteamiento General para Polinomios Ortogonales . . . . . . . . . . . . . . . . . . . 279
7.4.5. Un par de aplicaciones de ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
7.5. Series y transformadas de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
7.5.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
7.5.2. Las Condiciones de Dirichlet y el Teorema de Fourier . . . . . . . . . . . . . . . . . . 289
7.5.3. Algunos ejemplos de expansiones en series de Fourier . . . . . . . . . . . . . . . . . . . 290
7.5.4. Consideraciones de Simetrı́a en series de Fourier . . . . . . . . . . . . . . . . . . . . . 293
7.5.5. Tratamiento de discontinuidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
7.5.6. Tranformadas de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
7.5.7. Tranformadas Discretas de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
8. La Variable Compleja 303

8.1. Vectores y números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
8.1.1. Los números complejos y su álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
8.1.2. Vectores y el plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
8.1.3. Fórmulas de Euler y De Moivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
8.2. Funciones de Variable Compleja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
8.2.1. De la recta real al plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
8.2.2. Continuidad en el plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
8.2.3. Diferenciabilidad de funciones complejas . . . . . . . . . . . . . . . . . . . . . . . . . . 308
8.2.4. Funciones Analı́ticas y Condiciones de Cauchy-Riemann . . . . . . . . . . . . . . . . . 309
8.2.5. Curiosidades de Cauchy-Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
8.3. Series de Potencias en Variable Compleja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
8.3.1. La convergencia y sus criterios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
8.3.2. Consecuencias y conclusiones para series de potencias complejas . . . . . . . . . . . . 313
8.4. Algunas Funciones Complejas Elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
8.5. Puntos de corte, lı́neas de cortes y ceros de funciones complejas . . . . . . . . . . . . . . . . . 315
8.5.1. Puntos y lı́neas de corte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
8.5.2. Singularidades, polos y ceros de funciones complejas. . . . . . . . . . . . . . . . . . . . 316
8.6. Transformaciones conformes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
8.6.1. Definiciones y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318

8.6.2. Algunas consecuencias y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

8.7. Integrales complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
8.7.1. Algunas propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
8.7.2. Un par de ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
8.8. Teorema Integral de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
8.8.1. El Teorema y las Regiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
8.8.2. Algunas observaciones y el Teorema de Morera . . . . . . . . . . . . . . . . . . . . . . 324
8.8.3. Fórmula integral de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
8.9. Otra vez Taylor y ahora Laurent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
8.9.1. Series de Taylor para funciones analı́ticas . . . . . . . . . . . . . . . . . . . . . . . . . 327
8.9.2. Series de Laurent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
8.9.3. Algunos Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
8.10. Integración por el método de los residuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
8.10.1. Los residuos de Laurent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
8.10.2. Teorema del Residuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
8.10.3. Evaluación de integrales, reales, impropias . . . . . . . . . . . . . . . . . . . . . . . . . 334
9. Ecuaciones Diferenciales Ordinarias de Primer Orden 343

9.1. Motivación y Origen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
9.2. Empezando por el principio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
9.2.1. Ejemplos de Algunas ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . 349
9.2.2. De Ecuaciones y Ecuaciones Diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . 350
9.2.3. Fauna y Nomenclatura de Ecuaciones Diferenciales Ordinarias . . . . . . . . . . . . . 351
9.2.4. Métodos elementales de integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
9.3. Ecuación Diferenciales de Primer Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
9.3.1. Ecuaciones Diferenciales separables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
9.3.2. Ecuaciones Diferenciales Exactas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364
9.3.3. Solución Paramétrica de Ecuaciones Diferenciales . . . . . . . . . . . . . . . . . . . . . 366
9.4. Soluciones Numéricas a las Ecuaciones Diferenciales . . . . . . . . . . . . . . . . . . . . . . . 366
9.4.1. Las Ideas Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
9.4.2. La idea de la Integración y los Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . 368
9.4.3. Control del Paso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
9.5. Algunas Aplicaciones de Ecuaciones Diferenciales de Primer Orden . . . . . . . . . . . . . . . 376
9.5.1. Ley de Malthus/Decaimiento Radioactivo. . . . . . . . . . . . . . . . . . . . . . . . . . 376
9.5.2. La Ecuación logı́stica o Ley de Verhulst . . . . . . . . . . . . . . . . . . . . . . . . . . 377
9.5.3. La Ley de Enfriamiento de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
9.5.4. Interés Compuesto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
9.5.5. Mecánica Elemental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
9.5.6. Modelado de Concentración/Desliemiento de Soluciones . . . . . . . . . . . . . . . . . 386
10.Ecuaciones Diferenciales Ordinarias de Orden Superior 391

10.1. Definiciones para comenzar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392
10.2. Homogéneas, Lineales, de Segundo Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392
10.3. Ecuaciones Diferenciales de Orden n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395
10.4. Algunos Métodos de Solución para Ecuaciones Inhomog’eneas . . . . . . . . . . . . . . . . . . 397
10.4.1. El Wronskiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
10.4.2. Métodos de los Coeficientes Indeterminados . . . . . . . . . . . . . . . . . . . . . . . . 398
10.4.3. Métodos de Variación de los Parámetros . . . . . . . . . . . . . . . . . . . . . . . . . 400

10.4.4. Métodos de Reducción de Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402

10.5. Algunas Aplicaciones de las Ecuaciones de Orden Superior . . . . . . . . . . . . . . . . . . . . 403
10.5.1. Mecánica y Electricidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
10.5.2. Oscilaciones libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
10.5.3. Oscilaciones Libres Amortiguadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404
10.5.4. Oscilaciones Forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
10.5.5. Oscilaciones Forzadas amortiguadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
10.5.6. Movimiento alrededor de un punto de equilibrio . . . . . . . . . . . . . . . . . . . . . . 412
10.5.7. Péndulo Simple con desplazamiento finito. . . . . . . . . . . . . . . . . . . . . . . . . . 413
10.5.8. Disgresión Elı́ptica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
10.5.9. ¿Cuán buena es la aproximación lineal ? . . . . . . . . . . . . . . . . . . . . . . . . . 423
10.5.10.El Péndulo Fı́sico: Integración Numérica . . . . . . . . . . . . . . . . . . . . . . . . . . 424
10.6. Transformaciones Integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
10.6.1. Cálculo Operacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
10.6.2. Definiciones para Comenzar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
10.6.3. Tranformada de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
10.6.4. Ejemplos Sencillos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
10.6.5. Integral de Convolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
10.7. Sistemas de Ecuaciones Diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
10.7.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
10.7.2. Notación Vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434
10.7.3. Sistemas Lineales Homogéneos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
10.7.4. Sistemas Lineales Inhomogéneos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
11.Series y Ecuaciones Diferenciales Ordinarias 441

11.1. Otra vez Algebra de Series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
11.2. Un Ejemplo conocido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
11.3. Otro Ejemplo menos conocido pero importante . . . . . . . . . . . . . . . . . . . . . . . . . . 444
11.4. Método de Diferenciaciones Sucesiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
11.5. Métodos de los Coeficientes Indeterminados . . . . . . . . . . . . . . . . . . . . . . . . 447
11.6. Los Puntos y las Estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
11.7. Ecuaciónes e intervalos en puntos regulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
11.8. El Método de Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
11.8.1. m1 6= m2 ∧ m1 − m2 6= N con N entero. . . . . . . . . . . . . . . . . . . . . . . . . . . 456
11.8.2. m1 = m2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
11.8.3. m1 6= m2 ∧ m1 − m2 = N con N entero. . . . . . . . . . . . . . . . . . . . . . . . . . . 463
11.9. Revisitando a Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466
11.9.1. Otras Formas de la Ecuación de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . 472
11.9.2. Relaciones de Recurrencia: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472
11.9.3. Funciones de Bessel y Funciones Elementales . . . . . . . . . . . . . . . . . . . . . . . 473
11.9.4. Reflexión: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474
11.9.5. Función Generatriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475
11.9.6. Representación Integral para las Funciones de Bessel . . . . . . . . . . . . . . . . . . . 475
11.9.7. Ortogonalidad de las Funciones de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . 476
11.10.Algunas funciones Especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477
11.10.1.Función Gamma e Integrales de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . 477
11.10.2.La Funciones Digamma y Poligamma . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
11.10.3.La Aproximación de Stirling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482

11.10.4.La función Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483

Capı́tulo 1
Los vectores de siempre
10
1.1. Para comenzar

Este conjunto de secciones pretende hacer una repaso, un recordatorio y avanzar sobre lo que la mayorı́a
de Uds. conocen o han escuchado a lo largo de sus cursos de Fı́sica, Matemáticas y Quı́mica.
1.2. Vectores y escalares y álgebra vectorial

Desde siempre, desde los primeros cursos de Fı́sica en educación media, venimos hablando de vectores
como cantidades que tienen que ser representadas con más de un número. Son muchas las razones que obligan
a introducir este (y otro) tipo de cantidades, enumeraremos algunas que a criterio personal son como más
representativas.
1. Necesidad de modelos matemáticos de la naturaleza. Desde los albores del renacimiento, con
Galileo Galilei a la cabeza es imperioso representar cantidades de manera precisa. Las matemáticas
nos apoyan en esta necesidad de precisión. Desde ese entonces las matemáticas son el lenguaje de la
actividad cientı́fica.
2. Los modelos tienen que tener contrastación experimental. Las ciencias y sus modelos, en última
instancia, tienen que ver con la realidad, con la naturaleza y por ello debemos medir y contrastar las
hipótesis con esa realidad que modelamos. Necesitamos representar cantidades medibles (observables)
y que por lo tanto tienen que ser concretadas de la forma más compacta, pero a la vez más precisa
posible.
3. Las leyes de los modelos deben ser independiente de los observadores. Cuando menos a
una familia significativa de observadores. El comportamiento de la naturaleza no puede depender de la
visión de un determinado observador, ası́ los modelos que construimos para describirla, tampoco pueden
depender de los observadores. Con conocer la ley de transformación entre observadores equivalentes
deberemos conocer cómo ocurren los fenómenos en otros referenciales.
Por ello, tropezaremos con escalares, vectores, tensores y espinores, dependiendo del número de cantidades
que necesitemos para representar ese objeto pero, sobre todo, dependiendo de la ley de transformación que
exista entre estos objetos. Constataremos que las leyes de la Fı́sica vienen escritas en forma vectorial (o
tensorial) y, por lo tanto, al conocer la ley de transformación de los vectores (tensores) conoceremos la visión
que de esta ley tendrán otros observadores.
1.2.1. Escalares y vectores

Dejaremos para más adelante caracterizar objetos como tensores y espinores, por ahora nos contentaremos
con refrescar nuestros recuerdos con cantidades como:
Escalares: Serán aquellas cantidades las cuales se representan con UN solo número, una magnitud: temperatura,
volumen, masa, entre otras. Es costumbre no denotarlas de manera especial, ası́ T = 5o C represen-
tará una temperatura de 5 grados centı́grados.
Vectores: Serán cantidades las cuales, para ser representadas por un objeto matemáticos requieren más de un
número, requieren de UN número, UNA dirección y UN sentido. Entre las cantidades que tı́picamente
reconocemos como vectores están: la velocidad, la aceleración, la fuerza En términos gráficos podremos
decir que un vector será un segmento orientado, en el cual la dimensión del segmento representará su
módulo y su orientación la dirección y el sentido. Para diferenciarla de las cantidades escalares hay

Figura 1.1: Vectores y sus operaciones
una variedad de representaciones, entre ellas: en negrita a; con una flecha arriba de la cantidad ~a;
−−→
con una tilde arriba ã; o explicitando el origen del segmento orientado OP . El módulo del vector lo
representaremos dentro de la función valor absoluto, o sencillamente sin la flecha arriba a = |a| = |~a| .
Los vectores son independientes del sistema de coordenadas. Sus caracterı́sticas (módulo, dirección y
sentido) se preservarán en todos los sistemas de coordenada. Más aún, habrá vectores que podremos des-
plazarlos (conservando su módulo dirección y sentido) paralelos a ellos mismos, en el espacio y (obvio que)
seguirán siendo los mismo. Por ello encontrarán el término de vectores deslizantes. Un ejemplo de ellos son
las fuerzas que actúan en un determinado cuerpo, como se muestra el cuadrante III en la Figura 1.1, arriba.
También habrá vectores atados a un punto en el espacio, por cuanto representan una de sus propiedades:
la velocidad del viento, el campo eléctrico, o sus variaciones son algunos ejemplos de estos vectores atados
(observe la Figura 1.2 como ejemplos ilustrativos).
1.2.2. Algebra de vectores

Enumeraremos rápidamente el álgebra de vectores sin hacer referencia a un sistema de coordenadas.
Desde siempre nos enseñaron a representar gráficamente este álgebra. Ası́ tenemos que:
Vector nulo Es aquel que tiene por módulo cero y no se le pude asignar dirección ni sentido. Podremos
comparar vectores si tienen la misma dirección y sentido.
Vector unitario Es aquel que tiene por módulo la unidad, es muy útil por cuanto, para efectos algebraicos,
“contiene” únicamente dirección y sentido. Lo denotaremos con un acento circunflejo, comúnmente llamado
~a
“sombrero” û~a = , con lo cual todo vector ~a = |~a| û~a se podrá expresar por un módulo en la dirección y
|~a|
sentido de un vector unitario.

Figura 1.2: Ejemplos de vectores atados
Comparamos vectores Al comparar sus módulos diremos que pueden ser mayores, menores o iguales.
Por lo tanto, tal y como mostramos en el cuadrante I de la Figura 1.1, dos vectores serán iguales ~a = ~b si
tienen la misma dirección y sentido.
Multiplicación por un escalar Un vector, multiplicado por un escalar, n, cambiará su módulo si n > 0
y cambiará su sentido y eventualmente su módulo si n < 0 Tal y como puede apreciarse en el cuadrante I de
la Figura 1.1. Claramente dos vectores proporcionales serán colineales. Diremos además, que el inverso del
vector ~a será la multiplicación de ~a por (−1) . Esto es ~c = (−1) ~a = −~a
Suma de vectores Aprendimos que para sumar vectores utilizamos la regla del paralelogramo, es decir,
desplazamos paralelamente uno de los vectores y lo colocamos a continuación del otro, de tal forma que
la diagonal del paralelogramo, que tiene por lados los vectores sumandos, constituye el vector suma (ver
cuadrantes IIa y IIb de la Figura 1.1). Este esquema se puede generalizar para varios vectores tal y como lo
mostramos en el cuadrante IIa de la Figura 1.1. Allı́ construimos un polı́gono cuyos lados los constituyen los
vectores sumandos ~a, ~b, ~c,d~ y ~n con ~n = ~a + ~b + ~c + d.
~
Nótese que aún el caso tridimensional, el vector suma siempre será coplanar (estará en el mismo plano)
a los sumandos que lo generaron.
Igualmente, podemos definir la resta de vectores al sumar el inverso. Esto es

~a − ~b ≡ ~a + −~b ⇒ 0 = ~a − ~a ≡ ~a + (−~a)
En términos gráficos la resta de dos vectores se representa colocando los vectores (minuendo y sutraendo) con
el mismo origen y uniendo las cabezas de flecha. Dependiendo de cual vector es el minuendo y cual sustraendo
el vector
resta apuntará
del sustraendo hacia el minuendo. Obsérvese el cuadrante IIa de la Figura 1.1 la
resta ~a + ~b + ~c − ~a = ~b + ~c.

Claramente, el módulo del vector resta representa la distancia entre los dos extremos de los vectores
minuendo y el sustraendo
Un resumen de propiedades Podemos resumir las propiedades del álgebra de vectores como sigue
La suma de vectores
• tiene un único elemento neutro 0 + ~a = ~a + 0 = ~a ∀~a

• existe un elemento simétrico (−~a) (uno para cada vector) tal que 0 = ~a − ~a ≡ ~a + (−~a)
• es conmutativa ~a + ~b = ~b + ~a

• es asociativa ~a + ~b + ~c = ~a + ~b + ~c

• es distributiva µ ~a + ~b = µ~a + µ~b respecto a la multiplicación por escalares
La multiplicación de escalares por vectores
• es conmutativa ~aµ = µ~a

• es asociativa µ (ν~a) = (µν) ~a
• es distributiva (µ + ν) ~a = µ~a + ν~a
1.3. Independencia lineal y las bases para vectores

Armados con el álgebra y explicitando sus propiedades podemos construir la primera aproximación a uno
de los conceptos fundamentales del álgebra lineal. La noción de independencia o dependencia lineal.
Diremos que tres vectores ~a, ~b, ~c son linealmente independientes si se cumple que
µ~a + ν~b + γ~c = 0 ⇒ µ=ν=γ=0
es decir que la única manera que al sumar cualquier múltiplo de ~a, ~b, ~c se anule esto obliga que los escalares son
necesariamente nulos. Si no se cumple lo anterior entonces diremos que uno de los vectores será linealmente
dependiente y que por lo tanto se podrá expresar como combinación lineal de los otros dos
 
 µ 6= 0 
µ~a + ν~b + γ~c = 0 alguno de ν 6= 0 ⇒ ~c = µ̄ ~a + ν̄ ~b
 
γ 6= 0
Los vectores linealmente independientes formarán base para el espacio donde ellos “viven” y el número
máximo de vectores linealmente independientes será la dimensión de ese espacio de “residencia”. Tratemos
de concretar algunas de estas importantes afirmaciones.
Dos vectores linealmente dependientes son colineales. Es claro que

 ν
 ~a = − ~b


µ 6= 0 µ
µ~a + ν~b = 0 con alguno de ⇒
ν 6= 0 
 ~b = − µ ~a

ν

el contrario también será cierto: si dos vectores son colineales ellos serán linealmente dependientes.
ν
~a = α~b ⇒ µ~a + ν~b = 0 ⇒ µα~b + ν~b = 0 ⇒ (µα + ν) ~b = 0 ⇒ α = −
µ
y con lo cual podremos afirma que si dos vectores son linealmente independientes ellos no son colineales y
más aún si dos vectores son linealmente independientes no son colineales.
Tres vectores linealmente dependientes son complanares. Es claro que por ser los tres vectores
linealmente dependientes al menos uno de los escalares tiene que ser distinto de cero. Esto es
µ ν
µ~a + ν~b + γ~c = 0 ⇒ ~c = − ~a − ~b = µ̄ ~a + ν̄ ~b
γ γ
pero como µ̄ ~a ∝ ~a y ν̄ ~b ∝ ~b eso significa que ambos µ̄ ~a y ~a y ν̄ ~b y ~b son colineales respectivamente y su
suma estará en el mismo plano.
Dos vectores linealmente independientes expanden todos los vectores coplanares. Esto es, dado
dos vectores ~a, ~b linealmente independientes, entonces cualquier vector ~c,complanar con ~a y ~b, podrá expre-
sarse como una combinación lineal de ellos y diremos que ~c se expresa en términos de ~a, ~b como ~c = µ̄ ~a + ν̄ ~b
y esa expresión es única.
La primera de las afirmaciones es directa por cuanto hemos visto que si ~a y ~b son linealmente independiente
y ~c es complanar con ~a y ~b. Entonces, necesariamente ~a, ~b y ~c son linealmente dependientes. Esto es
µ ν
µ~a + ν~b + γ~c = 0 ⇒ ~c = − ~a − ~b = µ̄ ~a + ν̄ ~b
γ γ
La demostración de que la expansión es única viene de suponer que existen dos maneras distintas de repre-
sentar al vector ~c
 
~c = µ̄ ~a + ν̄ ~b   µ̄ − µ̆ = 0 ⇒ µ̄ = µ̆
⇒ 0 = (µ̄ − µ̆) ~a + (ν̄ − ν̆) ~b ⇒
 
~c = µ̆ ~a + ν̆ ~b ν̄ − ν̆ = 0 ⇒ ν̄ = ν̆
debido a que ~a y ~b son linealmente independiente. La demostración para el caso tridimensional es equivalente.
Es decir tres vectores linealmente independientes ~a, ~b y ~c expanden, de manera unı́voca, todos los vectores
del espacio. Esta demostración queda para el lector.
Cuando un vector ~c se pueda expresar en términos de dos vectores linealmente independientes ~a, ~b diremos
que ~a y ~b forman una base para todos los vectores complanares a ellos. Equivalentemente para el caso
tridimensional, tres vectores linealmente independientes ~a, ~b y ~c conformarán una base para los vectores del
espacio. Los escalares µ, ν para el caso bidimensional se denominan las componentes de ~c a lo largo de ~a y
~b, .respectivamente. Equivalentemente µ, ν, γ serán las componentes de cualquier vector para el caso 3D a lo
largo de ~a, ~b y ~c, respectivamente. Esta nomenclatura será más evidente luego de la próxima sección.
1.4. Productos de vectores

1.4.1. Producto escalar
Denominaremos producto escalar de dos vectores ~a y ~b a un escalar cuyo valor será igual al producto de
los módulos multiplicado por el coseno del ángulo que ellos forma.

ζ = ~a · ~b = |~a| ~b cos θh~a,~bi

Figura 1.3: Productos de Vectores
El significado geométrico del producto escalar es evidente el cuadrante I de la Figura El producto escalar
representa la proyección de ~a sobre ~b y equivalentemente la proyección de ~b sobre ~a.
De esta definición se derivan varias consecuencias las cuales por obvias no dejan de ser importantes.
2
El producto escalar de un vector consigo mismo, siempre es positivo. ζ~a = ~a ·~a = |~a| ≥ 0 y√
sólo será √
nulo
si ~a es el vector nulo. Esto es ζ~a = 0 ⇒ ~a = 0. Con esto podemos concluir que |~a| == ~a · ~a = ζ~a
El producto escalar es conmutativo ζ = ~a · ~b = ~b · ~a ya el ángulo entre los vectores es el mismo y la

multiplicación entre escalares es conmutativa.

El producto escalar es distributivo Esto es ~a · ~b + ~c = ~a · ~b + ~a · ~c. La demostración (gráfica) puede
apreciarse en el cuadrante II de la Figura 1.3

La multiplicación por un escalar. ζ̄ = αζ = |α| ~a · ~b = (α~a) · ~b = ~a · α~b = |α~a| ~b cos θh~a,~bi =

|~a| α~b cos θh~a,~bi
Desigualdad de Cauchy Schwarz. A partir de la definición de producto interno es inmediata la compro-

bación de la desigualdad de Cauchy Schwarz
2 2 2 2
2
~a · ~b = |~a| ~b cos θh~a,~bi ⇒ ~a · ~b ≤ |~a| ~b ⇔ ~a · ~b ≤ |~a| ~b ya que 0 ≤ cos2 θh~a,~bi ≤ 1
Del producto escalar surge el Teorema del Coseno. Es inmediato generalizar el producto escalar de un
vector consigo mismo, para ello suponemos que ~c = ~a + ~b, con lo cual
2
2 2
~c = ~a + ~b ⇒ ~c · ~c = ~a + ~b · ~a + ~b = |~c| = |~a| + ~b + 2 |~a| ~b cos θh~a,~bi

que no es otra cosa que el teorema del coseno y está ilustrado en el cuadrante III de la Figura 1.3.
Diremos que dos vectores, no nulos son ortogonales (perpendiculares) si su producto escalar es nulo.
Esta afirmación es inmediata
π

~a ⊥ ~b ⇒ θh~a,~bi = ⇒ ~a · ~b = |~a| ~b cos θh~a,~bi = 0
2
1.4.2. Producto vectorial

De siempre, también hemos aprendido que existe otro producto entre vectores. El producto vectorial. A
diferencia del producto escalar que genera un escalar, el producto vectorial ~c = ~a × ~b tiene como resultado
otro vector (realmente un pseudovector o vector axial en contraposición a los vectores polares pero eso lo
veremos más adelante), ~c, con las siguientes caracterı́sticas:

El módulo de ~c, será |~c| = |~a| ~b sen θ~a~b . Es claro que el módulo de ~c representa el área del paralelogramo
cuyos lados están formados por ~a y ~b (cuadrante V de la Figura 1.3)
Tal y como muestran los cuadrantes IV y V de la Figura 1.3, tendrá como dirección la perpendicular
al plano que forman ~a y ~b
y como sentido regla del pulgar derecho, regla de la mano derecha, o más elegante será positivo cuando
la multiplicación de ~a × ~b corresponda al sentido horario.
Otra vez, podemos deducir algunas consecuencias de esta definición.
El producto vectorial es anticonmutativo. Esto es ~a × ~b = −~b × ~a y se sigue de la definición que expresa

el cuadrante IV de la Figura 1.3

El producto vectorial es distributivo respecto a la suma. Vale decir ~a × ~b + ~c = ~a × ~b + ~a × ~c. La
demostración de esto lo dejaremos para más adelante. Valga ahora creerse la propiedad.
La multiplicación por un escalar. Nos conduce rápidamente a

|~c| = |α| ~a × ~b = (α~a) × ~b = ~a × α~b = |α~a| ~b sen θ~a~b = |~a| α~b sen θ~a~b
Dos vectores serán colineales si su producto vectorial se anula. Al igual que el cuando se anula el
producto escalar identificábamos a dos vectores ortogonales, cuando se anule el producto vectorial
tendremos dos vectores paralelos. Obvio que esto se cumple de inmediato

~a k ~b ⇒ θ~a~b = 0 ⇒ |~c| = ~a × ~b = |~a| ~b sen θ~a~b = 0
y si el módulo del vector es cero, obvio que es el vector nulo. Ahora bien, también de aquı́ deducimos
que
~c = ~a × ~b ⇒ ~c · ~a = ~a × ~b · ~a = ~c · ~b = ~a × ~b · ~b = 0

1.4.3. Una división fallida

Uno esperarı́a que para cada una de las definiciones de productos vectoriales, existiera vector cociente. Es
decir pudiéramos “despejar” uno de los multiplicados en términos del otro. La situación es que esta operación
no está definida unı́vocamente y lo podemos intuir a partir de una de las definiciones de producto.
Supongamos que tenemos un producto escalar o ζ = ~a · ~b con lo cual, si pudiéramos “despejar”,digamos
~b = ζ ¿ tendrı́amos entonces definido ~b de una manera unı́voca ? La respuesta es NO. ya que ζ = ~a · ζ + d~
~a ~a
~ ~ ζ ~ ~
donde ~a ⊥ d por lo cual existen infinitos b = + d que cumplen ζ = ~a · b.
~a
1.4.4. Producto triple o mixto

Analicemos ahora el número (pseudoescalar) que proviene de la multiplicación

V = ~c · ~a × ~b = |~c| ~a × ~b cos θh~c,~a×~bi
representa del volumen del paralelepı́pedo cuyos lados quedan definidos por ~a, ~b y ~c. Este producto también
cumple con algunas propiedades que enunciaremos ahora y demostraremos más tarde

El producto mixto ~a × ~b ·~c, representa el volumen del paralelepı́pedo cuyos lados son los vectores ~a, ~b

y ~c.Es claro y fue ilustrado que el módulo del producto vectorial ~a × ~b representa el área de la base
y la altura está representada por la proyección del vector ~c sobre la perpendicular al plano de la base
que es, precisamente, |~c| cos θh~c,~a×~bi
El producto mixto es cı́clico respecto a sus factores. Esto es

~a × ~b · ~c = ~b × ~c · ~a = (~c × ~a) · ~b
Esta afirmación se verá demostrada más adelante
el producto mixto se anula cuando se repite alguno de sus factores

~a × ~b · ~a = ~a × ~b · ~b = (~a × ~a) · ~c = ~b × ~b · ~c = 0

Claramente, si ~a × ~b ⊥ ~a ⇒ ~a × ~b · ~a = 0

Si los tres vectores ~a, ~b y ~c son coplanares (linealmente dependientes) entonces ~a × ~b · ~c = 0 o, dicho

de manera más elegante, útil e impactante: tres vectores que cumplen ~a × ~b · ~c 6= 0 forma base para
el espacio
tridimensional. Esa base se denominará levógira (contraria al giro de
las manecillas
del reloj)
~ ~
si ~a × b · ~c < 0 y dextrógira (la convencional base de la mano derecha) si ~a × b · ~c > 0.

Figura 1.4: Vectores, bases y componentes
1.5. Componentes, coordenadas y cosenos directores

1.5.1. Bases, componentes y coordenadas
La formulación de las leyes fı́sicas debe hacerse en término de cantidades vectoriales (tensoriales). Esto
independiza su formulación de un sistema particular de coordenadas, pero llegado el momento de calcular
valores y utilizar estas leyes, es mucho más conveniente referirla a un sistema de coordenadas particularmente
adaptado a la geometrı́a del problema. En ese caso la ecuación vectorial se convertirá en tantas ecuaciones
como componentes (referidas al sistema de coordenadas utilizado) tenga los vectores en ese sistema de
coordenadas
Tal y como mencionamos arriba tres vectores no coplanares cualesquiera son linealmente independientes
y constituyen una base para el espacio tridimensional. Denominaremos, de ahora en adelante estos vectores
base {w ~ 1, w ~ 3 } y por ser linealmente independientes podremos expresar cualquier vector ~a como una
~ 2, w
combinación lineal única. Tal y como lo mostramos en el cuadrante I de la Figura 1.4 con los vectores base
{w~ 1, w ~ 3 } podemos construir un sistema (oblicuo en general) de coordenadas al colocarlos con un mismo
~ 2, w
origen. Esto es
~a = ã1 w
~ 1 + ã2 w~ 2 + ã3 w
~3
1 2 3
donde las cantidades ã , ã , ã son números (no son escalares) que representan las componentes del vector
~a a lo largo de cada uno de los vectores base {w ~ 1, w ~ 3 } . Nótese que por costumbre (la cual será evidente
~ 2, w
más adelante) etiquetamos estos números con superı́ndices y la letra que identifica el vector.
→
− −−→
Más aún, cada punto P del espacio viene definido por un radiovector r̃ (P ) ≡ OP que une el origen
de coordenadas con el punto P y se le asocian ntres números o x̃1 , x̃2 , x̃3 , los cuales son las proyecciones

a lo largo de cada uno de los ejes coordenados 0x̃1 , 0x̃2 , 0x̃3 . Los números x̃1 , x̃2 , x̃3 se denominarán
→
−
componentes de r̃ (P ) en el sistema de referencia {w ~ 1, w
~ 2, w~ 3} .

Existe una familia de sistema de coordenadas en la cual sus vectores base son ortogonales (o mejor
ortonormales), es decir los vectores base {~e1 , ~e2 , ~e3 } son perpendiculares entre si. Tal y como mostraremos
más adelante, siempre se puede construir un sistema ortogonal (ortonormal) {~e1 , ~e2 , ~e3 } a partir de una
base genérica de vectores linealmente independientes {w ~ 1, w ~ 3 } . Cuando el sistema sea ortogonal sus
~ 2, w
componentes se denominarán rectangulares. Dependiendo del signo del triple producto mixto el sistema de
coordenadas será dextrógiro ((~e1 × ~e2 ) · ~e3 > 0) o levógiro ((~e1 × ~e2 ) · ~e3 < 0) tal y como se muestra en el
cuadrante III de la Figura 1.4
Es costumbre ancestral, por relaciones de dominación de los derechos sobre los izquierdos (en latı́n e
italiano los zurdos son siniestros) utilizar la convención
n odextrógira ((~e1 × ~e2 )·~e3 > 0) y en ese caso utilizamos
el bien conocido conjunto de vectores unitarios ı̂, ̂, k̂ con lo cual desde siempre tenemos que
~a = ax ı̂ + ay ̂ + az k̂ y ~r (P ) = x ı̂ + y ̂ + z k̂
n o
de ahora en adelante representaremos este sistema de coordenadas ortonormal como ı̂ ≡ ı̂1 , ̂ ≡ ı̂2 , k̂ ≡ ı̂3
para recordar que estamos en un sistema de coordenadas cartesianas.
Obviamente el módulo del vector se podrá expresar con la utilización del Teorema de Pitágoras
q p →
−
a2x + a2y + a2z = |~a| y x2 + y 2 + z 2 = r̃ (P )
y la multiplicación por un escalar

q
α~a = α ax ı̂ + ay ̂ + az k̂ = (αax )ı̂ + (αay ) ̂ + (αaz ) k̂ ⇒ |~a| = α a2x + a2y + a2z
Igualmente un vector unitario

~a 1 ax ay az
û~a = =q ax ı̂ + ay ̂ + az k̂ = q ı̂ + q ̂ + q k̂
|~a| a2x + a2y + a2z a2x + a2y + a2z a2x + a2y + a2z a2x + a2y + a2z
con lo cual todo vector q

~a = |~a| û~a = a2x + a2y + a2z û~a
1.5.2. Cosenos directores

Como se puede apreciar en el cuadrante IV de la Figura 1.4 podemos construir tres triángulos rectángulos
~ (P ) como hipotenusa de cada uno de ellos. Los ángulos que forma el radiovector R
con el radiovector R ~ (P )
con cada uno de los ejes coordenados {x, y, z} son {α, β, γ} respectivamente, con lo cual

~ ~ ~
Rx = R cos α Ry = R cos β y Rz = R cos γ ⇒ cos2 α + cos2 β + cos2 γ = 1
pero además
~a
u~a = = cos α ı̂ + cos β ̂ + cos γ k̂
|~a|
1.6. Algebra vectorial y coordenadas

Entonces podremos reescribir el álgebra vectorial como de forma algebraica, vale decir mediante opera-
ciones referidas a las coordenadas. Ası́

1.6.1. Suma y resta de vectores

Será representada por

~a + ~b = ax ı̂ + ay ̂ + az k̂ + bx ı̂ + by ̂ + bz k̂ = (ax + bx )ı̂ + (ay + by ) ̂ + (az + bz ) k̂
o equivalentemente

~a + ~b = a1 ı̂1 + a2 ı̂2 + a3 ı̂3 + b1 ı̂1 + b2 ı̂2 + b3 ı̂3 = a1 + b1 ı̂1 + a2 + b2 ı̂2 + a3 + b3 ı̂3
y obviamente, la resta

~a + ~b = a1 ı̂1 + a2 ı̂2 + a3 ı̂3 − b1 ı̂1 + b2 ı̂2 + b3 ı̂3 = a1 − b1 ı̂1 + a2 − b2 ı̂2 + a3 − b3 ı̂3
con lo cual la distancia entre dos puntos P y M será

→ → q
− − 2 2 2
d (P, M ) = r̃ (P ) = ~a − r̃ (M ) = ~b = (ax − bx ) + (ay − by ) + (az − bz )
1.6.2. Dependencia e independencia lineal

Ahora es fácil estudiar la dependencia/independencia lineal en coordenadas. Otra vez, tres vectores
~a = ax ı̂ + ay ̂ + az k̂; ~b = bx ı̂ + by ̂ + bz k̂ y ~c = cx ı̂ + cy ̂ + cz k̂ serán linealmente independientes si se cumple
que
µ~a + ν~b + γ~c = 0 ⇒ µ = ν = γ = 0
Antes de proseguir en forma general, veamos algunos casos particulares
La base canónica ı̂1 = ı̂ ≡ (1, 0, 0) ;ı̂2 = ̂ ≡ (0, 1, 0) ;ı̂3 = k̂ ≡ (0, 0, 1). Estos vectores son claramente
linealmente independientes y por lo tanto constituyen un base
µ = 0
ν = 0
γ = 0
Los vectores w1 = ı̂ ≡ (1, 0, 0) ; w2 = ı̂ + ̂ ≡ (1, 1, 0) ; ı̂3 = ı̂ + ̂ + k̂ ≡ (1, 1, 1). Estos vectores no son
linealmente independientes de manera obvia. Veamos
 
µ = 0   µ=0
µ +ν = 0 ⇒ ν=0
 
µ +ν +γ = 0 γ=0
con lo cual demostramos que son linealmente independientes y por lo tanto constituyen una base para
los vectores tridimensionales.
En general tendremos que

0 = µ ax ı̂ + ay ̂ + az k̂ + ν bx ı̂ + by ̂ + bz k̂ + γ cx ı̂ + cy ̂ + cz k̂ ⇒

 µax + νbx + γcx = 0
0 = (µax + νbx + γcx )ı̂ + (µay + νby + γcy ) ̂ + (µaz + νbz + γcz ) k̂ ⇒ µay + νby + γcy = 0

µaz + νbz + γcz = 0

Esto no es otra cosa que un sistema de 3 ecuaciones lineales con 3 incógnitas {µ, ν, γ} y la solución que
estamos buscando µ = ν = γ = 0 se cumplirá si

ax bx cx

ay by cy = az (by cx − cx by ) − ay (bx cz − cz bx ) + ax (by cz − cz by ) 6= 0

az bz cz
1.6.3. Producto escalar

n o
Del mismo modo representaremos el producto escalar de dos vectores en una base cartesiana como ı̂, ̂, k̂
es una base ortonormal entonces

~a · ~b = ax ı̂ + ay ̂ + az k̂ · bx ı̂ + by ̂ + bz k̂ = ax bx + ay by + az bz
ya que por ser ortogonales


 ı̂ · ̂ = ̂ · ı̂ = 0
ı̂ · ı̂ = ̂ · ̂ = k̂ · k̂ = 1 y ı̂ · k̂ = k̂ · ı̂ = 0

̂ · k̂ = k̂ · ̂ = 0
Las propiedades del producto escalar en coordenadas comprueban fácilmente
El producto interno de un vector consigo mismo, siempre es positivo.

2
ζ~a = ~a · ~a = |~a| = a2x + a2y + a2z ≥ 0 y a2x + a2y + a2z = 0 ⇒ ax = ay = az = 0 ⇔ ~a = 0
√ √ q
Adicionalmente |~a| = ζ~a = ~a · ~a = a2x + a2y + a2z
El producto escalar es conmutativo
ζ = ~a · ~b = ~b · ~a = ax bx + ay by + az bz = bx ax + by ay + bz az
El producto escalar es distributivo:

~a · ~b + ~c = ~a · ~b + ~a · ~c
m

ax ı̂ + ay ̂ + az k̂ · (bx + cx )ı̂ + (by + cy ) ̂ + (bz + cz ) k̂ = ax (bx + cx ) + ay (by + cy ) + az (bz + cz )
(ax bx + ax cx ) + (ay by + ay cy ) + (az bz + az cz ) = (ax bx + ay by + az bz ) + (ax cx + ay cy az cz )
La multiplicación por un escalar.

ζ̄ = αζ = |α| ~a · ~b = (α~a)·~b = ~a · α~b = (αax ) bx +(αay ) by +(αaz ) bz = ax (αbx )+ay (αby )+az (αbz )
Desigualdad de Cauchy Schwarz.

q q

~a · ~b = ax bx + ay by + az bz ≤ a2x + a2y + a2z b2x + b2y + b2z = |~a| ~b

Diremos que dos vectores, no nulos son ortogonales (perpendiculares) si su producto escalar es nulo.
Esta afirmación es inmediata
π

~a ⊥ ~b ⇒ θh~a,~bi = ⇒ ~a · ~b = |~a| ~b cos θh~a,~bi = 0
2
Por lo cual
ax bx + ay by + az bz

ax bx + ay by + az bz = |~a| ~b cos θ~a~b ⇒ cos θ b~ = q q
~
ab
a2x + a2y + a2z b2x + b2y + b2z
de donde se deduce que dos vectores perpendiculares
~a⊥~b ⇒ 0 = ax bx + ay by + az bz
Los vectores de la base canónica ı̂1 = ı̂ ≡ (1, 0, 0) ;ı̂2 = ̂ ≡ (0, 1, 0) ;ı̂3 = k̂ ≡ (0, 0, 1) son claramente
mutualmente ortonormales
cos θı̂̂ = ı̂ · ̂ = ̂ · ı̂ = 0
ı̂ · k̂ = k̂ · ı̂ = 0
̂ · k̂ = k̂ · ̂ = 0
Del producto escalar surge el Teorema del Coseno. Es inmediato generalizar el producto escalar de un
vector consigo mismo, para ello suponemos que ~c = ~a + ~b, con lo cual
2
2 2
~c = ~a + ~b ⇒ ~c · ~c = ~a + ~b · ~a + ~b = |~c| = |~a| + ~b + 2 |~a| ~b cos θh~a,~bi
que no es otra cosa que el teorema del coseno y está ilustrado en el cuadrante III de la Figura 1.3
1.6.4. Producto vectorial

De igual manera aprendimos
~c = ~a × ~b = (ay bz − az by )ı̂+ (az bx − ax bz ) ̂+ (ax by − ay bx ) k̂
con lo cual lo podemos organizar como el determinante de la matriz

ı̂ ̂ k̂

~c = ~a × ~b = ax ay az
b x by b z
con lo cual
q q q
2 2 2
|~c| = (ay bz − az by ) + (az bx − ax bz ) + (ax by − ay bx ) = a2x + a2y + a2z b2x + b2y + b2z sen θ~a~b
1.6.5. Triple producto mixto


cx cy cz

V = ~c · ~a × ~b = k~ck ~a × ~b cos θh~c,~a×~bi = ax ay az

bx by b z
representa del volumen del paralelepı́pedo cuyos lados quedan definidos por ~a, ~b y ~c.

1.7. Algebra vectorial con ı́ndices

1.7.1. Convención de Einstein
Antes de comenzar con la presentación de este esquema de cálculo. cabe aclarar algunas costumbres y
convenciones con la notación de ı́ndices
1. Los ı́ndices repetidos (arriba y abajo) indicarán suma por los valores que tomen los ı́ndices. Las com-
ponentes de los vectores tendrán ı́ndices arriba y los vectores base abajo
3
X
~a = ax ı̂ + ay ̂ + az k̂ = ⇔ ~a = a1 ı̂1 + a2 ı̂2 + a3 ı̂3 = am ı̂m ⇔ ~a = am ı̂m
m=1
hemos identificado ı̂1 = ı̂;ı̂2 = ̂ y ı̂3 = k̂
2. Los ı́ndices repetidos son mudos (no importa la letra que lo etiquete) y representan suma. Ası́
Kj Aj = Km Am = K1 A1 + K2 A2 + K3 A3 = B
3. Llamaremos contracción cuando sumamos respecto a un par de ı́ndices, vale decir

X
Aii = A11 + A22 + A33 =⇒ Aii = A11 + A22 + A33
i
Es claro que la contracción de ı́ndices convierte un conjunto de números (i × j) → 1,a un solo número
4. Los ı́ndices libres (aquellos que no están sumados) indican el número de objetos disponibles y deben
mantenerse. Ası́  1

 K1 A1 + K21 A2 + K31 A3 = B1



Kki Ak = Bi ⇔ K12 A1 + K22 A2 + K32 A3 = B2




 1
K1 A1 + K21 A2 + K31 A3 = B1
con lo cual Kki Ak = Bi representan 3 ecuaciones y Kki Akj = Bij representará 9
5. La delta de Kronecker1 δik lleva un ı́ndice arriba y uno abajo. Representa δik = 1 si i = k y es nula en
los otros casos. Con esto
=0 =0 =0 =0 =0 =0
z}|{ z}|{ z}|{ z}|{ z}|{ z}|{
Kkij δki = K11j δ11 + K12j δ12 + K13j δ13 + K21j δ21 + K22j δ22 + K23j δ23 + K31j δ31 + K32j δ32 + K33j δ33
|{z} |{z} |{z}
=1 =1 =1
es decir
Kkij δki = Kkkj = Kiij = K11j + K22j + K33j
1 Leopold Kronecker (7 diciembre 1823 Legnica, Polonia; 29 diciembre 1891, Berlin, Alemania) Matemático polaco con
importantes contribuciones en teorı́a de números, funciones elı́pticas y algebra, ası́ como la interrelación estre estas disciplinas.
Más detalles http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Kronecker.html

6. Además de la delta de Kronecker introduciremos el sı́mbolo de permutación de Levi-Civita2 εijk para

el caso de tres dimensiones, vale decir i, j, k = 1, 2, 3

 +1 cuando {(1, 2, 3) ; (3, 1, 2) ; (2, 3, 1)} permutación cı́clica
εijk = εijk = −1 cuando {(1, 3, 2) ; (3, 2, 1) ; (2, 1, 3)} permutación impar o anticı́clica

0 cuando i = j; i = k ∧ j = k
y quiere decir que es distinto de cero cuando todos los ı́ndices son diferentes; 1 si la permutación de
ı́ndices es cı́clicas (o par) y −1 si la permutación es anticı́clica (o impar). Con ello
 111

 ε a1 b1 + ε112 a1 b2 + ε113 a1 b3 + ε121 a2 b1 + ε122 a2 b2 + ε123 a2 b3 + ε131 a3 b1 + ε132 a3 b2 + ε133 a3 b3



εijk aj bk = ε211 a1 b1 + ε212 a1 b2 + ε213 a1 b3 + ε221 a2 b1 + ε222 a2 b2 + ε223 a2 b3 + ε231 a3 b1 + ε232 a3 b2 + ε233 a3 b3




 311
ε a1 b1 + ε312 a1 b2 + ε313 a1 b3 + ε321 a2 b1 + ε322 a2 b2 + ε323 a2 b3 + ε331 a3 b1 + ε332 a3 b2 + ε333 a3 b3
con lo cual  1

 c = ε123 a2 b3 + ε132 a3 b2 = a2 b3 − a3 b2



ci = εijk aj bk ⇒ c2 = ε231 a3 b1 + ε213 a1 b3 = a3 b1 − a1 b3




 3
c = ε312 a1 b2 + ε321 a2 b1 = a1 b2 − a2 b1
7. A continuación enumeramos algunas propiedades de las deltas de Kronecker y de los sı́mbolos de

permutación de Levi-Civita las cuales le dejamos al lector su demostración. Ellas son
δjj = 3
εjkm εilm = δji δkl − δki δjl = δji δkl − δjl δki
εjmn εimn = 2δji ,
εijk εijk = 6.
1.7.2. Los vectores y los ı́ndices

Sumas de vectores
De ese modo la suma de vectores será expresada de la siguiente manera

~a + ~b = ai ı̂i + bi ı̂i = ai + bi ı̂i = ci ı̂i ⇒ ci = ai + bi con i, j = 1, 2, 3
Producto escalar
A partir da ahora y de forma equivalentemente, expresaremos el producto escalar en término de los
ı́ndices. De forma y manera que

~a · ~b = k~ak ~b cos θ~a~b = ai bi = bj aj con i, j = 1, 2, 3
2 Tullio Levi-Civita (1873 Padova, Veneto, 1941 Roma, Italia) Geómetra italiano uno de los desarrolladores del Cálculo
Tensorial que más tarde serı́a utilizado, por Einstein y Weyl como el lenguaje de la Relatividad General

Producto vectorial
En términos de ı́ndices, el producto vectorial se puede expresar como
i
~a × ~b = εijk aj bk con i, j = 1, 2, 3
todas las particularidades de producto vectorial ahora descansan en las propiedades del sı́mbolo de Levy
Civita.
Triple producto mixto


cx cy cz

V = ~c · ~a × b = k~ck ~a × b cos θh~c,~a×~bi = c εijk a b = ax ay
~ ~ i j k
az

bx by bz
1.7.3. Un par de cálculos ilustrativos

Mostremos tres casos de identidades vectoriales que pueden ser demostradas mediante la utilización de
ı́ndices.

1. ~a × ~b × ~c = (~c · ~a) ~b − ~a · ~b ~c
El resultado será un vector, por lo tanto
i
~a × ~b × ~c = εijk aj ~b × ~c
k
= εijk aj εkmn bm cn = εijk εkmn aj bm cn = εijk εmnk aj bm cn
i j j i

= δm δn − δ m δn aj bm cn = δm
i j
δn aj bm cn − δm δn aj bm cn
j i
i m j
= δm b δn aj cn − δni cn δm j
aj bm = bi an cn − ci aj bj
| {z } |{z}
(~
c·~
a)
(~a·~b)
i
~a × ~b × ~c = bi (~c · ~a) − ci ~a · ~b

2. ~a × ~b · ~c × d~ = (~a · ~c) ~b · d~ − ~a · d~ ~b · ~c
El lado derecho es un escalar, por lo tanto
l
~a × ~b · ~c × d~ = ~a × ~b ~c × d~
l
= εljk aj bk εlmn cm dn = εljk εlmn aj bk cm dn

= εjkl εmnl aj bk cm dn = δm j k k j
δn − δm δn aj bk cm dn
j k
= δm δn aj bk cm dn − δm
k j
δn aj bk cm dn
j
= δm aj cm δ k bk dn − δ k bk cm δ j aj dn
| {z }|n {z } |m {z }|n {z }
(~
a·~
c) (~b·d~) (~b·~c) (~a·d~)

= (~a · ~c) ~b · d~ − ~a · d~ ~b · ~c

1.7.4. El escalares, pseudoescalares, vectores y pseudovectores

La diferencia entre vectores polares y axiales proviene del siguiente comportamiento bajo transformaciones
de coordenadas y base. Un vector polar (normal, común y corriente) queda invariante bajo la siguiente
transformación
ı̂i → −ı̂i
=⇒ ~a = ai ı̂i → −aj (−ı̂j ) = ai ı̂i = ~a
ai → −ai
mientras que un pseudovector o vector axial cambia de signo cuando las componentes de los vectores que la
generan y sus vectores base

ı̂i → −ı̂i 
ai → −ai =⇒ ~c = ~a × ~b → εijk (−aj ) (−bk ) (−ı̂i ) = −ci ı̂i = −~c
i i 
b → −b
es decir
~a × ~b = (ay bz − az by )ı̂+ (az bx − ax bz ) ̂+ (ax by − ay bx ) k̂
↓

= ((−ay ) (−bz ) − (−az ) (−by )) (−ı̂) + ((−az ) (−bx ) − (−ax ) (−bz )) (−̂) + ((−ax ) (−by ) − (−ay ) (−bx )) −k̂
↓

− ~a × ~b = − (ay bz − az by )ı̂ − (az bx − ax bz ) ̂ + (ax by − ay bx ) k̂
Existen varias e importantes cantidades fı́sicas que vienen representadas por pseudovectores, entre ellas
mencionamos
Velocidad Angular ~ × ~r
~v = ω
Cantidad de Movimiento Angular ~
L = ~r × p~
Torque ~τ = ~r × F~
~
∂ B ~ ~
Campo de Inducción Magnética ∂t = −∇ × E

Adicionalmente el volumen, V = ~c · ~a × ~b , como era de esperarse, no es invariante bajo cambio del
espacio

ci → −ci 
ai → −ai =⇒ V = ~c · ~a × ~b = ci εijk aj bk → (−ci ) εijk (−aj ) (−bk ) = −V

bi → −bi
El volumen es un pseudoescalar mientras que los escalares son invariantes bajo esta transformación

ai → −ai
=⇒ w = ~a · ~b = ai bi → −ai (−bi ) = w
bi → −bi
en general también tendremos multiplicación entre algunos de estos objetos, con lo cual construiremos otros
objetos. Dejamos al lector demostrar la siguiente tabla de relaciones
vector · vector = escalar
vector · pseudovector = pseudoescalar
pseudovector · pseudovector = escalar
vector × vector = pseudovector
vector × pseudovector = vector
pseudovector × pseudovector = pseudovector

Figura 1.5: Gemetrı́a analı́tica y vectores cartesianos
1.8. Aplicaciones del álgebra vectorial

Uno de los terrenos más exitosos de las aplicaciones del álgebra vectorial es la geometrı́a analı́tica en el
plano. Esto se realiza en base a la definición que hiciéramos de radio vector, en la cual a cada punto, P, del
espacio le asociábamos un radiovector posición tal y como lo mostramos en el cuadrante IV de la Figura 1.4
.
P ←→ (x, y, z) ≡ x1 , x2 , x3 ⇒ ~r (P ) = x ı̂ + y ̂ + z k̂ = x1 ı̂1 + x2 ı̂2 + x3 ı̂3 = xm ı̂m
A partir de esta definición todas las propiedades geométricas del espacio las podemos construir con vectores.
1.8.1. Rectas y vectores

La ecuación de la recta en término de vectores la definiremos fijando uno de sus puntos, digamos
~ (P1 ) = X
~r (P1 ) ≡ X ~ 1 = x1 ı̂ + y1 ̂ + z1 k̂ = x1 ı̂1 + x21 ı̂2 + x31 ı̂3 ←→ (x1 , y1 , z1 )
1
sus puntos y un vector que indique su dirección, digamos A ~ = Ax ı̂ + Ay ̂ + Az k̂ (ver cuadrante IV de la

Figura 1.5) con lo cual la ecuación de una recta en lenguaje vectorial será


 x = x1 + λAx



X~ =X ~ 1 + λA
~ ⇒ x ı̂ + y ̂ + z k̂ = x1 ı̂ + y1 ̂ + z1 k̂+λ Ax ı̂ + Ay ̂ + Az k̂ ⇒ y = y1 + λAy





z = z1 + λAz
donde X ~ = x ı̂ + y ̂ + z k̂ el conjunto de puntos genéricos que cumple con la ecuación de la recta en 3D. Si
lo colocamos en función de la notación de ı́ndices, las ecuaciones anteriores son más evidentes
~ =X
X ~ 1 + λA
~ ⇒ xm ı̂m = xm m
1 ı̂m + λA ı̂m ⇒ xm = xm
1 + λA
m
para m = 1, 2, 3

Nótese que efectivamente se cumplen tres ecuaciones escalares y cada una de ellas tiene la forma de una
recta. Además, tal y como muestra la Figura 1.5 el punto genérico (x, y, z) lo describe (sobre la recta) la
~
variación del módulo de A mediante la constante de proporcionalidad λ. Si se requiere describir una recta
que pase por dos puntos, digamos (x1 , y1 , z1 ) y (x2 , y2 , z2 ) entonces una vez seleccionado uno de los puntos
~ = ~r (P2 ) − ~r (P1 ) como la resta de los dos radiovectores a los
(digamos (x1 , y1 , z1 )) seleccionamos el vector A
puntos P2 y P1 . Esto es
~ 1 + δX
X ~2 ~1 − X
X ~
~ =X
X ~1 + λ X~2 − X
~1 ~ =
⇒X con δ = .
1−δ ~2 − X
X ~
La división entre vectores δ tiene sentido porque no es una división entre vectores genéricos es una división
entre vectores que tienen la misma dirección Nótese además que, lo mismo ocurre cuando “despejamos” λ
de la ecuación de la recta
~ −X
X ~1 xm − xm x − x1 y − y1 z − z1
1
λ= ⇒ xm = xm
1 + λA
m
⇒λ= = = =
~
A Am Ax Ay Az
y equivalentemente ocurre cuando “despejamos” λde la ecuación de la recta que pasa por dos puntos.
~ −X
X ~1 xm − xm x − x1 y − y1 z − z1
1
λ= ⇒ xm = xm m m
1 + λ (x2 − x1 ) ⇒λ= m = x −x = y −y = z −z
~2 − X
X ~1 xm
2 − x1 2 1 2 1 2 1
1.8.2. Planos y vectores

Ocurre exactamente lo mismo cuando construimos la ecuación vectorial para un plano. En general una
superficie la define su vector normal (perpendicular). En el caso de una superficie plana (un plano) tendrá una
única normal que lo define. Por lo tanto, un plano vendrá definido su vector perpendicular un punto, digamos
−−→
P1 ←→ (x1 , y1 , z1 ) . La ecuación vectorial del plano vendrá definida por todos los vectores P Q tales que sean
perpendiculares a un determinado vector A ~ (ver cuadrante IV de la Figura 1.5). Donde el punto P es un
punto genérico (x, y, z) que define un radiovector. La ecuación vectorial del plano será simplemente
 
~·
A

~r (P ) − ~r (P1 ) = 0 ⇔ ~ · (~r − ~r1 ) = 0
A ⇔ ~ · ~r = A
A ~ · ~r
| {z } | {z }1
~
B b
Esto es se tiene que cumplir la condición

Ax ı̂ + Ay ̂ + Az k̂ · x ı̂ + y ̂ + z k̂ − x1 ı̂ + y1 ̂ + z1 k̂ = 0

Ax ı̂ + Ay ̂ + Az k̂ · (x − x1 ) ı̂ + (y − y1 ) ̂ + (z − z1 ) k̂ = 0
Ax (x − x1 ) + Ay (y − y1 ) + Az (z − z1 ) = 0
con lo cual la ecuación del plano queda como siempre ha sido
Ax x + Ay y + Az z − Ax x1 − Ay y1 − Az z1 = 0 ⇒ Ax x + Ay y + Az z = b = Ax x1 + Ay y1 + Az z1

Figura 1.6: Vectores variables
es decir, de manera más compacta

Am xm − Aj xj1 = 0 ⇒ Ak xk = b = Al xl1
Es claro que A ~ · ~r1 = b es la proyección del radiovector ~r (P1 ) sobre la perpendicular que define al plano. Por
lo tanto será la distancia entre el plano y el origen de coordenadas. Si b = 0 el plano pasa por el origen de
coordenadas.
Consideremos ahora el cuadrante IV de la Figura 1.5. Allı́ están especificados tres puntos en el espacio
caracterizados por sus correspondientes radiovectores posición, ~r (P1 ) = ~r1 , ~r (P2 ) = ~r2 y ~r (P3 ) = ~r3 . Estos
tres puntos serán coplanares si

(~r1 − ~r2 ) · ((~r2 − ~r3 ) × (~r3 − ~r1 )) = 0 ⇔ εmnl (xm m n n l l
1 − x2 ) (x2 − x3 ) x3 − x1 = 0
y la ecuación del plano vendrá dada por

(~r − ~r1 ) · ((~r2 − ~r1 ) × (~r3 − ~r1 )) = 0 ⇔ =0
1.9. Un comienzo a la derivación e integración de vectores

1.9.1. Vectores variables,
Los vectores podrán ser constantes o variables. Ahora bien esa caracterı́stica se verificará tanto en las
componentes como en la base. Esto quiere decir que cuando un vector es variable podrán variar su módulo, su
dirección, su sentido o todo junto o separado. Obviamente esta variabilidad del vector dependerá de la base
en la cual se exprese, por lo cual un vector podrá tener una componente constante en una base y constante
en otra.
~a (t) = ak (t) ẽk (t) = ãk ẽk (t) = âk (t) ẽk (t)

Nótese que hemos utilizado una base {ẽk (t)} de vectores variables a diferencia de la tradicional base de
vectores cartesianos, los cuales son constantes en módulo dirección y sentido (ver los cuadrantes I y II
de la Figura 1.6). Más aún, tal y como se muestra en cuadrante IIc de la Figura 1.6 todo vector variable
podrá ser expresado como la suma de uno variable, ~a (t) , mas otro constante ~c
~ (t) = ~a (t) + ~c
A
1.9.2. Derivación
De esta manera, cuando uno piensa en un vector variable ~a (t) ⇐⇒ ~a (t) uno rápidamente piensa en
establecer un cociente incremental tal y como se muestra en
~a (t + ∆t) − ~a (t) ∆~a (t) d~a (t)
lı́m = lı́m =
∆t→0 ∆t ∆t→0 ∆t dt
el cuadrante IV de la Figura 1.6 ilustra gráficamente este cociente incremental. Como siempre, las propiedades
de esta operación derivación serán

d ~a (t) + ~b (t) d (~a (t)) d ~b (t)
= +
dt dt dt
d (α (t) ~a (t)) d (α (t)) d (~a (t))

= ~a (t) + α (t)
dt dt dt
 
d ~a (t) · ~b (t) d ~b (t)
d (~a (t))
= · ~b (t) + ~a (t) ·  
dt dt dt

d ~a (t) × ~b (t) d (~a (t)) ~ d ~b (t)
= × b (t) + ~a (t) ×
dt dt dt
Ahora bien, esto implica que

k d (~a (t)) d ak (t) ẽk (t) d ak (t) d (ẽk (t))
~a (t) = a (t) ẽk (t) =⇒ = = ẽk (t) + ak (t)
dt dt dt dt
con lo cual hay que tener cuidado al derivar vectores y cerciorarse de la dependencia funcional de base y
componentes. Habrá sistemas de coordenadas (bases de vectores) que serán constantes y otros en los cuales
sus vectores bases cambiarán en su dirección. El primer término representa la variación del módulo y el
segundo muestra la contribución de los cambios en dirección del vector. Más aún, mostraremos apoyándonos
en la ilustración del cuadrante el cuadrante III de la Figura 1.6 que, independientemente del sistema de
coordenada el cambio en el módulo apunta en la dirección del vector, mientras que las contribuciones en
dirección apuntan en la dirección perpendicular al vector. Esto es
d (~a (t)) d (|~a (t)|)
= ûak + |~a (t)| ûa⊥ con ûak · ûa⊥ = 0
dt dt
Es fácil convencernos de la forma del primer término. Siempre podemos representar un vector como su
módulo y un vector unitario en la dirección apropiada. Esto es
d (~a (t)) d (|~a (t)| ûa (t)) d |~a (t)| d (ûa (t))
~a (t) = |~a (t)| ûa =⇒ = = ûa (t) + |~a (t)|
dt dt dt dt

adicionalmente

2
d |~a (t)| d (~a (t) · ~a (t)) d (|~a (t)|) d (~a (t))
2
|~a (t)| = ~a (t) · ~a (t) =⇒ ≡ = 2 |~a (t)| ≡ 2~a (t) ·
dt dt dt dt
con lo cual
d (|~a (t)|) ~a (t) d (~a (t)) d (|~a (t)|) d (~a (t))
≡2 · =⇒ = ûa (t) ·
dt 2 |~a (t)| dt dt dt
| {z }
ûa (t)
para que finalmente



 d (~a (t)) d |~a (t)|
d (~a (t))

d |~a (t)| d (ûa (t))
 ûa (t) ·

dt
=
dt
ûa (t) · = ûa (t) · ûa (t) + |~a (t)| =⇒
dt dt dt 
 d (ûa (t))

 ûa (t) · =0
dt
Es decir que el cambio en el módulo de un vector se manifiesta en la dirección del mismo vector, tal y
como era intuitivo suponer. Adicionalmente vemos que el vector siempre será perpendicular a su derivada.
Gráficamente podemos apreciarlo en el cuadrante IV de la Figura 1.6 , pero también surge analı́ticamente
de si derivamos el vector unitario en la dirección de ~a (t)

2
d (ûa (t) · ûa (t)) d |û a (t)| d (1) d (ûa (t)) d (ûa (t))
≡ = ≡ 0 = ûa (t) · =⇒ ûa (t) ⊥
dt dt dt dt dt
es decir
d (~a (t)) d (|~a (t)| ûa (t)) d |~a (t)| d (ûa (t)) d (|~a (t)|)
= = ûa (t) + |~a (t)| = ûak + |~a (t)| ûa⊥
dt dt dt dt dt
Supongamos que definimos un vector
 
  
 ûn × ûak = ûa⊥ 


 

 ûn ⊥ ûak   
∆ θ~ = ∆θ ûn con =⇒ ûa⊥ × ûn = ûak
  
 

ûn ⊥ ûa⊥ 
 

 
ûak × ûa⊥ = ûn
donde es el ángulo de rotación del vector ~a (t) (ver cuadrante V de la Figura 1.6) Claramente
∆~a⊥ = a (t + ∆t) sen (∆θ) ûa⊥ ≈ a (t + ∆t) ∆θ ûa⊥ =⇒ ∆~a⊥ = ∆ θ~ × ~a (t) =⇒

∆~a⊥ ∆~a ∆ θ~ d (~a (t)) d (θ (t))
≡ · ~a⊥ ~a⊥ = × ~a (t) =⇒ · ûa⊥ ûa⊥ = ûn × ~a (t) = ω
~ × ~a (t)
∆t ∆t ∆t dt dt
donde hemos identificado ω ~ = d(θ(t))

dt ûn Entonces podemos ir más allá. Observando el cuadrante V de la
Figura 1.6 vemos que si suponemos que el módulo del vector es constante, entonces

d |~a (t)| d (~a (t)) d (~a (t))
= 0 =⇒ = |~a (t)| ûa⊥ =⇒ ~ × ~a (t)
· ûa⊥ ûa⊥ = ω
dt dt dt

1.9.3. Velocidades y aceleraciones

Ası́, el radio vector posición de una partı́cula genera los vectores velocidad y aceleración.
d (~r (t)) d (~v (t)) d2 (~r (t))

~r = ~r (t) =⇒ ~v (t) = =⇒ ~a (t) = =
dt dt dt2
ahora bien
~r = r (t)P ûr = xP ı̂ + yP ̂ + zP k̂ con ûr = cos θ ı̂ + sen θ ̂
si suponemos que la partı́cula describe un movimiento entonces
 
rP = rP (t)   x = x (t) ı̂ = const
⇐⇒ y = y (t) ; ûr = ûr (t) ; ̂ = const
 
θ = θ (t) z = z (t) k̂ = const
con lo cual
d (ûr ) d (cos θ (t) ı̂ + sen θ (t) ̂) dθ (t) dθ (t)
= = − (sen θ (t)) ı̂ + cos θ (t) ̂
dt dt dt dt
d (ûr ) dθ (t) dθ (t)

= [− (sen θ (t))ı̂ + cos θ (t) ̂] = ûθ
dt dt | {z } dt
ûθ
ya que
p p
kûr k = ûr · ûr = [cos θ (t) ı̂ + sen θ (t) ̂] [cos θ (t) ı̂ + sen θ (t) ̂] = 1
p p
kûθ k = ûθ · ûθ = [− (sen θ (t)) ı̂ + cos θ (t) ̂] [− (sen θ (t))ı̂ + cos θ (t) ̂] = 1
y
ûθ · ûr = ûr · ûθ = [− (sen θ (t)) ı̂ + cos θ (t) ̂] [cos θ (t) ı̂ + sen θ (t) ̂] = 0
Más aún
d (ûθ ) d (− (sen θ (t)) ı̂ + cos θ (t) ̂) dθ (t)
= = − (cos θ (t) ı̂ + sen θ (t) ̂) = − ûr
dt dt dt
Con lo cual, una partı́cula que describe un movimiento genérico vendrá descrita en coordenadas cartesianas
por
~r = xP (t) ı̂ + yP (t) ̂ + zP (t) k̂
y su velocidad será

d~r (t) d xP (t)ı̂ + yP (t) ̂ + zP (t) k̂ d (xP (t)) d (yP (t)) d (zP (t))
~v (t) = = = ı̂ + ̂ + k̂
dt dt dt dt dt
= vxP (t)ı̂ + vyP (t) ̂ + vzP (t) k̂
y la aceleración
d (vxP (t)) d (vyP (t)) d (vzP (t))
~a (t) = ı̂ + ̂ + k̂ = axP (t)ı̂ + ayP (t) ̂ + azP (t) k̂
dt dt dt

Mientras que en coordenadas polares será
d (r (t)P ûr (t)) d (r (t)P ) d (ûr (t))

~r (t) = rP (t) ûr (t) =⇒ ~v (t) = = ûr (t) + r (t)P
dt dt dt
con lo cual la velocidad
dθ (t)
~v (t) = vr (t)P ûr (t) + r (t)P ûθ (t)
dt
y la aceleración

dr (t)P dθ (t) dθ (t)
d ûr (t) + r (t)P ûθ (t) d r (t)P ûθ (t)
d (~v (t)) dt dt d (vr (t)P ûr (t)) dt
~a (t) = = = +
dt dt dt dt

dr (t)P
d
dt dr (t)P d (ûr (t))
~a (t) = ûr (t) +
dt dt dt
dr (t)P dθ (t) d2 θ (t) dθ (t) d (ûθ (t))
+ ûθ (t) + r (t)P ûθ (t) + r (t)P
dt dt dt2 dt dt
 
 dr (t)P 

d 2
dt dθ (t)  dr (t)P dθ (t) d2 θ (t)
~a (t) = − r (t)P ûr (t) + 2 + r (t)P ûθ (t)

 dt dt 
 dt dt dt2
 
Claramente para el caso de un movimiento circular



 ~r (t) = Rûr(t)





 dθ (t)
dR 
~v (t) = R ûθ
r = R = const =⇒ = 0 =⇒ dt
dt 


 2

 dθ (t) d2 θ (t)


 ~ a (t) = −R ûr (t) + R ûθ (t)
dt dt2
De aquı́ podemos ver claramente que velocidad ~v (t) y posición ~r (t) son ortogonales. La velocidad, ~v (t) ,
siempre es tangente a la trayectoria ~r (t) y en este caso la trayectoria es una circunferencia. En general el
vector
X X X Z
~rmed = ∆ ~r (ti ) = (~r (ti + ∆ti ) − ~r (ti )) =⇒ lı́m ∆ ~r (ti ) = d~r (t) = ~r (t)
∆t→0
i i i
P
es decir d~r (t) = lı́m∆t→0 i ∆ ~r (ti ) es tangente a la trayectoria. Es claro que
h i ∂x (t) ∂yP (t) ∂zP (t)
P
d~r (t) = d xP (t)ı̂ + yP (t) ̂ + zP (t) k̂ ≡ ı̂ + ̂ + k̂
∂t ∂t ∂t
Tal y como mencionamos arriba, para el sistema de coordenadas cartesiano podemos definir un vector

(en este caso) velocidad angular

 
 ω
~ 

 × û~r = û~v 


 |~
ω| 


 


 

 ω
~ 
ω
~ ∋ û~v × = û~r =⇒ ~ × ~r (t)
~v (t) = ω

 |~
ω | 


 


 


 ω
~ 


 û~r × û~v = 

|~
ω|
Supongamos por que, simplicidad, elegimos el sistema de coordenadas cartesiano tal que ~r esté el plano x, y.
En este caso es inmediato comprobar que v i = εijk ωj xk y dado que ~r y ~v tienen ’únicamente componentes
1, 2 entonces, necesariamente ω ~ tiene componente 3. Es decir
  1 
~r = ri ı̂i   v = ε1j2 ωj x2 
=⇒ ~ = ω 3 ı̂3 ≡ |~
=⇒ ω ω |ı̂3 ≡ |~
ω | k̂
i   2 2j1 
~v = v ı̂i v = ε ωj x1
como
~r = xP (t) ı̂ + yP (t) ̂
⇓
d (~r (t)) d (θ (t))
~v (t) = ~ × ~r (t) =
= vxP (t) ı̂ + vyP (t) ̂ = ω k̂ × (xP (t) ı̂ + yP (t) ̂)
dt dt
como se ve más claro es en coordenadas polares, esto es
d (~r (t)) dθ (t)
~v (t) = = r (t)P ω | ûn (t)) × (r (t)P ûr (t))
ûθ (t) = (|~
dt dt
⇓ |~r (t)| = const
dθ (t) dθ (t)
r (t)P ûθ (t) = |~
ω | r (t) ûθ (t) =⇒ ≡ |~
ω|
| {z dt } dt
~
v⊥ (t)
1.9.4. Vectores y funciones

~ (x, y, z) . Son,
Antes de continuar con la integración repensemos algunas funciones de tipo φ (x, y, z) y V
sin duda funciones de varias variables
φ = φ (x, y, z)
~ =V
V ~ (x, y, z) = ı̂Vx (x, y, z) + ̂Vy (x, y, z) + k̂Vz (x, y, z)
un par de reflexiones se pueden hacer en este punto. Primeramente, dado que hemos relacionado un punto
del espacio con un radio vector posición, entonces

 φ = φ (x, y, z) ≡ φ (~r)
P(x,y,z) ↔ (x, y, z) ↔ ~r = xP ı̂ + yP ̂ + zP k̂ ⇒
 ~ ~ (x, y, z) ≡ V
~ (~r)
V =V

La primera función, φ (~r) será una función escalar de argumento vectorial o, simplemente un campo escalar
y la segunda se conoce como una función vectorial de argumento vectorial o campo vectorial. Como hemos
dicho este tipo de funciones y las operaciones que pueden ser realizadas con ellas, ası́ como también su
significado, será analizada en detalle más adelante en este mismo curso.
En segundo lugar, siempre podremos parametrizar las coordenadas y tendremos
φ = φ (t) = φ (x (t) , y (t) , z (t))
~ =V
V ~ (t) = V
~ (x (t) , (t) y, z (t)) ⇒
~ = ı̂Vx (x (t) , y (t) , z (t)) + ̂Vy (x (t) , y (t) , z (t)) + k̂Vz (x (t) , y (t) , z (t))
V
Este caso lo hemos encontrado en montones de situaciones. El movimiento parabólico viene descrito por un
vectores velocidad y posición

 vx = v0x
~v = −k̂gt + ~v0 = −k̂gt + ı̂v0x + ̂v0y + k̂v0z ⇒ vy = v0x

vz = v0z − gt

 x = v0x t
g t 2 
~r = −k̂ t2 + ~v0 t = −k̂g t + ı̂v0x + ̂v0y + k̂v0z t ⇒ y = v0x t
 2
2 2  z = v t − gt
0z
2
Derivada de funciones φ (~r (t))

Al derivar una función de argumento vectorial también aplica la “regla de la cadena”. Esto es
z = φ (~r (t)) = g (x (t) , y (t) , z (t)) ⇒
d φ (~r (t)) ∂ φ (x (t) , y (t) , z (t)) d x (t) ∂ φ (x (t) , y (t) , z (t)) d y (t) ∂ φ (x (t) , y (t) , z (t)) d z (t)
= + +
dt ∂x dt ∂y dt ∂z dt

d φ (~r (t)) ∂ φ (x, y, z) ∂ φ (x, y, z) ∂ φ (x, y, z) d x (t) d y (t) d z (t)
= ı̂ + ̂+ k̂ ı̂ + ̂ + k̂
dt ∂x ∂y ∂z dt dt dt
d φ (~r (t)) ~ (x (t) , y (t) , z (t)) · d ~r (t)

= ∇φ
dt dt
donde hemos representado
~ (~r (t)) = ∂ φ (x, y, z) ı̂ + ∂ φ (x, y, z) ̂+ ∂ φ (x, y, z) k̂ = ∂ m φ (x, y, z)ı̂m = φ,m (x, y, z)ı̂m
∇φ
∂x ∂y ∂z
y lo llamaremos el gradiente de la función. El gradiente de un campo escalar es uno de los objetos más útiles,
el cual lo utilizaremos, por ahora de manera operacional y recordaremos que emerge como consecuencia de
una derivación contra un parámetro. El gradiente mide el cambio del la función φ (x, y, z).

La idea de gradiente nos lleva a considerar al ∇ ~ como un operador vectorial que actúa sobre la función
escalar de variable vectorial φ (~r (t)) . Es decir con un poquito de imaginación

~ ∂ ∂ ∂
∇φ (~r (t)) ≡ ı̂ + ̂+ k̂ φ (x, y, z) = (ı̂m ∂ m ) φ (x, y, z)
∂x ∂y ∂z
⇓

~ (◦) = ∂ (◦) ∂ (◦) ∂ (◦)
∇ ı̂ + ̂+ k̂ = ı̂m ∂ m (◦)
∂x ∂y ∂z
Derivada de funciones ~c (~r (t))

De modo que inspirados en la regla de la cadena de una función escalar de variable vectorial comprobamos
que
d ~c d cx (x, y, z) d cy (x, y, z) d cz (x, y, z) d cm (x, y, z)
= ı̂ + ̂+ k̂ = ı̂m
dt dt dt dt dt
por consiguiente,
si ~c, tiene por componentes cartesianas (cx , cy , cz ) las componentes del vector derivado
d cx d cy d cz
serán dt , dt , dt . Con lo cual cada componente

d cm (x (t) , y (t) , z (t)) d cm (xn (t)) ∂cm (xn ) d xl (t) d ~r (t) ~
= = = · ∇ cm (x, y, z)
dt dt ∂xl dt dt
es decir, en términos vectoriales

d ~c d ~r (t) ~ ~ ~c d (◦) ~
= · ∇ ~c ≡ ~v · ∇ ⇒ = ~v · ∇ (◦) ≡ v i ∂i (◦)
dt dt dt
con ~v la derivada del radiovector posición ~r (t), es decir, la velocidad. Es decir, estamos viendo el cambio del
vector ~c respecto al tiempo es el cambio de sus componentes en la dirección de la velocidad.
Si se nos ocurre calcular la derivada del vector velocidad para encontrar la aceleración tendremos que
nos queda expresada como
d ~v ~
~ vi
~a = = ~v · ∇ ~v ⇒ ai = ~v · ∇
dt
donde las componentes cartesianas de los vectores velocidad y aceleración son v i = v i (x (t) , y (t) , z (t))
y ai = ai (x (t) , y (t) , z (t)) , respectivamente.
1.9.5. El vector gradiente

~ (◦) merece un poco de atención en este nivel. Tal y como hemos visto
El operador vectorial ∇

~ ∂φ (x, y, z) ∂φ (x, y, z) ∂φ (x, y, z)
∇φ (x, y, z) = ı̂ + ̂ + k̂
∂x ∂y ∂z
~ (x, y, z) = ı̂1 ∂ 1 φ (x, y, z) + ı̂2 ∂ 2 φ (x, y, z) + ı̂3 ∂ 3 φ (x, y, z)

∇φ

Con el operador nabla ∇~ (◦) realizaremos operaciones igual como un vector común y corriente. Ası́ en el caso
~ ~
∇ × E se denomina rotor de E ~ viene definido por

~ ~ ∂ ∂ ∂
∇ × E = ı̂ + ̂ + k̂ × Ex ı̂ + Ey ̂ + Ez k̂ =
∂x ∂y ∂z

~ ×E
~ = ∂Ez ∂Ey ∂Ex ∂Ez ∂Ey ∂Ez
∇ − ı̂+ − ̂+ − k̂
∂y ∂z ∂z ∂x ∂x ∂y
~ ×E
∇ ~ = ı̂i εijk ∂j Ek
También tendremos el “producto escalar” de nabla por un vector. Esta operación la llamaremos divergencia

∂ai xj ∂ax (x, y, z) ∂ay (x, y, z) ∂az (x, y, z)
˜
∇ · ~a = ≡ ∂i ai xj ≡ + +
∂ x̃i ∂x ∂y ∂z
pero por ahora consideremos nabla ∇ ~ como un vector. De este modo habrá cantidad de relaciones vectoriales
~
que involucren a ∇ las cuales se podrán demostrar. Veamos

1. ∇ ~ ~b + ~b · ∇
~ ~a · ~b = ~a · ∇ ~ ~a + ~a × ∇ ~ × ~b + ~b × ∇ ~ × ~a
El resultado es un gradiente, es decir un vector. El lado izquierdo será
i
~ ~a · ~b
∇ = ∂ i ~a · ~b = ∂ i aj bj = ∂ i aj bj + ∂ i bj aj
mientras que el lado derecho

i
∇~ ~a · ~b = aj ∂ j bi + bj ∂ j ai + εijk aj ∇ ~ × ~b + εijk bj ∇ ~ × ~a
k k
i
= aj ∂ j bi + j ijk m n ijk
bj ∂ a + ε aj εkmn ∂ b + ε bj εkmn ∂ a m n

= aj ∂ j bi + bj ∂ j ai + εijk εmnk aj ∂ m bn + εijk εmnk bj ∂ m an

= aj ∂ j bi + bj ∂ j ai + δm i j j i
δn − δm δn aj ∂ m bn +
i j j i

+ δm δn − δm δn bj ∂ m an
δn aj ∂ m bn − δm
i j
= aj ∂ j bi + bj ∂ j ai + δm δn aj ∂ m bn +
j i
i j
+ δm δn bj ∂ m an − δm
j i
δn bj ∂ m an
= aj ∂ j bi + bj ∂ j ai + an ∂ i bn − am ∂ m bi + bn ∂ i an − bm ∂ m ai
= aj ∂ j bi − am ∂ m bi + bj ∂ j ai − bm ∂ m ai + an ∂ i bn + bn ∂ i an
| {z } | {z }
=0 =0

= an ∂ i bn + bn ∂ i an = ∂ i aj bj = ∂ i ~a · ~b
h i h i
~ × ~a · ∇
2. ∇ ~ ~a = ∇ ~ · ~a ∇ ~ × ~a − ∇ ~ · ∇ ~ × ~a ~a + ~a · ∇ ~ ∇~ × ~a − ∇ ~ × ~a · ∇ ~ ~a
Iniciamos la traducción a ı́ndices por el lado izquierdo de la ecuación ası́

~ × ~a · ∇
∇ ~ ~a = ǫijk ∂j (am ∂ m ) ak = ǫijk (∂j am ) ∂ m ak + ǫijk am ∂j ∂ m ak

= ǫijk (∂j am ) ∂ m ak + am ∂ m ǫijk ∂j ak

el lado derecho lo traduciremos término por término

~ · ~a ∇
∇ ~ × ~a = (∂ m am ) ǫijk ∂j ak
h i
− ∇ ~ · ∇ ~ × ~a ~a = − ∂m ǫmjk ∂j ak ai = − ǫmjk ∂m ∂j ak ai = 0

~
~a · ∇ ~ × ~a = am ∂ m ǫijk ∂j ak
∇
h i
− ∇ ~ × ~a · ∇ ~ ~a = − ǫmjk ∂j ak ∂m ai
el segundo término se anula por cuanto ǫmjk es antisimétrico respecto a los ı́ndices mj mientras que
∂m ∂j es simétrico. El tercer término del desarrollo del lado derecho corresponde con el segundo del
desarrollo del lado izquierdo. Por cual llegamos a la siguiente igualdad

ǫijk (∂j am ) ∂ m ak = (∂ m am ) ǫijk ∂j ak − ǫmjk ∂j ak ∂m ai
Para verificar la igualdad tendremos que evaluar componente a componente. Esto es para el lado
izquierdo
ǫ1jk (∂j am ) ∂ m ak = ǫ123 (∂2 am ) ∂ m a3 + ǫ132 (∂3 am ) ∂ m a2
= (∂2 am ) ∂ m a3 − (∂3 am ) ∂ m a2
= (∂2 a1 ) ∂ 1 a3 + (∂2 a2 ) ∂ 2 a3 + (∂2 a3 ) ∂ 3 a3
− (∂3 a1 ) ∂ 1 a2 − (∂3 a2 ) ∂ 2 a2 − (∂3 a3 ) ∂ 3 a2
mientras que para el primer término del lado derecho

(∂ m am ) ǫ1jk ∂j ak = (∂ m am ) ǫ123 ∂2 a3 + (∂ m am ) ǫ132 ∂3 a2
= ∂2 a3 ∂ 1 a1 + ∂2 a3 ∂ 2 a2 + ∂2 a3 ∂ 3 a3
| {z }
α
−∂3 a2 ∂ 1 a1 − ∂3 a2 ∂ 2 a2 − ∂2 a2 ∂ 3 a3
| {z }
β
y el segundo término se escribe como

− ǫmjk ∂j ak ∂m ai = − ǫ1jk ∂j ak ∂1 a1 − ǫ2jk ∂j ak ∂2 a1 − ǫ3jk ∂j ak ∂3 a1
= − (∂2 a3 − ∂3 a2 ) ∂1 a1 − (∂3 a1 − ∂1 a3 ) ∂2 a1 −
− (∂1 a2 − ∂2 a1 ) ∂3 a1
= ∂3 a2 ∂1 a1 −∂2 a3 ∂1 a1 + ∂1 a3 ∂2 a1 −∂3 a1 ∂2 a1
| {z }| {z } | {z }
β α γ
+∂ a1 ∂3 a1 − ∂1 a2 ∂3 a1
| 2 {z }
γ
al sumar ambos términos se eliminan los sumandos indicados con letras griegas, y queda como

(∂ m am ) ǫ1jk ∂j ak − ǫmjk ∂j ak ∂m ai = ∂2 a3 ∂2 a2 + ∂2 a3 ∂3 a3
Ξ Υ
−∂3 a2 ∂2 a2 −∂2 a2 ∂3 a3
Ω Ψ
+ ∂1 a3 ∂2 a1 −∂1 a2 ∂3 a1
Λ Σ

y al compararlo con el desarrollo del lado derecho e identificar término a término queda demostrado
ǫ1jk (∂j am ) ∂ m ak = (∂2 a1 ) ∂1 a3 + (∂2 a2 ) ∂2 a3 + (∂2 a3 ) ∂3 a3

Λ Ξ Υ
− (∂3 a1 ) ∂1 a2 − (∂3 a2 ) ∂2 a2 − (∂3 a3 ) ∂3 a2
Σ Ω Ψ
De igual manera se procede con i = 2 e i = 3
1.9.6. Integración
Después de haber diferenciado campos escalares y vectoriales, el siguiente paso es integrarlos. Encontra-
remos varios objetos vectoriales a integrar serán:
Z
~ (u) d u
V integración de un vector por un escalar
Z
φ (x, y, z) d ~r integración de un escalar a lo largo de un vector
c
Z
~ (x, y, z) · d ~r
V integración de un vector a lo largo de otro vector
c
Z
~ (x, y, z) × d ~r
V integración de un vector por otro vector
c
el primero de casos es el tipo de integral que siempre hemos utilizado para encontrar la posición a partir
de la velocidad. Los siguientes tres casos se conocen con el nombre de integrales de lı́nea por cuanto es
importante la “ruta” o trayectoria que sigamos al integrar. Esto aparece indicado por la letra C en la
integral y será evidente más adelante. En general la integral de lı́nea dependerá de la trayectoria.
Un vector por un escalar

El primer caso de este tipo integrales es el trivial que siempre hemos utilizado:
Z Z Z Z Z
~ (u) d u = ı̂ Vx (u) d u + ̂ Vy (u) d u + k̂ Vz (u) d u =
V V i (u) d u êi
La integral de un vector (en un sistema de coordenadas cartesianas) por un escalar se convierte en una suma
de tres integrales de siempre, cada una a lo largo de las componentes cartesianas del vector.
Ası́ integramos la aceleración de un movimiento parabólico
Z Z
d ~v
= ~a = −g k̂ =⇒ ~v = ~a dt = k̂ −g dt = −k̂gt + ~v0 = −k̂gt + ı̂v0x + ̂v0y + k̂v0z
dt
Ahora bien, existen sutilezas en este caso que debemos tener en cuenta. Por ejemplo considere la integral
Z Z Z
d2 ~a d d ~a d ~a d ~a d d ~a d ~a
dt ~a × = dt ~a × − × = dt ~a × = ~a × + ~c
dt2 dt dt dt dt dt dt dt

Pero en general los casos quedan resueltos integrando componente a componente con la ayuda de la notación
de ı́ndices Z Z

dt ~a × ~b = dt εijk aj bk |ei i
Quizá uno de los problemas que ilustra mejor esta situación es el movimiento bajo fuerzas centrales. La Ley
de Gravitación de Newton nos dice que
X d ~v M d ~v M
F = m ~a = m = m G 2 ûr =⇒ = G 2 ûr
dt rmM dt rmM
Es costumbre definir la velocidad aerolar, ~vA , como el área barrida por el radio vector posición, ~r (t) que
describe la trayectoria de la partı́cula

d ~r d (r ûr ) dr d ûr d ûr d ûr
2~vA = ~r × = r ûr × = r ûr × ûr + r = r ûr × r = r2 ûr ×
dt dt dt dt dt dt
Nótese que si ~c es un vector constante

d d ûr d ûr d ûr
ûr × = 0 =⇒ ûr × = ~c =⇒ 2~vA = r2 ûr × = const
dt dt dt dt
con lo cual

d d ~v M MG d ûr
(~v × ~vA ) = × ~vA = G 2 ûr × ~vA = ûr × ûr ×
dt dt rmM 2 dt

d MG d ûr d ûr M G d ûr
(~v × ~vA ) = ûr · ûr − (ûr · ûr ) =
dt 2 dt dt 2 dt
integrando
MG
~v × ~vA =ûr + p~
2
donde p~ es un vector arbitrario de constante de integración. Finalmente nos damos cuenta que

MG MG
~r · (~v × ~vA ) = r ûr · ûr + p~ = r + rp cos θ
2 2
~r · (~v × ~vA ) = εijk ri vj vAk ≡ ~vA · (~r × ~v ) = ~vA · ~vA = vA

2
y entonces
2
2 2vA
2 MG vA MG
vA = r + rp cos θ =⇒ r = MG
≡ 2p
2 2 + p cos θ 1+ M G cos θ
que constituye la ecuación de una cónica.
R
Un escalar a lo largo de un vector c
φ (~r) d~r
El segundo objeto que “tropezaremos” es la integración de funciones de varias a lo largo de una curva
determinada. Esto es
Z Z Z Z Z
φ (x, y, z) d~r = φ (x, y, z) dx ı̂ + dy ̂ + dz k̂ = ı̂ φ (x, y, z) d x+̂ φ (x, y, z) d y+k̂ φ (x, y, z) d z
c c c c c

la integral se nos ha convertido

en tres integrales, las cuales son ahora componentes de un vector. Esto
es posible dado que la base ı̂, ̂, k̂ es una base constante. Ahora bien, cada una de estas integrales son
interdependientes, dado que hay que seguir la misma curva c. Consideremos el caso bidimensional que es
más simple y contiene toda la riqueza conceptual del tridimensional. Ası́
Z (1,2) Z (1,2) Z (1,2)

φ (x, y) = 3x2 + 2y =⇒ 3x2 + 2y d~r = ı̂ 3x2 + 2y d x + ̂ 3x2 + 2y d y
(0,0) (0,0) (0,0)
Se requiere especificar la curva c a lo largo de la cual integraremos desde el punto P1 → (0, 0) al punto
P2 → (1, 2) . Si recorremos la ruta (0, 0) → (1, 0) → (1, 2) tendremos que
Z (1,0) Z (1,0) Z 1

(0, 0) → (1, 0) =⇒ y = cte = 0 =⇒ 3x2 + 2y d~r = ı̂ 3x2 + 2y dx = ı̂ 3x2 dx = ı̂
(0,0) (0,0) 0
Z (1,0) Z (1,2) Z 2

(1, 0) → (1, 2) =⇒ x = cte = 1 =⇒ 3x2 + 2y d~r = ̂ 3x2 + 2y dy = ̂ (3 + 2y) dy = 10̂
(0,0) (0,0) 0
con lo cual Z (1,2)

c1 ←→ (0, 0) → (1, 0) → (1, 2) =⇒ 3x2 + 2y d~r = ı̂ + 10̂
−−−−−→ −−−−−→ (0,0)
cA
1 cB
1
si hubiéramos seleccionado la recta que une a estos dos puntos como la curva c2 entonces
c2 ←→ y = 2x =⇒ d y = 2d x
⇓
Z (1,2) Z (1,2) Z (1,2)

3x2 + 2y d~r = ı̂ 3x2 + 2y d x + ̂ 3x2 + 2y d y
(0,0) (0,0) (0,0)
⇓
Z (1,2) Z 1 Z 1
2
2

3x + 2y d~r = ı̂ 3x + 2 (2x) d x + ̂ 3x2 + 2 (2x) 2dx = 3ı̂+6̂
(0,0) 0 0
En general la curva c se parametrizará y las integrales en varias variables se convertirán en integrales a lo

largo del parámetro que caracteriza la curva
 
 x = x (τ ) 
c ←→ y = y (τ )
 
z = z (τ )
⇓
Z Z
∂x (τ ) ∂y (τ ) ∂z (τ )
φ (x, y, z) d~r = φ (x (τ ) , y (τ ) , z (τ )) dτ ı̂ + dτ ̂ + dτ k̂
c c ∂τ ∂τ ∂τ
⇓
Z Z Z
∂x (τ ) ∂y (τ )
φ (x, y, z) d~r = ı̂ φ (x (τ ) , y (τ ) , z (τ )) dτ + ̂ φ (x (τ ) , y (τ ) , z (τ )) dτ
c c ∂τ c ∂τ
Z
∂z (τ )
+ k̂ φ (x (τ ) , y (τ ) , z (τ )) dτ
c ∂τ

las parametrizaciones para las curvas anteriores son muy simples

  
 x=τ  x=2  x=τ
cA
1 = ; cB 1 = ; c2 =
  
y=0 y=τ y = 2τ
R
Un vector a lo largo de otro vector c
F~ (~r) d~r
R
Quizá la integral de lı́nea más conocida sea una del tipo c F~ (~r) d~r por cuanto nos la hemos “tropezado”
en el cálculo del trabajo de que realiza una fuerza. Todo lo que hemos considerado al parametrizar la curva
en el caso anterior, sigue siendo válido.
Z Z Z Z Z

F~ (~r) d~r = Fx (x, y, z) dx + Fy (x, y, z) dy + Fz (x, y, z) dz = F i xj dxi
c c c c c
Por lo cual, si consideramos

F~ (~r) = 3x2 + 2xy 3 ı̂+6xy̂
⇓
Z (1, 43 √2) Z (1, 43 √2)

~
F (~r) d~r = 3x2 + 2xy 3 ı̂+6xy̂ (dx ı̂ + dy ̂)
(0,0) (0,0)
⇓
Z (1, 34 √2) Z (1, 43 √2) Z (1, 43 √2)

F~ (~r) d~r = 2
3x + 2xy 3
dx + 6xy dy
(0,0) (0,0) (0,0)
y si la curva que une esos puntos viene parametrizada por

  ∂x(τ )

x = 2τ 2   ∂τ = 4τ 
=⇒ =⇒
  ∂y(τ ) 
y = τ3 + τ = 3τ 2 + 1 ∂τ
entonces la primera de las integrales resulta

Z (1, 43 √2) Z
2 3
3x2 + 2xy 3 dx = 3 2τ 2 + 2 2τ 2 τ3 + τ (4τ ) dτ
(0,0)
Z (1, 34 √2) Z √
2
2 3
2 1 9305 √
3x + 2xy dx = 12τ 5 + 4τ 12 + 12τ 10 + 12τ 8 + 4τ 6 dτ = + 2
(0,0) 0 4 96 096
y la segunda
Z (1, 43 √2) Z √
2
2 65
6xy dy = 6 2τ 2 τ3 + τ 3τ 2 + 1 dτ =
(0,0) 0 32
con lo cual
Z (1, 34 √2) Z (1, 43 √2) Z (1, 34 √2)
73 9305 √
F~ (~r) d~r = 2
3x + 2xy 3
dx + 6xy dy = + 2
(0,0) (0,0) (0,0) 32 96 096

1.10. Vectores y números complejos

Desde la más tierna infancia matemática nos hemos tropezado con las llamadas raı́ces imaginarias o
complejas de polinomios. De este modo la solución a un polinomio cúbico
 
 x = 2i 
x3 − 3x2 + 4x − 12 = 0 =⇒ x = −2i =⇒ (x + 2i) (x − 2i) (x − 3) = 0
 
x=3
o cuadrático
x = 2i
x2 + 4 = 0 =⇒ =⇒ (x + 2i) (x − 2i)
x = −2i
√
nos lleva a definir un número i2 = 1 ⇔ i = −1 como vimos arriba al multiplicar el número imaginario i
por cualquier número real obtendremos el número imaginario puro bi, con b ∈ ℜ. La nomenclatura números
imaginarios surgió de la idea de que estas cantidades no representan mediciones fı́sicas. Esa idea ha sido
abandonada pero el nombre quedó.
1.10.1. Los números complejos y su álgebra

Un número complejo, z, es la generalización de los números imaginarios (puros), ib. Esto es

 a → parte real
z = a + ib con a, b ∈ ℜ =⇒

b → parte imaginaria
Obviamente los números reales serán a + i0 números complejos con su parte imaginaria nula. Los números
imaginarios puros serán números complejos con su parte real nula, esto es 0 + ib. Por ello en general diremos
que
z = a + ib =⇒ a = Re (z) ∧ b = Im (z)
es decir, a corresponde a la parte real de z y b a su parte imaginaria.
Cada número complejo, z, tendrá un número complejo conjugado, z ∗ tal que
z = a + ib ⇋ z ∗ = a − ib
⇓
∗ ∗
(z ) = z ∧ z · z ∗ = a2 + b2
claramente
2 2
z · z∗ ≥ 0 =⇒ |z| = |z ∗ | = z · z ∗
Es importante señalar que, en general, no existe relación de orden entre los números complejos. Vale
decir, que no sabremos si un número complejo es mayor que otro. No está definida esta operación.
z1 ≯ z2 ∨ z 1 ≮ z2
las relaciones de orden sólo se podrán establecer entre módulos de números complejos y no números complejos
en general.
Rápidamente recordamos el álgebra de los números complejos:
dos números complejos serán iguales si sus partes reales e imaginarios lo son
z1 = z2 =⇒ (a1 + ib1 ) = (a2 + ib2 ) =⇒ a1 = a2 ∧ b1 = b2

se suman dos números complejos sumando sus partes reales y sus partes imaginarias.
z 3 = z1 + z2 =⇒ (a1 + ib1 ) + (a2 + ib2 ) = (a1 + a2 ) + i(b1 + b2 ) = a3 + ib3

| {z } | {z }
a3 b3
∗ ∗
claramente z + z = 2 Re z también z − z = 2 Im z. Igualmente es inmediato comprobar que
∗
(z1 + z2 ) = z1∗ + z2∗
se multiplican números complejos por escalares multiplicando el escalar por sus partes reales e imagi-
narias
z3 = αz1 =⇒ α (a1 + ib1 ) = (αa1 ) + i (αb1 )
se multiplican números complejos entre si, multiplicando los dos binomios y teniendo cuidad que
i2 = −1.
z3 = z1 z2 =⇒ (a1 + ib1 ) · (a2 + ib2 ) = (a1 a2 − b1 b2 ) + i (a1 b2 + b1 a2 )
∗
también es inmediato comprobar que (z1 z2 ) = z1∗ z2∗
se dividen números complejos siguiendo la estrategia de racionalización de fracciones irracionales. Esto
es
z1 (a1 + ib1 ) (a1 + ib1 ) (a2 − ib2 ) a1 a2 + b1 b2 b1 a2 − a1 b2
z3 = =⇒ = = +i
z2 (a2 + ib2 ) (a2 + ib2 ) (a2 − ib2 ) (a22 + b22 ) (a22 + b22 )
es claro que el divisor será cualquier número complejo excepto el cero complejo, 0 + i0
1.10.2. Vectores y el plano complejo

Mirando con cuidado el álgebra de números complejos nos damos cuenta que un número complejo puede
ser representado por una dupla de números complejos es decir,
z = (a + ib) ⇌ z = (a, b)
las propiedades entre números complejos de igualdad, suma y multiplicación por un escalar arriba expuestas se
cumplen de forma inmediata con esta nueva representación. Hay que definir las operaciones de multiplicación
y división entre números complejos de forma que

(a1 , b1 ) a1 a2 + b1 b2 b1 a2 − a1 b2
(a1 , b1 ) (a2 , b2 ) = (a1 a2 − b1 b2 , a1 b2 + b1 a2 ) ∧ = ,
(a2 , b2 ) (a22 + b22 ) (a22 + b22 )
Esta asociación de un número complejo con una pareja de números inmediatamente nos lleva a imaginar
un punto en un plano (complejo) en el cual la primera componente (horizontal) representa la parte real
y la segunda componente (vertical) representa la parte imaginaria. De esta forma asociamos a un número
complejo a un vector que une a ese punto (a, b) con el origen del plano complejo. Esta representación de
números complejos como vectores un el plano (complejo) de conoce con el nombre de Diagrama de Argand3
a pesar que no fue Jean Argand, sino Caspar Wessel4 el primero en proponerlo. Por cierto esta interpretación
3 En honor a Jean Robert Argand, (Ginebra, Suiza, 18 Julio 1768; Paris, Francia 13 agosto 1822) Contador pero matemático
aficionado. Propuso esta interpretación de números complejos como vectors en un plano complejo en un libro autoeditado con
sus reflexiones que se perdió y fue rescatado 7 años después, fecha a partir de la cual Argand comenzó a publicar en Matematicas.
M’as detalles en http://www-groups.dcs.st-and.ac.uk/\char126\relaxhistory/Mathematicians/Argand.html
4 Caspar Wessel (Vestby, Noruega 8 junio 1745; 25 marzo 1818, Copenhagen, Dinamarca) Matemático noruego que se
dedicó principalemente al levantamiento topográfico de Noruega. Su trabajo sobre la interpretación de números comple-
jos permaneció desconocido por casi 100 años. Más detalles http://www-groups.dcs.st-and.ac.uk/\char126\relaxhistory/
Mathematicians/Wessel.html

fue tres veces redescubierta primero por Caspar Wessel en 1799, luego por Jean Argand en 1806 y finalmente
por Gauss5 en 1831.
De esta manera como un recordatorio al plano real
 √ p
 ∗ 2 2
 r = zz = |z| = x + y
z = x + iy ⇌ z = r (cos θ + i sen θ) con
 tan θ = y donde − π ≤ θ ≤ π

x
La interpretación vectorial de números complejos permite que la suma de números complejos sea representada
por la “regla del paralelogramo”. Mientras que los productos escalar y vectorial nos llevan a
z1 · z2 = Re (z1 z2∗ ) = Re (z1∗ z2 ) ∧ z1 × z2 = Im (z1∗ z2 ) = −Im (z1 z2∗ )
Con esta interpretación tendremos

x = Rez ⇋ componente real del vector z o parte real de z
y =√Imz ⇋ componente imaginaria del vector z o parte real de z
r = zz ∗ = |z| ⇋ módulo, magnitud o valor absoluto de z
θ ⇋ ángulo polar o de fase del número complejo z
1.10.3. Fórmulas de Euler y De Moivre

Nos hemos tropezado con la expansión en Taylor6 esta serie permite expresar cualquier función infini-
tamente diferenciable alrededor de un punto x0 como una serie infinita de potencias del argumento de la
función. Esto es

d f (x) 1 d2 f (x) 2 1 d3 f (x) 3
f (x) = 1 + (x − x0 ) + (x − x0 ) + (x − x0 ) + · · · · · ·
d x x=x0 2 d x2 x=x0 3! d x3 x=x0

n 1 dn f (x)
f (x) = Cn (x − x0 ) con Cn = donde n = 0, 1, 2, 3, 4 · · ·
n! d xn x=x0
con lo cual si consideramos x0 = 0 entonces

1 1 1 1 5 1 6 1 7
ex = 1 + x + x2 + x3 + x4 + x + x + x + ······
2 6 24 120 720 5040
1 1 1 6
cos x = 1 − x2 + x4 − x + ······
2 24 720
1 1 5 1 7
sen x = x − x3 + x − x + ······
6 120 5040
5 Johann Carl Friedrich Gauss (30 abril 1777, Brunswick, Alemania; 23 febrero 1855, Göttingen, Alemania). Uno de los
mátemáticos más geniales y precoces de la Historia. Desde los 7 años comenzó a mostrar sus condiciones de genialidad. Sus
contribuciones en Astronomı́a y Matemáticas son múltiples y diversas. Más detalles http://www-groups.dcs.st-and.ac.uk/
\char126\relaxhistory/Mathematicians/Gauss.html
6 Brook Taylor (18 agosto 1685, Edmonton, Inglaterra; 29 diciembre 1731, Londres, Inglaterra) Fı́sico y Matemático Inglés
contemporaneo de Newton y Leibniz y con ellos participó profundamente en el desarrollo del Cálculo diferencial e integral.
Además de sus aportes magnetismo, capilaridad y termometrı́a, desarrolló el área de diferencias finitas que hasta hoy utilizamos
para cálculos en computación. Inventó la integración por partes y descubrió la serie que lleva su nombre. Más detalles http:
//www-history.mcs.st-andrews.ac.uk/Mathematicians/Taylor.html

Es fácil convercerse que

1 1 1 1 5 1 6 1
eiθ = 1 + iθ − θ2 + − i θ3 + θ4 + iθ − θ + − i θ7 + · · · · · ·
2 6 24 120 720 5040
puede rearreglarse como

iθ 1 2 1 4 1 6 1 3 1 5 1 7
e = 1− θ + θ − θ + ······ + i θ − θ + θ − θ + ······
2 24 720 6 120 5040
| {z } | {z }
cos θ sen θ
eiθ = cos θ + i sen θ
esta relación se conoce como la relación de Euler 7 . Con lo cual ahora tenemos tres formas de representar
un número complejo
z = x + iy ⇌ z = r (cos θ + i sen θ) ⇌ z = reiθ
La expresión z = x + iy se conoce como forma cartesiana de representación de un número complejo, la
forma z = r (cos θ + i sen θ) será la forma trigonométrica o polar y la expresión z = eiθ será la forma de Euler.
Es importante notar una sutileza implı́cita en esta notación. La forma cartesiana representa unı́vocamente
a un número complejo, mientras que la forma polar (y la de Euler), es ambigua
z = r (cos θ + i sen θ) = r (cos(θ + 2nπ) + i sen(θ + 2nπ)) (1.1)
es decir, existen varios valores del argumento que definen el mismo número complejo. Esto se considerará más
adelante cuando tratemos las funciones de número complejos.
Las sumas de números complejos son más fácilmente planteables en su forma cartesiana. Mientras las
multiplicación y división serán directas en la forma de Euler

z1 = r1 eiθ1 
=⇒ z1 z2 = eiθ1 eiθ2 = ei(θ1 +θ2 ) = r1 r2 (cos (θ1 + θ2 ) + i sen (θ1 + θ2 ))
iθ2 
z2 = r 2 e
Más aún, si
z = x + iy =⇒ ez = e(x+iy) = ex eiy = ex (cos y + i sen y)
y a partir de la relación o fórmula de Euler se puede demostrar la De Moivre 8
n n
eiθ = einθ ⇌ (cos θ + i sen θ) = cos (nθ) + i sen (nθ) con n entero
1.10.4. Algunas Aplicaciones Inmediatas

Presentaremos algunas aplicaciones inmeditas la fórmula de De Moivre en varios ámbitos
7 Leonhard Euler (15 abril 1707, Basilea, Suiza; 18 septiembre 1783, San Petersburgo, Rusia). Uno de los matemáticos más
prolı́ficos de todos los tiempos. Desarrolló inmensamente campos como la geometrı́a analı́tica y trigonometrı́a, siendo el primero
que consideró el coseno y el seno como funciones. Hizo aportes significativos en el desarrollo del cálculo diferencial e integral
ası́ como también, astronomı́a, elasticidad y mecánica de medios contı́nuos. Más detalles http://www-history.mcs.st-andrews.
ac.uk/Mathematicians/Euler.html
8 Abraham de Moivre (26 mayo 1667 in Vitry-le-François, Francia; 27 noviembre 1754, Londres Inglaterra) Matemático
francés que tuvo que emigrar a Inglaterra por razones religiosas. Contemporaneo de Newton, Liebniz, Halley, fue pionero con
sus contribuciones en Geometrı́a Analı́tica y Teorı́a de Probabilides.

Identidades trigonométricas
La primera de las aplicaciones de la fórmula de De Moivre es para construir identidades trigonométricas
en las cuales se expresa el coseno o el seno de factores de un ángulo. Esto las siguientes (nada triviales)
identidades trigonométricas
3
cos 3θ = 4 cos3 θ − 3 cos θ o sen 3θ = 3 sen θ − 4 sen θ
para demostrar estas (y otras) identidades utilizamos la fórmula de De Moivre, es decir
3
cos 3θ + i sen 3θ = (cos θ + i sen θ)

= cos3 θ − 3 cos θ sen2 θ + i 3 cos2 θ sen θ − sen3 θ
igualando ahora parte real e imaginaria tendremos
cos 3θ = cos3 θ − 3 cos θ sen2 θ

= cos3 θ − 3 cos θ 1 − cos2 θ = 4 cos3 θ − 3 cos θ
sen 3θ = 3 cos2 θ sen θ − sen3 θ

3
= 3 1 − sen2 θ sen θ − sen3 θ = 3 sen θ − 4 sen θ
El método puede extenderse a expresiones de senos y cosenos de nθ
Igualmente podemos desarrollar un método para encontrar expresiones de potencias de funciones tri-
n
gonométricas en término de funciones de factores de ’ángulo del tipo (cos θ) = F (cos nθ, sen nθ) . Para
empezar, supongamos que tenemos un número complejo de módulo 1, de tal forma que
 1
 n
 z + z n = 2 cos nθ

z = eiθ = cos θ + i sen θ ⇒


 z n − 1 = 2 sen nθ
zn
. Estas identidades surgen de manera inmediata de
1 n −n
z n + n = (cos θ + i sen θ) + (cos θ + i sen θ) = (cos nθ + i sen nθ) + (cos (−nθ) + i sen (−nθ))
z
= cos nθ + i sen nθ + cos nθ − i sen nθ
1
z n + n = 2 cos nθ
z
igualmente puede demostrarse la segunda de las afirmaciones anteriores. Ahora bien, supongamos además
que n = 1, con lo cual se cumple que
1 1
z + = eiθ + e−iθ = 2 cos θ y z − = eiθ − e−iθ = 2 sen θ
z z
que también lo sabı́amos desde la mas temprana edad de nuestros bachilleratos. Ahora bien, lo que quizá no
sabı́amos en esos entonces (y quizá ahora tampoco) es que a partir de aquı́ podemos construir
5
1 1 1 1 5 10
cos5 θ = 5 z + = 5 z 5 + 5 + 5z 3 + 3 + 10z +
2 z 2 z z z
es decir
1
cos5 θ = [2 cos 5θ + 10 cos 3θ + 20 cos θ]
25
de la misma manera se puede proceder con otras potencias y con potencias de la función seno.

Raı́ces de polinomios
La fórmula de De Moivre nos puede ayudar para la encontrar raı́ces de polinomios. Supongamos, para
empezar que queremos encontrar las n raı́ces de la ecuación z n = 1. Para ello procedemos con el siguiente
artificio
z n = 1 = cos (k2π) + i sen (k2π) = ei(k2π) con k = 0, 1, 2, ....
con lo cual las n raı́ces de la ecuación z n = 1 serán
⇒ z = ei( )
k2π
zn = 1 n
⇓
z }| {
2πi( n
1
) 2πi( n
2
) 2πi( n
3
); · · · n )
2πi( n−2 n )
2πi( n−1
z 0 = 1; z1 = e ; z2 = e ; z3 = e zn−2 = e ; zn−1 = e
es decir n raı́ces corresponderán a los n valores de k = 0, 1, 2, · · · n − 2, n − 1. Mayores valore de k no proveen

nuevas raı́ces.
Estas propiedades pueden extenderse a raı́ces de polinomios. Supongamos la siguiente ecuación polinómica
con sus raı́ces:
 4
 z + 2 = 0 ⇒ z 4 = −2
5 4 4
z − z + 2z − 2 = 0 ⇒ z + 2 (z − 1) = 0 ⇒

z−1=0 ⇒z =1
una vez más

√
⇒ z = i 2ei( 4 )
k2π
z 4 = −2 ⇒ z 4 = −2ei(k2π)
4
√ √ π √ √ √ √ 3π √
z1 = i 2ei 2 = − 2; z2 = i 2eiπ = −i 2; z3 = i 2ei 2 = 2
4 4 4 4 4 4 4
z0 = i 2;
por lo tanto la ecuación z 5 − z 4 + 2z − 2 = 0 tendrá tres raı́ces reales y dos complejas

√ √ √ √
z 5 − z 4 + 2z − 2 = 0 ⇒ z0 = i 2; z1 = − 2; z2 = −i 2; z3 = 2;
4 4 4 4
z4 = 1
Una afirmación que nos han dicho y que quizá no sepamos de dónde viene es que si un polinomio
con coeficientes reales tiene raı́ces complejas, ellas
√ serán complejas conjugadas unas de√otras. Vale decir si
z 5 − z 4 + 2z − 2 = 0 tiene como raı́z z0 = i 4 2 también tendrá como raı́z z2 = −i 4 2 y z0 = z2∗ . Esta
afirmación se prueba de forma general si suponemos que tenemos una ecuación
ai z i = 0 con i = 0, 1, 2, · · · n − 1, n ⇒ a0 + a1 z + a2 z 2 · · · + an−1 z n−1 + an z n = 0
donde los coeficientes a0 , a, a2 , · · · , an−1 , an los suponemos reales, esto es ai = a∗i para todos los valores del
ı́ndice i. Al tomar complejo conjugado a la ecuación nos queda
2 n−1 n
a0 + a1 z + a2 z 2 · · · + an−1 z n−1 + an z n = 0 ⇐⇒ a∗0 + a∗1 z ∗ + a∗2 (z ∗ ) · · · + a∗n−1 (z ∗ ) + a∗n (z ∗ ) = 0
como los coeficientes son reales tenemos que

2 n−1 n
a0 + a1 z + a2 z 2 · · · + an−1 z n−1 + an z n = 0 ⇐⇒ a0 + a1 z ∗ + a2 (z ∗ ) · · · + an−1 (z ∗ ) + an (z ∗ ) = 0
que no dice otra cosa que si z es solución también lo será z ∗ ya que la ecuación es la misma por tener los
mismos coeficientes (reales).

Ahora consideremos el siguiente polinomio complejo P (z) = z 6 − z 5 + 4z 4 − 6z 3 + 2z 2 − 8z + 8 = 0. Si

por algún método comprobamos que (z 3 − 2) es uno de sus factores, entonces podremos encontrar las raı́ces
del polinomio P (z). Veamos:
Claramente si (z 3 − 2) es un factor podemos expresar
P (z) = z 6 − z 5 + 4z 4 − 6z 3 + 2z 2 − 8z + 8 = (z 3 − 2)(z 3 − z 2 + 4z − 4) = (z 3 − 2)(z − 1)(z 2 + 4)
con lo cual, como z es complejo, hay que tener cuidado de las raı́ces encubiertas
   1
 a(a2 − 3b2 ) = 2   a=−√
 3
4
3 3 3 2 2 3
z = 2 ⇒ (a + ib) = 2 ⇒ a − 3ab + i(3a b − b ) = 2 ⇒ ⇔ √
  
 b=±√
b(b2 − 3a2 ) = 0 3
3
4
es decir, las 6 raı́ces serán


 z=2
z3 = 2 ⇒ z = 1, z = ±2i
 z = − √1 1 ± i√3
3
4
Logaritmos y potencias de números complejos

Definamos las siguiente función
z = eiθ ⇐⇒ Ln z = iθ
donde Ln representará el logaritmo natural del número complejo z. Nótese que hemos utilizado Ln en lugar
de tradicional ln y la razón es la ambigüedad implı́cita en la notación de Euler, vale decir
z = reiθ ⇐⇒ Ln z = ln r + i (θ + 2nπ) = ln r + iθ
en otras palabras, Ln z no es función por ser multivaluada. Se supera esta dificultad cuando se restringe el
argumento −π < θ ≤ π y esta se conoce como el valor principal de la función Ln z = ln z.
Por ejemplo, al evaluar el
h i
i( −π +2nπ ) −π
Ln (−3i) = Ln 3e 2 = ln 3 + i + 2nπ con n = 0, 1, 2, · · ·
2
por lo tanto el valor principal del Ln (−3i) será ln (−3i) = ln 3 − i π2 .
Con la misma intuición se procede con las potencias de números complejos. Si queremos evaluar z = i−5i
tendremos que proceder como sigue
h π i
z = i−5i ⇒ Ln (z) = Ln i−5i = −5i Ln (i) = −5i Ln ei( 2 +2nπ) =
con lo cual z = i−5i = e5( 2 +2nπ) ¡ es un número real !

π
√ 3
Para finalizar consideremos otro par de casos de potencias y logaritmos ii y ln 3+i . Entonces
π i π π
ii = exp i + 2nπ = exp i2 + 2nπ = exp − − 2nπ
2 2 2
y para
n o3 π
√ 1 1
ln 3+i = 3 ln 2 exp i arctan √ = 3 ln 2 + i arctan √ = ln 8 + i + 6nπ
3 3 2

1.11. Algunos Ejemplos Resueltos

~ del centro de masa para un sistema de N partı́culas como
1. Hemos definido como la posición, R,
N
~ = Σi=1 mi~ri
R
ΣNj=1 mj
donde ~ri corresponde con la posición de la i−ésima partı́cula

Determine la posición del centro de masa para un sistema de tres masas, mi = 1,2,3, colocadas en los
vértices de un triángulo equilátero de lado l = 2
Solución: Al colocar el origen de coordenadas en uno de los vértices y uno de los ejes de coordenadas sobre uno
de los lados. Entonces,
√ √
~ Σ3i=1 mi~ri m1~r1 + m1~r1 1 · 2ı̂ + 3 · ı̂ + 3̂ 5 3
R= 3 = = = ı̂ + ̂
Σj=1 mj MT 6 6 2
2. Dada una base ortonormal {ı̂,̂, k̂} y los siguientes vectores
~a = 3ı̂ + 2̂ + k̂ ~b = 3ı̂ − 2̂ + k̂ ~c = ı̂ − k̂

a) Comprobar si {~a, ~b, ~c} forman base
Solución: Para que los vectores formen base tienen que ser linealmente independientes. Esto es α~a +β~b+γ~c =
0 ⇒ α = β = γ = 0 con lo cual

 3α + 3β + γ = 0
α 3ı̂ + 2̂ + k̂ + β 3ı̂ − 2̂ + k̂ + γ ı̂ − k̂ = 0 ⇒ 2α − 2β = 0

α+β−γ =0
y al resolver esl sistema se obtiene α = β = γ = 0 con lo cual se demuestra que son linealmente
independientes
Otra manera de resolverlo es mostrar que ~c · ~a × ~b 6= 0 y efectivamente

1 0 −1
~c · ~a × ~b = 3 2 1 = 4 6= 0
3 −2 1
b) Si {~a, ~b, ~c} forma base, exprese d~ = ı̂ + 2̂ ~e = 3ı̂ − 2̂ f~ = ~a × ~b en término de esa base {~a, ~b, ~c}.
De lo contrario, construya una base como {~a, ~b, ~a × ~b} y exprese los vectores {d, ~ ~e, f~} en término
de esa nueva base
Solución: Como forman base expresamos los vectores en término esos términos. Esto es

 3α + 3β + γ = 1
ı̂ + 2̂ = α 3ı̂ + 2̂ + k̂ + β 3ı̂ − 2̂ + k̂ + γ ı̂ − k̂ ⇒ 2α − 2β = 2

α+β−γ =0
resolviendo tendremos que d~ = 58 ~a − 38~b + 41 ~c. Seguidamente


 3α + 3β + γ = 3

3ı̂ − 2̂ = α 3ı̂ + 2̂ + k̂ + β 3ı̂ − 2̂ + k̂ + γ ı̂ − k̂ ⇒ 2α − 2β = −2

α+β−γ =0

resolviendo tendremos que ~e = − 18 ~a + 78~b + 43 ~c

Ahora bien
ı̂ ̂ k̂

~a × ~b ≡ 3ı̂ + 2̂ + k̂ × 3ı̂ − 2̂ + k̂ ≡ 3 2 1 = 4ı̂ − 12k̂

3 −2 1
con lo cual

 3α + 3β + γ = 4

4ı̂ − 12k̂ = α 3ı̂ + 2̂ + k̂ + β 3ı̂ − 2̂ + k̂ + γ ı̂ − k̂ ⇒ 2α − 2β = 0

α + β − γ = −12
y finalmente f~ = ~a × ~b = −~a − ~b + 10~c

3. Utilizando la notación de ı́ndices demostrar que para cualquier trı́o de vectores {~a, ~b, ~c} se cumple que
~a × (~b × ~c) + ~b × (~c × ~a) + ~c × (~a × ~b) = 0
Solución: En notación de ı́ndices
~a × (~b × ~c) + ~b × (~c × ~a) + ~c × (~a × ~b) = ǫlmi am ǫijk bj ck + ǫlmi bm ǫijk cj ak + ǫlmi cm ǫijk aj bk
con lo cual arreglando
ǫlmi ǫijk am bj ck + ǫlmi ǫijk bm cj ak + ǫlmi ǫijk cm aj bk =

δjl δkm − δjm δkl am bj ck + δjl δkm − δjm δkl bm cj ak + δjl δkm − δjm δkl cm aj bk =
y ahora desarrollando los productos de δs, nos queda
     
ak bl ck −ak bk cl  + bk cl ak −bk ck al  + ck al bk −ck ak bl  = 0
| {z } | {z } | {z } | {z } | {z } | {z }
I II II III III I
e indentificando término a término, notamos que se anula.

4. Una partı́cula se mueve a lo largo de una curva descrita por
x(t) = 3t2 y(t) = 4t3 − t z(t) = t
a) Encuentre las expresiones para los vectores: posición, velocidad y aceleración de esa partı́cula
Solución:
~r(t) = 3t2 ı̂ + (4t3 − t)̂ + tk̂ ~v = 6tı̂ + (12t2 − 1)̂ + k̂ ~a = 6ı̂ + 24t̂
b) Encuentre las expresiones, más generales, de los vectores tangentes y perpendiculares a todo a
punto de la trayectoria de la partı́cula
Solución: Vector tangente a todo punto de la trayectoria es el vector velocidad
~v = 6tı̂ + (12t2 − 1)̂ + k̂
El perpendicular a todo punto, será un vector ~b = bx ı̂ + by ̂ + bz k̂, tal que
(6tı̂ + (12t2 − 1)̂ + k̂) · (bx ı̂ + by ̂ + bz k̂) = 6tbx + (12t2 − 1)by + bz = 0

con lo cual
~b = bx ı̂ + by ̂ − (6tbx + (12t2 − 1)by )k̂

5. El campo de fuerzas del oscilador anarmónico anisótropo bidimensional se escribe como
F~ = −k1 x2 ı̂ + k2 y̂ (1.2)

R (x2 ,y2 )
Encuentre el trabajo realizado, (x1 ,y1 )
d~r · F~ a lo largo de las siguientes trayectorias
a) (1, 1) → (4, 1) → (4, 4)

Solución: Z Z
(4,1) (4,4)
15k2
(ı̂dx) · (−k1 x2 ı̂ + k2 ̂) + (̂dy) · (−k1 16ı̂ + k2 y̂) = −21k1 +
(1,1) (4,1) 2
b) (1, 1) → (1, 4) → (4, 4)

Solución: Z Z
(1,4) (4,4)
15k2
(̂dy) · (−k1 ı̂ + k2 y̂) + (ı̂dx) · (−k1 x2 ı̂ + k2 4̂) = −21k1 +
(1,1) (1,4) 2
c) (1, 1) → (4, 4) para x = y

Solución: Z Z
(4,4) (4,4)
15k2
(ı̂dx + ̂dx) · (−k1 x2 ı̂ + k2 x̂) = (−k1 x2 + k2 x)dx = −21k1 +
(1,1) (1,1) 2
6. Dados los siguientes puntos en el espacio (1, 0, 3); (2, −1, 0); (0, −1, 1); (−1, 0, 1).
a) Considere los tres primeros puntos. ¿ Estos tres puntos son coplanares ? ¿ por qué ? De ser
coplanares,
Solución: Tres puntos en el espacio definen un plano, por lo tanto siempre serán coplanares
1) Encuentre el área del triángulo que tiene por vértices esos tres puntos
Solución: Para ello seleccionamos uno de los puntos como un vértice privilegiado (digamos (2, −1, 0))
respecto al cual construirémos dos vectores que representan dos de los lados del triángulo.
Esto es
~a = (1, 0, 3) − (2, −1, 0) ↔ ~a = −1ı̂ + ̂ + 3k̂
y
~b = (0, −1, 1) − (2, −1, 0) ↔ ~b = −2ı̂ + k̂
con lo cual, el área del vértice será la mitad del área del paralelogramo que tiene por lados
estos dos vectores. Es decir

ı̂ ̂ k̂ √
1
A = k~a × bk ⇒ ~a × b = −1 1
~ ~ 3 = ı̂ − 5̂ + 2k̂ ⇒ A = 1 kı̂ − 5̂ + 2k̂k = 30
2 2 2
−2 0 1
2) Encuentre la ecuación del plano que los contiene

Solución: La ecuación del plano vendrá dada por
(~r − ~r1 ) · ((~r2 − ~r1 ) × (~r3 − ~r1 )) = 0
donde
~r = xı̂ + y̂ + z k̂, ~r1 = ı̂ + 3k̂, ~r2 = 2ı̂ − ̂, ~r3 = −̂ + k̂,

con lo cual la ecuación del plano queda como

(x − 1) y (z − 3)

1 −1 −3 = 0 ⇒ −(x − 1) + 5y − 2(z − 3) = 0 ⇒ x − 5y + 2z = 7

−1 −1 −2
b) Considere los cuatro puntos ¿ Estos cuatro puntos son coplanares ? ¿ por qué ? De NO ser
coplanares, encuentre la distancia del cuarto punto al posible plano que contiene a los otros tres.
Solución: Para verificar si el cuarto punto está en el plano, verificamos si cumple la ecuación que lo define
(−1) − 5(0) + 2(1) 6= 7
los cuatro puntos no son coplanares. Para calcular la distancia del cuarto punto al plano construyo
el vector unitario normal al plano
~a × ~b 1 1
~nP = =√ ı̂ − 5̂ + 2k̂ d = ~nP · ~c = √ ı̂ − 5̂ + 2k̂ · −3ı̂ + ̂ + k̂
k~a × ~bk 30 30
con lo cual la distancia al cuarto punto será

1 6
d = ~nP · ~c = √ ı̂ − 5̂ + 2k̂ · −3ı̂ + ̂ + k̂ = − √
30 30
7. Considere los siguientes tres vectores
w ~ 2 = 2ı̂ − 3̂ w
~ 1 = ı̂ + 3k̂ w ~ 3 = −̂ + k̂
a) ¿ Forman una base para R3 ? Explique detalladamente

Solución: Son linealmente independientes, estos es
αw
~ 1 + βw
~ 2 + γw
~3 = 0 ⇒α=β=γ=0
que se comprueba directamente al resolver
α +2β =0
−3β −γ =0
3α +γ =0
b) Si es que forman base, exprese el vector ~a = ı̂ − 3̂ + 3k̂ en la posible base {w

~ 1, w ~ 3}
~ 2, w
Solución: Como son linealmente independientes, forman base, con lo cual cualquier vector puede ser expre-
sado como combinación lineal de estos tres. Eso es:

  
 α = 31


 α +2β =1  
~a = αw
~ 1 + βw ~3 ⇒
~ 2 + γw −3β −γ = −3 ⇒ β = 31
  

3α +γ = 3 


γ=2
8. Utilizando la notación de ı́ndices muestre si se cumple la siguiente identidad

~ × ~a × ~b = ~a ∇
∇ ~ · ~b − ~b ∇~ · ~a + ~b · ∇ ~ ~b
~ ~a − ~a · ∇

Solución:
~ × ~a × ~b = ǫijk ∂j (ǫklm al bm ) = (δli δm
∇ j i j
− δm δl )∂j (al bm ) = ∂m (ai bm ) − ∂l (al bi )
expandiendo la derivada
~ × (~a × ~b) = bm ∂m (ai ) + ai ∂m (bm ) − bi ∂l (al ) − al ∂l (bi ) ≡ (~b · ∇)~
∇ ~ · ~b)~a − (∇
~ a + (∇ ~ · ~a)~b − (~a · ∇)
~ ~b
9. La trayectoria de un punto en el plano vista por un observador 1 es
~r1 (t) = 5 cos 3t2 ı̂ + 5 sen 3t2 ̂
a) Exprese las aceleraciones radiales y tangenciales de esta partı́cula

Solución: Es claro que la partı́cula describe un movimiento circular donde θ(t) = 3t2
d~r(t) dθ(t) d~a(t)

~r(t) = 5ûr ⇒ ~v (t) = =5 ûθ = 30t ûθ ⇒ ~a(t) = = 30 ûθ − 30t ûr
dt dt dt
b) Considere ahora un segundo observador, el cual describe una trayectoria respecto al primero
representada por
~r21 (t) = (t3 − 4t)ı̂ + (t2 + 4t) ̂
Encuentre las expresiones para los vectores posición, velocidad y aceleración de la partı́cula me-
didos respecto al segundo observador
Solución: La trayectoria de la partı́cula respecto al segundo observador será
~r2 (t) = ~r1 (t) − ~r21 (t) = 5 cos 3t2 ı̂ + 5 sen 3t2 ̂ − ((t3 − 4t)ı̂ + (t2 + 4t) ̂)
con lo cual
~r2 (t) = (5 cos 3t2 − (t3 − 4t))ı̂ + (5 sen 3t2 − (t2 + 4t))̂
entonces
d~r2 (t)
~v2 (t) = = (30t cos 3t2 − (3t2 − 4))ı̂ + (30t sen 3t2 − (2t + 4))̂
dt
y
d~v2 (t)
~a2 (t) = = (30 cos 3t2 − 180tt sen 3t2 − 6t)ı̂ + (30 sen 3t2 − 180t2 cos 3t2 − 2)̂
dt
10. El campo de fuerzas del oscilador armónico anisótropo bidimensional se escribe como
F~ = −k1 xî + k2 y ĵ
R (x2 ,y2 )
Encuentre el trabajo realizado, (x1 ,y1 )
d~r · F~ a lo largo de las siguientes trayectorias
Solución: En general
Z (4,4) Z (4,4) Z (4,4) Z (4,4)
d~r · F~ = (dx ı̂ + dy ̂) · −k1 xî + k2 y ĵ = − dx k1 x + dy k2 y
(1,1) (1,1) (1,1) (1,1)
a) (1, 1) → (4, 1) → (4, 4)

Z (4,4) Z (4,1) Z (4,4) 4 4
1
2 1
2 15
d~r · F~ = − dx k1 x + dy k2 y = − k1 x + k2 y = (k2 − k1 )
(1,1) (1,1) (4,1) 2 1 2 1 2

b) (1, 1) → (1, 4) → (4, 4)

Z (4,4) Z (1,4) Z (4,4) 4 4
1 1 15
d~r · F~ = dy k2 y − dx k1 x = k2 y 2 − k1 x2 = (k2 − k1 )
(1,1) (1,1) (1,4) 2 1 2 1 2
c) (1, 1) → (4, 4) para x = y

Z (4,4) Z 4 4
1
2 15
d~r · F~ = dx (k2 − k1 ) x = (k2 − k1 ) x = (k2 − k1 )
(1,1) 1 2 1 2

Bibliografı́a
[1] Arfken, G. B.,Weber, H., Weber, H.J. (2000) Mathematical Methods for Physicists 5ta Edición
(Academic Press, Nueva York)
[2] Borisenko, A.I, y Tarapov I.E. (1968) Vector and Tensor Analisys (Dover Publications Inc, Nueva
York)
[3] Dennery, P. y Krzywicki, A. (1995) Mathematics for Physicists (Dover Publications Inc, Nueva York)
[4] Harper, C. (1971) Introduction to Mathematical Physics (Prentice Hall, Englewood Cliff, N.J:)
[5] Hassani, S. (1991) Foundations of Mathematical Physics (Prentice Hall, International Edition,
London:
[6] Hauser, W (1971) Introduction to Principles of Electromagnetism (Addison-Wesley Pub Co
Reading)
[7] Riley, K.F., Hobson, M.P. y Bence, S.J. (2002) Mathematical Methods for Physics and Enginee-
ring (Cambridge University Press)
[8] Santaló, L.A (1969) Vectores y Tensores (Editorial Universitaria, Buenos Aires)
[9] Schutz, B. (1980) Geometrical Methods in Mathematical Physics (Cambridge University Press,
Londres)
[10] Spiegel, M. (1959) Vector Analysis (Schaums Outline Series, McGraw Hill New York )
57
Capı́tulo 2
Espacios Vectoriales Lineales
58
2.1. Grupos, Campos y Espacios Vectoriales

2.1.1. Grupos
Considere el siguiente conjunto G = {g1 , g2 , g3 , · · · , gn , · · · } y la operación entonces estos elementos
forman un grupo abeliano1 respecto a la operación si ∀gi ∈ G
1. Cerrada respecto a la operación : {gi , ∈ G, gj ∈ G} ⇒ ∃gk = gi gj ∈ G

2. Asociativa respecto a la operación : gk (gi gj ) = (gk gi ) gj
3. Existencia de un elemento neutro: ∃1 ∈ G ∋ gi 1 = gi = 1 gi
4. Existencia de un elemento inverso: gi , ∈ G ⇒ ∃gi−1 ∈ G ∋ gi gi−1 = gi−1 gi = 1
5. Conmutativa respecto a la operación : gi gj ≡ gj gi
Si sólo se cumplen las cuatro primeras, entonces se dice que simplemente forman grupo respecto a la
operación . Se pueden definir subgrupos
Ejemplos: Serán grupo:
Los enteros Z = {· · · − 3 − 2, −1, 0, 1, 2, 3, · · · } respecto a la suma pero no respecto a la multiplicación

(excluyendo el cero) por cuanto no existe inverso.
Los racionales respecto a la suma y a la multiplicación
Las rotaciones en 2 Dimensiones (2D), sin embargo las rotaciones en 3D forman grupo no-abeliano.
Dado un grupo de tres elementos, G = {1, a, b} y la operación , por construcción si queremos
que la operación de dos de los elementos provea un tercero distinto, entonces la úNICA “tabla de
multiplicación” posible será:
1 a b
1 1 a b
a a b 1
b b 1 a
Ejercicio
1. Sea S el conjunto de todos los números reales excluyendo −1 y defina la operación
a b = a + b + ab
donde + es la suma estándar entre números reales.
a) Muestre que [S, ] forman grupo

b) Encuentre la solución en S para la ecuación 2 x 3 = 7
1 NIELS HENRIK ABEL, (1802-1829 Noruega) Pionero en el desarrollo de diferentes ramas de la matemática moderna, Abel
mostró desde su infancia un notable talento para el estudio de las ciencias exactas. Tal predisposición se verı́a muy pronto
confirmada por sus precoces investigaciones sobre cuestiones de álgebra y cálculo integral, en particular sobre la teorı́a de las
integrales de funciones algebraicas (a las que se denominarı́a abelianas en honor de su formulador) que no habrı́a de publicarse
hasta 1841, doce años después de su fallecimiento. En 2002 el gobierno noruego lanzó el premio Abel que llenará el vacı́o que
existe en la premiación Nobel del gobierno sueco, en el cual no existe premiación para la comunidad matemática.
Más detalles http://www-history.mcs.st-andrews.ac.uk/Mathematicians

2.1.2. Campo
Definiremos como un campo como el conjunto F = {f1 , f2 , f3 , · · · , fn , · · · } sobre el cual están definidas
dos operaciones suma, +, y multiplicación, ·, y que satisfacen las siguientes propiedades
1. Forman un grupo abeliano respecto a la suma, +,con el elemento neutro representado por el cero, 0.
2. Forman un grupo abeliano respecto a la multiplicación, ·. Se excluye el cero, 0 y se denota el elemento
neutro de la multiplicación como 1.
3. Es distributiva respecto a la suma, + : Dados fi , fj y fk se tiene que
fi · (fj + fk ) = fi · fj + fi · fk
Ejemplos tı́picos de campos lo constituyen los racionales Q, los números reales R y los números complejos
C. Normalmente se refiere estos campos como Campos Escalares
2.1.3. Espacios Vectoriales Lineales

Sea el conjunto de objetos V = {|v1 i , |v2 i , |v3 i · · · |vi i · · · } se denominará V un espacio vectorial
lineal y sus elementos |vi i vectores, si existe definida una operación suma, ⊞, respecto a la cual los elementos
|vi i ∈ V de forman un grupo abeliano y una operación multiplicación por un número escalar de un campo,
K = {α, β, γ · · · } tal que:
1. La operación suma ⊞ es cerrada en V : ∀ |vi i , |vj i ∈ V ⇒ |vk i = |vi i ⊞ |vj i ∈ V

2. La operación suma ⊞ es conmutativa y asociativa
a) ∀ |vi i , |vj i ∈ V ⇒ |vi i ⊞ |vj i = |vj i ⊞ |vi i

b) ∀ |vi i , |vj i , |vk i ∈ V ⇒ (|vi i ⊞ |vj i) ⊞ |vk i = |vj i ⊞ (|vi i ⊞ |vk i)
3. Existe un único elemento neutro: ∃! |0i ∋ |0i ⊞ |vj i = |vj i ⊞ |0i = |vj i ∀ |vj i ∈ V
4. Existe un elemento simétrico para cada elemento de V :
∀ |vj i ∈ V ∃ |−vj i ∋ |vj i ⊞ |−vj i = |0i
5. α (β |vi i) = (αβ) |vi i

6. (α + β) |vi i = α |vi i + β |vi i
7. α (|vi i ⊞ |vj i) = α |vi i ⊞ α |vj i
8. 1 |vi i = |vi i
Es inmediato notar que podemos definir subespacios vectoriales dentro de los espacios vectoriales. Ellos
serán aquellos conjuntos de vectores que cumplan con los requisitos anteriores pero además sean cerrado
dentro de los esos mismos conjuntos de vectores.

Ejemplos
Serán ejemplos de espacios vectoriales
1. Los números reales y complejos con el campo de reales o complejos y definidas las operaciones ordinarias
de suma y multiplicación. V ≡ R; ⊞ ⇒ +; |vi ≡ x; K ≡ R.
V ≡ C; ⊞ ≡ +; |vi i ≡ x + iy; K ≡ R.
Si el campo K es el conjunto de los números reales se dirá que es un espacio vectorial real de números
reales si V ≡ R y si V ≡ C se dirá un espacio vectorial real de números complejos. Por su parte si
K ≡ C diremos que es un espacio vectorial complejo de números reales ( si V ≡ R) o complejos (
V ≡ C ). Siempre se asociará el campo de escalares al espacio vectorial. Se dirá que es un espacio
vectorial sobre el campo de los escales. Si el campo es real (complejo) se dirá que el espacio vectorial
es real (complejo).
2. El espacio V ≡ Rn = R × R × · · · × R, vale decir el producto cartesiano de R, cuyos elementos son

n−uplas de números, con la operación suma ordinaria de vectores en n-dimensionales y la multiplicación
por escalares.
|xi = (x1 , x2 , x3 , · · · xn ) ∧ |yi = (y1 , y2 , y3 , · · · , yn )

|xi ⊞ |yi ≡ (x1 + y1 , x2 + y2 , x3 + y3 , · · · xn + yn )
α |xi = (αx1 , αx2 , αx3 , · · · αxn )
Este espacio vectorial es de dimensión finita. Igualmente, será espacio vectorial Cn = C × C × · · · × C

para el cual los elementos xi ∈ C. Si para este caso el campo sobre el cual se define el espacio vectorial
Cn es real, tendremos un espacio vectorial real de números complejos. Es obvio que el caso V ≡ R para
el cual |xi1 = (x1 , 0, 0, · · · , 0) y |yi1 = (y1 , 0, 0, · · · , 0) o cualquier espacio de vectores formados por
las componentes, i.e. |xii = (0, 0, 0, · · · , xi , · · · 0) y |yii = (0, 0, 0, · · · , yi , · · · 0) formarán subespacios
vectoriales dentro de Rn
3. El espacio E∞ constituido por vectores |xi = (x1 , x2 , x3 , · · · xn , · · · ) contables pero con infinitas com-
ponentes.
|xi = (x1 , x2 , x3 , · · · , xn , · · · ) ∧ |yi = (y1 , y2 , y3 , · · · , yn , · · · )

|xi ⊞ |yi ≡ (x1 + y1 , x2 + y2 , x3 + y3 , · · · , xn + yn , · · · )
α |xi = (αx1 , αx2 , αx3 , · · · , αxn , · · · )
con la restricción que

n
X
lı́m xi = L con L finito
n→∞
k=1
4. Para el conjunto de la matrices n × n reales o complejas con el campo K real o complejo.
|xi = Mab ∧ |yi = Nab

|xi ⊞ |yi ≡ Mab + Nab = (M + N )ab
α |xi = αMab = (αM )ab
Es también obvio que se podrán formar subespacios vectoriales cuyos elementos sean matrices de
dimensión menor a n × n


5. El conjunto de todos los polinomios con coeficientes reales P = ao , a1 x, a2 x2 , · · · , an xn , · · · con ⊞
la suma ordinaria entre polinomios y la multiplicación ordinaria de polinomios con escalares
6. Espacios Funcionales (de los cuales lo polinomios son un caso particular) En estos espacios los vectores
serán funciones, la suma sera la suma ordinaria entre funciones y la multiplicación por un escalar
también sera la multiplicación ordinaria de una función por un elemento de un campo
|f i = f (x) ∧ |gi = g (x)
|f i ⊞ |gi ≡ f (x) + g (x) ≡ (f + g) (x)
α |f i = (αf ) (x) ≡ αf (x)
Con este esquema vemos otros ejemplos
a) El conjunto de todas las funciones continuas e infinitamente diferenciables, definidas en el intervalo

∞
[a, b] : C[a,b]
b) El conjunto de todas las funciones complejas
R de variable 2real, ψ (x) , definidas en [a, b] , de cua-
drado integrable (es decir para las cuales [a,b] dx kψ (x)k sea finita). Este espacio se denomina
comúnmente L2 y pueden ser definidas en un rango [a, b] finito o infinito y para mas de una
variable.
Ejercicios
Muestre que también serán espacios vectoriales
1. El conjunto de todas las funciones f = f (x) definidas en x = 1 con f (1) = 0. Si f (1) = c, ¿ tendremos
igual un espacio vectorial ? ¿ por qué ?
2. Los vectores (x, y, z) ∈ V3 tal que sus componentes satisfacen el siguiente sistema de ecuaciones alge-
braico
a11 x + a12 y + a13 z = 0
a21 x + a22 y + a23 z = 0
a31 x + a32 y + a33 z = 0
La importancia de la conceptualización y la notación

En los ejemplos antes mencionados hemos utilizado para representar un vector abstracto la notación de
|v1 i y con ellos construimos un espacio vectorial abstracto V = {|v1 i , |v2 i , |v3 i , · · · , |vn i} . Un espacio
vectorial abstracto será un conjunto de elementos genéricos que satisfacen ciertos axiomas. Dependiendo del
conjunto de axiomas tendremos distintos tipos de espacios abstractos. En matemática el concepto de espacios
abstracto es reciente (1928) y, aparentemente, se le debe a Maurice Fréchet2 . La teorı́a resulta de desarrollar
las consecuencias lógicas que resultan de esos axiomas. Los elementos de esos espacios se dejan sin especificar
a propósito. Ese vector abstracto puede representar, vectores en Rn , matrices n × n o funciones continuas. La
notación |v1 i, que se denomina un ket y al cual corresponde un bra hv2 | proviene del vocablo inglés braket
que significa corchete y será evidente más adelante cuando construyamos escalares braket hv2 | |v1 i . Esta útil
notación la ideó Paul Dirac3 , uno de los fı́sicos más influyentes en el desarrollo de la fı́sica del siglo pasado
2 MAURICE FRéCHET (1878 Maligny, Yonne, Bourgogne-1973 Parı́s, Francia). Versátil Matemático Francés, con importan-
tes contribuciones en Espacios Métricos, Topologı́a y creador del concepto de espacios abstractos.
Más detalles http://www-history.mcs.st-andrews.ac.uk/Mathematicians/
3 PAUL ADRIEN MAURICE DIRAC (1902 Bristol, Inglaterra 1984-Tallahassee, EE.UU) Además de contribuir de manera
determinante en la comprensión de la Mecanica Cuántica, es uno de los creadores de la Mecanica Cuantica Relativista la cual

2.2. Métricas y Espacios Métricos

El siguiente paso en la dotación de propiedades de los espacios lineales lo constituye la idea de métrica o
distancia entre sus elementos. El concepto de métrica surge de la generalización de la idea de distancia entre
dos puntos de la recta real.
Un Espacio vectorial sera métrico si podemos definir una función
d : V × V → R ∋ ∀ |xi , |yi , |zi ∈ V se cumple que
1. d (|xi , |yi) ≥ 0 si d (|xi , |yi) = 0 ⇒ |xi ≡ |yi

2. d (|xi , |yi) ≡ d (|yi , |xi)
3. d (|xi , |yi) ≤ d (|xi , |zi) + d (|yi , |zi) La desigualdad Triangular
Ası́, diremos que (V, K,⊞; d) es un espacio vectorial, lineal, métrico.
Ejemplos
1. Espacios Euclidianos reales Rn
a) Para R, es decir la recta real, la definición de métrica es d (|xi , |yi) ≡ |x − y|

b) Para R2 , es decir
q el plano, una definición de métrica es
2 2
d (|xi , |yi) ≡ (x1 − y1 ) + (x2 − y2 ) . También podemos construir otra definición de métrica
como d1 (|xi , |yi) ≡ |x1 − y1 | + |x2 − y2 | . Es claro como el mismo espacio vectorial genera varios
espacios métricos, dependiendo de la definición de métrica
En general para Espacios Euclidianos reales Rn una posible definición de métrica sera d (|xi , |yi) ≡
c) q
2 2 2 2
(x1 − y1 ) + (x2 − y2 ) + (x3 − y3 ) + · · · + (xn − yn )
2. Espacios Unitarios n−dimensionales, o Espacios Euclidianos complejos, Cn , la definición de distancia

puede construirse
q como
2 2 2 2
d (|xi , |yi) ≡ |x1 − y1 | + |x2 − y2 | + |x3 − y3 | + · · · + |xn − yn | y es claro que se recobra la idea
de distancia en el plano complejo: d (|xi , |yi) ≡ |x − y|
∞
3. Para los Espacios Funcionales C[a,b] una posible definición de distancia seria
d (|f i , |gi) ≡ máxt∈[a,b] |f (t) − g (t)|
Es importante destacar que las definiciones de distancia arriba propuesta son invariante con traslaciones
de vectores. Esto es: |x̃i = |xi + |ai ∧ |ỹi = |yi + |ai, entonces
d (|xi , |yi) ≡ d (|x̃i , |ỹi) .
2.3. Normas y Espacios Normados

La idea de distancia, de métrica, es el equipamiento más elemental que uno le puede exigir a un espacio
vectorial. Mucho más interesante aún son aquellos espacios vectoriales que están equipados con la idea de
norma y a partir de allı́ se define la idea de distancia. La norma tiene que ver con el “tamaño” del vector y
ayudó a comprender el papel que juega el espı́n en las partı́culas subatómicas. Por sus importantes trabajos compartió con
Erwin Schrödinger el Premio Nobel de fı́sica en 1933.

la métrica tiene que ver con la distancia entre vectores. Cuando definimos la métrica a partir de la norma,
vinculamos las propiedades algebraicas del espacio con sus propiedades geométricas.
La norma, k|vi ik ≡ n (|vi i) de un espacio vectorial V = {|v1 i , |v2 i , |v3 i · · · |vn i} será una función
n: V → R∋ ∀ |vi i ∈ V se cumple que
1. n (|vi i) ≡ k|vi ik ≥ 0 si k|vi ik = 0 ⇒ |vi i ≡ |0i
2. n (α |vi i) ≡ kα |vi ik = |α| k|vi ik
3. k|xi + |yik ≤ k|xik + k|yik Desigualdad Triangular.
La definición de norma induce una métrica de la forma d (|xi , |yi) ≡ k|xi − |yik . Se denota en este caso
un espacio vectorial normado como (V, K,⊞; k·k) y también se le conoce como un Espacio de Banach. El
concepto de espacio vectorial normado fue formulado en 1922 de manera independiente por S. Banach4 , H.
Hahn y N Wiener
Ejemplos
1. Espacios Euclidianos reales, Rn y Espacios Euclidianos Complejos Cn
Para estos espacios de Banach, la norma se define como
q n
! 21
2 2 2 2
X 2
k|xik = |x1 | + |x2 | + |x3 | + · · · + |xn | = |xi |
i=1
p
es claro que para un espacio Euclidiano R3 se cumple que k|xik = x21 + x22 + x23 por lo tanto la idea de
norma generaliza la noción de “tamaño” del vector |xi . También es claro que la definición de distancia
se construye a partir de la norma de la forma
q
2 2 2 2
d (|xi , |yi) ≡ k|xi − |yik = |x1 − y1 | + |x2 − y2 | + |x3 − y3 | + · · · + |xn − yn |
2. Para el Espacio Lineal de matrices n × n reales o complejas con el campo K real o complejo, una
definición de norma es
Xm X n
kM k = |Mab |
a=1 b=1
y la correspondiente definición de distancia
m X
X n
d (|xi , |yi) ≡ kM − N k = |Mab − Nab |
a=1 b=1
∞
3. Para los Espacios Funcionales C[a,b] una posible definición de norma serı́a:
k|f ik = máx |f (t)|

t∈[a,b]
otra posible definición serı́a

Z ! 21
2
k|f ik = dx |f (x)|
t∈[a,b]
4 Stefan Banach (1892 Kracovia, Polonia-1945 Lvov,Ucrania) Matemático polaco, uno de los fundadores del Análisis Fun-
cional Moderno, con sus mayores contribuciones a la teorı́a de espacios topológicos. Hizo también importantes aportes a la
teorı́a de la Medida, Integración y Teorı́a de conjuntos y Series Ortogonales.

2.4. Producto Interno y Espacios de Hilbert

El siguiente paso en la construcción de espacios vectoriales más ricos es equiparlo con la definición de
producto interno y a partir de esta definición construir el concepto de norma y con éste el de distancia. La
idea de producto interno generaliza el concepto de producto escalar de vectores en R3 en incorpora a los
espacios vectoriales abstractos el concepto de ortogonalidad y descomposición ortogonal. Históricamente, la
teorı́a de espacios vectoriales con producto interno es anterior a la teorı́a de espacios métricos y espacios
de Banach y se le debe a D. Hilbert5 . En su honor, los espacios vectoriales abstractos dotados de producto
interno se denominan espacios de Hilbert. Adicionalmente, la semejanza entre la geometrı́a euclidiana y la
geométrica de Rn ha hecho que espacios en los cuales de puedan definir, distancia, ángulos, a partir de una
definición de producto interno, de denominen también espacio Euclidianos.
2.4.1. Producto Interno

En un espacio vectorial abstracto V = {|v1 i , |v2 i , |v3 i · · · |vn i} la definición del producto interno de
dos vectores se denota como hvi | vj i y es una función de
V × V → C ∋ ∀ |xi , |yi , |zi ∈ V, es decir asocia a ese par de vectores con un elemento del campo
escalar. Las propiedades que definen el producto interno son
1. hx| xi ∈R ∧ hx| xi ≥ 0 ∀ |xi ∈ V si hx| xi = 0 ⇒ |xi ≡ |0i
∗
2. hx| yi = hy| xi ∀ |xi , |yi ∈ V
3. hx| y + zi = hx| yi + hx| zi ∧ hx + z| yi = hx| yi + hz| yi ∀ |xi , |yi , |zi ∈ V
4. hx| αyi = α hx| yi ∧ hαx| yi = α∗ hx| yi ∀ |xi , |yi ∈ V ∧ α∈K
5. hx| 0i = h0| xi = 0
A partir de la definición de producto interno se construyen los conceptos de norma y distancia
p p
k|xik = hx| xi y d (|xi , |yi) ≡ k|xi − |yik = hx − y| x − yi
2.4.2. La desigualdad de Cauchy Schwarz

Todo producto interno hx| yi definido en un espacio vectorial abstracto V = {|v1 i , |v2 i , |v3 i · · · |vn i}
cumple con la desigualdad de Cauchy-Schwarz
2
|hx| yi| ≤ hx| xi hy| yi ⇐⇒ |hx| yi| ≤ k|xik k|yik
Es claro que |xi = |0i ∧ |yi = |0i se cumple la igualdad y es trivial la afirmación. Para |xi ∧ |yi
cualesquiera procedemos construyendo |zi = α |xi + β |yi con |xi ∧ |yi arbitrarios pero α y β tendrán
valores particulares, por lo tanto
hz| zi ≡ hαx + βy| αx + βyi ≥ 0
hαx + βy| αx + βyi = hαx| αxi + hαx| βyi + hβy| αxi + hβy| βyi ≥ 0
2 2
hαx + βy| αx + βyi = |α| hx| xi + α∗ β hx| yi + β ∗ α hy| xi + |β| hy| yi ≥ 0
5 David Hilbert (1862 Kaliningrad, Rusia-1943 Göttingen, Alemania) Matemático alemán defensor de la axiomática como
enfoque primordial de los problemas cientı́ficos. Hizo importantes contribuciones en distintas áreas de la matemática, como
invariantes, campos de números algebraicos, análisi funcional, ecuaciones integrales, fı́sica matemáticam y cálculo en variaciones.

si α = hy| yi se tiene que

2
hy| yi hx| xi + β hx| yi + β ∗ hy| xi + |β| ≥ 0
seguidamente seleccionamos β = − hx| yi y por lo tanto β ∗ = − hy| xi y consecuentemente
2
hy| yi hx| xi ≥ hx| yi hy| xi = |hx| yi|
De la desigualdad de Cauchy-Schwarz y la definición de norma se desprende que

2
|hx| yi| |hx| yi|
2 2 ≤1 ⇒ −1 ≤ ≤1
k|xik k|yik k|xik k|yik
por lo tanto podemos definir el “ángulo” entre los vectores abstractos |xi ∧ |yi como
|hx| yi|
cos Θ =
k|xik k|yik
Más aún, a partir de la definición de norma se obtiene
2 ∗
k|xi + |yik = hx + y| x + yi = hx| xi + hx| yi + hx| yi + hy| yi = hx| xi + 2 Re (hx| yi) + hy| yi
con lo cual hemos generalizado para un espacio vectorial abstracto el teorema del coseno
2 2 2
k|xi + |yik = k|xik + k|yik + 2 k|xik k|yik cos Θ
y para el caso que los vectores |xi ∧ |yi sean ortogonales, esto es hx| yi = 0, tendremos el teorema de
Pitágoras generalizado
2 2 2
k|xi + |yik = k|xik + k|yik
Ejemplos
1. Espacios Euclidianos reales, Rn y Espacios Euclidianos Complejos Cn . Los vectores de estos espacios
pueden ser representados por |xi = (x1 , x2 , · · · xn ) ∧ |yi = (y1 , y2 , · · · , yn ) y el producto interno
queda definido por
n
X
hx| yi = x1 y1 + x2 y2 + x3 y3 , · · · xn yn = xi yi
i=1
es claro que esta definición de producto interno coincide, para R2 y R3 con la idea de producto escalar
convencional, vale decir

ax ı̂ + ay ̂ + az k̂ 

⇒ ~a · ~b = ax bx + ay by + az bz

b ı̂ + b ̂ + b k̂ 
x y z
ahora bien, el lector puede comprobar que para vectores en R2 también se puede proveer una definición
de producto interno
~a ⊛ ~b = 2ax bx + ax by + ay bx + ay by
igualmente válida, con lo cual es claro que en un mismo espacio vectorial pueden coexistir. Por su parte
la norma v
q u n
p uX
k|xik = hx| xi = x1 + x2 + x3 , · · · + xn = t
2 2 2 2 x2i
i=1

La distancia también recupera la idea intuitiva de distancia euclidiana

p
d (|xi , |yi) ≡ k|xi − |yik = hx − y| x − yi
q
2 2 2 2
d (|xi , |yi) = (x1 − y1 ) + (x2 − y2 ) + (x3 − y3 ) + · · · + (xn − yn )
El teorema del coseno queda como
v  v 
n n n u n u n
X X X uX uX
+ 2 t x2  t
2
(xi + yi ) = x2i + yi2 y 2  cos Θ
i i
i=1 i=1 i=1 i=1 i=1
mientras que Pitágoras, queda como

n
X n
X n
X
2
(xi + yi ) = x2i + yi2
i=1 i=1 i=1
obvio que para R2 tanto el teorema del coseno como el teorema de Pitágoras retoman su forma tradi-
cional. Finalmente la desigualdad de Cauchy-Schwarz se expresa
n 2 ! n !
X Xn X
2 2
|hx| yi| ≤ k|xik k|yik ⇒ xi yi ≤ xi yi

i=1 i=1 i=1
∞
2. Para los Espacios de Funciones continuas C[a,b] una posible definición de producto interno serı́a
Z
hf | gi = dx f ∗ (x) g (x)
t∈[a,b]
de la cual se deriva la expresión para la norma

Z
2 2
k|f ik = hf | f i = dx |f (x)|
t∈[a,b]
la distancia entre funciones quedará definida como

p q
∗
d (|f i , |gi) ≡ k|f i − |gik ≡ hf − g| f − gi = hf | f i − hf | gi − hf | gi + hg| gi
sZ
2
d (|f i , |gi) = dx |f (x) − g (x)| ⇒
t∈[a,b]
v !
uZ Z Z
u
d (|f i , |gi) = t
2 2
dx |f (x)| − 2 Re dx f ∗ (x) g (x) + dx |g (x)|
t∈[a,b] t∈[a,b] t∈[a,b]
Los teoremas del coseno puede ser escrito como

Z Z Z
2 2 2
dx |f (x) + g (x)| = dx |f (x)| + dx |g (x)|
t∈[a,b] t∈[a,b] t∈[a,b]
Z ! 21 Z ! 21
2 2
+2 dx |f (x)| dx |g (x)| cos Θ
t∈[a,b] t∈[a,b]

donde R
dx f ∗ (x) g (x)
t∈[a,b]
cos Θ = 1 1
R 2 2 R 2 2
t∈[a,b]
dx |f (x)| t∈[a,b]
dx |g (x)|
y como era de esperarse el teorema de Pitágoras queda

Z Z Z
2 2 2
dx |f (x) + g (x)| = dx |f (x)| + dx |g (x)|
t∈[a,b] t∈[a,b] t∈[a,b]
para funciones f (x) y g (x) ortogonales, mientras que para este caso, la desigualdad de Cauchy-Schwarz
se expresa Z 2 Z ! Z !

∗ 2 2
dx f (x) g (x) ≤ dx |f (x)| dx |g (x)|
t∈[a,b] t∈[a,b] t∈[a,b]
2.5. Variedades Lineales

2.5.1. Dependencia, independencia lineal
Siguiendo la misma lı́nea de razonamiento generalizamos el concepto de dependencia e independencia
lineal de R2 y R3 . Ası́
n
X
|0i = C1 |v1 i + C2 |v2 i + C3 |v3 i · · · + Cn |vn i = Ci |vi i ,
i=1
Podemos afirmar que
Si esta ecuación se cumple para algún conjunto de {Ci } no nulos, se dirá que el conjunto de vectores
correspondiente {|vi i} son linealmente dependientes.
por el contrario, si esta ecuación sólo puede ser satisfecha para todos los Ci = 0, entonces se dirá que
el conjunto de vectores correspondiente {|vi i} son linealmente independientes.
Por ejemplo, dados tres vectores en R4

     
1 2 −1
 3   0   1 
|v1 i =  
 −1  ; |v2 i =  
 1 ; |v3 i =  
 0 .
2 3 0
El criterio de independencia lineal se cumple si |0i = C1 |v1 i + C2 |v2 i + C3 |v3 i y todos los {Ci } son nulos.
Esto es
C1 +2C2 −C3 = 0
3C1 +C3 = 0
−C1 +C2 = 0
2C1 +3C2 = 0
de donde es claro ver que la única solución posible implica C1 = C2 = C3 = 0.

Ejemplos Si consideramos el espacio vectorial V = {|v1 i , |v2 i , |v3 i , · · · , |vn i} serán ejemplos de inde-
pendencia lineal:
|vk i ≡ f (t) = tk para k = 1, 2, 3, · · · es claro que un polinomio dePgrado n + 1, no podrá ser expresado
n
en términos un polinomio de grado n. en otras palabras, tn+1 6= i=0 C̄i ti
|vk i ≡ f (t) = eak t con a1 , a2 , a3 , · · · coeficientes constantes. También salta a la vista que no podremos
expresar una de esas funciones exponenciales como combinación lineal
Si consideramos |v1 i ≡ f (t) = cos2 t, |v2 i = sen2 t y |v3 i = 1 es claro que |v1 i , |v2 i , y |v3 i son
linealmente dependientes por cuanto |v1 i + |v2 i = |v3 i . Nótese que si
|v1 i = cos t, |v2 i = sen t y |v3 i = 1,
entonces |v1 i , |v2 i , y |v3 i serán vectores linealmente independientes.

Consideremos ahora otros ejemplos y determinemos ¿ cuál o cuáles de los siguientes conjuntos de vectores
en P 3 son linealmente independientes ?
1. |x1i = 1; |x2i = x − 1; |x3i = x2 ; |x4i = x2 + 2x + 1;

Linealmente dependiente ya que siempre podremos expresar |x4i = 3|x1i + 2|x2i + |x3i
2. |x1i = 2x; |x2i = x2 + 1; |x3i = x + 1; |x4i = x2 − 1;
Linealmente dependiente ya que siempre podremos expresar |x4i = |x1i + |x2i − 2|x3i
3. |x1i = x(x − 1); |x2i = x; |x3i = x3 ; |x4i = 2x3 − x2 ;
Linealmente dependiente ya que siempre podremos expresar |x4i = −|x1i + |x2i + 2|x3i
2.5.2. Bases de un Espacio Vectorial

Ahora bien, dado un espacio vectorial V = {|v1 i , |v2 i , |v3 i · · · , |vn i}, encontramos que el conjunto de
{|vn i} es linealmente dependiente, entonces siempre es posible despejar uno de los vectores en términos de
los demás, vale decir
n−1
X
|vn i = C̄1 |v1 i + C̄2 |v2 i + C̄3 |v3 i · · · + C̄n−1 |vn−1 i = C̄i |vi i ,
i=1
seguidamente se procede a comprobar si {|v1 i , |v2 i , |v3 i · · · , |vn−1 i} son linealmente independientes, es
decir si C̄1 = C̄2 = C̄3 = · · · = C̄n−1 = 0. En caso de no serlo se procede otra vez a despejar uno de los
vectores en términos de los anteriores y a aplicar el criterio de independencia lineal,
n−2
X
|vn−1 i = C̃1 |v1 i + C̃2 |v2 i + C̃3 |v3 i · · · + C̃n−2 |vn−2 i = C̃i |vi i ,
i=1
¿C̃1 = C̃2 = C̃3 = · · · = C̃n−1 = 0.?
se repite este procedimiento hasta encontrar un conjunto {|v1 i , |v2 i , |v3 i · · · , |vn−j i} de vectores lineal-
mente independientes. Esto es ¡C̆1 = C̆2 = C̆3 = · · · = C̆n−j = 0.! y por lo tanto
n−j
X
|vn−j+1 i = C̆1 |v1 i + C̆2 |v2 i + C̆3 |v3 i · · · + C̆n−j |vn−i i = C̆i |vi i ,
i=1
C̆1 = C̆2 = C̆3 = · · · = C̆n−j = 0.?

¡C̆1 = C̆2 = C̆3 = · · · = C̆n−j = 0.! y por lo tanto

n−j
X
|0i = C̆1 |v1 i + C̆2 |v2 i + C̆3 |v3 i · · · + C̆n−j |vn−j i = C̆i |vi i ,
i=1
En este caso diremos que {|v1 i , |v2 i , |v3 i · · · , |vn−j i} es una base para V. La dimensión de V sera el
conjunto de vectores linealmente independientes, que para este caso es n − j. Ası́ se puede comprobar que,
dado |xi ∈ V entonces
n−j
X
|xi = Ci |vi i , ∀ |xi ∈ V
i=1
y el conjunto {C1 , C2 , C3 , · · · Cn−j } es único. Diremos que el número mı́nimo de vectores,
|v1 i , |v2 i , |v3 i · · · , |vn−j i
que expanden V conforman una base de ese espacio vectorial, y que el número finito de escalares {C1 , C2 , C3 , · · · Cn−j }
constituyen las componentes de |xi relativas a la base |v1 i , |v2 i , · · · , |vn−j i . Del ejemplo anterior se puede
concretar la siguiente definición
A un conjunto finito de vectores de un espacio vectorial,
B = {|v1 i , |v2 i , |v3 i · · · , |vn i} ∈ V,
se les denominará base de ese espacio V si los |v1 i , |v2 i , |v3 i · · · , |vn i son linealmente independientes y
expanden V. El espacio vectorial se denominará de dimensión finita sı́ la base es finita y de dimensión infinita
sı́, por el contrario su base es infinita.
Es fácil darse cuenta que si V lo expanden n vectores linealmente independientes, cualquier otro vector
|xi ∈ V será linealmente dependiente. Igualmente fácilmente demostrable que todas las bases de un espacio
vectorial V,de dimensión finita, tendrán el mismo número de elementos y ese número de elemento será la
dimensión del espacio.
Adicionalmente, puede ser que dentro de un espacio vectorial V se puedan encontrar subespacios y dentro
de esos subespacios un conjunto de vectores base. Vale decir ∀ |xi ∈ V :
|xi = C1 |v1 i · · · + Cn−j |vn−j i + Cn−j+1 |vn−j+1 i · · · Cn−k |vn−k i + Cn−k+1 |vn−k+1 i · · · Cn |vn i
| {z } | {z } | {z }
S1 S2 S3
Entonces |xi = |x1 i + |x2 i + |x3 i con |x1 i ∈ S1 ; |x2 i ∈ S2 ; |x3 i ∈ S3 , entonces diremos que V es la suma
directa de S1 , S2 y S3 y lo denotaremos como V = S1 ⊕ S2 ⊕ S3
2.5.3. El determinante de Gram

Existe una forma directa de comprobar la independencia lineal de una conjunto de vectores {|v1 i , |v2 i , |v3 i · · · , |vn i} ∈
V,y es como sigue: dado |xi ∈ V entonces


 C1 hv1 |v1 i + C2 hv1 |v2 i + C3 hv1 |v3 i + · · · + Cn hv1 |vn i = hv1 |xi
n 
 C1 hv2 |v1 i + C2 hv2 |v2 i + C3 hv2 |v3 i + · · · + Cn hv2 |vn i = hv2 |xi
X
|xi = Ci |vi i , ⇒ .. ..

 . .
i=1 

C1 hvn |v1 i + C2 hvn |v2 i + C3 hvn |v3 i + · · · + Cn hvn |vn i = hvn |xi

donde las C1 , C2 , C3 , · · · Cn son las incógnitas, por lo cual para que este sistema tenga solución se impone
que
hv1 |v1 i hv1 |v2 i hv1 |v3 i ··· hv1 |vn i

hv2 |v1 i hv2 |v2 i hv2 |v3 i ··· hv2 |vn i

.. .. .. 6= 0
. . .

hvn |v1 i hvn |v2 i hvn |v3 i ··· hvn |vn i
6
Esto es que el determinante de Gram distinto de cero implica que el conjunto
{|v1 i , |v2 i , |v3 i · · · , |vn i} ∈ V es linealmente independiente. La inversa también es cierta.
Ejemplos
Vn tendrá dimensión n y una de las posibles bases {|v1 i , |v2 i , |v3 i · · · , |vn i} será
|v1 i = (1, 0, 0, · · · , 0)
|v2 i = (0, 1, 0, · · · , 0)
|v3 i = (0, 0, 1, · · · , 0)
.. ..
. .
|vn−j i = (0, 0, 0, · · · , 1)
Esta base se conoce con el nombre de base canónica.
El
espacio de polinomios,
P n , de grado g ≤ n tendrá como una de las posibles bases al conjunto
2 3 n
1, t, t , t , · · · , t , por que cualquier polinomio de grado ≤ n podrá ser expresado como combinación
lineal de estos n+1 vectores. Más aún, el espacio de todos
los polinomios, P ∞ , tendrá como una posible
base al conjunto de funciones 1, t, t , t , · · · , t · · · . En este caso P ∞ será infinito dimensional.
2 3 n
2.5.4. Ortogonalidad y Bases Ortogonales

En una espacio con vectorial con producto interno, dos vectores |u1 i∧|u2 i serán ortogonales si su producto
interno se anula
|u1 i ⊥ |u2 i ⇔ hu2 |u1 i = 0
Se denomina un conjunto ortogonal de vectores {|u1 i , |u2 i , |u3 i · · · , |un i} si

2 δij = 0 si i 6= j
hui |uj i = δij k|uj ik i, j = 1, 2, 3, · · · , n y con
δij = 1 si i = j
2
y se denominará conjunto ortonormal si k|uj ik = 1.
Un conjunto ortogonal de vectores {|u1 i , |u2 i , |u3 i · · · , |un i} ∈ V es linealmente independiente, más
aún, para el caso particular de un espacio euclidiano, {|u1 i , |u2 i , |u3 i · · · , |un i} conforman una base orto-
gonal para V. La demostración es sencilla. Para un determinado espacio vectorial una combinación lineal de
6 Jorgen Pedersen Gram (1850-1916 Dinamarca) Matemático Danés, que alternaba su actividad de gerente de una im-
portante compañı́a de seguros con las matemáticas (Probabilidad, Análisis Numérico y Teorı́a de Números). Es conocido
mayormente por el método de ortogonalización, pero se presume que no fue él quien primero lo utilizó. Aparentemente fue
ideado por Laplace y utilizado también por Cauchy en 1836. Gram murió arrollado por una bicicleta a la edad de 61 años.

los {|u1 i , |u2 i , |u3 i · · · , |un i} se anula.

 Pn Pn

 hu1 | [Pi=1 Ci |ui i] = 0 ⇒ Pi=1 Ci δ1i = 0 ⇒ C1 = 0

 n n
X n  hu2 | [Pi=1

n
Ci |ui i] = 0 ⇒ Pi=1
n
Ci δ2i = 0 ⇒ C2 = 0
Ci |ui i = |0i ⇒ hu3 | [ i=1 Ci |ui i] = 0 ⇒ i=1 Ci δ3i = 0 ⇒ C3 = 0

 .. .. .. ..
i=1 
 . . .P .

 Pn n
hun | [ i=1 Ci |ui i] = 0 ⇒ i=1 Ci δni = 0 ⇒ Cn = 0
con lo cual es claro que {|u1 i , |u2 i , |u3 i · · · , |un i} son linealmente independientes. Si la dimensión de V, es
n, dim V = n y tenemos n vectores linealmente independientes, entonces esos n vectores {|u1 i , |u2 i , |u3 i · · · , |un i}
forman una base ortogonal para V,y por lo tanto las componentes de un vector en esa base se pueden expresar
de manera simple.
n
" n #
X X huj |xi
∀ |xi ∈ V |xi = Ci |ui i ⇒ huj |xi = huj | Ci |ui i ⇒ Cj =
i=1 i=1
hu j |uj i
2
En el caso de un conjunto ortonormal de vectores {|e1 i , |e2 i , |e3 i · · · , |en i} ∈ Vn con k|ej ik = 1, las
componentes de cualquier vector quedan determinadas de una forma todavı́a más simple y con consecuencias
mucho más impactantes
n n n
!
2
X X X
k|ej ik = 1 ⇒ Cj = hej |xi ⇒ |xi = Ci |ei i = hei |xi |ei i ≡ |ei i hei | |xi
i=1 i=1 i=1
| {z }
1
por lo tanto es bueno recalcar la relación de cierre

n
X
|ei i hei | = 1
i=1
con lo cual es trivial demostrar la fórmula de Parseval.

n
! n n
X X X ∗
∀ |xi |yi ∈ V hy |xi ≡ hy| |ei i hei | |xi = hy| |ei i hei | |xi = hy| |ei i hx| |ei i
i=1 i=1 i=1
la cual se concreta para el caso de |xi ≡ |yi en la generalización del Teorema de Pitágoras
n
X
2 2
hx |xi ≡ k|xik = |hx| |ei i|
i=1
Ejemplos
Funciones Trigonométricas: Uno de los ejemplos más emblemáticos es el caso de las funciones continuas,
∞
reales de variable real y definidas en [0, 2π], C[0,2π] , con lo cual el producto interno viene definido por
R 2π
hf | gi = 0 dx f (x) g (x) ésto es el conjunto de funciones {|u1 i , |u2 i , |u3 i , · · · , |un i · · · } represen-
tadas por
|u0 i = 1, |u2n−1 i = cos nx y |u2n i = sen nx, con n = 1, 2, 3, · · ·

Es claro que {|u1 i , |u2 i , |u3 i · · · , |un i , · · · } es un conjunto de funciones ortogonales por cuanto
  R 2π

 
 R0 dx sen nx sen mx = 0



 0 si n = 6 m 2π
dx cos nx sen mx = 0

  R 0

  2π dx cos nx cos mx = 0

 0


 
2 R 2π
hun |um i = δnm k|un ik ⇒ 
 dx = 2π si n = m = 0

 
 0

 
 R

 2

 k|un ik si n = m 2π
dx cos2 nx = π si i = j = 2l − 1

  0

 

 

  R 2π dx sen2 nx = π si i = j = 2l

0
con l = 1, 2, 3, · · · también. Por lo tanto, podremos construir una base ortonormal de funciones
{|e1 i , |e2 i , |e3 i , · · · , |en i , · · · } de la forma
1 1 1
|e0 i = √ , |e2n−1 i = √ cos nx y |e2n i = √ sen nx.
2π π π
Por lo tanto cualquier función definida en el intervalo [0, 2π] puede expresarse en términos de esta base
como
 R 2π

 dx √12π f (x) = a0 si i = 0
 0

∞ 

X R 2π
|f i = Ci |ei i ⇒ Ci = hei |f i = dx f (x) cos nx = a2n−1 si i = 2n − 1

 0
i=1 


 R 2π
0
dx f (x) sen nx = a2n si i = 2n
donde los Ci son los coeficientes de Fourier

Otro de los ejemplos tı́picos lo constituye los llamados polinomios de Legendre. Polinomios Pn (x)
definidos en el intervalo [−1, 1] y generados a partir de la Fórmula de Rodrigues7
1 dn 2
Pn (x) = (x − 1)n , n = 0, 1, 2, .....
n!2n dxn
con P0 (x) = 1. Los polinomios de Legendre son solución de la ecuación diferencial
(1 − x2 ) y ′′ − 2x y ′ + λ(λ + 1) y = 0
λ Ecuación de Legendre Solución

0 (1 − x2 ) y ′′ − 2x y ′ = 0 y0 (x) = 1
1 (1 − x2 ) y ′′ − 2x y ′ + 2 y = 0 y1 (x) = x
2 (1 − x2 ) y ′′ − 2x y ′ + 6 y = 0 y0 (x) = 1 − 3x2
3 (1 − x2 ) y ′′ − 2x y ′ + 12 y = 0 y1 (x) = x − 53 x3
4 (1 − x2 ) y ′′ − 2x y ′ + 20 y = 0 y0 (x) = 1 − 10x2 + 35 3 x
4
Es fácil comprobar que los polinomios de Legendre |Pα i = Pα (x) son mutuamente ortogonales con un
7 Benjamin Olinde Rodrigues (1794 Burdeos, Francia - 1851, Parı́s Francia) Banquero, Matemático y activista polı́tico
solcialista Francés durante la Revolución Francesa. De origen judı́o, y cuyas contribuciones fundamentales como la fórmula para
la generación de Polinomios de Legendre, permanecieron olvidadas por mucho tiempo.

producto interno definido como

Z 1
2
hPn |Pm i = Pn (x)Pm (x)dx = δnm
−1 2n + 1
con norma definida por Z 1
2 2
kPn k = hPn |Pn i = Pn2 (x)dx=
ˇ
−1 2n + 1
Cualquier función en el intervalo [−1, 1] puede ser expresada en esa base.
∞
X ∞
X hPk |Fi
f (x) = |Fi = ak |Pk i = |Pk i
hPk |Pk i
k=0 k=0
Varios ejemplos ilustrarán esta aplicación. Si f (x) es un polinomio

m
X ∞
X ∞
X
f (x) = bn xn = ak |Pk i = an Pn (x)
n=0 k=0 n=0
no se requiere hacer ninguna integral por cuanto los coeficientes an se determinan a través de un
sistema de ecuaciones algebraicas. Para el caso de f (x) = x2 tendremos
f (x) = x2 = a0 P0 (x) + a1 P1 (x) + a2 P2 (x)

1
f (x) = x2 = a0 + a1 x + a2 (3x2 − 1)
2
1 2
f (x) = x2 = P0 (x) + P2 (x)
3 3
Quedará como ejercicio demostrar que para el caso de
r ∞ ∞
1 − x X hPk |Fi 2 X Pn (x)
f (x) = = |Pk i = P0 (x) − 2
2 hPk |Pk i 3 n=1
(2n − 1) (2n + 3)
k=0
con Z Z r
1 1
1−x
hPk |Fi = f (x)Pk (x)dx = Pk (x)dx
−1 −1 2
2.5.5. Ortogonalización
Hemos visto que un conjunto de vectores ortogonales forman base para un espacio vectorial. Ahora
bien, siempre es posible construir un conjunto de vectores ortogonales a partir de un conjunto de vectores
linealmente independientes. Es método de “ortogonalización” se conoce como el método de Gram-Schmidt8 ,
en honor de estos dos matemáticos alemanes que NO inventaron el método, el cual al parecer se le debe al
matemático francés P.S. Laplace.
Dado un conjunto de vectores linealmente independientes, {|v1 i , |v2 i , |v3 i , · · · , |vn i} que expanden un
espacio Euclidiano de dimensión finita, E n . Entonces siempre se puede construir un conjunto ortogonal de
vectores, {|u1 i , |u2 i , |u3 i , · · · , |un i} que también expandan E n de la siguiente forma:
8 Erhard Schmidt (1876, Estonia-1959 Alemania). MatemáticoAlemán fundador del primer instituto de matemáticas apli-
cadas de Berlı́n. Alumno de Hilbert, Schmidt hizo sus mayores contribuciones en Ecuaciones Integrales y Teorı́a de Funciones
en el Espacio de Hilbert.

|u1 i ≡ |v1 i
hv2 |u1 i
|u2 i ≡ |v2 i − hu1 |u1 i |u1 i ∋ hu2 |u1 i = 0

hv3 |u2 i hv3 |u1 i hu3 |u1 i = 0
|u3 i ≡ |v3 i − |u2 i − |u1 i ∋
hu2 |u2 i hu1 |u1 i hu3 |u2 i = 0

 hu4 |u1 i = 0
hv4 |u3 i hv4 |u2 i hv4 |u1 i
|u4 i ≡ |v4 i − hu3 |u3 i |u3 i − hu2 |u2 i |u2 i − hu1 |u1 i |u1 i ∋ hu4 |u2 i = 0

hu4 |u3 i = 0
.. ..
. . 

 hu4 |u1 i = 0



 hu4 |u2 i = 0
Pn−1 hvn |ui i hu4 |u3 i = 0
|un i ≡ |vn i − i=1 hui |ui i |ui i ∋

 ..

 .


hu4 |un−1 i = 0
Ası́ siempre es posible construir una base ortonormal a partir de un conjunto de vectores linealmente
independientes. Esta base ortogonal será única en E n , si existe otra sus vectores serán proporcionales, Más
aún, cada espacio vectorial Vn de dimensión finita tendrá una base ortogonal asociada.
Ejemplos
El subespacio de V4 expandido por los siguientes vectores

     
1 2 −1
 3   0   1 
|v1 i =   
 −1  ; |v2 i =  1  ;
 |v3 i =  
 0 .
2 3 0

Tendrá una base ortogonal asociada dada por

 
−1
 1 
|u1 i ≡ |v3 i =  
 0 ;
0
    
2 −1 1
hv2 |u1 i  0   1   1 
|u2 i ≡ |v2 i − 
|u1 i =   
− (−1)   =  
hu1 |u1 i 1  0   1 
3 0 3
hv1 |u2 i hv1 |u1 i

|u3 i ≡ |v1 i − |u2 i − |u1 i =
hu2 |u2 i hu1 |u1 i
 5

4
       
1 1 −1  5 
 
 3  9  1   1   4 
|u3 i ≡   
 −1  − 12 
 − (1)  =
 0   7
;

1   − 
2 3 0  4 
 
− 14
y la base ortonormal asociada será
   
√ ! −1 √ ! 1
|u1 i 2  
 1  .; |u2 i 12  1 
 
|e1 i = p =  |e2 i = p =  1 ;
hu1 |u1 i 2 0  hu2 |u2 i 12
0 3
 5

4
 
 
√ ! 5 
|u3 i 2 3 

4 

|e3 i = =  
hu3 |u3 i 9  −7 
 4 
 
− 14
Para el caso de R2 es muy claro. Si tenemos dos vectores |v1 i y |v2 i linealmente independientes,

1 0
|v1 i = ; |v2 i = ;
1 1
elegimos |u1 i ≡ |v2 i entonces, |u2 i vendrá dado por

hv1 |u1 i 1 0 1
|u2 i ≡ |v1 i − |u1 i ⇒ |u2 i ≡ − =
hu1 |u1 i 1 1 0
tal y como se esperaba, el otro vector ortogonal es el canónico.

Si consideramos el espacio de polinomios, P n , de grado g ≤ n definidos

en el intervalo [−1, 1] Este
espacio vectorial tendrá como una de las posibles bases al conjunto 1, t, t2 , t3 , · · · , tn con el producto
R1
interno viene definido por hf | gi = −1 dx f (x) g (x) . Por lo tanto, se procede a construir una base
ortogonal de la forma
|u0 i ≡ |v0 i = 1
hv1 |u0 i
|u1 i ≡ |v1 i − |u0 i = t
hu0 |u0 i
R1 R1
hv1 |u0 i = −1
dx t = 0; hu0 |u0 i = −1
dx = 2
hv2 |u1 i hv2 |u0 i 1

|u2 i ≡ |v2 i − |u1 i − |u0 i = t2 − 3
hu1 |u1 i hu0 |u0 i
R1 R1
hv2 |u0 i = −1
dx t2 = 32 ; hv2 |u1 i = −1
dx t3 = 0;
R1 2
hu1 |u1 i = −1
dx t2 = 3
hv3 |u2 i hv3 |u1 i hv3 |u0 i

|u3 i ≡ |v3 i − |u2 i − |u1 i − |u0 i = t3 − 53 t
hu2 |u2 i hu1 |u1 i hu0 |u0 i
R1 R1 2
hv3 |u0 i = −1
dx t3 = 0; hv3 |u1 i = −1
dx t4 = 5
R1 1
R1
1 2 8
hv3 |u2 i = −1
dx t3 t2 − 3 = 0; hu2 |u2 i = −1
dx t2 − 3 = 45
..
.
Podemos resumir
|v1 i |u1 i |e
q1 i
1
1 1 2
q
3
t t 2t
q
1 1 5
t2 t2 − 3 2q 2 3t2 − 1

t3 t3 − 35 t 1 7
5t3 − 3t
q2 2

t4 t4 − 76 t2 + 3
35
1
8
9
2 35t4 − 30t2 + 3
.. .. ..
. . .
2.5.6. Complementos Ortogonales.

Sea un subespacio S ⊂ V un elemento |v̄i i ∈ V se dice ortogonal a S si hsk |v̄i i = 0 ∀ |sk i ∈ S, |v̄i i
es decir, es ortogonal a todos los elementos de S . El conjunto {|v̄1 i , |v̄2 i , |v̄3 i , · · · , |v̄m i} de todos los
elementos ortogonales a S,se denomina S−perpendicular y se denota como S⊥ . Es fácil demostrar que S⊥
es un subespacio, aún si S no lo es.

2.5.7. Descomposición ortogonal

Dado {|v1 i , |v2 i , |v3 i , · · · , |vn i , · · · } un Espacio Euclidiano V y un subespacio de V con dimensión
finita, S ⊂ V y dim V = m. Entonces ∀ |vk i ∈ V se puede expresar como suma de dos vectores |sk i ∈
⊥
S ∧ |sk i ∈ S⊥ . Esto es
⊥ ⊥
|vk i = |sk i + |sk i |sk i ∈ S ∧ |sk i ∈ S⊥
Más aún, la norma de |vk i se calcula a través del teorema de Pitágoras generalizado
2
2 2 ⊥
k|vk ik = k|sk ik + |sk i
⊥
La demostración es sencilla. Primero se prueba que la descomposición ortogonal |vk i = |sk i + |sk i
es siempre posible. Para ello recordamos que S ⊂ V es de dimensión finita, por lo tanto existe una base
⊥
ortonormal {|e1 i , |e2 i , |e3 i · · · |em i} para S. Esto es, dado un |vk i definimos los elementos |sk i y |sk i
como siguen
Xm
⊥
|sk i = hvk |ei i |ei i ∧ |sk i = |vk i − |sk i
i=1
Nótese que hvk |ei i |ei i es la proyección de |vk i a lo largo de |ei i y |sk i se expresa combinación lineal de la
base de S. Por lo tanto está en S. Por otro lado,
 
Xm
⊥
⊥
hsk |ei i = hvk −sk |ei i = hvk |ei i − hsk |ei i = hvk |ei i −  hvk |ej i hej  |ei i = 0 ⇒ |sk i ⊥ |ej i
j=1
⊥
lo cual indica que |sk i ∈ S⊥ .
⊥
Pero, podemos ir un poco más allá. La descomposición |vk i = |sk i + |sk i es única en V. Para ello
suponemos que existen dos posibles descomposiciones, vale decir
⊥ ⊥ ⊥ ⊥
|vk i = |sk i + |sk i ∧ |vk i = |tk i + |tk i con |sk i ∧ |tk i ∈ S ∧ |sk i ∧ |tk i ∈ S⊥
Por lo tanto

⊥ ⊥ ⊥ ⊥
|vk i − |vk i = |sk i + |sk i − |tk i + |tk i =0 ⇒ |sk i − |tk i = |tk i − |sk i
⊥ ⊥
Pero |sk i−|tk i ∈ S,por lo tanto ortogonal a todos los elementos de S⊥ y |sk i−|tk i = |tk i −|sk i con lo cual
|sk i − |tk i ≡ |0i que es el único elemento que es ortogonal a el mismo y en consecuencia la descomposición
⊥
|vk i = |sk i + |sk i es única. Finalmente, con la definición de norma
2 2
2 ⊥ ⊥ ⊥ ⊥ 2 ⊥
k|vk ik = |sk i + |sk i = hsk | + hsk | |sk i + |sk i = hsk |sk i +⊥ hsk |sk i k|sk ik + |sk i
Ası́, dado Sm un subespacio de V de dimensión finita y dado un |vk i ∈ V el elemento

m
X
|sk i ∈ S ∋ |sk i = hvk |ei i |ei i
i=1
será la proyección de |vk i en S.

Dado un vector |xi ∈ V y un subespacio de V con dimensión finita, Sm ⊂ V y dim V = m, entonces la
distancia de |xi a Sm es la norma de la componente de |xi , perpendicular a Sm .

2.6. Temas Avanzados

2.6.1. Aproximación de Funciones
Sea {|v1 i , |v2 i , |v3 i , · · · , |vn i , · · · } un Espacio Euclidiano V y un subespacio de V con dimensión
finita, Sm ⊂ V y dim V = m,y sea un elemento |vi i ∈ V. La proyección de |vi i en Sm , |si i , será el elemento
de Sm más próximo a |vk i. En otras palabras
k|vi i − |si ik ≤ k|vi i − |ti ik ∀ |ti i ∈ S
La demostración se sigue ası́

2 2 2
|vi i − |ti i = (|vi i − |si i) − (|si i − |ti i) ⇒ k|vi i − |ti ik = k|vi i − |si ik + k|si i − |ti ik
⊥
ya que |vi i − |si i = |sk i ∈ S⊥ ∧ |si i − |ti i ∈ S.y vale el teorema de Pitágoras generalizado Ahora bien,
como
2 2 2
k|si i − |ti ik ≥ 0 ⇒ k|vi i − |ti ik ≥ k|vi i − |si ik ⇒ k|vi i − |ti ik ≥ k|vi i − |si ik
Ejemplos
Desarrollemos la aproximación de funciones continuas, reales de variable real y definidas en [0, 2π],
∞
R 2π
C[0,2π] , mediante funciones Trigonométricas y con el producto interno definido por hf | gi = 0 dx f (x) g (x) .
Hemos visto que para este espacio vectorial tenemos una base ortonormal definida por
1 1
|e0 i = ϕ0 (x) = √ , |e2n−1 i = ϕ2n−1 (x) = √ cos nx y
2π π
1
|e2n i = ϕ2n (x) = √ sen nx.
π
como
∞
X
|f i = Ci |ei i con
i=1
 R 2π

 dx f (x) = a0 si i=0

 0
Z 2π 
 R
2π
Ci = hei |f i = dx f (x) ϕi (x) = dx f (x) cos nx = a2n−1 si i = 2n − 1
0 

0


 R 2π dx sen nx f (x) = a

si i = 2n
0 2n
donde los Ci son los coeficientes de Fourier. Es decir, cualquier función puede ser expresada como una
serie de Fourier de la forma
Xn
1
f (x) = a0 + (ak cos kx + bk sen kx)
2
k=1
con Z Z
2π 2π
1
ak = dx f (x) cos kx ∧ bk = dx f (x) sen kx f (x)
π 0 0

Es claro que para la aproximación de funciones por funciones Trigonométricas cuyos coeficientes son
los coeficientes de Fourier constituyen la mejor aproximación. Por lo tanto, de todas las funciones
∞
P (x) ∈ C[0,2π] las funciones trigonométricas, T (x) minimizan la desviación cuadrática media
Z 2π Z 2π
2 2
dx (f (x) − P (x)) ≥ dx (f (x) − T (x))
0 0
2.6.2. El Método de Mı́nimos Cuadrados

Una de las aplicaciones más importantes en la aproximación de funciones es el método de mı́nimos
cuadrados. La idea es determinar el valor más aproximado de una cantidad fı́sica, c a partir de un conjunto
de medidas experimentales: {x1 , x2 , x3 , · · · xn } . La intención es encontrar en el mejor valor de c a partir de
ese conjunto de datos experimentales.
Para ello asociamos el conjunto de medidas {x1 , x2 , x3 , · · · xn } con las componentes de un vector |xi en
Rn . Ası́
|xi = (x1 , x2 , x3 , · · · xn ) ∧ c |yi = (c,c,c, · · · c)
Por lo tanto si la mejor aproximación de c|yi ,que llamaremos c’|yi ,será la proyección perpendicular de |xi
(las medidas) sobre el subespacio generado por |yi . Esto es
hx |yi x1 + x2 + x3 , · · · + xn
c′ = =
hy |yi n
que no es otra cosa que el promedio aritmético de las medidas. Es claro que la proyección perpendicular de
|xi sobre |yi hace mı́nimo la distancia entre el subespacio perpendicular generado por |yi y el vector |xi .Es
decir hace mı́nimo el cuadrado de esa distancia
n
X
2 2
[d (|xi , c′ |yi)] = hx−c′ y |x−c′ yi = (xi − c′ )
i=1
Es claro que este problema se puede generalizar si se desea medir dos (o n) cantidades. Para el caso de dos
cantidades extendemos la dimensión del espacio. Por lo tanto, los resultados experimentales se acumularán
en un vector de 2n dimensiones
|xi = (x11 , x12 , x13 , · · · x1n , x21 , x22 , x23 , · · · x2n )
mientras que los vectores que representan las cantidades más aproximadas serán
 
c′1 |y1 i = c′1 ,c′1 ,c′1 , · · · c′1 ,0, 0, 0, · · · 0 ∧ c′2 |y2 i = (0, 0, 0, · · · 0, c′2 ,c′2 ,c′2 , · · · c′2 )
| {z } | {z }
n n
Ahora {|y1 i , |y2 i} expanden un subespacio vectorial sobre el cual |xi tiene como proyección ortogonal
c′1 |y1 i +c′2 |y2 i y consecuentemente |x−c′1 y1 −c′2 y2 i será perpendicular a {|y1 i , |y2 i} , por lo tanto
hx |y1 i x11 + x12 + x13 , · · · + x1n hx |y2 i x21 + x22 + x23 , · · · + x2n
c′1 = = ∧ c′2 = =
hy1 |y1 i n hy2 |y2 i n
La consecuencia más conocida de esta aproximación de funciones es el “ajuste” de un conjunto de datos
experimentales {(x1 , y1 ) , (x2 , y2 ) , (x3 , y3 ) , · · · , (xn , yn )} a la ecuación de una recta y =cx. En este caso, el
planteamiento del problema se reduce a encontrar el vector c′ |xi en el subespacio S (|xi) esté lo más cercano
2
posible al vector |yi = c |xi . Por lo tanto k|c′ x − yik será lo menor posible y |c′ x − yi ser[ perpendicular
a S (|xi) ,por lo tanto
hx |yi x1 y1 + x2 y2 + x3 y3 · · · + xn yn
hx |c′ x − yi = 0 ⇒ c′ = =
hx |xi x21 + x22 + x23 , · · · + x2n

Ejemplo Si el conjunto de datos experimentales es {(1, 2) , (3, 2) , (4, 5) , (6, 6)} ¿ cuál es la recta que ajusta
más acertadamente a estos puntos ? La ecuación queda como
   
2 1
 2   3  hx |yi 2 + 6 + 20 + 36 32
|yi = c |xi ⇒     ′
 5  = c  4  ⇒ c = hx |xi = 1 + 9 + 16 + 36 = 31
6 6
Ahora bien, se puede generalizar esta procedimiento cuando se tiene que una cantidad y que es una
combinación lineal desconocida de un conjunto de cantidades
y = c1 x1 + c2 x2 + c3 x3 + · · · + cm xm
En este caso se ejecutarán n experimentos con n > m y el conjunto de medidas experimentales serán
(y1 , x11 , x12 , x13 , · · · x1m ; y2 , x21 , x22 , x23 , · · · x2m ; y3 , x31 , x32 , x33 , · · · x3m ; · · · yn , xn1 , xn2 , xn3 , · · · xnm )
y a partir de ellas generamos el siguiente sistema de ecuaciones
y1 = c′1 x11 + c′2 x12 + c′3 x13 , · · · + c′m x1m

y2 = c′1 x21 + c′2 x22 + c′3 x23 , · · · + c′m x2m
y3 = c′1 x31 + c′2 x32 + c′3 x43 , · · · + c′m x4m
..
.
yn = c′1 xn1 + c′2 xn2 + c′3 xn3 , · · · + c′m xnm
en el cual las incógnitas {c′1 ,c′2 ,c′3 , · · · c′m } hacen que el lado derecho de las ecuaciones antes mencionadas
sean los más próximas a las {y1 , y2 , y3 , · · · yn } por lo tanto si consideramos los vectores
|x1 i = (x11 , · · · x1n ) ; |x2 i = (x21 , · · · x2n ) ; · · · |xm i = (xm1 , · · · xmn ) ; |yi = (ym1 , · · · yn )
por lo tanto los {|x1 i , |x2 i , · · · |xm i} expanden el subespacio S (|x1 i , |x2 i , · · · |xm i) donde está la aproxima-
ción de |yi . Por lo tanto la distancia de este subespacio al vector |yi, será mı́nimo. Esto es
2
[d (S (c′i |xi i) , |yi)] = hS (c′i |xi i) −y |S (c′i |xi i) −yi
y por lo tanto |S (c′i |xi) −yi será ortogonal a

m +
X
′ ′
hxj |S (ci |xi) −yi ≡ hxi ci |xi −y = 0 ∀ i, j = 1, 2, 3, · · · m

i=1
por lo tanto podemos construir el sistema de ecuaciones normales para la aproximación que hemos conside-
rado:
c′1 hx1 |x1 i + c′2 hx1 |x2 i + c′3 hx1 |x3 i + · · · + c′m hx1 |xm i = hx1 |yi
c′1 hx2 |x1 i + c′2 hx2 |x2 i + c′3 hx2 |x3 i + · · · + c′m hx2 |xm i = hx2 |yi
.. ..
. .
c′1 hxm |x1 i + c′2 hxm |x2 i + c′3 hxn |x3 i + · · · + c′m hxm |xm i = hxn |yi
donde, tal y como se ha señalado, las incógnitas son las {c′1 ,c′2 ,c′3 , · · · c′m }

Ejemplos
Se sospecha que una determinada propiedad de un material cumple con la ecuación y = ax1 + bx2 . Si
al realizar un conjunto de medidas experimentales obtenemos
               
y1 15 y2 12 y3 10 y4 0
 x11  =  1  ;  x21  =  2  ;  x31  =  1  ;  x41  =  1 
x12 2 x22 1 x32 1 x42 −1
Es claro que tenemos un subespacio de m = 2 dimensiones y hemos hecho n = 4 veces el experimento.

Por lo tanto los vectores considerados arriba serán
|x1 i = (1, 2, 1, 1) ; |x2 i = (2, 1, 1, −1) ; |yi = (15, 12, 10, 0)
por lo tanto  
 a= 45

7a +4b = 49 11
⇒ ⇒ 11y = 45x1 + 56x2
4a +7b = 52  56 
b= 11
Se puede extender el razonamiento anterior y generar un ajuste linear cuadrático. Esto es, el ajuste
lineal es en los coeficiente, pero la funcionalidad de la ley a la cual queremos ajustar los datos puede
ser un polinomio de cualquier orden. Ese es el caso de una parábola que ajusta al siguiente conjunto
de puntos
{(0, 1) , (1, 3) , (2, 7) , (3, 15)} ⇔ y = ax2 + bx + c
Las ecuaciones toman la forma de
1= 0 +0 +c
3 = a +b +c
7 = 4a +2b +c
15 = 9a +3b +c
y los vectores construidos a partir de los datos experimentales serán
|x1 i = (0, 1, 4, 9) ; |x2 i = (0, 1, 2, 3) ; |x3 i = (1, 1, 1, 1) ; |yi = (1, 3, 7, 15)
las ecuaciones normales para este sistema son

 
 
 a = −6 


 

136 = 98a +36b +14c    113 32
62 = 36a +14b +6c ⇒ b = 113
5 ⇒ y = −6x2 + x−
 
 
 5 5
26 = 14a +6b +4c 
 

 
c = − 32
5
Ejercicios Al medir la temperatura a lo largo de una barra material obtenemos los siguientes valores
xi (cm) 1, 0 2, 0 3, 0 4, 0 5, 0 6, 0 7, 0 8, 0 9, 0
Ti (◦ C) 14, 6 18, 5 36, 6 30, 8 59, 2 60, 1 62, 2 79, 4 99, 9
Encuentre, mediante el método de los mı́nimos cuadrados los coeficientes que mejor ajustan a una recta
T = ax + b

2.7. Algunos Ejemplos Resueltos

1. Consideramos el espacio vectorial de polinomios, , de grado g ≤ n definidos en el intervalo [0, 1] o en
el intervalo [−1, 1] según el caso
a) Consideramos el espacio vectorial de polinomios, , de grado g ≤ n definidos en el intervalo [0, 1] o
en el intervalo [−1, 1] según el caso ¿ Cuál o cuáles de los siguientes conjuntos de vectores en P 3
son linealmente independientes ? Explique por qué
Ninguno, todos son linealmente dependientes
1) |x1i = 1; |x2i = x − 1; |x3i = x2 ; |x4i = x2 + 2x + 1;
Linealmente dependiente ya que siempre podremos expresar |x4i = 3|x1i + 2|x2i + |x3i
2) |x1i = 2x; |x2i = x2 + 1; |x3i = x + 1; |x4i = x2 − 1;
Linealmente dependiente ya que siempre podremos expresar |x4i = |x1i + |x2i − 2|x3i
3) |x1i = x(x − 1); |x2i = x; |x3i = x3 ; |x4i = 2x3 − x2 ;
Linealmente dependiente ya que siempre podremos expresar |x4i = −|x1i + |x2i + 2|x3i
b) Considerando las siguientes definiciones de producto interior en P n :definidos en el intervalo [0, 1]
o en el intervalo [−1, 1] según el caso
Z 1 Z 1
hqn |pn i = p(x)q(x)dx y hqn |pn i = p(x)q(x)dx
−1 0
En P 3 encontrar la distancia y el ángulo entre los vectores
|x1i = x(x − 1); |x2i = x;
En general la definición de distancia es

p
d (|x1i, |x2i) = hx2 − x1 |x2 − x1i
R1
por lo tanto para hqn |pn i = −1
p(x)q(x)dx la distancia será
sZ
p 1
2 1√
hx2 − x1 |x2 − x1i = (x(x − 1) − x) dx = 690
−1 15
R1
y para hqn |pn i = 0
p(x)q(x)dx ser’a
s
p Z 1
2 2√
hx2 − x1 |x2 − x1i = (x(x − 1) − x) dx = 30
0 15
los ángulos serán !

hx1 |x2i
θ = arc cos p p
hx1 |x1i hx2 |x2i

R1
para hqn |pn i = −1
p(x)q(x)dx
!  R1 
hx1 |x2i (x(x − 1)) (x) dx
−1
θ = arc cos p p = arc cos  qR qR 
hx1 |x1i hx2 |x2i 1
(x(x − 1))
2
dx
1
(x)
2
dx
−1 −1

1√ √
θ = arc cos − 15 6 = 2,4825 rad
12
R1
para hqn |pn i = 0
p(x)q(x)dx
!  R1 
hx1 |x2i (x(x − 1)) (x) dx
θ = arc cos p p = arc cos  qR 0
qR 
hx1 |x1i hx2 |x2i 1 2 1
(x(x − 1)) dx 0 (x) dx
2
0

1√ √
θ = arc cos − 15 2 = 2,4825 rad
12
¡ el mismo ángulo !

c) Una de las posibles bases de P n será el conjunto 1, x, x2 , x3 , · · · , xn con el producto interno
R1
viene definido por hf | gi = 0 dx f (x) g (x) .
1) Encuentre la base ortonormal que expande el subespacio S 3 de los polinomios, P n , de grado
g ≤ 3.
S 3 tendrá como vectores linealmente independientes 1, x, x2 , x3 para encontrar la base or-
tonormal utilizamos el método de Gram Smith con lo cual tendremos que
n−1
X hvn |ui i
|un i ≡ |vn i − |ui i
i=1
hui |ui i
esto es
|v1 i 1
|u1 i = p = qR =1
hu1 |u1 i 1
dx
0
R1
hv2 |u1 i xdx
|v2 i − hu |u1 i x − R0 1 dx x − 12 1 √
1 |u1 i
|u2 i = p =p 0
= qR = 2 x − 3
hu2 |u2 i hu2 |u2 i 1 1 2 2
0
x − 2 dx
R1 2 R1 √
x dx x2 (2(x− 21 ) 3)dx 1
√
|v3 i − hv3 |u1 i
|u1 i − hv3 |u2 i
|u2 i x2 − 0
R1 − 0
R1 √ 2 2 x− 2 3
0 ( (
hu1 |u1 i hu2 |u2 i 0
dx 2 x− 12 ) 3) dx
|u3 i = p = p
hu3 |u3 i hu3 |u3 i
1
x2 + 6 −x 1 √
2
|u3 i = qR 2 =6 x + −x 5
1 1 6
0
x2 + 6 − x dx

hv4 |u1 ihv4 |u2 i hv4 |u3 i

|v4 i − |u1 i − hu
hu1 |u1 i |u i |u2 i − hu3 |u3 i |u2 i
|u4 i = p 2 2 =
hu4 |u4 i
R1 R √ √
1
x3 − 0 x3 dx − 0 x3 2 x − 21 3 dx 2 x − 21 3
|u4 i = p
hu4 |u4 i
R √ √
1 3
0
x 6 x2 + 16 − x 5 dx 6 x2 + 16 − x 5
− p
hu4 |u4 i
1 3 3 2

3
x − 20 + 5 x − 2 x 3 1 3 3 2 √
|u4 i = qR 2 = 20 x − + x− x 7
1 1 20 5 2
0
x3 − 20 + 53 x − 32 x2 dx
2) Encuentre las componentes del polinomio g (x) = 5 + 3x2 − x3 + x5 proyectado sobre esa base
ortonormal que expande a S 3
Las componentes de la proyección de g (x) en S 3 serı́an
Z 1 Z 1
71
c1 = hg |u1 i = u1 (x) g (x) dx = (1) 5 + 3x2 − x3 + x5 dx =
0 0 12
Z 1 Z 1
2 1 √ 197 √
c = hg |u2 i = u2 (x) g (x) dx = 2 x− 3 5 + 3x2 − x3 + x5 dx = 3
0 0 2 420
Z 1 Z 1
1 √
c3 = hg |u3 i = u3 (x) g (x) dx = 6 x2 + − x 5 5 + 3x2 − x3 + x5 dx
0 0 6
23 √
= 5
210
Z 1
c4 = hg |u4 i = u4 (x) g (x) dx
0
Z 1
√

1 3 3 4 √
= 20 x3 − + x − x2 7 5 + 3x2 − x3 + x5 dx = 7
0 20 5 2 315
con lo cual
71 197 √ 23 √ 4 √
|giS 3 = |u1 i + 3 |u2 i + 5 |u3 i + 7 |u4 i
12 420 210 315
y la norma será
2 2 2 2
2 71 197 √ 23 √ 4 √ 1,418,047 ∼
k|giS 3 k = + 3 + 5 + 7 = = 35,728
12 420 210 315 39,690
para que, finalmente la proyección del polinomio en S 3 será

71 197 √ 1 √ 23 √ 2 1 √ 3 1 3 3 2 √
gS 3 (x) = + 3 2 x− 3 + 5 6 x + −x 5 + 20 x − + x− x 7
12 420 2 210 6 20 5 2

71 197 1 23 1 √ 1 3 3
gS 3 (x) = + x− + x2 + − x + 20 7 x3 − + x − x2
12 70 2 42 6 20 5 2
es decir

5797 √ 34 √ 23 √ √
gS 3 (x) = − 7+ + 12 7 x + − 30 7 x2 + 20 7x3
1260 15 42

3) Encuentre la mı́nima distancia desde el subespacio S 3 al polinomio g (x)

La distancia mı́nima será la norma del vector ortogonal a S 3 tal que
|gi = |giS 3 + |gi⊥S 3 donde |giS 3 ∈ S 3
y |gi⊥S 3 es un vector de su complemento ortogonal. Por lo tanto el Teorema de Pitágoras nos

dice que
2 2 2
k|gik = k|giS 3 k + k|gi⊥S 3 k
con lo cual tendremos que la mı́nima distancia será
q
2 2
k|gi⊥S 3 k = k|gik − k|giS 3 k
Z 1
2 2 495193
k|gik = 5 + 3x2 − x3 + x5 dx =
0 13860
2 1418047
k|giS 3 k =
39690
con lo cual r
495193 1418047
k|gi⊥S 3 k = − ≈ 1,196 5 × 10−2
13860 39690
d ) Sea f (x) = e2x una función perteneciente al espacio lineal de funciones continua y continuamente
∞
R1
diferenciables, C[−1,1] , en el cual el producto interno viene definido por hq|pi = −1 p(x)q(x) dx.
Encuentre el polinomio lineal más cercano a la función f (x) .
En el subespacio S 1 de polinomios lineales, los vectores base son {1, x} Es una base ortogonal
pero no es normal, con lo cual la normalizamos
|v1 i 1 1√
|u1 i = p = qR = 2
hu1 |u1 i 1
dx 2
−1
R1
xdx √
|v2 i − hv2 |u1 i
|u1 i x − R−1
1
hu1 |u1 i −1
dx x 6
|u2 i = p = p = qR = x
hu2 |u2 i hu2 |u2 i 1
x2 dx 2
−1
y la proyección ortogonal de esta función será

Z √ Z √ ! √
0
1
2x 1√ 2 1
6 6 2
c = e 2 dx = − −e2 + e−2 y 1
c = 2x
x e dx = e + 3e−2
−1 2 4 −1 2 8
con lo cual la función lineal será

√ ! √
n 6 2 −2
2
P = e + 3e x− −e2 + e−2
8 4

Bibliografı́a
[1] Apostol, T. M. (1972) Calculus Vol 2 (Reverté Madrid ) QA300 A66C3 1972
[3] Cohen-Tannoudji, C., Diu B. y Laloë (1977) Quantum Mechanics Vol 1 (John Wiley Interscience,
Nueva York )
[4] Gelfand, I.M. (1961) Lectures on Linear .Algebra (John Wiley & Sons Interscience, Nueva York ).
[5] Jordan, T.F. (1969) Linear Operator for Quantum Mechanics (John Wiley & Sons Interscience,
Nueva York ).
Londres)
87
Capı́tulo 3
Vectores Duales y Tensores
88
3.1. Funcionales Lineales

Definiremos funcionales lineales aquella operación que asocia un número complejo (o real) a un vector |vi ∈
V y cumple con la linealidad. Esto es
∀ |vi ∈ V → F [|vi] ∈ C
F [α |v1 i + β |v2 i] ≡ α F [|v1 i] + β F [|v2 i] ∀ |vi , |v1 i , |v2 i ∈ V
El conjunto de funcionales lineales {F1 , F2 , F3 , F4 , · · · , Fn , · · · } constituyen a su vez un espacio vectorial,

que se denomina espacio vectorial dual de V y se denotará como V∗ . Este espacio lineal también se denomina
espacio de formas lineales y los funcionales son esas 1−forma. Esto es, dados F1 , F2 ∈ V∗ se tiene

(F1 + F2 ) [|vi] = F1 [|vi] + F2 [|vi] 
∀ |vi ∈ V

(α F) [|vi] = α∗ F [|vi]
En aquellos espacios lineales con producto interno definido (Espacios de Hilbert), el mismo producto interno
constituye la expresión natural del funcional. Ası́ para tendremos
(Fa ) [|vi] ≡ ha |vi ∀ |vi ∈ V ∧ ∀ ha| ∈ V∗
Es claro comprobar que el producto interno garantiza que los {Fa , Fb , · · · } forman un espacio vectorial.

(Fa + Fb ) [|vi] = Fa [|vi] + Fb [|vi] = ha |vi + hb |vi 
∀ |vi ∈ V

(α Fa ) [|vi] = hαa |vi = α∗ ha |vi = α∗ Fa [|vi]
Esta última propiedad se conoce como antilinealidad. Con lo cual se establece una correspondencia 1 − 1
entre kets y bras, entre vectores y formas diferenciales.
λ1 |v1 i + λ2 |v2 i ⇄ λ∗1 hv1 | + λ∗2 hv2 |
Con lo cual podemos puntualizar esta correspondencia como

∗
ha |vi = hv |ai
ha |λ1 v1 + λ2 v2 i = λ1 ha |v1 i + λ2 ha |v2 i
hλ1 a1 +λ2 a2 |vi = λ∗1 ha1 |vi + λ∗2 ha2 |vi
Más aún, dada una base ortonormal {|e1 i , |e2 i , |e3 i · · · |em i} para V siempre es posible asociar una base
para V∗ de tal manera que

|vi = λi |ei i ⇄ hv| = λ∗i ei con λi = ei |vi ∧ λ∗i = hv |ei i con i = 1, 2, · · · , n
En un
lenguaje
arcaico (y muchos textos de Mecánica todavı́a lo reproducen) denominan a la base del espacio
dual ei la base recı́proca de {|ei i}
Nótese estamos utilizando la notación de Einstein

en la cual ı́ndices repetidos indican suma y que las
bases del espacio dual de formas diferenciales ẽk llevan los ı́ndices arriba. Los ı́ndices arriba se llamarán
contravariantes y los ı́ndices abajo

covariantes. Las componentes de las formas diferenciales en una base dada,
llevan ı́ndices abajo ha| = ai ẽi mientras que las componentes de los vectores los llevan abajo |ai = aj |ẽj i

3.2. Bases Discretas

Para fijar conceptos y extender algunos de los razonamientos que hemos desarrollado hasta aquı́. Tal y
como vimos arriba, la representación de un vector |Fi en un espacio vectorial abstracto V puede darse en
término de una base ortonormal de vectores (discreta y finita BDF = {|u1 i , |u2 i , |u3 i , · · · |un i} o discreta
e infinita BDI = {|u1 i , |u2 i , |u3 i · · · |un i · · · }) de la forma:


 ci |ui i = ui Fi |ui i ⇐ BDF = {|u1 i , |u2 i , |u3 i · · · |un i}
|Fi =
con i = 1, 2, · · · , n
 i
c |ui i = ui Fi |ui i ⇐ BDI = {|u1 i , |u2 i , |u3 i · · · |un i · · · }
donde en ambos casos:

ci = ui Fi = cj ui |uj i = cj δji
Donde la delta de Kronecker δik lleva un ı́ndice arriba y uno abajo y representa δik = 1 si i = k y es nula en
los otros casos. Supondremos, de ahora en adelante un espacio de dimensión finita y en éste consideraremos
dos bases ortogonales, BDF = {|e1 i , |e2 i , |e3 i · · · |en i} y B̃DF = {|ẽ1 i , |ẽ2 i , |ẽ3 i · · · |ẽn i} , de dimensión
finita. Como ambas son bases ortogonales todo vector de V puede expresarse en término de esas bases, en
particular cada vector base se puede expresar en términos de la otra base como
|e1 i = c1 |ẽ1 i + c2 |ẽ2 i · · · + cn |ẽn i = cj |ẽj i

|e2 i = ĉ1 |ẽ1 i + ĉ2 |ẽ2 i · · · + ĉn |ẽn i = ĉj |ẽj i
..
.
|en i = č1 |ẽ1 i + č2 |ẽ2 i · · · + čn |ẽn i = čj |ẽj i
Este sistema de ecuaciones se puede resumir aún más como
|ei i = Cij |ẽj i = Cij |ẽj i
Los Cij son constantes que han renombrado las distintas formas de las constantes cj , ĉj · · · čj que expresamos
arriba. Igualmente, podemos expresar los vectores de la segunda base en términos de la primera como

k
|ẽi i = Aji |ej i =⇒ ẽ |ẽi i = δik = Aji ẽk |ej i = Aji Cjk
ya que

j
|em i = Cm |ẽj i =⇒ ẽk |em i = Cm
j
ẽk |ẽj i = Cm
j k k
δj = Cm
Adicionalmente, hay varias costumbres a aclarar con la notación de ı́ndices.
k
Al asociar los Cm con elementos de matriz los ı́ndices contravariantes (arriba) indicarán filas y los cova-
riantes (abajo) las columnas. Esas matrices serán no singulares para garantizar la independencia lineal de
los vectores base. De este modo para el caso i, k = 1, 2, 3 tendremos
δik = Aji Cjk =⇒ δ̃ik = Ãji C̃jk = C̃jk Ãji
representa
   1 j 
1 0 0 C̃j Ã1 C̃j1 Ãj2 C̃j1 Ãj3
 0  
1 0  =  C̃j2 Ãj1 C̃j2 Ãj2 C̃j2 Ãj3 
0 0 1 C̃j3 Ãj1 C̃j3 Ãj2 3 j
C̃j Ã3

   C̃ 1 Ã1 + C̃ 1 Ã2 + C̃ 1 Ã3 ··· C̃11 Ã13 + C̃21 Ã23 + C̃31 Ã33

1 0 0 1 1 2 1 3 1
 0  .. 
1 0  =  C̃ 2 Ã1 + C̃ 2 Ã2 + C̃ 2 Ã3 . C̃12 Ã13 + C̃22 Ã23 + C̃32 Ã33 
1 1 2 1 3 1
0 0 1 C̃13 Ã11 + C̃23 Ã21 + C̃33 Ã31 ··· C̃13 Ã13 + C̃23 Ã23 + C̃33 Ã33
Es claro que C̃ji y Ãji son inversas una de la otra, por cuanto su multiplicación nos da la matriz identidad.
Por lo tanto si |ei i = Cij |ẽj i se considera la transformación directa, mientras que |ẽi i = Aji |ej i será la
transformación inversa. El caso más emblemático lo constituyen las transformaciones entre la base ortonormal
cartesiana {|ı̂i , |̂i} y la base ortonormal de vectores en coordenadas polares {|ur i , |uθ i} .
Siguiendo con el esquema propuesto expresamos los vectores cartesianos en la base de vectores polares

|ı̂i = cos θ |ur i − sen θ |uθ i 
=⇒ |ei i = Cij |uj i =⇒ Cij = uj |ei i


|̂i = sen θ |ur i + cos θ |uθ i
con
i
i
|e1 i ⇋ |ı̂i
;
|u1 i ⇋ |ur i
y
ek |ej i = δjk
|e2 i ⇋ |̂i |u2 i ⇋ |uθ i u |ul i = δl
con lo cual
1
1 r

u2 |e1 i
u2 |e2 i Ci Cjr cos θ sen θ
Cij = = =
u |e1 i u |e2 i Ciθ Cjθ − sen θ cos θ
Más adelante veremos que esta es la matriz de rotaciones.
3.3. Paréntesis Tensorial

3.3.1. Tensores una definición funcional
La extensión natural al concepto de funcional lineal es el concepto de tensor. Definiremos como un tensor
a un funcional lineal que asocia un número complejo (o real) a un vector |vi ∈ V, a una forma hu| ∈ V∗ , o
ambas y cumple con la linealidad. Esto es
∀ |vi ∈ V ∧ hu| ∈ V∗ → T [hu| ; |vi] ∈ C

T [ hu| ; α |v1 i + β |v2 i] ≡ α T [hu| ; |v1 i] + β T [hu| ; |v2 i] ∀ |v1 i , |v2 i ∈ V ∧ hu| ∈ V∗
T [ζ hu1 | + ξ hu2 | ; |vi] ≡ αζ T [hu1 | ; |vi] + ξ T [hu2 | ; |vi] ∀ |vi , ∈ V ∧ hu1 | , hu2 | ∈ V∗
Es decir, un tensor es un funcional generalizado cuyos argumentos son vectores, formas o ambas. Esto es
T [•; •] una cantidad con dos “puestos” y una vez cubiertos se convierte en un escalar (complejo o real). Al
igual que las funciones de varias variables (f (x, y) = 3x + 4y 2 ) la posición es importante
|vi hu|

↓ ↓
T ◦; •∈C
Un tensor con dos argumentos correspondientes a formas y uno a un vector

|v i |v i hu|
1 2
↓ ↓ ↓ 1
T [◦, ◦; ·] ⇒ T  ◦ , ◦ ; •  ∈ C ⇒ tensor de tipo ;
2

y el caso contrario |vi 

hu1 | hu2 |
↓ ↓ ↓ 2
T [◦; ·, ·] ⇒ T  ◦ ; • , •  ∈ C ⇒ tensor de tipo
1
En general
|v 
1i |v2 i |vn i hu1 | hu2 | hum |
↓ ↓ ↓ ↓ ↓ ↓ m
T [◦; ·, ·] ⇒ T  ◦ , ◦ , · · · , ◦ ; • , • · · · , •  ⇒ tensor de tipo
n
En esta notación el punto y coma ;separa las “entradas” para las formas de las de los vectores. Es importante
recalcar que el orden si importa, no sólo para las cantidades separadas por el punto y como sino el orden
de los puestos de los vectores y formas separados por coma. Ese último orden repercutirá en las propiedades
de los tensores. Serán tensores simétricos si al permutar dos de los puestos de vectores (o formas) cambia de
signo el orden no importa; antisimétricos si el orden importa y un tensor genérico si el orden importa pero
no se comporta como los casos reseñados anteriormente. De todos modos esto será tratado con detalle más
adelante.
Obviamente las formas pueden ser representadas por tensores ya que son funcionales lineales de vectores,
es decir, ha|

1 ↓
un vector es tensor de tipo ⇒ T  ◦  ∈ C.
0
Por su parte, los vectores constituyen un caso especial de tensores

|ai

0 ↓
una forma es tensor de tipo ⇒ T  •  ∈ C.
1
porque son funcionales lineales para las formas diferenciales
3.3.2. Producto Tensorial: Definición y propiedades

Como será evidente más adelante, unos tensores (simples) pueden provenir del producto tensorial (exterior
o directo) de espacios vectoriales. Esto es que, dados E1 y E2 dos espacios vectoriales con dimensiones N1 y N2 ,
respectivamente y vectores genéricos, |ϕ(1)i y |χ(2)i pertenecientes a estos espacios vectoriales, |ϕ(1)i ∈ E1
y |χ(2)i ∈ E2 . Definiremos el producto tensorial (exterior o directo) de espacios vectoriales,
E = E 1 ⊗ E2 , si
2
a cada par de vectores |ϕ(1)i ∈ E1 y |χ(2)i ∈ E2 le asociamos un tensor tipo si se cumple que
0
hζ(1)| hξ(2)|

↓ ↓
|ϕ(1)χ(2)i = |ϕ(1)i ⊗ |χ(2)i = T  • , •  = hζ(1) |ϕ(1)i hξ(2) |χ(2)i ∈ C
y cumplen con las siguientes propiedades:
1. La suma entre tensores de E viene definida como
|ϕ(1)χ(2)i + |ζ(1)ξ(2)i = |ϕ(1)i ⊗ |χ(2)i + |ζ(1)i ⊗ |ξ(2)i

= |ϕ(1) + ζ(1)i ⊗ |χ(2) + ξ(2)i

2. El producto tensorial es lineal respecto a la multiplicación con números reales λ y µ

[|λϕ(1)i] ⊗ |χ(2)i = [λ |ϕ(1)i] ⊗ |χ(2)i = λ [|ϕ(1)i ⊗ |χ(2)i] = λ |ϕ(1)χ(2)i
|ϕ(1)i ⊗ [|µχ(2)i] = |ϕ(1)i ⊗ [µ |χ(2)i] = µ [|ϕ(1)i ⊗ |χ(2)i] = µ |ϕ(1)χ(2)i
3. El producto tensorial es distributivo respecto a la suma:

|ϕ(1)i ⊗ [|χ1 (2)i + |χ2 (2)i] = |ϕ(1)i ⊗ |χ1 (2)i + |ϕ(1)i ⊗ |χ2 (2)i
[|ϕ1 (1)i + |ϕ2 (1)i] ⊗ |χ(2)i = |ϕ1 (1)i ⊗ |χ(2)i + |ϕ2 (1)i ⊗ |χ(2)i
Nótese que los ı́ndices (1) y (2) denotan la pertenencia al espacio respectivo.
Es fácil convencerse que los tensores |ϕ(1)χ(2)i ∈ E = E 1 ⊗E2 forman un espacio vectorial La demostración
se basa en comprobar los axiomas o propiedades de los espacios vectoriales. Es decir:
1. La operación suma ⊞ es cerrada en V : ∀ |vi i , |vj i ∈ V ⇒ |vk i = |vi i ⊞ |vj i ∈ V
Esto se traduce en demostrar que sumados dos tensores |ϕ(1)χ(2)i , y |ζ(1)ξ(2)i ∈ E el tensor suma
también pertenece a E,con a y b pertenecientes al campo del espacio vectorial
a |ϕ(1)χ(2)i + b |ζ(1)ξ(2)i = |aϕ(1) + ζ(1)i ⊗ |χ(2) + bξ(2)i
y esto se cumple siempre ya que, el producto tensorial es lineal respecto a la multiplicación con números
reales y por ser E1 y E2 espacios vectoriales se cumple

|aϕ(1) + ζ(1)i = a |ϕ(1)i + |ζ(1)i ∈ E1 
=⇒ |ϕ(1) + ζ(1)i ⊗ |χ(2) + ξ(2)i ∈ E2

|ϕ(2) + bζ(2)i = |ϕ(2)i + b |ζ(2)i ∈ E2
2. La operación suma ⊞ es conmutativa y asociativa

Conmutativa ∀ |vi i , |vj i ∈ V ⇒ |vi i ⊞ |vj i = |vj i ⊞ |vi i
Esta primera es clara de la definición de suma
|ϕ(1)χ(2)i + |ζ(1)ξ(2)i = |ϕ(1) + ζ(1)i ⊗ |χ(2) + ξ(2)i
|ζ(1)ξ(2)i + |ϕ(1)χ(2)i = |ζ(1) + ϕ(1)i ⊗ |ξ(2) + χ(2)i

por ser E1 y E2 dos espacios vectoriales
∀ |vi i , |vj i , |vk i ∈ V ⇒ (|vi i ⊞ |vj i) ⊞ |vk i = |vj i ⊞ (|vi i ⊞ |vk i)
una vez más, esto se traduce en:
(|ϕ(1)χ(2)i + |ζ(1)ξ(2)i) + |κ(1)κ(2)i = |ϕ(1)χ(2)i + (|ζ(1)ξ(2)i + |κ(1)κ(2)i)
con lo cual, por la definición de suma la expresión anterior queda como
(|ϕ(1) + ζ(1)i ⊗ |ξ(2) + χ(2)i) + |κ(1)κ(2)i = |ϕ(1)χ(2)i + (|ζ(1) + κ(1)i ⊗ |ξ(2) + κ(2)i)
|(ϕ(1) + ζ(1)) + κ(1)i ⊗ |(ξ(2) + χ(2)) + κ(2)i = |ϕ(1) + (ζ(1) + κ(1))i ⊗ |ξ(2) + (χ(2) + κ(2))i
3. Existe un único elemento neutro: ∃! |0i ∋ |0i ⊞ |vj i = |vj i ⊞ |0i = |vj i ∀ |vj i ∈ V
Es decir,
|ϕ(1)χ(2)i + |0(1)0(2)i = |ϕ(1) + 0(1)i ⊗ |χ(2) + 0(2)i = |ϕ(1)i ⊗ |χ(2)i = |ϕ(1)χ(2)i

4. Existe un elemento simétrico para cada elemento de V :

∀ |vj i ∈ V ∃ |−vj i ∋ |vj i ⊞ |−vj i = |0i ⇒
|ϕ(1)χ(2)i − |ϕ(1)χ(2)i = |ϕ(1) − ϕ(1)i ⊗ |χ(2) − χ(2)i = |0(1)i ⊗ |0(2)i = |0(1)0(2)i
5. α (β |vi i) = (αβ) |vi i ⇒
α (β |ϕ(1)χ(2)i) = α (|βχ(2)i ⊗ |ϕ(1)i) = |αβχ(2)i ⊗ |ϕ(1)i

= (αβ) |χ(2)i ⊗ |ϕ(1)i = (αβ) |ϕ(1)χ(2)i
6. (α + β) |vi i = α |vi i + β |vi i ⇒
(α + β) |ϕ(1)χ(2)i = |ϕ(1)i ⊗ |(α + β) χ(2)i = |ϕ(1)i ⊗ |αχ(2) + βχ(2)i

= |ϕ(1)i ⊗ [(α |χ(2)i + β |χ(2)i)]
= α |ϕ(1)i ⊗ |χ(2)i + β |ϕ(1)i ⊗ |χ(2)i
7. α (|vi i ⊞ |vj i) = α |vi i ⊞ α |vj i ⇒
α (|ϕ(1)χ(2)i + |ζ(1)ξ(2)i) = α (|ϕ(1) + ζ(1)i ⊗ |ξ(2) + χ(2)i)

= |α (ϕ(1) + ζ(1))i ⊗ |ξ(2) + χ(2)i
= |αϕ(1) + αζ(1)i ⊗ |ξ(2) + χ(2)i
= (|αϕ(1)χ(2)i + |αζ(1)ξ(2)i)
= α |ϕ(1)χ(2)i + α |ζ(1)ξ(2)i
Equivalentemente, podemos construir un producto tensorial entre espacios de formas diferenciales. Si E1∗ y
E2∗ son dos espacios vectoriales duales a E1 y E2 , con dimensiones N1 y N2 , respectivamente. A estos espacios
pertenecen las formas diferenciales genéricas hζ(1)| ∈ E1∗ y hξ(2)| ∈ E2∗ . Definiremos el producto tensorial de
∗ ∗ ∗ ∗ ∗
E =
espacios vectoriales duales, E 1 ⊗ E2 , si a cada par de formas diferenciales hζ(1)| ∈ E1 y hξ(2)| ∈ E2 le
0
asociamos un tensor tipo . Esto es
2
hζ(1)ξ(2)| = hζ(1)| ⊗ hξ(2)|
3.3.3. La tentación del producto interno

Uno puede verse tentado a definir un producto interno de la forma
hϕ̃(1)χ̃(2) |ϕ(1)χ(2)i = hϕ̃(1) |ϕ(1)i · hχ̃(2) |χ(2)i
A partir de las definiciones de productos internos en E1 y E2 mostraremos, sin embargo que NO es una
buena definición de producto interno. Para ello supondremos que · representa la multiplicación estándar
entre números reales. Para comprobar que
Debemos demostrar los axiomas o propiedades de los productos internos. Las propiedades que definen el
producto interno son:
1. hx| xi ∈ℜ ∧ hx| xi ≥ 0 ∀ |xi ∈ V si hx| xi = 0 ⇒ |xi ≡ |0i

Esto es:
hϕ(1)χ(2) |ϕ(1)χ(2)i = hϕ(1) |ϕ(1)i · hχ(2) |χ(2)i

como hϕ(1) |ϕ(1)i y hχ(2) |χ(2)i son buenas definiciones de producto interno tendremos que

hϕ(1) |ϕ(1)i ≥ 0 
⇒ hϕ(1)χ(2) |ϕ(1)χ(2)i ≥ 0

hχ(2) |χ(2)i ≥ 0
Aquı́ vale la pena mencionar algunos puntos sutiles sobre la segunda parte de la propiedad a demostrar:
si hx| xi = 0 ⇒ |xi ≡ |0i lo cual para este caso se traducen en
hϕ(1)χ(2) |ϕ̃(1)χ̃(2)i = hϕ(1) |ϕ̃(1)i · hχ(2) |χ̃(2)i = 0

 

 hϕ(1) |ϕ̃(1)i = 0 



 ⇒ |ϕ̃(1)i = |0(1)i

 

 hχ(2) |χ̃(2)i 6
= 0



 


 hϕ(1) |ϕ̃(1)i = 6 0 
hϕ(1) |ϕ̃(1)i · hχ(2) |χ̃(2)i = 0 ⇒ ⇒ |χ̃(1)i = |0(1)i

 

 hχ(2) | χ̃(2)i = 0



  



 hϕ(1) |ϕ̃(1)i = 0   |ϕ̃(1)i = |0(1)i



 ⇒
  
hχ(2) |χ̃(2)i = 0 |χ̃(1)i = |0(1)i
definitivamente, habrı́a que restringir los posibles vectores que intervienen en el producto tensorial, de
modo que no fuera posible vectores del tipo
|ϕ(1)0(2)i = |ϕ(1)i ⊗ |0(2)i o |ϕ(1)χ(2)i = |0(1)i ⊗ |χ(2)i
sólo ası́ se cumple la propiedad mencionada.

∗
2. hx| yi = hy| xi ∀ |xi , |yi ∈ V
Esto puede ser demostrado fácilmente como sigue
hϕ̃(1)χ̃(2) |ϕ(1)χ(2)i = hϕ̃(1) |ϕ(1)i · hχ̃(2) |χ(2)i

∗ ∗
= hϕ(1) |ϕ̃(1)i · hχ(2) |χ̃(2)i
∗
= (hϕ(1) |ϕ̃(1)i · hχ(2) |χ̃(2)i)
∗
= hϕ(1)χ(2) |ϕ̃(1)χ̃(2)i
3. hx| y + zi = hx| yi + hx| zi ∧ hx + z| yi = hx| yi + hz| yi ∀ |xi , |yi , |zi ∈ V

Partimos del lado derecho de la primera de las igualdades anteriores:
hϕ̃(1)χ̃(2)| [|ϕ(1)χ(2)i + |ζ(1)ξ(2)i] = hϕ̃(1)χ̃(2)| [|ϕ(1) + ζ(1)i ⊗ |ξ(2) + χ(2)i]

= hϕ̃(1) |ϕ(1) + ζ(1)i · hχ̃(2) |ξ(2) + χ(2)i
y otra vez, como hϕ(1) |ϕ(1)i y hχ(2) |χ(2)i son buenas definiciones de producto interno tendremos
que:
hϕ̃(1) |ϕ(1) + ζ(1)i = hϕ̃(1) |ϕ(1)i + hϕ̃(1) |ζ(1)i

hχ̃(2) |ξ(2) + χ(2)i = hχ̃(2) |ξ(2)i + hχ̃(2) |χ(2)i

y al multiplicar hχ̃(2) |ξ(2) + χ(2)i por hϕ̃(1) |ϕ(1) + ζ(1)i surgirán cuatro sumandos
hϕ̃(1) |ϕ(1)i hχ̃(2) |ξ(2)i + hϕ̃(1) |ϕ(1)i hχ̃(2) |χ(2)i + hϕ̃(1) |ζ(1)i hχ̃(2) |ξ(2)i + hϕ̃(1) |ζ(1)i hχ̃(2) |χ(2)i
lo cual contrasta con el lado izquierdo al utilizar la definición dos veces que tienen dos sumandos
hϕ̃(1)χ̃(2) |ϕ(1)χ(2)i + hϕ̃(1)χ̃(2) |ζ(1)ξ(2)i = hϕ̃(1) |ϕ(1)i · hχ̃(2) |χ(2)i + hϕ̃(1) |ζ(1)i · hχ̃(2) |ξ(2)i
por lo cual NO se cumple esta propiedad y no hay forma de enmendarla. Sólo por razones de
completitud.
3.3.4. Bases para un producto tensorial

Si {|ui (1)i} y {|vi (2)i} son bases discretas para E1 y E2 , respectivamente, entonces podremos construir
el tensor
|ui (1)vj (2)i = |ui (1)i ⊗ |vj (2)i ∈ E
el cual funcionará como una base para E . Por lo tanto, un tensor genérico de E, construido a partir
|ϕ(1)χ(2)i = |ϕ(1)i ⊗ |χ(2)i = ϕi χj |ui (1)vj (2)i
donde ϕi y χj son las componentes de |ϕ(1)i y |χ(2)i en sus respectivas bases. En otras palabras las
componentes de un tensor en E corresponden a la multiplicación de las componentes de los vectores en E1
y E2 Recuerde que estamos utilizando Pn la convención de Einstein de suma tácita en ı́ndices covariantes y
contravariantes, en la cual ck |vk i ≡ k=1 ck |vk i .
Es importante señalar que si bien un tensor genérico |Ψi ∈ E siempre se puede expandir en la base
|ui (1)vj (2)i no es cierto que todo tensor de E provenga del producto tensorial de E1 y E2 . Es decir, E tiene
más tensores que los que provienen el producto tensorial. Esta afirmación puede verse del hecho que si
|Ψi ∈ E entonces
|Ψi = ci,j |ui (1)vj (2)i
por ser {|ui (1)vj (2)i} base para E. Es claro que dados dos números n1 y n2 habrá ci,j que no provienen de
la multiplicación de n1 n2 .
3.3.5. Tensores, sus componentes y sus contracciones

Componentes de un tensor
Denominaremos componentes de un tensor, aquellos números que surgen de incorporar bases de formas
diferenciales y vectores. Ası́ si {|ui (1)i , |vj (2)i , |tk (3)i} y{hxm(1)| , hy n (2)|} son bases para los vectores y las
2
formas, respectivamente. Las componentes de un tensor serán
3
|u (1)i |v (2)i |t (3)i hxm (1)| hyn (2)|
i j k
↓ ↓ ↓ ↓ ↓
mn
Sijk =S ◦ , ◦ , ◦ ; • , • 
claramente, esta definición de componente contiene a las componentes ci,j de aquellos espacios tensoriales
generados por el producto tensorial. Ya si consideramos un tensor como resultado de un producto tensorial
y consideramos que las base {|ui (1)i , hxm (1)|} su componentes se pueden expresar {ϕm (1)χi (1)}, vale decir,

1
⇐⇒ |ϕ(1)i ⊗ h∆(1)| =⇒ hxm (1) |ϕ(1)i ⊗ h∆(1)| ui (1)i ⇐⇒ {ϕm (1)δi (1)}
1

Combinaciones lineales de Tensores

Es claro que podremos sumar (componentes) de tensores como lo hemos hecho con la suma de (compo-
nentes) de vectores

~a + ~b = (ax + bx )ı̂ + (ay + by ) ̂ + (az + bz ) k̂ = a1 + b1 ı̂ + a2 + b2 ̂ + a3 + b3 k̂ = ai + bi |ei i

ij
Rkl = αQij ij
kl + βPkl
Producto Tensorial de Tensores

Podemos
extender
aún más la idea del producto directo y ahora realizarla entre tensores. Ası́ dos tensores
2 2
tipo y si se cumple que
0 1
hζ(1)| hξ(2)| 


↓ ↓ 

|ϕ(1)χ(2)i = |ϕ(1)i ⊗ |χ(2)i = T  • , •  




=⇒
|u (1)i hε(1)| hφ(2)| 

i 

↓ ↓ ↓ 
|µ(1)κ(2)Θ(1)i = |µ(1)i ⊗ |κ(2)i ⊗ hΘ (1)| = P  ◦ ; • , •   


|ϕ(1)χ(2)i ⊗ |µ(1)κ(2)Θ(1)i = |ϕ(1)i ⊗ |χ(2)i ⊗ |µ(1)i ⊗ |κ(2)i ⊗ hΘ (1)|
hζ(1)| hξ(2)|
 |u 
i (1)i hε(1)| hφ(2)|
↓ ↓ ↓ ↓ ↓
=T  • , • ⊗P ◦ ; • , • 
|u 
i (1)i hε(1)| hφ(2)| hζ(3)| hξ(4)|
↓ ↓ ↓ ↓ ↓
= R ◦ ; • , • , • , • 
Contracción de un Tensor
Denominaremos una contracción cuando sumamos las componentes covariantes y contravariantes, esto
es ϕi (1)χi (1) lo cual genera un escalar independiente de la base. Esta situación será más evidente cuando
definamos métricas y contracción de tensores. Por
analogı́a
y considerando un caso más general,
dada una
mn 2 1
componente Sijk correspondiente a un tensor podremos construir un nuevo tensor a partir
3 2
in n
de una contracción. Las componentes de este nuevo tensor serán Sijk ≡ S̃jk . Del mismo modo, dadas las
componentes de dos tensores, P y Qzk generarán componentes de nuevos tensores Rklij = P lm Qij
lm ij
mk . Ası́

2 
=⇒ P lm 
0 3
=⇒ =⇒ Rklij = P lm Qij
mk
2 ij  1
=⇒ Qzk  
2

Es claro que si dos tensores derivan de productos tensoriales y si {|ui (1)i} , {hum (1)|} y {|vi (2)i} son bases
ortonormales para E1 E1∗ y E2 , entonces sus productos podrán ser expresados como

|γ(1)δ(2)i = γ i (1)δ j (2) |ui (1)i ⊗ |vj (2)i 

| {z } 

P ij


=⇒
|α(1)β(1)i = αl (1)βm (2) |ul (1)i ⊗ hum (1)|  


| {z } 

Qlm

αl (1)βm (2) |ul (1)i ⊗ hum (1)| γ i (1)δ j (2) |ui (1)i ⊗ |vj (2)i =⇒

αl (1)βm (2) γ i (1)δ j (2) {hum (1) |ui (1)i} |vj (2)i ⊗ |ul (1)i =⇒
| {z }
δim

αl (1)βk (2) γ k (1)δ j (2) |vj (2)i ⊗ |ul (1)i = P ij Qli |vj (2)ul (1)i = Rjl |vj (2)ul (1)i
Pero más aún si |ui (1)vj (2)i = |ui (1)i ⊗ |vj (2)i ∈ E es base de E entonces se puede demostrar lo anterior
sin circunscribirnos a tensores cuyas componentes provengan de multiplicación de las componentes en cada
espacio vectorial.
Simetrización de Tensores
Un tensor (las componentes) será simétrico respecto a dos de sus ı́ndices si su permutación no cambia su
valor:
Sij = Sji ; S ij = S ji ; Sij···kl···mn = Sij···lk···mn S ij···kl···mn = S ij···lk···mn
y será antisimétrico si
Aij = −Aji ; Aij = −Aji Aij···kl···mn = −Aij···lk···mn Aij···kl···mn = −Aij···lk···mn
Un tensor de rango 2, viene representado por una matriz. La matriz que representa un tensor de rango 2,
tendrá como máximo 6 componentes distintas será
 1   1 
S1 S21 S31 S1 S21 S31
j 
i
Sj = Si = S12 S22 S32  =  S21 S22 S32 
S13 S23 S33 S31 S32 S33
mientras que un tensor antisimétrico de segundo orden tendrá, cuando máximo, tres componentes con valor
absoluto distintos de cero  
0 A12 A13
Aij = −Aji =  −A21 0 A23 
3 3
−A1 −A2 0
Siempre es posible construir tensores simétricos y antisimétricos a partir de un tensor genérico. Esto es:
1 1
Sij = (Tij + Tji ) ≡ T(ij) ⇐⇒ Sij···kl···mn = (Tij···kl···mn + Tij···lk···mn ) = Tij···(kl)···mn
2 2
1 1
Aij = (Tij − Tji ) ≡ T[ij] ⇐⇒ Aij···kl···mn = (Tij···kl···mn − Tij···lk···mn ) = Tij···[kl]···mn
2 2

Más aún, es evidente que las componentes de un tensor genérico Tij , pueden expresarse como una combinación
de su parte simétrica y antisimétrica
Tij = Sij + Aij
Obviamente que algo equivalente se puede realizar para componentes contravariantes de tensores.
3.3.6. Tensor Métrico, Indices y Componentes

Para una base genérica, {|xj i} , no necesariamenteortogonal,
de un espacio vectorial con producto interno,
0
podemos definir la expresión de un tensor simétrico que hemos denominado tensor métrico como
2
|x i |x i
i j
↓ ↓
g  ◦ , ◦,  = gij ≡ gji =⇒ gij ≡ gji = g [|xi i , |xj i]
 i 
hx | hxj |
 ↓ ↓  −1
g  • , •  = g ij ≡ g ij =⇒ g ij ≡ g ij = (gij )
|x |xj i

ii
↓ ↓
Nótese que las gij ≡ gji son las componentes del tensor g  ◦ , ◦,  una vez que la base {|xj i} ha actuado.
|x |xj i

ii
↓ ↓
La denominación de tensor métrico, no es gratuita, g  ◦ , ◦,  cumple con todas las propiedades de la
métrica definida para un espacio vectorial euclidiano. Vale decir

|x i |x i
i j
↓ ↓
1. g  ◦ , ◦,  = g [|xi i , |xj i] = gij ≡ gji ≥ 0 ∀ |xj i y si g [|xi i , |xj i] = 0 ⇒ i = j
2. g [|xi i , |xj i] = g [|xj i , |xi i] ⇒ gij ≡ gji

3. g [|xi i , |xj i] ≤ g [|xi i , |zk i] + g [|zk i , |xj i] La desigualdad Triangular
Si la base genérica, {|xj i} , es ortonormal entonces estas propiedades emergen de manera natural y es
claro que
|e i |e i
i j
↓ ↓

g  ◦ , ◦,  =⇒ g [◦, ◦] ≡ gij ei ⊗ ej ≡ gji ej ⊗ ei y g [•, •] ≡ g ij |ei i ⊗ |ej i ≡ g ji |ej i ⊗ |ei i
con lo cual sus componentes serán matrices simétricas gij = gji y igualmente g ij = g ji . En general impon-
dremos que

gij ei ⊗ ej g km |ek i ⊗ |em i = gij g km ei |ek i ej |em i = gij g km δki δm

j
= gij g ji = δii = n
ya que i, j = 1, 2, 3, · · · , n. Con lo cual gij es la matriz inversa de g ij . Es decir, claramente, hemos definido
las componentes contravariantes del tensor de modo que cumplan con gik g kj = δij

Adicionalmente, es también es claro que

gij ei ⊗ ej |ai = ak gij ei ⊗ ej |ek i = ak gij ej |ek i ei = ak gij δkj ei = ak gik ei ≡ ai ei
con lo cual ai = ak gik . De esta manera, el tensor métrico nos permite asociar componentes covariantes a
componentes contravariantes. Dicho rápido y mal pero muy frecuente, el tensor métrico nos permite subir y
bajar ı́ndices. De la misma forma

ha| g ij |ei i ⊗ |ej i = ha| g ij |ei i ⊗ |ej i = g ij ha |ei i ⊗ |ej i = ak g ij ek |ei i |ej i = ak g kj |ej i ≡ aj |ej i
otra vez aj = ak g kj , y subimos el ı́ndice correspondiente. La importancia de esta
Otra forma de verlo es combinando las propiedades del producto directo de tensores y contracción de
ı́ndices

g ij |ei i ⊗ |ej i ⊗ Pklmn |el i ⊗ |em i ⊗ |en i ⊗ ek =⇒

g ij Pklmn |ej i ⊗ Pklmn |el i ⊗ |em i ⊗ |en i ⊗ ek ei i =

g ij Pklmn |ej i ⊗ |el i ⊗ |em i ⊗ |en i · ek ei i = P jlmn |ej i ⊗ |el i ⊗ |em i ⊗ |en i
| {z }
δik
g ij Pilmn ≡ P jlmn
Adicionalmente, el tensor métrico permite la contracción de ı́ndices. Ası́, dado un producto tensorial de
dos vectores que se pueden expresar en una base ortonormal
|a, bi = |ai ⊗ |bi = ak bm |ek i ⊗ |em i
⇓

i
j k

gij e ⊗ e a |ek i ⊗ b |em i = a b gij δki δm
m k m j
= ak bm gkm = ak bk = hb |ai = ha |bi
Con lo cual ,el producto interno de dos vectores involucra, de manera natural, la métrica del espacio. Esto
es
hb |ai = ha |bi = ak bk = ak bk = ak bm gkm = ak bm g km
Obviamente la norma de un vector, también incluirá al tensor métrico:
2
k|aik = ha |ai = ai aj ei |ej i = ai ai = ai aj g ij = ai aj gij

El caso más emblemático lo constituye la norma de un desplazamiento infinitesimal. Para una base genérica,
{|ẽj i} no necesariamente ortogonal de un espacio vectorial con producto interno, el desplazamiento infinite-
simal puede expresarse como
2

(ds) ≡ hdr |dri = d x̃k ẽk (d x̃m |ẽm i) = ẽk |ẽm i d x̃k d x̃m = d x̃m d x̃m = g̃km d x̃k d x̃m
Si la base {|ej i} es ortogonal (cosa más o menos común pero no necesariamente cierta siempre) las matrices
gij y g ij son diagonales cumplen con
1 2 2 2 2
gii = =⇒ (ds) = h1 dx1 + h2 dx2 + h3 dx3
g ii
√
donde hi = gii con i, j = 1, 2, 3.

3.4. Un par de tensores

3.4.1. El tensor de esfuerzos (stress)
Figura 3.1: Tensor de Esfuerzos (stress) en 2 dimensiones
El caso 2D
Supongamos un cuerpo que se encuentra en equilibrio y está sometido a un conjunto de fuerzas externas.
Para facilitar las cosas consideremos el efecto de esas fuerzas sobre un plano que contiene a un determinado
punto P (ver figura 3.1 cuadrante Ia) Es decir, vamos a considerar los efectos de las componentes de todas
las fuerzas sobre ese plano y obviaremos efecto del resto de las componentes. Como observamos en la figura
3.1 Ib y Ic, si cortamos la superficie en dos lı́neas (AB y A′ B ′ ), observaremos que el efecto del conjunto de
fuerzas externas es distinto sobre P en la dirección perpendicular a cada una de esas lı́neas. De hecho al
“cortar” la superficie las fuerzas que aparecen sobre las lı́neas AB (y A′ B ′ ) antes eran fuerzas internas y
ahora los son externas al nuevo cuerpo “cortado”. Ası́, estas fuerzas por unidad de longitud1 sobre el punto
P existen un conjunto de fuerzas que generan esfuerzos (stress). Por lo tanto es claro que los esfuerzos sobre
un punto dependen del punto, de las fuerzas externas y de la dirección del efecto.
Para irnos aclarando consideremos un elemento de área infinitesimal ds sobre la cual actúan un conjunto
de fuerzas externas, las cuales las podemos descomponer como normales y tangenciales a la lı́nea sobre la
cual están aplicadas (ver figura 3.1 cuadrante II). Es costumbre denotar los esfuerzos normales y tangenciales


 ↑ Y2 = σ2 dx −→ X2 = τ2 dx


 dx
Y3 = τ3 dy ↑ ↑ Y1 = τ1 dy
dA = dxdy ⇒ dy ds dy

 X3 = σ3 dy → → X1 = σ1 dy

 dx

↑ Y4 = σ4 dx → X4 = τ4 dx
1 En el caso tridimensional, las fuerzas que generan los esfuerzos serán definidas como fuerzas por unidad de área. Ese caso
lo veremos en la próxima sección.

La segunda ley de Newton nos lleva a


X  τ1 dy + σ2 dx + τ3 dy + σ4 dx = 0 = (σ2 + σ4 ) dx + (τ1 + τ3 ) dy
F~iext = dm ~a = 0 ⇒

σ1 dy + τ2 dx + σ3 dy + τ4 dx = 0 = (τ2 + τ4 ) dx + (σ1 + σ3 ) dy
con lo cual
σ2 = −σ4 ; τ1 = −τ3
τ2 = −τ4 σ1 = −σ3
pero más aún, como está en equilibrio, también la sumatoria de torques se tendrá que anular. Esto es
dy

(τ1 dy) dx
2 − (τ2 dx) 2 = 0 
⇒ τ1 = τ 2 = τ3 = τ4
dy 
(τ3 dy) dx
2 − (τ 4 dx) 2 = 0
con lo cual, nos damos cuenta que existen sólo tres cantidades independientes: dos esfuerzos normales σ1 y
σ2 ; y un esfuerzo tangencial τ1 . Adicionalmente notamos que los esfuerzos tienen que ver, con la dirección
de la fuerza y la superficie sobre la cual va aplicada. Con ello podemos diseñar la siguiente notación para
los esfuerzos: σij . El primer ı́ndice indica la dirección de la fuerza y el segundo dirección de la normal de la
superficie donde está aplicada. Ası́, tal y como muestra la figura (ver figura 3.1 cuadrante II)
σ1 ≡ σxx ; −σ4 ≡ σyy ; τ2 ≡ σxy ≡ σyx
El cambio de signo se debe a lo incómodo de la notación σ4 ≡ σy−y ya que la normal de lado 4 apunta en la
dirección −y. Es importante también señalar que los esfuerzos en cualquier punto contenido en el diferencial
de área dA = dxdy deben ser considerado constantes. O, lo que es lo mismo, que podemos hacer tender a
cero el área del diferencial y con ello asociar los esfuerzos σij a un punto P contenido en dA sobre la cual
hemos calculado los esfuerzos.
En esta misma lı́nea de razonamiento, nos podemos preguntar cual es la expresión de los esfuerzos cuando
se miden respecto a una superficie genérica, definida por un vector normal ~n (ver figura 3.1 cuadrante III).
Es decir, queremos conocer los esfuerzos medidos en el punto P en la dirección ~n, es decir σnn . Tendremos
que en
x → σxx dy + σxy dx = σnn ds cos φ + σsn ds sen φ; y → σyy dx + σyx dy = σnn ds sen φ − σsn ds cos φ
Ahora bien, dado que dy = ds cos φ y dx = ds sen φ, entonces podemos expresar
σnn = σxx cos2 φ + σxy sen φ cos φ + σyx sen φ cos φ + σyy sen2 φ
σsn = σxx sen φ cos φ + σxy sen2 φ − σyx cos2 φ − σyy sen φ cos φ
y si ahora nos damos cuenta que si construimos una matriz
x
An = cos φ Axs = sen φ
Aij =
Ayn = sen φ Ays = − cos φ
entonces podemos expresar
σnn = Axn Axn σxx + Axn Ayn σxy + Ayn Axn σyx + Ayn Ayn σyy → σnn = Ain Ajn σij con i, j = n, s
σsn = Axs Axn σxx + Axs Ayn σxy + Ays Axn σyx + Ays Ayn σyy → σsn = Ain Ajn σij con i, j = n, s

Figura 3.2: Tensor de Esfuerzos en 3 dimensiones
es decir σkl = Aik Ajl σij con i, j, k, l = n, s.

Como veremos más adelante, cualquier objeto que transforme como σkl = Aik Ajl σij lo llamaremos tensor
de segundo orden.
El caso 3D
Analicemos ahora el caso tridimensional. En este caso también procedemos como en el caso anterior
estableciendo las condiciones de equilibrio
X X
F~iext = 0 y ~τiext = 0
con ello construimos un volumen (cúbico) diferencial y construimos los esfuerzos normales y tangenciales,
los cuales serán
σxx dydz; σyy dxdz; σzz dxdy; σxz dxdy; σyz dxdy; σxy dxdz;
Siguiendo el mismo proceso que involucra imponer el equilibrio es fácil demostrar que al igual que el caso
anterior, el tensor de esfuerzos σij cumple con:
σxz = σzx ; σyz = σzy ; σxy = σyx
y por lo tanto tendremos 6 componentes (tres normales y tres tangenciales) independientes. Es decir, si bien
el tensor de esfuerzos σij viene representado por una matriz 3 × 3 y por lo tanto tiene 9 elementos, sólo 6 son
independientes. Construyamos ahora el caso general para un tensor de esfuerzos en un medio elástico. Para
ello construimos un tetraedro regular tal y como muestra la figura 3.2, y sobre su cara genérica asociada a
un vector normal ~n una fuerza
 

 Fx = σxn dSn 

 

 
~ ~ i
F = F ûn = F ii = Fx ı̂ + Fy ̂ + Fz k̂ → Fy = σyn dSn → F i = σji nj dS → F~ = σ · dS ~

 


 

 
Fz = σzn dSn

se especifica como la fuerza que actúa sobre un determinado elemento de superficie. Es claro que la condición
de equilibrio se traduce en
X 1 1 1
Fxi = 0 → σxn dSn − σxx dy dz − σxy dx dz − σxz dx dy = 0
2 2 2
X 1 1 1
Fyi = 0 → σyn dSn − σyx dy dz − σyy dx dz − σyz dx dy = 0
2 2 2
X 1 1 1
Fzi = 0 → σzn dSn − σzx dy dz − σzy dx dz − σzz dx dy = 0
2 2 2
Si consideramos que la proyección de dSn sobre cada uno de los planos del sistema cartesiano tendremos que

dS n cos (ı̂;~n) = 21 dy dz = dS n Axn 




dS n cos (̂;~n) = 12 dx dz = dS n Ayn → σxn = σxx Axn + σxy Ayn + σxz Azn





dS n cos (k̂;~n) = 12 dx dy = dS n Azn
y equivalentemente
σyn = σyx Axn + σyy Ayn + σyz Azn ; y σzn = σzx Axn + σzy Ayn + σzz Azn
las cuales se conocen como las relaciones de Cauchy y representan los esfuerzos sobre la superficie con normal
~n. Ahora bien, dado que F~ = σ · dS ~ es una relación vectorial podemos proyectar en la dirección ûm

ûm · F~ = ûm · σ · dS
~ → F m = σnm dS n = σim Ain dS n = σim Ain dS n

σmn dS n = σmi Ain dS n → σmn dS n = σki Akm Ain dS n con i, j = x, y, z
Una vez más vemos que transforma como un tensor.
3.4.2. El Tensor de Inercia

Consideremos el caso de un sistema de n partı́culas. La cantidad de movimiento angular para este sistema
vendrá dada por X
~ =
L m(i) ~r(i) × ~v(i)
i
donde hemos indicado que la i−ésima partı́cula que está en la posición ~r(i) tiene una velocidad ~v(i) . Si
las distancias entre las partı́culas y entre las partı́culas y el origen de coordenadas es constante podremos
expresar la velocidad de cada una de ellas como
~ × ~r(i)
~v(i) = ω
(¿ por qué ?). Donde ω

~ es la velocidad angular instantánea del sistema. Entonces tendremos que
X X
~ =
L m(i) ~r(i) × ω
~ × ~r(i) = ~ ~r(i) · ~r(i) − ~r(i) ω
m(i) ω ~ · ~r(i)
i i

y para cada partı́cula se cumple que, las componentes de la cantidad de movimiento angular serán
X
Lk = m(i) ω k r(i)
m k
r(i)m − r(i) ω m r(i)m
i
k
Si vemos que ω(i) = δlk ω(i)
l
entonces
! !
X X
k
L = m(i) δlk ω l m
r(i) r(i)m − k
r(i) m
ω r(i)m = l
ω(i) m(i) δlk m
r(i) r(i)m − k
r(i) r(i)l
i i
| {z }
Ilk
es decir X
Lk = ω(i)
l
Ilk donde Ilk = m
m(i) δlk r(i) k
r(i)m − r(i) r(i)l
i
el objeto Ilk se conoce como el tensor de inercia y corresponde a 9 cantidades (a pesar que sólo 6 son
independientes porque es un tensor simétrico)
 P P P 
2 2
Ixx = i m(i) y(i) + z(i) Ixy = − i m(i) x(i) y(i) Ixz = − i m(i) x(i) z(i)
 
 
 P P P 
k  
Il =  Iyx = i m(i) x(i) y(i) Iyy = i m(i) x2(i) + z(i)2
Iyz = − i m(i) y(i) z(i) 
 
 
 P P P 
2 2
Izx = i m(i) x(i) z(i) Izy = i m(i) y(i) z(i) Izz = i m(i) z(i) + y(i)
nos contentaremos por ahora, suponer que esta construcción es un tensor y lo demostraremos más adelante.
La ilustración más sencilla de que la masa en rotación se comporta como un tensor y no como un escalar
lo vemos en la rotación de dos masas, m1 , m2 iguales (con lo cual m1 = m2 = m) unidas por una varilla
sin masa de longitud l. Si el sistema (masas + varillas) se encuentra girando alrededor su centro de masa y
ambas masas se encuentran sobre el plano x, y, vale decir que la barra sin masa forma un ángulo de α = π2
con el eje z. Entoces tendremos que
l l d~r l dθ l dθ
~r = cos θ ı̂ + sen θ ~j ⇒ ~v = =− sen θ ı̂ + cos θ ~j
2 2 dt 2 dt 2 dt
con lo cual
2
~ = m1 (~r1 × ~v1 ) + m2 (~r2 × ~v2 ) = m (~r1 × ~v1 ) + m ((−~r1 ) × (−~v1 )) = 2m (~r1 × ~v1 ) = l dθ
L k̂
2 dt
ya que
m1 = m2 = m; ~r2 = −~r1 y ~v2 = −~v1
3.5. Repensando los vectores, otra vez

3.5.1. Vectores, Covectores y Leyes de Transformación
Hemos visto que un determinado vector |ai ∈ V puede expresarse en una base ortogonal {|ej i} como
aj |ej i donde las aj son las componentes del vector contravariantes en la base que se ha indicado. En general,
como es muy largo decir “componentes del vector contravariante” uno se refiere (y nos referiremos de ahora


en adelante) al conjunto aj como un vector contravariante obviando la precisión de componente, pero
realmente las aj son las componentes del vector.
Adicionalmente, en esta etapa pensaremos a las bases como distintos observadores o sistemas de refe-
rencias. Con ello tendremos (algo que ya sabı́amos) que un vector se puede expresar en distintas bases y
tendrá distintas componentes referidas a esa base
|ai = aj |ej i = ãj |ẽj i
Ası́ una misma cantidad fı́sica vectorial “se verá” distinta (tendrá distintas componentes) desde diferentes
sistemas de coordenadas. Las distintas “visiones” están conectadas mediante un transformación de sistema
de referencia
que veremos más adelante.

Igualmente
hemos dicho que una
iforma
diferencial hb| ∈ V ∗ es susceptible de expresarse en una base
i ∗
e del espacio dual V como bi e y, como el espacio está equipado con un producto interno entonces

ha |bi = hb |ai = bi ei · aj |ej i = bi aj δji = ai bi
Con lo cual avanzamos otra vez en la interpretación de cantidades fı́sicas: una cantidad fı́sica escalar “se
vera” igual (será invariante) desde distintos sistemas de referencia.
Además sabemos que unas y otras componentes se relacionan como

i

  i
e |ai = aj ei |ej i = aj δji = ãj ei |ẽj i   a = Aij ãj

i

=⇒
  i
ẽ |ai = ãj ẽi |ẽj i = ãj δji = aj ẽi |ej i ã = Ãij aj
donde claramente

−1
ei |ẽj i = Aij ; ẽi |ej i = Ãij y Aik Ãkj = δji ⇐⇒ Ãij = Aij
Diremos entonces que aquellos objetos cuyas componentes transforman como ai = Aij ãj o equivalentemente
ãi = Ãij aj serán vectores o en un lenguaje un poco más antiguo, vectores contravariantes. Tradicionalmente,
e inspirados
en la ley de transformación, la representación matricial de las componentes contravariantes de
un vector, ei |ai = aj , para una base determinada {|ej i} se estructuran en una columna
 1 
a

i  a2 
 
|ai =⇒ e |ai con i = 1, 2, 3, · · · , n ⇐⇒  . 
 .. 
an
De la misma manera, en el espacio dual, V ∗
, las formas

diferenciales se podrán expresar en término de
una base de ese espacio vectorial como hb| = bi ei = b̃i ẽi Las {bi } serán las componentes de las formas
diferenciales o las componentes covariantes de un vector |bi o dicho rápidamente un vector covariante o
covector. Al igual que en el caso de las componentes contravariantes las componentes covariantes transforman
de un sistema de referencia a otro mediante la siguiente “ley de transformación”:

 
hb |ej i = bi ei |ej i = bi δji = b̃i ẽi |ej i   bi = b̃i Aij

=⇒
 
hb |ẽj i = b̃i ẽi |ẽj i = b̃i δji = bi ei |ẽj i b̃i = bi Ãij
Otra vez, objetos cuyas componentes transformen como bi = b̃i Aij los denominaremos formas diferenciales o
vectores covariantes o covectores y serán representados matricialmente como un arreglo tipo fila

hb| =⇒ hb |ej i con i = 1, 2, 3, · · · , n ⇐⇒ b 1 b 2 · · · bn

3.5.2. Cartesianas y Polares, otra vez

El ejemplo más simple, y por ello, clásico y emblemático de lo anterior lo constituye las expresiones de
un mismo vector en dos sistemas de coordenadas en el plano: Cartesianas {|ii , |ji} y {|ur i , |uθ i} . Esto es
|ai = ax |ii + ax |ji = a1 |e1 i + a2 |e2 i y |ai = ar |ur i + aθ |uθ i = ã1 |ẽ1 i + ã2 |ẽ2 i
Al expresar una base en términos de la otra obtenemos
|ur i = cos θ |ii + sen θ |ji y |uθ i = − sen θ |ii + cos θ |ji
con lo cual

i hi |ur i hi |uθ i cos θ − sen θ
e |ẽj i = Aij ⇐⇒ Aij = ≡
hj |ur i hj |uθ i sen θ cos θ
y

hur |ii hur |ji cos θ sen θ
ẽi |ej i = Ãij ⇐⇒ Ãij = ≡
huθ |ii huθ |ji − sen θ cos θ
cumpliendo además

cos θ − sen θ cos θ sen θ 1 0
= ⇐⇒ Aik Ãkj = δji
sen θ cos θ − sen θ cos θ 0 1
De este modo si
|ai = ar |ur i + aθ |uθ i = ã1 |ẽ1 i + ã2 |ẽ2 i = ax |ii + ax |ji = a1 |e1 i + a2 |e2 i
tendremos que

i cos θ sen θ ax ar ax cos θ + ay sen θ
ã = Ãij aj ⇐⇒ = =
− sen θ cos θ ay aθ −ax sen θ + ay cos θ
con lo cual
ar = ax cos θ + ay sen θ y aθ = −ax sen θ + ay cos θ
del mismo modo

i cos θ − sen θ ar ax ar cos θ − aθ sen θ
a = Aij ãj ⇐⇒ = =
sen θ cos θ aθ ay ar sen θ + aθ cos θ
y
ax = ar cos θ − aθ sen θ y ay = ar sen θ + aθ cos θ
3.5.3. Repensando las componentes

En general podemos pensar que las componentes de los vectores pueden ser funciones de las otras.
Consideremos el ejemplo anterior con esta visión. Tendremos que un punto en el plano viene representado
en coordenadas cartesianas por dos números (x, y) y en coordenadas polares por otros dos números (r, θ) .
Siguiendo el ejemplo anterior un punto P, en el plano lo describimos como
|P i = rP |ur i = xP |ii + yP |ji

Veamos como están relacionadas estas dos descripciones. Para este caso las ecuaciones de transformación son

xP = xP (r, θ) = x1 = x1 x̃1 , x̃2 rP = rP (x, y) = x̃1 = x̃1 x1 , x2
⇐⇒
yP = yP (r, θ) = x2 = x2 x̃1 , x̃2 θ = θP (x, y) = x̃2 = x̃2 x1 , x2
y explı́citamente
xP = rP cos θP =⇒ x1 = x̃1 cos x̃2
yP = rP sen θP =⇒ x2 = x̃1 sen x̃2
y
p q
2 2
rP = x2P + yP2 =⇒ x̃1 = (x1 ) + (x2 )
2
θP = arctan xyPP =⇒ x̃ = arctan xx1
2
Es claro que ambas coordenadas están relacionadas y que se puede invertir la relación
1
x̃1 = x̃1 x1 , x2 x = x1 x̃1 , x̃2
⇐⇒
x̃2 = x̃2 x1 , x2 x2 = x2 x̃1 , x̃2
si se piden cosas razonables:
que las funciones xi = xi (x̃m ) y x̃j = x̃j (xm ) sean al menos C 2 (función y derivada continua)
i 1 2
∂ x (x̃ ,x̃ )
que el determinante de la matriz Jacobiana sean finito y distinto de cero det ∂ x̃l
6= 0.
Más aún, si
∂xi ∂ xi ∂ x̃k ∂ xi
xi = xi x̃j (xm ) =⇒ = = δli =⇒ d xi = d x̃k
∂xl ∂ x̃k ∂ xl ∂ x̃k
con lo cual intuı́mos dos cosas:
1. que las componentes de un vector, deben transformar bajo un cambio de coordenadas como xi =
∂ xi (x̃1 ,x̃2 ) l
∂ x̃l
x̃ .
∂ xi ∂ x̃i
2. Las matrices Jacobianas ∂ x̃k
y ∂ xk
son una la inversa de la otra.
Veamos si es cierto para el caso de vectores en el plano. Para ello calculamos la matriz Jacobiana (matriz
de derivadas) la cual será
!  ∂ x1 (x̃1 ,x̃2 ) ∂ x1 (x̃1 ,x̃2 ) 
∂ xi x̃1 , x̃2 cos x̃2 −x̃1 sen x̃2
=  ∂ x̃1 ∂ x̃2  =
∂ x̃l ∂ x2 (x̃1 ,x̃2 ) ∂ x2 (x̃1 ,x̃2 ) sen x̃2 x̃1 cos x̃2
∂ x̃1 ∂ x̃2
y seguidamente, identificando

∂ xi x̃1 , x̃2 l x1 cos x̃2 −x̃1 sen x̃2 x̃1
xi = x̃ =⇒ =
∂ x̃l x2 sen x̃2 x̃1 cos x̃2 0
Igualmente, si calculamos la inversa de la matriz Jacobiana
!−1  
√ x2
1
√ x2
∂ xi x̃1 , x̃2 cos x̃2 sen x̃2 1 ) +(x2 )2 (x1 )2 +(x2 )2
= − sen x̃2 cos x̃2 =  (x 
∂ x̃l −x2 x1
x̃1 x̃1 1 2 2 2 (x ) +(x ) (x1 )2 +(x2 )2

tendremos
 
√ x1 √ x2
x̃1 (x1 )2 +(x2 )2 (x1 )2 +(x2 )2 x1 ∂ x̃i x1 , x2 l
=  =⇒ x̃i = x
0 −x2 x1 x2 ∂ xl
(x1 )2 +(x2 )2 (x1 )2 +(x2 )2
Es decir q
2 2
p
x̃1 = (x1 ) + (x2 ) =⇒ r = x2 + y 2 y 0=0
Supongamos ahora que tenemos el caso tridimensional en esos mismos dos sistemas
de coordenadas:
uno cartesiano x1 = x, x2 = y, x3 = z y otro esférico x̃1 = r, x̃2 = θ, x̃3 = φ , tal y como hemos
supuesto anteriormente el punto P vendrá descrito por
|P i = rP |ur i = xP |ii + yP |ji + zP |ki
otra vez
 
x = x (r, θ, φ) = x1 = x1 x̃1 , x̃2 , x̃3   r = r (x, y, z) = x̃1 = x̃1 x1 , x2 , x3
y = y (r, θ, φ) = x2 = x2 x̃1 , x̃2 , x̃3 ⇐⇒ θ = θ (x, y, z) = x̃2 = x̃2 x1 , x2 , x3
 
z = z (r, θ, φ) = x3 = x3 x̃1 , x̃2 , x̃3 φ = φ (x, y, z) = x̃3 = x̃3 x1 , x2 , x3
Las ecuaciones de transformación serán

xP = rP sen θP cos φP =⇒ x1 = x̃1 sen x̃2 cos x̃3
yP = rP sen θP sen φP =⇒ x2 = x̃1 sen x̃2 sen x̃3
zP = rP cos θP =⇒ x3 = x̃1 cos x̃2
y
p q
2 2 2
rP = x2P + yP2 + zP2 =⇒ x̃1 = (x1 ) + (x2 ) + (x3 )
2
φP = arctan xyPP =⇒ x̃2 = arctan xx1
√ √
x2P +yP
2
(x1 )2 +(x2 )2
θP = arctan zP =⇒ x̃3 = arctan x3
con lo cual la matriz de las derivadas será para esta transformación en particular será
 sen (θ) cos (φ) −r sen (θ) sen (φ) r cos (θ) cos (φ) 
∂ xi x̃1 , x̃2 , x̃3
=  sen (θ) sen (φ) r sen (θ) cos (φ) r cos (θ) sen (φ) 
∂ x̃l
cos (θ) 0 −r sen (θ)
es decir
 sen x̃2 cos x̃3
−x̃1 sen x̃2 sen x̃3

x̃1 cos x̃2 cos x̃3
∂ xi x̃1 , x̃2 , x̃3
=  sen x̃2 sen x̃3 x̃1 sen x̃2 cos x̃3 x̃1 cos x̃2 sen x̃3 
∂ x̃l
cos x̃2 0 −x̃1 sen x̃2
y su inversa  
i 1 2 3
sen (θ) cos (φ) sen (θ) sen (φ) cos (θ)
∂ x̃ x , x , x  
= − rsen(φ)
sen(θ)
cos(φ)
r sen(θ) 0 
∂ xl cos(θ) cos(φ) cos(θ) sen(φ)
r r − sen(θ)
r

 √ x √ y √ z 
x2 +y 2 +z 2 x2 +y 2 +z 2 x2 +y 2 +z 2
∂ x̃i x1 , x2 , x3  −y x
0

l
=
 x2 +y 2 x2 +y 2 √


∂x xz √ yz √ − x2 +y 2
(x2 +y 2 +z 2 ) x2 +y 2 (x2 +y 2 +z 2 ) x2 +y 2 (x2 +y 2 +z 2 )
dejaremos al lector comprobar que, efectivamente,

i ∂ xi x̃1 , x̃2 , x̃3 l i ∂ x̃i x1 , x2 , x3 l
x = x̃ ⇐⇒ x̃ = x
∂ x̃l ∂ xl
3.6. Transformaciones, vectores y tensores

En general las afirmaciones anteriores se pueden generalizar considerando que las coordenadas que definen
un determinado punto, P, expresado en un sistema de coordenadas particular, son x1 , x2 , · · · , xn y las
coordenadas de ese mismo punto P, expresado en otro sistema de coordenadas es x̃1 , x̃2 , · · · , x̃n ambas
coordenadas estarán relacionadas por
  1
x̃1 = x̃1 x1 , x2 , · · · , xn 
 
 x = x1 x̃1 , x̃2 , · · · , x̃n
  2
x̃2 = x̃2 x1 , x2 , · · · , xn   x = x2 x̃1 , x̃2 , · · · , x̃n
.. ⇐⇒ ..
. 
 
 .

 

x̃n = x̃n x1 , x2 , · · · , xn xn = xn x̃1 , x̃2 , · · · , x̃n

es decir x̃i = x̃i xj ⇐⇒ xi = xi x̃j con i, j = 1, 2, 3, · · · , n. Otra vez, sólo exigiremos (y es bastante)
que:
1. las funciones xi = xi (x̃m ) y x̃j = x̃j (xm ) sean al menos C 2 (función y derivada continua)
i 1 2
∂ x (x̃ ,x̃ )
2. que el determinante de la matriz Jacobiana sean finito y distinto de cero det ∂ x̃l
6= 0. Esto
es
x̃1 x̃1 ∂ x̃1

∂ ∂
∂ x1 ∂ x2 ∂ xn
∂ x̃1 ∂ x̃2
∂ x2 ∂ x2 6= 0 =⇒ xi = xi (x̃m ) ⇐⇒ x̃j = x̃j (xm )

∂ x̃n ∂ x̃n ∂ x̃n
∂ x1 ∂ x2 ∂ xn
Ahora bien, una vez más, derivando y utilizando la regla de la cadena

∂xi ∂ xi ∂ x̃k ∂ xi
xi = xi x̃j (xm ) =⇒ = = δli =⇒ d xi = d x̃k
∂xl ∂ x̃k ∂ xl ∂ x̃k
y como hemos comprobado para dos casos particulares, de ahora en adelante tendremos que:

ReDefinición Tal y como hemos visto, un conjunto de cantidades a1 , a2 , · · · , an se denominarán componentes
contravariantes de un vector |ai ∈ V en un punto P de coordenadas x1 , x2 , · · · , xn si
1. dada dos base ortonormales de vectores coordenados. {|e1 i , |e2 i , · · · |en i} y {|ẽ1 i , |ẽ2 i , · · · |ẽn i}
se cumple que

i
i
|ai = aj |ej i = ãi |ẽi i =⇒

ei ai = ai =⇒ ãi = aj ẽi |ej i

ẽ ai = ã


2. o equivalentemente, bajo una transformación de coordenadas xi = xi x̃j con i, j = 1, 2, 3, · · · , n.,
estas cantidades transforman como
∂ x̃i k ∂ xi k ∂ xi ∂ x̃k
ãi = a ⇐⇒ ai = ã con = δli
∂ xk ∂ x̃k ∂ x̃k ∂ xl
∂ x̃i ∂ xi
y donde las cantidades ∂ xk
y ∂ x̃k
deberán ser evaluadas en el punto P .
ReDefinición Un conjunto de cantidades {b1 , b2 , · · · , bn } se denominarán

componentes covariantes de un vector
hb| ∈ V ∗ en un punto P de coordenadas x1 , x2 , · · · , xn si

1. dada dos base de formas e1 , e2 , · · · hen | y ẽ1 , ẽ2 , · · · hẽn | se cumple que

j
i hb| ei = bi

hb| = bj e = b̃i ẽ =⇒ =⇒ b̃i = bj hej ẽi
hb| ẽi = b̃i

2. o equivalentemente, bajo una transformación de coordenadas xi = xi x̃j con i, j = 1, 2, 3, · · · , n.,
estas cantidades transforman como
∂ xi ∂ x̃i ∂ xi ∂ x̃k
b̃k = bi ⇐⇒ bk = b̃i con = δli
∂ x̃k ∂ xk ∂ x̃k ∂ xl
∂ x̃i ∂ xi
y donde las cantidades ∂ xk
y ∂ x̃k
ReDefinición Generalizamos los conceptos anteriores de la siguiente manera. Dado un conjunto bases para de formas
diferenciales {hxm (1)| , hy n (2)|} hemos definido las componentes contravariantes de un tensor
 i 
hx (1)| hyj (2)|
 ↓ ↓ 
T ij =T  • , • ∈V ⇐⇒ T ij ≡ T 11 , T 12 , · · · , T 1n , T 21 , T 22 , · · · , T 2n , · · · , T nn

ahora, en esta visión, las componentes contravariantes en un puntoP de coordenadas x1 , x2 , · · · , xn ,serán
aquella que bajo una transformación de coordenadas xi = xi x̃j con i, j = 1, 2, 3, · · · , n., estas canti-
dades transforman como
∂ x̃i ∂ x̃j km ∂ xi ∂ xj km ∂ xi ∂ x̃k
T̃ ij = T ⇐⇒ T ij = T̃ con = δli
∂ xk ∂ xm ∂ x̃k ∂ x̃m ∂ x̃k ∂ xl
i i
y donde ∂∂ xx̃k y ∂∂ x̃xk deberán ser evaluadas en el punto P . Esta generalización nos permite construir
el caso más general.

ReDefinición Si {|ti (1)i , |uj (2)i , · · · , |vk (m)i} y hxe (1)| , y f (2) , · · · , hz g (n)| son bases para los vectores y las
formas, respectivamente. Las componentes de un tensor serán
 
|vk (m)i hxe (1)| hy (2)|
f
|ti (1)i |uj (2)i hz g (n)|
mn  ↓ ↓ ↓ ↓ ↓ ↓ 
Tijk = T  ◦ , ◦, , · · · , ◦ ; • , • , · · · , • 

1···1 2···1 ···1 ñ···1 ñ···1 1···1 ñ···ñ

un conjunto de cantidades T1···1 , T1···1 , · · · , T1···1 , T1···1 , T2···1 , · · · , Tm̃···1 , · · · , Tm̃··· m̃ se denomi-
narán componentes contravariantes y covariantes, respectivamente, de un tensor mixto en unpun-
to P de coordenadas x1 , x2 , · · · , xn si bajo una transformación de coordenadas xi = xi x̃j con
i, j = 1, 2, 3, · · · , n., estas cantidades transforman como
i···k ∂ x̃i ∂ x̃j ∂ xa ∂ xd p···q i···k ∂ xi ∂ xj ∂ x̃a ∂ x̃d p···q

T̃e···g = ··· ··· T ⇐⇒ Te···g = ··· ··· T
∂x p q
∂ x ∂ x̃ e ∂ x̃g a···d ∂ x̃p q
∂ x̃ ∂ x e ∂ xg a···d
∂ xi ∂ x̃k ∂ x̃i ∂ xi
con ∂ x̃k ∂ xl
= δli y donde las cantidades ∂ xk
y ∂ x̃k
3.6.1. Un ejemplo
Ilustremos ahora las transformaciones de tensores bajo cambios de la base del espacio vectorial. Una vez
más consideremos dos bases de vectores coordenados {|e1 i , |e2 i , |e3 i} y {|ẽ1 i , |ẽ2 i , |ẽ3 i} para el espacio
vectorial ℜ3 La expresión de un determinado tensor en la base {|e1 i , |e2 i , |e3 i} será
 
2 1 3
{|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} =⇒ Tji =  2 3 4 
1 2 2
Si consideramos una nueva base

 
1



 |ẽ1 i = |ii ẽ |ẽ1 i = 1 ẽ1 |ẽ2 i = 1 ẽ1 |ẽ3 i = 1

  
 
2


{|ẽ1 i , |ẽ2 i , |ẽ3 i} ⇒ |ẽ2 i = |ii + |ji ⇐⇒ 
 ẽ |ẽ1 i = 1 ẽ2 |ẽ2 i = 2 ẽ2 |ẽ3 i = 2 


  


3


|ẽ3 i = |ii + |ji + |ki ẽ |ẽ1 i = 1 ẽ3 |ẽ2 i = 2 ẽ3 |ẽ3 i = 3
para ese mismo espacio ℜ3 encontraremos la expresión que toma Tji en esa base. Igualmente encontraremos las

expresiones para los siguientes tensores: T̃ij , T̃ij , T̃ ij . Nótese que

esta nueva base no es ortogonal , ẽk |ẽi i =
6
δik , con lo cual no se cumplen muchas cosas entre ellas |ẽk i ẽk 6= 1
Para encontrar la expresión T̃ji lo haremos expresando los vectores base {|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki}
en término de la base {|ẽ1 i , |ẽ2 i , |ẽ3 i}


 |e1 i = |ii = |ẽ1 i



{|e1 i , |e2 i , |e3 i} =⇒ |e2 i = |ji = |ẽ2 i − |ẽ1 i





|e3 i = |ki = |ẽ3 i − |ẽ2 i
recordamos que un vector genérico
|ai = aj |ej i = ãj |ẽj i =⇒
|ai = aj |ej i = ã1 |ẽ1 i + ã2 |ẽ2 i + ã3 |ẽ3 i = ã1 |e1 i + ã2 (|e1 i + |e2 i) + ã3 (|e1 i + |e2 i + |e3 i)
con lo cual
a1 |e1 i + a2 |e2 i + a3 |e3 i = ã1 + ã2 + ã3 |e1 i + ã2 + ã3 |e2 i + ã3 |e3 i

y como

 ∂ x1 ∂ x1 ∂ x1
 
 ∂ x̃1 = 1; ∂ x̃2 = 1; ∂ x̃3 = 1;


a1 = ã1 + ã2 + ã3  
∂ xi k ∂ x2 ∂ x2 ∂ x2
a2 = ã2 + ã3 =⇒ ai = ã =⇒ ∂ x̃1 = 0; ∂ x̃2 = 1; ∂ x̃3 = 1;
 ∂ x̃k 

a3 = ã3 


 ∂ x3 ∂ x3 ∂ x3
∂ x̃1 = 0; ∂ x̃2 = 0; ∂ x̃3 = 1;
Es de hacer notar que dado que la base ortonormal {|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} se tiene que

∂ xi
|ai = aj |ej i = ãi |ẽi i =⇒ ei ai = aj ei |ej i = aj δji = ai = ãk ei |ẽk i =⇒ k

= ei |ẽk i
∂ x̃
El mismo procedimiento se puede aplicar para expresar el vector |ai como combinación lineal de los vectores
|ẽj i
|ai = ãj |ẽj i = aj |ej i = a1 |e1 i + a2 |e2 i + a3 |e3 i = a1 |ẽ1 i + a2 (|ẽ2 i − |ẽ1 i) + a3 (|ẽ3 i − |ẽ2 i)

 ∂ x̃1 ∂ x̃1 ∂ x̃1
 
 ∂ x1 = 1; ∂ x2 = −1; ∂ x3 = 0;


ã1 = a1 − a2  k 
∂ x̃ ∂ x̃2 ∂ x̃2 ∂ x̃2
ã2 = a2 − a3 =⇒ ãk = ai i
=⇒ ∂ x1 = 0; ∂ x2 = 1; ∂ x3 = −1;
 ∂ x 

ã3 = a3 


 ∂ x̃3 ∂ x̃3 ∂ x̃3
∂ x1 = 0; ∂ x2 = 0; ∂ x3 = 1;
Nótese que, como era de esperarse,

    
1 1 1 1 −1 0 1 0 0
∂ xi ∂ x̃k
= δji =⇒  0 1 1  0 1 −1  =  0 1 0 
∂ x̃k ∂ xj
0 0 1 0 0 1 0 0 1
Con las expresiones matriciales para las transformaciones ,estamos en capacidad de calcular, componente a
componente, las representación del tensor en la nueva base con lo cual
k ∂ x̃k ∂ xj i
T̃m = T =⇒
∂ xi ∂ x̃m j

∂ x̃1 ∂ xj ∂ x̃1 ∂ x1 2 3
T̃11 = Tji = T 1 + ∂ x1 T 1 + ∂ x1 T 1
∂ xi ∂ x̃1 ∂ x1 ∂ x̃1 1 1 ∂ x̃ 2 2 ∂ x̃ 3
x̃1 x3
+ ∂∂ ∂ x
1 T
2
+ ∂∂ x̃x1 T22 + ∂∂ T32
x2 ∂ x̃1 1 x̃1
x̃1 ∂ x2 x3
+ ∂∂ x3
∂ x 3 3
∂ x̃1 T1 + ∂ x̃1 T2 + ∂
∂
x̃1 T33
es decir
∂ x̃1 ∂ xj
T̃11 = ∂ xi ∂ x̃1 Tji = 1 · 1 T11 + 0 T21 + 0 T31
−1 · 1 T12 + 0 T22 + 0 T32
+0 1 T13 + 0 T23 + 0 T33
∂ x̃1 ∂ xj
T̃11 = ∂ xi ∂ x̃1 Tji = T11 − T12 = 2 − 2 = 0

del mismo modo

∂ x̃1 ∂ xj ∂ x̃1 ∂ x1 2 3
T̃21 = Tji = T 1 + ∂ x2 T 1 + ∂ x2 T 1
∂ xi ∂ x̃2 ∂ x1 ∂ x̃2 1 1 ∂ x̃ 2 2 ∂ x̃ 3
x̃1 x3
+ ∂∂ ∂ x
2 T
2
+ ∂∂ x̃x2 T22 + ∂∂ T32
x2 ∂ x̃1 1 x̃2
x̃1 ∂ x2 x3
+ ∂∂ x3
∂ x 3 3
∂ x̃2 T1 + ∂ x̃2 T2 + ∂
∂
x̃2 T33
es decir
∂ x̃1 ∂ xj
T̃21 = ∂ xi ∂ x̃2 Tji = 1 · 1 T11 + 1 T21 + 0 T31
−1 · 1 T12 + 1 T22 + 0 T32
+0 1 T13 + 1 T23 + 0 T31
∂ x̃1 ∂ xj

T̃21 = ∂ xi ∂ x̃1 Tji = T11 + T21 − T12 + T22 = (2 + 1) − (2 + 3) = −2
k j
se puede continuar término a término o realizar la multiplicación de las matrices ∂∂ x̃xi , Tji y ∂∂ x̃xm provenientes
de la transformación de componentes de tensores. Vale decir
     
k j 1 −1 0 2 1 3 1 1 1 0 −2 −3
∂ x̃ ∂ x
k
T̃m = Ti ⇔ 0 1 −1   2 3 4   0 1 1  =  1 2 4 
∂ xi j ∂ x̃m
0 0 1 1 2 2 0 0 1 1 3 5
hay que resaltar un especial cuidado que se tuvo en la colocación de la matrices para su multiplicación. Si
k j k
bien en la expresión T̃m k
= ∂∂ x̃xi ∂∂ x̃xm Tji las cantidades ∂∂ x̃xi son números y no importa el orden con el cual
se multipliquen, cuando se colocan como matrices debe respetarse la “concatenación interna de ı́ndices”.
k
Esto es cuando queramos expresar T̃m como una matriz, donde el ı́ndice contravariante k indica filas y el
ı́ndice covariante m las columnas, fijamos primero estos ı́ndices y luego respetamos la “concatenación ı́ndices”
covariantes con los contravariantes. Esta es la convención para expresar la multiplicación de matrices en la
notación de ı́ndices2 . Esto es
k ∂ x̃k ∂ xj i k ∂ x̃k i ∂ xj
T̃m = T =⇒ T̃m = T
∂ xi ∂ x̃m j ∂ xi j ∂ x̃m
k j
Ahora los objetos ∂∂ x̃xi , Tji y ∂∂ x̃xm pueden ser sustituidos (en sus puestos correspondientes) por su represen-
tación matricial.
k
Con lo cual hemos encontrado la representación matricial T̃m de las componentes del tensor T en la base
{|ẽ1 i , |ẽ2 i , |ẽ3 i}
 1 
T̃1 = 0 T̃21 = −2 T̃21 = −3
 T̃12 = 1 T̃22 = 2 T̃32 = 4 
3 3
T̃1 = 1 T̃2 = 3 T̃33 = 5
n
Para encontrar la expresión para T̃km recordamos que T̃km = g̃kn T̃m es decir, requerimos las componentes
covariantes y contravariantes del tensor métrico g̃kn que genera esta base. Para ello recordamos que para una
base genérica, {|ẽj i} , no necesariamente ortogonal, de un espacio vectorial con producto interno, podemos
2 Quizá una forma de comprobar si los ı́ndices está bien concatenados se observa si se “bajan” los ı́ndices contravariantes
pero se colcan de antes que los covariantes. Esto es Tji → Tij Ası́ la multiplicación de matrices queda representada por
Cji = Aik Bjk → Cij = Aik Bkj y aquı́ es claro que ı́nidices consecutivos están “concatenados” e indican multiplicación


0
definir la expresión de un tensor que denominaremos tensor métrico como
2
|ẽ |ẽj i

ii
↓ ↓
g  ◦ , ◦,  = g̃ij ≡ g̃ji =⇒ g̃ij ≡ g̃ji = g [|ẽi i , |ẽj i] ≡ hẽi |ẽj i ≡ hẽj |ẽi i
 i 
hẽ | hẽj |
 ↓ ↓  −1
g  • , •  = g̃ ij ≡ g̃ ij =⇒ g̃ ij ≡ g̃ ij = (g̃ij )
Es de hacer notar que la representación matricial para la métrica covariante gij de una base ortonormal
{|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} es siempre diagonal. Esto es
g11 = he1 |e1 i = hi |ii = 1; g12 = he1 |e2 i = hi |ji = 0; g13 = he1 |e2 i = hi |ji = 0;
g21 = he2 |e1 i = hj |ii = 0; g22 = he2 |e2 i = hj |ji = 1ñ; g23 = he2 |e3 i = hj |ki = 0;
g31 = he3 |e1 i = hk |ii = 0; g32 = he3 |e2 i = hk |ji = 0; g33 = he3 |e3 i = hk |ki = 1;
con lo cual 
n
hTm i 
  


 0 −2 −3
n
hTkm i ≡ hgkn Tm i =⇒  1 2 4 




 1 3 5
m 
hT nm i ≡ g nk Tk
donde hemos denotado h•i como la representación matricial del objeto
Para el caso de la base genérica no ortonormal {|ẽj i} tenemos dos formas de calcular el tensor (las
componentes covariantes y contravariantes) del tensor métrico. La primera es la forma directa
g̃11 = hẽ1 |ẽ1 i = hi |ii = 1; g̃12 = hẽ1 |ẽ2 i = hi| (|ii + |ji) = 1;
g̃21 = hẽ2 |ẽ1 i = (hi| + hj|) |ii = 1; g̃22 = hẽ2 |ẽ2 i = (hi| + hj|) (|ii + |ji) = 2
g̃31 = hẽ3 |ẽ1 i = (hi| + hj| + hk|) |ii = 1; g̃32 = hẽ3 |ẽ2 i = (hi| + hj| + hk|) (|ii + |ji) = 2;
y
g̃13 = hẽ1 |ẽ3 i = hi| (|ii + |ji + |ki) = 1;
g̃23 = hẽ2 |ẽ3 i = (hi| + hj|) (|ii + |ji + |ki) = 2
g̃33 = hẽ3 |ẽ3 i = (hi| + hj| + hk|) (|ii + |ji + |ki) = 3

consecuentemente
   
1 1 1 2 −1 0
 1 −1
g̃ij ≡ g̃ji ⇐⇒ 2 2  =⇒ g̃ ij
≡ g̃ ij
= (g̃ij ) ⇐⇒  −1 2 −1 
1 2 3 0 −1 1

La otra forma de calcular la métrica correspondiente la base ortonormal {|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} y
transformarla a la base no ortonormal {|ẽ1 i , |ẽ2 i , |ẽ3 i} ≡ {|ii , |ii + |ji , |ii + |ji + |ki} esto es
∂ xi ∂ xj ∂ xi ∂ xj
g̃km = gij =⇒ g̃km = gij
∂ x̃k ∂ x̃m ∂ x̃k ∂ x̃m
1
La métrica para el la base ortonormal será diagonal y además gii = g ii , con lo cual
     
1 0 0 1 0 0 1 0 0
gij ⇐⇒  0 1 0 ; g ij ⇐⇒  0 1 0 ; gji ⇐⇒  0 1 0 ;
0 0 1 0 0 1 0 0 1
y      
1 0 0 1 0 0 1 1 1 1 1 1
∂ xi ∂ xj
g̃km = k
gij ; 1 1 0  0 1 0  0 1 1 = 1 2 2 
∂ x̃ ∂ x̃m
1 1 1 0 0 1 0 0 1 1 2 3
nótese para conservar la convención de ı́ndices y matrices hemos representado que hemos traspuesto la matriz
i
correspondiente a ∂∂ x̃xk . La razón, como dijimos arriba es
∂ xi ∂ xj
g̃km = k
gij −→ g̃km = Πik gij Πjm −→ g̃km = Π̄ki gij Πjm
∂ x̃ ∂ x̃m
Para poder representar multiplicación de matrices los ı́ndices deben estar consecutivos, por tanto hay que
trasponer la representación matricial para poder multiplicarla.
Ya estamos en capacidad de obtener las representaciones matriciales para los tensores: T̃ij , T̃ij , T̃ ij .
 T  
D E D ET 0 −2 −3 0 1 1 D E
T̃ij = T̃ji −→  1 2 4  =  −2 2 3  −→ T̃ij
1 3 5 −3 4 5
    
D E D E 1 1 1 0 −2 −3 2 3 6 D E
n
T̃km = g̃kn T̃m −→  1 2 2  1 2 4 = 4 8 15  −→ T̃km
1 2 3 1 3 5 5 11 20
    
D E D E 0 −2 −3 1 1 1 −5 −10 −13 D E
T̃ kn = T̃m
n mk
g̃ → 1 2 4  1 2 2 = 7 13 17  → T̃ km
1 3 5 1 2 3 9 17 22
3.7. Teorema del Cociente

Al igual que existe el producto directo entre tenores, cabe preguntarse si es posible multiplicar una
componente de un tensor por otra de otro tensor y el producto ¿ será un tensor ? Existe importantes
situaciones fı́sicas en las cuales es aplicable esta pregunta. Si Tij son las componentes de un tensor de rango
2 y V i ¿ el producto Tij V i = Bj serán componentes de un vector ? La respuesta no es siempre afirmativa, y
puede ser utilizado como un criterio de cuando una componente es un tensor. Este criterio que se denomina
el Teorema del Cociente.
La respuesta a esta pregunta surge de una respuesta a una pregunta distinta pero equivalente. Dados n2
números aij y un (una componente de un) vector genérico V i , entonces la cantidad si aij V i V j es un escalar


1 0
entonces la parte simétrica a(ij) = 2 (aij + aji ) será un (una componente de) tensor . La demostración
2
involucra algunos de los conceptos antes expuesto y la haremos para fijar conceptos.
Dados dos sistemas de coordenadas xi = xi (x̃m ) y x̃j = x̃j (xm ) con i, j = 1, 2, 3, · · · , n se cumple que
aij xi xj = ψ = ψ̃ = ãij x̃i x̃j donde ψ = ψ̃ constituye un escalar
y por lo tanto derivando y utilizando la regla de la cadena
∂xi ∂ xi ∂ x̃k
xi = xi x̃j (xm ) =⇒ l
= = δli =⇒
∂x ∂ x̃k ∂ xl

∂ x̃k ∂ x̃l
aij xi xj − ãij x̃i x̃j ≡ aij − ãkl xi xj = 0
∂ xi ∂ xj
como hay una suma en ij no se puede afirmar la cantidad del paréntesis se anula. Como esta afirmación vale
para cualquier sistema de coordenadas Seleccionaremos las componentes coordenadas en la base canónica.
x1 = (1, 0, 0, · · · , 0) ; x2 = (0, 1, 0, · · · , 0) ; · · · · · · xn = (0, 0, 0, · · · , 1)
con lo cual
∂ x̃k ∂ x̃l ∂ x̃k ∂ x̃l ∂ x̃k ∂ x̃l
a11 − ãkl = 0; a22 − ãkl = 0; · · · · · · ann − ãkl =0
∂ x1 ∂ x1 ∂ x2 ∂ x2 ∂ xn ∂ xn
1 1
como siempre podemos hacer ã(kl) = 2 (ãkl + ãlk ) y ã[kl] = 2 (ãkl − ãlk ) y separar el tensor
∂ x̃k ∂ x̃l
ãkl = ã(kl) + ã[kl] =⇒ a(hh) − ã(kl) + ã[kl] =0 =⇒
∂ xh ∂ xh
∂ x̃k ∂ x̃l
a(hh) − ã(kl) =0
∂ xh ∂ xh
con lo cual se garantiza que la parte simétrica de un tensor transforma como un verdadero tensor una vez
que se contrae con un par de vectores.
3.8. Temas avanzados

3.8.1. Bases Discretas y Continuas
Haremos una disgresión para fijar conceptos y extender algunos de los razonamientos que hemos desa-
rrollado hasta aquı́. Tal y como vimos arriba, la representación de un vector |Fi en un espacio vecto-
rial abstracto V puede darse en término de una base ortonormal de vectores (discreta y finita BDF =
{|u1 i , |u2 i , |u3 i , · · · |un i} o discreta e infinita BDI = {|u1 i , |u2 i , |u3 i · · · |un i · · · }) de la forma:


 ci |ui i = ui Fi |ui i ⇐ BDF = {|u1 i , |u2 i , |u3 i · · · |un i}
|Fi =

 i
c |vi i = ui Fi |ui i ⇐ BDI = {|u1 i , |u2 i , |u3 i · · · |un i · · · }

ci = ui Fi = cj ui |uj i = cj δji

Ahora bien, si estamos tratando el espacio vectorial de funciones de cuadrado integrable L2 ,definidas en ℜ3
tendremos que
∞ Z ∞
X

|Fi = ci |ui i ≡ ui Fi |ui i = d3 r′ u∗i (r′ ) f (r′ ) |ui i
i=0 −∞
que se reescribe en términos de funciones como

∞ Z
X ∞
f (r) = d3 r′ u∗i (r′ ) f (r′ ) ui (r)
i=0 −∞
R P
Es claro que se pueden intercambiar los sı́mbolos de y , por lo cual
Z " ∞
#
∞ X
3 ′ ′
f (r) = d r f (r ) u∗i ′
(r ) ui (r)
−∞ i=0
| {z }
G(r′ ,r)
la función G(r′ , r) que depende de los argumentos, r′ y r, vive dentro de las integrales y convierte
Z ∞
f (r) = d3 r′ f (r′ ) G(r′ , r)
−∞
Este tipo de funciones que apareció en el capı́tulo de transformadas integrales se conoce como la función
distribución delta de Dirac Z ∞
f (r) = d3 r′ f (r′ ) δ(r′ − r)
−∞
Esto sugiere la generalización de bases discretas a continua |wα i de tal forma que transformamos el ı́ndice
de la sumatoria en la variable de una integral
Z
|Ψi = dα c (α) |wα i
donde Z Z
c (β) = hwβ |Ψi = dα c (α) hwβ |wα i = dα c (α) δ (α − β)
con en la cual δ (α − β) es una Delta de Dirac. Ası́, los dos conceptos expresados hasta ahora tienen una
expresión:
Propiedad\Base
Discreta Continua
Ortogonalidad vi |v i = δj
i hwβ R|wα i = δ (α − β)
P∞ j
Cierre 1 = j=0 |vj i vj 1 = dα |wα i hwα |
P∞ R
Expansión |Fi =
i=0ci |ui i |Ψi = dα c (α) |wα i
Componentes ci = Pui Fi c (β)R= hwβ |Ψi
∞
Producto Interno hG| Fi = i=0 g i∗ fi hG| Fi = dα g ∗ (α) f (α)
P∞ 2 R 2
Norma hF| Fi = i=0 |fi | hF| Fi = dα |f (α)|

3.8.2. Bases de Ondas Planas

Como un ejemplo de lo anterior consideraremos la base de las ondas planas. En el capı́tulo de transfor-
madas integrales consideramos un caso particular de las transformada de Fourier compleja para una función,
vale decir Z ∞ Z ∞
F (s) = dt ei st
f (t) ⇄ f (t) = ds e−i st
F (s)
−∞ −∞
las cuales re-escribiremos en términos más familiares a la comunidad de fı́sicos como
Z ∞ Z ∞
1 1
ψ (x) = √ dp ei px/~ ψ̄ (p) ⇄ ψ̄ (p) = √ dx e−i px/~
ψ (x)
2π~ −∞ 2π~ −∞
Hemos tenido cuidado de incluir los factores de normalización adecuados para el caso de las descripciones
en mecánica Cuántica. Estas fórmulas pueden ser re-interpretadas en función de los conceptos anteriormente
expuestos y podemos definir una base continua de la forma
Z ∞ Z ∞
1 1 1 1
ψ (x) = √ dp √ ei px/~ ψ̄ (p) ⇄ ψ̄ (p) = √ dx √ e−i px/~ ψ (x)
2π~ −∞ 2π~ 2π~ −∞ 2π~
| {z } | {z }
vp (x) vpx (x)
por lo cual Z Z
∞ ∞
ψ (x) = dp vp (x) ψ̄ (p) ⇄ ψ̄ (p) = dx vp∗ (x) ψ (x)
−∞ −∞
Diremos que la función ψ (x) está expresada en la base de ondas planas vp (x) = √ 1 ei px/~
2π~
Nótese
El ı́ndice p de vp (x) varı́a de forma continua entre −∞ e ∞.

1
Que vp (x) = √2π~ ei px/~ ∈/ L2 es decir no pertenece al espacio vectorial de funciones de cuadrado
integrable ya que su norma diverge
Z ∞ Z ∞
2 1
hvp | vp i = dx |vp (x)| = dx →∞
−∞ −∞ 2π~
Que las proyecciones de ψ (x) sobre la base de ondas planas es ψ̄ (p) = hvp | ψi
La relación de cierre para esta base se expresa como
Z Z ∞ Z ∞
1 i p(x′ −x)/~
1= dα |vα i hvα | ⇄ dp vp∗ (x′ ) vp (x) = dp e = δ (x′ − x)
−∞ −∞ 2π~
mientras que de la definición de producto interno, uno obtiene
Z ∞ Z ∞
1 i x(p′ −p)/~
hvp′ | vp i = dx vp∗′ (x) vp (x) = dp e = δ (p′ − p)
−∞ −∞ 2π~
En este mismo orden de ideas podemos construir otra base continua ξr0 (r) a partir de la utilización de
las propiedades de la delta de Dirac. Esto es
Z ∞ Z ∞
3
ψ (r) = d r0 ψ (r0 ) δ(r0 − r) ⇄ ψ (r0 ) = d3 r ψ (r) δ (r − r0 )
−∞ | {z } −∞
ξr0 (r)

por lo cual la re-interpretación es inmediata

Z ∞ Z ∞
ψ (r) = d3 r0 ψ (r0 ) ξr0 (r) con ψ (r0 ) = hξr0 | ψi = d3 r ξr∗0 (r) ψ (r)
−∞ −∞
más aún la ortogonalidad queda garantizada por la relación de cierre

Z ∞ Z ∞
3 ∗ ′
hξr0 | ξr0 i = d r0 ξr0 (r) ξr0 (r ) = d3 r0 δ (r − r0 ) δ (r′ − r0 ) = δ (r′ − r)
−∞ −∞
al igual que
Z ∞ Z ∞

hξr0 | ξr′0 = d3 r ξr∗0 (r) ξr′0 (r) = d3 r δ (r − r0 ) δ (r − r′0 ) = δ (r′0 − r0 )
−∞ −∞
3.8.3. Las Representaciones |ri y |pi

A partir de las bases de ondas planas vp0 (x) ,y de distribuciones, ξr0 (r) , construimos las llamadas
representaciones |ri y |pi de la forma siguiente. Asociamos
ξr0 (r) ⇄ |r0 i
vp0 (x) ⇄ |p0 i
De esta forma dada las bases {ξr0 (r)} y {vp0 (x)} para el espacio vectorial V definiremos dos “representa-
ciones”, la representación de coordenadas, |r0 i , y la representación de momentos |p0 i de V,respectivamente.
De tal modo que
Z ∞
hr0 | r′0 i = d3 r ξr∗0 (r) ξr′0 (r) = δ (r′0 − r0 )
−∞
Z
1 = d3 r0 |r0 i hr0 |
Z ∞ Z ∞
1 −i r0 ·p0 /~
hp0 | p′0 i = d3 r vp∗′0 (r) vp0 (r) = d3 r e = δ (p′0 − p0 )
−∞ −∞ 2π~
Z
1 = d3 p0 |p0 i hp0 |
Podemos, entonces expresar el producto interno para la representación de coordenadas como

Z Z
hΦ |Ψi = hΦ| 3
d r0 |r0 i hr0 | |Ψi = d3 r0 φ∗ (~r0 )ψ(~r0 )
| {z }
1
y equivalentemente para la representación de momentos

Z Z
hΦ |Ψi = hΦ| d p0 |p0 i hp0 | |Ψi = d3 p0 φ∗ (~
3
p0 )ψ(~
p0 )
| {z }
1

por lo cual hemos encontrado que

Z Z
|Ψi = d3 r0 |r0 i hr0 | Ψi = d3 p0 |p0 i hp0 | Ψi
ψ(~r0 ) = hr0 |Ψi y p0 ) = hp0 |Ψi

ψ(~
que es la representación de |Ψi en coordenadas, ψ(r0 ), y en momentos, ψ(p0 ). Adicionalmente cuando

|Ψi = |pi tendremos que
Z Z
−3/2 i
hr0 |p0 i = hr0 | d3 r0′ |r′0 i hr′0 | |p0 i = (2π~) d3 r0′ δ (~r0′ − ~r0 ) e ~ p~0 ·~r0
| {z }
1
−3/2 i
hr0 |p0 i = (2π~) e ~p~0 ·~
r0
con lo cual ψ(p0 ) puede considerarse la transformada de Fourier de ψ(r0 ), y denotaremos de ahora en ade-
lante las bases |r0 i ≡ |ri y |p0 i ≡ |pi . Estos ı́ndices continuos, r0 y p0 ,representan tres ı́ndices continuos
r ⇋ (x, y, z) y p ⇋ (px , py , pz ) . La proyección de un vector abstracto |Ψi en la representación |ri será con-
siderada como su expresión en el espacio de coordenadas, igualmente su proyección hp |Ψi será su expresión
en el espacio de los momentos. Eso nos permitirá hacer corresponder los elementos de espacios vectoria-
les abstractos con, con elementos de un espacio vectorial de funciones. Por lo tanto todas las fórmulas de
proyección quedan como
hr |Ψi = ψ(r) y hp |Ψi = ψ(p)
mientras que las relaciones de cierre y ortonormalización
Z
hr| r′ i = δ (r′ − r) y 1= d3 r |ri hr|
Z
′
hp| pi = δ (p − p) y 1= d3 p |pi hp|
por su parte, la relación de cierre hará corresponder a la expresión del el producto interno de dos vectores,
tanto en la representación de las coordenadas como en la representación de momentos de la forma
Z Z
hΦ| d3 r |ri hr| |Ψi = d3 r φ∗ (r) ψ(r)
m
hΦ |Ψi
m
Z Z
hΦ| d3 p |pi hp| |Ψi = d3 p φ̄∗ (p) ψ̄(p)
donde φ̄∗ (p) y ψ̄(p) son las transformadas de Fourier de φ∗ (r) y ψ(r), respectivamente. La afirmación anterior
queda evidentemente demostrada del cambio entre las bases |ri y |pi . Esto es
∗ −3/2 i
hr |pi = hp |ri = (2π~) e ~ p·r
por lo cual
Z Z Z
−3/2 i
ψ(r) = hr |Ψi = hr| d3 p |pi hp| |Ψi = d3 p hr |pi hp| Ψi = (2π~) d3 p e ~ p·r ψ̄(p)

e inversamente
Z Z Z
−3/2 −i
ψ(p) = hp |Ψi = hp| d3 r |ri hr| |Ψi = d3 r hp |ri hr| Ψi = (2π~) d3 r e ~ p·r ψ(r)

Bibliografı́a
York)
[5] Gel´fand, I.M. (1961) Lectures on Linear .Algebra (John Wiley & Sons Interscience, Nueva York ).
[6] Lovelock, D, y Rund, H. (1975) Tensors, Differential Forms & Variational Principles (John Wiley
Interscience, Nueva York ).
Londres)
123
Capı́tulo 4
Coordenadas Curvilineas
124
4.1. Disgreción Derivativa

Los vectores podrán ser constantes o variables. Ahora bién esa caracterı́stica se verificará tanto en las
componentes como en la base. Esto quiere decir que cuando un vector es variable podrán variar su módulo, su
dirección, su sentido o todo junto o separado. Obviamente esta variabilidad del vector dependerá de la base
en la cual se exprese, por lo cual un vector podrá tener una componente constante en una base y constante
en otra.
|ai(t) = ak (t) |ek i(t) = ãk |ẽk i(t) = âk (t) |êk i
De esta manera, cuando uno piensa en un vector variable |ai(t) ⇐⇒ ~a (t) uno rápidamente piensa en establecer
un cociente incremental

|ai(t+∆t) − |ai(t) ∆ |ai(t) d |ai(t)
lı́m = lı́m =
∆t→0 ∆t ∆t→0 ∆t dt
m
~a (t + ∆t) − ~a (t) ∆~a (t) d~a (t)
lı́m = lı́m =
∆t→0 ∆t ∆t→0 ∆t dt
La misma propuesta se cumplirá para las formas diferenciales (t) ha| . Como siempre, las propiedades de esta
operación serán

d |ai(t) + |bi(t) d |ai(t) d |bi(t)
= +
dt dt dt

d α (t) |ai(t) d (α (t)) d |ai(t)
= |ai(t) + α (t)
dt dt dt
 
!
d (t) ha |bi(t) d (t) ha| d |bi(t)
= |bi(t) + ha|(t)  
dt dt dt
Ahora bien, esto implica que

d |ai(t) d ak (t) |ek i(t) d ak (t) d |ek i(t)
|ai(t) = ak (t) |ek i(t) =⇒ = = |ek i(t) + ak (t)
dt dt dt dt
con lo cual hay que tener cuidado al derivar vectores y cerciorarse de la dependencia funcional de base y
componentes. Habrá sistemas de coordenadas (bases de vectores) que sean constantes y otros con bases
variables. Ası́, el radio vector posición de una partı́cula genera los vectores velocidad y aceleración.
d (~r (t)) d (~v (t)) d2 (~r (t))

~r = ~r (t) =⇒ ~v (t) = =⇒ ~a (t) = =
dt dt dt2
ahora bien
~r ≡ |ri = rP |ur i = xP |ii + yP |ji + zP |ki con |ur i = cos θ |ii + sen θ |ji

si suponemos que la partı́cula describe un movimiento entonces

 
rP = rP (t)   x = x (t) |ii = const
⇐⇒ y = y (t) ; |ur i = |ur i(t) ; |ji = const
 
θ = θ (t) z = z (t) |ki = const
con lo cual
d (|ur i) d (cos θ (t) |ii + sen θ (t) |ji) dθ (t) dθ (t)
= = − (sen θ (t)) |ii + cos θ (t) |ji
dt dt dt dt
d (|ur i) dθ (t) dθ (t)

= [− (sen θ (t)) |ii + cos θ (t) |ji] = |uθ i
dt dt | {z } dt
|uθ i
ya que
p p
k|ur ik = hur |ur i = [cos θ (t) hi| + sen θ (t) hj|] [cos θ (t) |ii + sen θ (t) |ji] = 1
p p
k|uθ ik = huθ |uθ i = [− (sen θ (t)) hi| + cos θ (t) hj|] [− (sen θ (t)) |ii + cos θ (t) |ji] = 1
y
hur |uθ i = huθ |ur i = [− (sen θ (t)) hi| + cos θ (t) hj|] [cos θ (t) hi| + sen θ (t) |ji] = 0
Más aún
d (|uθ i) d (− (sen θ (t)) |ii + cos θ (t) |ji) dθ (t)
= = − (cos θ (t) |ii + sen θ (t) |ji) = − |ur i
dt dt dt
Con lo cual, una partı́cula que describe un movimiento genérico vendrá descrita en coordenadas cartesianas
por
~r ≡ |ri = xP (t) |ii + yP (t) |ji + zP (t) |ki
y su velocidad será
d~r (t) d (|ri) d (xP (t) |ii + yP (t) |ji + zP (t) |ki)
~v (t) = = =
dt dt dt
d (xP (t)) d (yP (t)) d (zP (t))
= |ii + |ji + |ki = vxP (t) |ii + vyP (t) |ji + vzP (t) |ki
dt dt dt
y la aceleración
d (vxP (t)) d (vyP (t)) d (vzP (t))

~a (t) = |ii + |ji + |ki = axP (t) |ii + ayP (t) |ji + azP (t) |ki
dt dt dt
Mientras que en coordenadas polares será

d r (t)P |ur i(t) d (r (t)P ) d |ur i(t)
~r ≡ |ri = rP (t) |ur i(t) =⇒ ~v (t) = = |ur i(t) + r (t)P
dt dt dt
con lo cual la velocidad
dθ (t)
~v (t) = vr (t)P |ur i(t) + r (t)P |uθ i
dt

y la aceleración

dr(t)P dθ(t) dθ(t)
d (~v (t)) d dt |ur i(t) + r (t)P dt |uθ i d vr (t)P |ur i(t) d r (t)P dt |uθ i
~a (t) = = = +
dt dt dt dt

dr(t)P
d dt dr (t)P d |ur i(t)
~a (t) = |ur i(t) +
dt dt dt
dr (t)P dθ (t) d2 θ (t) dθ (t) d |uθ i(t)
+ |uθ i(t) + r (t)P |uθ i(t) + r (t)P
dt dt dt2 dt dt
 dr(t) 
d P 2 
dt dθ (t) dr (t)P dθ (t) d2 θ (t)
~a (t) = − r (t)P |ur i(t) + 2 + r (t)P |uθ i(t)
 dt dt  dt dt dt2
Claramente para el caso de un movimiento circular


 ~r (t) = R |ur i(t)




dR 
r = R = const =⇒ =0 =⇒ ~v (t) = R dθ(t)
dt |uθ i
dt 




 ~a (t) = −R dθ(t) 2 |u i + R d2 θ(t) |u i
dt r (t) dt2 θ (t)
De aquı́ podemos ver claramente que velocidad ~v (t) y posición ~r (t) son ortogonales. La velocidad, ~v (t) ,
siempre es tangente a la trayectoria ~r (t) y en este caso la trayectoria es una circunsferencia. En general el
vector
X X X Z
~rmed = ∆ ~r (ti ) = (~r (ti + ∆ti ) − ~r (ti )) =⇒ lı́m ∆ ~r (ti ) = d~r (t) = ~r (t)
∆t→0
i i i
P
es decir d~r (t) = lı́m∆t→0 ∆ ~r (ti ) es tangente a la trayectoria. Es claro que
i

∂xP (t) ∂yP (t) ∂zP (t)
d~r (t) = d [xP (t) |ii + yP (t) |ji + zP (t) |ki] ≡ |ii + |ji + |ki dt
∂t ∂t ∂t
4.2. Curvas y parámetros

Podemos generalizar esta afirmación y considerar un parámetro genérico λ, en este caso
~r = ~r (xP (λ) , yP (λ) , zP (λ)) =⇒

∂~r ∂xP (λ) ∂~r ∂yP (λ) ∂~r ∂zP (λ)
d~r (xP (λ) , yP (λ) , zP (λ)) = + + dλ
∂xP (λ) ∂λ ∂yP (λ) ∂λ ∂zP (λ) ∂λ

∂xP (λ) ∂~r ∂yP (λ) ∂~r ∂zP (λ) ∂~r
= + + dλ
∂λ ∂xP (λ) ∂λ ∂yP (λ) ∂λ ∂zP (λ)

con lo cual
d (•) ∂xP (λ) ∂ (•) ∂yP (λ) ∂ (•) ∂zP (λ) ∂ (•)
= + +
dλ ∂λ ∂xP (λ) ∂λ ∂yP (λ) ∂λ ∂zP (λ)

P (λ) ∂yP (λ) ∂zP (λ)
con lo cual podemos considerar las cantidades ∂x∂λ , ∂λ , ∂λ como las componentes del vector,
d(•)
d~r (λ) , (y en general del operador
dλ ) tangente ala trayectoria parametrizada con λ.
Más aún las cantidades ∂x∂(•) , ∂(•)
, ∂(•)
P (λ) ∂xP (λ) ∂zP (λ)
serán los vectores base en esas coordenadas.

Ası́ al considerar coordenadas generalizadas q (λ) , q 2 (λ) , q 3 (λ)
1

|ri = r̃ = r̃ q 1 (λ) , q 2 (λ) , q 3 (λ)
⇓
∂q 1 (λ) ∂~r ∂q 2 (λ) ∂~r ∂q 3 (λ) ∂~r
d~r q 1 (λ) , q 2 (λ) , q 3 (λ) = dλ 1 + dλ 2 + dλ 3
∂λ ∂q (λ) ∂λ ∂q (λ) ∂λ ∂q (λ)
m
dr̃ ∂q 1 (λ) ∂~r ∂q 2 (λ) ∂~r ∂q 3 (λ) ∂~r
= + +
dλ ∂λ ∂q 1 (λ) ∂λ ∂q 2 (λ) ∂λ ∂q 3 (λ)
| {z } | {z } | {z }
|q 1 i |q 2 i |q 3 i
n 2 3 o
donde q 1 = ∂q∂~r
1 (λ) , q = ∂q∂~
r
2 (λ) , q = ∂q∂~
r
3 (λ) , son la base de vectores.
Por otro lado el módulo del vector kd~r (λ)k representará la longitud de arco ds para esa curva. Por
consiguiente
d hdr(λ)| d |dr(λ)i ∂q i ∂ hdr(λ)| ∂q j ∂ |dr(λ)i

ds2 = hdr(λ) |dr(λ)i = (dλ)2 = (dλ)2
dλ dλ ∂λ ∂q i ∂λ ∂q j
∂ hdr(λ)| ∂ |dr(λ)i ∂q i ∂q j ∂ hdr(λ)| ∂ |dr(λ)i i j

= dλ dλ = dq dq
∂q i ∂q j |∂λ{z }|∂λ{z } ∂q i ∂q j
dq i dq j
d~
r (λ)
donde dλ es el vector tangente a la curva. Dado que
2 ∂ hdr(λ)| ∂ |dr(λ)i i j
(ds) = gij dxi dxj = g̃ij dx̃i dx̃j = ḡij dq i dq j = dq dq
∂q i ∂q j
| {z }
ḡij
identificamos claramente
∂ hdr(λ)| ∂ |dr(λ)i
≡ ḡij
∂q i ∂q j

Figura 4.1: Coordenadas Curvilı́neas en 2D.

Cuadrante I, coordenadas cilı́ndricas x = ρ cos ϕ; y = ρ sen ϕ; z = z
Cuadrante II, coordenadas cilı́ndricas elı́pticas x = a cosh u cos v; y = a senh u sen v; z = z
Cuadrante III coordenadas cilı́ndricas parabólicas x = 12 u − v 2 ; y = uv; z = z
2 2
Cuadrante IV coordenadas cilı́ndricas bipolares x2 + (y − a cot u) = a2 csc2 u; x − a senh v
cosh v +
a2
y 2 = senh2v; z = z
4.3. Coordenadas Curvilı́neas Generalizadas

Como hemos visto siempre se podrá definir un sistema de coordenadas generalizadas q 1 , q 2 , q 3 tales que
∂ r̃ 1 ∂ r̃ 2 ∂ r̃ 3
|ri = r̃ = r̃ q 1 , q 2 , q 3 =⇒ dr̃ = dq + dq + dq =⇒
∂ q1 ∂ q2 ∂ q3

 gij = ∂∂ qr̃i ∂∂ qr̃j
∂ r̃ ∂ r̃ 
2
(ds) = gij dxi dxj ≡ dr̃·dr̃ = dq i dq j =⇒
∂ qi ∂ qj 
 |ẽj i = ‚ 1 ‚ ∂ |ri
‚ ∂ |ri ‚ ∂ q j
‚ ∂ qj ‚
genere una trı́ada de vectors base {|ẽj i} ortonormales de vectores unitarios tales que
1 ∂ |ri 1 ∂ |ri 1 ∂ |ri

|ẽ1 i =
∂ |ri ∂ q 1 ; |ẽ2 i =
∂ |ri ∂ q 2 ; |ẽ3 i =
∂ |ri ∂ q 3 ;
∂ q1 ∂ q2 ∂ q3
los cuales son vectores tangentes a las curvas que define el radio vector |ri. Claramente si el sistema es
ortogonal los factores de escala son importantes para su categorización

∂ |ri ∂ |ri ∂ |ri
h1 =
; h2 = ; y h3 = ;
∂ q1 ∂ q2 ∂ q3

con lo cual podemos definir el elemento de lı́nea como

2 2 2 ∂ hdr(λ)| ∂ |dr(λ)i i j
ds2 = h1 dq 1 + h2 dq 2 + h3 dq 3 = dq dq = gij dq i dq j
∂q i ∂q j
Es decir que identificamos la métrica como
∂x ∂x1 √ ∂y ∂x2 √ ∂z ∂x3 √
h1 = = = g11 ; h2 = = = g22 ; h3 = = = g33 .
∂q 1 ∂q 1 ∂q 2 ∂q 2 ∂q 3 ∂q 3
De tal forma que los casos particulares se recuperan fácilmente.
4.3.1. Coordenadas generalizadas, vectores y formas

Recordando como construimos el desplazamiento para una base genérica ortogonal, {|ẽj i} de un espacio
vectorial con producto interno, el desplazamiento infinitesimal puede expresarse como

ds2 ≡ hdr |dri = d x̃k ẽk (d x̃m |ẽm i) = ẽk |ẽm i d x̃k d x̃m = d x̃m d x̃m = g̃km d x̃k d x̃m
Donde hemos utilizado el hecho que la métrica nos permite asociar componentes contravariantes a covariantes
y viceversa, es decir establece una relación entre formas y vectores.

Si las bases de formas y vectores son ortogonales la métrica será diagonal y como en general ∂|dr(λ)i
∂q j 6= 1,
entoces surgen los llamados factores de escala hi = gii
Entonces, una vez más, una forma hb| o, un vector |ai cualquiera puede expresarse como una combinación
lineal de formas o vectores base

|ai = aj |ej i = ãj |ẽj i ↔ hb| = bj ej = b̃j ẽj
con

aj = ej |ai ; ãj = ẽj |ai ; bj = hb |ej i ; y b̃j = hb |ẽj i

De esta manera las componentes covariantes y contravariantes estarán relacionadas como
aj = gjk ak ⇒ ai = h[i] a[i]
donde h[i] a[i] NO indica suma. En otras palabras, en aquellos sistemas de coordenadas en los cuales la métrica
es diagonal pero no viene representada por la matriz unidad, subir y bajar indices puede incluir los camibos
de escala.
4.3.2. Velocidades y Aceleraciones

Antes de pasar a analizar los casos particulares haremos un alto para expresar las expresiones de las
velocidades y las aceleraciones en coordenadas generalizadas. Para ello recordamos que los vectores velocidad
y aceleración se representan como
|V i = V j |ej i = ẋj |ej i = Ṽ j |ẽj i = x̃˙ j |ẽj i y ¨j |ẽj i

|ai = aj |ej i = ẍj |ej i = ãj |ẽj i = x̃
respectivamente. Para determinar las expresiones de estos vectores en cualquier sistema de coordenadas, es
suficiente con encontrar las expresiones de sus componentes contravariantes o contravariantes. Como sabemos,
podremos encontrar una a partir de las otras con la ayuda de la métrica del sistema de coordenadas.

Entonces, el vector velocidad en la base cartesiana se puede expresar como

E E E

|V i = Vx |ı̂i+Vy |̂i+Vz k̂ = ẋ |ı̂i+ẏ |̂i+ż k̂ = ẋj |ej i = q̇ j |ẽj i con |e1 i = |ı̂i ; |e2 i = |̂i ; y |e3 i = k̂ ,
claramente las componentes contravariantes del vector velocidad en un sistema de coordenadas generalizado
son V j = q̇ j
Para encontrar las componentes covariantes recordamos que para cualquier base generalizada de vectores
o formas se expresan en término de la base cartesiana (de vectores o formas) como
∂xi
i ∂q i
j
|ẽj i = |ei i y ẽ = e
∂q j ∂xj
Entoces las componentes covariantes del vector velocidad en una base generalizada será

i m ∂xm m ∂ Vm V m
∂x ∂x ∂ ẋ 2
Ṽj = hV |ẽj i = (ẋm hẽm |) ∂t
|ei i = ẋm j = ẋm ∂q j = ẋm j =
∂q j ∂q ∂ q̇ ∂ q̇ j
∂t
Con lo cual resulta fácil expresar las componentes covariantes una vez que conocemos el módulo del vector
expresado en ese sistema de coordenadas. El cual siempre viene expresado a partir del diferencial
d |ri
d |ri ⇒
dt
Para encontrar la expresión para la aceleración se procede de manera análoga.
i
m ∂x ∂xm d ∂xm ∂ ẋm
ãj = ha |ẽj i = (ẍm hẽ |) |e i i = ẍm ≡ ẋm − ẋm
∂q j ∂q j dt ∂q j ∂q j
y otra vez

∂xm ∂ ẋm d ∂ ẋm ∂ ẋm d ∂ ẋm ẋm ∂ ẋm ẋm
= ⇒ ãj = ẋm j − ẋm j = − j
∂q j ∂ q̇ j dt ∂ q̇ ∂q dt ∂ q̇ j 2 ∂q 2
y finalmente
d ∂ Vm V m ∂ Vm V m
ãj = − j
dt ∂ q̇ j 2 ∂q 2
4.3.3. Coordenadas Cartesianas

El primer caso, el más trivial, lo constituyen las coordenadas cartesianas. Vale decir

q 1 , q 2 , q 3 ⇐⇒ (x, y, z)
|ri = x |ii + y |ji + z |ki = r̃ = xı̂ + y̂ + z k̂

∂ r̃ ∂ r̃ ∂ r̃
r̃ = r̃ (x, y, z) =⇒ dr̃ = dx + dy + dz = dx |ii + dy |ji + dz |ki
∂x ∂y ∂z

cosecuentemente
|ẽx i = 1 ∂ |ri
= |ii
hx = ∂∂ |ri
x =1 k ∂∂ |ri ∂ x
x k

1 ∂ |ri
hy = ∂∂ |ri
y =1 y |ẽy i =
k ∂∂y|ri k ∂ x = |ji ;

1 ∂ |ri
hz = ∂∂ |ri
z =1
|ẽz i = = |ki
k ∂∂ |ri
z k
∂ z
El elemento de lı́nea viene definido como

2 2 2 2
(ds) = h1 dx1 + h2 dx2 + h3 dx3 ⇐⇒ ds2 = dx2 + dy 2 + dz 2
y el tensor métricó será
g11 = gxx = 1; g22 = gyy = 1; g22 = gzz = 1.
El hecho que para el caso de las coordenadas cartesianas hx = hy = hz = 1 significará que las tomaremos
como coordenadas base respecto a las cuales expresaremos las demás.
4.3.4. Coordenadas Cilı́ndricas

Las coordenadas cilı́ndricas se expresan como

q 1 , q 2 , q 3 ⇐⇒ (ρ, ϕ, z)
|ri = x (ρ, ϕ) |ii + y (ρ, ϕ) |ji + z |ki ⇐⇒ r̃ = x (ρ, ϕ)ı̂ + y (ρ, ϕ) ̂ + z k̂

∂ r̃ ∂ r̃ ∂ r̃
r̃ = r̃ (ρ, ϕ, z) =⇒ dr̃ = dρ + dϕ + dz
∂ρ ∂ϕ ∂z
y estas cantidades pueden ser identificadas de las leyes de transformación respecto a las coordendas carte-
sianas 
x = x (ρ, ϕ) = ρ cos ϕ 
 dx = cos ϕdρ − ρ sen ϕdϕ



y = y (ρ, ϕ) = ρ sen ϕ =⇒ dy = sen ϕdρ + ρ cos ϕdϕ





z=z dz = dz
con lo cual es fácil identificar
 ∂ x(ρ,ϕ)   ∂ x(ρ,ϕ)   ∂ x(ρ,ϕ) 
∂ ρ = cos ϕ ∂ ϕ = −ρ sen ϕ =0
    ∂ z
     
 ∂ y(ρ,ϕ)     
 = sen ϕ  ;  ∂ y(ρ,ϕ) = ρ cos ϕ  ; y  
∂ y(ρ,ϕ)
=0 

 ∂ ρ   ∂ ϕ  
∂ z

   
∂ z ∂ z ∂ z
∂ ρ =0 ∂ ϕ =0 ∂ z =1
y de allı́

∂ |ri ∂ x (ρ, ϕ)ı̂ + y (ρ, ϕ) ̂ + z k̂ ∂ x (ρ, ϕ) ∂ y (ρ, ϕ)
hρ =
∂ρ
= =
∂ρ ı̂+ ̂

∂ρ ∂ρ
hρ = kcos ϕ ı̂+ sen ϕ ̂k = 1

y del mismo modo

∂ (x (ρ, ϕ)ı̂ + y (ρ, ϕ) ̂) ∂ (z)
hϕ =

= r;
hz = k̂
∂ z = 1.
∂ϕ
mientras que los vectores unitarios serán

1 ∂ |ri ∂ x(ρ,ϕ) ∂ y(ρ,ϕ)
|ẽρ i = = ∂ ρ ı̂ + ∂ ρ ̂ = cos ϕ ı̂ + sen ϕ ̂
k ∂∂ |ri
ρ k
∂ ρ

1 ∂ |ri 1 ∂ x(ρ,ϕ) ∂ y(ρ,ϕ)
|ẽϕ i = ∂ |ri ∂ ϕ = ρ ∂ ϕ ı̂ + ∂ ϕ ̂ = − sen ϕ ı̂ + cos ϕ ̂ ;
k ∂ ϕ k
1 ∂ |ri ∂ (x(ρ,ϕ)ı̂+y(ρ,ϕ)̂+zk̂)
|ẽz i = = = k̂
k ∂∂ |ri
z k
∂ z ∂ z

2 2 2 2
(ds) = h1 dx1 + h2 dx2 + h3 dx3 ⇐⇒ ds2 = dρ2 + ρ2 dϕ2 + dz 2
y el tensor métricó será

g11 = gρρ = 1; g22 = gϕϕ = ρ2 ; g33 = gzz = 1.
4.3.5. Coordenadas Esféricas

Para construir el sistema de coordenadas esféricas

q 1 , q 2 , q 3 ⇐⇒ (r, ϕ, θ)
|ri = x (r, ϕ, θ) |ii + y (r, ϕ, θ) |ji + z (r, ϕ, θ) |ki = x (r, ϕ, θ)ı̂ + y (r, ϕ, θ) ̂ + z (r, ϕ, θ) k̂

∂ ~r ∂ ~r ∂ ~r
~r = ~r (r, ϕ, θ) =⇒ d~r= dr + dϕ + dθ
∂r ∂ϕ ∂θ
y estas cantidades pueden ser identificadas de las leyes de transformación respecto a las coordendas carte-
sianas

x = x (r, ϕ, θ) = r cos ϕ sen θ 
 dx = cos ϕ sen θdr − r sen ϕ sen θdϕ + r cos ϕ cos θdθ



y = y (r, ϕ, θ) = r sen ϕ sen θ =⇒ dy = sen ϕ sen θdr + r cos ϕ sen θdϕ + r sen ϕ cos θdθ





z (r, ϕ, θ) = r cos θ dz = cos θdr − r sen θdθ
con lo cual es fácil identificar

   ∂ x(r,ϕ,θ)   
∂ x(r,ϕ,θ) = −r sen ϕ sen θ ∂ x(r,ϕ,θ)
∂ r = cos ϕ sen θ ∂ ϕ ∂ θ = r cos ϕ cos θ
     
     
 ∂ y(r,ϕ,θ)   ∂ y(r,ϕ,θ)   ∂ y(r,ϕ,θ) 
 = sen ϕ sen θ ;  ∂ ϕ = r cos ϕ sen θ ;  = r sen ϕ cos θ 
 ∂ r     ∂ θ 
     
∂ z(r,ϕ,θ) ∂ z(r,ϕ,θ) ∂ z(r,ϕ,θ)
∂ r = cos θ ∂ ϕ =0 ∂ θ = −r sen θ

y de allı́

∂ |ri ∂ x (r, ϕ, θ)ı̂ + y (r, ϕ, θ) ̂ + z (r, ϕ, θ) k̂

hr = =
∂r ∂r

∂ x (r, ϕ, θ) ∂ y (r, ϕ, θ) ∂ z (r, ϕ, θ)
hr =
ı̂+ ̂+ k̂

∂r ∂r ∂r
p

hr = cos ϕ sen θ ı̂+ sen ϕ sen θ ̂+ cos θ k̂ = cos2 ϕ sen2 θ + sen2 ϕ sen2 θ + cos2 θ = 1
y del mismo modo

∂ x (r, ϕ, θ)ı̂ + y (r, ϕ, θ) ̂ + z (r, ϕ, θ) k̂
∂ x (r, ϕ, θ) ∂ y (r, ϕ, θ)

hϕ = ̂
∂ϕ = ∂ϕ
ı̂+
∂ϕ

q
2 2
hϕ = k−r sen ϕ sen θ ı̂+r cos ϕ sen θ ̂k = (r sen ϕ sen θ) + (r cos ϕ sen θ) = r sen θ
Finalmente,

∂ x (r, ϕ, θ)ı̂ + y (r, ϕ, θ) ̂ + z (r, ϕ, θ) k̂

hθ =

∂θ

∂ x (r, ϕ, θ) ∂ y (r, ϕ, θ) ∂ z (r, ϕ, θ)

hθ = ı̂+ ̂+ k̂
∂θ ∂θ ∂θ

hθ = r cos ϕ cos θ ı̂+r sen ϕ cos θ ̂ − sen θ k̂
q
2 2 2
hθ = (r cos ϕ cos θ) + (r sen ϕ cos θ) + (r sen θ) = r
mientras que los vectores unitarios serán

1 ∂ |ri
|ẽr i = = cos ϕ sen θ ı̂+ sen ϕ sen θ ̂+ cos θ k̂
k ∂∂ |ri
r k
∂ r
1 ∂ |ri 1
|ẽϕ i = = (−r sen ϕ sen θ ı̂+r cos ϕ sen θ ̂) ;
k ∂∂ |ri
ϕ k
∂ ϕ r sen θ

1 ∂ |ri 1
|ẽθ i = ∂ |ri ∂ θ = r r cos ϕ cos θ ı̂+r sen ϕ cos θ ̂ − sen θ k̂
k ∂ θ k
2 2 2 2
(ds) = h1 dx1 + h2 dx2 + h3 dx3 ⇐⇒ ds2 = dr2 + r2 sen2 θ dϕ2 + r2 dθ2

El tensor métrico será

g11 = grr = 1; g22 = gϕϕ = r2 sen2 θ ; g33 = gθθ = r2 .
Por completidud, enumeraremos algunos otros sistemas de coordenadas y dejaremos al lector la labor de
calcular los vectores unitarios y la métrica del espacio expresada en estas coordenadas.
4.3.6. Otros Sistemas Coordenados

Coordenadas Toroidales

q 1 , q 2 , q 3 ⇐⇒ (λ, µ, α) ; |ri = x (λ, µ, α)ı̂ + y (λ, µ, α) ̂ + z (λ, µ, α) k̂
con
senh λ
x = x (λ, µ, α) = r cos α; con r =
cosh λ + cos µ
y = y (λ, µ, α) = r sen α
sen µ
z = z (λ, µ, α) = r
cosh λ + cos µ
con lo cual los vectores unitarios serán
1 ∂ |ri 1 ∂ (x(λ,µ,α)ı̂+y(λ,µ,α)̂+z(λ,µ,α)k̂)
|ẽλ i = = ‚ ‚
‚ ∂ (x(λ,µ,α)ı̂+y(λ,µ,α)̂+z(λ,µ,α)k̂) ‚
k ∂∂ |ri
λ k
∂ λ ‚
‚ ∂ λ
‚
‚
∂ λ
|ẽµ i = 1 ∂ |ri
= ;
k ∂∂ |ri
µ k
∂ µ
1 ∂ |ri
|ẽα i = =
k ∂∂ |ri
α k
∂ α


senh λ senh λ senh λ sen µ
∂ |ri ∂ cosh λ+cos µ cos α ∂ cosh λ+cos µ sen α ∂ cosh λ+cos µ cosh λ+cos µ
= ı̂ + ̂ + k̂
∂λ ∂λ ∂λ ∂λ

∂ |ri cosh λ cos µ + 1 sen µ cosh2 λ − cosh λ cos µ − 2
= (cos αı̂+ sen α̂) −
∂λ cosh2 λ + 2 cosh λ cos µ + cos2 µ cosh3 λ + 3 cosh2 λ cos µ + 3 cosh λ cos2 µ + cos3 µ
la métrica queda como
dλ2 + dµ2
ds2 = r2
senh2 λ
Las superficies λ = const representan toros alrededor del eje z; las superficies µ = const son esferas con
centro sobre el eje z;y finalmente las superficies α = const son planos que contiene al eje z
Coordenadas Elipsoidales
Dados tres números a, b y c; con a > b > c > 0, la ecuación
x2 y2 z2
+ 2 + 2 =1
a2 +α b +α c +α
representa las superficies cuádricas1 homofocales (es decir, con el mismo foco u origen en (x = 0, y = 0, z = 0)).
Dependiendo del valor del parámetro α, estas ecuaciones representarán superficies
Elipsoides si α > −c2

Hiperboloides de una hoja si −c > α > −b2
2
Hiperboloides de dos hojas si −b2 > α > −c2
Esto quiere decir que por cada punto (x, y, z) del espacio, pasan tres superficies cuádricas (dependiendo del
valor de α). Conocidos a, b y c y el punto, (x = x0 , y = y0 , z = z0 ) , los valores de α vienen dados por las
raı́ces de la ecuación cúbica
x2 y2 z2
+ 2 + 2 =1 =⇒ α3 + ∆ α2 + Φ α + Ω = 0
a2 +α b +α c +α
con
∆ = x20 + y02 + z02 − a2 − b2 − c2

Φ = b2 + c2 x20 + a2 + c2 y02 + a2 + b2 z02 − a2 b2 − a2 + b2 c2
Ω = x20 b2 c2 + y02 a2 c2 + z02 a2 b2 − a2 b2 c2
Las raı́ces de esta ecuación (α1 = λ; α2 = µ; α3 = ν) definen las coordenadas elipsoidales del punto (x, y, z) =
(x (λ, µ, ν) , y (λ, µ, ν) , z (λ, µ, ν))

q 1 , q 2 , q 3 ⇐⇒ (λ, µ, ν) ; |ri = x (λ, µ, ν)ı̂ + y (λ, µ, ν) ̂ + z (λ, µ, ν) k̂
1 Nótese que la proyección de estas superficies en el plano (x, y) representan curvas cónicas homofocales

y la ley de transformación queda como

s
(a2 + λ) (a2 + µ) (a2 + ν)
x = x (λ, µ, ν) =
(a2 − b2 ) (a2 − c2 )
s
(b2 + λ) (b2 + µ) (b2 + ν)
y = y (λ, µ, ν) =
(b2 − a2 ) (b2 − c2 )
s
(c2 + λ) (c2 + µ) (c2 + ν)
z = z (λ, µ, ν) =
(c2 − b2 ) (c2 − a2 )
por cual la métrica será
(λ − µ) (λ − ν) (µ − λ) (µ − ν)
ds2 = dλ2 + dµ2
4 (a2 + λ) (b2 + λ) (c2 + λ) 4 (a2 + µ) (b2 + µ) (c2 + µ)
(ν − µ) (ν − λ)
+ dν 2
4 (a2 + ν) (b2 + ν) (c2 + ν)
4.4. Vectores, Tensores, Métrica y Transformaciones

Nos toca ahora construir expresiones de vectores y tensores a partir de sus leyes de transformación, hemos
dicho que los vectores y los tensores son independiente del sistema de coordenadas (la base) en la cual se
exprese.
4.4.1. Transformando Vectores

Ası́ si dada dos bases de vectores coordenados {|e1 i , |e2 i , |e3 i} y {|ẽ1 i , |ẽ2 i , |ẽ3 i} para el espacio vectorial
ℜ3 Entonces, se cumple que:

i
i
i ∂ x̃i j
j i
|ai = a |ej i = ã |ẽi i =⇒
ei ai = ai =⇒ ãi
= aj
ẽ |e i ⇐⇒ ãi
= a
ẽ ai = ã j j
|∂{zx }
hẽi |ej i
con ello de cartesianas a cilı́ndricas
x = x (r, ϕ) = ρ cos ϕ; y = y (r, ϕ) = ρ sen ϕ; z=z
de lo cual se deriva
 ∂ x(ρ,ϕ)
  ∂ x(ρ,ϕ)
  
= cos ϕ = −ρ sen ϕ ∂ x(ρ,ϕ)
∂ ρ ∂ ϕ ∂ z =0
     
     
     =0 
∂ y(ρ,ϕ) ∂ y(ρ,ϕ) ∂ y(ρ,ϕ)
 = sen ϕ  ;  = ρ cos ϕ  ; y  
 ∂ ρ   ∂ ϕ  
∂ z

   
∂ z ∂ z ∂ z
∂ ρ =0 ∂ ϕ =0 ∂ z =1

Entonces dados
|ai = aj |ej i = a1 |e1 i + a2 |e2 i + a3 |e3 i = ax |ii + ay |ji + az |ki
|ai = ãi |ẽi i = ã1 |ẽ1 i + ã2 |ẽ2 i + ã3 |ẽ3 i = ar |ẽr i + aϕ |ẽϕ i + az |ẽz i
con
1 ∂ |ri ∂ x(ρ,ϕ) ∂ y(ρ,ϕ)
|ẽρ i = = ∂ ρ ı̂ + ∂ ρ ̂ = cos ϕ ı̂ + sen ϕ ̂
k ∂∂ |ri
ρ k
∂ ρ

1 ∂ |ri 1 ∂ x(ρ,ϕ) ∂ y(ρ,ϕ)
|ẽϕ i = ∂ |ri ∂ ϕ = ρ ∂ ϕ ı̂ + ∂ ϕ ̂ = − sen ϕ ı̂ + cos ϕ ̂ ;
k ∂ ϕ k
1 ∂ |ri ∂ (x(ρ,ϕ)ı̂+y(ρ,ϕ)̂+zk̂)
|ẽz i = = = k̂
k ∂∂ |ri
z k
∂ z ∂ z
Si tenemos en concreto un vector |ai = 5 |ii + 4 |ji + 3 |ki quisiéramos conocer su expresión en coordenadas
cilı́ndricas. Hay que hacer la acotación que existe una familia de sistemas de coordenados cilı́ndricos para-
metrizados por el ángulo ϕ y NO un único sistema coordenado. Obviamente se puede especificar el sistema
coordenado y entonces tendremos un conjunto de componentes definito. Ası́ la familia de componentes en
cilı́ndricas del vector |ai serán

ãj = ẽj |ai = ẽj ã1 |ẽ1 i + ã2 |ẽ2 i + ã3 |ẽ3 i = ẽj a1 |e1 i + a2 |e2 i + a3 |e3 i
con lo cual al expresar los vectores base

ã1 = aρ = hẽρ | (5 |ii + 4 |ji + 3 |ki) = (cos ϕ ı̂ + sen ϕ ̂) · 5ı̂ + 4̂ + 3k̂ = 5 cos ϕ + 4 sen ϕ

ã2 = aϕ = hẽϕ | (5 |ii + 4 |ji + 3 |ki) = (− sen ϕ ı̂ + cos ϕ ̂) · 5ı̂ + 4̂ + 3k̂ = −5 sen ϕ + 4 cos ϕ
ã3 = az = hẽz | (5 |ii + 4 |ji + 3 |ki) = hk| (5 |ii + 4 |ji + 3 |ki) = 3
con lo cual
|ai = 5 |ii + 4 |ji + 3 |ki = (5 cos ϕ + 4 sen ϕ) |ẽρ i + (−5 sen ϕ + 4 cos ϕ) |ẽϕ i + 3 |ẽz i
donde es claro que existen infinitos sistemas cilindricos parametrizados por el ángulo ϕ , digamos
 √ √ √

 aρ = 5 cos arctan 45 + 4 sen arctan 54 = 25 16
41 41 + 41 41 = 41


4  √ √
ϕ = arctan ⇒ aϕ = −5 sen arctan 54 + 4 cos arctan 45 = − 20 20
41 41 + 41 41 = 0
5 




az = 3
con lo cual hemos alineado el eje |ẽρ i a lo largo del vector |ai . Ese es un sistema de coordenadas cilindrico
muy particular.

4.4.2. Transformando Tensores

Ilustremos ahora las transformaciones de tensores bajo cambios de la base del espacio vectorial.
Consideremos el siguiente tensor
 
2 1 3
{|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} =⇒ Tji =  2 3 4 
1 2 2
Es decir es un tensor que hemos expresado en coordenadas cartesianas y queremos pasarlo a cilindricas. Para
ello recordamos que
  1

 
 x = x = x (ρ, ϕ) = ρ cos ϕ

 


 

 x2 = y = y (ρ, ϕ) = ρ sen ϕ


 
 
 
 

  3
x =z=z
k
∂ x̃ ∂ x j 
k i
T̃m = T donde  p
∂ xi ∂ x̃m j 


 
 x̃1 = ρ = ρ (x, y) = x2 + y 2

 


 



 x̃2 = ϕ = ϕ (x, y) = arctan xy

 
 
 
  3
x̃ = z = z
con lo cual
 
∂ x̃1 ∂ ρ x ∂ x̃1 ∂ ρ y ∂ x̃1 ∂ ρ
∂ x1 = ∂ x =√ ∂ x2 = ∂ y =√ ∂ x3 = ∂ z =0
 x2 +y 2 x2 +y 2 
 
∂ x̃k  
= 2
∂ x̃
= ∂ ϕ
= −y ∂ x̃ 2
= ∂ ϕ
= x ∂ x̃2
= ∂ ϕ 
∂ xi  ∂ x1 ∂ x x2 +y 2 ∂ x2 ∂ y x2 +y 2 ∂ x3 ∂ z =0 
 
 
∂ x̃3 ∂ z ∂ x̃3 ∂ z ∂ x̃3 ∂ z
∂ x1 = ∂ x =0 ∂ x2 = ∂ y =0 ∂ x3 = ∂ z = 1
es decir  
cos ϕ sen ϕ 0
 
∂ x̃k  sen ϕ cos ϕ 
=  − 0 
∂x i  ρ ρ 
 
0 0 1
mientras que
 ∂ x1 ∂ x ∂ x1 ∂ x ∂ x1 ∂ x

∂ x̃1 = ∂ ρ = cos ϕ ∂ x̃2 = ∂ ϕ = −ρ sen ϕ ∂ x̃3 = ∂ z =0
 
∂ xj  
 ∂ x2 ∂ y ∂ x2 ∂ y ∂ x2 ∂ y 
=  ∂ x̃1 = ∂ ρ = sen ϕ ∂ x̃2 = ∂ ϕ = ρ cos ϕ ∂ x̃3 = ∂ z =0 
∂ x̃m  
 
∂ x3 ∂ z ∂ x3 ∂ z ∂ x3 ∂ z
∂ x̃1 = ∂ ρ =0 ∂ x̃2 = ∂ ϕ =0 ∂ x̃3 = ∂ z =1
con lo cual  
cos ϕ −ρ sen ϕ 0
 
∂ xj  
m
=
 sen ϕ ρ cos ϕ 0 

∂ x̃  
0 0 1

Por lo tanto
   
cos ϕ sen ϕ 0 cos ϕ −ρ sen ϕ 0
   
∂ x̃k i ∂ xj  sen ϕ cos ϕ  i  
k
T̃m = T ⇒ k
T̃m =
 − ρ 0  Tj 

 sen ϕ ρ cos ϕ 0 

∂ xi j ∂ x̃m 
ρ
  
0 0 1 0 0 1
es decir     
cos ϕ sen ϕ 0 2 1 3 cos ϕ −ρ sen ϕ 0
k
T̃m =  − senρ ϕ cos ϕ
ρ 0   2 3 4   sen ϕ ρ cos ϕ 0 
0 0 1 1 2 2 0 0 1
 2 
− cos ϕ + 3 cos ϕ sen ϕ + 3 ρ sen ϕ cos ϕ − 2ρ + 3ρ cos2 ϕ 3 cos ϕ + 4 sen ϕ
2
k
T̃m = cos ϕ sen ϕ+3 cos ϕ−1
ρ −3 cos ϕ sen ϕ + cos2 ϕ + 2 −3 senρ ϕ + 4 cosρ ϕ 
cos ϕ + 2 sen ϕ −ρ sen ϕ + 2ρ cos ϕ 2
Si suponemos que el origen del sistema de coordenadas cilindrico está en el vector anterior. Esto es
 p √ √
 ρ = x2 + y 2 ⇒ ρ = 52 + 42 = 41
|ai = 5 |ii + 4 |ji + 3 |ki ⇒

ϕ = arctan xy ⇒ ϕ = arctan 45 = 0,67474 rad
y entonces  
3,8537 2,030 3 4,841 4
k
T̃m =  0,20569 1. 146 3 0,195 12 
2,030 3 6,0 2
Si consideramos una nueva base
 
1



 |ẽ1 i = |ii ẽ |ẽ1 i = 1 ẽ1 |ẽ2 i = 1 ẽ1 |ẽ3 i = 1

  
 
2


{|ẽ1 i , |ẽ2 i , |ẽ3 i} ⇒ |ẽ2 i = |ii + |ji ⇐⇒ 
 ẽ |ẽ1 i = 1 ẽ2 |ẽ2 i = 2 ẽ2 |ẽ3 i = 2 


  


3


|ẽ3 i = |ii + |ji + |ki ẽ |ẽ1 i = 1 ẽ3 |ẽ2 i = 2 ẽ3 |ẽ3 i = 3
para ese mismo espacio ℜ3 encontraremos una nueva expresión que toma Tji en esa base. Igualmente encontra-
remos

k las expresiones para los siguientes tensores: T̃ij , T̃ij , T̃ ij . Nótese que

esta
nueva base no es ortogonal
6 δik , con lo cual no se cumplen muchas cosas entre ellas |ẽk i ẽk 6= 1
, ẽ |ẽi i =
Para encontrar la expersión T̃ji expresamos los vectores base {|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} en término
de la base {|ẽ1 i , |ẽ2 i , |ẽ3 i}


 |e1 i = |ii = |ẽ1 i



{|e1 i , |e2 i , |e3 i} =⇒ |e2 i = |ji = |ẽ2 i − |ẽ1 i





|e3 i = |ki = |ẽ3 i − |ẽ2 i
recordamos que un vector genérico
|ai = aj |ej i = ãj |ẽj i =⇒
|ai = aj |ej i = ã1 |ẽ1 i + ã2 |ẽ2 i + ã3 |ẽ3 i = ã1 |e1 i + ã2 (|e1 i + |e2 i) + ã3 (|e1 i + |e2 i + |e3 i)

con lo cual
a1 |e1 i + a2 |e2 i + a3 |e3 i = ã1 + ã2 + ã3 |e1 i + ã2 + ã3 |e2 i + ã3 |e3 i
y como

 ∂ x1 ∂ x1 ∂ x1
 
 ∂ x̃1 = 1; ∂ x̃2 = 1; ∂ x̃3 = 1;


a1 = ã1 + ã2 + ã3  
∂ xi k ∂ x2 ∂ x2 ∂ x2
a2 = ã2 + ã3 =⇒ ai = ã =⇒ ∂ x̃1 = 0; ∂ x̃2 = 1; ∂ x̃3 = 1;
 ∂ x̃k 

a3 = ã3 


 ∂ x3 ∂ x3 ∂ x3
∂ x̃1 = 0; ∂ x̃2 = 0; ∂ x̃3 = 1;
Es de hacer notar que dado que la base ortonormal {|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} se tiene que

∂ xi
|ai = aj |ej i = ãi |ẽi i =⇒ ei ai = aj ei |ej i = aj δji = ai = ãk ei |ẽk i =⇒ k

= ei |ẽk i
∂ x̃
El mismo procedimiento se puede aplicar para expresar el vector |ai como combinación lineal de los vectores
|ẽj i
|ai = ãj |ẽj i = aj |ej i = a1 |e1 i + a2 |e2 i + a3 |e3 i = a1 |ẽ1 i + a2 (|ẽ2 i − |ẽ1 i) + a3 (|ẽ3 i − |ẽ2 i)

 ∂ x̃1 ∂ x̃1 ∂ x̃1
 
 ∂ x1 = 1; ∂ x2 = −1; ∂ x3 = 0;


ã1 = a1 − a2  k 
∂ x̃ ∂ x̃2 ∂ x̃2 ∂ x̃2
ã2 = a2 − a3 =⇒ ãk = ai i
=⇒ ∂ x1 = 0; ∂ x2 = 1; ∂ x3 = −1;
 ∂ x 

ã3 = a3 


 ∂ x̃3 ∂ x̃3 ∂ x̃3
∂ x1 = 0; ∂ x2 = 0; ∂ x3 = 1;
Nótese que, como era de esperarse,

    
1 1 1 1 −1 0 1 0 0
∂ xi ∂ x̃k
= δji =⇒  0 1 1  0 1 −1  =  0 1 0 
∂ x̃k ∂ xj
0 0 1 0 0 1 0 0 1
Con las expresiones matriciales para las transformaciones ,estamos en capacidad de calcular, componente a
componente, las representación del tensor en la nueva base con lo cual
k ∂ x̃k ∂ xj i
T̃m = T =⇒
∂ xi ∂ x̃m j

∂ x̃1 ∂ xj ∂ x̃1 ∂ x1 2 3
T̃11 = Tji = T 1 + ∂ x1 T 1 + ∂ x1 T 1
∂ xi ∂ x̃1 ∂ x1 ∂ x̃1 1 1 ∂ x̃ 2 2 ∂ x̃ 3
x̃1 x3
+ ∂∂ ∂ x
1 T
2
+ ∂∂ x̃x1 T22 + ∂∂ T32
x2 ∂ x̃1 1 x̃1
x̃1 ∂ x2 x3
+ ∂∂ x3
∂ x 3 3
∂ x̃1 T1 + ∂ x̃1 T2 + ∂
∂
x̃1 T33
es decir
∂ x̃1 ∂ xj
T̃11 = ∂ xi ∂ x̃1 Tji = 1 · 1 T11 + 0 T21 + 0 T31
−1 · 1 T12 + 0 T22 + 0 T32
+0 1 T13 + 0 T23 + 0 T33
∂ x̃1 ∂ xj
T̃11 = ∂ xi ∂ x̃1 Tji = T11 − T12 = 2 − 2 = 0

del mismo modo

∂ x̃1 ∂ xj ∂ x̃1 ∂ x1 2 3
T̃21 = Tji = T 1 + ∂ x2 T 1 + ∂ x2 T 1
∂ xi ∂ x̃2 ∂ x1 ∂ x̃2 1 1 ∂ x̃ 2 2 ∂ x̃ 3
x̃1 x3
+ ∂∂ ∂ x
2 T
2
+ ∂∂ x̃x2 T22 + ∂∂ T32
x2 ∂ x̃1 1 x̃2
x̃1 ∂ x2 x3
+ ∂∂ x3
∂ x 3 3
∂ x̃2 T1 + ∂ x̃2 T2 + ∂
∂
x̃2 T33
es decir
∂ x̃1 ∂ xj
T̃21 = ∂ xi ∂ x̃2 Tji = 1 · 1 T11 + 1 T21 + 0 T31
−1 · 1 T12 + 1 T22 + 0 T32
+0 1 T13 + 1 T23 + 0 T31
∂ x̃1 ∂ xj

T̃21 = ∂ xi ∂ x̃1 Tji = T11 + T21 − T12 + T22 = (2 + 1) − (2 + 3) = −2
k j
se puede continuar término a término o realizar la multiplicación de las matrices ∂∂ x̃xi , Tji y ∂∂ x̃xm provenientes
de la transformación de componentes de tensores. Vale decir
     
k j 1 −1 0 2 1 3 1 1 1 0 −2 −3
∂ x̃ ∂ x
k
T̃m = Ti ⇔ 0 1 −1   2 3 4   0 1 1  =  1 2 4 
∂ xi j ∂ x̃m
0 0 1 1 2 2 0 0 1 1 3 5
hay que resaltar un especial cuidado que se tuvo en la colocacı́on de la matrices para su multiplicación. Si
k j k
bien en la expresión T̃m k
= ∂∂ x̃xi ∂∂ x̃xm Tji las cantidades ∂∂ x̃xi son números y no importa el orden con el cual
se multipliquen, cuando se colocan como matrices debe respetarse la “concatenación interna de ı́ndices”.
k
Esto es cuando querramos expresar T̃m como una matriz, donde el ı́ndice contravariante k indica filas y el
ı́ndice covariante m las columnas, fijamos primero estos ı́ndices y luego respetamos la “concatenación ı́ndices”
covariantes con los contravariantes. Esta es la convención para expresar la multiplicación de matrices en la
notación de ı́ndices2 . Esto es
k ∂ x̃k ∂ xj i k ∂ x̃k i ∂ xj
T̃m = T =⇒ T̃m = T
∂ xi ∂ x̃m j ∂ xi j ∂ x̃m
k j
Ahora los objetos ∂∂ x̃xi , Tji y ∂∂ x̃xm pueden ser sustitidos (en sus puestos correspondientes) por su represen-
tación matricial.
k
Con lo cual hemos encontrado la respresentación matricial T̃m de las componentes del tensor T en la
base {|ẽ1 i , |ẽ2 i , |ẽ3 i}
 1 
T̃1 = 0 T̃21 = −2 T̃21 = −3
 T̃12 = 1 T̃22 = 2 T̃32 = 4 
3 3
T̃1 = 1 T̃2 = 3 T̃33 = 5
n
Para encontrar la expresión para T̃km recordamos que T̃km = g̃kn T̃m es decir, requerimos las componentes
covariantes y contravariantes del tensor métrico g̃kn que genera esta base. Para ello recordamos que para
para una base genérica, {|ẽj i} , no necesariamente ortogonal, de un espacio vectorial con producto interno,
2 Quizá una forma de comprobar si los ı́ndices está bien concatenados se observa si se “bajan” los ı́ndices contravariantes
pero se colcan de antes que los covariantes. Esto es Tji → Tij Ası́ la multiplicación de matrices queda representada por
Cji = Aik Bjk → Cij = Aik Bkj y aquı́ es claro que ı́nidices consecutivos están “concatenados” e indican multiplicación


0
podemos definir la expresión de un tensor que denominaremos tensor métrico como
2
|ẽ |ẽj i

ii
↓ ↓
g  ◦ , ◦,  = g̃ij ≡ g̃ji =⇒ g̃ij ≡ g̃ji = g [|ẽi i , |ẽj i] ≡ hẽi |ẽj i ≡ hẽj |ẽi i
 i 
hẽ | hẽj |
 ↓ ↓  −1
g  • , •  = g̃ ij ≡ g̃ ij =⇒ g̃ ij ≡ g̃ ij = (g̃ij )
Es de hacer notar que la representación matricial para la métrica covariante gij de una base ortonormal
{|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} es siempre diagonalEsto es
g11 = he1 |e1 i = hi |ii = 1; g12 = he1 |e2 i = hi |ji = 0; g13 = he1 |e2 i = hi |ji = 0;
g21 = he2 |e1 i = hj |ii = 0; g22 = he2 |e2 i = hj |ji = 1ñ; g23 = he2 |e3 i = hj |ki = 0;
g31 = he3 |e1 i = hk |ii = 0; g32 = he3 |e2 i = hk |ji = 0; g33 = he3 |e3 i = hk |ki = 1;
con lo cual 
n
hTm i 
  


 0 −2 −3
n
hTkm i ≡ hgkn Tm i =⇒  1 2 4 




 1 3 5
m 
hT nm i ≡ g nk Tk
donde hemos denotado h•i como la representación matricial del objeto
Para el caso de la base genérica no ortonormal {|ẽj i} tenemos dos formas de calcular el tensor (las
componentes covariantes y contravariantes) del tensor métrico. La primera es la forma directa
g̃11 = hẽ1 |ẽ1 i = hi |ii = 1; g̃12 = hẽ1 |ẽ2 i = hi| (|ii + |ji) = 1;
g̃21 = hẽ2 |ẽ1 i = (hi| + hj|) |ii = 1; g̃22 = hẽ2 |ẽ2 i = (hi| + hj|) (|ii + |ji) = 2
g̃31 = hẽ3 |ẽ1 i = (hi| + hj| + hk|) |ii = 1; g̃32 = hẽ3 |ẽ2 i = (hi| + hj| + hk|) (|ii + |ji) = 2;
y
g̃13 = hẽ1 |ẽ3 i = hi| (|ii + |ji + |ki) = 1;
g̃23 = hẽ2 |ẽ3 i = (hi| + hj|) (|ii + |ji + |ki) = 2
g̃33 = hẽ3 |ẽ3 i = (hi| + hj| + hk|) (|ii + |ji + |ki) = 3

consecuentemente
   
1 1 1 2 −1 0
 1 −1
g̃ij ≡ g̃ji ⇐⇒ 2 2  =⇒ g̃ ij
≡ g̃ ij
= (g̃ij ) ⇐⇒  −1 2 −1 
1 2 3 0 −1 1

La otra forma de calcular la métrica correspondiente la base ortonormal {|e1 i , |e2 i , |e3 i} ≡ {|ii , |ji , |ki} y
transformarla a la base no ortonormal {|ẽ1 i , |ẽ2 i , |ẽ3 i} ≡ {|ii , |ii + |ji , |ii + |ji + |ki} esto es
∂ xi ∂ xj ∂ xi ∂ xj
g̃km = gij =⇒ g̃km = g ij
∂ x̃k ∂ x̃m ∂ x̃k ∂ x̃m
1
La métrica para el la base ortonormal será diagonal y además gii = g ii , con lo cual
     
1 0 0 1 0 0 1 0 0
gij ⇐⇒  0 1 0 ; g ij ⇐⇒  0 1 0 ; gji ⇐⇒  0 1 0 ;
0 0 1 0 0 1 0 0 1
y      
1 0 0 1 0 0 1 1 1 1 1 1
∂ xi ∂ xj
g̃km = g ij ; 1 1 0  0 1 0  0 1 1 = 1 2 2 
∂ x̃k ∂ x̃m
1 1 1 0 0 1 0 0 1 1 2 3
nótese para conservar la convención de ı́ndices y matrices hemos representado que hemos traspuesto la matriz
i
correspondiente a ∂∂ x̃xk . La razón, como dijimos arriba es
∂ xi ∂ xj
g̃km = k
gij −→ g̃km = Πik gij Πjm −→ g̃km = Π̄ki gij Πjm
∂ x̃ ∂ x̃m
Para poder representar multipicación de matrices los ı́ndices deben estar consecutivos, por tanto hay que
trasponer la represetación matricial para poder multiplicarlar.
Ya estamos en capacidad de obtener las representacines matriciales para los tensores: T̃ij , T̃ij , T̃ ij .
 T  
D E D ET 0 −2 −3 0 1 1 D E
T̃ij = T̃ji −→  1 2 4  =  −2 2 3  −→ T̃ij
1 3 5 −3 4 5
    
D E D E 1 1 1 0 −2 −3 2 3 6 D E
n
T̃km = g̃kn T̃m −→  1 2 2  1 2 4 = 4 8 15  −→ T̃km
1 2 3 1 3 5 5 11 20
    
D E D E 0 −2 −3 1 1 1 −5 −10 −13 D E
T̃ kn = T̃m
n mk
g̃ → 1 2 4  1 2 2 = 7 13 17  → T̃ km
1 3 5 1 2 3 9 17 22

Bibliografı́a
York)
Londres)
145
Capı́tulo 5
Campos y Operadores Diferenciales
146
Figura 5.1: Radio vector posición ~r (t) en ℜ2 que describe paramétricamente una curva.
5.1. Campos Tensoriales y el Concepto de Campo

Cuando avanzamos en la derivación de vectores vimos vectores que dependı́an del tiempo. Luego cuando
construimos sistemas de coordenadas ortogonales vimos también vectores que variaban en módulo dirección
y sentido.
|ai(t) = ak (t) |ek i(t) = ãk |ẽk i(t) = âk (t) |êk i
Ahora podemos generalizar este concepto a tensores que dependen de una variable escalar
T [◦, ◦, · · · , ◦; •, •, · · · , •](t)
⇓
 
|ti (1)i |uj (2)i m
|vk (m)i hx (1)| hy n (2)| hzl (n)|
 ↓ ↓ ↓ ↓ ↓ ↓  mn···l
T  ◦ , ◦, , · · · , ◦ ; • , • ,··· , •  = Tij···k (t)
(t)

mn···l
Tij···k (t) ti (1) ⊗ uj (2) ⊗ · · · ⊗ v k (m) ⊗ |xm (1)i ⊗ |yn (2)i ⊗ · · · ⊗ |zl (n)i

mn···l
Ťij···k ťi (1)(t) ⊗ ǔj (2)(t) ⊗ · · · ⊗ v̌ k (m)(t) ⊗ |x̌m (1)i(t) ⊗ |y̌n (2)i(t) ⊗ · · · ⊗ |žl (n)i(t)

mn···l
T̃ij···k (t) t̃i (1)(t) ⊗ ũj (2)(t) ⊗ · · · ⊗ ṽ k (m)(t) ⊗ |x̃m (1)i(t) ⊗ |ỹn (2)i(t) ⊗ · · · ⊗ |z̃l (n)i(t)
al igual que los vectores, la dependencia funcional de los tensores variará con la base en la cual se exprese.
Ası́ tendremos tensores cuyas componentes, en una determinada base, serán variables y en otra no. Mientras
que una de las bases será variable y otra no.

Figura 5.2: Campo Vectorial en ℜ3
Igualmente saltamos al cociente incremental para conocer la velocidad de variación
T [◦, ◦, · · · , ◦; •, •, · · · , •](t+∆t) − T [◦, ◦, · · · , ◦; •, •, · · · , •](t)

lı́m
∆t→0 ∆t
m
∆T [◦, ◦, · · · , ◦; •, •, · · · , •](t)
lı́m
∆t→0 ∆t
m

d T [◦, ◦, · · · , ◦; •, •, · · · , •](t)
dt
si la base es constante, entonces podemos, como en el caso de los vectores, la dependencia funcional y su
variación (su derivada) recae sobre sus componentes. Ası́ podemos construir la derivada de las componentes
como
mn···l
mn···l
Tij···k mn···l
(t + ∆t) − Tij···k (t) mn···l
∆Tij···k (t) d Tij···k (t)
lı́m = lı́m =
∆t→0 ∆t ∆t→0 ∆t dt
Siguiendo con el proceso de generalización podemos pensar en una dependencia funcional multilineal.
Esto es que el argumento de la “función” tensorial otro tensor,
T [◦, ◦, · · · , ◦; •, •, · · · , •] = T [◦, ◦, · · · , ◦; •, •, · · · , •]G[◦,◦,··· ,◦;•,•,··· ,•]
A ese objeto se le llama Campo Tensorial, pero vamos con calma. Analicemos lo casos más simples los cuales
son los verdaderamente útiles. Como era de esperarse, tendremos varios casos que se pueden construir a

partir de esta idea hemos visto funciones que ahora llamaremos campos homogéneos
ϕ = ϕ (t) función
|ri(t) ⇐⇒ ~r = ~r (t) rk (t) vector
mn···l
T = T [◦, ◦, · · · , ◦; •, •, · · · , •](t) Tij···k (t) tensor
y veremos campos constantes o estacionarios ~r 6= ~r (t)
ϕ = ϕ (~r) Campo Escalar
|ai(|ri) ⇐⇒ ~a = ~a (~r) ak (~r) Campo Vectorial
mn···l
T = T [◦, ◦, · · · , ◦; •, •, · · · , •](|ri) Tij···k (~r) Campo Tensorial
.. ..
. .
campos variables o no estacionarios
ϕ = ϕ (~r (t) , t) Campo Escalar Variable
|ai(|ri) ⇐⇒ ~a = ~a (~r (t) , t) ak (~r (t) , t) Campo Vectorial
mn···l
T = T [◦, ◦, · · · , ◦; •, •, · · · , •](|ri) Tij···k (~r (t) , t) Campo Tensorial
.. ..
. .
en ambos casos hemos supuesto que la base en la cual se expresan vectores y tensores es constante.
La idea de los campos escalares, vectoriales, tensoriales, con argumento vectorial, es asociar un valor de la
componente (escalar, vectorial o tensorial) a cada punto del espacio (si el vector está en ℜ3 ). Obviamente los
campos escalares asocian un número a cada posición y los campos vectoriales, además del número (módulo)
asocian una dirección y un sentido.
Los campos escalares serán las distribuciones de densidad ρ (~r (t)) , presión P (~r (t)) y temperatura
T (~r (t)) de la atmósfera terrestre o la distribución de intensidades del campo eléctrico en una superficie.
Ası́ al considerar el potencial eléctrico
q q
2 2
φ (~r) = φ (x, y) = ln (x + 1) + y 2 − ln (x − 1) + y 2
La representación del campo escalar será

q q
2 2 2 2
Campo Escalar φ (~r) = φ (x, y) = ln (x + 1) + y − ln (x − 1) + y
y la representación de un campo vectorial será
Campo vectorial
5.2. Campos escalares y superficies

Campo escalar será aquella función escalar de argumento vectorial. Con ello a cada punto del espacio se
le asocia un número. Esto es

φ : ℜn → ℜ φ = φ (~r) ⇒ φ = φ xi = φ x̃i ⇔ φ = φ (x, y, z) = φ (x̃, ỹ, z̃)
Estamos enfatizando el hecho que un campo escalar no variará bajo cambios de las coordenadas en su
Adicionalmente recalcamos que es indistinto hablar de vectores o sus coordenadas φ = φ (~r) ⇔
argumento.
φ = φ xi . La Figura 5.3 ilustra un campo de temperaturas
T = T (x, y) = 70 + 180e−(x−3)2/10−(y−2)2/10
Si unimos los puntos con iguales temperaturas tendremos curvas isotermas tal y como se observan en la
Figura 5.2

Figura 5.3: Ejemplo de Campo Escalar. Campo de Temperaturas T = T (x, y)
Curvas Isotermas. T = T (x, y) = cte

Un campo escalar φ = φ x1 , x2 definirá superficies si la representamos en ℜ3 como x3 = φ x1 , x2
curvas de nivel o isocurvas las cuales corresponden a soluciones φ = φ xi = cte. Tal y como se ilustra en la
figura (5.4) los planos z = k = cte cortan la superficie y definen la curva g (x, y) = z = k.
En la próxima sección describiremos una fauna de operadores vectoriales, su utilidad y significado fı́sico.
5.3. Campos vectoriales y lı́neas de flujo

Consideremos ahora un campo vectorial ~a (~r) y estudiemos su representación y lo que es más importante,
su variación. Tal y como hemos dicho y volvemos a representar en la figura (5.5) los campos vectoriales
asocian un vector (con su módulo dirección y sentido) a cada punto del espacio. Comúnmente, nos referimos
a campos vectoriales según el caso. Ası́ consideraremos campos de fuerza (es decir el vector del campo es una
fuerza), campo de velocidades ( el vector del campo es una velocidad). Del mismo modo a aquellas lı́neas a las
cuales los vectores son tangentes se les dominan lı́neas de campo, curvas integrales o simplemente lı́neas de
flujo o de corriente. A las trayectorias ortogonales a estas lı́neas, vale decir a aquellas lı́neas cuyos vectores
tangentes sean ortogonales al campo, se les denominarán lı́neas equipotenciales. El ejemplo más emblemático
lo constituye el gradiente de un campo escalar ∇φ~ (x, y). Las lı́neas equipotenciales las define el campo escalar

Figura 5.4: Curvas de Nivel para una función z = g (x, y) = cte
mismo, φ (x, y) = z = cte (curva de nivel) y construimos un campo vectorial con su gradiente, ∇φ ~ (x, y) .
Como el gradiente es perpendicular a la curva de nivel tendremos que las curvas integrales, ( lı́neas de flujo o
~ (x, y) serán trayectorias ortogonales a las curvas equipotenciales.
lı́neas de corriente) del campo vectorial ∇φ
5.3.1. Lı́neas de flujo o curvas integrales

Supongamos el caso bidimensional1 en coordenadas cartesianas, y consideremos un desplazamiento dife-
rencial d~r en la dirección del campo vectorial, es fácil convencerse que
dx dy
d~r ∝ ~a (x, y) = ax (x, y)ı̂ + ay (x, y) ̂ ⇒ =
ax (x, y) ay (x, y)
con lo cual encontramos las lı́neas de flujo o curvas integrales y (x) del campo ~a (x, y)
Z
dy ay (x, y) ay (x, y)
= ⇒ y (x) = dx
dx ax (x, y) ax (x, y)
ası́ dado un campo vectorial

Z Z
dy y dy dx 1
~a = −xı̂ + y̂ ⇒ = ⇒ = +C ⇒ y (x) = C1
dx −x y −x x
o lo que son lo mismo hipérbolas yx = C.
Otra forma, equivalente de verlo es que
d~r ∝ ~a (x (t) , y (t) , z (t) , t) ⇒d~r × ~a (x (t) , y (t) , z (t) , t) = 0 ⇒

ı̂ ̂ k̂

0= dx dy dz

ax (x (t) , y (t) , z (t) , t) ay (x (t) , y (t) , z (t) , t) az (x (t) , y (t) , z (t) , t)
1 El caso tridimensional sólo añade complicaciones técnicas y no riqueza conceptual

Figura 5.5: Capt5AnalisiVectorial/Campos vectoriales
por lo cual
(az (x (t) , y (t) , z (t) , t) dy − ay (x (t) , y (t) , z (t) , t) dz)ı̂+

+ (ax (x (t) , y (t) , z (t) , t) dz − az (x (t) , y (t) , z (t) , t) dx) ̂+
+ (ay (x (t) , y (t) , z (t) , t) dx − ax (x (t) , y (t) , z (t) , t) dy) k̂ = 0
y finalmente
dx dy dz
= =
ax (x (t) , y (t) , z (t) , t) ay (x (t) , y (t) , z (t) , t) az (x (t) , y (t) , z (t) , t)
la integral de estas ecuaciones construirá las lı́neas de flujo o curvas integrales.
5.3.2. Trayectorias ortogonales a las lı́neas de flujo

Para encontrar las trayectorias ortogonales al campo vectorial o las lı́neas equipotenciales construimos
un campo vectorial ~a⊥ (x, y) que sea ortogonal en todo punto a ~a (x, y)
ax (x, y) a⊥
y (x, y)
~a⊥ (x, y) · ~a (x, y) = 0 ⇒ax (x, y) a⊥ ⊥
x (x, y) + ay (x, y) ay (x, y) = 0 ⇒ =− ⊥
ay (x, y) ax (x, y)
⇒ ~a⊥ (x, y) = a⊥ ⊥
x (x, y)ı̂ − ay (x, y) ̂
y ahora procedemos del mismo modo pero con el campo vectorial ~a⊥ (x, y, z)
Z
dy −a⊥y (x, ) −a⊥ y (x, y)
= ⊥ ⇒ y (x) = ⊥
dx
dx ax (x, y) ax (x, y)
con lo cual las trayectorias ortogonales al campo
dy x p
~a = −xı̂ + y̂ ⇒ ~a⊥ = yı̂ + x̂ ⇒ = ⇒ y (x) = C 2 + x2
dx y
serán curvas.

5.4. Flujo de Campos Vectoriales

Podemos
también
imaginar flujo de campos vectoriales. Para ello, consideramos una superficie infinitesi-
~ ~
mal dS = dS n̂s , con n̂s el vector unitario normal esa superficie S. Entonces, la cantidad
ZZ ZZ ZZ
~ = ~a · n̂s dS
df = ~a · dS ⇒ f= ~=
~a · dS ~a · n̂s dS = an̂ dS
s s s
representará el flujo del campo vectorial a través de la RR ~ Hemos denotado an̂ como la componente
superficie dS.
de ~a a lo largo de n̂s . Hay que hacer notar que f = s ~a · dS ~ es independiente del sistema de coordenadas
y en cartesianas puede expresar como

\
df = ~a · n̂s dS = a1 cos n̂ s a
1 + a2 cos n̂\s a
\
2 + a3 cos n̂
s a
3

donde a1 , a2 , a3 son las componentes cartesianas del vector ~a. La idea que esta cantidad representa flujo
puede tenerse si pensamos en un fluido incompresible que fluye con un campo de velocidades ~v = ~v (~r) . El
volumen que atraviesa una determinada superficie en un intervalo de tiempo dt. Ası́, dS definirá la base de un
d
tubo de fluido y tendrá como “altura” la k~v k cos n̂s ~v dt ya que la altura no tiene por qué ser perpendicular
a la base2 . Por lo tanto la cantidad de fluido que atraviesa la superficie por unidad de tiempo viene dada por
ZZ ZZ ZZ
df = k~v k cos n̂d v dS = (~v · n̂s dS) = ~v · dS
s ~
~ ⇒f = ~=
~v · dS ~v · n̂s dS = vn̂ dS
s s s
5.5. La fauna de los operadores vectoriales

A partir del concepto de campo escalar, presentaremos la fauna de objetos diferenciales en el espacio
tridimensional. Salvo que se diga lo contrario, utilizaremos el sistema de coordenadas cartesianas, vale decir

q 1 , q 2 , q 3 ⇐⇒ (x, y, z)
|ri = x |ii + y |ji + z |ki = r̃ = xı̂ + y̂ + z k̂

∂ |ri ∂ |ri ∂ |ri

hx = = 1;
hy =
= 1; hz = =1
∂x ∂y ∂z

∂ r̃ ∂ r̃ ∂ r̃
r̃ = r̃ (x, y, z) =⇒ dr̃ = dx + dy + dz = dx |ii + dy |ji + dz |ki
∂x ∂y ∂z
ds2 = dx2 + dy 2 + dz 2 ⇐⇒ g11 = gxx = 1; g22 = gyy = 1; g22 = gzz = 1

“ ”
2 Si lo es cos nd̂
~v = 1 porque la velocidad es paralela a la normal

5.5.1. Derivada direccional, diferencial total y gradiente

Derivada direccional de Campos escalares
Para analizar los cambios en los campos escalares requerimos comparar dos “instantes de tiempo” para
ello, parametrizamos las componentes del vector tendremos que
z = φ (~r (t)) = g (x (t) , y (t)) ⇒
d φ (x (t) , y (t)) ∂ φ (x (t) , y (t)) d x (t) ∂ φ (x (t) , y (t)) d y (t) ~ (x (t) , y (t)) · d ~r (t)
= + = ∇φ
dt ∂x dt ∂y dt dt
donde hemos representado
~ (x (t) , y (t)) = ∂ φ (x, y) ı̂ + ∂ φ (x, y) ̂ = φx (x, y)ı̂ + φy (x, y) ̂ = ∂ i φ (x, y) |ei i = φ,i (x, y) |ei i
∇φ
∂x ∂y
y lo llamaremos el gradiente de la función. El gradiente de un campo escalar es uno de los objetos más
útiles, el cual lo hemos utilizado de manera operacional y no nos hemos detenido a reflexionar sobre sus
propiedades.
Es claro que para una curva de nivel
d φ (x (t) , y (t)) dk
g (x, y) = z = φ (~r (t)) = k = cte ⇒ = =0 ⇒
dt dt
d φ (x (t) , y (t)) ~ (x (t) , y (t)) · d ~r (t)

= 0 = ∇φ
dt dt
con lo cual dado que d d~r(t)

t es la tangente a la curva, el gradiente es perpendicular a la curva tal y como
muestra la figura (5.5.1).
La derivada direccional indicará la tasa de cambio del campo escalar en la dirección que apuntemos.
Derivada Direccional
En una generalización de la idea que surge de parametización de la curva o de la derivada total respecto
al tiempo
dφ ~ (x (t) , y (t)) · d ~r (t)
= ∇φ
dt dt

Ası́ es claro que, dados dos puntos M y M ′ en el campo se puedes relacionar será. Definiremos, entonces la
−−−→
derivada en la dirección de un vector unitario |ui ↔ M ′ M como
′
~ (x, y) · û = d φ = lı́m φ (Mh ) − φi(M )
D|ui φ = ∇φ
d λ M ′ →M −−− →
M ′M
Tal y como se puede apreciar en la figura (??) la derivada direccional representa la pendiente de la recta
tangente a la curva que surge como intersección entre la superficie φ (x, y) = z = k = cte y el plano vertical
formado por el eje z y el vector unitario û.Si se da el caso que la función φ de penda de manera explı́cita del
parámetro tendremos que
dφ ∂φ (x (t) , y (t) , t) ~ d ~r (t)

φ = φ (x (t) , y (t) , t) ⇒ = + ∇φ (x (t) , y (t) , t) ·
dt ∂t dt
Dirección de máxima variación en una función
En este punto, varias conclusiones se pueden derivar del concepto de derivada total. La primera es que
dado que, la norma de la derivada direccional a lo largo de |ui es
\
D|ui φ = ~ (x, y) · û
∇φ
~
= ∇φ
~ (x, y) , û
(x, y) cos ∇φ
(donde hemos denotado por ∇φ ~ \ ~ (x, y) y û), el valor

(x, y) û como el ángulo que forman los vectores ∇φ
máximo del la norma de la derivada direccional será
r s 2 2 2
p ∂φ ∂φ ∂φ ∂φ ∂φ
D|ui φ ~ i
= ∇φ (x, y) = ∂ φ∂i φ ≡ ≡ + +
máx ∂xi ∂xi ∂x1 ∂x2 ∂x3
es decir, cuando û apunta en la dirección del gradiente, o lo que es lo mismo, dirección de la mayor tasa
de cambio la indica la dirección del gradiente. O dicho de otro modo, en un determinado punto M de las
~ apunta en la dirección de la máxima tasa de cambio, tal y como podemos
superficie φ (x, y) = z el vector ∇φ
apreciar en la figura (5.5.1).

Gradiente y Tangente de una función
La segunda conclusión es dado que el gradiente es ortogonal a la superficie, los vectores perpendiculares
a él conformarán el planto tangente a la superficie en un determinado punto.
Gradiente y flujo de un campo vectorial

Podemos utilizar la idea de flujo de un campo vectorial y generalizar la definición de gradiente para que
sea independiente de coordenadas.
ZZ ZZ
˜ = grad φ = lı́m 1
∇φ ~ = lı́m 1
φ (x, y, z) dS φ (x, y, z) n̂s dS
V →0 V s V →0 V s
Esto es, supongamos que construimos un campo vectorial de la forma siguiente
~a (x, y, z) = ~c φ (x, y, z) con ~c = cte
con lo cual ZZ ZZ
f= ~=
~c φ (x, y, z) · dS ~c φ (x, y, z) · n̂s dS
s s
Es claro que esta expresión vale para todos los sistemas de coordenadas. En particular, para un sistema de
coordenadas cartesianas construimos un cubo diferencial con aristas que coincidan con los ejes coordenados.
Entonces se tiene que las caras del cubo serán con
~x+ = (dy dz) ı̂; dS
dS ~x− = − (dy dz)ı̂
dx
~y+ = (dx dz) ̂; dS

dS ~y− = − (dx dz) ̂
dy dy
~z+ = (dx dy) k̂; dS

dS ~z− = − (dx dy) k̂
dy dy

con lo cual el flujo por las seis caras será
~x+ + ~c φ (x, y, z) · dS
df = ~c φ (x, y, z) · dS ~x− + ~c φ (x, y, z) · dS
~y+
~y− + ~c φ (x, y, z) · dS
+ ~c φ (x, y, z) · dS ~z+ + ~c φ (x, y, z) · dS
~z−
= ~c (φ (x + dx, y, z) dy dz − φ (x, y, z) dy dz + φ (x, y + dy, z) dx dz − φ (x, y, z) dx dz

+φ (x, y, z + dz) dx dy − φ (x, y, z) dx dy)
= ~c ((φ (x + dx, y, z) − φ (x, y, z)) dy dz + (φ (x, y + dy, z) − φ (x, y, z)) dx dz+

+ (φ (x, y, z + dz) − φ (x, y, z)) dx dy)
Desarrollando por Taylor hasta primer orden porque estamos considerando un “cubo diferencial” tendremos
que
∂ φ (x, y, z)
φ (x + dx, y, z) ≈ φ (x, y, z) + dx
∂x
∂ φ (x, y, z)
φ (x, y + dy, z) ≈ φ (x, y, z) + dy
∂y
∂ φ (x, y, z)
φ (x, y, z + dz) ≈ φ (x, y, z) + dz
∂z
con lo cual
∂ φ (x, y, z) ∂ φ (x, y, z) ∂ φ (x, y, z)
df = dx dy dz + dy dx dz + dz dx dy
∂x ∂y ∂z

∂ φ (x, y, z) ∂ φ (x, y, z) ∂ φ (x, y, z) ˜ dV
df = + + dV → df = ∇φ
∂x ∂y ∂z
ZZ ZZ
˜ = df = lı́m f2 − f1 = lı́m 1
∇φ ~ = lı́m
φ (x, y, z) dS
1
φ (x, y, z) n̂ dS
dV ∆V →0 V2 − V1 V →0 V s V →0 V s
RR
~ Que quiere decir que tanto V1 ∼ 0
nótese que hemos supuesto que ∆V ≡ V2 ≡ V y que f2 = s φ (x, y, z) dS
y con lo cual el flujo a través de un punto se anula, f1 ∼ 0.
Gradiente y coordenadas curvilı́neas

La generalización de la expresión del gradiente
en coordenadas curvilı́neas es inmediata a partir de
diferencial total de una función φ q 1 , q 2 , q 3 . Esto es
∂ φ (x, y, z) j
φ q1 , q2 , q3 = φ qj ⇒dφ= ~ q 1 , q 2 , q 3 · d ~r
d q = ∇φ
∂q j

con
 
1 ∂ φ 1 ∂ φ 1 ∂ φ
~ q ,q ,q
∇φ 1 2 3
=  
∂ |ri ∂ q 1 hẽ1 | + ∂ |ri ∂ q 2 hẽ2 | + ∂ |ri ∂ q 3 hẽ3 |
∂ q1 ∂ q2 ∂ q3
y

∂ r̃ 1 ∂ r̃ 2 ∂ r̃ 3
d ~r = 1
dq + 2
dq + dq ⇒
∂q ∂q ∂ q3

∂ |ri ∂ |ri ∂ |ri

d ~r = 1
|ẽ1 i dq + 2
|ẽ2 i dq + |ẽ3 i dq 3
∂ q1 ∂ q2 ∂ q3
ya que
1 ∂ |ri 1 ∂ |ri 1 ∂ |ri
|ẽ1 i =
∂ |ri ∂ q 1 ; |ẽ2 i =
∂ |ri ∂ q 2 ; |ẽ3 i =
∂ |ri ∂ q 3 ;
∂ q1 ∂ q2 ∂ q3
Es decir la forma general del gradiente para un sistema de coordenadas curvilı́neas es
˜ = grad φ = 1 ∂ φ |ẽ1 i + 1 ∂ φ |ẽ2 i + 1 ∂ φ |ẽ3 i

∇φ
h1 ∂ x̃1 h2 ∂ x̃2 h3 ∂ x̃3

√
Donde denotamos hi = ∂∂ |ri
qi = gii el factor de escala que acompaña a la base |ẽi i
5.5.2. Divergencia y flujo en campos vectoriales

Viendo con un poco más de cuidado la expresión para el gradiente tenemos

˜ (φ) = grad (φ) = |ẽ1 i ∂ + |ẽ2 i ∂ |ẽ2 i + |ẽ3 i ∂
∇ φ=
|ẽi i ∂
φ
h1 ∂ x̃1 h2 ∂ x̃2 h3 ∂ x̃3 (h)i ∂ x̃i
Donde hemos indicado por (h)i al factor de escala y no implica suma. La suma está indicada entre las
componentes ∂ ∂x̃i ≡ ∂i y los elementos de la base {|ẽi i} . Con esta inspiración podemos construir un operador
vectorial
˜ hẽ1 | ∂ hẽ2 | ∂ hẽ3 | ∂
∇≡ + +
H (h1 , h2 , h3 ) ∂ x̃1 F (h1 , h2 , h3 ) ∂ x̃2 G (h1 , h2 , h3 ) ∂ x̃3
con lo cual, si cuidamos el orden de operación, podremos realizar un “producto escalar entre dos vectores”
˜ · ã ≡
∇

hẽ1 | ∂ hẽ2 | ∂ hẽ3 | ∂
+ + a1 |ẽ1 i + a2 |ẽ2 i + a2 |ẽ3 i
H (h1 , h2 , h3 ) ∂ x̃1 F (h1 , h2 , h3 ) ∂ x̃2 G (h1 , h2 , h3 ) ∂ x̃3

hẽ 1 | ∂ a1 |ẽ1 i + a2 |ẽ2 i + a2 |ẽ3 i
˜ · ã ≡
∇ +
H (h1 , h2 , h3 ) ∂ x̃1

hẽ2 | ∂ a1 |ẽ1 i + a2 |ẽ2 i + a2 |ẽ3 i hẽ3 | ∂ a1 |ẽ1 i + a2 |ẽ2 i + a2 |ẽ3 i
+ +
F (h1 , h2 , h3 ) ∂ x̃2 G (h1 , h2 , h3 ) ∂ x̃3

y hay que tener cuidado con la posible variación de los vectores base. Consideremos en caso de coordenadas
cartesianas, x1 , x2 , x3 → (x, y, z) , donde la base {|ẽi i} ≡ {|ii , |ji , |ki} es constante. Entonces tendremos
de forma inmediata

∂ai xj ∂ax (x, y, z) ∂ay (x, y, z) ∂az (x, y, z)
˜
∇ · ~a = ≡∂i ai xj ≡ + +
∂ x̃i ∂x ∂y ∂z
Divergencia como medida de flujo

El significado fı́sico de la divergencia puede comprenderse si consideramos la definición, independiente
del sistema de coordenada
ZZ ZZ ZZ
˜ · ~a = df = lı́m 1
div [~a] ≡ ∇ ~ ≡ lı́m 1
~a · dS ~a · n̂s dS = lı́m
1
an̂ dS
dV V →0 V s V →0 V s V →0 V s
Es decir el flujo por unidad de volumen. Otra vez, para un sistema de coordenadas cartesianas construimos
un cubo diferencial con aristas que coincidan con los ejes coordenados. Entonces se tiene que las caras del
cubo serán con
~x+ = (dy dz) ı̂; dS
dS ~x− = − (dy dz)ı̂
dx
~y+ = (dx dz) ̂; dS

dS ~y− = − (dx dz) ̂
dy
~z+ = (dx dy) k̂; dS

dS ~z− = − (dx dy) k̂
dy
el flujo por las seis caras será

~x+ + ~a · dS
df = ~a · dS ~x− + ~a · dS
~y+ + ~a · dS
~y− + ~a · dS
~z+ + ~a · dS
~z−
con lo cual
df = ax (x + dx, y, z) dy dz − ax (x, y, z) dy dz+

+ ay (x, y + dy, z) dx dz − ay (x, y, z) dx dz+
+ az (x, y, z + dz) dx dy − az (x, y, z) dx dy
df = (ax (x + dx, y, z) − ax (x, y, z)) dy dz + (ay (x, y + dy, z) − ay (x, y, z)) dx dz+
+ (az (x, y, z + dz) − az (x, y, z)) dx dy
desarrollando por Taylor otra vez, tendremos

∂ ax (x, y, z)
ax (x + dx, y, z) ≈ ax (x, y, z) + dx
∂x
∂ ay (x, y, z)
ay (x, y + dy, z) ≈ ay (x, y, z) + dy
∂y
∂ az (x, y, z)
az (x, y, z + dz) ≈ az (x, y, z) + dz
∂z

obtendremos
∂ ax (x, y, z) ∂ ay (x, y, z) ∂ az (x, y, z)
df = dx dy dz + dy dx dz + dz dx dy
∂x ∂y ∂z

~= ∂ ax (x, y, z) ∂ ay (x, y, z) ∂ az (x, y, z)
df = ~a · dS + + dV
∂x ∂y ∂z
Consecuentemente
ZZ ZZZ ZZZ
~= ∂ ax (x, y, z) ∂ ay (x, y, z) ∂ az (x, y, z) ˜ · ~a dV
f= ~a · dS + + dV ≡ ∇
S V ∂x ∂y ∂z V
La primera conclusión es que podemos convertir una integral de superficie cerrada de un campo vectorial,
en una integral de volumen encerrada por esaRRmisma superficie. Lo hemos demostrado para el caso de
coordenadas cartesianas, pero como el flujo f = S ~a · dS ~ es un escalar, esta afirmación vale para cualquier
sistema de coordenadas. Esto se conoce como el Teorema de la Divergencia el cual veremos más adelante
(ver sección 5.7.1 en la página 176). A partir de este teorema tenemos que si la divergencia de un campo
vectorial en positiva lo interpretaremos como flujo hacia afuera (saliente) del volumen V encerrado por la
superficie, S, y si la divergencia del campo es negativa esa tendremos flujo entrante. Como ilustración puede
ver el ejemplo de la página 163.
Divergencia y coordenadas curvilı́neas

Para encontrar la expresión para la divergencia en coordenadas curvilı́neas generalizadas partimos de la
definición invariante de sistema de coordenadas
ZZ ZZ ZZ
˜ · ~a = lı́m 1
div [~a] ≡ ∇ ~ ≡ lı́m 1
~a · dS ~a · n̂s dS = lı́m
1
an̂ dS
V →0 V s V →0 V s V →0 V s
y al igual que procedimos en coordenadas cartesianas, ahora consideraremos un “paralelepı́pedo curvilı́neo”

con tres de sus aristas alineadas con el sistema ortogonal curvilı́neo. Las caras de este “paralelepı́pedo
curvilı́neo podrán ser representadas como Entonces se tiene que las caras del cubo serán con

dS~q1 + = ds→q2 ds→q3 1 |ẽ1 i ; ~q1 − = − ds→q2 ds→q3 |ẽ1 i
dS
dq

~q2 + = ds→q3 ds→q1
dS |ẽ2 i ; ~q2 − = − ds→q3 ds→q1 |ẽ2 i
dS
dq 2

~q3 + = ds→q1 ds→q2
dS |ẽ3 i ; ~q3 − = − ds→q1 ds→q2 |ẽ3 i ;
dS
dq 3
donde denotamos ds→i el arco de curva a lo largo de la coordenadas curvilı́neas generalizada q i . Los paréntesis
(·)dqi indican que esta superficie es evaluada en q i + dq i Adicionalmente, es de hacer notar que
p
(ds→i ) = g̃ii dq i = hi dq i donde los ı́ndices repetidos NO indican suma
Ahora bien, dado que |ai ≡ ~a = ãj |ẽj i el flujo por las seis caras será
~q1 + + ~a · dS
df = ~a · dS ~q1 − + ~a · dS
~q2 + + ~a · dS
~q2 − + ~a · dS
~q3 + + ~a · dS
~q3 −

continuando el paralelo, pero con mucho más cuidado. Para comenzar vemos que ES el flujo del campo
vectorial lo que está siendo evaluado en dos puntos distintos. A lo largo de q 1 vemos que

~q1 − = ã1 q 1 , q 2 , q 3 h2 h3 dq 2 dq 3
~a · dS

~q2 − = ã2 q 1 , q 2 , q 3 h3 h1 dq 3 dq 1
~a · dS

~q3 − = ã3 q 1 , q 2 , q 3 h1 h2 dq 1 dq 2
~a · dS
con lo cual es el flujo lo que debemos desarrollar por Taylor.

!
1 1 1 2 3
1 1 2 3
∂ ã1 q 1 , q 2 , q 3 h2 h3 1
ã q + dq , q , q h2 h3 = ã q ,q ,q h2 h3 + dq
∂q 1
!
2 1 2 2 3
2 1 2 3
∂ ã2 q 1 , q 2 , q 3 h3 h1 2
ã q , q + dq , q h3 h1 = ã q ,q ,q h3 h1 + dq
∂q 2
!
∂ ã3 q 1 , q 2 , q 3 h1 h2
ã3 q 1 + dq 1 , q 2 , q 3
h1 h2 = ã3 q 1 , q 2 , q 3
h 1 h2 + dq 3
∂q 3
Nótese que el caso cartesiano no se hizo explı́cito este echo por cuanto h3 = h2 = h1 = cte = 1. Entonces el
flujo por las el caso de coordenadas curvilı́neas será

∂ ã1 q 1 , q 2 , q 3 h2 h3 1 2 3 ∂ ã2 q 1 , q 2 , q 3 h3 h1
df = dq dq dq + dq 2 dq 3 dq 1 +
∂q 1 ∂q 2

∂ ã3 q 1 , q 2 , q 3 h1 h2
+ dq 3 dq 1 dq 2
∂q 3
si recordamos que
p p p
dV = (ds→1 ) (ds→2 ) (ds→3 ) = g̃11 dq 1 g̃22 dq 2 g̃33 dq 3 = h1 h2 h3 dq 1 dq 2 dq 3
donde denotamos ds→i el arco de curva a lo largo de la coordenadas curvilı́neas generalizada q i . Tendremos
que
!
df 1 ∂ ã1 q 1 , q 2 , q 3 h2 h3 ∂ ã2 q 1 , q 2 , q 3 h3 h1 ∂ ã3 q 1 , q 2 , q 3 h1 h2
= + +
dV h1 h2 h3 ∂q 1 ∂q 2 ∂q 3
con lo cual identificamos la forma genérica de la divergencia en coordenadas curvilı́neas

!
1 ∂ ã1 q 1 , q 2 , q 3 h2 h3 ∂ ã2 q 1 , q 2 , q 3 h3 h1 ∂ ã3 q 1 , q 2 , q 3 h1 h2
˜
div [~a] ≡ ∇ · ~a = + +
h1 h2 h3 ∂q 1 ∂q 2 ∂q 3

Un par de ejemplos
La ecuación de continuidad El primero de los ejemplos que consideraremos es la ecuación de continuidad.
Consideremos una superficie cerrada S que encierra un volumen V. Esta superficie está inmersa en un fluido,
de densidad ρ (~r, t) que fluye con un campo de velocidades ~v (~r, t) . Supondremos además que el volumen V
que encierra la superficie S no cambia de posición, con lo cual, la variación de masa del fluido contenido en
este volumen es Z Z Z ZZZ
∂ ∂ρ (~r, t)
ρ (~r, t) dV = dV
∂t V V ∂t
Entonces la variación de la cantidad de fluido encerrada por la superficie S será igual a la cantidad de fluido
que escapa (o ingresa) a través de esa superficie. Esto es
ZZZ ZZ ZZZ
∂ρ (~r, t) ~ · (~v (~r, t) ρ (~r, t)) dV
dV = − ρ (~r, t) ~v (~r, t) · n̂s dS = − ∇
V ∂t s V
con lo cual
ZZZ
∂ρ (~r, t) ~ ∂ρ (~r, t) ~
+ ∇ · (~v (~r, t) ρ (~r, t)) dV = 0 ⇔ + ∇ · (~v (~r, t) ρ (~r, t)) = 0
V ∂t ∂t
y esta última representa la ecuación de continuidad en dinámica de fluidos.
Fuentes y sumideros El segundo ejemplo es un cálculo explı́cito el cual ilustra la interpretación de la

divergencia como medida de flujo de un campo vectorial. Consideremos un campo vectorial de la forma
~r q
~a (~r) = q 3
≡ 2 ûr ⇒
r r

~ · ~a = 1 ∂ (ãr (r, θ, ϕ) hθ hϕ ) ∂ (ãθ (r, θ, ϕ) hϕ hr ) ∂ (ãϕ (r, θ, ϕ) hr hθ )
∇ + +
hr h θ hϕ ∂r ∂θ ∂ϕ
q 2
!
~ · ~a = 1 ∂ r2 r sen θ
∇ =0
r2 sen θ ∂r
ya que en coordenadas esféricas, hr = 1, hθ = r, hϕ = r sen θ.

Nótese que el origen del sistema coordenado (el punto r = 0) no está definido porque no lo estaba en
el campo vectorial original ~a (~r) = rq2 ûr . Con lo cual, se tiene que si la superficie S no encierra a r = 0,
entonces el flujo a través de esa superficie será nulo
ZZ ZZZ
f= ~=
~a · dS ∇˜ · ~a dV = 0
S V
Es decir, todo lo que entra sale. Sin embargo, si el volumen contiene al origen de coordenadas no podemos
decir nada por cuanto hay una indeterminación en la expresión de la divergencia.
Consideremos con más cuidado este caso de la aplicación del Teorema de la Divergencia, en el cual la
superficie S contenga el origen de coordenadas. Es claro que el volumen contenido entre dos esferas de
distintos radio r̃ < r, centradas en el origen y con superficies S̃ y S respectivamente no contiene al origen y
por lo tanto el flujo será nulo
ZZZ ZZ ZZ
f= ˜ · ~a dV = 0 =
∇ ~a · n̂s dS + ~a · n̂s̃ dS̃
V s s

Pero el campo vectorial sobre la superficie S̃ de la esfera de radio r̃ es

ZZ ZZ ZZ
q q q
~a = 2 ûr , y n̂s̃ ≡ −ûr , con lo cual ~a · n̂s̃ dS̃ = û
2 r
· (−û r ) dS̃ = − 2
ds→θ ds→ϕ
r̃ s̃ s̃ r̃ s̃ r̃
es decir,
ZZ ZZ ZZ Z π Z 2π
q q 2
~a · n̂s dS = ds→θ ds→ϕ = r̃ sen θ dθ dϕ = q sen θ dθ dϕ = 4πq
s s̃ r̃2 s̃ r̃2 0 0
ya que dS̃ = hθ dθ hϕ dϕ ≡ r̃dθ r̃ sen θdϕ. Con lo cual, tenemos que el flujo de un campo singular en un
punto (el origen de coordenadas), ~a (~r) = rq2 ûr , a través de una superficie de que encierra ese punto singular,
no es nulo y es igual a 4πq. El campo vectorial ~a (~r) , se denominará campo de una partı́cula fuente si q > 0
y campo de un sumidero si q < 0
5.5.3. Rotores, lı́neas de torbellino y Circulación

Del mismo modo como hemos venido procediendo, haremos otra operación vectorial con el operador
˜ Tendremos entonces el rotor o rotacional actuando u operando sobre un campo vectorial ∇×~
nabla ∇ ˜ a. En
coordenadas cartesianas podremos expresar esta operación como
˜ a = εijk ∂j ak |ei i ≡ εijk ∂ak |ei i = (∂2 a3 − ∂3 a2 ) |e1 i + (∂3 a1 − ∂1 a3 ) |e2 i + (∂1 a2 − ∂2 a1 ) |e3 i
∇×~
∂xj

ı̂ ̂ k̂

∇×~a = (∂y az − ∂z ay )ı̂ + (∂z ax − ∂x az ) ̂ + (∂x ay − ∂y ax ) k̂ ≡ ∂x
˜ ∂y ∂z

ax ay az
El rotor de un campo vectorial genera otro campo (pseudo)vectorial llamado campo rotor del campo vectorial.
Por razones que serán evidentes enseguida, las curvas integrales de este campo rotor se denominan lı́neas de
torbellino.
Lı́neas de torbellino
Consideremos el siguiente campo vectorial en coordenadas cilı́ndricas para z ≥ 0
−z y zx
~a = z ûϕ = z (− sen ϕ ı̂ + cos ϕ ̂) = p ı̂ + p ̂
2
x +y 2 x2 + y 2
con lo cual el campo rotor del campo vectorial ~a será

! ı̂ ̂ k̂
−z y zx
~b = ∇
˜ × ~a (x, y, z) = ∇×
˜ ∂ ∂y ∂z
p ı̂ + p ̂ = x ⇒
2
x +y 2 x2 + y 2 √−z y √ z2 x 0
x2 +y2 x +y 2

˜ × ~a (x, y, z) = p −x
~b = ∇ ı̂ − p
y
̂+ p
z
k̂
x2 + y 2 x2 + y 2 x2 + y 2

Figura 5.6: Rotores de un campo vectorial, lı́neas de torbellino
es claro que el campo vectorial y su campo rotor son ortogonales

! !
−z y zx −x y z
p ı̂ + p ̂ · p ı̂ − p ̂+ p k̂ = 0
x2 + y 2 x2 + y 2 x2 + y 2 x2 + y 2 x2 + y 2
Tal y como se detalló en la Sección 5.3 de la página 151 las lı́neas de flujo se construyen a partir de un
vector diferencial paralelo a campo vectorial en cada punto. Esto es si

ı̂ ̂ k̂

~ × ~a (x, y, z) = ∂x ∂y ∂z = (∂y az − ∂z ay )ı̂ + (∂z ax − ∂x az ) ̂ + (∂x ay − ∂y ax ) k̂
~b = ∇

ax ay az
tendremos que
d~r ∝ ~b = ∇
~ × ~a (x, y, z)
⇓
dx dy dz
= = = dλ
bx (x, y, z) by (x, y.z) bz (x, y.z)
⇓
dx dy dz
= = = dλ
(∂y az − ∂z ay ) (∂z ax − ∂x az ) (∂x ay − ∂y ax )
donde hemos parametrizado la curva con λ.
por lo tanto
dx dy dz
= = = dλ
(∂y az − ∂z ay ) (∂z ax − ∂x az ) (∂x ay − ∂y ax )
p p p
x2 + y 2 dx x2 + y 2 dy x2 + y 2 dz
= = = dλ
−x −y z

las dos primeras ecuaciones proveen


dx

 = √ −x = C̃1 ⇒ x (λ) = λC̃1
dy y  dλ x +y 2
2
= ⇒ y (x) = xC1 ⇒
dx x 
 dy
 dλ = √ −y = C̃2 ⇒ y (λ) = λC̃2
x +y 2
2
con
1 C1
C1 = cte; C̃1 = − q = cte; C̃2 = − q = C1 C̃1 = cte
2 2
1 + (C1 ) 1 + (C1 )
finalmente
p
x2 + y 2 dz dz z z z z
= dλ ⇒ =p = q = q =
z dλ 2
x +y 2 2 2 −λ
x 1 + (C1 ) λC̃1 1 + (C1 )
con lo cual
dz z 1
= ⇒ z (λ) = C̃3
dλ −λ λ
Lı́neas de campo ortogonales a superficies

Hemos visto como la condición d~r ∝ ~b = ∇ ~ × ~a (x, y, z) encuentra lı́neas (de torbellino) perpendiculares
al campo ~a (x, y, z) . Uno también puede plantearse encontrar el conjunto de superficies para las cuales las
lı́neas de flujo del campo vectorial, ~a (x, y, z) , sean perpendiculares. Para ello suponemos que existen estas
superficies y que se representan, matemáticamente, como un función ϕ = ϕ (x, y, z) . Por lo tanto
~ ∝ ~a (x, y, z) ⇒ ∇
∇ϕ ~ × (γ (x, y, z) ~a (x, y, z)) = ∇γ
~ (x, y, z) × ~a (x, y, z) + γ (x, y, z) ∇
~ × ~a (x, y, z) = 0
~ es proporcional al campo ~a (x, y, z) y al aplicar el rotor a ambos miembros se anula. Más aún,
es decir ∇ϕ
al proyectar sobre el mismo vector ~a la ecuación de la derecha nos queda
h i h i
~ (x, y, z) × ~a (x, y, z) + ~a (x, y, z) · γ (x, y, z) ∇
~a (x, y, z) · ∇γ ~ × ~a (x, y, z) = 0
ambos sumandos se anula por definición de producto vectorial, pero el segundo sumando
h i
~a (x, y, z) · ∇~ × ~a (x, y, z) = 0
impone una condición sobre el campo independiente de la función de proporcionalidad.

Por lo tanto, la condición necesaria y suficiente para que las lı́neas de flujo de un campo vectorial ~a (x, y, z)
sean perpendiculares a un conjunto de superficies ϕ = ϕ (x, y, z) es
h i
~a (x, y, z) · ∇~ × ~a (x, y, z) = 0
Circulación de un campo vectorial

La idea (y el nombre de rotor ) surge de la idea de rotación (¿ circulación ? ) que este operador descubre
al ser “aplicado” a un campo vectorial. Como se muestra en la Figura 5.7, la idea intuitiva es colocar un
“detector” de rotación inmerso en el campo. En este caso es un par de aspas e imaginamos que el campo
vectorial representa un campo de velocidades de un fluido. Si el fluido hace girar las aspas en sentido horario

Figura 5.7: Idea sobre el significado fı́sico del rotor
(tirabuzón o sacacorchos derecho hacia arriba) diremos que el campo tiene una “circulación” positiva y el rotor
del campo siempre será positivo en esa región. Si es inversa, diremos que el campo tiene una “circulación”
negativa y el rotor también lo será en esa región. Finalmente, si el par de aspas no rota, el campo tendrá una
circulación nula o no tendrá circulación y su rotor será también nulo en esa región.
Para concretar esta intuición de forma matemática, procedemos de la siguiente forma. Suponga una
circunferencia con radio r = 2, la cual viene descrita paramétricamente por el radio vector
~r (t) = 2 cos t ı̂ + 2 sin t ̂ ⇒ d ~r = 2 (− sen ϕ ı̂ + cos ϕ ̂) dϕ
y nos planteamos “hacer circular el campo” a lo largo de la esa trayectoria. Esto es realizar la siguiente
integral I Z 2π
Γ = ~a · d ~r = z (− sen ϕ ı̂ + cos ϕ ̂) · 2 (− sen ϕ ı̂ + cos ϕ ̂) dϕ = 4πz
0
HEl campo vectorial ~a = z (− sen ϕ ı̂ + cos ϕ ̂) está representado en la Figura 5.6. Hemos utilizado el sı́mbolo
para denotar la integral de lı́nea en un circuito cerrado. Es la primera idea de integrales de campos
vectoriales que veremos con más detalles en las sección 5.6.1. Uno hace el producto escalar ~a · d ~r y luego
integra.
Es interesante comparar este resultado con el flujo del campo de rotores a través de la superficie que
delimita la circunferencia de radio r = 2. Vale decir
ZZ ZZ !
−x y z
~
∇ × ~a · n̂s̃ dS̃ = p ı̂ − p ̂+ p k̂ · k̂ dx dy ⇒
x2 + y 2 x2 + y 2 x2 + y 2
ZZ ZZ ZZ Z 2 Z 2π
~ × ~a · n̂s̃ dS̃ = z dx dy dr rdθ
∇ p =z =z dr dθ = 4zπ
x2 + y 2 r 0 0
Esta “coincidencia” no es tal, corresponde a otro Teorema Integral para campos vectoriales, el Teorema de
Stokes (ver sección 5.7.2 en la página 182) mediante el cual se convierte una integral cerrada de lı́nea de un
campo vectorial en el flujo del campo de rotores. Este teorema lo estudiaremos con detalle en la sección 5.7.2

La idea de circulación se puede generalizar a un campo vectorial genérico,

~a = ax (x, y, z)ı̂+ay (x, y, z) ̂+ax (x, y, z) k̂
con lo cual la integral de lı́nea cerrada, a lo largo de una circunferencia de radio, r, en el plano x, y será
I Z 2π n o
Γ = ~a · d ~r = ax (x, y, z)ı̂+ay (x, y, z) ̂+ax (x, y, z) k̂ · (−r sen ϕ ı̂ + r cos ϕ ̂) dϕ
0
y suponiendo r ≪ 1 podemos desarrollar por Taylor las componentes del campo vectorial en al plano x, y
alrededor del origen de coordenadas rx,y ∼ 0. Esto es

x ∂ax ∂ax ∂ax
ax (x, y, 0) = ax |r=0 + x ∂a
∂x r=0 + y ∂y + · · · = ax |r=0 + r cos ϕ ∂x r=0 + r sen ϕ ∂y + ···
r=0 r=0

∂a ∂a ∂a ∂a
ay (x, y, 0) = ay |r=0 + x ∂xy + y ∂yy + · · · = ay |r=0 + r cos ϕ ∂xy + r sen ϕ ∂yy + ···
r=0 r=0 r=0 r=0
Por lo tanto, la integral de lı́nea nos queda como

I Z 2π
∂ax ∂ax
Γ = ~a · d ~r = − ax |r=0 + r cos ϕ + r sin ϕ r sin ϕ dϕ+
0 ∂x r=0 ∂y r=0
Z 2π
∂ay ∂ay
+ ay |r=0 + r cos ϕ + r sin ϕ r cos ϕ dϕ
0 ∂x r=0 ∂y r=0
con los cual I
∂ay ∂ax
Γ= ~a · d ~r = πr2 − + O r3
∂x r=0 ∂y r=0
Finalmente vemos que la componente del rotor en el origen del plano x, y es igual al lı́mite de la circulación
a lo largo de una curva cerrada, dividida entre el área de la superficie que encierra la curva cerrada.

∂ay ∂ax Γ
− = lı́m
∂x r=0 ∂y r=0 r→0 πr2
Rotores y velocidades angulares

Considere un cuerpo rı́gido que gira alrededor de un eje con velocidad angular ω
~ . Entonces la velocidad
tangencial de un punto P, con una posición ~r medida a un origen O situado en ese eje, siempre es
~ × ~r = ı̂ (ωy z − ωz y) + ̂ (ωz x − ωx z) + k̂ (ωx y − ωy x)
~v = ω
y su rotor será

ı̂ ̂ k̂

~ × ~v = (∂y vz − ∂z vy )ı̂ + (∂z vx − ∂x vz ) ̂ + (∂x vy − ∂y vx ) k̂ ≡ ∂x
∇ ∂y ∂z

vx vy vz
es decir, por ser un cuerpo rı́gido la velocidad angular ω ~ es independiente de ~r; o lo que es lo mismo, todo
el cuerpo rı́gido tiene la misma velocidad angular. Con ello tendremos que

˜ × ~v = εijk ∂j vk |ei i = εijk ∂j εklm ω l rm |ei i = δli δm
j i j
∇ − δm δl ∂j ω l rm |ei i

˜ × ~v = δli δm
j i j
∇ − δm δl ω l δjm |ei i = 3ω i − ω i |ei i = 2ω i |ei i = 2~
ω

sin ı́ndices hubiera sido

~ × ~v = (∂y vz − ∂z vy ) = ∂y (ωx y − ωy x) − ∂z (ωz x − ωx z) = 2ωx
∇
x

~ × ~v
∇ = (∂z vx − ∂x vz ) = ∂z (ωy z − ωz y) − ∂x (ωx y − ωy x) = 2ωy
y

~ × ~v
∇ = (∂x vy − ∂y vx ) = ∂x (ωz x − ωx z) − ∂y (ωy z − ωz y) = 2ωz
z
Otra vez, el rotor de una campo de velocidades de un cuerpo (que rota) “detecta” su velocidad angular.
Rotores y coordenadas curvilı́neas

Una vez más recurrimos a una definición para el rotor independiente del sistemas de coordenada
ZZ ZZ
~ × ~a = rot [~a] = lı́m 1
∇ ~ × ~a = lı́m 1
dS n̂s̃ × ~a dS̃
V →0 V V →0 V
y del mismo modo que calculamos el flujo a través de las distintas capas de un volumen podremos (no lo
haremos y se lo dejaremos al lector) demostrar que
" #
h1 |ẽ1 i h2 |ẽ2 i h3 |ẽ3 i
1 ∂ h ak 1
~ × ~a = rot [~a] =
∇ εijk k̃
|ẽi i = ∂ ∂ ∂
hj̃ hk̃ ∂q j
h1 h2 h3 ∂ q1 ∂ q2 ∂ q3
h1 a1 h2 a2 h3 a3
donde los ı́ndices repetidos i, j, k indican suma; j̃ y k̃ no indican suma sino que replican los valores de los
ı́ndices j, k.
Explı́citamente

~ |ẽ1 i ∂ (h3 a3 ) ∂ (h2 a2 ) |ẽ2 i ∂ (h1 a1 ) ∂ (h3 a3 )
∇ × ~a = rot [~a] = − + − +
h2 h3 ∂ q2 ∂ q3 h1 h3 ∂ q3 ∂ q1

|ẽ3 i ∂ (h2 a2 ) ∂ (h1 a1 )
+ −
h1 h2 ∂ q1 ∂ q2
5.5.4. ~
Formulario del Operador nabla, ∇
~ en las fórmulas anteriores actúa como un operador lineal. Esto es, dadas ϕ (~r) , χ (~r) , ψ (~r)
El operador nabla, ∇,
funciones escalares de variable vectorial y ~a y ~b dos campos vectoriales cuales quiera, se puede generar el
siguiente formulario, el cual deberá ser demostrado por el lector
~ (ϕ + χψ) = ∇ϕ
∇ ~ +∇
~ (χψ) = ∇ϕ
~ + ψ ∇χ
~ + χ∇ψ
~

~ · ~a + ϕ~b = ∇
∇ ~ · ~b + ∇ϕ
~ · ~a + ϕ∇ ~ · ~b

~ × ~a + ϕ~b = ∇
∇ ~ × ϕ~b = ∇
~ × ~a + ∇ ~ × ~b + ϕ∇
~ × ~a + ∇ϕ ~ × ~b

y también si consideramos las cantidades ~a · ~b y ~a × ~b tendremos

~ ~a · ~b = ∂ i aj bj |ei i = ∇
∇ ~ · ~a ~b + ∇ ~ · ~b ~a

~ · ~a × ~b = ∂ i εijk aj bk = εijk ∂ i aj bk + εijk ∂ i bk aj = ∇
∇ ~ × ~a · ~b − ~a · ∇~ × ~b

~ × ~a × ~b = ~b · ∇
∇ ~ ~a − ~b ∇~ · ~a + ~a ∇ ~ ~b
~ · ~b − ~a · ∇
es claro que
~a ∇~ · ~b 6= ~b · ∇
~ ~a ⇐⇒ aj ∂ i bi =6 bi ∂ i aj
por cuanto en las partes izquierda las derivadas actúan sobre las componentes de ~b, mientras que en las
partes derechas es sobre las componentes de ~a.
Otros casos importantes se presentan cuando los campos escalares y/o vectoriales son a su vez funciones
de un campo escalar. Es decir, funciones compuestas. Esto es
ψ = ψ (χ (~r)) y ~a = ~a (χ (~r)) .
En este caso, tendremos

d ~a
~ (χ (~r)) = dψ ∇χ;
∇ψ ~ ∇ ~ · d ~a ;
~ · ~a (χ (~r)) = ∇χ ~ × ~a (χ (~r)) = ∇χ
∇ ~ ×
dχ dχ dχ
Para demostrar, por ejemplo, ∇ ~ · ~a (χ (~r)) = ∇χ

~ · d ~a , utilizamos la estrategia de Taylor y expandimos el
dχ
campo vectorial alrededor de un determinado punto, digamos ~r = ~r0 arbitrario. Esto es

d ~a 1 d2 ~a 2
~a = ~a (~r0 ) + (χ (~r) − χ (~r0 )) + (χ (~r) − χ (~r0 )) + · · ·
dχ ~r0 2 dχ2 M
aplicando la divergencia a ambos miembros queda como

" # 2
d ~
a
~ · ~a = ∇
∇ ~ · [~a (~r0 )] + ∇
~ · ~ · d ~a (χ (~r) − χ (~r0 ))2 + · · ·
(χ (~r) − χ (~r0 )) + 1 ∇
dχ ~r0 2 dχ2 M
con lo cual

~ d ~a ~ d2 ~a ~ 1 3
2 d ~
a ~ (~r) + · · ·
∇ · ~a = · ∇χ (~r) + (χ (~r) − χ (~r0 )) · ∇χ (~r) + (χ (~r) − χ (~r0 )) · ∇χ
dχ ~r0 dχ2 ~r0 2 dχ3 ~r0
esta relación vale para todo ~r, en particular para ~r = ~r0 . Con lo cual

~ d ~a ~ (~r0 ) ~ · ~a = d ~a · ∇χ
~ (~r)
∇ · ~a = · ∇χ =⇒ ∇
~
r0 dχ ~r0 dχ
ya que ~r0 es arbitrario, con lo cual queda demostrado.

5.5.5. Nabla dos veces y el Laplaciano

Formulario de Nabla dos veces
~ como un operador surge la pregunta de su aplicación repetida sobre distintos
Considerando a Nabla, ∇,
objetos. Consideremos primero las siguientes expresiones en coordenadas cartesianas. Esto es
~ · ∇φ
∇ ~ =∇
~ 2 φ = ∆φ = ∂ i ∂i φ
~ × ∇φ
∇ ~ = εijk ∂j ∂k φ |ei i = 0

~ ∇
∇ ~ · ~a = ∂ i ∂ j aj |ei i = ∂ j ∂ i aj |ei i

~ × ∇
∇ ~ · ~a = ∇
~ · ∇~ × ~a = 0

~ × ∇
∇ ~ × ~a = εijk ∂j εklm ∂ l am |ei i = δ i δ j − δ i δ j ∂j ∂ l am |ei i = ∂ i ∂j aj |ei i − ∂j ∂ j ai |ei i
l m m l

~ × ∇
∇ ~ × ~a = ∇
~ ∇ ~ · ~a − ∆~a
Laplaciano y campos escalares

Más allá de la gimnasia de ı́ndices para determinar la expresión de la relación vectorial, quizá la más
importante de las aplicaciones es el Laplaciano, el cual en ℜ3 y en coordenadas cartesianas puede expresarse
como:
~ · ∇φ
∇ ~ =∇ ~ 2 φ = ∆φ = ∂ i ∂i φ = ∂xx φ + ∂yy φ + ∂zz φ
La importancia el Laplaciano reside en que la mayor parte (casi todas) las ecuaciones de la fı́sica matemática
son ecuaciones diferenciales (ordinarias y parciales) de segundo orden y el Laplaciano las genera en el espacio.
Adicionalmente la solución a la ecuación armónica
∆φ = ∂ i ∂i φ = ∂xx φ + ∂yy φ + ∂zz φ = 0
es de importancias en varias áreas de la fı́sica.
Se puede demostrar fácilmente que el Laplaciano cumple con
∆ (φ + Cψ) = ∆φ + C∆ψ; ~ · ∇φ
∆ (φψ) = φ∆ψ + ψ∆φ + 2∇ψ ~
considerando las expresiones para el gradiente y la divergencia en coordenadas curvilı́neas
˜ = 1 ∂ φ |ẽ1 i + 1 ∂ φ |ẽ2 i + 1 ∂ φ |ẽ3 i

∇φ
h1 ∂ q 1 h2 ∂ q 2 h3 ∂ q 3
y !
1 ∂ ã1 q 1 , q 2 , q 3 h2 h3 ∂ ã2 q 1 , q 2 , q 3 h3 h1 ∂ ã3 q 1 , q 2 , q 3 h1 h2
˜ · ~a =
∇ + +
h1 h2 h 3 ∂q 1 ∂q 2 ∂q 3
respectivamente, es fácil llegar a la expresión para el Laplaciano en coordenadas curvilı́neas

1 ∂ h2 h3 ∂ φ ∂ h1 h3 ∂ φ ∂ h2 h1 ∂ φ
∇2 φ ≡ ∆φ = + +
h1 h2 h3 ∂ q 1 h1 ∂ q 1 ∂ q2 h2 ∂ q 2 ∂ q3 h3 ∂ q 3

Laplaciano y campos vectoriales

Inspirado en la forma que toma un campo vectorial en coordenadas cartesianas, definiremos el Laplaciano
de un campo vectorial como la relación

˜ ∇
∆ ~a = ∇ ˜ · ~a − ∇×
˜ ˜ a
∇×~
Desarrollando esta expresión en coordenadas cartesianas tendremos que

∆ ~a = ∂ i ∂ j aj − ∂ i ∂j aj − ∂j ∂ j ai |ei i =⇒ ∆ ~a = ∂j ∂ j ai |ei i ≡ ∆ai |ei i
Es decir, que el Laplaciano de un campo vectorial, expresado en coordenadas cartesianas, es igual al

vector cuyas componentes sonlos Laplacianos de las componentes del campo original. Es importante resaltar
i
que la expresión ∆ ~a = ∆a |ei i se cumple
únicamente
en coordenadas cartesianas pero la definición que
hemos propuesto, ∆ ~a = ∇ ˜ ∇ ˜ · ~a − ∇×˜ ˜ a , es una ecuación vectorial y es, por lo tanto, válida en
∇×~
cualquier sistema de coordenadas.
El Laplaciano de campos vectoriales no lleva construir un formulario de relaciones fácilmente demostrables

˜
∆ ∇φ =∇ ˜ (∆φ) ; ˜ · (∆ ~a) = ∆ ∇
∇ ˜ · ~a ; ˜ (∆ ~a) = ∆ ∇×~
∇× ˜ a
5.5.6. Derivadas Direccionales de Campos Vectoriales

El concepto
Formalmente y como siempre la misma idea de derivada como cociente incremental. Dados dos puntos
P1 y P2 y un vector û que los une (va de P1 → P2 ), entonces por definición
i
d ~a ~a (P2 ) − ~a (P1 ) d ~a d ai ai (P2 ) − ai (P1 )
D|ui |ai ≡ = lı́m =⇒ = = lı́m
du P 2 →P 1 P2 − P1 du du P2 →P1 P2 − P1
por consiguiente, si ~a,tiene por componentes cartesianas (en general

cualquier sistema
de coordenadas orto-
ax d ay d az
gonales) (ax , ay , az ) las componentes del vector derivado serán ddu , du , du . De modo que inspirados
en la derivada direccional de un campo escalar que presentamos en la sección 5.5.1, podemos construir la
expresión para la derivada direccional de cada una de las componentes del vector ddu~a . Esto es
dϕ i
~ · û = ui ∂i ϕ =⇒ d a = û · ∇a
= D|ui φ = ∇φ ~ i = uj ∂j ai =⇒ D|ui |ai ≡ d ~a = û · ∇
~ ~a
du du du
Otra vez, en coordenadas cartesianas se tiene que
d (◦) ~
~ ~a = ui ∂i aj |ej i
D|ui~a = û · ∇ =⇒ D|ui (◦) ≡ = û · ∇ (◦) ≡ ui ∂i (◦)
du
Un ejemplo: el campo de aceleraciones de un fluido

El ejemplo más estándar es la descripción del campo de aceleraciones de un fluido en movimiento. El
campo de aceleraciones de un fluido, como de costumbre, es la variación del campo de velocidades respecto
al tiempo. Esto es ~a = ddt~v . Para escribir la expresión de este campo de aceleraciones, supongamos que un
fluido se mueve y registra un campo de velocidades ~v = ~v (~r, t) el cual, en general, será inhomogéneo y no
estacionario. Identificamos una porción del fluido (partı́cula) cualquiera y observamos que en un intervalo

Figura 5.8: Contribuciones a la variación de la velocidad en un fluido
de tiempo dt esa porción identificada se mueve de P1 → P2 y registra un incremento en su velocidad de ~v

en P1 a ~v + d~v en P2 :
~v (P1 ) ≡ ~v (~r, t) y ~v (P2 ) ≡ ~v (~r + d~r, t + dt)
Tal y como ejemplificamos en la Figura 5.8, este incremento proviene de dos contribuciones. Una, llamada
local, debido a el cambio en la variable temporal y otra, por la comparación del vector velocidad, ~v , en dos
posiciones (traslación espacial o contribución convectiva).
∂~v d ~v
d ~vt = dt y d ~v~u = du
∂t du
Visto de otro modo un poco más informal, dado que el campo es función de dos variables y una de ellas
vectorial
d ~v d ~v ∂~v
~v = ~v (~r, t) ⇒ ~a = = +
dt dr ∂t
d ~
v
De la discusión anterior es claro que du es la derivada direccional del campo de velocidades a lo largo
del vector unitario û que apunta P1 → P2 Ahora bien, para este caso tenemos que:
~v
du = kd ~rk , du = k~v k dt y û =
k~v k
con lo cual la derivada direccional nos queda como
d ~v 1 ~
= ~v · ∇ ~v
du k~v k
finalmente la aceleración nos queda expresada como
d ~v 1 ~ ∂~v 1 ~ i ∂v i
~a = = ~v · ∇ ~v + ⇒ ai = ~v · ∇ v +
dt k~v k ∂t k~v k ∂t
donde hemos representado las componentes cartesianas de los vectores velocidad y aceleración como v i y ai ,
respectivamente.
Es importante hacer una reflexión un poco más fı́sica de las contribuciones. La contribución local proviene
de la variación del vector (por la dependencia temporal) alrededor del punto, sin importar la dirección que
sigue al partı́cula y la contribución convectiva proviene de la inhomogeneidad del campo de velocidades. Esto
es de la variación del campo de velocidades según la dirección que siga la partı́cula.

5.6. Integrales y Campos Vectoriales

5.6.1. Resumiendo lo visto
Integrales de Campos
Después de haber diferenciado campos escalares y vectoriales, el siguiente paso es integrarlos. El primer
caso de este tipo integrales es el trivial que siempre hemos utilizado:
Z Z Z Z Z
~
V (u) d u = ı̂ Vx (u) d u + ̂ Vy (u) d u + k̂ Vz (u) d u = i
V (u) d u |ei i
Ası́ integramos la aceleración de un movimiento parabólico

Z Z
d ~v
= ~a = −g k̂ =⇒ ~v = ~a dt = k̂ −g dt = −k̂gt + ~v0 = −k̂gt + ı̂v0x + ̂v0y + k̂v0z
dt
Ahora bien, existen sutilezas en este caso que debemos tener en cuenta. Por ejemplo considere la integral
Z Z Z
d2 ~a d d ~a d ~a d ~a d d ~a d ~a
dt ~a × = dt ~
a × − × = dt ~a × = ~a × + ~c
dt2 dt dt dt dt dt dt dt
Pero en general los casos quedan resueltos integrando componente a componente con la ayuda de la notación
de ı́ndices Z Z

dt ~a × ~b = dt εijk aj bk |ei i
Quizá uno de los problemas que ilustra mejor esta situación es el movimiento bajo fuerzas centrales. La Ley
de Gravitación de Newton nos dice que
X d ~v M d ~v M
F = m ~a = m = m G 2 ûr =⇒ = G 2 ûr
dt rmM dt rmM
Es costumbre definir la velocidad aerolar, ~vA , como el área barrida por el radio vector posición, ~r (t) que
describe la trayectoria de la partı́cula

d ~r d (r ûr ) dr d ûr d ûr d ûr
2~vA = ~r × = r ûr × = r ûr × ûr + r = r ûr × r = r2 ûr ×
dt dt dt dt dt dt
Nótese que si ~c es un vector constante

d d ûr d ûr d ûr
ûr × = 0 =⇒ ûr × = ~c =⇒ 2~vA = r2 ûr × = const
dt dt dt dt
con lo cual

d d ~v M MG d ûr
(~v × ~vA ) = × ~vA = G 2 ûr × ~vA = ûr × ûr ×
dt dt rmM 2 dt

d MG d ûr d ûr M G d ûr
(~v × ~vA ) = ûr · ûr − (ûr · ûr ) =
dt 2 dt dt 2 dt
integrando
MG
~v × ~vA = ûr + p~
2

Figura 5.9: Trayectorias de integración y campos vectoriales
donde p~ es un vector arbitrario de constante de integración. Finalmente nos damos cuenta que

MG MG
~r · (~v × ~vA ) = r ûr · ûr + p~ = r + rp cos θ
2 2
~r · (~v × ~vA ) = εijk ri vj vAk ≡ ~vA · (~r × ~v ) = ~vA · ~vA = vA

2
y entonces
2
2 2vA
2 MG vA MG
vA = r + rp cos θ =⇒ r = MG
≡ 2p
2 2 + p cos θ 1+ M G cos θ
que constituye la ecuación de una cónica.
Integrales de lı́nea
Ahora nos detendremos con más cuidado en integrales que también ya hemos utilizado, pero muy rápi-
damente. Ası́ tendremos por delante algunos objetos del siguiente tenor:
Z Z Z
φ d ~r, V~ · d ~r y ~ × d ~r
V
C C C
Este tipo de objetos se conoce como integrales de lı́nea y requieren la especificación de la curva, C, (la
trayectoria) a lo largo de la cual se lleva la integración. Es clara la importancia de esa trayectoria para la
integración de los campos por cuanto encontrarán expresiones del campo vectorial que puebla la región a
través de la cual se integra. Esas trayectorias serán abiertas o cerradas dependiendo de la curva que se siga
en el proceso de integración.
Ası́ para integrar un campo escalar φ = φ (~r) en coordenadas cartesianas, tendremos que
Z Z
φ (x, y, z) d ~r = φ (x, y, z) d x ı̂+d y ̂+d z k̂
C C
Z Z Z
= ı̂ φ (x, y (x) , z (x)) d x + ̂ φ (x (y) , y, z (y)) d y + k̂ φ (x (z) , y (z) , z) d z
C C C

tal y como indicamos arriba, las tres integrales se podrán realizar si conocemos, en cada caso, la expresión
del integrando en término de la variable de integración. Esa es la razón por la cual hay que especificar la
curva C que define la trayectoria de integración. Esta define esa funcionalidad.
Integrales de Superficie
Otros objetos que ya nos hemos encontrado son las integrales de superficie y las hemos encontrado cuando
evaluamos el flujo de un campo vectorial y lo relacionamos con la divergencia. Ası́ interpretamos que objetos
ZZ ZZ ZZ
~
~a · dS ≡ ~a · n̂s dS = an̂ dS
s s s
representaban el flujo de las lı́neas de campo a través del diferencial de superficie dS. ~ Es costumbre que
se separen el módulo, dS, de la dirección y el sentido, n̂s el cual es el vector normal (sentido positivo) a
la superficie. Otra vez, las superficies podrán ser abiertas (cuando disponen de una curva que limita sus
fronteras) y cerradas cuando no. Un cı́rculo será una superficie abierta y una esfera cerrada. Por convención
supondremos que el vector normal a una superficie cerrada tendrá sentido positivo saliendo.
La utilización de integrales de superficie nos ha permitido definir, de manera invariante (independiente
del sistema de coordenadas) las expresiones para los operadores diferenciales. Ası́ hemos podido definir:
ZZ ZZ
˜ ≡ grad φ = lı́m 1
∇φ ~ = lı́m 1
φ (x, y, z) dS φ (x, y, z) n̂s dS
V →0 V s V →0 V s
ZZ ZZ ZZ
˜ · ~a ≡ div [~a] = lı́m 1
∇ ~ ≡ lı́m
~a · dS
1
~a · n̂s dS = lı́m
1
an̂ dS
V →0 V s V →0 V s V →0 V s
ZZ ZZ
~ × ~a ≡ rot [~a] = lı́m 1
∇ ~ × ~a = lı́m 1
dS n̂s̃ × ~a dS̃
V →0 V V →0 V
5.7. Campos Vectoriales y Teoremas integrales

En esta sección presentaremos un conjunto de teoremas que relacionan las variaciones de un campo
vectorial con las fuentes que lo producen. En términos técnicos (matemáticos) resultan fundamentales cuando
queremos convertir un tipo de integral (lı́nea, superficie o volumen) en otra.
El primer teorema, el Teorema de Gauss permite expresar el valor de una integral de volumen, V, en-
cerrado por una determinada superficie, S, (cerrada) en términos de una integral sobre esa superficie, S.
El otro teorema importante es el Teorema de Stokes, el cual permite relacionar el valor de una integral de
superficie con la integral de lı́nea sobre la curva que delimita esa superficie.
5.7.1. Teorema de Gauss

Presentación y demostración
La primera relación que presentaremos entre una integral de superficie de un campo vectorial, ~a,y una
de superficie de su derivada es el Teorema de Gauss el cual se expresa de forma vectorial como
ZZ ZZ Z
~≡
~a · d S ~a · n̂s dS = ˜ · ~a d V
∇
s s V

Figura 5.10: Teoremas de Gauss
donde ~a = ~a (x, y, z) es el campo vectorial d S ~ ≡ n̂s dS es el diferencial de área y d V el diferencial de

volumen.
Tal y como vimos en su oportunidad el término ∇ ˜ ·~a es interpretado como el flujo del campo ~a por unidad
de volumen, por lo tanto el lado derecho de la ecuación es la tasa de flujo neto que sale del volumen sobre
el cual estamos integrando.
La demostración del Teorema de Gauss es como sigue. supongamos un volumen encerrado por una
superficie convexa, S, como se muestra en la Figura 5.10 en los cuadrantes I, II y III. Supongamos además
que orientamos el sistema de coordenada de tal forma que una lı́nea paralela a uno de los ejes toca la superficie
en dos puntos (Figura 5.10, cuadrante I). De este modo podemos trazar una superficie (perpendicular a esa
lı́nea) tal que divida la superficie, S, en dos superficies, S1, y S2, cada una de las cuales está bordeada por la
curva, C, (Figura 5.10, cuadrante II).
Al evaluar la integral
Z Z Z ZZ
~=
ax ı̂ · d S ~+
ax ı̂ · d S ax ı̂ · d S~= [ax (x2 , y, z) − ax (x1 , y, z)] d S ′
S S1 S2 s′
ya que las componentes x de los vectores normales a las dos superficies que contribuyen (Figura 5.10,
cuadrante III) tienen signos opuestos
~2 = −ı̂ · d S
d S2x = ı̂ · d S ~1 = −d S1x = d y d z = d S ′
Ahora bien, dado que

Z x2
∂ax ax (x2 , y, z) − ax (x1 , y, z) ∂ax
= lı́m ⇒ ax (x2 , y, z) − ax (x1 , y, z) = dx
∂x x2 →x1 x2 − x1 x1 ∂x
con lo cual Z Z Z Z x2 Z
~= ∂ax ∂ax
ax ı̂ · d S dx d y d z = dV
S s′ x1 ∂x V ∂x

y equivalentemente al hacerlo en las direcciones ̂ y k̂, obtendremos

Z Z Z Z
~= ∂ay ~= ∂az
ay ̂ · d S dV y az k̂ · d S dV
S V ∂y S V ∂z
y finalmente hemos demostrado el Teorema de la divergencia o Teorema de Gauss

ZZ ZZ Z Z Z
∂ax ∂ay ∂az
~≡
~a · d S ~a · n̂s dS = + + dV = ∂i ai d V = ˜ · ~a d V
∇
s s V ∂x ∂y ∂z V V
Expresiones equivalentes para el Teorema de Gauss

Si bien la expresión estándar es la que hemos presentado, existen algunas variantes que se derivan de ella.
Por ejemplo si consideramos un campo escalar, φ (x, y, z) , el teorema de Gauss nos conduce a
ZZ ZZZ ZZ ZZZ
~=
φ (x, y, z) d S ~ (x, y, z) d V y
∇φ dS~ ×B ~ (x, y, z) = ~ ×B
∇ ~ (x, y, z) d V
s V s V
~ (x, y, z) es un campo vectorial.

donde B
Para comprobar la primera de estas dos relaciones consideramos un vector ~c constante y construimos un
campo vectorial
~a (x, y, z) = ~cφ (x, y, z) ⇒
ZZ ZZZ ZZ ZZZ
~=
~a · d S ˜ · ~a d V
∇ ⇒ ~c · ~ = ~c ·
φ (x, y, z) d S ˜ (x, y, z) d V
∇φ
s V s V
Z Z ZZZ
0 = ~c · ~−
φ (x, y, z) d S ˜ (x, y, z) d V
∇φ
s V
es decir, para todo vector ~c siempre se cumple que

ZZ ZZZ
~=
φ (x, y, z) d S ˜ (x, y, z) d V
∇φ
s V
Esa misma metodologı́a se puede aplicar para demostrar la segunda relación si consideramos un campo
~ (x, y, z), con ~c vector constante y se procede de una manera similar.
vectorial ~a (x, y, z) = ~c × B
Ley de Gauss y Campo Eléctrico

La aplicación más emblemática del Teorema de Gauss lo constituyen el cálculo de la divergencia del
campo eléctrico E ~ y su relación con las distribuciones de cargas existentes. Desde siempre sabemos que el
campo eléctrico producido por una carga Qi viene dado por
ZZ
E~ i (~r) = 1 Qi ûr ; ⇒ E ~i = Qi
~i · d S ⇔ ˜ ·E
∇ ~ = ρ (~r)
4πǫ0 ri2 i Si ǫ0 ǫ0
En definitiva la “deducción” de una de las ecuaciones de Maxwell. Si calculamos el flujo del campo eléctrico
~ (~r) atraviesan el volumen: todas entran y todas salen.
en una región sin cargas todas las lı́neas del campo E
Sin embargo si tenemos un conjunto de cargas discretas distribuidas dentro de la región encerrada por la

superficie, S, (ver Figura 5.10, cuadrante IVa) podemos encerrar cada una de las cargas con superficies
esféricas Si . Por lo tanto
ZZ X ZZ Z ZZ X ZZ
E~ ·d S
~+ ~ ·d S
E ~i = ˜ ·E
∇ ~ dV =0 ⇒ ~ ·d S
E ~=− ~ ·d S
E ~i
S i Si V S i Si
Con lo cual hemos definido una superficie con “huecos” alrededor de cada una de las cargas y llegamos a la
conclusión que lo que entra sale. Por su parte, el campo eléctrico medido cada superficie esférica interior, Si
será
E~ = 1 Qi ûr + E ~′
Si 4πǫ0 ri2 i
~ ′ es el campo de todas las otras cargas presentes en e volumen encerrado por S. Es claro que este
donde E
campo E~ ′ tiene flujo cero neto sobre cada esfera de superficie Si . Por lo tanto
ZZ X Z Z 1 Qi X 1 Qi Z Z P
~ ~ ~ ′ Qi Q
E·d S =− 2 ûri + E · n̂Si dSi = 2 dSi = i =
S i Si 4πǫ r
0 i i
4πǫ r
0 i Si ǫ0 ǫ0
donde hemos utilizado que

Z X ZZ ZZ
˜ ~ ′
∇ · E d Vi = 0 = ~ ′ · n̂S dSi ;
E ûri · n̂Si = −1; y dSi = Si = 4πri2
i
Vi i Si Si
Finalmente encontramos una de las Leyes de Maxwell si reescribimos la integral de superficie utilizando la
Ley de Gauss
ZZ Z ZZ Z Z
E ~= Q = 1
~ ·d S ρ (~r) d V ⇒ E~ ·d S
~= ˜ ·E
∇ ~ dV = 1 ρ (~r) d V
S ǫ0 ǫ0 V S V ǫ0 V
con lo cual Z
∇ ~ − ρ (~r)
~ ·E dV ~ = ρ (~r)
~ ·E
⇒∇
V ǫ0 ǫ0
Discontinuidades y densidades superficiales de carga

Normalmente, siempre consideramos que los campos vectoriales ~a = ~a (x, y, z) son campos continuos (y,
más aún, con todas sus derivadas continuas). Sin embargo, encontramos en la naturaleza situaciones en
la cuales el campo varı́a mucho en una distancia muy corta (infinitesimal). En estas situaciones podemos
simular esta rápida variación como una discontinuidad en el campo. Existe formas de aplicar el Teorema de
Gauss para algunas situaciones en las cuales tratamos con campos discontinuos. La manera apropiada de
tratar (derivadas e integrales de) funciones discontinuas es considerándolas no funciones sino distribuciones.
Este tipo de tratamiento está fuera del alcance de este formulario y será considerado en otros cursos.
Supongamos el caso que ilustra la Figura 5.10, cuadrante IVb. Una región R delimitada por una superficie
S, dentro de la cual, una superficie de discontinuidad, S̄, separa dos subregiones R1 y R2 a través de la
cual un campo vectorial, ~a = ~a (x, y, z) , es discontinuo. Ahora bien, el campo vectorial es continuo en las
subregiones, por lo cual el flujo del campo atraviesa las superficies S1 y S̄ que delimitan el volumen V1 de la
región R1 . Entonces el Teorema de Gauss para cada región queda expresado como
Z ZZ ZZ Z ZZ ZZ
∇˜ · ~a d V = ~+
~a · d S ~a+ · n̂S̄ dS̄ y ˜ · ~a d V =
∇ ~−
~a · d S ~a− · n̂S̄ dS̄
V1 S1 S̄ V2 S2 S̄

Figura 5.11: Discontinuidad del Vector Desplazamiento
donde n̂S̄ es el vector normal a al superficie, S̄,de separación de las dos regiones. Adicionalmente hemos
denotado, ~a+ y ~a− el campo ~a evaluado del lado de R1 y R2 , respectivamente. Si ahora consideramos el
teorema de Gauss en toda la región
Z Z Z
∇˜ · ~a d V ≡ ∇˜ · ~a d V + ˜ · ~a d V
∇
V1 +V2 V1 V2
Claramente si el campo es continuo dentro de la región R entonces nos queda la formulación estándar del
Teorema de Gauss, Z ZZ
˜
∇ · ~a d V = ~
~a · d S
V1 +V2 S
por el contrario si el campo es discontinuo, entonces debe tomarse en cuenta la discontinuidad del campo y
la relación que surge de sumar el flujo a través de las dos regiones es
Z ZZ ZZ
˜ · ~a d V =
∇ ~−
~a · d S (~a2 − ~a1 ) · n̂S̄ dS̄
V1 +V2 S S̄
con n̂S̄ el vector unitario, normal a la superficie S̄ y que apunta de R1 → R2 . Es claro que la discontinuidad
que cuenta es la de la componente del campo perpendicular a la superficie (ver Figura 5.11).
Este tipo de discontinuidad en campos irrotacionales es generada por la presencia de fuentes las cuales,
en este caso son densidades superficiales de carga. Quizá el ejemplo tı́pico para la aplicación de las anteriores
consideraciones es la aplicación de las ecuaciones de Maxwell en el caso del vector desplazamiento eléctrico
~ través de una superficie, S̄, que separa dos medios. Este caso se ilustra en la Figura 5.10, cuadrante
D,a
IVc y en la Figura 5.11, sólo que en este último caso el vector normal está definido a la inversa: la región 2
corresponde a la región 1 de la Figura 5.10, cuadrante IVc. La ecuación de Maxwell correspondiente será

~ = ρ (~r)
˜ ·E
∇ ~ = ρ (~r)
˜ ·D
⇒∇ ⇒ D~2 −D
~ 1 · n̂S̄ = σ ~ = ǫ0 E
con D ~
ǫ0
donde n̂S es el vector normal a la superficie (ver Figura 5.10, cuadrante IVc) y σ es la densidad superficial de
carga en la superficie, S. Para comprobar esta relación construimos un volumen cilı́ndrico infinitesimal que
encierra la superficie de discontinuidad, de tal forma que ∆S2 corresponde con la “tapa” del cilindro y ∆S1
con su “base” (Figura 5.10 cuadrante IVc). Adicionalmente, como ∆l ∼ 0 no sólo podremos trabajar sin las

integrales, el flujo a través de las “paredes” del cilindro será despreciable y ∆S2 ≈ ∆S1 , sino que además, al
encerrar la discontinuidad no tomamos en cuenta la contribución de la superficie ∆S3 (o S̄, en el cuadrante
IVb de la Figura 5.10). Ası́

~ dV =D
˜ ·D
∇ ~ 2 · ∆S
~2 − D
~ 1 · ∆S
~1 ⇒ ρ (~r) (∆S2 ∆l) = D ~2 −D~ 1 · n̂S ∆S2
2
con lo cual
ρ (~r) ∆l ≡ σ = D~2 −D
~ 1 · n̂S
2
Teoremas de Green
Cuando consideramos campos vectoriales muy particulares el Teorema de Gauss nos lleva a un par de
identidades vectoriales conocidas como las Identidades o Teoremas de Green
Supongamos que tenemos dos campos escalares: ζ (x, y, z) y ξ (x, y, z) entonces y con ellos construimos
un campo vectorial
ZZ ZZZ
˜ (x, y, z) ⇒
~a (x, y, z) = ζ (x, y, z) ∇ξ ~=
~a · d S ˜ · ~a d V
∇ ⇒
s V
ZZ ZZZ
⇒ ζ (x, y, z) ∇ξ ~=
˜ (x, y, z) · d S ˜ · ζ (x, y, z) ∇ξ
∇ ˜ (x, y, z) d V
s V
con lo cual arribamos a primera identidad de Green, Primer Teorema de Green o, Teorema escalar de Green:
ZZ ZZZ h i
ζ (x, y, z) ∇ξ ~=
˜ (x, y, z) · d S ζ (x, y, z) ∇˜ · ∇ξ
˜ (x, y, z) + ∇ζ
˜ (x, y, z) · ∇ξ
˜ (x, y, z) d V
s V
Si ahora, consideramos los siguientes campos vectoriales

˜ · ζ (x, y, z) ∇ξ
∇ ˜ (x, y, z) = ∇ζ
˜ (x, y, z) · ∇ξ
˜ (x, y, z) + ζ (x, y, z) ∇
˜ · ∇ξ
˜ (x, y, z)
y

˜ · ξ (x, y, z) ∇ζ
∇ ˜ (x, y, z) = ∇ξ
˜ (x, y, z) · ∇ζ
˜ (x, y, z) + ξ (x, y, z) ∇
˜ · ∇ζ
˜ (x, y, z)
restando ambas expresiones tendremos que

n o
˜ · ζ (x, y, z) ∇ξ
∇ ˜ (x, y, z) − ξ (x, y, z) ∇ζ
˜ (x, y, z) =
˜ · ∇ξ
ζ (x, y, z) ∇ ˜ (x, y, z) − ξ (x, y, z) ∇
˜ · ∇ζ
˜ (x, y, z)
y al integrar sobre un volumen V tendremos la formulación del Teorema de simétrico de Green, la segunda
identidad (o teorema) de Green o el Teorema
ZZZ n o
˜ · ∇ξ
ζ (x, y, z) ∇ ˜ (x, y, z) − ξ (x, y, z) ∇
˜ · ∇ζ
˜ (x, y, z) d V =
V
ZZ n o
˜ (x, y, z) − ξ (x, y, z) ∇ζ
ζ (x, y, z) ∇ξ ~
˜ (x, y, z) · d S
s
La utilidad de estas relaciones las veremos en el desarrollo de la Teorı́a de Potencial en la sección 5.8.1
en la página 185

Figura 5.12: Teorema de Stokes
5.7.2. Teorema de Stokes

Presentación y demostración
El teorema de Stokes relaciona una integral de lı́nea escalar de un campo vectorial, ~a = ~a (x, y, z) , a
lo largo de una curva cerrada, C, con una integral del rotor del campo sobre la superficie encerrada por la
curva, C. Es decir I ZZ ZZ

~a · d ~r = ~ × ~a · d S
∇ ~≡ ~ × ~a · n̂S dS
∇
S S
Tal y como hemos mencionado antes la superficie la define su vector normal, y éste lo define el “sentido” de
circulación de la curva que bordea la superficie (ver Figura 5.12 cuadrantes I y III).
No haremos una demostración formal del Teorema de Stokes como lo hicimos para el Gauss. Nos con-
venceremos de que es correcta la relación a partir de algunas situaciones sencillas. Cualquier superficie la
podremos dividir en pequeñas cuadrı́culas diferenciales, las cuales sumadas constituyen la superficie (ver
Figura 5.12 cuadrante II). Es fácil convencerse que la circulación3 por le borde de una cuadrı́cula diferencial
(por ejemplo en el plano x, y) nos lleva a
I Z Z Z Z
Γ1234 = ~a · d ~r = ax (x, y) d x + ay (x, y) d y + ax (x, y) (−d x) + ay (x, y) (−d y)
1234 1 2 3 4
donde hemos denotado la trayectoria a lo largo del perı́metro de la cuadrı́cula por 1234 De la Figura 5.13
podemos intuir
Z Z Z Z
Γ1234 = ax (x0 , y0 ) d x + ay (x0 + d x, y0 ) d y + ax (x0 , y0 + d y) (−d x) + ay (x0 , y0 ) (−d y)
3 Pueden consultar otro ejemplo de circulación en la sección 5.5.3

Figura 5.13: Circulación en una cuadrı́cula del plano x, y
y de allı́ el desarrollo por Taylor que nos conduce a

Z Z " # Z " #
∂ay ∂ax
Γ1234 = ax (x0 , y0 ) d x + ay (x0 , y0 ) + dx dy− ax (x0 , y0 ) + dy dx
∂x x=x0 ∂y y=y0
Z
+ ay (x0 , y0 ) d y
Z ! ZZ ZZ
∂ay ∂ax
Γ1234 = − d xd y = ~ × ~a d Sz ≡
∇ ~ × ~a · d S
∇ ~

∂x x=x0
∂y y=y0 z
S S
pero esto vale para todos los puntos (x0 , y0 ) y se puede aplicar para las otras superficies con lo cual es fácil
convercerse que esta técnica se puede utilizar para cada cuadrı́cula en las cuales hemos dividido la superficie
(ver Figura 5.12 cuadrante II). Más aún las circulaciones a lo largo de los perı́metros de las cuadrı́culas
interiores se anulan (ver Figura 5.12 cuadrante III) y sólo sobrevive la circulación a lo largo del perı́metro
exterior de la superficie. Con ello
X X I ZZ
~a · d ~r ≡ ~
∇ × ~a · d S~ ⇒ ~a · d ~r = ~ × ~a · d S
∇ ~
cuadricula S
Expresiones equivalentes para el Teorema de Stokes

Del mismo modo que hicimos en la sección 5.7.1 con el Teorema de Gauss, podemos hacerlo para el
Teorema de Stokes y tendremos
I ZZ I ZZ
φ (x, y, z) d ~r = ~ × ∇φ
dS ~ (x, y, z) y ~ (x, y, z) =
d ~r × B ~ ×∇
dS ~ ×B~ (x, y, z)
S S
donde φ (x, y, z) es un campo escalar y B ~ (x, y, z) un campo vectorial. Otra vez, la metodologı́a para proceder a
la demostración se fundamenta en considerar un par de campos vectoriales de la forma ~a (x, y, z) = φ (x, y, z) ~c
y ~b (x, y, z) = ~c × B
~ (x, y, z) y desarrollar un álgebra vectorial mı́nima.

Teorema de Stokes y Fuerzas Conservativas

El teorema de Stokes nos permite identificas que campos vectoriales irrotacionales generan integrales de
lı́nea las cuales son independientes de la trayectoria. Esto es
ZZ I
∇~ × F~ (x, y, z) = 0 ⇒ ~ × ~a · d S
∇ ~ = ~a · d ~r = 0
S
con lo cual, lo que se está implicando es que toda trayectoria cerrada de puede fraccionar en dos trayectorias
abiertas que se unen en los extremos, entonces
I Z Z Z P2 Z P2
~a · d ~r = 0 = ~a · d ~r + ~a · d ~r ⇒ ~a · d ~r ≡ ~a · d ~r
C1 C2 P1 P1
curva C1 curva C2
y lo que nos dice es que vamos de un punto (de corte de la curva cerrada) P1 a otro punto P2 por dos
trayectorias distintas y la integral de lı́nea es la misma. Más adelante veremos que a los campos vectoriales
irrotacionales les está asociado un potencial tal que
~ × F~ (x, y, z) = 0 ⇒ F~ (x, y, z) ∝ ∇φ
∇ ~ (x, y, z)
Teorema de Stokes y discontinuidades del campo vectorial

Al igual que el Teorema de Gauss puede ser considerado para manejar funciones discontinuas, el Teorema
de Stokes también tiene una expresión cuando se consideran campos discontinuos (continuo a trozos o
continuos por segmentos)
Al igual que en el caso de Teorema de Gauss, consideremos el caso más simple el de un campo vectorial
~a (x, y, z) que es discontinuo sobre una superficie, S̄ ,que divide R en dos subregiones R1 y R2 (ver otra vez
5.10, cuadrante IVb). En este caso la superficie S, será abierta y estará delimitada por una curva C2 . La
intersección de las superficies S y S̄ será una curva C̄,la cual dividirá a S en dos superficies S1 y S2 (ver
Figura 5.12 cuadrante IV). Entonces, aplicando el Teorema de Stokes a la curva cerrada. Entonces
I Z P2 Z P1 ZZ
~a · d ~r = ~a · d ~r + ~a · d ~r = ~ × ~a · d S
∇ ~
P1 P2 S1
C1 +C̄ curva C1 curva C̄
y
I Z P1 Z P2 ZZ
~a · d ~r = ~a · d ~r + ~a · d ~r = ~ × ~a · d S
∇ ~
P2 P1 S2
C2 +C̄ curva C2 curva C̄
Ahora bien si las sumamos obtendremos
ZZ ZZ I Z P1 Z P2
~ × ~a · d S
∇ ~+ ~ × ~a · d S
∇ ~= ~a · d ~r + ~a · d ~r + ~a · d ~r
S1 S2 C P2 P1
curva C̄ en S1 curva C̄ en S2
la cual puede ser reescrita como

I ZZ Z P2
~a · d ~r = ~ ~
∇ × ~a · d S − ~a|S2 − ~a|S1 · d ~r
C S P1
curva C̄
donde hemos denotado ~a|S2 como el campo vectorial evaluado sobre la curva C̄ “del lado” de las superficie
S2 . Es importante señalar que el término que incorpora la contribución de la discontinuidad del campo
sólo encierra componentes tangenciales a la superficie. Esto es claro del producto escalar con el vector, d ~r,
tangente a la curva C̄ (y también a la superficie S).

5.8. Teorı́a de Potencial

5.8.1. Potenciales escalares
Si un campo vectorial F~ (x, y, z) en una determinada región R puede asociarse con un gradiente de un
potencial tendremos que
I
~ ~ ~ ~
F (x, y, z) = −∇φ (x, y, z) ⇔ ∇ × F (x, y, z) = 0 ⇔ F~ (x, y, z) · d ~r = 0
La ventaja que un campo derive de un potencial es, por un la lado la simplicidad y la cantidad de información
que sobre el campo teneos: describimos la interacción por una función y no con tres (las componentes del
campo) y sabremos que el campo es irrotacional y conservativo. Pero además la función que describe el
campo es escalar, con lo cual es independiente del sistema de coordenadas.
Cualquiera de las afirmaciones implica las otras dos, con o cual podremos elegir cualquier de ellas para
demostrar las otras dos. Veamos:
un campo que derive de un potencial es conservativo e irrotacional


 −∇ ~ × ∇φ ~ (x, y, z) = 0
F~ = −∇φ
~ (x, y, z) ⇒

 H ~ H
− ∇φ (x, y, z) · d ~r = − dφ = φ (x0 , y0 , z0 ) − φ (x0 , y0 , z0 ) = 0
donde hemos utilizado la definición de diferencial total
∂φ (x, y, z) ∂φ (x, y, z) ∂φ (x, y, z) ~ (x, y, z) · d ~r
dφ = dx + dy + dz = ∇φ
∂x ∂y ∂z
un campo conservativo es irrotacional y deriva de un potencial.
RP
Un campo conservativo implica que el trabajo ( P12 F~ (x, y, z) · d ~r) es independiente de la trayectoria
entre P1 y P2 . Por eso llamamos a la fuerza conservativa por cuanto se conserva la energı́a y por lo
tanto, ésta depende únicamente de la posición
I Z P2
F~ (x, y, z) · d ~r = 0 ⇒ F~ (x, y, z) · d ~r = φ (x2 , y2 , z2 ) − φ (x1 , y1 , z1 )
P1
⇓
F~ (x, y, z) · d ~r = dφ = −∇φ
~ (x, y, z) · d ~r ⇒ F~ (x, y, z) = −∇φ
~ (x, y, z)
con lo cual hemos demostrado que el campo vectorial deriva de un potencial. El signo menos (−) es una
convención tradicional del oficio de Fı́sico y proviene de nuestra intuición de flujo de los acontecimientos:
“El agua siempre fluye hacia abajo”.
Ahora bien, utilizando el Teorema de Stokes tendremos:
I ZZ
~ (x, y, z) ⇒ F~ · d ~r =
F~ (x, y, z) = −∇φ ~ × F~ · d S
∇ ~=0 ⇒∇ ~ × F~ (x, y, z) = 0
S2
es fácil demostrar que el campo también es irrotacional.

un campo de fuerzas irrotacional implica que el campo deriva de un potencial y que el campo es
conservativo.
Otra vez, por el Teorema de Stokes si es irrotacional es conservativo,
ZZ I
∇~ × F~ (x, y, z) = 0 ⇒ ~ × F~ · d S
∇ ~ = F~ · d ~r = 0
S2

y si es conservativo deriva de un potencial
F~ (x, y, z) · d ~r = dφ = −∇φ
~ (x, y, z) · d ~r ⇒ F~ (x, y, z) = −∇φ
~ (x, y, z)
En definitiva, si cualquiera de las condiciones se cumple: conservativo, irrotacional o potencial, las otras
también se cumplirán.
5.8.2. Potenciales vectoriales y calibres

Al igual que derivamos un campo vectorial F~ a partir de un potencial escalar φ (x, y, z) y asociamos
su existencia a su condición de irrotacionalidad, ∇~ × F~ (x, y, z) = 0, podemos pensar que un campo sin
divergencia (solenoidal o transverso) conlleva a la existencia de un potencial vectorial. Esto es
~ · F~ (x, y, z) = 0
∇ ⇒ F~ (x, y, z) = ∇
~ ×A
~ (x, y, z)
Claramente
~ · F~ (x, y, z) = ∂i F i = ∂i εijk ∂j Ak = 0
∇
El campo vectorial A~=A ~ (x, y, z) se conoce con el nombre de potencial vectorial del campo F~ . Ahora bien,
~
el campo solenoidal, F , no queda unı́vocamente determinado a partir de su potencial vectorial. Existe una
arbitrariedad de un campo escalar, llamado de calibre, χ = χ (x, y, z) (gauge en inglés) de forma tal que

A~′ = A
~ + ∇χ
~ (x, y, z) ⇒ F~ = ∇ ~ ×A ~′ = ∇~ × A~ + ∇χ
~ =∇ ~ ×A ~+∇ ~ × ∇χ~ =∇ ~ ×A ~
de forma que varios potenciales vectoriales A ~′ y A~ generan el mismo campo vectorial F~ . Esta arbitrariedad
nos permite particularizar el calibre según nos convenga. Existen varios calibres en el mercado, los cuales
son utilizados según el problema fı́sico al cual tratemos. Entre ellos podemos mencionar un par de ellos:
El calibre de Lorentz :
Esta selección proviene de requerir que el campo de calibre satisfaga la ecuación una ecuación de onda
2
~ 2 χ (x, y, z, t) − a ∂ χ (x, y, z, t) = 0
∇
∂t2
donde a es una constante. Nótese que hemos supuesto que el campo de calibre puede depender del
tiempo. El calibre del Lorentz se escoje porque (entre otras cosas) permite que la solución a la ecuación
de onda para el potencial vectorial
2~
~ (x, y, z, t) − a ∂ A (x, y, z, t) = 0
~ 2A
∇
∂t2
quede unı́vocamente determinada
El calibre de Coulomb, de radiación o transverso:
La selección de este calibre impone que el potencial vectorial A ~ (x, y, z, t) satisfaga la ecuación

~ ·A
∇ ~=0 ⇒∇ ~ ·A~ ′ (x, y, z, t) = ∇
~ · A~ (x, y, z, t) + ∇χ
~ (x, y, z, t) = 0 ⇒ ∇ ~ 2 χ (x, y, z, t) = 0
El nombre de calibre de Coulomb, de radiación o transverso proviene de las consecuencias de su

utilización en las ecuaciones de Maxwell.
~=A
Nótese que si el campo (y el calibre) es independiente del tiempo A ~ (x, y, z) ambos calibres coinciden.

5.8.3. Teorema de Green y Potenciales

Si el rotor y la divergencia de un campo vectorial, F~ , decente (continuo y continuamente diferenciable)
están especificados en una región del espacio delimitada por una superficie cerrada, S, y las componentes del
campo normales a esa superficie, n̂S · F~ , también se conocen, entonces el Teorema de Green nos garantiza
que ese campo, F~ , que cumple con esas condiciones es único.
Esa demostración procede ası́. Supongamos que existe otro campo vectorial que cumple con las mismas
condiciones que el campo F~ . Esto es
 
~ · F~ = ∇
∇ ~ ·G ~  ~ ~

  ∇·H =0



 

~ × F~ = ∇
∇ ~ ×G ~ ⇒H ~ = F~ − G~ ⇒ ∇~ ×H ~ =0

 


 

~ 
n̂S · F~ = n̂S · G
 ~ =0
n̂S · H
~ es irrotacional entonces
como H
~ ×H
∇ ~ =0 ~ = ∇φ
⇒H ~ (x, y, z) ~ ·H
⇒∇ ~ =∇
~ · ∇φ
~ (x, y, z) = 0
, y el Teorema de Green nos garantiza que

I ZZ ZZZ h i
~ ~
φ∇φ · d S = ~
φ ∇φ · n̂S̄ dS̄ = φ ∇˜ · ∇φ
˜ ˜ · ∇φ
+ ∇φ ˜ dV
S̄ V
con lo cual ZZ ZZ ZZZ h i

~ · n̂S̄ dS̄ =
φ ∇φ φ H~ · n̂S̄ dS̄ = ~ ·H
H ~ dV ~ =0
⇒H
S̄ S̄ V
de donde se deduce que F~ = G

~ es decir, que el campo, F~ , es único.
5.8.4. Teorema de Helmholtz

El teorema de Helmholtz afirma que todo campo vectorial, F~ , continuo, y continuamente diferenciable
(al menos a trozos) y, regular en infinito se puede expresar como una suma de dos “componentes”, una
longitudinal o irrotacional, F~l , y otra transversa o solenoidal, F~t . Esto es

 ∇~ × F~l = 0
~ ~ ~
F = Fl + Ft con
 ~ ~
∇ · Ft = 0
En general dado que el campo, F~ , puede ser discontinuo, tendremos que suponer que

  ~ · F~l + F~t = ∇
~ · F~ = ∇ ~ · F~l = ρ (~r)
~ ~
∇ · F = ρ (~r)  
 ∇
y como F~ = F~l + F~t ⇒
~ ~ ~  

∇ × F = J (~r)  ∇ ~ × F~ = ∇~ × F~l + F~t = ∇~ × F~t = J~ (~r)
dado que ∇~ · (◦) y ∇

~ × (◦) son lineales. Esta separación del campo vectorial F~ = F~l + F~t es completamente
general y siempre puede hacerse para cualquier campo vectorial.

~ 2 φ (x, y, z) = −ρ (x, y, z) existe y es

Supondremos además, que la solución a la ecuación de Poisson ∇
4
única .
Tendremos que
~ × F~l = 0
∇ ⇒ F~l = −∇φ
~ (x, y, z) ~ · F~ = ∇
⇒∇ ~ · F~l = −∇
~ 2 φ (x, y, z) = ρ (~r)
y la solución existe y es única. Es decir, podemos expresar de manera unı́voca al campo vectorial, F~ , (a través
de su “componente” longitudinal F~l ) en términos de un campo escalar (a función potencial) φ (x, y, z) . Por
otra parte

~ · F~t = 0 ⇒ F~t = ∇
∇ ~ ×A ~ ⇒∇ ~ × F~ = ∇
~ × F~t = ∇
~ × ∇~ ×A ~ =∇ ~ ∇ ~ ·A
~ −∇ ~ 2A
~ = J~ (~r)
~ ·A
La cual al seleccionar el calibre de Coulomb ∇ ~ = 0 se convierte en Es importante señalar que el campo,
~=A
A ~ (x, y, z) , solución a la ecuación
 2
 ~ Ax = −Jx (~r)
∇




~ × ∇
∇ ~ ×A
~ =∇~ 2A
~ = ∂ i ∂i A
~ = −J~ (~r) ⇒ ∂ i ∂i Ak = −J k (~r) ⇔ ~ 2 Ay = −Jy (~r)
∇




 ~2
∇ Az = −Jz (~r)
Una vez más nos topamos con la solución a la ecuación de Poisson, esta vez para cada componente. Esto se
cumple siempre, porque hemos supuesto que la solución para la ecuación de Poisson existe y es única.
Un corolario del Teorema de Helmholtz que un campo vectorial queda unı́vocamente determinado si
conocemos su rotor y su divergencia.
4 Esta suposición es indispensable pero es muy fuerte. Las condiciones sobre el potencial φ (x, y, z) que la implican serán
consideradas en otros cursos de Métodos Matemáticos. En este curso, supondremos que existe y es única

Bibliografı́a
York)
[6] Knisley, J. (2001) http://math.etsu.edu/MultiCalc/
Londres)
189
Capı́tulo 6
Matrices, Determinantes y
Autovectores
190
6.1. Operadores Lineales

Definiremos como operador lineal (o transformaciones lineales) a una operación que asocia un vector
|vi ∈ V1 un vector |v′ i ∈ V2 y que respeta la linealidad, es decir esta función de V1 →V2 cumple con
|v′ i = A |vi ∋ A [α |v1 i + β |v2 i] = α A |v1 i + β A |v2 i ∀ |vi , |v1 i y |v2 i ∈ V1
Sencillamente algo que actúe sobre una suma de vectores y que sea equivalente a la suma de sus actuaciones
sobre los vectores suma.
Ejemplos
Las siguientes transformaciones
|x′ i = T |xi → (x′ , y ′ , z ′ ) = T {(x, y, z)}
claramente son lineales
• T {(x, y, z)} = (x, 2y, 3z) →
T {a (x, y, z) + b (m, n, l)} = aT {(x, y, z)} + bT {(m, n, l)}

T {(ax + bm, ay + bn, az + bl)} = a (x, 2y, 3z) + b (m, 2n, 3l)
(ax + bm, 2 [ay + bn] , 3 [az + bl]) = (ax + bm, 2 [ay + bn] , 3 [az + bl])
• T {(x, y, z)} = (z, y, x) →
T {a (x, y, z) + b (m, n, l)} = aT {(x, y, z)} + bT {(m, n, l)}

T {(ax + bm, ay + bn, az + bl)} = a (z, y, x) + b (l, n, m)
(az + bl, ay + bn, ax + bm) = (az + bl, ay + bn, ax + bm)
Cosas tan sencillas como multiplicación por un escalar es una transformación (u operador) lineal
T : V →V tal que
T |vi = |v′ i = α |vi
Claramente,
T [a |vi + b |wi] = aT |vi + bT |wi = aα |vi + bα |wi
Obviamente, si α = 1 tenemos la transformación identidad que transforma todo vector en sı́ mismo; si
α = 0 tendremos la transformación cero, vale decir que lleva a todo |vi ∈ V a al elemento cero |0i
La definición de producto interno también puede ser vista como una transformación (operador) lineal
T:V→R
T |vi = α ⇋ ha |vi ≡ α
Otra vez:
T [a |vi + b |wi] = ha| [a |vi + b |wi] = a ha |vi + b ha |wi
por lo tanto es lineal. Esto implica que también la proyección de un determinado |vi ∈ V sobre un
subespacio S es un operador lineal, y lo denotaremos como
[|si hs|] |vi = hs |vi |si = |vs i con |si y |vs i ∈ S

esta idea se extiende fácil si para un proyector T : Vm → Sn con m > n de tal modo que para un vector
|vi ∈ Vm

Pm |vi ≡ |ui i ui m |vi = ui |vim |ui i = |vm i

con {hui |} base de Sn .Es claro que estamos utilizando la convención de Einstein para la suma de
ı́nidices
Las ecuaciones lineales también pueden verse como transformaciones lineales. Esto es, considere una
transformación lineal T : Vn → Vm Por lo tanto asociaremos

|yi = T |xi → y 1 , y 2 , y 3 , · · · , y m = T x1 , x2 , x3 , · · · , xn
a través de n × m números, aij , organizados de la siguiente forma

i = 1, 2, · · · , m
y i = aij xj con
j = 1, 2, · · · , n
una vez más,

T [α |vi + β |wi] = T α v 1 , v 2 , v 3 , · · · , v n + β w1 , w2 , w3 , · · · , wn = αaij v j + βaij wj

= T αv 1 + βw1 , αv 2 + βw2 , αv 3 + βw3 , · · · , αv n + βwn
j
= aij (αv + βw) = αaij v j + βaij wj = aij αv j + βwj
Como siempre estamos utilzando la convención de suma de Einstein
La derivada es un operador lineal. Ası́ podemos representar el operador lineal diferenciación como
d dy (x)
|v′ i = T |vi → |y′ i = D |yi → D [y (x)] ≡ [y (x)] ≡ ≡ y ′ (x)
dx dx
es claro que
D [αf (x) + βg (x)] = αDf (x) + βDg (x) ≡ αf ′ (x) + βg ′ (x)
igualmente podemos asociar un operador diferencial de cualquier orden a una derivada del mismo
orden, esto es
d2 d2 y (x)
|y′′ i = D2 |yi → D2 [y (x)] ≡ [y (x)] ≡ ≡ y ′′ (x)
dx2 dx2
d3 d3 y (x)
|y′′′ i = D3 |yi → D3 [y (x)] ≡ 3
[y (x)] ≡ ≡ y ′′′ (x)
dx dx3
..
.
E dn dn y (x)
(n)
y = Dn |yi → Dn [y (x)] ≡ [y (x)] ≡ ≡ y (n) (x)
dxn dxn
Igualmente, cualquier ecuación diferencial lineal es un ejemplo de operador lineal, recordamos el ejemplo
del tema de transformadas integrales. Esto es

y ′′ − 3 y ′ + 2 y = D2 − 3D + 2 y (x)
es claro que si y (x) = αf (x) + g (x) la linealidad es evidente
′′ ′
(αf (x) + g (x)) − 3 (αf (x) + g (x)) + 2 (αf (x) + g (x)) = α (f ′′ − 3 f ′ + 2 f ) + g ′′ − 3 g ′ + 2 g
↑↓

D − 3D + 2 (αf (x) + g (x)) = D − 3D + 2 αf (x) + D2 − 3D + 2 g (x)
2 2

La integral también es un operador lineal

Z x
g (x) = f (t)dt ⇆ T {f (t)}
a
Otro ejemplo tı́pico son los operadores de transformaciones integrales

Z b
F (s) = K (s, t) f (t)dt ⇆ T {f (t)}
a
donde K (s, t) es una función conocida de s y t, denominada el núcleo de la transformación. Si a y b

son finitos la transformación se dirá finita, de lo contrario infinita.
∞
Ası́ si f (t) = αf1 (t) + f2 (t) con f1 (t) y f2 (t) ∈ C[a,b] es obvio que
Z b
F (s) = K (s, t) [αf1 (t) + f2 (t)] dt ⇆ T {[αf1 (t) + f2 (t)]}
a
Z b Z b
F (s) = α K (s, t) f1 (t)dt + K (s, t) f2 (t)dt
a a
⇓
F (s) = αF (s1 ) + F (s2 ) ⇆ T {[αf1 (t) + f2 (t)]} = αT {f1 (t)} + T {f2 (t)}
Dependiendo de la selección del núcleo y los limites tendremos distintas transformaciones integrales.
En Fı́sica las más comunes son:
Nombre F (s) = T {f (t)} f (t) = T−1 {F (s)}
R∞ 1
R γ+i∞
Laplace F (s) = 0
e−st f (t)dt f (t) = 2πi γ−i∞
est F (s)ds
Z ∞ Z ∞
sen(st) 2 sen(ts)
Fourier de senos y cosenos F (s) = f (t)dt f (t) = π F (s)ds
0 cos(st) 0 cos(ts)
Z ∞ Z ∞
2
Fourier compleja F (s) = ei st
f (t)dt f (t) = π e−i st
F (s)ds
−∞ −∞
Z ∞ Z ∞
Hankel F (s) = tJn (st)f (t)dt f (t) = sJn (ts)F (s)ds
0 0
Z ∞
1
R γ+i∞
Mellin F (s) = ts−1 f (t)dt f (t) = 2πi γ−i∞
s−t F (s)ds
0
6.1.1. Espacio Vectorial de Operadores Lineales

Un conjunto de operadores lineales {A, B, C · · · } : V1 →V2 puede constituir un espacio vectorial lineal
si se dispone entre ellos de la operación suma y la multiplicación por un escalar. Ası́, claramente, dado
{A, B, C · · · } ,y definida

 A [α |v1 i + β |v2 i] = α A |v1 i + β A |v2 i
(χA + B) |vi ≡ χA |vi + B |vi ∋

B [α |v1 i + β |v2 i] = α B |v1 i + β B |v2 i

es directo comprobar que
(χA + B) [α |v1 i + β |v2 i] = χA [α |v1 i + β |v2 i] + B [α |v1 i + β |v2 i]

= χ (α A |v1 i + β A |v2 i) +α B |v1 i + β B |v2 i
= χ (α A |v1 i +α B |v1 i) + β A |v2 i + β B |v2 i
⇓
(χA + B) [α |v1 i + β |v2 i] = χA [α |v1 i + β |v2 i] + B [α |v1 i + β |v2 i]
Igualmente, se cumple que

[(A + B) + C] = [A+ (B + C)]
con A + B + C lineales en V
[(A + B) + C] |vi = (A + B) |vi + C |vi ∀ |vi ∈ V1

= A |vi + B |vi + C |vi
= A |vi + (B + C) |vi
= [A+ (B + C)] |vi
del mismo modo se puede comprobar fácilmente
A+B=B+A
Ahora bien, si definimos la transformación cero de V1 →V2 tal que
|0i = 0 |vi ∀ |vi ∈ V1
se le asigna a el vector |0i ∈ V2 ∀ |vi ∈ V1 , entonces el operador lineal 0 será el elemento neutro respecto
a la suma de operadores. Finalmente, el elemento simétrico queda definido por
(−A) |vi = −A |vi =⇒ (A − A) |vi = 0 |vi = |0i
Con ello queda demostrado que los operadores lineales forman un espacio vectorial el cual de ahora en
adelante denominaremos L (V1 , V2 ) .
6.1.2. Composición de Operadores Lineales

El producto o composición de dos operadores lineales, A y B se denotará AB y significará que primero
se aplica B y al resultado se aplica A. Esto es
AB |vi = A (B |vi) = A |ṽi = |ṽ′ i
La composición de funciones cumple con las siguientes propiedades
(AB) C = A (BC) ; α (AB) = (αA) B = A (αB) ;

(A1 +A2 ) B = A1 B + A2 B; A (B1 +B2 ) = AB1 +AB2
Es decir, que la composición de operadores es asociativa y distributiva a la suma y que conmuta respecto a
la multiplicación por escalares.
Por otro lado si 1 es el operador Identidad
1 |vi = |vi =⇒ A1 = 1A = A;

En general AB 6= BA,por lo tanto podemos construir el conmutador de estos operadores como
[A, B] = AB − BA ∋ [AB − BA] |vi = AB |vi − BA |vi
Es inmediato comprobar algunas de las propiedades más útiles de los conmutadores:
[A, B] = − [B, A]
[A, (B + C)] = [A, B] + [A, C]
[A, BC] = [A, B] C + B [A, C]
0 = [A, [B, C]] + [B, [C, A]] + [C, [A, B]]
Dados dos vectores |v1 i y |v2 i definiremos como el elemento de matriz del operador A al producto interno
de dos vectores
hv2 | (A |v1 i) ≡ A(|v1 i,|v2 i)
es claro que A(|v1 i,|v2 i) será en general un número complejo, pero esto lo veremos detalladamente en la
sección 6.2, más adelante.
Ejemplos
Potencias de Operadores: Uno de los ejemplos más útiles en la composición de operadores lo
constituyen las potencias de los operadores, las cuales provienen de la aplicación consecutiva de un
mismo operador,
A0 = 1; A1 = A; A2 = AA; A3 = A2 A = AAA; ···
Es claro que las potencias de operadores cumplen las propiedades estándares de las potencias de
números
m
An+m = An Am ; (An ) = Anm
Llamaremos operadores nilpotentes de grado n a los operadores An 6= 0, del tipo
An |vi = |0i ∀ |vi ∈ V1 al vector nulo, |0i ∈ V2 . Es decir un operador que lleva cualquier vector |vi
al elemento neutro de V2 . El ejemplo más emblemático es el operador diferencial
dn dn i
Dn Pn−1 = |0i ⇆ n
Pn−1 (x) = ai x = 0
dx dxn

con Pn−1 perteneciente al espacio de polinomios de grado n − 1
Operador Ecuaciones Diferenciales. Si consideramos el espacio de funciones
∞
f (x) ∈ C[a,b] podemos construir un operador diferencial

d d2 dn
a0 1 + a1 D + a2 D2 + · · · + an Dn |f i ⇆ a0 + a1 + a2 2 + · · · + an n f (x)
dx dx dx
con {a0 , a1 , a2 , · · · an } coeficientes constantes. De este modo

2
d d
D2 − 3D + 2 y = (D − 1) (D − 2) y =⇒ − 3 + 2 y (x) = y ′′ − 3 y ′ + 2 y
dx2 dx
con r = 1 y r = 2 las raı́ces del polinomio caracterı́stico

Funciones de Operadores: Basándonos en el primero de los ejemplos se puede construir un “poli-

nomio” en potencias de los operadores:
Pn (x) = a0 + a1 x + a2 x2 + · · · + an xn = ai xi =⇒

Pn (A) |vi = a0 1 + a1 A + a22 A + · · · + ann An |vi = ai Ai |vi ∀ |vi ∈ V1
Más aún, lo anterior nos permite extender la idea operadores a funciones de operadores, es decir si nos
saltamos todos los detalles de convergencia de la serie anterior, los cuales dependerán de los autovalores
de A y de su radio de convergencia, de esta manera, al igual que podemos expresar cualquier función
F (z) como una serie de potencias de z en un cierto dominio, podremos expresar la función de un
operador, F (A) , como una serie de potencias del operador A esto es

F (z) = ai xi ⇆ F (A) |vi = ai Ai |vi
Ası́, por ejemplo, podemos expresar

"∞ #
X An A An
A
e |vi = |vi = 1 + A + + ··· + · · · |vi
n=0
n! 2! n!
En este caso hay que hacer una acotación, dado que, en general, [A, B] 6= 0 =⇒ eA eB 6= eB eA 6= eA+B
esta afirmación se corrobora de manera inmediata al desarrollar las exponenciales
"∞ #" ∞ # "∞ ∞ #
X An X Bm X X A n Bm
A B
e e |vi = |vi = |vi
n=0
n! m=0
m! n=0 m=0
n! m!
"∞
#" ∞
# "∞ ∞ #
X Bn X Am X X Bn A m
eB eA |vi = |vi = |vi
n=0
n! m=0
m! n=0 m=0
n! m!
" ∞
#
X (A + B)
n
A+B
e |vi = |vi
n=0
n!
sólo en el caso que [A, B] = 0 =⇒ eA eB = eB eA = eA+B , la demostración es inmediata pero requiere

expandir y rearreglar las sumatorias arriba expuestas. En general más adelante demostraremos la
relación de Glauber
1
eA eB = eA+B e 2 [A,B]
6.1.3. Proyectores
La notación de Dirac se hace particularmente conveniente para representar proyectores. Hasta ahora,
hemos relacionado un funcional lineal, un bra hw| del espacio dual V∗ , con un vector ket |vi del espacio
vectorial V a través de su producto interno hw| vi ∈ C el cual es, en general, un número complejo. Si ahora
escribimos esta relación entre vectores y formas diferenciales de una manera diferente. Ası́, la relación entre
hw|, y |vi un ket |Ψi o un bra hΦ| arbitrarios serán

 |vi hw| Ψi
|vi hw| =⇒

hΦ |vi hw|

La primera será la multiplicación del vector |vi por el número complejo hw| Ψi ,mientras que la segunda
relación será la multiplicación de la forma hw| por el complejo hΦ |vi . Es imperioso señalar que el orden en
la escritura de los vectores y formas es crı́tico, sólo los números complejos λ se pueden mover con impunidad
a través de estas relaciones
λ |vi = |λvi = |vi λ, λ hw| = hλw| = hw| λ
hw| λ |vi = λ hw| vi = hw| vi λ y A |λvi = Aλ |vi = λA |vi
Por lo tanto, dado un vector |vi , podemos construir un proyector P|vi a lo largo del vector |vi
P|vi ≡ |vi hv| con hv| vi = 1
siempre y cuando este operador lineal cumpla
P|vi [α |z1 i + β |z2 i] = α P|vi |z1 i + β P|vi |z2 i =⇒
|vi hv| [α |z1 i + β |z2 i] = |vi hv| α |z1 i + |vi hv| β |z2 i = α |vi hv |z1 i + β |vi hv |z2 i
P2|vi = P|vi ⇐⇒ (|vi hv|) (|vi hv|) = |vi hv| =⇒

P|vi P|vi |zi = (|vi hv|) (|vi hv|) |zi = |vi hv |vi hv |zi = |vi hv |zi = P|vi |zi
| {z }
1
Ası́ el operador P|vi actuando sobre el vector |Ψi representará la proyección de |Ψi a lo largo de |vi
P|vi |Ψi = |vi hv| Ψi ≡ hv| Ψi |vi
Es inmediato construir un proyector de un vector sobre un subespacio Sq .
Sea {|e1 i , |e2 i , |e3 i , · · · , |eq i} un conjunto ortonormal de vectores que expande Sq . Por lo tanto definiremos
el proyector Pq al proyector sobre el subespacio Sq de la forma

Pq = |ei i ei q
es claro que P2q = Pq

P2q |vi = Pq Pq |vi =⇒ P2q |vi = |ei i ei q |ej i ej q |vi = |ei i ei |ej i ej |vi
| {z }
δji
P2q |vi = |ej i ej |vi ≡ Pq |vi ∀ |vi ∈ V
6.1.4. Espacio Nulo e Imagen

El conjunto de todos los |vi ∈ V1 ∋ A |vi = |0i , se denomina espacio nulo, núcleo o kernel (núcleo en
alemán) de la transformación A y lo denotaremos como ℵ (A), en sı́mbolos diremos que
ℵ (A) = {|vi | |vi ∈ V1 ∧ A |vi = |0i}
Adicionalmente, ℵ (A) ⊂ V1 será un subespacio de V1 . La prueba de esta afirmación es inmediata. Dados
|v1 i , |v2 i ∈ ℵ (A) ,con A un operador lineal, es claro que

A |v1 i = |0i 
=⇒ α1 A |v1 i + α2 A |v2 i = |0i = A (α1 |v1 i + α2 |v2 i)

A |v2 i = |0i

por la misma razón se tiene que el elemento neutro contenido en ℵ (A) ,esto es
A |α vi = |0i ∀ |vi ∈ V1 ∧ ∀α ∴ A |0i = |0i si α=0
por lo tanto, queda demostrado que ℵ (A) es un subespacio de V1 .

Definiremos imagen (rango o recorrido) de A,y la denotaremos como
ℑ (A) = {|v′ i | |v′ i ∈ V2 ∧ A |vi = |v′ i}
igualmente ℑ (A) ⊂ V2 también será un subespacio de V2 ya que si |vi = α1 |v1 i + α2 |v2 i y dado que A
es un operador lineal, se cumple que
 
 
A α1 |v1 i + α2 |v2 i = α1 A |v1 i + α2 A |v2 i = α1 |v1′ i + α2 |v2′ i
| {z } | {z } | {z } | {z }
|vi |v1′ i |v2′ i |v′ i
Es claro que si V de dimensión finita, A {V} = n también será de dimensión finita n y tendremos que
dim [ℵ (A)] + dim [ℑ (A)] = dim [V]
vale decir que la dimensión del núcleo más la dimensión del recorrido o imagen de una transformación lineal
es igual a la dimensión del dominio.
Para demostrar esta afirmación supongamos que dim [V] = n y que
{|e1 i , |e2 i , |e3 i · · · |ek i} ∈ V es una base de ℵ (A) , donde k = dim [ℵ (A)] ≤ n.
Como {|e1 i , |e2 i , |e3 i · · · |ek i} ∈ V estos elementos formán base y por lo tanto son linealmente indepen-
dientes, necesariamente ellos formarán parte de una base mayor de V.
Esto es {|e1 i , |e2 i , |e3 i , · · · , |ek i , |ek+1 i , · · · , |ek+r−1 i , |ek+r i} ∈ V será una base de V donde k + r = n
Es esquema de la demostración será:
primero probaremos que {A {|ek+1 i} , A {|ek+2 i} , · · · , A {|ek+r−1 i} , A {|ek+r i}} forman una base pa-
ra A {V}
luego demostraremos que dim [A {V}] = r y como hemos supuesto que k +r = n habremos demostrado
la afirmación anterior.
Si los r elementos {A {|ek+1 i} , A {|ek+2 i} , · · · , A {|ek+r−1 i} , A {|ek+r i}} expanden A {V} entonces
cualquier elemento
|wi ∈ A {V} ∋ |wi = A |vi = C i |Aei i con |Aei i = A |ei i
Ahora bien, analicemos con cuidado los lı́mites de la suma implı́cita del ı́ndice i = 1, 2, · · · , k + r
|wi = C i |Aei i = C 1 |Ae1 i + C 2 |Ae2 i + · · · + C k |Aek i + C k+1 |Aek+1 i + · · · + C k+r |Aek+r i

| {z }
=|0i ya que A|e1 i=A|e2 i=A|e3 i···=A|ek i=|0i
Por lo tanto {A {|ek+1 i} , A {|ek+2 i} , · · · , A {|ek+r−1 i} , A {|ek+r i}} expanden A {V} . Ahora bien, para
demostrar que son base, demostraremos que son linealmente independientes, para ello supondremos que
k+1 k+2
∃ C ,C , · · · , C k+r ∋ C i |Aei i = 0 con i = k + 1, k + 2, · · · , k + r

y ttenemos que demostrar que C k+1 = C k+2 = · · · = C k+r = 0. Entonces

C i |Aei i = C i A |ei i = A C i |ei i = 0 con i = k + 1, k + 2, · · · , k + r
por lo tanto el elemento |vi = C i |ei i ∈ ℵ (A) con i = k + 1, k + 2, · · · , k + r. Con lo cual dado que
∀ |vi ∈ ℵ (A) , |vi = C i |ei i con i = 1, 2, · · · , r, entonces se puede hacer la siguiente resta
k
X k+r
X
|vi − |vi = C i |ei i − C i |ei i
i=1 i=k+1
y como los {|e1 i , |e2 i , |e3 i , · · · , |ek i , |ek+1 i , · · · , |ek+r−1 i , |ek+r i} son una base de V entonces las C k+1 =
C k+2 = · · · = C k+r = 0
Ejemplos
Transformaciones Identidad: Sea 1 : V1 →V2 , la transformación identidad,
∀ |vi ∈ V1 ∋ 1 |vi = |vi . ⇒ ℵ (1) = |0i ⊂ V1 ∧ ℑ (1) ≡ V1
Sistemas de lineales de Ecuaciones. En Vn los sistemas de ecuaciones lineales representan el

espacio nulo,ℵ (A) , para vectores de Vn
    
A11 A12 · · · A1n x1 0
 A21 A22 ···     
   x2   0 
A |xi = |0i ⇆  . .   .  =  .  ⇆ Aij xi = 0
 .. ..   ..   .. 
An1 An2 Ann xn 0
son j ecuaciones con j = 1, 2,P· · · , n. Recordemos que estamos utilizando la convención de Einstein
n
para suma de ı́ndices. Esto es i=1 Aij xi = 0
2
Ecuaciones diferenciales ordinarias. Sea C[−∞,∞] el espacio vectorial de todas las funciones con-
2
tinuas doblemente diferenciables. Definimos A :C[−∞,∞] −→ C[−∞,∞] como la transformación lineal

D2 − 1 tal que para todas las y(x) ∈ C[−∞,∞]
2
se cumple

2
d2
A |xi = |0i ⇆ D − 1 y(x) = 0 ⇆ − 1 y (x) = y ′′ − y = 0
dx2
por lo tanto el núcleo o espacio nulo de A,ℵ (A) lo constituyen el conjunto de soluciones para la
mencionada ecuación diferencial. Por lo tanto el problema de encontrar las soluciones de la ecuación
diferencial es equivalente a encontrar los elementos del núcleo de A.
6.1.5. Operadores Biyectivos e Inversos

Se dice que A : V1 →V2 es biyectivo (uno a uno o biunı́voco) si dados |v1 i , |v2 i ∈ V1 , ∧ |v′ i ∈ V2 ,
se tiene que
A |v1 i = |v′ i ∧ A |v2 i = |v′ i =⇒ |v1 i = |v2 i
es decir será biyectiva si A transforma vectores distintos de V1 en vectores distintos de V2 . Más aún, se
puede afirmar que una transformación lineal A, será biyectiva si y sólo si ℵ (A) = |0i . Vale decir, si el

subespacio nulo está constituido, únicamente por el elemento neutro del espacio vectorial. La demostración
es sencilla. Supongamos que A es biyectiva y que A |vi = |0i ,entonces |vi = |0i ,es decir, A |0i = |0i , por
consiguiente ℵ (A) = |0i . Recı́procamente, si
  
ℵ (A) = |0i 
 
∧ =⇒ A |v1 i − A |v2 i = |0i = A |v1 i − |v2 i =⇒ |v1 i = |v2 i
 | {z }
A |v1 i = A |v2 i |v i−|v i=0
1 2
La importancia de las transformaciones lineales uno a uno o biyectiva reside en la posibilidad de definir
inversa, debido a que siempre existe en V2 un vector |v′ i asociado a través de A con un vector |vi ∈ V1 .
Diremos que A−1 : V2 →V1 es el inverso de A, si A−1 A = 1 = AA−1 .
Podemos afirmar que un operador lineal A tendrá inverso A−1 si a cada vector |v′ i ∈ V2
Habrı́a que hacer un par de comentarios al respecto. El primero es que, tal y como hemos enfatizado
arriba, en general, los operadores no conmutan entre si, y los inversos no son una excepción. Es decir, debieran
existir (y de hecho existen) inversas por la izquierda A−1 A e inversas por la derecha AA−1 . Por simplicidad
e importancia en Fı́sica obviaremos esta dicotomı́a y supondremos que A−1 A = 1 = AA−1 . El segundo
comentario tiene que ver con la existencia y unicidad del inverso de un operador lineal. Algunos operadores
tienen inverso, otros no, pero aquellos quienes tienen inverso, ese inverso es único. Veamos, supongamos que

A−1
1 A |vi = |vi 
∧ =⇒ A−1 −1
1 A |vi − A2 A |vi = |0i = A1 − A2
−1 −1
A |vi =⇒ A−11 = A2
−1
−1  | {z }
A2 A |vi = |vi −1 −1
A1 =A2
Ahora bien, un operador lineal A tendrá inverso sı́ y sólo sı́ para cada vector |v′ i ∈ V2 ∃! |vi ∈
V1 ∋ A |vi = |v′ i . Es decir cada vector |v′ i está asociado con uno y sólo un vector |vi a través de la
transformación lineal A. Dejaremos sin demostración esta afirmación pero lo importante es recalcar que
para que exista inverso la transformación lineal A,tiene que ser biyectiva y esto implica que se asocia uno y
solo un vector de V1 con otro de V2 .
Todavı́a podemos añadir algunas demostraciones consecuencias de las afirmaciones anteriores. Sea la
transformación lineal T : V1 → V2 supongamos además que T ∈ L (V1 , V2 ) Entonces las siguientes afirma-
ciones son válidas y equivalentes
1. T es Biyectiva en V1
2. T es invertible y su inversa T−1 : T {V1 } → V1 es lineal
3. ∀ |vi ∈ V1 , T {|vi} = |0i =⇒ |vi = |0i esto es, el espacio nulo ℵ (T) únicamente contiene al elemento
neutro de V1 .
Si ahora suponemos que V1 tiene dimensión finita, digamos dim [V1 ] = n, las siguientes afirmaciones
serán válidas y equivalentes
1. T es Biyectiva en V1
2. Si {|u1 i , |u2 i , |u3 i , · · · |un i} ∈ V1 son linealmente independientes entonces, {T {|u1 i} , T {|u2 i} , T {|u3 i} , · · · T {|un
T {V1 } también serán linealmente independientes.
3. dim [T {V1 }] = n
4. Si {|e1 i , |e2 i , |e3 i · · · |en i} ∈ V1 es una base de V1 , entonces {T {|e1 i} , T {|e2 i} , T {|e3 i} · · · T {|en i}} ∈
T {V1 } es una base de T {V1 }

6.1.6. Operadores Hermı́ticos Conjugados

Definiremos la acción de un operador A sobre un bra de la forma siguiente
(hw| A) |vi = hw| (A |vi)

| {z } | {z }
hw′ | |v′ i
por lo cual lo que estamos diciendo es que el elemento de matriz para el operador, A, es el mismo, y no
importa donde opere A.De esta manera, dado cada vector en V, tiene asociado un vector en V∗ podemos
demostrar que A operando sobre los bra es lineal. Esto es dado
hw| = λ1 hz1 | + λ2 hz2 | =⇒

(hw| A) |vi ≡ (λ1 hz1 | + λ2 hz2 | A) |vi = (λ1 hz1 | + λ2 hz2 |) (A |vi) = λ1 hz1 | (A |vi) + λ2 hz2 | (A |vi)
= λ1 (hz1 | A) |vi + λ2 (hz2 | A) |vi
Siguiendo con esta lógica podemos construir la acción del operador hermı́tico conjugado, A† . Para ello
recordamos que igual que a cada vector (ket) |vi le está asociado una forma lineal (bra) hv| ,a cada ket
transformado A |vi = |v′ i le corresponderá un bra transformado hv′ | = hv| A† . Por lo tanto
|vi ⇐⇒ hv|
′
|v i = A |vi ⇐⇒ hv′ | = hv| A†
ahora bien,si A es lineal, A† también lo será. Dado que a un vector |wi = λ1 |z1 i + λ2 |z2 i le corresponde
un bra hw| = λ∗1 hz1 | + λ∗2 hz2 | (la correspondencia es antilineal). Por lo tanto, |w′ i = A |wi = λ1 A |z1 i +
λ2 A |z2 i , por ser A lineal, entonces
|w′ i ⇐⇒ hw′ | ≡ hw| A† = (λ∗1 hz1 | + λ∗2 hz2 |) A† ≡ λ∗1 hz′1 | + λ∗2 hz′2 | = λ∗1 hz1 | A† + λ∗2 hz2 | A†
Es claro que de la definición de producto interno en la notación de Dirac, se desprende

∗ ∗
hx′ | yi = hy| x′ i ∀ |x′ i = A |xi , |yi ∈ V =⇒ hx| A† |yi = hy| A |xi ∀ |xi , |yi ∈ V
Igualmente se pueden deducir las propiedades de los operadores hermı́ticos conjugados

† † † † †
A† = A; (λA) = λ∗ A† ; (A + B) = A† + B† ; (AB) = B† A
Esta última propiedad es fácilmente demostrable y es educativa su demostración. Dado |v′ i = AB |vi,
además se tiene que

|v̄i = B |vi 
† †
=⇒ hv′ | = hv̄| A† = hv| B† A = hv| (AB)

|v′ i = A |v̄i
A partir de propiedades anteriores se deriva una más útil relacionada con el conmutador de dos operadores
hermı́ticos h i
† †
[A, B] = − A† , B = B† , A†
La conclusiones a las que llegamos son

Para obtener el hermı́tico conjugado de una expresión proceda de la siguiente manera:
Cambie constantes por sus complejas conjugadas λ ⇆ λ∗

Cambie los kets por sus bras asociados y viceversa (bras por kets): |vi ⇆ hv|
Cambie operadores lineales por sus hermı́ticos conjugados A† ⇆ A;

Invierta el orden de los factores
De este modo
†
(|vi hw|) = |wi hv|
que se deduce fácilmente de la consecuencia de la definición de producto interno
†
∗ ∗ ∗
hx| |vi hw| |yi = hy| (|vi hw|) |xi = hy| |vi hw| |xi = hx| |wi hv| |yi
Existe un conjunto de operadores que se denominan Hermı́ticos a secas o autoadjunto. Un operador

Hermı́tico (o autoadjunto) será aquel para el cual A† = A. Con esto
∗
hx| A† |yi = hx| A |yi = hy| A |xi
Claramente los proyectores son autoadjuntos por construcción

†
P†|vi ≡ (|vi hv|) = |vi hv|
6.1.7. Operadores Unitarios

Por definición un operador será unitario si su inversa es igual a su adjunto. Esto es
U−1 = U† =⇒ U† U = UU† = 1
De estos operadores podemos decir varias cosas
Las transformaciones unitarias dejan invariantes al producto interno y consecuentemente la norma de

vectores. Esto se demuestra fácilmente. Dados dos vectores |xi , |yi sobre los cuales actua un operadore
unitario 
|x̃i = U |xi 
=⇒ hỹ |x̃i = hy| U† U |xi = hy |xi

|ỹi = U |yi
Es claro que si Aes hermı́tico, A† = A, el operador T = eiA es unitario.
−iA† iA −iA −iA iA
T = eiA =⇒ T† = e = e−iA =⇒ TT† = e e = 1 = T† T = e e
El producto de dos operadores unitarios también es unitario. Esto es si U y V son unitarios entonces
(UV) † (UV) = V† |U{z

†
U}V = V† V = 1
1
† † † †
| {z }U = UU = 1
(UV) (UV) = UVV
1

6.2. Representación Matricial de Operadores

Supongamos un operador lineal A en el espacio vectorial de transformaciones lineales L (V, W ) donde
dim (V ) = n y dim (W ) = m y sean {|e1 i , |e2 i , |e3 i , · · · |en i} y {|ẽ1 i , |ẽ2 i , |ẽ3 i , · · · |ẽm i} las bases para
V y W respectivamente. Entonces A |ej i ∈ W
A |ei i = Aα
i |ẽα i con i = 1, 2, .., n y α = 1, 2, .., m
las Aαi son las componentes de la expansión de A |ei i en la base {|ẽ1 i , |ẽ2 i , |ẽ3 i , · · · |ẽm i} . Para un vector
genérico |xi tendremos que
|x̃i = A |xi = x̃α |ẽα i pero, a su vez |xi = xi |ei i
con lo cual

|x̃i = A |xi = x̃α |ẽα i = A xi |ei i = xi A |ei i = xi Aα
i |ẽα i =⇒ x̃α − xi Aα
i |ẽi i = 0
para finalmente concluir que

x̃α = Aα
i x
i
Varias cosas se pueden concluir hasta este punto
1. Si acordamos que los ı́ndices de arriba indican filas podemos representar los vectores como un arreglo
vertical de sus componentes  1 
x
 x2 
 
|xi →  . 
 .. 
xn
y las cantidades  
A11 A12 ··· A1j ··· A1n
 A21 A22 A2j 2 
An 

 .. .. .. 
 . . . 
Aα →  
i  Aα Aα Aα α 
An 
 1 2 j
 .. .. .. 
 . . . 
Am 1 Am2 Am
j Am
n
de tal modo que se cumpla

    
x̃1 A11 A12 ··· A1j ··· A1n x1
 x̃2   A21 A22 A2j A2n 
 x2 
    
 ..   .. .. ..
 ..
 .   . . .  .
|x̃i →  =  
 x̃α   Aα Aα Aα Aα
n  xj 
   1 2 j
 
  
 .. .. ..  
. . .
x̃m Am Am Am Am xn
1 2 j n
Nótese que los ı́ndices arriba indican fila y los de abajo columnas. Las cantidades Aα j es la represen-
tación del operador A en las bases {|e1 i , |e2 i , |e3 i , · · · |en i} y {|ẽ1 i , |ẽ2 i , |ẽ3 i , · · · |ẽm i} de V y W

respectivamente. Es decir una matriz Aij es un arreglo de números

 
A11 A12 ··· A1n
 A21 A22 A2n 
 
Aij =  .. .. 
 . . 
An1 An2 Ann
donde el superı́ndice, i, indica fila  

A11
 A21 
 
 .. 
 . 
An1
y el subı́ndice j columna
A11 A12 ··· A1n
2. Diremos que las componentes de los vectores transforman como
x̃α = Aα
i x
i
3. Si suponemos {|e1 i , |e2 i , |e3 i , · · · |en i} y {|ẽ1 i , |ẽ2 i , |ẽ3 i , · · · |ẽm i} bases ortonormales

x̃α = hẽα |x̃i = hẽα | A |xi = hẽα | A xi |ei i =xi hẽα | A |ei i
queda claro que Aα α

i ≡ hẽ | A |ei i será la representación matricial
4. Los vectores |ek i transforman de la siguiente manera
A |ei i = |w̃i i = Aji |ẽj i =⇒
donde {|e1 i , |e2 i , |e3 i , · · · |en i} y {|ẽ1 i , |ẽ2 i , |ẽ3 i , · · · |ẽn i} son las bases para V y W respectiva-
mente.
Definitivamente, las matrices son uno de los objetos más útiles de las Matemáticas. Ellas permiten aterri-
zar conceptos y calcular cantidades. La palabra matriz fue introducida en 1850 por James Joseph Sylvester1
y su teorı́a desarrollada por Hamilton2 y Cayley3 . Si bien los fı́sicos las consideramos indispensables, no
fueron utilizadas de manera intensiva hasta el aparición de la Mecánica Cuántica alrededor de 1925.
1 James Joseph Sylvester (1814-1897 Londres, Inglaterra). Además de sus aportes con Cayley a la Teorı́a de las Matrices
descubrió la solución a la ecuación cúbica y fue el primero en utilizar el término discriminante para categorizar cada una de
las raı́ces de la ecuación. Para vivir tuvo que ejercer de abogado durante una década. Por fortuna otro matemático de la época
(Arthur Cayley) frecuentaba los mismos juzgados y tribunales y pudieron interactuar. Por ser judı́o tuvo cantidad de dificultades
para conseguir trabajo en la Academia.
2 Sir William Rowan Hamilton (1805 - 1865, Dublin, Irlanda) Sus contribuciones en el campo de la Optica, Dinámica del
cuerpo Rı́gido, Teorı́a de ecuaciones algebráicas y Teorı́a de Operadores Lineales.

3 Arthur Cayley (1821, Richmond, 1895, Cambridge, Inglaterra) En sus cerca de 900 trabajos cubrió cası́ la totalidad de
las áreas de las Matemáticas de aquel entonces. Sus mayores cotribuciones se centran el la Teorı́a de Matrices y la Gemetrı́a no
euclideana. No consiguió empleo como Matemético y tuvo que graduarse de abogado y ejercer durante más de 15 años, durante
los cuales publicó más de 250 trabajos en Matemáticas

6.2.1. Bases y Representación Matricial de Operadores

Es importante recalcar que la representación matricial de un operador depende de las bases {|e1 i , |e2 i , |e3 i , · · · |en i}
y {|ẽ1 i , |ẽ2 i , |ẽ3 i , · · · |ẽm i} de de V y W respectivamente. Si tenemos otras bases ortonormal para V y W
vale decir, {|ē1 i , |ē2 i , |ē3 i , · · · |ēn i} y {|ě1 i , |ě2 i , |ě3 i , · · · |ěm i} su representación será distinta. Esto es
 
Ã11 Ã12 · · · Ã1j · · · Ã1n
 Ã2 Ã2 Ã2j Ã2n 
 1 2 
 . .. . 
 . . . 
α α  . . 
hě | A |ēj i = Ãj =⇒  α 
 Ã1 Ãα 2 Ãα
j Ãα
n 
 
 .. .. .. 
 . . . 
Ãm1 Ã m
2 Ã m
j Ã m
n
Más aún cambiando el orden en el cual se presenta una base, cambia la representación matricial del operador.
Los siguientes ejemplos tratarán de ilustrar estas situaciones
Si tenemos un matriz 2 × 3, B de la forma

3 1 −2
B=
1 0 4
y supongamos las bases canónicas para V 3 y V 2 : {|e1 i , |e2 i , |e3 i} y {|e1 i , |e2 i} . Entonces la matriz B
representan la transformación B :V 3 → V 2 que lleva un vector genérico |xi = (x1 , x2 , x3 ) en un vector
genérico |yi = (y1 , y2 ) tal que
 
x
3 1 −2 3 1 −2  1  y1
B= =⇒ B |xi = |yi =⇒ x2 =
1 0 4 1 0 4 y2
x3
y esto es
y1 = 3x1 + x2 − 2x3
y2 = x1 + 0x2 + 4x3
La representación matricial, dependerá de la base en la cual se exprese. Si suponemos el operador dife-

rencial D (·) = d(·)
dx y consideramos el dominio un espacio vectorial
polinomios de grado ≤ 3, por lo
de los
tanto D (·) : P 3 → P 2 , si consieramos las bases 1, x, x2 , x3 y 1, x, x2 de P 3 y P 2 respectivamente. Si el
producto interno está definido como
Z 1

i
P |Pj i → dx Pi (x) Pj (x) dx
−1
La representación matricial el operador diferencial será

 
D D E 0 1 0 0

P̃ i D |Pj i = P̃ i P̃j =  0 0 2 0 
0 0 0 3
como siempre i indica las filas y j las columnas.

Otra manera de verlo es operar (diferenciar) sobre el |Pj i ∈ P 3 y expresar ese resultado en la base de P 2
 d(1)

 = 0 = 0 · 1 + 0 · x + 0 · x2

 dx
 d(x) = 1 = 1 · 1 + 0 · x + 0 · x2
dx
D |Pj i =⇒ d(x2 )


 dx = 2x = 0 · 1 + 2 · x + 0 · x2

 d(x3 )
dx = 3x2 = 0 · 1 + 0 · x + 3 · x2
y los coeficientes de esa expansión serán las columnas de la matriz que los representa.
Para enfatizar que los elementos de matrı́z, no sólo dependen de la base sino
del orden en el cual la base
se presente. Consideremos que la base de P 2 viene representadas por x2 , x, 1 . La representación matricial
del operador D (·) = d(·)
dx será
 

i
i E 0 0 0 3
P D |Pj i = P P̃j =  0 0 2 0 
0 1 0 0
aunque 
  1  
0 1 0 0  1  1
 0 0 2 0    2 
 1 = =⇒1 + 2x + 3x2
0 0 0 3 3
1
equivalentemente  
  1  
0 0 0 3  1  3
 0 0 2 0  1
= 2 
 =⇒1 + 2x + 3x2
0 1 0 0 1
1
¡Es el mismo polinomio!
Recuerde que las componentes del vector multiplican a los vectores bases en el mismo orden.
Si ahora construimos la respresentación
para el mismo operador D (·) = d(·)
dx en la siguiente base
2 2 3 2 3 2
1, 1 + x, 1 + x + x , 1 + x + x + x y 1, x, x de P y P , respectivamente.
 d(1)

 = 0 = 0 · 1 + 0 · x + 0 · x2

 dx
E  d(1+x) = 1 = 1 · 1 + 0 · x + 0 · x2
dx
D |Pj i = P̃j =⇒ d(1+x+x2 )


 dx = 1 + 2x = 1 · 1 + 2 · x + 0 · x2

 ( d 1+x+x 2
+x3
)
dx = 1 + 2x + 3x2 = 1 · 1 + 2 · x + 3 · x2
con lo cual  

E 0 1 1 1

P i D |Pj i = P i P̃j =  0 0 2 2 
0 0 0 3
6.2.2. Algebra de Matrices

Por comodidad supongamos que dim (V ) = dim (W ) = n y consideremos la base ortogonal {|e1 i , |e2 i , |e3 i , · · · |en i} .De
este modo es claro, que se reobtienen las conocidas relaciones para matrices cuadradas

i

e A + B |ej i = ei A+B |ej i = ei A |ej i + ei B |ej i = Aij + Bji

con lo cual tenemos la suma de matrices. Esto es

 1   
A1 A12 · · · A1n B11 B21 ··· Bn1
 A21 A22 A2n   B12 B22 Bn2 
   
 .. .. + .. .. 
 . .   . . 
An1 An2 Ann B1n B2n Ann
⇓
 
A11 + B11 A12 + B21 ··· A1n + Bn1
 A21 + B12 A22 + B22 A2n + Bn2 
 
 .. .. .. 
 . . . 
An1 + B1n Ann + Bnn
i
en forma compacta puede demostrarse Aij + Bji = (A + B)j con lo cual es directo la demostrar la igualdad
de matrices
 1 
A1 + B11 A12 + B21 · · · A1n + Bn1
 A1 + B1 A2 + B2
2 2 2 2
An + Bn 
2 2
 
 .. .. . . =0
 . . . 
n n n n
A1 + B1 An + Bn
⇓
   1 
A11 A12 ··· A1n B1 B21 ··· Bn1
 A21 A22 A2n   B12 B22 2 
Bn 
  
 .. ..  =  .. .. 
 . .   . . 
An1 An2 Ann
B1n B2n n
An
de donde Aij = Bji

De igual modo para la representación de composición de operadores

i

e AB |ej i = ei A1B |ej i = ei A |ek i ek B |ej i = ei A |ek i ek B |ej i = Aik Bjk
para multiplicación de matrices. Esto es
 1   1 
A1 A12 · · · A1n B1 B21 ··· Bn1
 A21 A22 2 
An   2
B22 2 
  B1 Bn 
 .. ..  ×  .. .. 
 . .   . . 
An1 An2 Ann
B1n B2n n
An
⇓
 
A1k B1k A1k B2k ··· A1k Bnk
 A2k B1k A2k B2k A2k Bnk 
 
 .. .. .. 
 . . . 
Ank B1k n k
Ak Bn
como ya sabı́amos AB 6= BA →Aik Bjk 6=Bki Akj

De la misma manera la multiplicación de un número por una matriz es la multiplicación de todos sus
elementos por ese número
i

e αA |ej i = α ei A |ej i = αAij

6.2.3. Representación Diagonal

Finalmente mostraremos que dado un operador lineal A ∈L (V, W ) donde dim (V ) = dim (W ) = n y sea
{|u1 i , |u2 i , |u3 i , · · · |un i} una base ortonormal para V y W . Si adicionalmente se da el caso que
A |ui i = |ui i
la representación matricial es diagonal

uj A |ui i = Aji = uj |ui i = δij
Esta afirmación también es válida para dim (V ) 6= dim (W ) pero por simplicidad seguimos trabajando con
matrices cuadradas.
En leguaje de ı́ndices estaremos diciendo que
 
D1 0 0 0
 0 D2 0 0 
Dji = Dk δlk δjl δki = 
 0

0 D3 0 
0 0 0 D4
6.2.4. Sistemas de Ecuaciones lineales

Una de las aplicaciones más útiles del álgebra de matrices es la resolución de los sitemas de ecuaciones
lineales. El cual puede ser expresado de la siguiente forma
Aα i
i x =c
α
con i = 1, 2, .., n y α = 1, 2, .., m

por lo tanto tendremos m ecuaciones lineales para n incognitas x1 , x2 , · · · xn . Las Aα
i es la matriz de
los coeficientes. Por lo tanto este problema puede ser pensado como un problema de un operador A en el
espacio vectorial de transformaciones lineales L (V, W ) donde dim (V ) = n y dim (W ) = m, con las cα las
componentes del vector transformado
|ci = A |xi → cα = Aα
i x
i
Concretemos en un ejemplo
    
2x + 3y − z = 5 2 3 −1 x 5
4x + 4y − 3z = 3 =⇒  4 4 −3   y  =  3 
−2x + 3y − z = 10 −2 3 −1 z 1
el método más utilizado es la eliminación de Gauss Jordan el cual se basa en el intercambio de ecuaciones
y la multiplicación apropiada e inteligente por constantes y resta de ecuaciones. La idea es construir una
matriz triangular superior para poder luego despejar desde abajo. Veamos:
 
a 2 3 −1 5
b  4 4 −3 3 
c −2 3 −1 1
entonces para eliminar x de lala fila c (o la ecuación c) sumamos la fila a con la c, a + c y esta nueva ecuación
será la nueva c  
a 2 3 −1 5
b  4 4 −3 3 
c′ 0 6 −2 6

ahora −2a + b será la nueva b  

a 2 3 −1 5

b′  0 −2 −1 −7 

c′ 0 6 −2 6
finalmente 3b′ + c′  
a 2 3 −1 5

b′  0 −2 −1 −7 

c′′ 0 0 −5 −15
Este sistema es equivalente al primer sistema de ecuaciones. La solución emerge rápidamente:
−5z = −15 → z = 3 − 2y − z = −7 → −2y − 3 = −7 → y = 2 2x + 3 (2) − 3 = 5 → x = 1
Es bueno recalcar que los sistemas de ecuaciones lineales no necesariamente tienen solución y a veces tienen
más de una solución.
6.2.5. Operadores Hermı́ticos

La representación matricial de un operador hermı́tico,
i

∗
∗
A† j
= ei A† |ej i = ej A |ei i = Aji
vale decir: el hermı́tico conjugado de una matriz, es su traspuesta conjugada. Si la matriz es Hermı́tica, i.e.
i
A† = A =⇒ A† j
= Aij
por lo tanto, las matrices hermı́ticas son simétricas respecto a la diagonal y los elementos de la diagonal son
números reales. Un operador hermı́tico estará representado por una matriz hermı́tica.
Aquı́ vale la pena probar algunas de las propiedades que arriba expresamos para operadores hermı́ticos
conjugados, vale decir
† † † † †
A† = A; (λA) = λ∗ A† ; (A + B) = A† + B† ; (AB) = B† A
Es claro que
†
i † † i † ∗ †
A† → e A |ej i = A† j = Aji = Aij
y

† ∗ ∗
(λA) → ei λA† |ej i = ej λA |ei i = λ∗ ej A |ei i = λ∗ ei A† |ej i = λ∗ A†
pero más interesante es
†
† † † †
(AB) → ei (AB) |ej i = Aik Bjk = Aj∗ k∗ k∗ i∗ i∗ k∗
k Bi = Aj Bk = Bk Aj → B A
6.2.6. Inversa de una matriz

Hemos visto que dada una transformación lineal biyectiva, podemos definir una inversa para esa trans-
formación lineal. Esa transformación lineal tendrá como representación un matriz. Por lo tanto dado un
operador lineal A diremos que otro operador lineal B será su inverso (por la derecha) si

AB = 1 → ei AB |ej i = δji → Aik Bjk = δji


ahora bien, como conocemso la matriz Aik y las suponemos no singular (esto es: det Aik 6= 0) y si tomamos
un j fijo tendremos un sistema de n ecuaciones lineales inhomogeneo con n incognitas Bj1 , Bj2 , Bj3 , · · · Bjn .
Al resolver el sistema tendremos la solución. El procedimiento para encontrar la inversa es equivalente al
método de eliminación de Gauss Jordan, veamos como funciona. Supongamos una matriz 3 × 3
 1   
A1 A12 A13 1 0 0 1 0 0 B11 B21 B31
Gauss Jordan
 A21 A22 A23 0 1 0  →  0 1 0 B12 B22 B32 
3

3 3
A1 A2 A3 0 0 1 0 0 1 B13 B23 B33
Como un ejemplo
   
2 3 4 1 0 0 2 3 4 1 0 0

 2 1 1 0 1 0 → 0 2 3 1 −1 0 →

−1 1 2 0 0 1 −1 1 2 0 0 1
 
2 3 4 1 0 0

 0 2 3 1 −1 0 →

0 5 8 1 0 2
6.2.7. Cambio de Bases para vectores

Dada una representación (una base) particular un bra, un ket o un operador queda representado por una
matriz. Si cambiamos la representación, ese mismo bra, ket u operador tendrá otra matriz como representa-
ción. Mostraremos cómo están relacionadas esas matrices.
Dadas dos base discretas ortonormales {|ui i} y {|ti i}, entonces un vector cualquiera

  m

|Ψi = uk huk | |Ψi = uk Ψi |uk i   ht |Ψi = uk Ψi htm |uk i

 
 | {z }
| {z } 
 

  Skm
ck
=⇒
k
  u |Ψi = htm | Ψi uk |tm i

|Ψi = (|tm i htm |) |Ψi = htm | Ψi |tm i 





| {z } 
 
 | {z }
c̃m k
S̃m
con lo cual, una vez más, tendremos que la expresión de transformación de componentes de un vector
c̃m = Skm ck ⇐⇒ ck = S̃m

k m
c̃
y Skm (o S̃m
k
) será la matriz de transformación, cambio de base o cambio de representación. Ahora bien, por
definición de producto interno

∗
htm |uk i = uk |tm i =⇒ Skm = Sm k∗
≡ Skm†
por lo tanto, la matriz de transformación entre bases es hermı́tica o autoadjunta y la relación anterior queda
escrita como

c̃m = Skm ck =⇒ htm | Ψi = Skm uk Ψi
ck = Sm
k† m
c̃ =⇒ uk |Ψi = Sm
k†
htm | Ψi

Igualmente la regla de transformación de las representaciones matriciales de operadores quedan expresadas

como
i

t A |tj i = ti |uk i uk A (|um i hum |) |tj i = ti |uk i uk A |um i hum |tj i
| {z } | {z }
Ski Sjm†
por lo tanto,
Ãij = Ski Akm Sjm†
donde Ãij es la representación del operador A respecto a la base {|tj i} y Akm su representación en la base
{|um i}
6.3. Traza de Operadores

La traza, Tr (A) , de un operador A es la suma de los elementos diagonales de su representación matricial.
Esto es dado un operador A y una base ortogonal {|ui i} para V n

Tr (A) = uk A |uk i = Aii
Ası́  
1 2 3
Aij =  4 5 6  =⇒ Tr (A) = Aii = 15
7 8 9
6.3.1. Invariancia de la Traza

La traza de una matriz no depende de la base que seleccionemos. Es un invariante que caracteriza
al operador independientemente de la base en la cual se represente. Entonces Dadas dos base discretas
ortonormales {|ui i} y {|ti i},

Akk = uk A |uk i = uk |tm i htm | A |uk i = htm | A|uk i uk |tm i = htm | A |tm i = Am
m
| {z }
1

Donde una vez más hemos utilizado las dos relaciones de cierre |tm i htm | = 1 y uk huk | = 1. Es claro que
el número que representa esta suma será el mismo independientemente de su representación matricial.
6.3.2. Propiedades de la Traza

Claramente la traza es lineal
Tr (A+λB) = Tr (A) + λ Tr (B)
ya que

Tr (A + λB) = uk A + λB |uk i = uk A |uk i + λ uk B |uk i = Tr (A) + λ Tr (B)
La traza de un producto conmuta esto es
Tr (AB) = Tr (BA)
y es fácilmente demostrable

Tr (AB) = uk AB |uk i = uk A|um i hum |B |uk i = uk B|um i hum |A |uk i = Tr (BA)
| {z } | {z }
1 1


Recuerde que uk B |um i y uk A |uk i son números que pueden ser reordenados.
Del mismo modo es fácil demostrar que la traza de un triple producto de matrices respeta la ciclicidad
del orden de la matrices en el producto
Tr (ABC) = Tr (BCA) = Tr (CAB)
6.3.3. Diferenciación de Operadores

Dado un operador A (t) el cual supondremos dependiente de una variable arbitraria t podremos definir
la derivada como
dA (t) A (t + ∆t) − A (t)
= lı́m
dt ∆t→0 ∆t

k
por lo tanto si u A |ui i = A entonces
k
i
 dA11 dA12 dA1n

dt dt ··· dt
k  dA21 dA22 dA2n 

dA (t) dA (t) d
k dAki  
uk |ui i = = u A (t) |ui i = =

dt
..
dt
..
dt 

dt dt i dt dt  . . 
dAn
1 dAn
2 dAnn
dt dt dt
con lo cual la regla es simple, la representación matricial de la derivada de un operador será la derivada de
cada uno de sus elementos. Con ello
   
x x2 2 1 2x 0
d 
1 e−x 5x  =  0 −e−x 5 
dx 3 2
3x 3 cos x 9x 0 − sen x
6.3.4. Reglas de Diferenciación de Operadores Lineales

Las reglas usuales de la diferenciación se cumplirán con la diferenciación de operadores. Esto se demuestra
con la representación matricial
d (A (t) + B (t)) d (A (t)) d (B (t))

= +
dt dt dt

d (A (t) + B (t)) d
k
uk |ui i = u (A (t) + B (t)) |ui i
dt dt
d
k

= u A (t) |ui i + uk B (t) |ui i
dt
d
k d
k
= u A (t) |ui i + u B (t) |ui i
dt dt

dA (t)
dB (t) d (A (t)) d (B (t))
= uk |ui i + uk |ui i = +
dt dt dt dt
Del mismo modo se cumplirá que
d (A (t) B (t)) dA (t) dB (t)

= B (t) + A (t)
dt dt dt

con la precaución que no se puede modificar el orden de aparición de los operadores. Es fácil ver que

d (A (t) B (t)) d
k d
k
uk |ui i = u A (t) B (t) |ui i = u A (t) 1B (t) |ui i
dt dt

k dt
= u A (t) |um i hu | B (t) |ui i
m

d uk A (t) |um i m
d hum | B (t) |ui i
= hu | B (t) |ui i + uk A (t) |um i
dt dt

k dA (t)
k dB (t)
= u |um i hu | B (t) |ui i + u A (t) |um i hu |
m m
|ui i
dt dt
Otras propiedades de la derivación de operadores se demuestran a partir de la expansión en series de los
At
operadores. Por ejemplo si queremos conocer la expresión para dedt , con A 6= A (t)si recordamos que
"∞ # " #
X (At)n (At)
2
(At)
n
At
e |vi = |vi = 1 + At + + ··· + · · · |vi
n=0
n! 2! n!
tendremos que
"∞ # "∞ #
deAt d X (At)
n X d (At)n
|vi = |vi = |vi
dt dt n=0 n! n=0
dt n!
"∞ # "∞ #
X ntn−1 An X tn−1 An−1
= |vi = A |vi
n=0
n! n=0
(n − 1)!
| {z }
eAt
Nótese que la suma es hasta infinito, por lo tanto al cambiar de ı́ndice p = n − 1, p sigue variando hasta
infinito y la serie es la misma que la anterior. Entonces
deAt
|vi = eAt A |vi ≡ AeAt |vi
dt
también fı́jese que si un solo operador esta siendo derivado el orden de presentación de los operadores es
indiferente. Ahora bien, cuando se presenta la siguiente situación

d eAt eBt deAt Bt deBt
|vi = e |vi + eAt |vi = AeAt eBt |vi + eAt BeBt |vi
dt dt dt
= eAt AeBt |vi + eAt eBt B |vi

con A 6= A (t) y B 6= B (t) y siempre eBt , B = 0. Con lo cual, sólo para el caso en el cual [A, B] = 0
podremos factorizar eAt eBt y
d eAt eBt
|vi = (A + B) eAt eBt |vi
dt
Si [A, B] 6= 0 el orden de aparición de los operadores es MUY h importante.i
dA(t)
Para el caso en el cual A = A (t) no necesariamente A (t) , e dt = 0. Veamos:
"∞ # "∞ #
deA(t) d X (A (t))
n X 1 d (A (t))n
|vi = |vi = |vi
dt dt n=0 n! n=0
n! dt
"∞ #
X 1 d (A (t)) n−1 d (A (t)) n−2 n−1 d (A (t))
= A (t) + A (t) A (t) · · · A (t) |vi
n=0
n! dt dt dt

Adicionalmente
dF (B)
si [A, [A, B]] = [B, [A, B]] = 0 =⇒ [A, F (B)] = [A, B]
dt
Esta relación es fácilmente demostrable para el caso en el cual [A, B] = 1 el operador indentidad, en ese
caso tenı́amos que ABn − Bn A = nBn−1
ABn − Bn A = ABB · · · B}−BB
| {z · · · B}A
| {z
n n
· · · B} − BB
= (1 + BA) |BB{z · · · B}A
| {z
n−1 n
= 1Bn−1 + B (1 + BA)BB · · · B} − |BB{z

| {z · · · B}A
n−2 n
n−1 2
= 2B + B (1 + BA)BB · · · B} − |BB{z
| {z · · · B}A
n−3 n
..
.
= nBn−1
Obviamente, para este caso, se cumple que
[A, B] = 1 =⇒ [A, [A, B]] = [B, [A, B]] = 0
para demostrar esta relación “desarrollemos en Serie de Taylor” la funcion F (B) . Esto es
" ∞
# ∞ ∞ ∞
X Bn X [A, Bn ] X nBn−1 X Bn−1
[A, F (B)] = A, fn = fn = [A, B] fn = [A, B] fn
n=0
n! n=0
n! n=0
n! n=0
(n − 1)!
dF (B)
= [A, B]
dt
Para el caso más general se procede del mismo modo
? dF (B)
si [A, C] = [B, C] = 0 con C = [A, B] =⇒ [A, F (B)] = [A, B]
dt
Probaremos primero que
n−1
si [A, C] = [B, C] = 0 con C = [A, B] =⇒ [A, Bn ] = ABn − Bn A = n [A, B] B
Tendremos que
ABn − Bn A = ABB · · · B}−BB
| {z · · · B}A
| {z
n n
· · · B} − |BB{z
= (C + BA) |BB{z · · · B}A
n−1 n
= CBn−1 + B (C + BA)BB · · · B} − |BB{z

| {z · · · B}A
n−2 n
n−1 2
= 2CB + B (C + BA)BB · · · B} − |BB{z
| {z · · · B}A
n−3 n
..
.
n−1
= nCBn−1 = n [A, B] B

con lo cual es inmediato demostrar que

" ∞
# ∞ ∞ ∞
X Bn X [A, Bn ] X nBn−1 X Bn−1
[A, F (B)] = A, fn = fn = [A, B] fn = [A, B] fn
n=0
n! n=0
n! n=0
n! n=0
(n − 1)!
dF (B)
= [A, B]
dt
6.3.5. La Fórmula de Glauber

Ahora estamos en capacidad de demostrar limpiamente la fórmula de Glauber. Esta es
1
Para demostrarla, procedemos a considerar un operador F (t) = eAt eBt , por lo tanto
dF (t) deAt eBt

|vi = |vi = AeAt eBt |vi + eAt BeBt |vi = A + eAt Be−At eAt eBt |vi
dt dt
= A + eAt Be−At F (t) |vi
Ahora bien, dado que

dF (B)
si [A, [A, B]] = [B, [A, B]] = 0 =⇒ [A, F (B)] = [A, B]
dt
entonces At
e , B = t [A, B] eAt =⇒ eAt B = BeAt + t [A, B] eAt
por lo cual
dF (t)
|vi = A + eAt Be−At F (t) |vi = A + B + t [A, B] eAt F (t) |vi
dt
por tanteo uno puede darse cuenta que
n 2
o
(A+B)t+ t2 [A,B]
F (t) = e
cumple con la ecuación anterior, por lo tanto absorbiendo t en los operadores correspondientes llegamos a la
fórmula de Glauber
1
6.4. Un Zoológico de Matrices Cuadradas

A continuación presentaremos un conjunto de matrices que serán de utilidad más adelante
6.4.1. La matriz nula

es  
0 0 ··· 0
 0 0 0 
 
Aij = 0 ∀i, j =⇒ Aij =  .. .. 
 . . 
0 0 0

6.4.2. Diagonal a Bloques

Podremos tener matrices diagonales a bloques, vale decir
 1 
D1 D21 0 0
 D 2
D22 0 0 
Dji = 
 0
1 
0 D33 D43 
0 0 D34 D44
6.4.3. Triangular superior e inferior

   
Ď11 Ď21 Ď31 Ď41 D̂11 0 0 0
 0 Ď22 D32 Ď42   D̂12 D̂22 0 0 
Ďji = 
 0
 y D̂ji =  
0 Ď33 Ď43   D̂3
1 D23 D̂33 0 
0 0 0 Ď44 D̂14 D̂24 D̂34 D̂44
6.4.4. Matriz singular

A es singular =⇒ det A = 0
6.4.5. Matriz de cofactores

   1 1 1 
a11 a12 a13 (Ac )1 (Ac )2 (Ac )3
c i
Aj =  a21
i
a22 a23  y (A )j =  (Ac )21 2
(Ac )2 (Ac )3 
2
a31 a32 a33 (Ac )1

3 c 3
(A )2 c 3
(A )3
i
donde los (Ac )j es la matriz de cofactores, y los cofactores son
2 2 2
1 1+1 a2 a23 1 1+2 a1 a23 1 1+3 a1 a22
(Ac )1 = (−1) 3 (Ac )2 = (−1) 3 (Ac )3 = (−1) 3
a2 a33 a1 a33 a1 a32
1 1 1
2 2+1 a2 a13 2 2+2 a1 a13 2 2+3 a1 a12
(Ac )1 = (−1) 3 (Ac )2 = (−1) 3 (Ac )3 = (−1) 3
a2 a33 a1 a33 a1 a32
1 1 1
3 3+1 a2 a13 3 3+2 a1 a13 3 3+3 a1 a12
(Ac )1 = (−1) 2 (Ac )2 = (−1) 2 (Ac )3 = (−1) 2
a2 a23 a1 a23 a1 a22
6.4.6. Matriz Adjunta

Llamaremos matriz adjunta, adj [A], a la traspuesta de la matriz de cofactores de una determinada matriz.
Esto es
T i
T
j
adj [A] = (Ac ) =⇒ adj Aij = (Ac )j = (Ac )i
Esto es    
1 2 3 i −3 6 −3
Aij =  4 5 6  =⇒ adj Aj =  6 −12 6 
7 8 9 −3 6 −3

Una matriz será autoadjunta si adj [A] = A
6.5. Un Paréntesis Determinante

6.5.1. Definición
Antes de continuar es imperioso que refresquemos algunas propiedades del determinante de una matriz.
Ya hemos visto que el det A : Mn×n → ℜ. Es decir, asocia un número real con cada matriz del espacio
vectorial Mn×n de matrices n × n
Ası́, dada una matriz
 1  1
A1 A12 · · · A1n A1 A12 · · · A1n

 A21 A22 A2n  A21 A22 A2n
i   ijk··· 1 2 3
Aj =  . ..  =⇒ det A = ε Ai Aj Ak · · · = . ..
 .. .  .. .

An An An An An An
1 2 n 1 2 n
Hemos generalizado el ı́ndice de Levi Civita de tal forma que


 0, si cualesquiera dos ı́ndices son iguales
εijk··· = εijk··· = 1, si los ı́ndices i, j, k · · · constituyen una permutación cı́clica de 1, 2, 3 · · · n

−1 si los ı́ndices i, j, k · · · constituyen una permutación anticı́clica de 1, 2, 3 · · · n
Esta situación es clara para el caso de matrices 3 × 3, veamos.

Dada una matriz 3 × 3
 1  1
A1 A12 A13 A1 A12 A13

i
Aj =  2 2
A1 A2 A3 2 
=⇒ det A = ε Ai Aj Ak = A21
ijk 1 2 3
A22 A23

A31 A32 A33 A31 A32 A33
con lo cual
det A = ε123 A11 A22 A33 + ε312 A13 A21 A32 + ε231 A12 A23 A31 + ε132 A11 A23 A32 + ε321 A13 A22 A31 + ε213 A12 A21 A33
= A11 A22 A33 + A13 A21 A32 + A12 A23 A31 − A11 A23 A32 − A13 A22 A31 − A12 A21 A33
6.5.2. Propiedades Determinantes

1. det A = det AT donde AT es la traspuesta de A
Esta propiedad proviene de la definición del ı́ndice de Levi Civita
det A = εijk··· A1i A2j A3k · · · = εijk··· Ai1 Aj2 Ak3 · · · = det AT
que se traduce que se intercambian filas por columnas el determinante no se altera

1
A1 A12 A13 A11 A21 A31
2
A1 A22 A23 = A12 A22 A32
3
A1 A32 A33 A13 A23 A33
2. Si dos filas o dos columnas son idénticas el determinante se anula
εiik··· A1i A2i A3k · · · = εiik··· Ai1 Ai2 Ak3 · · · = 0

por definición del ı́ndice de Levi Civita

1 1
A1 A11 A13 A1 A12 A13
2 1
A1 A21 A23 = A1 A12 A13 =0
3 3
A1 A31 A33 A1 A32 A33
3. Si multiplicamos una fila o una columna por un número, el determinante queda multiplicado por el
número

εijk··· A1i λA2j A3k · · · = λεijk··· A1i A2j A3k · · · = λ det A

εijk··· Ai1 Aj2 λAk3 · · · = λεijk··· Ai1 Aj2 Ak3 · · · = λ det A
de aquı́ claramente se desprende que si una fila o una columna es cero (λ = 0) el determinante se
anula. Más aún, si dos filas o dos columnas son proporcionales A1i = λA2j el determinante se anula, por
cuanto se cumple la propiedad anterior
1 1
A1 λA12 A13 A11 A12 A13 A1 A12 A13
2
A1 λA22 A23 = A21 A22 A23 = λ A21 A22 A23
3
A1 λA32 A33 λA31 λA32 λA33 A31 A32 A33
Obvio que 1 1
A1 0 A13 A1 A12 A13
2 2
A1 0 A23 = A1 A22 A23 =0
3
A1 0 A33 0 0 0
al igual que
1 1
A11 λA11 A13 A11 A12 A13 A1 A11 A13 A1 A12 A13

A21 λA21 A23 = λA11 λA12 λA13 = λ A21 A21 A23 = λ A11 A12 A13 =0
3 3
A31 λA31 A33 A31 A32 A33 A1 A31 A33 A1 A32 A33
4. Si se intercambian dos filas o dos columnas cambia de signo el determinante.

1
A1 A12 · · · A1n
2
A1 A22 A2n
ijk··· 1 2 3
det A = ε Ai Aj Ak · · · = . .. =⇒ εijk··· A1j A2i A3k · · · = det Ã
.. .

An An Ann
1 2
donde en la matriz Ã se han intercambiando un par de columnas. Claramente las propiedades del
ı́ndice de Levi Civita, obliga al cambio de signo
det Ã = − det A
Nótese que una sı́ntesis de las propiedades anteriores nos lleva a reescribir el determinante de una
matriz de la forma
det A = εαβγ··· det A = εijk··· Aiα Ajβ Akγ · · · ⇐⇒ det A = εαβγ··· det A = εijk··· Aα β γ
i Aj Ak · · ·
claramente, si αβγ · · · ⇐⇒ 123 · · · reobtenemos la definición anterior. Si se intercambian dos filas o dos
columnas, el determinante cambia de signo debido al intercambio de dos ı́ndices griegos. Si dos filas
o dos columnas son iguales el determinante se anula debido a la propiedad de sı́mbolo de Levi Civita
con ı́ndices griegos.

5. El determinante de un producto es el producto de los determinantes

det (AB) = det (A) det (B)
Antes de proceder a la demostración de este importante propiedad jugaremos un poco más con las
propiedades de las matrices. Queremos señalar que si A es una matriz m × n y B es una matriz n × p,
entonces tendremos que
α
(AB) = Aα B
esto es que la α − esima fila es igual a la multiplicación de la α − esima fila, Aα ,por toda la matriz
B. Veamos
i
Cji = (AB)j = Ail Bjl
por lo tanto la α − esima fila
 
B11 B21 ··· Bn1
 B12 B22 Bn2 
α  
Cjα = Aα l
l Bj =⇒ Cjα = (Aα
1 , Aα
2 , Aα
3 , · · · A n , )  .. .. 
 . . 
B1n B2n Bnn

det (A) det (B) = det (A) εijk··· B1i B2j B3k · · · = εijk··· Aiα Ajβ Akγ · · · εabc··· B1a B2b B3c · · ·
que siempre puede ser rearreglado a

β γ
εijk··· Aα
i Aj Ak · · · εijk··· B1i B2j B3k · · · = Aα i β j γ k
i B1 Aj B2 Ak B3 · · · = det (AB)
veamos este desarrollo en el caso de 3 × 3

ε123 A11 A22 A33 + ε312 A13 A21 A32 + ε231 A12 A23 A31 + ε132 A11 A23 A32 + ε321 A13 A22 A31 + ε213 A12 A21 A33

× ε123 B11 B22 B33 + ε312 B31 B12 B23 + ε231 B21 B32 B13 + ε132 B11 B32 B23 + ε321 B31 B22 B13 + ε213 B21 B12 B33
con lo cual

= A11 A22 A33 B11 B22 B33 + B31 B12 B23 + B21 B32 B13 − B11 B32 B23 − B31 B22 B13 − B21 B12 B33

+ A13 A21 A32 B11 B22 B33 + B31 B12 B23 + B21 B32 B13 + B11 B32 B23 + B31 B22 B13 + B21 B12 B33

+ A12 A23 A31 B11 B22 B33 + B31 B12 B23 + B21 B32 B13 + B11 B32 B23 + B31 B22 B13 + B21 B12 B33

− A11 A23 A32 B11 B22 B33 + B31 B12 B23 + B21 B32 B13 + B11 B32 B23 + B31 B22 B13 + B21 B12 B33


como son números los rearreglo

= A11 A22 A33 B11 B22 B33 + B12 B23 B31 + B13 B21 B32 − B11 B23 B32 − B13 B22 B31 − B12 B21 B33

+ A13 A21 A32 B11 B22 B33 + B12 B23 B31 + B13 B21 B32 − B11 B23 B32 − B13 B22 B31 − B12 B21 B33


− A11 A23 A32 B11 B22 B33 + B12 B23 B31 + B13 B21 B32 − B11 B23 B32 − B13 B22 B31 − B12 B21 B33




= A11 A22 A33 +B12 B23 B31 + B13 B21 B32 − B11 B23 B32 − B13 B22 B31 − B12 B21 B33


+ A12 A23 A31 B11 B22 B33 + +B13 B21 B32 − B11 B23 B32 − B13 B22 B31 − B12 B21 B33



A11 B11 A22 A33 B22 B33 + A12 B12 A23 A31 B23 B31
εijk··· Aiα B1α Ajλ B2λ Akµ B2µ · · ·
6.6. Autovectores y Autovalores

6.6.1. Definiciones y Teoremas Preliminares
Llamaremos a |ψi un autovector del operador A si se cumple que
A |ψi = λ |ψi
en este caso λ (que, en general será un número complejo) se denomina el autovalor correspondiente al
autovector |ψi . La ecuación A |ψi = λ |ψi en conocida en la literatura como la ecuación de autovalores y se
cumple para algunos valores particulares de los autovalores λ. El conjunto de los autovalores se denomina el
espectro del operador A.
Supongamos que A : V → V y que dim V = n, supongamos además que una base ortogonal para V es
{|e1 i , |e2 i , |e3 i , · · · |en i} . Por lo tanto la repercusión de esta ecuación sobre la representación matricial es
la siguiente
i

e A |ej i ej |ψi = ei λ |ψi = λ ei |ψi =⇒ Aij cj = λci

claramente, si {|e1 i , |e2 i , |e3 i , · · · |en i} genera una representación diagonal de A entonces
Aij ∝ δji =⇒ Aij cj ∝ δji cj = λci =⇒ Aij ∝ λδji
Esto lo podemos resumir en el siguiente teorema que presentaremos sin demostración.

Teorema Dado un operador lineal A :V n → V n si la representación matricial de A es diagonal, ei A |ej i =
Aij ∝ δji entonces existe una base ortonormal {|e1 i , |e2 i , |e3 i , · · · |en i}4 y un conjunto de cantidades
{λ1 , λn , · · · , λn } tales que se cumple
A |ei i = λi |ei i con i = 1, 2, · · · n
igualmente se cumple que si existe una base ortonormal {|e1 i , |e2 i , |e3 i , · · · |en i}y un conjunto de
cantidades {λ1 , λn , · · · , λn } tales satisfagan
A |ei i = λi |ei i con i = 1, 2, · · · n
Entonces se cumple la representación matricial de A es diagonal,

i
e A |ej i = Aij = diag (λ1 , λn , · · · , λn )
4 Realmente un conjunto de vectores linealmente independientes, pero como siempre puedo ortoganalizarlos mediante el
método de Gram Smith, consideraremos que es una base ortogonal de entrada

6.6.2. Algunos comentarios

E

1. Nótese que si |ψi es autovector de A para un determinado autovalor λ entonces ψ̆ = α |ψi (un vector
proporcional a |ψi ,con α un número complejo) también es un autovector para el mismo autovalor.
Esto representa una incómoda ambigüedad: dos autovectores que corresponden al mismo autovalor.
Un intento de eliminarla es siempre considerar vectores |ψi normalizados, i.e. hψ |ψi = 1. Sin embargo
no deja de ser un intento que no elimina la ambigüedad del todo porque siempre queda ángulo de fase
arbitrario. Esto es el vector eiθ |ψi ,con θ un número real arbitrario, tiene la misma norma del vector
|ψi . Sin embargo esta arbitrariedad es inofensiva. En Mecánica Cuántica las predicciones obtenidas
con |ψi son las mismas que con eiθ |ψi
2. Un autovalor λ será no degenerado o simple si está asociado a un único autovector |ψi5 de lo contrario
si denominará degenerado si existen dos o más autovectores de A, linealmente independientes asociados
al mismo autovalor λ. El grado (o el orden) de la degeneración es el número de vectores linealmente
independientes que estén asociados al mencionado autovalor λ.
3. El orden de degeneración de un autovalor λ expande un espacio vectorial S (λ) ⊂ Vn (denominado
autoespacio) cuya dimensión es el orden de la degeneración. Esto es si λ es g−degenerado, entonces
existen
{|ψ1 i , |ψ2 i , |ψ3 i , · · · |ψg i} =⇒ A |ψi i = λ |ψi i
adicionalmente un autovector correspondiente al autovalor λ puede ser expresado como
|ψi = ci |ψi i con i = 1, 2, · · · , g
con lo cual
A |ψi = ci A |ψi i = λ ci |ψi i = λ |ψi
6.6.3. Algunos Ejemplos

E

1. Reflexión respecto al plano xy : Si R :V 3 → V 3 es tal que R |ψi = ψ̃ donde se ha realizado una
reflexión en el plano xy. Esto es
R |ii = |ii ; R |ji = |ji ; R |ki = − |ki
con |ii , |ji , |ki vectores unitarios cartesianos. Es claro que cualquier vector en el plano xy será auto-
vector de R con un autovalor λ = 1 mientras que cualquier otro vector |ψi ∈ V3 y que no esté en
el mencionado plano cumple con |ψi = c |ki y también será autovector de R pero esta vez con un
autovalor λ = −1.
2. Dos visiones de Rotaciones de ángulo fijo θ : La rotaciones de un vector en el plano pueden verse
de dos maneras.
a) Se considera el plano como un espacio vectorial real V2 con una base cartesiana canónica: |ii =
(1, 0) , y |ji = (0, 1) , esto es si
R |ai = λ |ai =⇒ el ángulo de rotación = nπ con n entero

5 Con la arbitrariedad del calibre antes mencionado

b) Igualmente si consideramos el plano complejo unidimensional, expresemos cualquier vector en el

plano en su forma polar |zi = reiθ por lo cual
R |zi = rei(θ+α) = eiα |zi
si queremos λ = eiα reales necesariamente α = nπ con n entero
3. Autovalores y Autovectores de Proyectores. Es interesante plantearse la ecuación de autovalores

con la definición del proyector para un determinado autoespacio. Esto es dado Pψ = |ψi hψ| si este
proyector cumple con una ecuación de autovalores para un |ϕi supuestamente arbitrario
Pψ |ϕi = λ |ϕi =⇒ Pψ |ϕi = (|ψi hψ|) |ϕi =⇒ |ϕi ∝ |ψi
es decir necesariamente |ϕi es colineal con |ψi . Más aún si ahora el |ϕi no es tan arbitrario sino que
es ortogonal a |ψi , hψ |ϕi = 0 =⇒ λ = 0. Esto nos lleva a concluir que el espectro del operador
Pψ = |ψi hψ| es 0 y 1,el primer de los cuales es infinitamente degenerado y el segundo es simple. Esto
nos lleva a reflexionar que si existe un autovector de un determinado operador, entonces su autovalor
es distinto de cero, pero pueden existir autovalores nulos que generan un autoespacio infinitamente
degenerado.
4. El operador diferenciación D |f i → D (f ) = f ′ : Los autovectores del operador diferenciación

necesariamente deben satisfacer la ecuación
D |f i = λ |f i → D (f ) (x) = f ′ (x) = λf (x)
la solución a esta ecuación será una exponencial. Esto es
|f i → f (x) = ceλx con c 6= 0
las f (x) se denominarán autofunciones del operador
6.6.4. Autovalores, autovectores e independencia lineal

Uno de los teoremas más útiles e importantes tiene que ver con la independencia lineal de los autovectores
correspondientes a distintos autovalores de un determinado operador lineal. Este importante teorema se puede
concretar en.
Teorema Sean {|ψ1 i , |ψ2 i , |ψ3 i , · · · |ψk i} autovectores del operador A :V m → V n y suponemos que existen k
autovalores, {λ1 , λ2 , · · · , λk } , distintos correspondientes a cada uno de los autovectores |ψj i . Entonces
los {|ψ1 i , |ψ2 i , |ψ3 i , · · · , |ψk i} son linealmente independientes.
Demostración La demostración de este teorema es por inducción y resulta elegante y sencilla.
Primeramente demostramos que vale j = 1.

Obvio que el resultado se cumple y es trivial para el caso k = 1(un autovector |ψ1 i que corresponde a
un autovalor λ1 es obvia y trivialmente linealmente independiente).
Seguidamente supondremos que se cumple para j = k − 1.
Esto es que si existen {|ψ1 i , |ψ2 i , |ψ3 i , · · · |ψk−1 i} autovectores de A correspondientes a {λ1 , λ2 , · · · , λk−1 }
entonces los {|ψ1 i , |ψ2 i , |ψ3 i , · · · |ψk−1 i} son linealmente independientes.

Ahora lo probaremos para j = k.

Por lo cual si tenemos k autovectores {|ψ1 i , |ψ2 i , |ψ3 i , · · · |ψk i}, podremos construir una combinación
lineal con ellos y si esa combinación lineal se anula serán linealmente independientes
cj |ψj i = 0 con j = 1, 2, · · · , k
al aplicar el operador A a esa combinación lineal, obtenemos
cj A |ψj i = 0 =⇒ cj λj |ψj i = 0
multiplicando por λk y restando miembro a miembro obtenemos
cj (λj − λk ) |ψj i = 0 con j = 1, 2, · · · , k − 1
(nótese que el último ı́ndice es k−1) pero, dado que los k−1 vectores |ψj i son linealmente independiente,
entonces tendremos k − 1 ecuaciones cj (λj − λk ) = 0 una para cada j = 1, 2, · · · , k − 1. Dado que
λj 6= λk necesariamente llegamos a que cj = 0 para j = 1, 2, · · · , k − 1 y dado que
cj |ψj i = 0 con j = 1, 2, · · · , k =⇒ cj 6= 0
con lo cual si
cj |ψj i = 0 =⇒ cj = 0 con j = 1, 2, · · · , k
y los {|ψ1 i , |ψ2 i , |ψ3 i , · · · |ψk i} son linealmente independientes. Con lo cual queda demostrado el
teorema
Es importante acotar que el inverso de este teorema NO se cumple.

Esto es, si A :V m → V n tiene {|ψ1 i , |ψ2 i , |ψ3 i , · · · , |ψn i} autovectores linealmente independientes. NO
se puede concluir que existan n autovalores, {λ1 , λ2 , · · · , λn } , distintos correspondientes a cada uno de los
autovectores |ψj i .
El teorema anterior lo complementa el siguiente que lo presentaremos sin demostración. Este teorema
será de gran utilidad en lo que sigue.
Teorema Si la dim (V n ) = n cualquier operador lineal A :V n → V n tendrá un máximo de n autovalores distintos.

Adicionalmente, si A tiene precisamente n autovalores, {λ1 , λ2 , · · · , λn } , entonces los correspondientes
n autovectores, {|ψ1 i , |ψ2 i , |ψ3 i , · · · , |ψn i} , forman una base para V n y la representación matricial,
en esa base, del operador será diagonal

i
ψ A |ψj i = Aij = diag (λ1 , λ2 , · · · , λn )
6.7. Autovalores y Autovectores de un operador

Una vez más supongamos que A : V → V y que dim V = n, supongamos además que {|e1 i , |e2 i , |e3 i , · · · |en i}
es una base ortogonal para V. Por lo tanto la representación matricial de la ecuación de autovalores es la
siguiente
i

e A |ej i ej |ψi = λ ei |ψi =⇒ Aij cj = λci =⇒ Aij − λδji cj = 0

para con j = 1, 2, · · · , n El conjunto de ecuaciones Aij − λδji cj = 0 puede ser considerado un sistema (lineal
y homogéneo) de ecuaciones con n incógnitas cj .

6.7.1. El polinomio caracterı́stico.

Dado que un sistema lineal y homogéneo de ecuaciones con n incógnitas tiene solución si el determinante
de los coeficientes se anula tendremos que

Aij − λδji cj = 0 =⇒ det [A−λ1] = 0 ⇐⇒ P (λ) = det Aij − λδji = 0
Esta ecuación se denomina ecuación caracterı́stica (o secular) y a partir de ella emergen todos los autovalores
(el espectro) del operador A. Claramente esta ecuación implica que
1
A1 − λ A12 ··· A1n

A21 A22 − λ A2n

.. . . = 0 ⇐⇒ det Aij − λδji = 0
. .

An An An − λ
1 2 n
y tendrá como resultado un polinomio de grado n (el polinomio caracterı́stico). Las raı́ces de este polinomio
serán los autovalores que estamos buscando. Es claro que estas raı́ces podrán ser reales y distintas, algunas
reales e iguales y otras imaginarias.
Es importante señalar que

el polinomio caracterı́stico será independiente de la base a la cual esté referida
la representación matricial wi A |wj i del operador A.
6.7.2. Primero los autovalores, luego los autovectores

El procedimiento es el siguiente. Una vez obtenidos (los autovalores) las raı́ces del polinomio carac-
terı́stico, se procede a determinar el autovector, |ψj i , correspondiente a ese autovalor. Distinguiremos en
esta determinación casos particulares dependiendo del tipo de raı́z del polinomio caracterı́stico. Ilustraremos
estos casos con ejemplos especı́ficos para el caso especı́fico de matrices 3 × 3 a saber:
1. Una matriz 3 × 3 con 3 autovalores reales distintos
 
2 1 3 2−λ 1 3

i i
e A |ej i =  1 2 3  =⇒ det Aj − λδji = 1 2−λ 3 =0

3 3 20 3 3 20 − λ
con lo cual el polinomio caracterı́stico queda expresado como

λ3 − 24λ2 + 65λ − 42 = (λ − 1) (λ − 2) (λ − 21) = 0
y es claro que tiene 3 raı́ces distintas. Para proceder a calcular los autovectores correspondientes a cada
autovalor resolvemos la ecuación de autovalores para cada autovalor. Esto es
a) λ1 = 1   1   1 
2 1 3 x x 2x1 + x2 + 3x3 = x1
 1 2 3   x2 
=  x2 
⇐⇒ x1 + 2x2 + 3x3 = x2
3 3 20 x3 x3 3x1 + 3x2 + 20x3 = x3
que constituye un sistema de ecuaciones algebraicas de 3 ecuaciones con 3 incógnitas. Resolviendo
el sistema tendremos que
 1   
x −1
λ1 = 1 ⇐⇒  x2  = α 1 
3
x λ =1
0
1
con α un escalar distinto de cero

b) λ2 = 2   1   1 
2 1 3 x x 2x1 + x2 + 3x3 = 2x1
 1 2 3   x2 
=2  x2 
⇐⇒ x1 + 2x2 + 3x3 = 2x2
3 3
3 3 20 x x 3x1 + 3x2 + 20x3 = 2x3
Resolviendo el sistema tendremos que
   
x1 −3
λ2 = 2 ⇐⇒  x2  = α  −3 
x3 λ 1
2 =2
c) λ3 = 21
  1   1 
2 1 3 x x 2x1 + x2 + 3x3 = 21x1
 1 2 3   x  = 21  x  ⇐⇒ x1 + 2x2 + 3x3
2 2
= 21x2
3 3 20 x3 x3 3x1 + 3x2 + 20x3 = 21x3

   
x1 1
λ3 = 21 ⇐⇒  x 
2
= α 1 
x3 λ 6
3 =21
2. Una matriz 3 × 3 con 2 autovalores reales distintos, es decir una matriz con autovalores repetidos
 
4 −3 1 4−λ −3 1

i i
e A |ej i =  4 −1 0  =⇒ det Aj − λδji = 4 −1 − λ 0 =0

1 7 −4 1 7 −4 − λ

2
λ3 + λ2 − 5λ − 3 = (λ + 3) (λ − 1) = 0
y es claro que tiene 2 raı́ces iguales y una distinta. En este caso λ = 1 es un autovalor degenerado
de orden 2. Para proceder a calcular los autovectores correspondientes a cada autovalor resolvemos la
ecuación de autovalores para cada autovalor. Esto es:
a) λ1 = −3
  1   1 
4 −3 1 x x 4x1 − 3x2 + x3 = −3x1
 4 −1 0   x2 
= −3  x2 
⇐⇒ 4x1 − x2 = −3x2
1 7 −4 x3 x3 x1 + 7x2 − 4x3 = −3x3

   
x1 −1
λ1 = −3 ⇐⇒  x2  = α 2 
x3 λ 13
1 =−3

b) λ2 = 1 (autovalor degenerado de orden 2)

  1   1 
4 −3 1 x x 4x1 − 3x2 + x3 = x1
 4 −1 0   x2  =  x2  ⇐⇒ 4x1 − x2 = x2
3 3
1 7 −4 x x x + 7x2 − 4x3
1
= x3

   
x1 1
λ2 = 1 ⇐⇒  x2  = α 2 
x3 λ 3
2 =1
3. Otra matriz 3 × 3 con 2 autovalores reales distintos, es decir otra matriz con autovalores repetidos
 
2 1 1 2−λ 1 1

i i
e A |ej i =  2 3 2  =⇒ det Aj − λδji = 2 3−λ 2 = 0
3 3 4 3 3 4−λ
con lo cual el polinomio caracterı́stico ahora queda expresado como

2
λ3 + λ2 − 5λ − 3 = (λ − 7) (λ − 1) = 0
y es claro que tiene 2 raı́ces iguales y una distinta. En este caso λ = 1 vuelve a ser un autovalor
degenerado de orden 2. Para proceder a calcular los autovectores correspondientes a cada autovalor
resolvemos la ecuación de autovalores para cada autovalor. Esto es:
a) λ1 = 7   1   1 
2 1 1 x x 2x1 + x2 + x3 = 7x1
 2 3 2   x  = 7  x  ⇐⇒ 2x1 + 3x2 + 3x3
2 2
= 7x2
3 3 4 x3 x3 3x1 + 3x2 + 4x3 = 7x3
   
x1 1
λ1 = 7 ⇐⇒  x2  = α 2 
x3 λ 3
1 =7
b) λ2 = 1, el autovalor degenerado de orden 2 presenta una pequeña patologı́a. Veamos

    
2 1 1 x1 x1 2x1 + x2 + x3 = x1
 2 3 2  x2  =  x 2 
⇐⇒ 2x1 + 3x2 + 3x3 = x2
3 3 4 x3 x 3
3x1 + 3x2 + 4x3 = x3

  1   
 x 1

  x2 


 = α 0 

 x3
−1
 λ2 =1
λ2 = 1 ⇐⇒  1   



 x 0

  x2 

 =β 1 

x3 λ −1
2 =1

con lo cual el autovector |ψ2 i correspondiente al autovalor λ2 = 1 se podrá escribir como

 1     
x 1 0
|ψ2 i = α |φ21 i + β |φ22 i ⇐⇒  x2  = α 0  + β 1 
3
x λ =1
−1 −1
2
4. Una matriz 3 × 3 con 1 autovalor real y dos autovalores complejos

 
1 2 3 1−λ 2 3

i i

e A |ej i =  3 1 2  =⇒ det Aj − λδj = 3
i
1−λ 2 =0

2 3 1 2 3 1−λ

λ3 − 3λ2 − 15λ − 18 = (λ − 6) λ2 + 3λ + 3 = 0
y es claro que tiene 2 raı́ces iguales y una distinta. En este caso λ = 6 es un autovalor real. Adicio-
√
nalmente existen dos autovalores complejos, uno el complejo conjugado del otro: λ∗ = − 12 3 + i 3
√
y λ̄∗ = − 12 3 − i 3 . Para proceder a calcular los autovectores correspondientes a cada autovalor re-
solvemos la ecuación de autovalores para cada autovalor real. En este caso existe un único autovalor
real λ = 6.   1   1 
1 2 3 x x 4x1 − 3x2 + x3 = 6x1
 3 1 2   x2  = 6  x2  ⇐⇒ 4x1 − x2 = 6x2
3 3
2 3 1 x x x + 7x2 − 4x3 = 6x3
1

  
x1 1
λ = 6 ⇐⇒  x2  = α 1 
x3 λ=6 1
6.8. Autovalores y Autovectores de Matrices Importantes

En esta sección presentaremos autovalores y autovectores de matrices importantes en Fı́sica
6.8.1. Autovalores y Autovectores de Matrices Similares

Supongamos la representación matricial de un determinado operador lineal A : V → V y que dim V = n,
supongamos además que {|e1 i , |e2 i , |e3 i , · · · |en i} y {|w1 i , |w2 i , |w3 i , · · · |wn i} son dos bases ortogonales
para V. Entonces

A |ej i = Alj |el i con Aij = ei A |ej i
y

A |wj i = Ãlj |wl i con Ãij = wi A |wj i
ahora bien, cada uno de los vectores base |ej i y |wj i puede ser expresado en las otras bases {|w1 i , |w2 i , |w3 i , · · · |wn i}
y {|e1 i , |e2 i , |e3 i , · · · |en i} , respectivamente como

|wj i = clj |el i 
m −1
=⇒ |wj i = clj c̃m
l |wm i =⇒ clj c̃m m l m
l = c̃l cj = δj =⇒ c̃m
l = (cl )
m 
|el i = c̃l |wm i

Las cantidades clj son escalares que pueden ser “arreglados” como una matriz. Esa matriz, adicionalmente es
no singular6 por ser una la representación de una transformación lineal que aplica una base en otra. Entonces
además
|wj i = clj |el i =⇒ A |wj i = clj A |el i =⇒ Ãlj |wl i = cm k m k h
j Am |ek i = cj Am c̃k |wh i
| {z }
δjh
con lo cual −1

Ãlj = cm k l
j Am c̃k =⇒ Ãlj = c̃lk Akm cm
j =⇒ Ãlj = clk Akm cm
j
que puede ser expresada en el lenguaje de operadores, finalmente como
−1
i −1
k
Ã = C AC ⇐⇒ w A |wj i = cik e A |em i cm
j
De esta manera hemos demostrado el siguiente teorema.

Teorema Dadas dos matrices, n×n, Alj y Ãij las cuales corresponden a la representación matricial de un operador
A en las bases ortogonales {|e1 i , |e2 i , |e3 i , · · · |en i} y
{|w1 i , |w2 i , |w3 i , · · · |wn i} , respectivamente. Entonces existe una matriz clj , no singular, tal que
−1
i −1
k
Ã = C AC ⇐⇒ w A |wj i = cik e A |em i cm
j
El inverso de este teorema también se cumple. Vale decir

Teorema Si dos matrices n × n, Alj y Ãij , están relacionadas por la ecuación
−1
i −1
k
Ã = C AC ⇐⇒ w Ã |wj i = cik w A |wm i cm
j
donde C es una matriz no singular, entonces Ã y A representan el mismo operador lineal.

Demostración Para proceder a demostrarlo supondremos A : V → V y que dim V = n, supongamos además que
{|e1 i , |e2 i , |e3 i , · · · |en i} y {|w1 i , |w2 i , |w3 i , · · · |wn i} son bases de V de tal forma

|wj i = clj |el i 
m −1
=⇒ |wj i = clj c̃m l |wm i =⇒ clj c̃m m l m
l = c̃l cj = δj =⇒ c̃m
l = (cl )

|el i = c̃m
l |wm i
donde
−1
clj = el |wj i y c̃m m
l = (cl ) = hwm |el i
Supongamos que

A |ej i = Alj |el i con Aij = ei A |ej i
y

Ã |wj i = Ãlj |wl i con Ãij = wi Ã |wj i
al actuar A sobre |wj i tendremos
−1
A |wj i = clj A |el i = clj Akl |ek i = clj Akl c̃m m k l m
k |wm i = c̃k Al cj |wm i = (ck ) Akl clj |wm i
| {z }
hwi |Ã|wj i
que es exactamente la representación matricial de Ã. Con lo cual A ≡ Ã y queda demostrado el

teorema.
“ ”
6 det cij 6= 0

Definición Dos matrices, Akl y Ãij , n × n, se denominará similares si existe una matriz no singular cik tal que
−1
i −1
k
Ã = C AC ⇐⇒ w Ã |wj i = cik w A |wm i cm
j
Podemos juntar los dos teoremas anteriores y afirmar que

Teorema Dos matrices, Akl y Ãij , n × n, similares representan la misma transformación lineal.
Teorema Dos matrices, Akl y Ãij , n × n, similares tienen el mismo determinante.

Demostración La demostración es inmediata y proviene de las propiedades del determinante de un producto:

det Ã = det C−1 AC = det C−1 det (A) det (C) = det (A)
Con lo cual es inmediato el siguiente Teorema

Teorema Dos matrices, Akl y Ãij , n × n, similares tienen el mismo polinomio caracterı́stico y con ello el mismo
conjunto de autovalores
Demostración Es inmediato verificar que
−1
Ã − λ1 = C AC − λ1 = C−1 (A−λ1) C
y dado que

det Ã − λ1 = det C−1 (A−λ1) C = det C−1 det (A−λ1) det (C) = det (A−λ1)
ambas matrices, Ã y A, tendrán el mismo polinomio caracterı́stico y con ello el mismo conjunto de
autovalores.
Todos los teoremas de esta sección pueden ser resumidos en el siguiente teorema
Teorema Sea un operador lineal A : V → V y que dim V = n, supongamos además que el polinomio caracterı́stico
tiene n raı́ces distintas, {λ1 , λ2 , . . . , λn } . Entonces tendremos que
Los autovectores {|u1 i , |u2 i , · · · , |un i} correspondientes a los a {λ1 , λ2 , . . . , λn } , forman una base
para V.

La representación matricial del operador uk A |um i en la base de autovectores
{|u1 i , |u2 i , · · · , |un i}, será diagonal

Ākm = Λkm = uk A |um i = diag (λ1 , λ2 , . . . , λn )

Cualquier otra representación matricial, ek A |em i , del operador A en otra base de V, estará relacio-
nada con la representación diagonal mediante una transformación de similaridad
−1
k
Λ = C−1 AC ⇐⇒ diag (λ1 , λ2 , . . . , λn ) = cik e A |em i cm
j
donde cm
j es la matriz, no singular y por lo tanto invertible, de cantidades que relacionan ambas bases

|uj i = clj |el i 
m −1
⇐⇒ c̃m l = (cl ) =⇒ c̃m l m
l cj = δj

|el i = c̃m
l |um i
Demostración La demostración, en términos de los teoremas anteriores es inmediata y se la dejamos como ejercicio
al lector.

6.8.2. Autovalores y Autovectores de Matrices Hermı́ticas

Tal y como mencionamos con anterioridad un operador Hermı́tico cumple con
i

∗
∗
A† = A =⇒ A† j = ei A† |ej i = ej A |ei i = Aji
Esto es: el hermı́tico conjugado de una matriz, es su traspuesta conjugada. Por lo tanto las matrices Hermı́ti-
cas son simétricas respecto a la diagonal y los elementos de la diagonal son números reales.
Por su parte, llamaremos antihermı́tico a un operador que cumpla con
i

∗
∗
A† = −A =⇒ A† j = ei A† |ej i = − ej A |ei i = − Aji
Teorema Suponga un operador Hermı́tico A = A† tiene por autovalores {λ1 , λ2 , . . . , λn } . Entonces:
Los autovalores {λ1 , λ2 , . . . , λn } son reales.

Los autovectores {|u1 i , |u2 i , · · · , |un i} , correspondientes a cada uno de los autovalores, serán orto-
gonales.
Demostración:
Para demostrar que los autovalores {λ1 , λ2 , . . . , λn } son reales, proyectamos la ecuación de autovalores
en cada uno de los autovectores:
A |ψi = λ |ψi =⇒ hψ| A |ψi = λ hψ |ψi
Ahora bien, dado que hψ |ψi es real, si demostramos que hψ| A |ψi estará demostrado que λ lo será tam-
bién. Pero como A es Hermı́tico
∗
hψ| A |ψi = hψ| A† |ψi = hψ| A |ψi =⇒ hψ| A |ψi ∈ ℜ
y por consiguiente los autovalores {λ1 , λ2 , . . . , λn } son reales. Más aún, si A es Hermı́tico, y como sus
autovalores son reales entonces
hψ| A† = λ∗ hψ| = λ hψ| =⇒ hψ| A |φi = λ hψ |φi
Para demostrar que los autovectores {|u1 i , |u2 i , · · · , |un i} son ortogonales, consideremos dos auto-
vectores con sus correspondientes autovalores de tal forma que se cumplen las siguientes ecuaciones
A |ψi = λ |ψi y A |ϕi = µ |ϕi
pero como A es Hermı́tico entonces se cumple que hϕ| A = µ hϕ| entonces multiplicando a la izquierda
por |ψi y a hψ| A = λ hψ| por hϕ| la derecha.
  
(hϕ| A = µ hϕ|) |ψi   hϕ| A |ψi = µ hϕ |ψi 
=⇒ =⇒ (λ − µ) hϕ |ψi = 0
  
hϕ| (A |ψi = λ |ψi) hϕ| A |ψi = hϕ |ψi
y como hemos supuesto que λ 6= µ con lo cual hϕ |ψi = 0 los autovectores correspondientes a dos
autovalores son ortogonales.

Existen situaciones en las cuales un determinado autovalor λ = λ0 es degenerado. Consideremos una
matriz n × n, Aij , por lo cual el polinomio caracterı́stico P (λ) = det Aij − λδji = 0 tendrá una raı́z
degenerada de orden k ≤ n. Entonces el siguiente teorema garantiza la existencia de, al menos un subespacio
S (λ0 ) ⊂ V n
n n
Teorema Sea un operador
i lineal
i
A : V → V con una representación matricial n × n tal que su polinomio
P (λ) = det Aj − λδj = 0 tiene al menos una raı́z degenerada λ = λ0 , de orden k ≤ n. Entonces
existen k autovectores, no triviales, que cumplen con
A |ψj i = λ0 |ψj i con j = 1, 2, · · · , k
Demostración La demostración también emerge de una variante del Método de Inducción Completa.
Para ello, probamos que se cumple para j = 1. Esta afirmación es obvia. Si existe un λ = λ0 existe
un λ0 existe un |ψj i, tal que cumple con la ecuación anterior el es linealmente independiente con él
mismo.
Suponemos que se cumple para 1 ≤ j = m ≤ k. Es decir existen m autovectores |ψj i de A para el
autovalor λ0 . Definamos un subespacio Sλ0 = S (λ0 ) ⊂ V n donde
|ψj i ∈∈ Sλ0 ∋ A |ψj i = λ0 |ψj i =⇒ A |ψj i ∈ Sλ0 con j = 1, 2, · · · , m, · · · k
por lo tanto podremos separar V n como una suma directa entre el subespacio Sλ0 y, N su complemento
ortogonal
V n = Sλ0 ⊕ N ∋ A |ψj i = λ0 |ψj i ∧ |φi ∈ N =⇒ hφ |ψj i = 0
claramente Sλ0 es un subespacio invariante de A por cuanto su acción se circunscribe dentro del mismo
subespacio Sλ0 . Mostraremos que, para este caso por cuanto no es verdad, en general para operadores
no Hermı́ticos. Entonces

hφ |ψj i = 0 
∧ =⇒ hψj |φi = 0 = hψj | A† |φi = hψj | A |φi

A |ψj i = λ0 |ψj i
de donde se concluye que el vector es ortogonal a Sλ0 y por lo tanto está en el complemento ortogonal,
A |φi ∈ N como, por hipótesis |φi ∈ N . Esto implica que N también es un espacio invariante del
operador Hermı́tico A. Entonces el espacio V n puede expresarse como una suma directa de los dos
subespacios invariantes respecto al operador lineal A V n = Sλ0 ⊕ N y su representación matricial en
la base de autovectores tendrá la forma de una matriz diagonal a bloques:con lo cual
 1  
Q1 · · · Q1m 0 · · · 0 1 ··· 0 0 ··· 0
 .. .. .. .. .   .. . . . .. .. 
 .
 m . . . .. 

 .
 . .. . . 0 


j  Q1 m  
Qm 0 · · · 0   0 · · · 1 0 ··· 0 
u A |ui i = Aji → 
 0   m+1 m+1


 ··· 0 1 0 0   0 · · · 0 Rm+1 · · · Rn 
 . .. . . .   . . . . 
 .. . .. .. . . . ..   .. . . . .. .. ..
. .. 
n
0 ··· 0 0 ··· 1 0 ··· 0 Rm+1 ··· Rnn
donde Qα µ α
β y Rυ son matrices m × m y (n − m) × (n − m) , respectivamente. La matriz Qβ opera en
Sλ0 mientras que Rυµ actúa sobre el complemento ortogonal N . El polinomio caracterı́stico de A puede
expresarse como

P (λ) = det Aij − λδji = 0 =⇒ P (λ) = det Qij − λδji det Rji − λδji = 0


y como λ = λ0 es la raı́z múltiple del polinomio caracterı́stico y que anula el det Qij − λδji tendremos
que m
det Qij − λ0 δji = 0 =⇒ P (λ) = (λ − λ0 ) F (λ) con F (λ0 ) 6= 0
donde λ0 no es raı́z del polinomio F (λ) . Ahora bien, para que se cumpla para j = k el polinomio
caracterı́stico es
k m k
j=k =⇒ P (λ) = (λ − λ0 ) R (λ) =⇒ (λ − λ0 ) F (λ) = (λ − λ0 ) R (λ)
otra vez λ0 no es raı́z del polinomio R (λ) . La ecuación anterior se cumple para todo λ en particular
para λ = λ0 . Por lo tanto
k−m R (λ)
1 = (λ − λ0 )
F (λ)
Es claro que λ = λ0 obliga a k = m
6.8.3. Autovalores y Autovectores de Matrices Unitarias

Tal y como mencionamos anteriormente, un operador será unitario si su inversa es igual a su adjunto.
Esto es
U−1 = U† =⇒ U† U = UU† = 1
dado que los operadores unitarios conservan la norma de los vectores sobre los cuales ellos actúan, i.e.

|x̃i = U |xi 
=⇒ hỹ |x̃i = hy| U† U |xi = hy |xi

|ỹi = U |yi
son naturales para representar cambios de base dentro de un espacio vectorial. De lo anterior se deduce que
si {|e1 i , |e2 i , |e3 i , · · · |en i}es una base ortonormal, el conjunto de vectores transformados, |wj i = U |ej i ,
también son ortonormales:

|wj i = U |ej i =⇒ wi |wj i = wi U |ej i = ei U† U |ej i = δji
Bases y operadores unitarios

Los operadores unitarios aplican vectores base de un espacio vectorial en otra. El siguiente Teorema lo
ilustra
Teorema La condición necesaria y suficiente para que un operador U : V n → V n sea unitario es que aplique
vectores de una base ortonormal {|e1 i , |e2 i , |e3 i , · · · |en i} en otra de {|w1 i , |w2 i , |w3 i , · · · |wn i}
también ortonormal.
Demostración Demostremos primero la condición necesaria: Si es unitario aplica una base en otra. Esto es, supongamos
que los vectores {|ej i} forman una base ortonormal para V n . Sean |ψi , y U† |ψi ∈ V n . Estos vectores
pueden ser expresados en términos de la base {|ej i} de V n . Por lo tanto, si seleccionamos U† |ψi se
cumple que
U† |ψi = cj |ej i =⇒ UU† |ψi = cj U |ej i = cj |wj i =⇒ |ψi = cj |wj i
donde hemos aplicado el operador U a la ecuación U† |ψi = cj |ej i y el resultado es que el otro vector,
|ψi, también se pudo expresar como combinación lineal de los vectores transformados {|wj i} de la
base {|ej i} . Y por lo tanto los {|wj i} también constituyen una base. Es decir, los operadores unitarios

aplican una base ortonormal en otra
La condición de suficiencia (Si aplica una base en otra es unitario) se puede demostrar como sigue. Si
{|ej i} y {|wj i} son bases ortonormales de V n y una es la transformada de la otra implica que
|wj i = U |ej i ; y hwj | = hej | U†
con

ei |ej i = δji ; |ej i ej = 1 wi |wj i = δji ; |wj i wj = 1
Por lo tanto,

U† U |ej i = U† |wj i = |ek i ek U† |wj i = |ek i wk |wj i = |ek i δjk = |ej i

Esto significa que U† U = 1. De un modo equivalente, se puede demostrar que UU† = 1. Veamos:

U† |ej i = |ek i ek U† |ej i = |ek i wk |ej i

y ahora, aplicando el operador U a esta ecuación, tenemos

UU† |ej i = U |ek i wk |ej i = |wk i wk |ej i = |ej i

Esto significa que está demostrado que U es unitario: U† U = UU† = 1.
Matrices unitarias
La representación de una matriz unitaria en una base {|ej i} implica

†
∗
j ∗
Ujk = ek U |ej i ; hem | U |ej i = ej U |em i = Um

X
† j ∗
δjk = ek |ej i = ek 1 |ej i = ek UU† |ej i = ek U |em i hem | U |ej i = k
Um Um
m

X ∗
δjk = ek |ej i = ek 1 |ej i = ek U† U |ej i = ek U† |em i hem | U |ej i = (Ukm ) Ujm
m
Una vez más, dado un operador lineal A, la representación matricial del Hermı́tico conjugado de ese operador
A† es la traspuesta conjugada de la matriz que representa al operador A. En el caso de operadores unitarios.
Con lo cual es fácilmente verificable que una matriz sea unitaria. Basta comprobar que la suma de los
productos de los elementos de una columna (fila) de la matriz con los complejos conjugados de otra columna
(fila). Esa suma de productos será
1. cero si las columnas (filas) son distintas
2. uno si las columnas (filas) son iguales
Ejemplos de matrices unitarias son las llamadas matrices de rotación. Alrededor del eje z tendremos que
 
cos θ − sen θ 0
R (θ) =  sen θ cos θ 0 
0 0 1
y también la matriz de rotación de una partı́cula de espı́n 12 en el espacio de estados
− i (α+γ) i
(1/2) e 2 cos β −e 2 (α−γ) sen β
R (α, β, γ) = i i
e− 2 (α−γ) sen β e 2 (α+γ) cos β
claramente se cumple la regla expuesta arriba.

Autovalores y Autovectores de Matrices Unitarias

Si |ψu i es un autovector, normalizado del operador U correspondiente a un autovalor u tendremos que
norma al cuadrado será igual a
U |ψu i = u |ψu i =⇒ hψ u | U† U |ψu i = 1 = u∗ u hψ u |ψu i = u∗ u =⇒ u = eiϕu
con ϕu una función real. Por lo cual podemos concluir que, necesariamente, los autovalores de los operadores
unitarios Dserán números complejos de módulo 1. Cuando los autovalores son diferentes, digamos u′ 6= u,
′
entonces ψ u |ψu i = 0. Con lo cual los autovectores de un operador unitarios son ortogonales.
Transformación unitaria de Operadores Hemos visto como las transformaciones unitarias permiten
construir bases ortogonales {|ẽm i} para el espacio vectorial V n partiendo de otra base {|em i} también
ortogonal. En esta subsección mostraremos como transforman los operadores lineales bajo transformaciones
unitarias.
Definición Dadas dos bases ortonormales {|ej i} y {|wk i} en V n con |wj i = U |ej i, un operador lineal unitario
U : V n → V n .y un operador lineal A : V n → V n . Definiremos al operador transformado Ã : V n →
V n como aquel cuya representación matricial en la base {|wk i} es la misma que en la base {|ej i}:

j

w Ã |wi i = ej A |ei i
A partir de esta definición es fácil concluir que

†
wj Ã |wi i = ej U† ÃU |ei i = ej A |ei i =⇒ U† ÃU = A ⇐⇒ Ã = UAU
†
Por lo tanto la ecuación Ã = UAU corresponde a la definición de la transformación de un operador A
mediante un operador unitario U† . Es fácil identificar las propiedades de estos operadores transformados.
Veamos
Hermı́tico conjugado y Funciones de un Operador transformado:

† †
]
Ã = UAU† = U† A† U =(A †)
en particular se sigue de esta propiedad que si A = A† , es Hermı́tico también lo será Ã

†
A = A† ⇐⇒ Ã = Ã
Del mismo modo 2

]
Ã = UAU† UAU† = UA2 U† =(A 2)
con lo cual n n−2

]
Ã = UAU† · · · UAU† = UAn U† =(A n) =⇒ F̃ (A) = F Ã
donde F (A) es una función del operador A.

Autovalores y autovectores deEun operador transformado Sera un autovector |φχ i de A corres-

pondiente a un autovalor χ, y sea φ̃χ el transformado de |φχ i mediante el operador unitario U. Entonces
E E

A |φχ i = χ |φχ i =⇒ Ã φ̃χ = UAU† U |φχ i = UA |φχ i = χU |φχ i = χ φ̃χ
E E E

con lo cual es claro que φ̃χ es un autovector de Ã con el mismo autovalor χ : φ̃χ = χ φ̃χ . Equi-
valentemente podemos afirmar que los autovectores transformados de A, serán autovectores del operador
transformado, Ã.
6.9. Conjunto Completo de Observables que conmutan

Definición Diremos que un operador A : V n → V n es un observable si el conjunto de autovectores u i|µ de
un operador Hermı́tico A, forman una base de V n .
D D

A ui (µ) = ai ui (µ) =⇒ ui (µ) ui (µ) = 1 ⇐⇒ ui (µ) uj (ν) = δji δνµ
donde el ı́ndice µ indica el grado de degeneración del autovalor ai .

Un ejemplo trivial de un observable lo constituyen los proyectores, P|ψi = |ψi hψ| con hψ| ψi = 1.
Claramente, la ecuación de autovalores para un proyector obliga a que tenga dos autovalores 0 y 1. El
autovalor nulo es infinitamente degenerado y está asociado a todos los vectores ortogonales a |ψi, mientras
que el autovalor 1 corresponde a un autovalor simple y está asociado a todos los vectores colineales al mismo
vector |ψi. Esto es
P|ψi |ψi = |ψi y P|ψi |φi = 0 si hψ| φi = 0
Más aún, sea un vector arbitrario |ϕi ∈ V n . Siempre se podrá expresar como

|ϕi = P|ψi |ϕi + 1 − P|ψi |ϕi =⇒ P|ψi |ϕi = P|ψi |ϕi + 1 − P|ψi |ϕi =⇒

P|ψi |ϕi = P|ψi P|ψi |ϕi + P|ψi − P2|ψi |ϕi = P|ψi |ϕi =⇒ P|ψi P|ψi |ϕi = P|ψi |ϕi
ya que P2|ψi = P|ψi , por definición de proyector. Entonces, se deduce que P|ψi |ϕi es un autovector de P|ψi

con autovalor 1. Igualmente 1 − P|ψi |ϕi es un autovector de P|ψi con autovalor 0, y la demostración es
inmediata
P|ψi 1 − P|ψi |ϕi = P|ψi − P2|ψi |ϕi = 0
Para el caso de autoespacios correspondientes a autovalores degenerados se puede definir un observable A
de la forma X D

A= ai Pi con Pi = ψ· (µ) ψ · (µ) y µ = 1, 2, · · · , k
i
i
Observables que Conmutan

Teorema Si dos operadores lineales A y B, operadores Hermı́ticos, conmutan, [A, B] = 0,y |ψi es autovector de
A con autovalor a, entonces B |ψi también será autovector de A con el mismo autovalor a.
Demostración La demostración es sencilla
A |ψi = a |ψi =⇒ B (A |ψi = a |ψi) =⇒ BA |ψi = A (B |ψi) = a (B |ψi)

Ahora bien, de esta situación se pueden distinguir un par de casos:

si el autovalor a es no degenerado los autovectores asociados con este autovalor son, por definición,
colineales con |ψi . Por lo tanto B |ψi , será necesariamente colineal con |ψi . La conclusión a esta
afirmación es que NECESARIAMENTE |ψi es autovector de B
si el autovalor a se degenerado, B |ψi ∈ Sa , es decir B |ψi está en el autoespacio Sa con lo cual Sa es
globalmente invariante bajo la acción de B.
Teorema Si dos observables A y B conmutan, [A, B]
= 0, y si |ψ1 i y |ψ2 i son autovectores de A para autovalores
distintos, entonces el elemento de matriz ψ 1 B |ψ2 i = 0
Demostración Si A |ψ1 i = a1 |ψ1 i y A |ψ2 i = a2 |ψ2 i entonces

0 = ψ 1 [A, B] |ψ2 i = ψ 1 AB − BA |ψ2 i = ψ 1 A B |ψ2 i − ψ 1 B (A |ψ2 i)

= a1 ψ 1 B |ψ2 i − a2 ψ 1 B |ψ2 i = (a1 − a2 ) ψ 1 B |ψ2 i =⇒ ψ 1 B |ψ2 i = 0
Teorema Si dos observables A y B, operadores Hermı́ticos, conmutan, [A, B] = 0, los autovectores {|ψi i}
comunes a A y B constituyen una base ortonormal para V n .

Demostración Denotemos los autovectores de A como ψi (µ) , de tal modo

A ψi (µ) = ai ψi (µ) donde i = 1, 2, .., n − kn + 1 y µ = 1, 2, .., kn
kn indica
el orden de la degeneración de un determinado autovalor an . Dado que A es un observable
los ψi (µ) forman base los Claramente,
D
ψ i (µ) ψj (ν) = δji δνµ

y dado que los elementos de matriz ψ i (ν) B ψj (ν) = δji esto quiere decir que los elementos

i (µ)
ψ B ψj (ν) = B i (µ) serán nulos para i 6= j pero no podemos decir nada a priori para el
j (ν)
caso µ 6= υ y i = j. Entonces, al ordenar la base, en general

ψ1 (1) , ψ1 (2) , · · · ψ1 (k ) , ψ2 (1) , ψ2 (2) , · · · , ψ2 (k2 ) , · · · , ψ3 (1) , · · · ψn−kn (1)
1
para el caso que consideraremos será

ψ1 (1) , ψ1 (2) , ψ1 (3) , ψ2 , ψ2 (2) , ψ3 (1) , ψ4 (1) , ψ4 (2) , ψ5 (1)
(1)

y la representación matricial de B en esa base, ψ i (µ) B ψj (ν) , tendrá la forma de una matriz
diagonal a bloques
 1 (1) 1 (1) 1 (1)

B1 (1) B1 (2) B1 (3) 0 0 0 0 0 0
 1 (2) 
 B1 (1) B11 (2)(2) 1 (2)
B1 (3) 0 0 0 0 0 0 
 
 B 1 (3) B 1 (3) B 1 (3) 0 0 0 0 0 0 
 1 (1) 1 (2) 1 (3) 
 2 (1) 2 (1) 
 0 0 0 B B 0 0 0 0 
 2 (1) 2 (2) 
 2 (2) 2 (2) 
 0 0 0 B2 (1) B2 (2) 0 0 0 0 
 
 0 0 0 0 0
3 (1)
B3 (1) 0 0 0 
 
 4 (1) 4 (1) 
 0 0 0 0 0 0 B4 (1) B4 (2) 0 
 
 0 0 0 0 0 0
4 (2) 4 (2)
B4 (1) B4 (2) 0 
 
5 (1)
0 0 0 0 0 0 0 0 B5 (1)

Tal y como hemos mencionado los subespacios: E1 , E2 , y E4 corresponden a los autovalores degenerados
a1 , a2 , y a4 (de orden 3, 2 y 2 respectivamente).
Una vez más surgen dos casos a analizar
Si an es un autovalor no degenerado, entonces existe un único autovector asociado a este autovalor (la
dimensión del autoespacio es 1 esto es kj = 1 y no hace falta). Esto corresponde al ejemplo hipotético
de arriba para los autovalores simples a3 , y a5
Si an es un autovalor degenerado, entonces existe un conjunto de autovectores

asociados a este autovalor
an (en este caso la dimensión del autoespacio es kn ). Como los ψj (µ) son autovectores de A su
representación matricial seré diagonal a bloques. Ahora
bien, como el autoespacio Sa es globalmente
i (µ)

invariante bajo la acción de B y Bj (µ) = ψ i (µ) B ψj (µ) es Hermı́tico, por ser B Hermı́tico entonces

B es diagonalizable dentro del bloque que la define. Es decir, se podrá conseguir una base χj (µ) tal
que la representación matricial de B en esa base es diagonal
D D
i (µ) i (µ)
Bj = ψ i (µ) B ψj (µ) =⇒ χi (µ) B χj (µ) = B̃j (µ) = bj (µ) δji

que no es otra cosa que los vectores χj serán autovectores de B
(µ)

B χj
(µ) = bj (µ) χj (µ)

Es importante recalcar que los autovectores ψj (µ) de A asociados con un autovalor degenerado NO
son necesariamente autovectores de B. Sólo que como B es Hermı́tico puede ser diagonalizado dentro
del autoespacio.
De ahora en adelante
denotaremos los autovectores comunes a dos operadores A y B con distintos
autovalores como u i|j (µ) tal que

A u n|m (µ) = an u n|m (µ) y B u n|m (µ) = bm u n|m (µ)
donde hemos dejado “espacio” para permitir la degeneración la cual será indicada por el ı́ndice µ
La prueba del inverso del teorema anterior es bien simple

Teorema Si existe una base de autovectores uj (µ) comunes a A y B, entonces A y B conmutan, [A, B] = 0
Demostración Es claro que

AB u n|m (µ) = bm A u n|m (µ) = bm an u n|m (µ)

BA u n|m
(µ) = an B u n|m (µ) = an bm u n|m (µ)
restando miembro a miembro obtenemos de manera inmedita

(AB − BA) u n|m (µ) = [A, B] u n|m (µ) = (bm an − an bm ) u n|m (µ) =0
Definición Diremos que {A, B, C, D · · ·} constituye un conjunto completo de observables que conmuntan si
1. Obviamente los operadores del conjunto conmuntan entre ellos:

[A, B] = [A, C] = [A, D] = [B, C] = [B, D] = [C, D] = · · · = 0

2. Al especificar el conjunto de autovalores para los operadores

{an , bm , ck , dl , · · ·} se especifica de manera unı́voca un único autovetor común a todos estos
operadores
{an , bm , ck , dl , · · ·} =⇒ u n|m|k|l··· (µ)
Analicemos los siguientes ejemplos. Considere, que el espacio de estados para un determinado sistema
fı́sico viene expandido por una base ortonormal {|u1 i , |u2 i , |u3 i}. Definimos dos operadores Lz y S de la
siguiente manera
Lz |u1 i = |u1 i ; Lz |u2 i = 0; Lz |u3 i = − |u3 i

S |u1 i = |u3 i ; S |u2 i = |u2 i ; S |u3 i = |u1 i
En la base ortonormal {|u1 i , |u2 i , |u3 i} las representaciones matriciales para Lz , L2z , S y S2 serán las siguien-
tes
   

i 1 0 0
i 2 1 0 0
u Lz |uj i =  0 0 0  , u Lz |uj i =  0 0 0 
0 0 −1 0 0 1
   

i 0 0 1
i 2 1 0 0
u S |uj i =  0 1 0 , u S |uj i =  0 1 0 
1 0 0 0 0 1
Es claro que estas matrices son reales y simétricas y, por lo tanto, son Hermı́ticas y, al ser el espacio de
dimensión finita, deben ser diagonalizables y sus autovectores formarán base para ese espacio. Por lo tanto,
Lz , L2z , S y S2 son observables.
¿ Cuál será la forma más general de una representación matricial de un operador que conmunte con Lz ?
Notamos que los vectores de la base ortonormal {|u1 i , |u2 i , |u3 i} son autovectores para Lz con autovalores
{1, 0, −1} con lo cual su representación matricial tiene que ser diagonal. Recuerde que si dos observables A
y B conmutan, [A,
B] = 0, y si |ψ1 i y |ψ2 i son autovectores de A para autovalores distintos, entonces el
elemento de matriz ψ 1 B |ψ2 i = 0, con lo cual
 

i M11 0 0
[M, Lz ] = 0 ⇔ u M |uj i =  0 M22 0 ,
0 0 M33
Esto se desprende de manera directa de

0 = ui [M, Lz ] |uj i = ui MLz − Lz M |uj i = (λj − λi ) ui M |uj i con (λj − λi ) 6= 0 para i 6= j
Si nos planteamos la misma pregunta para L2z , vemos que sus autovalores son {1, 0}. Esto es
L2z |u1 i = |u1 i ; L2z |u2 i = 0; L2z |u3 i = |u3 i ;
con lo cual tendremos que la representaci’on matricial para ese operador que conmute con L2z , no es diagonal.
Esto es  1 

i N1 0 N31
2
[N, Lz ] = 0 ⇔ u N |uj i =  0 N22 0  ,
N13 0 N33

ya que

0 = u1 [N, L2z ] |u3 i ⇒ u1 N |u3 i = u1 N |u3 i
y vale para cualquier elemento N31 (y equivalentemente para N13 ). Adicionalmente, si ordenamos la base de
autovectores de Lz , como {|u1 i , |u3 i , |u2 i} tendremos como representaci’on matricial diagonal a bloques,
correspondiente a un autorvalor degenerado 1,
 1 

i N1 N31 0
u Ñ |uj i =  N13 N22 0  ,
0 0 N33
Finalmente, la representaci’on matricial, m’as general, de un operador que conmute con S 2 es
 1 

P1 P21 P31
[P, S2 ] = 0 ⇔ ui P |uj i =  P12 P22 P32  ,
N13 P23 P33
Ahora intentaremos construir una base com’un de autovectores para L2z y S. Para ello notamos que |u2 i
es un autovector com’un a L2z y S, por lo tanto existir’a un subespacio expandido por {|u1 i , |u3 i}. En ese
subespacio las respresentaciones matriciales para L2z y S, ser’an

i 2 1 0
i 0 1

u Lz |uj iS13 =
u S |uj iS13 =
0 1 1 0
Acto seguido planteamos el problema de autovalores para S, esto es

√1
 |q2 i = 2
(|u1 i + |u3 i)
0 1 q1 q1
S |qj i = λj |uj i ⇒ =λ ⇒
1 0 q2 q2  √1
|q3 i = 2
(|u1 i − |u3 i)
con lo cual tendremos

Autovectores Autovalor L2z Autovalor S
|q1 i = |u2 i 0 1
|q2 i = √12 (|u1 i + |u3 i) 1 1
|q3 i = √12 (|u1 i − |u3 i) 1 -1
Cuadro 6.1: Dado que no hay l’ineas repetidas L2z y S forman un CCOC
Figura 6.1: Osciladores armónicos acoplados
Consideremos otro ejemplo proveniente de la Mecánica Clásica. Se trata de dos osciladores armónicos,
de igual masa, acoplados con resortes con la misma constante elástica k 7 . La ecuaciones de movimiento para
7 Pueden consultar una animación bien interesante y simular en http://qbx6.ltu.edu/s_schneider/physlets/main/
coupledosc.shtml

este sistema son

mẍ1 + kx1 − k(x2 − x1 ) = 0 y mẍ2 + kx2 + k(x2 − x1 ) = 0
con lo cual podremos expresar esta ecuación en forma de operadores
2
!
d
m dt2 + 2k −k x1
D |xi = 0 ⇔ d2
=0
−k m dt2 + 2k
x2
Si pensamos esta ecuación como una ecuación de autovalores, el autovalor es claramente λ = 0 y como las
masas y las constantes elásticas son iguales podemos intercambiar las partı́culas y la fı́sica (las ecuaciones
de movimiento) no cambian. Esto se puede expresar matemáticamente como el operador permutación de las
partı́culas 1 2
0 1 0 1 x x
P= ⇒ =
1 0 1 0 x2 x1
Es inmediato comprobar que [D, P] = 0 con lo cual existirá una combinación lineal de autovectores de D
(asociados con el autovalor λ = 0 ) los cuales también serán autovectores de P. Para ello procedamos a
calcular los autovalores y autovectores de P

−λ 1
P |xi = λ |xi ⇒ = 0 ⇒ λ ± 1 ⇔ |u1 i = √1 1
; |u i = √
1 1
.
1 −λ 2 1 2
2 −1
fácilmente podemos expresar el vector posición como una combinación lineal de estos dos autovectores de P.
Esto es  1
1  ξ1 = √2 (x1 + x2 )
x ξ1 1 ξ2 1
=√ +√ ⇒
x2 2 1 2 −1 
ξ2 = √12 (x1 − x2 )
Es claro que
1 1 1 1
|u1 i = √ (x1 + x2 ) ; y |u2 i = √ (x1 − x2 ) .
2 1 2 −1
son autovectores de P y D

Bibliografı́a
[2] Arfken, G. B. y Weber, H. (2000) Mathematical Methods for Physicists 5ta Edición (Academic
Press, Nueva York)
[3] Cohen-Tannoudji, C., Diu B. y Laloë (1977) Quantum Mechanics Vol 1 (John Wiley Interscience,
Nueva York )
[4] Gelfand, I.M. (1961) Lectures on Linear .Algebra (John Wiley & Sons Interscience, Nueva York ).
[5] Jordan, T.F. (1969) Linear Operator for Quantum Mechanics (John Wiley & Sons Interscience,
Nueva York ).
Londres)
241
Capı́tulo 7
Serie de Series
242
7.1. Series por todos lados

Las series o sucesiones se nos presentan casi por todos lados en Fı́sica. Cuando no sabemos resolver un
problema analı́ticamente, lo más cercano serán las soluciones por series, por cuanto las series nos ayudarán
a definir funciones y a estudiar su continuidad o derivabilidad.
Representaremos unas serie como
i
X
i=N =⇒ la serie es finita con N elementos
Si = an
i→∞ =⇒ la serie es infinita
n=1
Nos van a interesar las series infinitas, ellas contienen a las series finitas a las cuales llamaremos sumas
parciales. Una serie infinita S∞ la podremos separar en sumas parciales finitas Si , y si la suma parcial
converge a un número finito S cuando i → ∞ diremos que la serie converge. Si no, diremos que diverge. Se
dirá que la serie diverge si el valor de la sumatoria aumenta indeteniblemente, pero también puede oscilar,
con lo cual tampoco converge.
i
X
Si = (−1)n = 1 − 1 + 1 − 1 + · · · + (−1)i + · · ·
n=1
Esto se puede formalizar un poco diciendo que la condición para la existencia de un lı́mite S es que para
cada ǫ > 0 existe un número N = N (ǫ) tal que
kS − Si k < ǫ para i > N ⇒ kSj − Si k < ǫ para, todo i, j > N
Esta afirmación se denomina criterio de Cauchy 1 sobre la convergencia de las series parciales. Esto es, la
condición necesaria y suficiente para que una suma parcial Si converja y quiere decir que las sumas parciales
convergen a medida que avanzamos en los términos de la serie.
7.1.1. La Suma de la Serie

De las series nos intereserá conocer cuanto suman. Es decir, cuál es el valor de Si para una serie finita
cuando i = N Pero también estaremos interesados en conocer cuánto suma una serie infinita. Empecemos
con las finitas.
Las Series de Siempre

De siempre hemos conocido algunas series emblemáticas
Serie aritmétrica Desde siempe hemos oı́do hablar de progresiones aritméticas. Ellas son, sencillamente
N
X −1
SN = (a + nd) = a + (a + d) + (a + 2d) + (a + 3d) + (a + 4d) + · · · + [a + (N − 1)d] .
n=0
Es fácil comprobar que al desarrollar la serie en orden inverso y sumar ambas

SN = a +(a + d) +(a + 2d) +(a + 3d) +··· + [a + (N − 1)d]
SN = [a + (N − 1)d] + [a + (N − 2)d] + [a + (N − 3)d] + [a + (N − 4)d] + · · · +a
1 Augustin Louis Cauchy Paris, 1789 - 1857, matemático francés pionero en los estudios de análisis (real y complejo) y de la
Teorı́a de los Grupos de Permutación. Cauchy hizo aportes importantes en los criterios de convergencia y divergencia de series
infinitas, ası́ como tambien, en ecuaciones diferenciales, determinantes, probabilidades y Fı́sica Matemática

Con lo cual
N N
SN = [a + a + (N − 1d)] → SN = [Primer Término + Ultimo Término]
2 a
obviamente, si N → ∞ la serie diverge.
Serie Geométrica De ésta también sabemos desde siempre....

N
X
SN = a + ar + ar2 + ar3 + · · · + arN −1 = ari
i=0
y si restamos
SN = a +ar +ar2 +ar3 +··· +arN −1
rSN = ar +ar2 +ar3 +ar4 +··· +arN
también es inmediato comprobar que si krk < 1
a(1 − rN ) a
SN = con lo cual tendremos que la suma de la serie seráS = lı́m SN =
1−r N →∞ 1−r
y, divergerá (u oscilará) si krk > 1
Series Aritmético-geométricas Estas series, un poco más exóticas y como su nombre lo sugiere son
una combinación de las anteriores. Estos es
N
X −1
SN = a + (a + d)r + (a + 2d)r2 + (a + 3d)r3 + (a + 4d)r4 + · · · + [a + (N − 1)d] rN = (a + nd)rn
n=0
y con la misma estrategia de las geométricas se llega a encontrar el valor de su, nada intuitiva, suma
a − [a + (N − 1)d] rN rd(1 − rN −1 )
SN = +
1−r (1 − r)2
Otra vez, si si krk < 1 entonces cuando N → ∞
a rd
S= +
1 − r (1 − r)2
Ejercicios Algunos ejercicios (respectivos) de las situaciones anteriores lo constituyen

1. Encuentre la suma de los 100 primeros enteros
2. Encuentre la distancia total que recorre una pelota que rebota verticalmente y que en cada rebote
pierde 2/3 de su energı́a cinética
5 8 11
3. Encuentre la suma de la serie S = 2 + 2 + 4 + 8 + ···

Serie Armónica Quizá no la conocı́amos con este nombre (y menos por sus propiedades) pero seguro nos
la hemos tropezado
∞
X
1 1 1 1 1 1
1 + + + + + ··· + ··· =
2 3 4 5 n n=1
n
Esta serie es engañosa, en apariencia parece converger, pero no es ası́. Si analizamos con más cuidado,
veremos que hay sutilezas
X∞
1 1 1 1 1 1 1 1 1 1 1
=1+ + + + + + + + + + ··· + +···
n 2
|{z} 3 4 5 6 7 8 9 10 16
n=1 | {z } | {z } | {z }
s0 s1 s2 s3
y puede ser reescrita como

n
X 2
1 1 1 1 1 1 1 1 1 1 1
1+ + + + + + + + + + ··· + + · · ·+ n
+· · ·
1+1 2+1 2+2 4+1 4+2 4+3 4+4 8+1 8+2 8+8 2 +j
| {z } | {z } | {z } | {z } j=1
s0 s1 s2 s3
con lo cual
1 7 1 533 1 95549 1
s0 = ; s1 = > ; s2 = > ; s3 = > ;
2 12 2 840 2 144144 2
y claramente diverge ya que
1 1 1 1
1 + s0 + s1 + s2 + s3 + · · · > 1 + + + + + ···
2 2 2 2
Nicole D’Oresme2 . Una de las generalizaciones de la serie harmónica
Esta prueba aparentemente se le debe a P
∞
es la función Zeta de Riemann ζ(p) = n=1 np , la cual analizaremos más adelante en la sección 7.1.3.
3
El método de la diferencia
PN
A veces para una serie SN = n=1 an uno encuentra que para el término n-ésimo an = f (n) − f (n − 1)
para alguna función. En ese caso es inmediato demostrar
N
X N
X m
X m
X
SN = an = f (N ) − f (0) ⇒ SN = an = f (N − k + 1) − f (1 − k) (7.1)
n=1 n=1 i=1 i=1
más aún, se puede ir más allá. Si identificamos que el término n-ésimo tiene la forma de an = f (n)−f (n−m)
es fácilmente demostrable que la suma de la serie se puede escribir como la segunda ecuación de (7.1). Hay
que hacer notar que el argumento n − m puede ser positivo o negativo. Con lo cual el método de la diferencia
resulta versátil y muy útil cuando se requiere encontrar la suma de series de variada dificultad
2 Nicole D’Oresme (1323-1382) Matemático francés que inventó la geometrı́a coordenada antes de Descartes. Más deta-
lles en http://www-history.mcs.st-and.ac.uk y más detalles sobre la serie harmónica en http://mathworld.wolfram.com/

HarmonicSeries.html
3 Georg Friedrich Bernhard Riemann 1826 Hanover, Alemania - 1866 Selasca, Italia, Matemático alemán cuyas ideas
sobre las geometrı́a del espacio han tenido un profundo impacto en el desarrollo de la Fı́sica Teórica. Igualmente clarificó la
noción de integral al introducir el concepto de lo que hoy se conoce como integral de Riemann.
Más detalles en http://www-history.mcs.st-and.ac.uk

Ası́, la suma de la serie

N
X
1 1 1 1 −1
SN = → an = = − → f (n) =
n=1
n(n + 1) n(n + 1) n+1 n n+1
se podrá expresar como

−1 N
SN = f (N ) − f (0) = +1=
N +1 N +1
También siguiendo la estrategia de la expansión en fracciones simples se puede encontrar que
XN
1 1 1 1 −1
SN = → an = =− − → f (n) =
n=1
n(n + 2) n(n + 2) 2(n + 2) 2n 2(n + 2)
de forma y manera que

3 1 1 1
SN = f (N ) + f (N − 1) − f (0) − f (−1) = − +
4 2 N +2 N +1
Con alguna frecuencia surgen las series de números naturales. La más simple es
N
X N (N + 1)
SN = 1 + 2 + 3 + · · · + N = n= una serie aritmétrica de razón d = 1
n=1
2
o también más interesante puede ser la serie de cuadrados de números enteros

N
X N (N + 1)(2N + 1)
SN = 1 + 22 + 32 + · · · + N 2 = n2 =
n=1
6
Este resultado, nada intuitivo, surge de la aplicación ingeniosa del método de la diferencia. Tal y como hemos
dicho, se trata de encontrar que el elemento genérico de la serie an = f (n) − f (n − 1) = n2 para alguna
función. Suponga una función del tipo
f (n) = n(n + 1)(2n + 1) ⇒ f (n − 1) = (n − 1)n(2n − 1) ⇒ f (n) − f (n − 1) = 6n2
con lo cual
N (N + 1)(2N + 1) f (N ) − f (0) N (N + 1)(2N + 1)
an = n2 = ⇒ SN = =
6 6 6
PN P 2
N N 2 (N +1)2
Ejercicio Muestre que SN = 1 + 23 + 33 + · · · + N 3 = n=1 n3 = n=1 n = 4
Sumando por analogı́a

Como siempre, intentaremos proceder por analogı́a. La intención es expresar una serie complicada como
sumas de series conocidas. Considere el siguiente ejemplo
N N N
! N
! N
!
X X X X X
2 2
SN = (n + 1)(n + 3) = n + 4n + 3 = n + 4n + 3
n=1 n=1 n=1 n=1 n=1
con lo cual

N (N + 1)(2N + 1) N (N + 1) N (2N 2 + 15N + 31)
SN = + + (3N ) =
6 2 6

7.1.2. Algebra Elemental de Series

Las series se suman, se igualan y se multipilican. Para ello es importante
P∞ que tengamos
P∞ cuidado con los
ı́ndices y sus valores. Consideremos un par de series infinitas S∞ = n=0 an y S̃∞ = n=0 bn con lo cual la
suma de esas series será
X∞ ∞
X ∞
X
S∞ + S̃∞ = an + bn = (an + bn )
n=0 n=0 n=0
Los ı́ndices son mudos y se acomodan para ser sumados. Para sumar series es imperioso que los ı́ndices de
cada serie comiencen con el mismo valor esto es
P∞ 
S∞ = n=0 an  X∞ X ∞ X∞ X∞
P∞ ⇒ an + b j = (an−1 + b n ) = a0 + (an + bn )

S̃∞ = n=1 bn n=0 j=1 n=1 n=1
nótese que hemos hecho j = n y n = n − 1.

Algo parecido ocurre cuando las series se igualan
∞
X ∞
X ∞
X ∞
X ∞
X
bn = nan ⇒ bn = (k + 1)ak+1 ⇐⇒ ((n + 1)an+1 + bn ) = 0
n=0 n=1 n=0 k=0 n=0
Para finalizar se puede comprobar que las series y también se pueden multiplicar
"∞ #" ∞ #
h i X X ∞
X
[S∞ ] S̃∞ = an bn = cn donde cn = a0 bn +a1 bn−1 +· · ·+aj bn−j +· · ·+an−2 b2 +an−1 b1 +an b0
n=0 n=0 n=0
7.1.3. Criterios de Convergencia

Sólo podremos calcular la suma de algunas series, en la mayorı́a nos será imposible y nos tendremos que
conformar con saber si convergen o no, o peor aún, si una suma parcial converge sin poder calcular el valor
de esa suma. Los términos de una serie pueden ser positivos, negativos o números complejos y las series
pueden converger (decrecer o crecer hacia un valor finito) diverger (incrementar o decrecer indefinidamente)
u oscilar, Existen una serie de criterios y teoremas de aplicación general que expondremos a continuación.
Convergencia Absoluta o Condicional

Pi
Para estudiar la convergencia de una serie dada i.e. n=1 ai siempre podremos asociarle otra de la forma
Pi
n=1 kai k, es decir la serie de valores absolutos, con lo cual garantizamos
Pi
la positividad (y que sean números
reales) de los términos de la serie. Si la serie de los valores absolutos n=1 kai k converge, entonces también
Pi
covergerá la serie original n=1 ai y diremos que esa serie es absolutamente convergente. Sin embargo si la
Pi
serie de valores absolutos diverge, no podremos decir que n=1 ai siempre converja. De hecho si converge
diremos que es condicionalmente convergente y, con un rearreglo de sus términos podrá converger, diverger
u oscilar.
Para una serie de términos positivos el criterio de convergencia más intuitivo (necesario pero no suficiente)
es que en lı́mite cuando n → ∞ el término nésimo tienda a cero, i.e. lı́mn→∞ an = 0. Con lo cual tenemos
que si esta condición no se satisface, la serie diverge.

Criteterio de Comparación
En segundo lugar de simplicidad está el criterio de comparación entre un par de series de términos
positivos. Si conocemos el comportamiento de una
P∞ de ellas comparamos el de la otra. Esto es, suponga que
consideremos dos serie, una de prueba S∞ = n=0 an y una serie conocida y convergente (o divergente)
P∞
S̃∞ = n=0 an , entonces
∞
X ∞
X ∞
X
Si S̃∞ = añ converge y ∀n se tiene que añ > an ⇒ añ > an ⇒ S∞ converge
n=0 n=0 n=0
Por otro lado

∞
X ∞
X ∞
X
Si S̃∞ = añ diverge y ∀n se tiene que 0 6 añ 6 an ⇒ añ 6 an ⇒ S∞ diverge
n=0 n=0 n=0
Para ilustrar esta estrategia consideremos las siguientes series

X∞
1 1 1 1 1
S∞ = + + + + ··· =
2 3 7 25 n=1
n! +1
En ese caso compararmos con con una serie conocida

X∞
1 1 1 1 1 1 1
= + + + + ··· = 1 + 1 + + + ··· = 1 + e
n=0
n! 0! 1! 2! 3! | 2! {z3! }
e
y es claro que la serie indicada no es otra cosa que e, con lo cual la serie claramente converge y su suma es
1 + e.
Criterio de la Raı́z
P∞
Dada una serie de términos positivos S∞ = n=0 an , el criterio de la raı́z (o también de la raı́z de
Cauchy) puede resumirse en el siguiente par de afirmaciones. Si
1
(an ) n 6 ρ < 1 para un valor de n suficientemente grande y ρ independiente de n =⇒ converge
1
(an ) n > 1 para un valor de n suficientemente grande y ρ independiente de n =⇒ diverge
1
(an ) n = 1 para un valor de n suficientemente grande y ρ independiente de n =⇒ diverge o converge
Otra forma, más compacta de expresarlo serı́a


 ρ < 1 =⇒ converge


1

Si ρ = lı́m (an ) n entonces, si ρ > 1 =⇒ diverge
n→∞ 




ρ = 1 =⇒ converge o diverge
Es fácil ver que si utilizamos el criterio de comparación, entonces

1
 cuando ρ < 1 la serie converge
(an ) n 6 ρ ⇒ an 6 ρn ⇒

cuando ρ > 1 la serie diverge

Criterio de D’Alembert
P∞ 4
Dada una serie de términos positivos S∞ = n=0 an , el criterio de D’Alembert o también llamado
criterio del cociente, compara el valor relativo de un término de la serie con el que le precede. Este criterio
se resume también fácilmente

 ρ < 1 =⇒ converge




an+1
Si ρ = lı́m entonces, si ρ > 1 =⇒ diverge
n→∞ an 




ρ = 1 =⇒ indeterminado
Nótese que si
an+1
ρ<1 ⇒ρ<r<1 ⇒ <r ⇒ an+1 = an r
an
Entonces para un N < n pero también suficientemente grande, tendremos que los términos de la serie a
partir de ese N serán

aN + aN +1 + aN +2 + aN +3 · · · = aN + raN + r2 aN + r3 aN · · · = aN 1 + r + r2 + r3 + r4 · · ·
y que no es otra cosa que una serie geométrica con razón r < 1 y por consiguiente converge. Es claro que un
argumento similar se puede utilizar para probar la divergencia.
Un ejemplo inmediato lo constituye la serie
∞
1 1 3 1 5 X n n+1
1 n+1 n+1
1
2n+1 2n+1
+ + + + + ··· = n
⇒ n = · ⇒ ρ = lı́m n = <1
2 2 8 4 32 n=1
2 2n
2 n n→∞
2n
2
con lo cual tiene converger.
Criterio de la Integral de Maclaurin

El criterio de la Integral de Maclaurin5 es otro criterio de comparación, pero esta vez se compara la serie
con una integral. Ası́ supondremos que existe una funciı́on f (x) contı́nua y monótonamente decreciente para
un valor de x > x0 y que, adicionalmente, se cumple que para algún valor entero x = n el valor de la función
RN
es igual a un término de la serie.
P∞ Esto es f (n) = an . Entonces se tendrá que si el lı́mite de lı́mN →∞ dx f (x)
existe y es finito, entonces n=1 an converge. Por el contrario si el lı́mite no existe o es infinito, entonces
diverge.
La idea de este criterio es comparar la integral de f (x) (es decir, el área bajo la curva) con la suma de
rectángulos que representa la serie. Entoces, la suma parcial
 R i+1 
Xi X i  si > 1 dx f (x)  Z i+1 Z i
si = an ≡ f (n) Pero, ⇒ dx f (x) ≤ si ≤ dx f (x) + a1
 Ri  1 1
n=1 n=1 si − a1 < 1 dx f (x)
4 Jean Le Rond D’Alembert Parı́s, Francia 1717 - 1783 Matemático francés pionero en el estudio de las ecuaciones
diferenciales y su utilización en la Fı́sica, en particular en el estudio de los fluı́dos

Más detalles en http://www-history.mcs.st-and.ac.uk
5 Colin Maclaurin 1698, Argyllshire, Escocia - 1746 Edinburgo, Escocia. Matemático escocés quien escribió el Tratado de
los Fluxiones el primer tratado que expuso de una manera sistemática y rigurosa el cálculo diferencial ideado por Newton. Este
tratado fue como respuesta a la crı́tica de Berkeley sobre la falta de rigurosidad de los métodos Newton

P∞
con lo cual, al hacer i → ∞ tendremos que si el lı́mite de la integral existe, entonces la serie n=1 an
converge.
Z ∞ ∞
X Z ∞
dx f (x) ≤ an ≤ dx f (x) + a1
1 n=1 1
Un ejemplo inmediato podrı́a ser determinar si la siguiente serie converge

∞
X Z N
1 1 1 −1
⇒ f (x) = ⇒ lı́m dx = lı́m =0
3 2 3 2 N →∞ 3 2 N →∞ N − 32
n=1 n− 2 x− 2 x− 2
con lo cual claramente converge

Este criterio es muy útil para acotar (entre un ı́nfimo y un supremo) el residuo de una determinada serie.
Vale decir
∞
X N
X ∞
X Z ∞ ∞
X Z ∞
an = an + an ⇒ dx f (x) ≤ an ≤ dx f (x) + aN +1
n=1 n=1 n=N +1 N +1 n=N +1 N +1
| {z }
Residuo
P∞
El otro ejemplo, más elaborado es comprobar que la función Zeta de Riemann, ζ(p) = n=1 n−p , efecti-
vamente converge. En este caso f (x) = x−p , entonces
 −p+1 ∞
Z 
X∞ ∞  x−p+1 Para p 6= 1
−p −p 1
ζ(p) = n ⇒ dx x =
1 
 ∞
n=1
ln x|1 Para p = 1
y
Pes claro que para p > 1 el lı́mite existe y es finito, por lo tanto, la función Zeta de Riemann, ζ(p) =
∞ −p
n=1 n , converge para p > 1
Series alternantes y convergencia condicional

P∞
Hasta ahora todos los criterios que analizamos eran para una serie de términos positivos S∞ = n=0 an
por
P∞ lo cual todos esos criteriosP nos llevaban al concepto de series absolutamente convergente. Esto es, si
∞
n=0 kan k converge, entonces n=0 an también converge. Sin embargo, muchas veces nos tendremos que
conformar con que una serie sea simplemente convergente y no requerir que sea absolutamente convergente.
Este es el caso de las series alternantes. Series en las cuales se alternas términos positivos y negativos. Son
series del tipo
∞
X
a1 − a2 + a3 − a4 + a5 − a6 + · · · + a2n−1 − a2n + · · · = (−1)n+1 (an ) con an ≥ 0
n=1
Entonces 

 an → 0 cuando n → ∞


∞
X 
(−1)n+1 (an ) converge, si ∧


n=1 


an > an−1 ∀ n>N
De otro modo la serie oscilará

Estas condiciones son fáciles de ver si reorganizamos la serie de los primeros 2m términos, a partir de un
determinado N par y N > n, entonces
s2m = (aN − aN −1 ) + (aN −2 − aN −3 ) + · · · + (aN +2m−2 − aN +2m−1 )
donde todos los paréntesis son positivos, con lo cual s2m > 0 y se incrementa al incrementar m. Ahora bien,
si rearreglamos la serie tendremos que
s2m = aN − (aN −1 − aN −2 ) − (aN −3 − aN −3 ) + · · · − (aN +2m−1 − aN +2m−2 ) − aN +2m−1
y, otra vez los paréntesis son positivos y es inmediato comprobar que entonces s2m < an para todo m. Como
an → 0 cuando n → ∞, la serie alternante necesariamente converge.
7.2. Series de potencias

El siguiente paso en este estudio, será el ampliar la idea de serie al permitir que sus términos sean
función de alguna variable (una o varias), esto es an = an (x). Esta extensión del concepto se serie, trae como
consecuencia que ahora las sumas parciales dependen de x
n
X ∞
X
sn = sn (x) = ak (x) = a0 (x) + a1 (x) + a2 (x) + · · · con lo cual, si lı́m sn (x) = S(x) = ak (x)
n→∞
k=1 k=1
Entonces, el comportamiento de las serie también dependerá de la variable. Ahora la convergencia de la serie
podrá ser posible para algunos valores de x y no para otros. El punto central con las en las series de funciones
f (x)(complicadas) es la tratar de construir funciones como una serie de funciones, ak (x), más simples. Ası́,
esas sumas parciales fn (x) constituirán la función deseada
n
X ∞
X n
X
fn (x) = ak (x) ⇒ f (x) = ak (x) = lı́m ak (x)
n→∞
k=1 k=1 k=1
Es decir estaremos interesados en aquellas funciones a las cuales converjan las sumas parciales de una serie.
Si bien más adelante abordaremos este concepto haciéndolo extensivo a cualquier función, para fijar con-
ceptos, comenzaremos por las series de funciones más comunes: Las series de potencias. Esto es, asimilaremos
una serie de potencias an = cn xn a un polinomio de grado infinito.
∞
X ∞
X n
P (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · = cn xn o también P (x − x0 ) = cn (x − x0 )
n=0 n=0
Esta asociación tiene la ventaja de permitirnos intuir algunos comportamientos de la serie para algunos
valores de x. Los coeficientes cn son números independientes
P∞ de x. Pero, más aún, estas series pueden ser
series de potencias de número complejos. Vale decir, n=0 cn z n con z = x + iy
7.2.1. Convergencia de una serie de potencias

Claramente,
P∞ podremos utilizar todos los criterios que hemos desarrollado
P∞ anteriormente. Ası́ una serie de
n n
potencias n=0 an (x − x0 ) converge en un punto x0 si el lı́mm→∞ n=0 an (x − x0 ) existe, para x = x0 ;
para todo x o para algunos x

P∞ n
Una serie de potencias n=0 cn (x − x0 ) convergerá absolutamente sı́ el
n
X
j
lı́m cj (x − x0 ) = l
n→∞
j=0
P∞ n
existe.
P∞También se cumplirá el criterio de convergencia absoluta. Esto era, si n=0 kcn (x − x0 ) k converge
n
⇒ n=0 cn (x − x0 ) converge, pero el inverso no es siempre verdad.
Los criterios más populares para evaluar la convergencia, se seguirán cumpliendo. Ası́ el criterio de
Dálembert y el de la raı́z de Cauchy se podrán reescribir como:

c n+1
 
n+1 (x − x0 ) 
lı́mn→∞ n =l   l(x) < 1 ⇒ converge
cn (x − x0 )
⇒

 
p n

 l(x) > 1 ⇒ diverge
lı́mn→∞ cn (x − x0 ) = l(x)
n
Sólo que ahora es bueno enfatizar que l = l(x), es decir que el lı́mite dependerá de la variable. Llamaremos,
de ahora en adelante a este lı́mite el radio o entorno de convergencia y lo denotaremos por l ≡ ρ = ρ(x).
El cual delimitará los valores de x para que la serie de potencias converja. Vemos el siguiente ejemplo en el
cual considermos la siguiente serie
n+1
x
∞
x2 x3 xn X xn an+1 (n + 1)! x
sn (x) = 1 + x + + +···+ +··· = ⇒ lı́m
≡ lı́m = lı́m =0
2 6 n! n! n→∞ an n→∞ xn n→∞ n + 1

n=1
n!
es decir, ρ = ρ(x) = lı́mn→∞ aan+1

n
= 0 con lo cual la serie converge para todo valor de x. Otro caso ocurre
cuando consideramos la siguiente serie de potencias:

X∞ (−1)n+2 (n + 1) (x − 2)n+1 n + 1
n+1 n
(−1) n (x − 2) ⇒ ρ = lı́m = kx − 2k lı́m
n=1
n→∞ (−1)
n+1
n (x − 2)
n n→∞ n

 converge si kx − 2k < 1 ⇒ 1<x<3
n + 1

ρ = kx − 2k lı́m = kx − 2k ⇒
n→∞ n 
diverge si kx − 2k > 1
P∞ n+1 n
Es decir, la serie n=1 (−1) n (x − 2) convergerá únicamente para 1 < x < 3. Para otros valores de x,
diverge.
Para puntualizar
Si una serie converge en x = x1 , convergerá absolutamente para kx − x0 k < kx1 − x0 k y divergerá para
kx − x0 k > kx1 − x0 k
P∞ n
Se llama radio de convergencia, ρ = ρ(x) a aquella cantidadPtal que la serie n=0 an (x − x0 ) converge
∞ n
para kx − x0 k < ρ y diverge para kx − x0 k > ρ. Una serie n=0 an (x − x0 ) que converge únicamente
para x = x0 tendrá un radio de convergencia ρ = 0, mientras que una que converja para todo x
tendrá un radio de convergencia ρ = ∞

7.2.2. Covergencia uniforme

En definitiva se puede refrasear el criterio de convergencia de Cauchy que vimos al comenzar este ca-
pitulo 7.1. Para cualquier valor de ǫ > 0, tan pequeño como uno quiera, siempre existirá un número N
independiente de x, con a ≤ x ≤ b tal que
∞
X
Si S(x) = lı́m sn (x) = an (x) ⇒ kS(x) − sn (x)k < ǫ ∀ x ∈ [a, b] ∧ n ≥ N.
n→∞
n=1
Con ello es inmediato indentificar el error que se comete cuando se corta la serie en un N suficientemente
grande
XN ∞
X
S(x) = an (x) + an (x)
n=1 n=N +1
| {z } | {z }
sn (x) ≈ǫ
Para el caso de series de funciones, consideraremos existen un par de criterios que identifican la conver-
gencia uniforme y tienen, también cierta popularidad. El criterio Mayorante de Weierstrass6 y el criterio de
Abel. A continuación los resumiremos.
Hay que resaltar el punto que las suma de funciones contı́nuas an (x) no necesariamente habrá de ser
contı́nua, el concepto de convergencia uniforme busca garantizar que esa suma de funciones contı́nuas también
será contı́nua. Ası́, recordamos la idea de continuidad de una función. Una función será contı́nua si sus lı́mites
por la derecha y por izquierda coinciden
?
lı́m f (t) = f (x) ⇒ lı́m lı́m fn (x) = lı́m lı́m fn (x)
t→x± t→x± n→∞ n→∞ t→x±
Es decir, al suponer que la suma de términos contı́nuos tiende a una función contı́nua estamos suponiendo
que podemos intercambiar los ı́mites. pero eso no es simpre cierto. Considere el caso (extremo)
 R1

 lı́mn→∞ fn = 0 ⇒ dx (lı́mn→∞ fn (x)) = 0
n 0
fn = n2 x 1 − x2 con 0 ≤ x ≤ 1 n = 1, 2, 3, . . .
 R 1 dx fn (x) = n2 ⇒ lı́mn→∞ R 1 dx fn → ∞

0 2(n+1) 0
Claramente no se pueden intercambiar los lı́mites.
Criterio Mayorante de Weierstrass

Si encontramos una serie convergente de números positivos
∞
X ∞
X
M= Mj con Mi ≥ kai (x)k ∀ x ∈ [a, b] entonces la serie an (x) es uniformemente convergente
j=1 n=1
P∞
La demostración se obtiene a partir de la definición misma de convergencia. Si j=1 Mj converge, entonces
para n + 1 ≥ N se tiene
∞
X ∞
X ∞
X
Mj < ǫ y como kai (x)k ≤ Mi ⇒ kai (x)k < ǫ ⇒ kS(x) − sn (x)k ≡ kai (x)k < ǫ
j=n+1 j=n+1 j=n+1
6 Karl Theodor Wilhelm Weierstrass Westphalia 1815 - Berlin 1897 Matemático Alemán con importantes contribuciones
al análisis complejo mediante la utilización de series

P∞
con la cual la serie n=1 an (x) será uniformemente convergente para todo x ∈ [a, b]. Ahora bien, como
consieramos los Mi ≥ 0. La serie en cuestión también será absolutamente convergente. Otra vez, los criterios
de convergencia absoluta y, en este caso, de convergencia uniforme, no son consecuencia uno del otro, ni
están relacionados. Las series
X∞ ∞
X
(−1)n xn
para − ∞ < x < ∞ ∧ (−1)n−1 para 0 ≤ x ≤ 1
n=1
n + x2 n=1
n
P∞
convergen uniformemente pero NO absolutamente. Sin embargo, en el intervalo 0 ≤ x ≤ 1 la serie j=0 (1 − x)xj
converge absolutamente pero no uniformemente, por cuanto tiene una discontinuidad. Se puede demostrar
que
X∞
=1 0≤x<1
(1 − x)xj =
=0 x=1
j=0
P∞
con lo cual se puede concluir que una serie arbitraria f (x) = j=1 ai (x) no podrá converger uniformemente
en intervalos en los cuales la función f (x) sea discontı́nua.
Criterio de Abel
El criterio de Abel se puede resumir de la siguiente forma: dada una serie de la forma
∞
X n
X
ai (x) ∧ ai (x) = cn fi (x) ⇒ lı́m aj (x) = S
n→∞
i=1 j=1
y por lo tanto la serie converge uniformemente en [a, b]. Para que se cumpla el criterio de Abel, fn (x) tiene
que estar acotada, 0 ≤ fn ≤ M ∀ n), tiene que ser monótonamente decreciente en el intervalo en el cual
esté definida, fn+1 (x) ≤ fn (x) con x ∈ [a, b]
7.2.3. Algebra y convergencia de series de potencias

El álgebrá elemental de series que mencionamos en la sección 7.1.2 se puede reconsiderar a la luz de las
series de potencias. De esta forma recordamos que los ı́ndices en las series son mudos
∞
X ∞
X ∞
X
n−1 j−1 k
an n (x − x0 ) = aj j (x − x0 ) = ak+1 (k + 1) (x − x0 )
n=1 j=1 k=0
en la última sumatoria hemos hecho k = j − 1, por lo cual j = k + 1.

Las series se igualan
∞
X ∞
X
n n−1
bn (x − x0 ) = an n (x − x0 )
n=0 n=1
X∞ X∞ ∞
X
n k n
bn (x − x0 ) = ak+1 (k + 1) (x − x0 ) = an+1 (n + 1) (x − x0 )
n=0 k=0 n=0
por lo cual
bn = an+1 (n + 1)

si la igualdad hubiera sido

∞
X ∞
X ∞
X
n n−1 n an
an (x − x0 ) = an n (x − x0 ) = an+1 (n + 1) (x − x0 ) =⇒ an+1 =
n=0 n=1 n=0
(n + 1)
Las series se suman
∞
X ∞
X ∞
X
n k n
an (x − x0 ) + bk (x − x0 ) = a0 + a1 (x − x0 ) + (an + bn ) (x − x0 )
n=0 k=2 n=2
o también
X∞ ∞
X ∞
X ∞
X
n k+2 n n
an (x − x0 ) + bk+2 (x − x0 ) = a0 +a1 (x − x0 )+ (an + bn ) (x − x0 ) = (an + cn−2 ) (x − x0 )
n=0 k=0 n=2 n=0
y en este último caso c−2 = c−1 = 0 y ci = bi+2 . Nótese como en los dos ejemplos anteriores hemos hecho
coincidir los el comienzo de los dós ı́ndices de la sumatoria.
La series también se multiplican, esto es
"∞ #" ∞ # ∞
X n
X n
X n
an (x − x0 ) bn (x − x0 ) = cn (x − x0 )
n=0 n=0 n=0
con
cn = a0 bn + a1 bn−1 + a2 bn−2 + · · · + aj bn−j + · · · + an−2 b2 + an−1 b1 + an b0
Si alguna de las series de potencias es absolutamente convergente, entonces su multiplicación con otra,
será absolutamente convergente.
Pero también las series de potencias se ¡ invierten ! y para ello utilizamos todo lo visto anteriormente
veamos. Supongamos que se tiene una serie del tipo
∞
X
2 n n
y − y0 = a0 + a1 (x − x0 ) + a2 (x − x0 ) + · · · + an (x − x0 ) + · · · = an (x − x0 )
n=0
n
Es decir tenemos y−y0 expresado en términos de una serie de potencias de (x − x0 ) entonces, igual podremos
n
plantearnos invertir el proceso, vale decir, expresar (x − x0 ) en términos de potencias (y − y0 ) Esto es
 k
X∞ X∞ X∞
n j
(x − x0 ) = bn (y − y0 ) ⇒ (x − x0 ) = bk  aj (x − x0 ) 
n=0 k=0 j=0
y a lo bestia al igualar términos con la misma potencia, despejamos los coeficientes bn en términos de los
an , de forma que
1
b1 =
a1
a2
b2 = −
(a1 )3
2(a2 )2 − a1 a3
b3 =
(a1 )5
5a1 a2 a3 − a21 a4 − 5a32
b4 =
(a1 )7
.. ..
. =.

P∞ P∞ n
Igualmente, si una serie f (x) = n=0 an (x − x0 ) = n=0 cn (x − x0 ) converge para un entorno −R ≤
x ≤ R entonces por el criterio de Mayorante de Weierstrass, entonces convergerá absoluta y uniformemente
para −S ≤ x ≤ S con 0 ≤ S ≤ R. Más aún, el criterio de Abel nos garantiza las siguientes propiedades
n
podemos extender la idea de continuidad de
P∞ una serie, dado que todos los términos an (x) = cn (x − x0 )
n
son funciones contı́nuas de x y f (x) = n=0 cn (x − x0 ) converge uniformemente para un entorno
−S ≤ x ≤ S, entonces la función f (x) es contı́nua en el intervalo de convergencia.
n
Si los términos an (x) = cn (x − x0 ) son funciones contı́nuas de x, entonces la serie puede ser derivada
término a término P∞ ∞
d [ n=0 cn (x − x0 ) ] X
n
n−1
= cn n (x − x0 )
dx n=1
(nótese como cambia el comienzo de la serie) y convergerá a

∞
X ∞
X
n−1 df (x) dan (x)
cn n (x − x0 ) → an (x) ∧ contı́nuas ∧ an (x) converge uniformemente en [a, b]
n=1
dx dx n=0
De igual manera las series pueden ser integradas término a término

Z b Z b ∞
X ∞ Z
X b X∞
n n cn n+1
dx f (x) = dx cn (x − x0 ) = dx cn (x − x0 ) = (x − x0 )
a a n=0 n=0 a n=0
n + 1
7.2.4. Series de Taylor

Para los fı́sicos el uso apropiado (y frecuente) de la serie Taylor facilita la vida y muchos cálculos. La
idea detrás de este tipo de series es la de la aproximación de una determinada función por una serie de
potencias en donde existe una forma sistemática de construir los coeficientes y, dependiendo de el número de
términos que utilicemos en la serie, tendremos idea de cuan aproximada es la serie y cuanto es el error que
cometemos al desarrollar la serie hasta un determinado término. Ası́ supodremos que f = f (x) es una función
contı́nua y contı́nuamente diferenciable. Con lo cual, si denotamos dfdx (x)
= f ′ (x), entonces supondremos que
′ ′′ ′′′ (n)
f (x), f (x), f (x), · · · , f (x) están definidas en el intervalo [a, b]. Entonces, conocemos desde siempre que
Z a+h Z a+h
dx f ′ (x) = f (a + h) − f (a) ⇒ f (a + h) = f (a) + dx f ′ (x) ⇒ f (a + h) ≈ f (a) + hf ′ (a)
a a
donde hemos supuesto que en intervalo [a, a + h] la función f ′ (x) es constante y tiene como valor f ′ (a).
Ahora bien, esto vale todo x y para cualquier función, por lo tanto se cumple que
f (x) ≈ f (a) + (x − a)f ′ (a)
f ′ (x) ≈ f ′ (a) + (x − a)f ′′ (a)
f ′′ (x) ≈ f ′′ (a) + (x − a)f ′′′ (a)
.. ..
. .
f (n−1) (x) ≈ f (n−1) (a) + (x − a)f (n) (a)

Con lo cual podemos construir

Z a+h Z a+h
h2 ′′
f (a + h) = f (a) + dx f ′ (x) ≈ f (a) + dx [f ′ (a) + (x − a)f ′′ (a)] ≈ f (a) + hf ′ (a) + f (a)
a a 2
que no es otra cosa que una aproximación de segundo orden a f (a + h). En general podemos construir
Z Z " Z #
a+h a+h a+h
′ ′ ′′
f (a + h) = f (a) + dx f (x) = f (a) + dx f (a) + dx f (x)
a a a
Z "Z #
a+h a+h
= f (a) + hf ′ (a) + dv dx f ′′ (x)
a a
Z Z " Z #!
a+h a+h a+h
′ ′′ ′′′
= f (a) + hf (a) + du dv f (a) + dx f (x)
a a a
Z Z "Z #!
a+h a+h a+h
h2 ′
= f (a) + hf (a) + f ′′ (a) + du dv ′′′
dx f (x)
2 a a a
y si repetimos ese procedimiento n veces, suponiendo que las derivadas de f (x) existan, tendremos la apro-
ximación n − 1 a la función. Esto es
h2 ′′ h3 hn−1 n−1
f (a + h) = f (a) + hf ′ (a) + f (a) + f ′′′ (a) + · · · + f (a) + Rn
2! 3! (n − 1)!
y también es fácil convencerse por inspección que el residuo o el error que cometemos en la aproximación
n − 1 viene dado por la integración enésima de la derivada enésima, vale decir
Z a+h Z a+h Z a+h
Rn = du dv ·|· ·{z· ·}· dx f ′′′ (x)
a a a
n veces
y por el Teorema del Valor medio

Z a+h
hn (n)
dτ g(τ ) = hg(ξ) ⇒ Rn = f (ξ) con a ≤ ξ ≤ a + h
a n!
Ahora bien, una elección astuta del parámetro h = x − a nos lleva a la conocida expresión de la serie de
Taylor para una función de una variable
(x − a)2 ′′ (x − a)3 ′′′ (x − a)n−1 n−1

f (x) = f (a) + (x − a)f ′ (a) + f (a) + f (a) + · · · + f (a) + Rn
2! 3! (n − 1)!
y el error vendrá dado por

(x − a)n (n)
Rn = f (ξ) con a ≤ ξ ≤ a + h
n!
ası́ la expansión de Taylor especifica el valor de una función en un punto x en términos de el valor de la
función y sus derivadas en un punto de referencia a. La expansión se hace en términos de potencias de la
diferencia, (x − a), entre el punto que se evalúa y el punto de referencia.

Algunas otras formas de expresar la serie de Taylor, serı́an

X∞ X∞ dn X∞
hn n hn dx n hn Dn d
f (x + h) = f (x) = f (x) = f (x) = ehD f (x) donde, D ≡
n=0
n! n=0
n! n=0
n! dx
Si el punto de referencia es a = 0 tendremos la serie de Maclaurin
x2 ′′ x3 xn−1 n−1
f (x) = f (0) + xf ′ (a) + f (a) + f ′′′ (a) + · · · + f (a) + Rn
2! 3! (n − 1)!
Algunas Series de Taylor

Un listado incompleto de las series de Taylor más utilizadas es
x2 x3 x4 xn
ex = 1+x+ + + + ··· + + ··· para − ∞ < x < ∞
2 3! 4! n!
x3 x5 x7 x2n−1
sen x = x− + − + · · · + (−1)n+1 + ··· para − ∞ < x < ∞
3! 5! 7! (2n − 1)!
x2 x4 x6 x2n−2
cos x = 1− + − + · · · + (−1)n+1 + ··· para − ∞ < x < ∞
2 4! 6! (2n − 2)!
x3 x5 x7 x2n−1
arctan x = x− + − + · · · + (−1)n+1 + ··· para − 1 < x < 1
3 5 7 (2n − 1)
x2 x3 x4 xn
ln(1 + x) = x− + − + · · · + (−1)n+1 + ··· para − 1 < x < 1
2 3 4 n
2 3
x x m!
(1 + x)m = 1 + mx + m(m − 1) + m(m − 1)(m − 2) + · · · + xn + · · · para − ∞ < x < ∞
2 3! n!(m − n)!
La expansión binomial
Por lo frecuente y su uso, consideremos el caso de la expansión binomial
X∞ X∞
x2 x3 m! m
(1 + x)m = 1 + mx + m(m − 1) + m(m − 1)(m − 2) + · · · = xn = xn
2 3! n!(m − n)! n
n=0 n=0

m
donde el término se denomina el coeficiente binomial y la serie termina cuando m = n. Ahora bien,
n
escrito de la formas compactas de la derecha se sugiere que el exponente m tendrı́a que ser entero y positivo.
Pero no es ası́. La serie explı́cita de la izquierda no se restringe a valores enteros y positivos de m. Por ello
la forma compacta pero exacta de la expansión binomial.
x m x m(m − 1) x 2 m(m − 1)(m − 2) x 3 X∞
Γ(1 + m) x n
1+ = 1+m + + +· · · =
a a 2 a 3! a n=0
Γ(1 + n)Γ(1 + m − n) a
Donde hemos utilizado la función Γ(x) como la generalización del factorial para valores que no se restringen
a enteros positivos. Cuando m es un entero positivo tendremos Γ(1 + m) = m!. Nótese también que si el
m
exponente es negativo, 1 + xa tiene una singularidad o un polo en x = −a

Taylor en varias variables

Sólo por razones de completitud, y para reforzar los conceptos de que es un desarrollo en series para una
función alrededor de un determinado punto, escribiremos el desarrollo en series de Taylor para una funcionón
de dos variables f = f (x, y). Esta es
1
f (x, y) = f (a, b) + (x − a) fx |ab + (y − b) fy |ab + (x − a)2 fxx ab + 2(x − a)(y − a) fxy |ab + (y − a)2 fyy |ab
2!
1
+ (x − a)3 fxxx |ab + 3(x − a)2 (y − a) fxxy |ab + 3(x − a)(y − a)2 fxyy |ab + (y − a)3 fyyy |ab + · · ·
3!
O más compacto
X ∞
1 n X∞
1 ~ n

f xj + xj0 = xk ∂k f (xm ) m m ⇒ f (~r + ~a) = ~r · ∇ f (xm )
n=0
n! x =x0
n=0
n! ~r =~
a
Dónde hemos utilizado la siguiente convención
∂ ∂ ∂2 ∂2 ∂2
fx = = ∂x ; fy = = ∂y ; fxx = = ∂xx ; fxy = = ∂xy ; fyy = = ∂yy ; ···
∂x ∂y ∂x2 ∂x∂y ∂y 2
7.3. Series y Espacios de Hilbert

Hemos dejado “sueltos” algunos conceptos para los espacios de Hilbert infito-dimensional. El primero de
estos conceptos es que un vector |ai ∈ E ∞ surge la combinación lineal de elementos de una base infinita
{|ei i}, ( de una serie) que converge al vector |ai para un espacio donde también la norma del vector converge
a un valor finito kak2 = ha |ai. El segundo concepto fue la posibilidad de expresar un determinado vector
(una función ) como combinación lineal de una base (de dimensión infinita) de un espacio vectorial E ∞ .
Efectivamente, esa combinación lineal (de dimensión infinita) habrá de converger a el valor de la función en ese
punto. En su momento expresamos estos conceptos intuitivos y fácilmente demostrables para E n (un espacio
vectorial Euclideano de dimensión finita, n−dimensional) y sin mayores justificaciónes hicimos el “salto ”
a E ∞ (un espacio Euclideano infinito-dimensional). Ahora, equipados con los conceptos de convergencia
uniforme estamos en capacidad de explorar esas razones que antes eludimos. Ambos conceptos tienen que
ver con la palabra completitud, la cual, como veremos, no tiene el mismo significado en cada una de las
situaciones antes mencionadas, pero será complementario. En el primer caso la completitud de E ∞ se logra
al poder expresar un vector como una combinación lineal de una base infinita que converja al valor del vector.
En el segundo caso diremos que la base {|ei i} para E ∞ será completa si expande la totalidad de los vectores
de E ∞ .
7.3.1. Completitud de E ∞
La primera idea de completitud de un Espacio de Hilbert E ∞ tiene que ver con el hecho que, en en ese
espacio, donde la norma de un vector es finita kak2 = ha |ai < ∞, la combinación lineal de los elementos de
n→∞
una base infinita, {|ei i}, converja al vector |ai. Esto es ai |ei i −→ |ai.
n
Para el caso de E es inmediato que, dada una base (ortonormal, por ejemplo)
|ai = ai |ei i ⇒ kak2 = ha |ai = ai ai < ∞ con i = 1, 2, 3, · · · n
La norma es finita, por cuanto es la suma de términos finitos (las componentes del vector (a1 , a2 , a3 , · · · an )).
Sin embargo, para el caso de E ∞ las componentes del vector serán función de las sumas parciales, esto es

hasta dónde desarrollemos la serie y debemos demostrar que si

n→∞
|an i ⇔ (a1n , a2n , a3n , a4n , · · · ann ) −→ |a∞ i ⇔ (a1∞ , a2∞ , a3∞ , · · · aj∞ , · · · ) ⇒ k |a∞ i − |an i k < ǫ
Es decir que, efectivamente, componente a componente el vector |an i converja al vector |ai. El criterio de
convergencia de Cauchy, en este caso significa que: dadas dos sumas parciales (desarrollos parciales en una
determinada base infinita {|ei i}) |an i = ai |ei i con i = 1, 2, · · · n y |am i = aj |ej i con j = 1, 2, · · · m entonces
k |am i − |an i k = k |am i − |ai − |an i + |ai k ≤ k |ai − |an i k + k |ai − |am i k < ǫ′ + ǫ′′ ≡ ǫ
con lo cual las diferencias en las sumas parciales serán siempre menor que un 0 < ǫ < 1. Nótese que hemos
utilizado la desigualdad triangular kx + yk ≤ kxk + kyk, y esa misma desigualdad triangular nos garantiza
que
∞
X
|ajn − ajm |2 ≤ |ajn − ajm |2 ≡ k |am i − |an i k2 < ǫ
j=1
vale decir, hemos demostrado que el término j−esimo (y con ello todas las componentes del vector) de una
n→∞ n→∞
suma parcial, converge al término correspondiente de la serie lı́mite. Esto es ajn −→ ajm −→ aj por lo tanto
que las combinación lineal converge al vector y nos queda por demostrar si su norma es finita, o lo que es lo
mismo, ha |ai = ai ai < ∞ con i = 1, 2, 3, · · · ∞. Es claro que
M
X ∞
X
|ajn − ajm |2 ≤ |ajn − ajm |2 ≡ k |am i − |an i k2 < ǫ
j=1 j=1
PM
con lo cual si m → ∞ tendremos que j=1 |ajn − aj |2 < ǫ y si ahora hacemos
∞
X ∞
X ∞
X
M →∞ ⇒ |ajn − aj |2 < ǫ ⇒ ha |ai = |aj |2 ≡ |aj + ajn − ajn |2
j=1 j=1 j=1
Ahora bien, para α y β complejos, se cumple que

2
(|α| − |β|) ≡ |α|2 + |β|2 − 2|α||β| ≥ 0 ⇒ 2|α||β| ≤ α|2 + |β|2 ⇒ |α + β|2 ≤ ||α| + |β||2 = |α|2 + |β|2 + 2|α||β|
para que finalmente, tengamos que

2
(|α| − |β|) ≤ 2 |α|2 + |β|2
Finalmente, podemos aplicarlo al caso que nos compete
 
X∞ X∞ ∞
X
ha |ai ≡ |aj + ajn − ajn |2 ≤ 2  |aj − ajn |2 + |ajn |2  < ∞
j=1 j=1 j=1
7.3.2. Conjunto completo de funciones

El segundo sentido de completitud con que el conjunto (funciones) de vectores base expandan la totalidad
del espacio vectorial (de funciones). Esto es, si {|ui i} ⇔ {ui (x)} es una base ortonormal para E ∞
∞
X
|ai = ai |ui i ⇒ k |ai k2 = ha |ai = ai ai = |ak |2 con i = 1, 2, 3, · · · ∞
k=1

Es, otra vez, la misma afirmación que consideramos en el caso de un espacio finito dimensional, E n en el
cual demostramos que una base {|ui i} con i = 1, 2, 3, · · · , n expandı́a todo el espacio.
Si adicionalmente existe una función cuadrado integrable, L2[a,b] definidas en el intervalo [a, b], la cual
pueda ser aproximada por la base
∞
X N
X Z b N
X
k |f i k2 ≡ hf |f i < ∞ ⇒ |f i = ci |ui i ∼ ci |ui i ⇔ kf (x)k2 ≡ dx|f (x)|2 ⇒ f (x) ∼ cj uj (x)
i=0 i=0 a j=0
Nótese que hemos supuesto la existencia de un producto interno y si las bases son ortonormales tendremos
que
Z b Z b Z b ∞
X
∗

k ∗k k 2
hg |f i ≡ dx g (x)f (x) ⇒ u |ul i ≡ dx u (x)ul (x) = δl ⇒ kf (x)k ≡ dx|f (x)|2 = |cj |2
a a a j=0
donde Z b
ck = dx u∗k (x)f (x)
a
Para demostrar que E ∞ es completo, comenzamos por demostrar la llamada Desigualdad de Bessel.
Esta es: dada una base ortonormal infinita, {|ui i} ⇔ {ui (x)} para un espacio vectorial de Hilbert, E ∞ , de
Rb
funciones cuadrado integrable f (x) ∈ L2[a,b] , con un producto interno definido por hg |f i ≡ a dx g ∗ (x)f (x),
entonces se cumple que
∞
X Z b Z b
2 2 k

k ∗k
kf (x)k ≥ |ck | con c = u |f i = dx u (x)f (x) ∧ hg |f i ≡ dx g ∗ (x)f (x)
k=1 a a
Para demostrar la desigualdad de Bessel, partimos de una afirmación obvia en espacios finito dimensionales

0 ≤ k |f i − ci |ui i k2 ≡ hf | − c∗k uk |f i − ci |ui i = k |f i k2 − c∗k uk |f i −ci hf |ui i +c∗k ci uk |ui i

| {z } | {z } | {z }
ck c∗
i δik
donde k, i = 1, 2, 3, · · · n Entonces, queda demostrada la desigualdad de Bessel al tomar el lı́mite n → ∞

n
X n
X
n→∞
0 ≤ k |f i k2 − |ck |2 =⇒ k |f i k2 ≥ |ck |2
k=1 k=1
Si definimos el error, Mn , que se comete al aproximar una función con su expansión hasta

un término
n−simo como Mn (b − a) ≡ k |f i − αi |ui i k2 demostraremos que Mn es mı́nima si αi = ci = ui |f i Para ello
procedemos como es costumbre, partiendo de la definición que acabamos de hacer y nos concentramos en el
caso finito dimiensional
0 ≤ Mn (b − a) ≡ k |f i − αi |ui i k2 = k |f i − (αi − ci ) |ui i − ck |uk i k2
Desarrollando

Mn (b − a) = hf | − (αk∗ − c∗k ) uk − c∗k uk |f i − (αi − ci ) |ui i − ci |ui i
n
X
=k |f i k2 − c∗i (αi − ci ) − 2c∗i ci − (αk∗ − c∗k )ck + kαj − cj k2 + (αk∗ − c∗k )ck + c∗i (αi − ci ) + c∗i ci
j=1
" n
# n
X X
= k |f i k2 − kci k2 + kαj − cj k2
i=1 j=1

Pero la desigualdad de Bessel garantiza que la cantidad entre corchetes es positiva, por lo tanto Mn es
mı́nima (y la denotaremos M̃n ) cuando seleccionamos αj = cj . Más aún M̃n decrece cuando n → ∞, vale
decir
n
X ∞
X
n→∞
M̃n (b − a) = k |f i k2 − kci k2 =⇒ M̃∞ (b − a) = k |f i k2 − kci k2
i=1 i=1
y si, adicionalemente tenemos que M̃n → 0 cuando n → ∞ entonces es claro que

∞
X
k |f i k2 = kci k2 =⇒ {|ui i} ⇔ {ui (x)} es completa
i=1
Este noción de convergencia se denomina como convergencia al promedio

Si adicionalmente exigimos que la serie ci |ui i converja uniformemente para x ∈ [a, b] entonces es claro
que
Z b ∞
X
dx kf (x) − ci |ui i k2 = 0 =⇒ |f i = ci |ui i (con i = 1, 2, 3 · · · , ∞) ⇔ f (x) = ci ui (x)
a i=1
Con lo cual enumeraremos las condiciones para la cual exigiremos que una función pueda ser expresada en
términos de una base completa de funciones.
Que f (x) sea cuadrado integrable f (x) ∈ L2[a,b]

P∞
Que la base sea completa, {|ui i} ⇔ {ui (x)} i.e. k |f i k2 = i=1 kci k2
P∞
Que la serie ci |ui i ⇔ i=1 ci ui (x) converja uniformemente, para x ∈ [a, b]
7.4. Series de Polinomios Ortogonales

Enunciaremos un teorema debido a Weierstrass el cual garantiza que una función contı́nua en un intervalo
[a, b] puede ser aproximada uniformemente por una serie de polinomios. Por lo tanto, cualquier función
contı́nua podrá ser aproximada por combinaciones lineales de potencias.
El Teorema de aproximación polinómica de Weiernstrass queda enunciado como sigue. Cualquier función
contı́nua f (x) en un intervalo cerrado x ∈ [a, b] podrá ser aproximada uniformente por polinomios en ese
mismo intervalo si, para un n suficientemente grande y un ǫ suficientemente pequeño siempre se tiene que
kPn (x) − f (x)k < ǫ ∀ x ∈ [a, b]
Para la demostración de este teorema puede consultar [Byron y Fuller 1970, Cushing 1975]. Sin embargo la
aceptación de este teorema nos permitirá desarrollar las secciones que siguientes...
7.4.1. Polinomios de Legendre

El primero de los ejemplos de una base ortonormal de polinomios en la cual podremos expresar cualquier
función contı́nua en el intervalo cerrado x ∈ [−1, 1] serán los Polinomios de Legendre. Estos vienen construidos
a partir de la Fórmula de Rodrı́gues
1 dn 2
Pn (x) = (x − 1)n , n = 0, 1, 2, .....
n!2n dxn

con P0 (x) = 1.
Es decir
P0 (x) = 1 P1 (x) = x
5
P2 (x) = 1 − 3x2 P3 (x) = x − x3
3
3 35 4 15 2 63 5 35 3 15
P4 (x) = + x − x P5 (x) = x − x + x
8 8 4 8 4 8
.. ..
. .
Generalidades de los Polinomios de Legendre

Es fácil comprobar que los polinomios de Legendre |Pα i ↔ Pα (x) son mutuamente ortogonales para un
producto interno definido como
Z 1
2
hPn |Pm i = Pn (x)Pm (x)dx = δnm
−1 2n +1
con norma definida por Z 1

2 2
ˇ
−1 2n + 1
nótese que los polinomios de Legendre, calculados a partir de la Fórmula de Rodrigues no están normalizados.
Al ser los Polinomios de Legendre un conjunto completo de funciones, ellos expanden el espacio de
funciones contı́nuas en el intervalo cerrado x ∈ [−1, 1]. Por ello cualquier función en el intervalo [−1, 1] puede
ser expresada en esa base.
X∞ ∞
X hPk |Fi
f (x) = |Fi = ak |Pk i = |Pk i
hPk |Pk i
k=0 k=0
Varios ejemplos ilustrarán esta aplicación

Si f (x) es un polinomio
m
X ∞
X ∞
X
f (x) = bn xn = ak |Pk i = an Pn (x)
n=0 k=0 n=0
no se requiere hacer ninguna integral por cuanto los coeficientes an se determinan a través de un sistema de
ecuaciones algebraicas. Para el caso de f (x) = x2 tendremos
f (x) = x2 = a0 P0 (x) + a1 P1 (x) + a2 P2 (x)

1
f (x) = x2 = a0 + a1 x + a2 (3x2 − 1)
2
1 2
f (x) = x2 = P0 (x) + P2 (x)
3 3
En el caso de una función mas complicada
r ∞
1 − x X hPk |Fi
f (x) = = |Pk i
2 hPk |Pk i
k=0

Z 1 Z 1
r
1−x
−1 −1 2
la expansión en series de Legendre quedarı́a cómo
r ∞
1−x 2 X Pn (x)
= P0 (x) − 2
2 3 n=1
(2n − 1) (2n + 3)
Antes de entrar en el detalle de las propiedades de estos polinomios, hay que enfatizar que los Polinomios
de Legendre constituyen la única base ortogonal para un espacio de Hilbert con un producto interno definido
como el producto simple de funciones en el intervalo cerrado. Al ortonormalizar mediante Gram Schmidt
la base 1, x, x2 , x3 , · · · , xn , · · · del espacio de polinomios, P n , de grado n en el intervalo [−1, 1], con el
R1
producto interno definido por hf | gi = −1 dx f (x) g (x) . se obtienen los polinomios de Legendre.
Los polinomios de Legendre surgen, originalmente, como soluciones a la ecuación diferencial ordinaria del
tipo
d2 Pn (x) dPn (x)
(1 − x2 ) − 2x + n(n + 1) Pn (x) = 0
dx2 dx
Vale decir
n Ecuación de Legendre Solución
d2 P0 (x) dP0 (x)
0 (1 − x2 ) dx2 − 2x dx =0 P0 (x) = 1
d2 P1 (x) dP1 (x)

1 (1 − x2 ) dx2 − 2x dx + 2 P1 (x) = 0 P1 (x) = x
d2 P2 (x) dP2 (x)

2 (1 − x2 ) dx2 − 2x dx + 6 P2 (x) = 0 P2 (x) = 1 − 3x2
d2 P3 (x) dP3 (x)

3 (1 − x2 ) dx2 − 2x dx + 12 P3 (x) = 0 P3 (x) = x − 35 x3
d2 P4 (x) dP4 (x) 35 4

4 (1 − x2 ) dx2 − 2x dx + 20 P4 (x) = 0 P4 (x) = 1 − 10x2 + 3 x
Ortogonalidad de los Polinomios de Legendre

Como los polinomios de Legendre son soluciones de su ecuaciones
(1 − x2 ) Pα (x)′′ − 2x Pα (x)′ + α(α + 1) Pα (x) = 0

(1 − x2 ) Pβ (x)′′ − 2x Pβ (x)′ + β(β + 1) Pβ (x) = 0
Nótese que hemos cambiado de notación del operador diferencial
d2 Pα (x) dPβ (x)

Pα (x)′′ ↔ Pβ (x)′ ↔
dx2 dx
Acomodando y restando ambas ecuaciones
(1−x2 ) { Pβ (x)Pα (x)′′ − Pα (x)Pβ (x)′′ }−2x {Pβ (x)Pα (x)′ − Pα (x)Pβ (x)′ }+{α(α + 1) − β(β + 1)} Pβ (x)Pα (x) = 0
el primer término de la ecuación puede interpretarse una la derivada

′
(1 − x2 ) { Pβ (x)Pα (x)′ − Pα (x)Pβ (x)′ }

por lo tanto al integrar

Z 1
1
(1 − x2 ) { Pβ (x)Pα (x)′ − Pα (x)Pβ (x)′ }−1 + {α(α + 1) − β(β + 1)} Pα (x)Pβ (x)dx = 0
−1
El primer término de la ecuación se anula en los extremos y es fácil comprobar que los polinomios de Legendre
|Pα i = Pα (x) son mutuamente ortogonales con un producto interno definido como
Z 1
hPα |Pβ i = Pα (x)Pβ (x)dx ∝ δαβ
−1
Relación de Recurrencia
Conocido esto se puede generar una relación de recurrencia. Supongamos que conocemos todos los poli-
nomios de Legendre hasta Pn (x) y queremos generar el próximo. Obviamente el ese polinomio será de grado
n + 1 y nos plantemos generarlo a partir de xPn (x) ası́ como los estos polinomios son base del espacio de
funciones, entonces
n+1
X hPk |xPn i
xPn (x) = |xPn i = |Pk i
hPk |Pk i
k=0
en donde Z 1
hPk |xPn i = hxPk |Pn i = Pn (x)xPk (x)dx = 0
−1
para k < n − 1. Sobreviven entonces tres términos
hPn−1 |xPn i hPn |xPn i hPn+1 |xPn i
|xPn i = xPn (x) = |Pn−1 i + |Pn i + |Pn+1 i
hPn−1 |Pn−1 i hPn |Pn i hPn+1 |Pn+1 i
y dado que Z Z
1 1
hPn |xPn i = Pn (x)xPn (x)dx = xPn2 (x)dx ,
−1 −1
es una función impar, entonces hPn |xPn i = 0. Entonces
hPn−1 |xPn i hPn+1 |xPn i
|xPn i = xPn (x) = |Pn−1 i + |Pn+1 i
hPn−1 |Pn−1 i hPn+1 |Pn+1 i
Es decir
xPn (x) = APn+1 (x) + BPn−1 (x)
desarrollando con la fórmula de Rodrı́guez el coeficiente de orden k del lado izquierdo es
1 (2k)!
2k(2k − 1) · · · [2k − (k − 1)] = k
2k k! 2 (k!)2
mientras que el primer término del lado izquierdo, hasta orden k − 2 queda como
(2k − 2)!
2k (k− 2)!(k − 1)
por lo cual
n+1
A=
2n + 1
De igual forma se determina B igualando coeficientes a orden n − 1 y queda la relación de recurrencia:
(n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x)

Norma de los Polinomios de Legendre

Conociendo que la ortogonalidad de los polinomios de Legendre y la relación de recurrencia, procedemos
encontrar el valor de su norma
Z 1
2 2
ˇ
−1 2n + 1
De la relación de recurrencia
(2n + 1) Pn (x)nPn (x) = (2n + 1) Pn (x) [(2n − 1) xPn−1 (x) − (n − 1) Pn−2 (x)]
(2n − 1) Pn−1 (x) (n + 1) Pn+1 (x) = (2n − 1) Pn−1 (x) [(2n + 1) xPn (x) − nPn−1 (x)]
restando miembro a miembro obtenemos:
(2n + 1) Pn (x)nPn (x) + (2n + 1) (n − 1) Pn (x)Pn−2 (x)−

2
− (n + 1) (2n − 1) Pn−1 (x)Pn+1 (x) − (2n − 1) nPn−1 (x) = 0
integrando y considerando la ortogonalidad

Z 1 Z
2 2n − 1 1 2
Pn (x)dx = P (x)dx
−1 2n + 1 −1 n−1
Z 1 Z 1
2 2n − 1 2n − 3 2
Pn (x)dx = Pn−2 (x)dx
−1 2n + 1 2n − 1 −1
Z 1 Z 1
2n − 1 2n − 3 2n − 5
Pn2 (x)dx = 2
Pn−3 (x)dx
−1 2n + 1 2n − 1 2n − 3 −1
.. ..
. = .
Z 1 Z 1
3
Pn2 (x)dx=
ˇ P12 (x)dx
−1 2n + 1 −1
Z 1
2
Pn2 (x)dx=
ˇ
−1 2n + 1
Función Generatriz de los Polinomios de Legendre

Se puede encontrar una función generatriz P(t, x) de los polinomios de Legendre:
X∞
1
P(t, x) = √ = P0 (x) + P1 (x) t + P2 (x) t2 + · · · = Pn (x) tn
1 − 2xt + t2 n=0
para la cual
los Pn (x) son los coeficientes de su desarrollo en series de potencias. Esta serie converge para
2xt + t2 < 1. Para demostrar que el desarrollo en serie de la función G(t, x) tiene como coeficientes a los
Pn (x) partimos de que:
1 ∂P(t, x) t−x
P(t, x) = √ ⇒ = 3/2
1 − 2xt + t2 ∂t (1 − 2xt + t2 )
por lo cual
∂P(t, x)
(t − x) P(t, x) + 1 − 2xt + t2 =0
∂t

y, consecuentemente
∞
X ∞
X
(t − x) Pn (x) tn + 1 − 2xt + t2 nPn (x) tn−1 = 0 .
n=0 n=1
Multiplicando y acomodando queda

∞
X ∞
X ∞
X
−x P0 (x) + P0 (x) t + (n + 1) Pn+1 (x)tn − (2n + 1) x Pn (x) tn − nPn−1 (x) tn = 0
n=0 n=1 n=2
por lo tanto
     
∞
X
P1 (x) − x P0 (x)+ 2P2 (x) − 3xP1 (x) + P0 (x) t+ (n + 1) Pn+1 (x) − (2n + 1) xPn (x) + nPn−1 (x) tn = 0
| {z } | {z } n=1
| {z }
=0 =0 =0
El primero de los términos se cumple siempre por cuanto P0 (x) = 1 y P1 (x) = x. El tercer término conforma
la relación de recurrencia para los polinomios de Legendre. Con esto queda demostrado que el desarrollo en
series de potencias de la función generatriz, tiene como coeficientes a los polinomios de Legendre.
La función generatriz muestra su utilidad en la expansión
r ∞
1 − x X hPk |Fi
f (x) = = |Pk i
2 hPk |Pk i
k=0
Ası́, al considerar la definición del producto interno

Z 1 Z 1
r
1−x
−1 −1 2
e integrando
Z r ∞ Z 1r
1
1−x 1 X 1−x
n
√ dx = t Pn (x)dx
−1 2 1 − 2xt + t 2
n=0 −1 2
" √ # ∞ Z 1r
1 (1 − t)
2
1+ t X 1−x
n
1+t− √ ln √ = t Pn (x)dx
2t 2 t 1− t n=0 −1 2
Expandiendo el lado izquierdo en series de potencias de t

∞ ∞ Z 1 r
4 X tn X 1−x
n
−4 = t Pn (x)dx
3 n=1
(4n2 − 1) (2n + 3) n=0 −1 2
lo cual nos conduce, al igualar coeficientes a

Z 1
r
4 1−x
= P0 (x)dx
3 −1 2
Z 1
r
−4 1−x
2
= Pn (x)dx
(4n − 1) (2n + 3) −1 2
y finalmente a la forma de la expansión en series
r ∞
1−x 2 X Pn (x)
= P0 (x) − 2
2 3 n=1
(2n − 1) (2n + 3)

Figura 7.1: Polinomios de Lengendre
Otras propiedades de los polinomios de Legendre

Pn (1) = 1 y Pn (−1) = (−1)n para todo n.
Pn (x) tiene n raı́ces en el intervalo (−1, 1) Esta propiedad puede apreciarse para los primeros 5 poli-
nomios en la figura 7.1
Tienen una representación integral de la forma

Z πh p in
1
Pn (x) = x + x2 − 1 cos ϕ dϕ
2π 0
Cambios de variables inmediatos conllevan a ecuaciones diferenciales equivalentes
• Forma autoadjunta ′
(1 − x2 ) y ′ + λ(λ + 1) y = 0
• En coordenadas esféricas con u = Pn (cos θ)

1 d du
sen θ + λ(λ + 1)u = 0
sen θ dθ dθ
√
• En coordenadas esféricas con u = sen θPn (cos θ)
" 2 #
d2 u 1 1
+ λ+ + u=0
dθ2 2 4 sen2 θ

Resumen de Propiedades Polinomios Legendre

Polinomios de Legendre
1 dn 2
Definición Pn (x) = (x − 1)n , n = 0, 1, 2, .....
n!2n dxn
P−1 ≡ 0; P0 ≡ 1; P1 = x
Ejemplos
P2 = 12 (3x2 − 1); P3 = 21 (5x3 − 3x)
Relación de Recurrencia (n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x)
(1 − x2 ) y ′′− 2x y ′ + λ(λ + 1) y = 0

Ecuaciones Diferenciales 1 d du
sen θ + n(n + 1)u = 0; u = Pn (cos θ)
sen θ dθ dθ
X∞
1
Función Generatriz P(t, x) = √ = Pn (x) tn
1 − 2xt + t2
Z n=0
1 π √
2
n
Representación Integral Pn (x) = x + x − 1 cos ϕ dϕ
2πZ 0
1
2
Ortogonalidad hPα |Pβ i = Pα (x)Pβ (x)dx = δαβ
−1 2α +1
Potencial Electrostático de un Dipolo Eláctrico

En Fı́sica el ejemplo claro es el cálculo del potencial electrostático producido por dos cargas q1 = +q y
q2 = −q separadas por una distancia 2d en un punto P cualquiera de un plano (x, y). El potencial en ese
punto genérico viene dado por
1 1
V =q −
R′ R
Tal y como puede apreciarse de la figura 7.4.1

2
(R′ ) = r2 + d2 − 2r d cos θ
R2 = r2 + d2 − 2r d cos (π − θ)
por lo cual
" 2 !#−1/2
1 1 d d
= 1− 2 cos θ −
R′ r r r
" 2 !#−1/2
1 1 d d
= 1− 2 cos (π − θ) −
R r r r
y consecuentemente
∞ n
1 1X d
′
= Pn (cos θ)
R r n=0 r
∞ n ∞ n
1 1X d 1X d
= Pn (cos (π − θ)) = Pn (− cos θ)
R r n=0 r r n=0 r
El potencial será
∞
X n !
q d
V = [Pn (cos θ) − Pn (− cos θ) ]
r n=0
r

Figura 7.2: Potencial Electrostático de un Dipolo Eláctrico
donde todos los términos pares de Pn (cos θ) se anula y finalmente tendremos la expresión del potencial para
cualquier punto del plano
∞ 2n+1 !
2q X d
V = P2n+1 (cos θ)
r n=0 r
Entonces nos quedamos con el primer término de la serie, si
d q
≪1 ⇒ V ≈ 2d cos θ
r r2
7.4.2. Polinomios de Hermite

Los polinomios de Hermite a diferencia de los de Legendre (y Tchevychev), vienen definidos en toda la
recta real, vale decir, x ∈ (−∞, ∞), por lo cual la función peso w(x) en el producto interno deberá decrecer
más rápido que |x|n , para garantizar que la norma de los vectores en este espacio vectorial sea finita. La
2
función más simple que cumple estos requisitos es w(x) = e−x (tambián algunos autores utilizan w(x) =
2
e−x /2 ) Esto es, el producto interno entre los polinomios de Hermite vendrá definido como
Z ∞ Z ∞
2
hf |gi = dx w(x)f (x)g(x) = dx e−x f (x)g(x)
−∞ −∞
Otra vez, para este producto interno, si ortogonalizamos con Gram-Schmidt se obtienen los polinomios de
Hermite. Al igual que el resto de los polinomios ortogonales, existe una fórmula de Rodrigues para los
polinomios de Hermite
2 d
n 2
Hn (x) = (−1)n ex n
e−x
dx

con lo cual se obtienen
H0 (x) = 1, H1 (x) = 2x
2
H2 (x) = 4x − 2, H3 (x) = 8x3 − 12x,
H4 (x) = 16x4 − 48x2 + 12 H5 (x) = 32x5 − 160x3 + 120x.
.. ..
. .
Generalidades de los Polinomios de Hemite

Los polinomios de Hermite serán ortogonales, pero no normales
Z ∞ Z ∞
√ 2 2 2 √
hHα |Hβ i = 2α α! π δαβ = e−x Hβ (x)Hα (x)dx ⇔ hHα |Hα i = kHα k = e−x Hα2 (x)dx = 2α α! π
−∞ −∞
Donde la función delta de Kronecker es δαβ = 0 si α 6= β; y δββ = 1.

Antes de desarrollar funciones en términos de los polinomios de Hermite, expondremos un par de teoremas
sin demostración.
Teorema 1
Sean | f i y | g i dos funciones arbitrarias, cuando menos continuas a trozos en (−∞, ∞) y que cumplen con
Z ∞ Z ∞
2 2
e−x f 2 (x)dx < ∞ ∧ e−x g 2 (x)dx < ∞
−∞ −∞
Entonces el conjunto de estas funciones forman un espacio vectorial Euclideano I2w con un producto interno
definido por Z ∞
2
hg|f i= e−x f (x)g(x)dx
−∞
Las funciones f (x) y g(x) se denominan cuadrado-integrables respecto al peso w. Es por ello que denotamos
el espacio de funciones como I2w
Teorema 2
Si f (x) es una función continua arbitraria en I2w entonces puede ser aproximada por un polinomio en ese
mismo espacio. Es decir
Z ∞ 1/2
2 2
lı́m kf (x) − pn (x)k = lı́m e−x [f (x) − pn (x)] dx =0
n→∞ n→∞ −∞
Ası́, la expresión de una función arbitraria en la base de los polinomio de Hermite se reduce a
∞
X ∞
X hHk |f i
f (x) = | f i = ak |Hk i = |Hk i
hHk |Hk i
k=0 k=0
donde R∞ 2 Z
hHk | f i −∞
e−x f (x)Hk (x)dx 1 ∞
2
ak = = R∞ = k
√ e−x f (x)Hk (x)dx
hHk |Hk i −∞
e−x2 Hk2 (x)dx 2 k! π −∞
Si f (x) = x2p con p = 1, 2, 3, · · ·

p
X
f (x) = x2p = a2k H2k (x)
k=0

entonces
Z ∞
1 2
a2k = 2k √ e−x x2p H2k (x)dx (7.2)
2 (2k)! π −∞
Z ∞
1 d2k −x2
= √ x2p e dx
22k (2k)! π −∞ dx2k
Una integración por partes estratágica muestra que:
( ∞ Z ∞ )
1 2p d
2k−1
−x2 2p−1 d
2k−1
−x2
a2k = 2k √ x e − 2px e dx
2 (2k)! π dx2k−1 −∞ −∞ dx2k−1
El primer término de la resta se anula siempre debido a la defición de los polinomios de Hermite
∞ ∞
2p d
2k−1
−x2 2p 2k−1 −x2
x e = x (−1) e H 2k−1 (x)
dx2k−1 −∞ −∞
Repitiendo el proceso 2k veces, tendremos

Z ∞
1 (2p)! 2
a2k = 2k √ x2p−2k e−x dx
2 (2k)! π (2p − 2k)! −∞
√
ahora si en la integral hacemos x = t obtenemos
Z ∞
1 (2p)! dt
a2k = 2k √ tp−k e−t √
2 (2k)! π (2p − 2k)! −∞ 2 t
Z ∞
1 (2p)! 1
= 2k+1 √ tp−k− 2 e−t dt
2 (2k)! π (2p − 2k)! −∞
R∞
y utilizando la definición Γ (z) ≡ 0 e−t tz−1 dt ≡ (z − 1)! , queda como

1 (2p)! 1
a2k = 2k+1 √ Γ p−k+
2 (2k)! π (2p − 2k)! 2
Ahora, recurrimos a la propiedad de “duplicación” de la Función Gamma, i.e.

1 √
22z−1 Γ (z) Γ z + = πΓ (2z)
2
tenemos que
1 √
22p−2k Γ p − k + (p − k)! = π (2p − 2k)!
2
quedan entonces los coeficientes determinados como
(2p)!
a2k =
22p+1 (2k)! (p − k)!
y, por lo tanto el desarrollo en la base de los polinomios de Hermite
p
(2p)! X H2k (x)
f (x) = x2p = −∞<x<∞
22p+1 (2k)! (p − k)!
k=0

Muestre que del mismo modo se puede encontrar

p
(2p − 1)! X H2k+1 (x)
f (x) = x2p+1 = −∞<x<∞
22p−1 (2k + 1)! (p − k)!
k=0
2
x2
Si f (x) = e−a con Re a2 > −1. Otra vez
∞
X
2
x2
f (x) = e−a = a2k H2k (x)
k=0
entonces Z ∞
1 2
+1)x2
a2k = 2k
√ e−(a H2k (x)dx
2 (2k)! π −∞
Sustituyendo H2k (x) por su expresión integral tendremos
Z ∞ " 2 Z ∞
#
2k+1
1 −(a2 +1)x2 2 (−1)k ex −t2 2k
a2k = 2k √ e √ e t cos 2xt dt dx
2 (2k)! π −∞ π 0
Z Z ∞
2(−1)k ∞ −a2 x2 −t2 2k
= e e t cos 2xt dt dx
π(2k)! −∞ 0
Z Z
2(−1)k ∞ −t2 2k ∞
−a2 x2
≡ e t e cos 2xt dx dt
π(2k)! 0 −∞
Z r
2(−1)k ∞ −t2 2k π −t2 /a2
= e t e dt =
π(2k)! 0 a2
Z ∞
2(−1)k 2 −2
=√ e−t (1+a ) t2k dt
π(2k)!a 0
Z ∞
(−1)k a2k 1
=√ e−s sk− 2 ds ← t2 (1 + a−2 ) = s
π(2k)! (1 + a2 )k+1/2 0

(−1)k a2k 1
=√ Γ k +
π(2k)! (1 + a2 )k+1/2 2
y ahora usando, otra vez la propiedad de “duplicación” de la función gamma,

1 √
22k Γ k + k! = π (2k)!
2
obtenemos
(−1)k a2k
a2k = k+1/2
22k k! (1 + a2 )
por lo tanto
∞
X
2
x2 (−1)k a2k
f (x) = e−a = k+1/2
H2k (x)
k=0 22k k! (1 + a2 )
Al igual que los polinomios de Legendre, los de Hermite, surgen tambián en sus orı́genes como soluciones a
la ecuación diferencial ordinaria del tipo
d2 Hn (x) dHn (x)
− 2x + nHn (x) = 0
dx2 dx
Vale decir

n Ecuación de Hermite Solución

d2 H0 (x) dH0 (x)
0 dx2 − 2x dx =0 H0 (x) = 1
d2 H1 (x) dH1 (x)

1 dx2 − 2x dx + 2H1 (x) = 0 H1 (x) = 2x
d2 H2 (x) dH2 (x)

2 dx2 − 2x dx + 4H2 (x) = 0 H2 (x) = 4x2 − 2
d2 H3 (x) dH3 (x)

3 dx2 − 2x dx + 6H3 (x) = 0 H3 (x) = 8x3 − 12x
d2 H4 (x) dH4 (x)

4 dx2 − 2x dx + 8H4 (x) = 0 H4 (x) = 16x4 − 48x2 + 12
Función Generatriz de los Polinomios de Hermite

Se puede encontrar una función generatriz H(t, x) de los polinomios de Hermite:
X∞
2xt−t2 H2 (x) 2 H3 (x) 2 Hn (x) n
H(t, x) = e = H0 (x) + H1 (x) t + t + t + ··· = t
2 3! n=0
n!
para la cual los Hn (x) son los coeficientes de su desarrollo en series de potencias. Es fácil darse cuenta que
esta expresión proviene del desarrollo en Serie de Taylor
X∞
2 1 ∂ n H(t, x)
H(t, x) = e2xt−t = n
tn ktk < ∞
n=0
n! ∂t t=0
para lo cual

∂ n H(t, x) 2 ∂ n −(x−t)2 n 2 dn −(u)2
= ex e = (−1) ex e = Hn (x)
∂tn t=0 ∂tn t=0 dun u=x
Relación de Recurrencia
A partir de la función generatriz se puede construir la siguiente identidad
∂H(t, x)
= (2x − 2t) H
∂t
y utilizando el desarrollo en series de potencias en t tendremos,
X∞ X∞ ∞
Hn (x) n−1 Hn (x) n X Hn (x) n+1
nt − 2x t + t =0
n=1
n! n=0
n! n=0
n!
 
X∞
1 
Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) tn = 0
n=0
n! | {z }
=0
Ası́ la relación de recurrencia será
Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) = 0

De igual modo, podemos partir de otra identidad

X∞ X∞
∂H(t, x) Hn′ (x) n Hn (x) n+1
= 2t H ⇒ t −2 t
∂x n=0
n! n=0
n!
y encontrar una relación para generar las derivadas de los polinomios de Hermite en término de ellos mismos:
Hn′ (x) = 2n Hn−1 (x), n = 1, 2, 3, · · ·
Finalmente, utilizando la ecuación anterior en la relación de recurrencia y derivando esa expresión una vez
más, queda como:
Hn+1 (x) − 2xHn (x) + Hn′ (x) = 0

Hn′′ (x) − 2xHn′ (x) + 2n Hn (x) = 0
con lo cual queda demostrado que los polinomios de Hermite son una solución particular de esa ecuación
diferencial.
y ′′ − 2xy ′ + 2ny = 0,
Donde hemos hecho y = Hn (x) Adicionalmente, haciendo un cambio cosmático podremos demostrar que
2
y = e−x /2 Hn (x) es solución de la ecuación diferencial autoadjunta

y ′′ + 2n + 1 − x2 y = 0
Ortogonalidad y Norma de los Polinomios de Hermite

En general estos polinomios cumplen con
Z ∞
√ 2
hHα |Hβ i = 2α α! π δαβ = e−x Hβ (x)Hα (x)dx
−∞
Donde la función delta de Kronecker es δαβ = 0 si α 6= β; y δββ = 1.

Para demostrar el caso α 6= β partimos de

uβ u′′α + 2α + 1 − x2 uα = 0

uα u′′β + 2β + 1 − x2 uβ = 0
restando miembro a miembro e integrando se tiene que:

′ ′
uα uβ − u′β uα + 2 (α − β) uα uβ = 0
Z ∞
2
(α − β) e−x Hβ (x)Hα (x)dx = 0
−∞
Z ∞
2
e−x Hβ (x)Hα (x)dx = 0 α 6= β;
−∞
ya que ∞
2
e−x /2
(2α Hα−1 (x)Hβ (x) − 2β Hβ−1 (x)Hα (x)) =0
−∞
Para encontrar el valor de la norma, procedemos a partir de la relación de recurrencia
Hn (x) (Hn (x) − 2xHn−1 (x) + 2(n − 1)Hn−2 (x)) = 0

Hn−1 (x) (Hn+1 (x) − 2xHn (x) + 2nHn−1 (x)) = 0

2
restando miembro a miembro, multiplicando por e−x e integrando entre (−∞, ∞) se obtiene
Z ∞ Z ∞
−x2 2 2
e Hα (x)dx = 2α e−x Hα−1
2
(x)dx
−∞ −∞
repitiendo la operación y recordando que al final queda

Z ∞
2 √
e−x x2 dx = 2 π
−∞
Obtenemos Z ∞
2 2 √
hHα |Hα i = kHα k = e−x Hα2 (x)dx = 2n n! π
−∞
Representación Integral de los Polinomios de Hermite

Los polinomios de Hermite pueden ser representados como
2 Z ∞
2n (−i)n ex 2
Hn (x) = √ e−t +2itx n
t dt
π −∞
que puede ser separada como

2 Z ∞
22n+1 (−1)n ex 2
H2n (x) = √ e−t t2n cos 2xt dt n = 1, 2, 3, · · ·
π 0
y paralos términos impares

2 Z ∞
22n+2 (−1)n ex 2
H2n+1 (x) = √ e−t t2n+1 sen 2xt dt n = 1, 2, 3, · · ·
π 0
La forma de llegar a cualquiera de estas últimas fórmulas se parte de las conocidas integrales desarrolladas
en el plano complejo Z ∞
2 2 2
e−x = √ e−t cos 2xt dt
π −∞
se deriva 2n veces a ambos miembros se utiliza la definición de los polinomios de Hermite.

Resumen de Propiedades Polinomios Hermite

Polinomios de Hermite
n
2 d 2
Hn (x) = (−1)n ex e−x , n = 0, 1, 2, ....
dxn
Definición n/2
X (−1) n! k
n−2k
Hn (x) = (2x)
k! (n − 2k)!
k=0
H0 (x) = 1; H1 (x) = 2x; H2 (x) = 4x2 − 2;
Ejemplos 3
H3 (x) = 8x − 12x H4 (x) = 16x5 − 48x2 + 12
Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) = 0
Relaciones de Recurrencia
Hn′ (x) = 2n Hn−1 (x), n = 1, 2, 3, · · ·
y ′′ − 2xy ′ + 2ny = 0
Ecuaciones Diferenciales 2
u′′ + 2n + 1 − x2 u = 0; u(x) = e−x /2 Hn (x)
∞
X Hn (x)
2
Función Generatriz H(t, x) = e2xt−t = tn
n=0
n!
2 Z ∞
22n+1 (−1)n ex 2
H2n (x) = √ e−t t2n cos 2xt dt
Representación Integral π 0
2 Z ∞
22n+2 (−1)n ex 2
H2n+1 (x) = √ e−t t2n+1 sen 2xt dt
π Z ∞ 0
α
√ 2
Ortogonalidad hHα |Hβ i = 2 α! π δαβ = e−x Hβ (x)Hα (x)dx
−∞
El Oscilador armónico, independiente del Tiempo, en Mecánica Cuántica.

La Ecuación de Schrödinger independiente del tiempo y en una dimensión es
d2 2µ
ψ(x) + 2 [E − U(x)] ψ(x) = 0
dx2 ~
con µ la “masa” de la partı́cula; E los niveles de energı́a y U(x) el potencial al cual estásometida la partı́cula.
En el caso que estudiemos un potencial U(x) = 21 µω 2 x2 en el cual la frecuencia angular del oscilador viene
representada por ω. La ecuación de Schrödinger se convierte en

d2 2µ 1 2 2
ψ(x) + 2 E − µω x ψ(x) = 0
dx2 ~ 2
p
haciendo un cambio de variable ξ = x µω/~ para adimensionalizar la ecuación, se obtiene

2E
ψ ′′ (ξ) + − ξ 2 ψ(ξ) = 0
~ω
la cual corresponde a la forma autoadjunta de la Ecuación de Hermite y por lo tanto identificamos

2E 1
= 2n + 1 ⇒ E = n + ~ω
~ω 2
con lo cual comprobamos la forma como viene cuantizada la energı́a en este sistema y la energı́a del estado
fundamental. Por su parte, la función de onda se podráexpresar en la base de soluciones de esa ecuación
∞
X ∞
X 2
ψ(ξ) = cn ψn (ξ) = cn e−ξ /2
Hn (ξ)
n=0 n=0

y se mantenemos la normalización
Z ∞ µω 1/4 1
ψn2 (ξ)dξ = 1 con cn = √
−∞ π~ 2n n!
7.4.3. MAPLE y los polinomios ortogonales

MapleV (9.5 y superiores) tiene predefinidos, como funciones., la mayor parte de los polinomios ortogo-
nales, Vale decir.
Legendre y sus asociados tanto de primera : LegendreP(n, x), LegendreQ(n, x), como de segunda
especie LegendreP(n, u, x), LegendreQ(n, u, x);
Hermite HermiteH(n, x)
Thebyshev de primera y segunda especie ChebyshevT(n, x) y ChebyshevT(n, x), respectivamente.

Laguerre: LaguerreL(n, a, x)
Jacobi: JacobiP(n, a, b, x)
donde n indica el orden del polinomio y x la variable con la cual se expresa. También existen varias bibliotecas
o paquetes que presentan facilidades para manipular polinomios ortogonales. Entre ellas podemos mencionar
OrthogonalSeries Paquete que permite manipular series de polinomios ortogonales. Permite expresar
una función polinómica como serie de polinomios ortogonales, multiplicar, sumar, derivar, cambiar de
base de polinomios, entre otras

> restart;with(OrthogonalSeries) :
> poli := 1+2*x+3*x^3 +4*x^5;
> S1 := ChangeBasis(poli,ChebyshevT(n,x)) ;
> S2 := ChangeBasis(poli,HermiteH(n,x)) ;
> S3 := ChangeBasis(S1,HermiteH(n,x));
Incorpora la biblioteca OrthogonalSeries; define un polinomo poli = 4x5 + 3x3 + 2x + 1 lo expresa

en serie de potencias en base de los polinomios de Tchebyshev (S1); o lo expresa como serie en la base
de polinomios de Hermite (S2); Toma la serie S1, expresada en la base de polinomios de Tchebishev
y las transforma a la base de polinomios de Hermite.
numapprox Paquete de subrutinas para aproximar funciones en término de series de algunos polinomios
ortogonales.
with(numapprox):
chebyshev(cos(x), x);
Expandirá la función cos x en series de polinomios de Tchebychev.

orthopoly. Un paquete casi obsoleto que habrá de ser eliminado tras la incorporación de los polinomios
ortogonales como funciones nativas de Maple
7.4.4. Planteamiento General para Polinomios Ortogonales

Hemos considerado un par de ejemplos de Polinomios Ortogonales. En ambos podemos idenficar algunas
caracterı́sticas comunes. En base a estas caracterı́sticas comunes definiremos otras familias de polinomios
ortogonales.
Nomenclatura Nombre a b w(x) Nn N0

2
Pn (x) Legendre −1 1 1
2n + 1
1 π
Tn (x) Tchebychev 1E −1 1 √ π
2 2
√ −x
1
π
Un (x) Tchebychev 2E −1 1 1 − x2
2
2√
Hn (x) Hermite −∞ ∞ e−x 2n n! π
Ln (x) Laguerre 0 ∞ e−x 1
Γ(n+α+1)
Lαn (x) Laguerre G 0 ∞ α −x
x e con α > −1 n!
Pnαβ (x) Jacobi −1 1 (1 − x)α (1 + x)β ver leyenda
Cuadro 7.1: Propiedades genéricas de los Polinomios Ortogonales, Nn indica la norma del polinomio de grado
2α+β+1 Γ(n + α + 1)Γ(n + β + 1)
n. En el caso de los polinomios de Jacobi, la norma es Nn = con
2n + α + β + 1 n!Γ(n + α + β + 1)
α > −1 y β > −1

Producto interno genérico, Norma y ortogonalidad

Los polinomios ortogonales se definen como un conjunto de polinomios {pn (x)} de orden n definidos en
un determinado intervalo a ≤ x ≤ b, los cuales son ortogonales respecto a una definición de producto interno
Z b
hpm |pn i = w(x)pm (x)pn (x)dx = hn δnm con w(x) > 0 una función peso en a ≤ x ≤ b
a
que garantiza que la norma sea finita en ese intervalo. Dado que el Teorema de Weierstrass garantiza que el
conjunto de polinomios {1, x, x2 , · · · , xn , · · · } es una base completa para un espacio vectorial E∞ , se procede
a ortogonalizar esa base con la definición de producto interno y el intervalo que corresponda. Para cada caso
tendremos una base ortogonal de polinomios.
Polinomio µn w(x) q(x)

Pn (−1)n 2n n! 1 1 − x2
(−1)n n+1 1
Tn √ 2 Γ n + 12 √ 1 − x2
π 1 − x2
(−1)n √
Un √ 2n+1 Γ n + 23 1 − x2 1 − x2
(n + 1) π
2
Hn (−1)n e−x 1
Ln n! e−x x
Lα
n n! xα e−x x
Cuadro 7.2: Funciones para determinar la Fórmula de Rodrigues generalizada
Haremos ahora un catálogo de las propiedades más resaltantes de estos polinomios. En el cuadro 7.1
resumimos las propiedades más resaltantes, com lo son: la función peso en el producto interno, el intervalo
en el cual están definidas estas fuciones y su norma.
Fórmula de Rodrigues genelarizada

En general todos los polinomios ortogonales {pn (x)} vienen definidos por la fórmula de Rodrigues gene-
ralizada
1 dn
pn (x) = (w(x)q(x)n )
w(x)µn dxn
donde w(x), q(x) y µn vienen especficados en el cuadro 7.2 para cada conjunto de polinomios ortogonales
Ejemplos de Polinomios Ortogonales

Utilizando la fórmula de Rodrigues generalizada, podemos construir algunos polinomios generalizados.
El cuadro 7.3 muestra algunos de ejemplos de estos polinomios ortogonales
Relaciones de Recurrencia
También se pueden formular, de manera genérica las realciones de recurrencia. Obviamente, las relaciones
de recurrencia también constituyen una forma alternativa de ir construyendo los polinomios ortogonales. Ası́,
un polinomio ortogonal genérico, pn (x), cumplirá
pn+1 (x) = (an + xbn )pn (x) − cn pn−1 (x)
El cuadro 7.4 contiene las expresiones de los coeficientes para construir las relaciones de recurrencia genera-
lizadas para cada uno de los polinomios

Polinomio n=0 n=1 n=2 n=3 n=4

1 1 1
Pn 1 x (3x2 − 1) (5x3 − 3x) (35x4 − 30x2 + 3)
2 2 8
Tn 1 x 2x2 − 1 4x3 − 3x 8x4 − 8x2 + 1
Un 1 2x 4x2 − 1 8x3 − 4x 16x4 − 12x2 + 1
Hn 1 2x 4x2 − 2 8x3 − 12x 16x4 − 48x2 + 12
1 2 −1 3 2 1 4
Ln 1 1−x 2 x − 2x + 1 6 (x − 9x + 18x − 6) 24 (x − 16x3 + 72x2 − 96x + 24)
Cuadro 7.3: Ejemplos de Polinomios Ortogonales
Polinomio an bn cn
2n + 1 n
Pn 0
n+1 n+1
Tn 0 2 1
Un 0 2 1
Hn 0 2 2n
2n + 1 1 n
Ln −
n+1 n+1 n+1
2n + 1 + α 1 n+α
Lα
n −
n+1 n+1 n+1
Cuadro 7.4: Funciones para determinar la Relación de Recurrencia Generalizada
Función generatriz generalizada

Para todos los polinomimos ortogonales podemos definir una función generatriz G(x, t), de tal manera
que cada uno de los polinomios ortogonales {pn (x)} será proporcional al coeficiente de tn del desarrollo en
series de Taylor, en potencias de t alrededor del punto x = 0. Esta función generatriz que constituye una
forma alternativa de definir los polinomios ortogonales viene expresada por la serie
∞
X
G(x, t) = Cn pn (x) tn con an constante
n=0
Las funciones generatrices no son exclusivas de los polinomios ortogonales. Como veremos más adelante,
existen funciones generatrices para las funciones de Bessel.
Ecuación diferencial para los Polinomios Ortogonales

Cada uno de los polinomios ortogonales habrá de ser solución de una ecuación diferencial ordinaria de la
forma
d2 pn (x) dpn (x)
g2 (x) + g1 (x) + αn pn (x) = 0
dx2 dx
En el cuadro 7.6 mostramos las expresiones para los coeficientes de las ecuaciones correspondientes a las
ecuaciones diferenciales para las cuales cada uno de los polinomio ortogonales es solución

Polinomio Cn G(x, t)
1
Pn 1 √
1 − 2xt + t2
1 − t2
Tn 2 +1
1 − 2xt + t2
1
Un 1
1 − 2xt + t2
1 2
Hn e2xt−x
n!
1n 2
H2n cos(2xt)et
(2n)!
1n 2
H2n+1 sen(2xt)et
(2n + 1)!
1 − 1−t xt
Ln 1 e
1−t
1 xt
Lα
n 1 e− 1−t
(1 − t)α
Cuadro 7.5: Funciones para determinar la función generatriz generalizada
Polinomio g2 (x) g1 (x) αn

Pn 1 − x2 −2x n(n + 1)
Tn 1 − x2 −x n2
Un 1 − x2 −2x n(n + 1)
Hn 1 −2x 2n
Ln x 1−x n
Lα
n x 1−x+α n
Pnαβ 1 − x2 β − α − x(2 + α + β) n(n + α + β + 1)
Cuadro 7.6: Funciones para determinar la ecuación diferencial para la cual son solución los polinomios
ortogonales
7.4.5. Un par de aplicaciones de ejemplos

Interpolación polinomial de puntos experimentales
Muchas veces nos encontramos con la situación en la cual tenemos un conjunto de (digamos n) medidas
o puntos experimentales {(x1 , y1 = f (x1 )), (x2 , y2 = f (x2 )), · · · , (xn , yn = f (xn ))} y para modelar ese
experimento quisiéramos una función que ajuste estos puntos. El tener una función nos provee la gran ventaja
de poder intuir o aproximar los puntos que no hemos medido. La función candidata más inmediata es un
polinomio y debemos definir el grado del polinomio y la estrategia que aproxime esos puntos. Si queremos
aproximar esos puntos por una recta el Método de Mı́nimos Cuadrados es el más utilizado7 . Puede ser que
no sea lineal el polinomio y queramos ajustar esos puntos a un polinomio tal que éste pase por los puntos
experimentales. Queda entonces por decidir la estrategia. Esto es si ajustamos la función como “trozos”
de polinomios que ajusten a subconjuntos {(x1 , y1 = f (x1 )), (x2 , y2 = f (x2 )), · · · , (xm , ym = f (xm ))} con
m < n. de los puntos experimentales En este caso tendremos una función de ajuste, para cada conjunto de
7 Para detalles pueden consultar Luis A. Núñez Formulario de Métodos Matemáticos 1. Grupos, SubEspacios,
Independencia Lineal y Bases para un Espacio Vectorial Lineal http://webdelprofesor.ula.ve/ciencias/nunez/

cursos/MetodosMatematicos1/B2005/Met1ClsEspVect105A.pdf

Figura 7.3: En el lado izquierdo se muestran los puntos experimentales son

{(2, 8), (4, 10), (6, 11), (8, 18), (10, 20), (12, 34)} y a la derecha la función polinómica que los interpola
puntos. También podemos a ajustar la función a todo el conjunto de puntos experimentales y, en ese caso el
máximo grado del polinomio que los ajuste será de grado n − 1. Para encontrar este polinomio lo expresamos
como una combinación lineal de Polinomios de Legendre. Esto es


 y1 = f (x1 ) = C0 P0 (x1 ) + C1 P1 (x1 ) + · · · + Cn−1 Pn−1 (x1 )
n−1
X 
 y2 = f (x2 ) = C0 P0 (x2 ) + C1 P1 (x2 ) + · · · + Cn−1 Pn−1 (x2 )
P(x) = f (x) = Ck Pk (x) ⇒ ..

 .
k=0 

yn = f (xn ) = C0 P0 (xn ) + C1 P1 (xn ) + · · · + Cn−1 Pn−1 (xn )
que no es otra cosa que un sistema de n equaciones con n incógnitas: los coeficientes {C0 , C1 , · · · Cn−1 } Al
resolver el sistema de ecuaciones y obtener los coeficientes, podremos obtener la función polinómica que
intermpola esos puntos. Una expansión equivalente se pudo haber logrado con cualquier otro conjunto de
polinomios ortogonales, que ellos son base del espacio de funciones. Es importante hacer notar que debido
a que los polinomios de Legendre está definido en el intervalo [−1, 1] los puntos experimentales deberán
re-escalarse al ese intervalo para poder encontrar el polinomio de interpolación como combinación lineal de
los Polinomios de Legendre.
Consideremos los puntos experimentales representado en la figura 7.3. Al construir el sistema de ecua-

ciones obtendremos
−8 + C0 − C1 + C2 − C3 + C4 − C5 =0
3 1 9 51 477
−10 + C0 − 5 C1 + 25 C2 + 25 C3 − 125 C4 + 3125 C5 =0
1 11 7 29 961
−11 + C0 − 5 C1 − 25 C2 + 25 C3 + 125 C4 − 3125 C5 =0
1 11 7 29 961
−18 + C0 + 5 C1 − 25 C2 − 25 C3 + 125 C4 + 3125 C5 =0
3 1 9 51 477
−20 + C0 + 5 C1 + 25 C2 − 25 C3 − 125 C4 − 3125 C5 =0
−34 + C0 + C1 + C2 + C3 + C4 + C5 =0
y al resolver el sistema obtendremos que
2249 3043 1775 175 625 14375
C0 = , C1 = , C2 = , C3 = − , C4 = , C5 =
144 336 504 216 336 3024
con lo cual
2249 3043 1775 175 625 14375
P(x) = f (x) = + x+ P (2, x) − P (3, x) + P (4, x) + P (5, x)
144 336 504 216 336 3024
la interpolación queda representada en al figura 7.3.
Es importante señalar que mientras más puntos experimentales se incluyan para la interpolación, el
polinomio resultante será de mayor grado y, por lo tanto incluirá oscilaciones que distorcionarán una apro-
ximación más razonable. Por ello, la estrategia de hacer la interpolación a trozos, digamos de tres puntos en
tres puntos, generará un mejor ajuste, pero será una función (un polinomio) contı́nuo a trozos.
Cuadratura de Gauss-Legendre
Una de los usos más comunes de los polinomios ortogonales es para aproximar funciones, en particular
integrales que requieren ser resueltas numéricamente. La idea es aproximar una integral, para una funcion
f (x), definida en el intervalo [a, b] y suficientemente bien comportada, por una suma finita de términos
ck f (xk ) y estimar el error que cometemos en esta aproximación. Esto es
Z b N
X
f (x)dx = ck f (xk ) + EN
a k=1
Nótese que la intención es utilizar la función a integrar evaluada en un conjunto de puntos estratégicos para
los cuales están definidos unos coeficientes, también inteligentemente seleccionados. Es decir se requieren 2N
números (ck y los xk con k = 1, 2, · · · N ). Más aún, esas 2N cantidades pueden ser seleccionadas de forma
tal que la aproximación es exacta EN = 0 cuando f (x) es un polinomio de grado ≤ 2N − 1
Supongamos, para empezar que la función f (x) está definida para x ∈ [−1, 1]8 y por lo tanto los polinomios
ortogonales que seleccionaremos para aproximar la integral (y la función) serán los del Legendre (igual
pudimos haber utilizado los polinomios de Tchebychev), con lo cual
X∞ Z 1 Z
1 1 1
f (x) = ak Pk (x) donde, como siempre ak = n + dx f (x)Pk (x) y a0 = dx f (x)
2 −1 2 −1
k=0
“ ” “ ”
8 ésta b−a b+a
no es una limitación muy severa porque siempre podemos hacer un cambio de variable del tipo x = 2
t+ 2
y convertir cualquier intervalo cerrado [a, b] en un intervalo cerrado [−1, 1]

Con lo cual
Z N N ∞
! ∞ N
!
1 X X X X X
f (x)dx ≈ ck f (xk ) = ck an Pn (xk ) = an ck Pn (xk )
−1 k=1 k=1 n=0 n=0 k=1
quedan todavı́a por determinar los pesos ck y los puntos xk . Para ello procedemos de la siguiente forma.
Notamos que PN (x) tiene N raı́ces, x = xj , en el intervalo −1 ≤ x ≤ 1. Entonces, si seleccionamos esos
puntos x = xj para evaluar la función f (xk ) se anulan el coeficiente para el término aN y, además podremos
encontrar los pesos ck resolviendo el sistema de N ecuaciones de la forma
N
X N
X N
X
cj P0 (xj ) = cj = 2 ∧ cj Pk (xj ) = 0 para k = 1, 2, · · · N − 1
j=1 j=1 j=1
donde los Pk (xj son los distintos polinomios evaluados en las raı́ces del polinomio de grado N , i.e. PN (xj ) = 0
Se puede demostrar que la solución de este sistema provee los pesos escritos de la forma
2
cj = !2
dPN (x)
(1 − x2j )
dx x=xj
Más aún, podremos, de esta forma, escribir

Z N ∞ N
!
1 X X X
f (x)dx ≈ ck f (xk ) = 2a0 + EN con EN = an ck Pn (xk )
−1 k=1 n=N +1 k=1
pero como
Z 1 Z 1 N
X
1
a0 = dx f (x) ⇒ dx f (x) = ck f (xk ) − EN
2 −1 −1 k=1
Es decir, demostramos que es posible aproximar la integral del la función con un promedio pesado de la
función evaluada en unos puntos estratégicos. Los puntos estratégicos son los ceros del polinomio de Legendre
de grado igual al número de puntos con los cuales se quiere aproximar la función y los pesos vienen de resolver
las ecuaciones para los coeficientes de la expansión.
En el cuadro 7.7 se ilustran los valores de los puntos de interpolación y sus pesos correspondientes.
Es inmediato comprobar que si f (x) es un polinomio de grado ≤ N − 1 la aproximación es exacta y el
error es nulo. Pero lo que realmente hace útil a este tipo de aproximaciones es que también será exacta para
polinomios de grado ≤ 2N − 1. Esto se puede ver si expresamos un polinomio de grado 2N − 1 como la suma
de dos polinomios
f (x) = PN (x)Y1 (x) + Y2 (x)
donde Y1 y Y2 son polinomios de grado N − 1. Entonces, al integrar miembro a miembro
Z 1 Z 1 Z 1
dx f (x) = dx PN (x)Y1 (x) + dx Y2 (x)
−1 −1 −1
| {z }
=0
el primer término se anula por ser PN (x) ortogonal a cualquier polinomio de grado inferior, y el segundo
término no es más que el caso que analizamos anteriormente de un polinomio de grado ≤ N − 1

2
N xj = fsolve(P(N,x),x,complex) cj = !2 2N − 1
dPN (x)
(1 − x2j )
dx x=xj
2 ±0,5773502692 1,0 3
3 0,0 0,88888889 5
±0,7745966692 0,55555555
4 ±0,3399810436 0,65214515 7
±0,8611363116 0,34785485
5 0,0 0,56888889 9
±0,5384693101 0,47862867
±0,9061798459 0,23692689
6 ±0,2386191861 0,46791393 11
±0,6612093865 0,36076157
±0,9324695142 0,17132449
.. .. .. ..
. . . .
Cuadro 7.7: Puntos y pesos para una cuadratura de Gauss-Legendre
Estrategia General para cuadraturas de Gauss

Para el caso general. Vale decir la aproximación de una integral
Z b N
X
dx w(x)f (x) ≈ ck f (xk )
a k=1
donde las {x1 , · · · xk , · · · xN } son los ceros del polinomio ortogonal, de grado N , pN (x), elegido para hacer
esta aproximación. Los N pesos {c1 , · · · ck , · · · cN } surgen de resolver el sistema de ecuaciones
N
X Z b N
X
h0
cj = con h0 = w(x)p20 (x)dx ∧ cj Pk (xj ) = 0 para k = 1, 2, · · · N − 1
j=1
p20 a j=1
Ası́ para aproximar integrales con funciones pesos, w(x), utilizaremos cuadraturas adaptadas a los polinomios
ortogonales. Esto es
Z ∞ Z ∞ Z 1
−x −x2 f (x)
dx e f (x) ⇒ Laguerre dx e f (x) ⇒ Hermite dx √ ⇒ Tchebychev
0 −∞ −1 1 − x2
7.5. Series y transformadas de Fourier

7.5.1. Generalidades
Otro de los casos de expansión en una base completa de funciones lo constituyen la base de Fourier. En este
∞
caso la serie de Fourier la constituyen funciones continuas, reales de variable real y definidas en [0, 2π], C[0,2π] ,
en término de funciones trigonométricas. Esto es el conjunto de funciones {|u1 i , |u2 i , |u3 i , · · · , |un i · · · }
representadas por
|u0 i = 1, |u2n i = cos nx y |u2n−1 i = sen nx, con n = 1, 2, 3, · · ·

Figura 7.4: Expansiones de Varias funciones en sumas parciales de Series de Fourier. Tomado de Eric
W. Weisstein. Fourier Series. MathWorld–A Wolfram Web Resource. http://mathworld.wolfram.com/
FourierSeries.html
Es claro que {|u1 i , |u2 i , |u3 i · · · , |un i , · · · } es un conjunto de funciones ortogonales por cuanto
  R 2π

 
 0 dx sen nx sen mx = 0

 


 
 R



 0 si n 6= m 2π
dx cos nx sen mx = 0

  0

 

 


  R 2π dx cos nx cos mx = 0

 0
2
hun |um i = δnm k|un ik ⇒  R 2π



 
 dx = 2π

 
 0

 
 R

 2

 k|un ik si n = m 2π
dx cos2 nx = π

  0

 

 

  R 2π dx sen2 nx = π

0
con l = 1, 2, 3, · · · también. Por lo tanto, podremos construir una base ortonormal de funciones
{|e1 i , |e2 i , |e3 i , · · · , |en i , · · · } de la forma
1 1 1
|e0 i = √ , |e2n i = √ cos nx y |e2n−1 i = √ sen nx.
2π π π
Tal y como se muestra en la figura 7.4 disntintas funciones pueden ser expandidas con sumas parciales de
Fourier. A diferencia de las series de potencias, que imponen que las funciones a ser expandidas deben ser
contı́nuas y contı́nuamente diferenciables en el intervalo, la series de Fourier pueden representar funciones
contı́nuas a trozos, siempre y cuando cumplan con algunas condiciones.

como
 R 2π
 √1 dx f (x) = c0 ≡ a0 si i=0

 2π 0


∞
X  R 2π
|f i = ci |ei i ⇒ ci = hei |f i = √1 dx f (x) cos(nx) = c2n ≡ am si i = 2n
 π 0
i=0 


 R 2π
 √1
π 0
dx f (x) sen(nx) = c2n−1 ≡ bm si i = 2n − 1
donde los ci son los coeficientes de Fourier, con lo cual

∞
a0 X
F (x) = + (an cos(nx) + bn sen(nx))
2 n=1
y equivalentemente si el perı́odo es T y para un un x0 genérico

 R x0 +T
2

 a0 = T dx f (x)


x0
∞
X 

a0 2πnx 2πnx 2
R x0 +T 2πnx

F (x) = + an cos + bn sen con an = T x0
dx f (x) cos T
2 T T 

n=1 


 2
R x0 +T 2πnx

bn = T x0
dx f (x) sen T
La figura 7.4 muestra la aproximación de las distintas sumas parciales para distintas funciones. A medida
que aumentamos el número de términos la aproximación mejora. Nótese que hemos utilizado F (x) ≡ F∞ (x)
para indicar el lı́mite de la suma parcial FN (x) para n = N de la expresión de una función f (x) expresada
en series de Fourier.
Pero más aún, podemos expresar la expansión de una serie de Fourier de manera más compacta atenden-
diendo a las expresiones anteriores. Esta expresión se conoce en algunos ámbitos como la expresión integral
para la series de Fourier
Z 2π
1
F (x) = √ dt f (t)
2π 0
X∞ Z 2π Z 2π
= + dt f (t) cos(nt) cos(nx) + dt f (t) sen(nt) sen(nx)
n=1 0 0
Z 2π ∞ Z
X 2π
1
F (x) = √ dt f (t) + dt f (t) cos(n(t − x))
2π 0 n=1 0
También es muy común expresar una serie de Fourier en término de una base compleja. Vale decir
· · · |φ̃k i · · · ↔ {· · · e−ikx · · · } con k = 0, ±1, ±2, · · · . Con lo cual
∞
X ∞
X Z π
hφ̃k |f i 1
|f i = C̃k |φ̃k i ≡ C̃k e−ikx con C̃k = = dx e−ikx f (x)
hφ̃k |φ̃k i 2π −π
k=−∞ k=−∞
Utilizando esta otra expresión podremos reescribir (una vez más) la expresión de una suma parcial de la
Serie de Fourier. Dado que
Z
1 π
an cos(nx) + bn sen(nx) = dt f (t) cos(n(t − x))
π −π

tendremos que
n n Z
a0 X a0 X 1 π
Fn (x) = + (ak cos(kx) + bk sen(kx)) = + dt f (t) cos(n(t − x))
2 2 π −π
k=1 k=1
"Z #
π n1 X n o
= ℜ dt f (t) + e−i(t−x)k
−π 2
k=1
y al sumar la progresión geometrica que representa una serie de exponenciales llegamos a

Z π " # Z π
1 sen n + 21 (t − x) 1
Fn (x) = dt f (t) ≡ dt f (t) K(x, n, t)
2π −π sen 12 (t − x) 2π −π
la cual siempre es convergente y el término

" #
sen n + 12 (t − x)
K(x, n, t) =
sen 21 (t − x)
se conoce como el núcleo de la transformación de F , el (Kernel ) de Dirichlet

La pregunta básica que sigue es, en todos estos casos,: ¿ cómo se relaciona la expansión de Fourier
|f i ⇔ F (x) con la función f (t) que genera los coeficientes de la expansión ? Nótese que es una forma de
mirar una relación entre F (x) ↔ f (t). Pasamos de f (t) a F (x) mediante una “transformación”
Z π
1
Fn (x) = dt f (t) K(x, n, t)
2π −π
Este tipo de relaciones se denomina transformación integral y en particular ésta es una de las expresiones
de las llamadas Transformaciones de Fourier las cuales trataremos más adelante en la sección 7.5.6.
7.5.2. Las Condiciones de Dirichlet y el Teorema de Fourier

Condiciones de Dirichlet
Las condiciones que una determinada función f (x) debe cumplir para poder ser representada como una
serie de Fourier, se conocen con el nombre de condiciones de Dirichlet9 las cuales pueden ser esquematizadas
en los siguientes puntos. Para que una función f (x) sea susceptible de ser expandida en series de Fourier
debe ser
periódica
univaluada y contı́nua a trozos (contı́nua menos, en un número finito de puntos) con un número finito
de máximos y mı́nimos
R T /2
la integral −T /2 dx|f (x)| debe ser convergente. Donde [−T /2, T /2] quiere indicar el intervalo de defi-
nición de una función con perı́odo T .
Podemos formalizar un poco más las condiciones de Dirichlet en el llamado Teorema de Fourier.
9 Johann Peter Gustav Lejeune Dirichlet 1805 - 1859 Matemático Alemán con importantes contribuciones en Teorı́as
de números Algebráica, Series y aproximaciones de funciones y ecuaciones diferenciales parciales

Teorema de Fourier
Sea f (x) una función en el intervalo −π ≤ x ≤ π y definida para el resto de la recta real tal que cumpla
con f (x + 2π) = f (x). Es decir f (x) es 2π−periódica. Supongamos además que existe
Z π Z π
1
dx f (x) con lo cual C̃k = dx e−ikx f (x) con k = 0, ±1, ±2, · · · .
−π 2π −π
y si |f (x)| está acotada para un intervalo [a, b] con −π < a ≤ x ≤ b < π, entonces
X∞
1
F (x) = C̃k e−ikx es convergente al valor F (x) = lı́m f (x + ǫ) + lı́m f (x − ǫ)
2 ǫ→0+ ǫ→0−
k=−∞
y si f (x) es contı́nua en x = x0 entonces F (x0 ) → f (x0 ).

En este punto se pueden puntualizar varias cosas

El valor F (x) = 12 lı́mǫ→0+ f (x + ǫ) + lı́mǫ→0+ f (x − ǫ) al cual converge la expansión de Fourier,
cobra particular importancia cuando el punto x = x0 es una discontinuidad. Tal y como veremos más
adelante (sección 7.5.5) y expresa este teorema, las series de Fourier son particularmente apropiadas
para expandir funciones discontı́nuas (en un número finito de puntos en el intervalo), sin embargo,
por ser una base de funciones contı́nuas no puede reproducir la discontinuidad como tal. La expansión
de Fourier alrededor de un punto de discontinuidad x → x±0 tenderá al valor F (x) → F (x±0 ) ≡ Fm
donde Fm = F (x+0 )+F2
(x−0 )
. Es decir, tenderá al valor medio de los valores de la discontinuidad por la
izquierda F (x−0 ) y por la derecha F (x+0 ).
Si los coeficientes de Fourier tienen variaciones acotadas en el intervalo y |C̃k | → 0 con k → ∞.
Entonces
X∞ Z π ∞ Z
1 1 2 X 2 1 π
|C̃k |2 = dx |f (x)|2 ⇔ a0 + |an + b2n | = dx |f (x)|2
2π −π 2 n=1
π −π
k=−∞
que no es otra cosa que la expresión de la completitud de esta base de funciones.
7.5.3. Algunos ejemplos de expansiones en series de Fourier

Para ilustrar esta relación entre la función f (x) y su expansión en serie de Fourier F (x) analicemos
algunos ejemplos tı́picos
Ondas Cuadradas
Para empezar, el caso de una función muy conocida en el ámbito de los circuitos eléctrico. Una onda
cuadrada

 −1 si − 21 T ≤ t < 0 Z T2 Z T2
2 2πnt 4 2πnt
f (t) = ⇒ bn = dt f (t) sen = dt f (t) sen
 T − T2 T T 0 T
+1 si 0 ≤ t ≤ 12 T
porque los coeficientes pares (an ) se anulan. Entonces

2 4 sen3ωt sen5ωt sen7ωt
bn = (1 − (−1)n ) ⇒ f (t) = senωt + + + + ···
nπ π 3 5 7

Figura 7.5: Un par de funciones, definidas con un perı́do T , a ser expresadas en como expansiones en Series
de Fourier. En los cuadrantes
I y II, encontramos una onda cuadrada. La primera (cuadrante I) definida en
un intervalo − T2 , T2 y en el cuadrante II la misma función definida en un intervalo (0, T ). El cuadrante III
ilustra las aproximaciones de la serie de Fourier para n = 3, 7, 20, mientras que el espectro de potencia se
presenta en el cuadrante IV. La onda “diente de sierra”, definida en un intervalo (0, T ), se presenta en el
cuadrante V. Sus aproximaciones en series de Fourier para n = 3, 7, 10 se pueden observar en el cuadrante
VI, mientras que el espectro de potencia en el cuadrante VII.
los coeficientes pares b2n se anulan y además hemos denotado ω = 2π/T . Al definir la función ω podemos
interpretar los coeficientes de Fourier an , bn como las contribuciones de cada uno de los armónicos an , bn →
ωn = 2nπ/
T . A partir de estas contribuciones se construye el espectro de potencia, el cual está prelacionado
con la energı́a que aporta cada uno de estos armónicos. Por ello construimos un ı́ndice En = a2n + b2n y
graficamos En vs n tal y como se puede comprobar en la figura 7.5, cuadrantes IV y VII. Se encuentra que
se puede asociar un espectro de potencia a cada señal y con lo cual realizar una especie de identificación.
En este punto podemos hacernos un par de preguntas

¿ qué´hubiera pasado si en vez de considerar el intervalo − T2 , T2 hubieramos considerado (0, T ) ?
¿ tendrı́amos el mismo desarrollo en serie de Fourier ?
¿ el mismo espectro ?
Justifique sus respuestas.
Variedades de dientes de sierra

Otra función muy común es la denominada dientes de sierra
 RT
 2

 a0 = T 0
dt f (t) = aT



 RT
2 2πnt
f (t) = at si 0 ≤ t ≤ T con a constante ⇒ an = T 0
dt f (t) cos T =0





 RT −aT
 bn = 2
dt f (t) sen 2πnt
=
T 0 T nπ

si adicionalmente suponemos a = 3, tendremos que la expansión en serie tomarı́a la forma

6sen (π t) 3sen (2 π t) 2sen (3 π t) 3sen (4 π t) 6sen (5 π t)
f (t) = 3t = 3 − − − − − + ··· para 0 ≤ t ≤ T
π π π 2π 5π
La figura 7.5 (cuadrantes V y VI) muestra la construcción de esta función y su representación en Series de
Fourier.
A partir de esta función podemos hacer unas variaciones. Por ejemplo considérese la función
 R T /2

 a0 = T2 −T /2 dt f (t) =0





 R T /2
−T T an = T2 −T /2 dt f (t) cos 2πnt =0
f (t) = at si ≤t≤ con a constante ⇒ T
2 2 




 b = 2 R T /2 dt f (t) sen 2πnt = − aT (−1)
 n
 n T −T /2 T nπ
Claramente es una función impar f (−x) = −f (x) y ası́ lo refleja su expansión en series de Fourier. Si hacemos
a = 3 y T = 2 → ωn = nπ tendremos que la expresión para de la serie es
6sen (π t) 3sen (2 π t) 2sen (3 π t) 3sen (4 π t) 6sen (5 π t) −T T
f (t) = 3t = − + − + + ··· con ≤t≤
π π π 2π 5π 2 2
la cual, si bien es parecida no es igual a la anterior, debido que estamos expandiendo otra función.
Otra variación posible de la función “diente de sierra” puede ser la versión completamente par del “diente”,
f (−x) = f (x). Esta es
 R
 2 T /2
 a0 = T −T /2 dt f (t)
 = T2a
 

−T
 −at si 2 ≤ t ≤ 0 
 R T /2 n
f (t) = ⇒ an = T2 −T /2 dt f (t) cos 2πnt T = T a((−1)
n 2 π2
−1)
 T 

at si 0 ≤ t ≤ 2 


 b = 2 R T /2 dt f (t) sen 2πnt = 0

n T −T /2 T
En este caso son los términos impares los que se anulan. Adicionalmente, nótese que para n par, los coeficientes
pares también se anulan, Otra vez, si hacemos a = 3 y T = 2 → ωn = nπ tendremos la serie
3 12 cos (π t) 4 cos (3 π t) 12 cos (5 π t) −T T
f (x) = − − − + ··· con ≤t≤
2 π2 3π 2 25 π2 2 2
Función cuadrática
Otro caso, complementario al anterior por sus propiedades de simetrı́a, es la expansión en series de Fourier
de la función f (x) = x2 para −π < x < π. Entonces los coeficientes se la expansión serán

 R
1 π 2π 2

 a = dx x2
=
 0 π −π 3
f (x) = x2 ⇒

 R n
 an = 2 π dx x2 cos(nx) = 4(−1)

π 0 π 2 n2
ya que los coeficientes correspondientes a los términos impares bn se anulan. Con lo cual
X∞
π2 (−1)n cos(nx)
x2 = +4
3 n=1
n2

Nótese que como un resultado particular, al evaluar en x = π, se tiene la función zeta de Riemann ζ(2)
X∞ X∞
π2 1 1 π2
π2 = +4 2
⇒ ζ(2) ≡ =
3 n=1
n n=1
n2 6
Pero este caso se presta también para considerar funciones no periódicas. Supongamos que queremos
desarrollar la expansión de Fourier para f (x) = x2 pero en este caso con 0 < x < 2. Si este fuera el caso,
empezamos por suponer que la función tienen un perı́odo, digamos T = 4. Esto es −2 ≤ x ≤ 2. Con lo cual
Z Z
2 2 4 2 8
a0 = dx x2 = dx x2 =
4 −2 4 0 3
Z Z 2 πnx
2 2 2πnx 4 16 16
an = dx x2 cos = dx x2 cos = 2 2 cos nπ = 2 2 (−1)n
4 −2 4 4 0 2 π n π n
Con lo cual tendremos que
4 X∞
(−1)n πnx
x2 = + 16 cos para 0 < x ≤ 2
3 n=1
π 2 n2 2
7.5.4. Consideraciones de Simetrı́a en series de Fourier

Es de hacer notar que esta propiedades de simetrı́a respecto al perı́odo de la función (f (x) = f (−x)
simetrı́a y f (x) = −f (−x) antisimetrı́a) para un perı́odo − T2 ≤ x ≤ T2 pueden y deben ser explotadas para
simplificar los cálculos. Esto se puede resumir en

an 6= 0 an = 0
f (x) = f (−x) ⇒ y alternativamente f (x) = −f (−x) ⇒
bn = 0 bn 6= 0
Pero más interesante aún es cuando estas propiedades de simet’ria
se presentan en un cuarto del perı́odo.
Vale decir, que f (x) será par o impar respecto a T /4 i.e. f T4 + x = ±f T4 − x ⇒ f (−s) = ±f (s) donde
s = T4 − x. Entonces
Z
2 x0 +T 2πns πn
bn = ds f (s) sen +
T x0 T 2
Donde los lı́mites de integración no se han visto alterados porque la función es periódica. Es inmediato
comprobar que
πn πn
2πns πn 2πns 2πns
sen + = sen cos + cos sen
T 2 T 2 T 2
es decir
πn Z x0 +T πn Z x0 +T !
2 2πns 2πns
bn = cos ds f (s)sen + sen ds f (s) cos
T 2 x0 T 2 x0 T

por lo que si n = 2k ⇒ sen πn2 = sen(πk) = 0 y si n = 2k − 1 ⇒ cos 2k−12 π = 0. Ta misma consideración
se puede hacer para los coeficientes an (queda como ejercicio para el lector) y se puede concluir que
Si f (x) par en T /4 entonces a2n−1 = b2n = 0
Si f (x) impar en T /4 entonces a2n = b2n−1 = 0

Figura 7.6: Aproximación por series de Fourier para la función escalón {f (x) = 0 para −∞ < x < 1 y f (x) =
1 para x ≥ 0} Las curvas corresponden a sumas parciales de Fourier: F40 (x), F100 (x), F200 (x),
7.5.5. Tratamiento de discontinuidades

Tal y como hemos mencionado, a diferencia de las series de potencias, las series de Fourier manejan razo-
nablemente bien las discontinuidades, pero por ser una base de funciones contı́nuas, no puede reproducirlas.
Tal y como comentamos en el Teorema de Fourier (sección 7.5.2) y muestra la figura 7.6 el valor de las sumas
parciales de Fourier en un punto de discontinuidad x = x±0 será el promedio de los valores F (x−0 ) (por la
izquierda) y F (x+0 ) (por la derecha) en la discontinuidad. Esto es la expansión de Fourier alrededor de un
punto de discontinuidad x → x±0 tenderá al valor F (x) → F (x±0 ) ≡ Fm donde Fm = F (x+0 )+F 2
(x−0 )
.
El Fenómeno de Gibbs
Pero también se muestra en esa figura 7.6 que, tanto por la izquierda como por la derecha la discontinuidad
de la función escalón, las sumas parciales de Fourier oscilan y no convergen a los valores x±0 . El comporta-
miento oscilante de las sumas parciales de Fourier alrdedor de las discontinuidades, que no desaparecen ni
en el lı́mite se denominan fenómeno de Gibbs en honor a su descubridor Josiah Willard Gibbs10
Para entender qué pasa en la discontinuidad consideremos una variación de la onda cuadrada considerada
anteriormente (7.5.3). Entonces sus sumas parciales serán

 1 si 0 ≤ t < π 1
n
2X 1
c
f (t) = ⇒ F2n (x) = + sen((2k − 1)x)
 2 π 2k − 1
0 si π ≤ t < 2π k=1
porque los coeficientes pares (an ) se anulan. Para estudiar el fenómeno de Gibbs reescribimos la suma parcial
anterior de una manera ingeniosa
n Z t Z n
! Z
c 1 2X 1 2 t X 1 1 t sen(2ns)
F2n (t) = + ds cos(2k − 1)s = + ds cos(2k − 1)s = + ds
2 π 0 2 π 0 2 π 0 sen(s)
k=1 k=1
donde, utilizando la fórmula de Moivre y convirtiendo esa serie de cosenos en una de exponenciales la cual,
10 Josiah Willard Gibbs 1839 - 1903 Algunos lo consideran el primer Fı́sico Norteamericano, de hecho fue el primero en
recibir un tı́tulo de doctorado por una universidad norteameicana (Yale University). Hizo importantes aportes en electromagne-
tismo y sobre todo en termodinámica y fı́sica estadı́stica, sentando las bases matemáticas para estas disciplinas. En matemáticas
es conocido su estudio de las oscilaciones de las expansiones de las series de Fourier en los puntos de discontinuidad. Más detalles
http://www-history.mcs.st-and.ac.uk

a su vez es una progresión geométrica (y le queda la comprobación al lector), hemos sustituido

n
X sen(2ns)
cos(2k − 1)s =
sen(s)
k=1
c
Es inmediato convencerse que las sumas parciales F2n (x) siempre tendrán máximos y mı́nimos
c
dF2n (x) sen(2nx) mπ
= =0 ⇒ para x = con m = 1, 2, 3, · · ·
dx sen(x) 2n
Las Series de Fourier tienden a sobre-estimar el valor de los puntos de discontinuidad en ±18 % esto es
un valor de ≈ 1,1789797. La inclusión de más términos en las sumas parciales no mejoran la situación. El
fenómeno de Gibbs no se restringe a Series de Fourier sino que también se presenta en las demás series de
funciones (ver detalles en la referencia [3]) .
El fenómeno de Gibbs fue observado ¡ experimentalmente ! por primera vez por Albert Michelson11 Para
finales de 1800 Michelson habı́a creado un dispositivo mecánico para medir las componentes de Fourier de
señales eléctricas. Al incorporarle una onda cuadrada observó que una oscilación inesperada en los puntos
de discontinuidad. Creyó que esa oscilación se debı́a a defectos del dispositivo. Luego de probar múltiples
tipos de señales periódicas y observar un comportamiento similar, decidió comentárselo a su amigo Willard
Gibbs, de la Universidad Yale. Al poco tiempo Gibbs volvió una explicación que dejó intacta la fama de
Michelson como instrumentista. El fenómeno es una consecuencia de la teor’ria de series de Fourier y no del
equipo diseñado por Michelson12 .
Corrección al fenómeno de Gibbs: Factor σ de Lanczos

Una de las estrategia para corregir las oscilaciones del fenómeno de Gibbs se le debe a Lanczos13 Consi-
derando el mismo caso de la función onda cuadrada, se puede intentar sustituir la función oscilante Fnc (x)
por su promedio F̄nc (x) alrededor del punto x. Vale decir
Z π Z π
" n
#
c c n x+ 2n c n x+ 2n 1 2X 1
F2n (x) → F̄2n (x) = ds F2n (s) = ds + sen((2k − 1)s)
π x− 2n
π π x− 2n
π 2 π 2k − 1
k=1
desarmando tendremos que

Z π
" n
#
c n x+ 2n
1 2X 1
F̄2n (x) = ds + sen((2k − 1)s)
π π
x− 2n 2 π 2k − 1
k=1
" n π #
x+ 2n
n π 2X 1

= + cos((2k − 1)s)
π 2n π (2k − 1)2 π
x− 2n
k=1
n
" #
c 1 2X 1 sen 2n π
(2k − 1)
F̄2n (x) = + π sen((2k − 1)x)
2 π 2k − 1 2n (2k − 1)
k=1
| {z }
σ
11 Albert Abraham Michelson Strelno, Prussia, 1852 - Pasadena EEUU. 1931. Premio Nobel en Fı́sica (1907) uno de los
fı́sicos experimentales más habilidosos de todos los tiempos. La precisión y lo ingenioso de los instrumentos creados por él son
famosos. Con importantes contribuciones en medidas de fenómenos en óptica. Una de sus contribuciones más conocidas son los
experimentos para mostrar la inexistencia del Ether como medio de trasmisión para el fenómeno electromagnético. Más detalles
http://nobelprize.org/physics/laureates/1907/michelson-bio.html
12 Más detalles http://en.wikipedia.org/wiki/Gibbs_phenomenon
13 Cornelius Lanczos 1893 - 1974 Hungrı́a. Matemático húngaro con contribuciones importante en Relatividad y Fı́sica
Teórica. En matemáticas es conocido inventar la transformada rápida de Fourier. Más detalles en http://www-history.mcs.
st-and.ac.uk/Biographies/Lanczos.html

Con lo cual hemos identificado el factor σ de Lanczos. Siguiendo este mismo proceso se puede generalizar
para cualquier función de tal modo que una serie de Fourier genérica podrá ser corregida con un factor σ
para lograr
n−1
" # n−1
a0 X sen kπ n a0 X
F̄n (x) = + kπ
(ak cos(kx) + b k sen(kx)) ≡ + σk (ak cos(kx) + bk sen(kx))
2 n
2
k=1 k=1
7.5.6. Tranformadas de Fourier

La transformada de Fourier representa (como combinación lineal de funciones sinusoidadesl) a funciones
definidas en toda la recta real y/o sin una periodicidad definida. Puede ser considerada como la generalización
de la representación en serie de Fourier, y es mayormente utilizada
R ∞ para expresar funciones que varı́an en el
tiempo con el único requisito que tengan norma acotada, i.e. −∞ dt |f (t)| finita
Hemos visto en 7.5.1, que podemos expresar una función en término se series de Fourier complejas
∞
X ∞
X ∞
X ∞
X
2nπ
|f i = C̃k |φ̃k i ≡ C̃k e−ikx ↔ f (t) = C̃n ei T t = C̃n eiωn t
k=−∞ k=−∞ n=−∞ n=−∞
2nπ
donde hemos definido ω = T . Ahora bien, podemos hacer T → ∞ con lo cual [−T /2, T /2] → [−∞, ∞]
pero además
R T /2 Z
2π ω −T /2
dt f (t) ∞
T →∞ ⇒ = = ∆ω → dω y además →0 ya que dt f (t) existe y es acotada.
T n T −∞
Si recordamos la expresión que toman los coeficientes de la expansión

Z ∞ Z !
hφ̃n |f i 1 T /2
−i2nπx X ∆ω T /2
−inx
C̃n = = dx e T f (x) ⇒ f (t) = dx e f (x) eiωn t
hφ̃k |φ̃n i T −T /2 n=−∞
2π −T /2
con lo cual hacer T → ∞ Z ∞ Z ∞

1
f (t) = dω eiωt dx e−iωx f (x)
2π −∞ −∞
| {z }
F (ω)
De este modo, la transformada de Fourier de una función y su inversa, pueden escribirse como
Z ∞ Z ∞
1 −iωt −1 1
F (ω) ≡ F[f (t)] = √ dt e f (t) ⇔ f (t) ≡ F [F (ω)] = √ dω eiωt F (ω)
2π −∞ 2π −∞
Propiedades
Las transformada de Fourier cumplen con las siguiente propiedades, las cuales de derivan de la definición
arriba expuesta
1. Las transformada de la derivada F[f ′ (t)] = iωF (ω) y en general F[f n (t)] = in ω n F (ω). Esta propiedad
es más o menos inmediata a partir de la definición integrando por partes
Z ∞ Z ∞
1 1 ∞ iω
F[f ′ (t)] = √ dt eiωt f ′ (t) = √ eiωt f (t)−∞ + √ dt eiωt f ′ (t)iωF (ω)
2π −∞ 2π 2π −∞

2. La transformada de la integral
Z t
1
F ds f (s) = F (ω) + 2πcδ(ω)
iω
donde la función (distribución) δ(ω) se denomina delta de Dirac y el término 2πcδ(ω) representa la
transformada de la constante de integración
3. Escalamiento F[f (at)] = a1 f ( ωa )
4. Traslación F[f (t + a)] = eiaω F (ω)
5. Multiplicación por un exponencial F [eαt f (t)] = f (ω + iα)
Funciones pares e impares

Al igual que en las espansiones de Fourier la paridad de las función f (t) es importante. Esto se nota
rápidamente a partir de la definición. Supongamos f (t) = −f (−t), entonces
Z ∞ Z ∞ Z
1 1 −2i ∞
F (ω) = √ dt e−iωt f (t) = √ dt (cos ωt − isenωt) f (t) = √ dt sen ωt f (t)
2π −∞ 2π −∞ 2π 0
con lo cual podremos definir las transformadas de Fourier seno y coseno para funciones impares y pares
respectivamente. Esto es para funciones impares f (t) = −f (−t)
r Z ∞ r Z ∞
2 2
F (ω) = dt cos ωt f (t) ⇔ f (t) = dω cos ωt F (ω)
π 0 π 0
y para funciones pares f (t) = f (−t)
r Z ∞ r Z ∞
2 2
F (ω) = dt sen ωt f (t) ⇔ f (t) = dω sen ωt F (ω)
π 0 π 0
Bases discreta y contı́nuas: La base de Ondas Planas

Haremos una disgresión para fijar conceptos y extender algunos de los razonamientos que hemos desa-
rrollado hasta aquı́. Tal y como hemos visto repetidas veces, la representación de un vector |Fi en un
espacio vectorial abstracto V puede darse en término de una base ortonormal de vectores (discreta y
finitaBDF = {|u1 i , |u2 i , |u3 i , · · · |un i} o discreta e infinita BDI = {|u1 i , |u2 i , |u3 i · · · |un i · · · }) de la
forma:
 Pn Pn
 i=0 ci |ui i = i=0 hui | Fi |ui i ⇐ BDF = {|u1 i , |u2 i , |u3 i · · · |un i}
|Fi =
 P∞ P∞
i=0 ci |vi i = i=0 hui | Fi |ui i ⇐ BDI = {|u1 i , |u2 i , |u3 i · · · |un i · · · }
∞
X ∞
X
ci = hui | Fi = cj hui |uj i = cj δij
j=0 j=0
la intención ahora será utilizar la transformada de Fourier para construir la generalización de bases discretas
a continua |wα i de tal forma que transformamos el ı́ndice de la sumatoria en la variable de una integral
Z
|Ψi = dα c (α) |wα i

donde Z Z
c (β) = hwβ |Ψi = dα c (α) hwβ |wα i = dα c (α) δ (α − β)
con en la cual δ (α − β) es una Delta de Dirac. Ası́, los dos conceptos expresados hasta ahora tienen una
expresión:
Propiedad\Base Discreta Continua

Ortogonalidad hvPi |vj i = δij hwβ R|wα i = δ (α − β)
∞
Cierre 1 = j=0 |vj i hvj | 1 = dα |wα i hwα |
P∞ R
Expansión |Fi = i=0 ci |ui i |Ψi = dα c (α) |wα i
Componentes ci = hu
Pi∞ | Fi c (β)R= hwβ |Ψi
Producto Interno hG| Fi = i=0 gi∗ fi hG| Fi = dα g ∗ (α) f (α)
P∞ 2 R 2
Norma hF| Fi = i=0 |fi | hF| Fi = dα |f (α)|
Ilustraremos esta generalización con la construcción de la base de ondas planas. Hemos visto que la
transformada compleja de Fourier compleja para una función, se puede escribir como
Z ∞ Z ∞
F (s) = dt ei st f (t) ⇄ f (t) = ds e−i st F (s)
−∞ −∞
las cuales reescribiremos en términos más familiares a la comunidad de fı́sicos como

Z ∞ Z ∞
1 1
ψ (x) = √ dp eipx/~ ψ̄ (p) ⇄ ψ̄ (p) = √ dx e−ipx/~ ψ (x)
2π~ −∞ 2π~ −∞
Hemos tenido cuidado de incluir los factores de normalización adecuados para el caso de las descripciones
en mecánica cuántica. Estas fórmulas pueden ser reinterpretadas en función de los conceptos anteriormente
expuestos y podemos definir una base continua de la forma
Z ∞ Z ∞
1 1 1 1
ψ (x) = √ dp √ ei px/~ ψ̄ (p) ⇄ ψ̄ (p) = √ dx √ e−i px/~ ψ (x)
2π~ −∞ 2π~ 2π~ −∞ 2π~
| {z } | {z }
vp (x) vpx (x)
por lo cual Z Z
∞ ∞
ψ (x) = dp vp (x) ψ̄ (p) ⇄ ψ̄ (p) = dx vp∗ (x) ψ (x)
−∞ −∞
Diremos que la función ψ (x) está expresada en la base de ondas planas vp (x) = √ 1 ei px/~
2π~
Nótese
El ı́ndice p de vp (x) varı́a de forma continua entre −∞ e ∞.

1
Que vp (x) = √2π~ ei px/~ ∈/ L2 es decir no pertenece al espacio vectorial de funciones de cuadrado
integrable ya que su norma diverge
Z ∞ Z ∞
2 1
hvp | vp i = dx |vp (x)| = dx →∞
−∞ −∞ 2π~
Que las proyecciones de ψ (x) sobre la base de ondas planas es ψ̄ (p) = hvp | ψi

La relación de cierre para esta base se expresa como

Z Z ∞ Z ∞
1 i p(x′ −x)/~
1= dα |vα i hvα | ⇄ dp vp∗ (x′ ) vp (x) = dp e = δ (x′ − x)
−∞ −∞ 2π~
mientras que de la definición de producto interno, uno obtiene

Z ∞ Z ∞
∗ 1 i x(p′ −p)/~
hvp′ | vp i = dx vp′ (x) vp (x) = dp e = δ (p′ − p)
−∞ −∞ 2π~
Un para de ejemplos
Un ejemplo inmediato lo tenemos al considerar la función
Z 1 1
1 si |t| < 1 1 1 e−iω − eiω 2sen ω
f (t) = ⇒ F (ω) = √ dt 1 e−iωt = √ = √2πω
0 el resto 2π −1 2π −iω −1
el otro ejemplo de uso lo podremos construir a si consideramos la ecuación diferencial inhomogénea y bus-
camos su solución
Z 1
dφ(x) 2 1 dφ(x) 2
− K φ(x) = f (x) ⇒ √ dt − K φ(x) e−iωt = F (ω)
dx2 2π −1 dx2
donde F (ω) es la transformada de Fourier de la función f (x). Utilizando las propiedades de la transformada
de Fourier obtenemos que
Z 1
1 dφ(x) −iωt ˜ = F (ω) ⇒ −k 2 φ(ω) ˜ = F (ω) ⇒ φ(ω)
˜ − K 2 φ(ω) ˜ = − F (ω)
√ dt e − K 2 φ(ω)
2π −1 dx2 k2 + K 2
˜ como la transformada de Fourier de la solución φ(x). Con lo cual

donde hemos representado φ(ω)
Z 1 Z 1
1 ˜ e−iωt = − √1 F (ω)
φ(x) = √ dt φ(ω) dt e−iωt
2π −1 2π −1 k2 + K 2
Como solución formal de la ecuación diferencial resulta sencilla y el método también es inmediato. El punto
crucial es la solución del la integral que resulta de la transformación inversa. Normalmente este tipo de
integrales no son tratables de manera analı́tica. Pero siempre queda el recurso numérico.
7.5.7. Tranformadas Discretas de Fourier

Aquı́ haremos algo más contemporaneo que será estudiar la versión discreta de esta transformación. En
general las integrales, en su mayorı́a, no se pueden resolver analı́ticamente por lo que tenemos que proceder
a resolverlas de forma numérica. La mayor parte de los métodos numéricos involucra convertir integrales en
sumatorias. Es decir en series de funciones.
En 7.5.1 hemos visto como las funciones trigonométricas (y las exponenciales de argumento imaginario)
son ortogonales bajo integrales evaluadas en un determinado intervalo. En otras palabras con la definición
de producto interno en un espacio de funciones. Ahora bien, esas mismas funciones (FourierGeneralidades,
cosenos y funciones exponenciales de argumento imaginario) serán también ortogonales al ser evaluadas en
puntos muy particulares.

kT
Consideremos los siguientes 2N puntos tk = 2N y probaremos que las funciones e2πiptk /T y e2πiqtk /T
serán ortogonales ∝ δqp en un conjunto esos puntos tk . Esto es


 1 − r2N
2N
X −1 h i 2πiqtk
2πiptk ∗
2N
X −1
2πistk
2N
X −1  = 0 r 6= 1
e T e T = e T =
2πisk
e 2N = 1−r


k=0 k=0 k=0  2N r=1
kT
donde hemos sustituido s = q − p, y evaluado en los puntos tk = con k = 1, 2, 3, · · · , 2N − 1. Nótese
2N
que la última de las series es una serie finita y geométrica con razón r = e(πis)/N , que comienza con 1 y por
lo tanto suma (dependiendo del valor de r) lo que aparece en la llave. Es inmediato convencerse que, para
todo N se cumple que r2N = e2πis = 1 (con s entero) con lo cual se cumple la relación de ortogonaliadad
que buscamos
2N
X −1 h i 2πiqtk
2πiptk ⋆
e T e T = 2N δqp con k = 1, 2, 3, · · · , 2N − 1 (7.3)
k=0
2πm
Si hacemos un ligero cambio de notación y llamamos ωm = tendremos algunos cambios, en apariencia,
T
cosméticos
2N −1 2N −1
2πimtk 1 X 1 X
e± T → e±ωm tk ⇒ F (ωm ) = f (tk )e±ωm tk ⇔ f (tk ) = F (ωm )e±ωm tk (7.4)
2N 2N m=0
k=0
La función F (ωm ) representa la tranformada discreta de Fourier de la f (tk ). Para despejar la función f (tk )
hemos utilizado la relación de ortogonalidad 7.3
Consideremos el siguiente f (tk ) = cos tk evaluado en un perı́odo T = 2π y dividido, digamos en N = 2
intervalos. Los puntos en los cuales evaluaremos nuestra serie serán 2N = 4, vale decir
kT kπ 2πm eiωm tk eimkπ/2
tk = ≡ con k = 0, 1, 2, 3 ⇔ ωm = ≡m ⇒ ≡
2N 2 T 2N 2N
nótese que la función f (tk ) puede ser escrita como un vector f (tk ) = (1, 0, −1, 0), con lo cual para encotrar
la expresión de su tranformada discreta de Fourier, F (ωm ), podemos expresar la suma como una matriz de
transformación con ı́ndices m, k. Esto es
 
1 1 1 1
eimkπ/2 1 1 i −1 −i 

⇔ 
2N 4 1 −1 1 −1 
1 −i −1 0
con lo cual
      
F (ω0 ) 1 1 1 1 1 0
2N −1
1 X  F (ω1 )  1  1 i −1 −i   0  1 1 
F (ωm ) = f (tk )e±ωm tk ⇒  
 F (ω2 )  = 4 
 =  
2N 1 −1 1 −1   −1  2 0 
k=0
F (ω3 ) 1 −i −1 0 0 1
Respecto a la ecuación 7.4 se deben puntualizar varios elementos
2πm
la frecuencia angular ωm = corresponde a lo que en Fı́sica se denomina el espacio recı́proco (al
T
temporal), espacio de frecuencias u ω-espacio. Por ello la función F (ωm ) está expresada en este espacio
de frecuencias, mientras que la función f (tk ) en el de tiempos.

La elección de uno de los signos + y − en la expresión e±ωm tk es arbitraria.

Con lo cual si “reconstruimos” la función original a partir de la transformada discreta nos sorprende el
resultado, por cuanto no coincide
1 −itk 1 −3itk 1 1
f (tk ) = e + e ⇒ ℜ [f (tk )] = cos tk + cos 3tk
2 2 2 2
Ahora bien, para los puntos tk = 0, π2 , π, y π2 si se cumple que los valores cos tk = 12 cos tk + 12 cos 3tk . En los
pocos puntos seleccionados cos tk y cos 3tk se asemejan. En la medida que seleccionemos más puntos en esa
medida se dejan de parecer y la recontrucción de la función será más fidedigna.

Bibliografı́a
[Aleksandrov Kolmogorov y Lavrentiev 1999] A. D. Aleksandrov, A. N. Kolmogorov y M. A. Lavrentiev

(1999) Mathematics: Its Content, Methods and Meaning. (Dover Publications, New York ) Existe
traducción por Editorial Alianza Universidad.
[Arfken, Weber y Weber 2000] Arfken, G. B., Weber, H., y Weber, H.J. (2000) Mathematical Methods
for Physicists 5ta Edición (Academic Press, Nueva York )
[1] Byron, F.W. y Fuller W.F. (1970) Mathematics of Classical and Quantum Physics (Dover Pu-
blications, New York )
[Cushing 1975] Cushing, J. (1975) Applied Analytical Mathematics for Physical Sciences (John
Wiley & Sons, New York )
[Hamming 1973] Hamming R.W. (1973) Numerical Methods For Scientist and Engineers, 2nd ed.
(Dover, New York.)
[Hassani 1991] Hassani, S. (1991) Foundations of Mathematical Physics (Prentice Hall, International
Edition, London:)
[Lebedev 1972] Lebedev, N.N. (1972) Special Functions & Their Applications (Dover Publications,
New York )
[math-atlas.org URL] The Mathematical Atlas http://www.math-atlas.org/welcome.html
[Richards 2002] Richards, D. (2002) Advanced Mathematical Methods with MAPLE (Cambridge
University Press Cambridge)
[Riley Hobson y Bence 2002] Riley, K.F., Hobson, M.P. y Bence, S.J. (2002) Mathematical Methods for
Physics and Engineering (Cambridge University Press Cambridge)
[Weisstein URL] Weisstein, E. W., MathWorld http://mathworld.wolfram.com/
302
Capı́tulo 8
La Variable Compleja
303
8.1. Vectores y números complejos

En otro de estos formularios de Métodos Matemáticos de la Fisica [Núñez 2005] introdujimos la noción
de números complejos y la asociamos a su representación de un vector en el plano complejo. Para hacer
autocontenido este formulario incluiremos aquı́ también esa discusión.
Desde la más tierna infancia matemática nos hemos tropezado con las llamadas raı́ces imaginarias o
complejas de polinomios. De este modo la solución a un polinomio cúbico
 
 x = 2i 
x3 − 3x2 + 4x − 12 = 0 =⇒ x = −2i =⇒ (x + 2i) (x − 2i) (x − 3) = 0
 
x=3
o cuadrático
x = 2i
x2 + 4 = 0 =⇒ =⇒ (x + 2i) (x − 2i)
x = −2i
√
nos lleva a definir un número i2 = −1 ⇔ i = −1 como vimos arriba al multiplicar el número imaginario
i por cualquier número real obtendremos el número imaginario puro bi, con b ∈ ℜ. La nomenclatura números
imaginarios surgió de la idea de que estas cantidades no representan mediciones fı́sicas. Esa idea ha sido
abandonada pero el nombre quedó.
8.1.1. Los números complejos y su álgebra

Un número complejo, z, es la generalización de los números imaginarios (puros), ib. Esto es

 a → parte real
z = a + ib con a, b ∈ ℜ =⇒

b → parte imaginaria
Obviamente los números reales serán a + i0 números complejos con su parte imaginaria nula. Los números
imaginarios puros serán números complejos con su parte real nula, esto es 0 + ib. Por ello en general diremos
que
z = a + ib =⇒ a = Re (z) ∧ b = Im (z)
es decir, a corresponde a la parte real de z y b a su parte imaginaria.
Cada número complejo, z, tendrá un número complejo conjugado, z ∗ tal que
z = a + ib ⇋ z ∗ = a − ib
⇓
∗ ∗
(z ) = z ∧ z · z ∗ = a2 + b2
claramente
z · z∗ ≥ 0 =⇒ |z|2 = |z ∗ |2 = z · z ∗
Es importante señalar que, en general, no existe relación de orden entre los números complejos. Vale
decir, que no sabremos si un número complejo es mayor que otro. No está definida esta operación.
z1 ≯ z2 ∨ z 1 ≮ z2
las relaciones de orden sólo se podrán establecer entre módulos de números complejos y no números complejos
en general.
Rápidamente recordamos el álgebra de los números complejos:

dos números complejos serán iguales si sus partes reales e imaginarios lo son
z1 = z2 =⇒ (a1 + ib1 ) = (a2 + ib2 ) =⇒ a1 = a2 ∧ b1 = b2
se suman dos números complejos sumando sus partes reales y sus partes imaginarias.
z 3 = z1 + z2 =⇒ (a1 + ib1 ) + (a2 + ib2 ) = (a1 + a2 ) + i(b1 + b2 ) = a3 + ib3

| {z } | {z }
a3 b3
claramente z + z ∗ = 2 Re z también z − z ∗ = 2 Im z. Igualmente es inmediato comprobar que

∗
(z1 + z2 ) = z1∗ + z2∗
se multiplican números complejos por escalares multiplicando el escalar por sus partes reales e imagi-
narias
z3 = αz1 =⇒ α (a1 + ib1 ) = (αa1 ) + i (αb1 )
se multiplican números complejos entre si, multiplicando los dos binomios y teniendo cuidado que
i2 = −1.
z3 = z1 z2 =⇒ (a1 + ib1 ) · (a2 + ib2 ) = (a1 a2 − b1 b2 ) + i (a1 b2 + b1 a2 )
∗
también es inmediato comprobar que (z1 z2 ) = z1∗ z2∗
se dividen números complejos siguiendo la estrategia de racionalización de fracciones irracionales. Esto
es
z1 (a1 + ib1 ) (a1 + ib1 ) (a2 − ib2 ) a1 a2 + b1 b2 b1 a2 − a1 b2
z3 = =⇒ = = +i
z2 (a2 + ib2 ) (a2 + ib2 ) (a2 − ib2 ) (a22 + b22 ) (a22 + b22 )
es claro que el divisor será cualquier número complejo excepto el cero complejo, 0 + i0
8.1.2. Vectores y el plano complejo

Mirando con cuidado el álgebra de números complejos nos damos cuenta que un número complejo puede
ser representado por una dupla de números complejos es decir,
z = (a + ib) ⇌ z = (a, b)
las propiedades entre números complejos de igualdad, suma y multiplicación por un escalar arriba expuestas se
cumplen de forma inmediata con esta nueva representación. Hay que definir las operaciones de multiplicación
y división entre números complejos de forma que

(a1 , b1 ) a1 a2 + b1 b2 b1 a2 − a1 b2
(a1 , b1 ) (a2 , b2 ) = (a1 a2 − b1 b2 , a1 b2 + b1 a2 ) ∧ = ,
(a2 , b2 ) (a22 + b22 ) (a22 + b22 )
Esta asociación de un número complejo con una pareja de números inmediatamente nos lleva a imaginar
un punto en un plano (complejo) en el cual la primera componente (horizontal) representa la parte real
y la segunda componente (vertical) representa la parte imaginaria. De esta forma asociamos a un número
complejo un vector que une a ese punto (a, b) con el origen del plano complejo. Esta representación de
números complejos como vectores un el plano (complejo), se conoce con el nombre de Diagrama de Argand1
1 En honor a Jean Robert Argand, (Ginebra, Suiza, 18 Julio 1768; Paris, Francia 13 agosto 1822) Contador pero matemático
aficionado. Propuso esta interpretación de números complejos como vectors en un plano complejo en un libro autoeditado con
sus reflexiones que se perdió y fue rescatado 7 años después, fecha a partir de la cual Argand comenzó a publicar en Matematicas.
Más detalles en http://www-groups.dcs.st-and.ac.uk/\char126\relaxhistory/Mathematicians/Argand.html

a pesar que no fue Jean Argand, sino Caspar Wessel2 el primero en proponerlo. Por cierto esta interpretación
fue tres veces redescubierta primero por Caspar Wessel en 1799, luego por Jean Argand en 1806 y finalmente
por Gauss3 en 1831.
De esta manera como un recordatorio al plano real
 √ p
 ∗ 2 2
 r = zz = |z| = x + y
z = x + iy ⇌ z = r (cos θ + i sin θ) con
 tan θ = y donde − π ≤ θ ≤ π

x
La interpretación vectorial de números complejos permite que la suma de números complejos sea representada
por la “regla del paralelogramo”. Mientras que los productos escalar y vectorial nos llevan a
z1 · z2 = Re z1 z2∗ = Re z1∗ z2 ∧ z1 × z2 = Im z1∗ z2 = −Im z1 z2∗
Con esta interpretación tendremos

x = Re z ⇋ componente real del vector z o parte real de z
y =√Im z ⇋ componente imaginaria del vector z o parte real de z
r = zz ∗ = |z| ⇋ módulo, magnitud o valor absoluto de z
θ ⇋ ángulo polar o de fase del número complejo z
8.1.3. Fórmulas de Euler y De Moivre

Nos hemos tropezado con la expansión en Taylor4 esta serie permite expresar cualquier función infini-
tamente diferenciable alrededor de un punto x0 como una serie infinita de potencias del argumento de la
función. Esto es

d f (x) 1 d2 f (x) 2 1 d3 f (x) 3
f (x) = f (x0 ) + (x − x0 ) + (x − x0 ) + (x − x0 ) + · · · · · ·
d x x=x0 2 d x2 x=x0 3! d x3 x=x0

n 1 dn f (x)
f (x) = Cn (x − x0 ) con Cn = donde n = 0, 1, 2, 3, 4 · · ·
n! d xn x=x0
2 Caspar Wessel (Vestby, Noruega 8 junio 1745; 25 marzo 1818, Copenhagen, Dinamarca) Matemático noruego que se
dedicó principalemente al levantamiento topográfico de Noruega. Su trabajo sobre la interpretación de números comple-
jos permaneció desconocido por casi 100 años. Más detalles http://www-groups.dcs.st-and.ac.uk/\char126\relaxhistory/
Mathematicians/Wessel.html
3 Johann Carl Friedrich Gauss (30 abril 1777, Brunswick, Alemania; 23 febrero 1855, Göttingen, Alemania). Uno de los
mátemáticos más geniales y precoces de la Historia. Desde los 7 años comenzó a mostrar sus condiciones de genialidad. Sus
contribuciones en Astronomı́a y Matemáticas son múltiples y diversas. Más detalles http://www-groups.dcs.st-and.ac.uk/
\char126\relaxhistory/Mathematicians/Gauss.html
4 Brook Taylor (18 agosto 1685, Edmonton, Inglaterra; 29 diciembre 1731, Londres, Inglaterra) Fı́sico y Matemático Inglés
contemporaneo de Newton y Leibniz y con ellos participó profundamente en el desarrollo del cálculo diferencial e integral.
Además de sus aportes al magnetismo, capilaridad y termometrı́a. Desarrolló el área de diferencias finitas que hasta hoy
utilizamos para cálculos en computación. Inventó la integración por partes y descubrió la serie que lleva su nombre. Más
detalles http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Taylor.html

con lo cual si consideramos x0 = 0 entonces

1 1 1 1 5 1 6 1 7
ex = 1 + x + x2 + x3 + x4 + x + x + x + ······
2 6 24 120 720 5040
1 1 1 6
cos x = 1 − x2 + x4 − x + ······
2 24 720
1 1 5 1 7
sin x = x − x3 + x − x + ······
6 120 5040
Es fácil convercerse que

iθ 1 2 1 3 1 4 1 5 1 6 1
e = 1 + iθ − θ + − i θ + θ + iθ − θ + − i θ7 + · · · · · ·
2 6 24 120 720 5040
puede rearreglarse como

1 1 1 6 1 1 5 1 7
eiθ = 1 − θ2 + θ4 − θ + · · · · · · + i θ − θ3 + θ − θ + ······
2 24 720 6 120 5040
| {z } | {z }
cos θ sin θ
eiθ = cos θ + i sin θ
esta relación se conoce como la relación de Euler 5 . Con lo cual ahora tenemos tres formas de representar
un número complejo
z = x + iy ⇌ z = r (cos θ + i sin θ) ⇌ z = reiθ
La expresión z = x + iy se conoce como forma cartesiana de representación de un número complejo,
la forma z = r (cos θ + i sin θ) será la forma trigonométrica y la expresión z = eiθ será la forma de Eu-
ler. Las sumas de números complejos son más fácilmente planteables en su forma cartesiana. Mientras las
multiplicación y división serán directas en la forma de Euler

z1 = r1 eiθ1 
=⇒ z1 z2 = r1 eiθ1 r2 eiθ2 = r1 r2 ei(θ1 +θ2 ) = r1 r2 (cos (θ1 + θ2 ) + i sin (θ1 + θ2 ))
iθ2 
z2 = r 2 e
Más aún, si
z = x + iy =⇒ ez = e(x+iy) = ex eiy = ex (cos y + i sin y)
y a partir de la relación o fórmula de Euler se puede demostrar la fórmula de De Moivre 6
n n
eiθ = einθ ⇌ (cos θ + i sin θ) = cos (nθ) + i sin (nθ) con n entero
5 Leonhard Euler (15 abril 1707, Basilea, Suiza; 18 septiembre 1783, San Petersburgo, Rusia). Uno de los matemáticos más
prolı́ficos de todos los tiempos. Desarrolló inmensamente campos como la geometrı́a analı́tica y trigonometrı́a, siendo el primero
que consideró el coseno y el seno como funciones. Hizo aportes significativos en el desarrollo del cálculo diferencial e integral
ası́ como también, astronomı́a, elasticidad y mecánica de medios contı́nuos. Más detalles http://www-history.mcs.st-andrews.
ac.uk/Mathematicians/Euler.html
6 Abraham de Moivre (26 mayo 1667 in Vitry-le-François, Francia; 27 noviembre 1754, Londres Inglaterra) Matemático
francés que tuvo que emigrar a Inglaterra por razones religiosas. Contemporaneo de Newton, Liebniz, Halley, fue pionero con
sus contribuciones en Geometrı́a Analı́tica y Teorı́a de Probabilides.

8.2. Funciones de Variable Compleja

A continuación, generalizaremos algunos conceptos de funciones complejas de variable compleja.
8.2.1. De la recta real al plano complejo

La idea de función de variable (o variables) reales puede ser extendida (continuada, le dicen también) al
plano complejo. La idea es la de siempre: si en una determinada región del plano complejo R a un número
complejo z le corresponde un número (o varios números) complejos w = f (z), diremos que f (z) es una
función de variable compleja z. Obvio que f (z) puede ser biyectiva, en cuyo caso tendremos que a z le
estará asociado uno y solo un número complejo w = f (z). Es claro también que siempre se podrá expresar
f (z) = u(x, y) + iv(x, y) con u(x, y) la parte real y v(x, y) la parte imaginaria (8.1)
Esta representación tiene una interpretación adicional. Como representamos un número complejo en el plano
0xy como z = x + iy, pero w = f (z) también podrá ser representada como un punto en el plano 0uv.
Entonces, desde el punto de vista geométrico una función de variable compleja podrá ser entendida como
una ley de transformación entre pares de puntos (x, y) del plano 0xy del argumento z y los puntos (u, v) del
plano 0uv de valor w.
8.2.2. Continuidad en el plano complejo

Podemos también extender el concepto de continuidad de una función de variable real a una función
de variable compleja. Esto es: diremos que una función compleja7 w = f (z) será contı́nua en z0 si para un
ǫ > 0 siempre existe un δ > 0 tal que |z − z0 | < δ tan pequeño como uno quiera y siempre puede encontrar
|f (z) − f (z0 )| < ǫ. La otra manera de verlo es la estándar: si existe el lı́mite cuando z → z0 . Es decir
lı́mz→z0 f (z) = f (z0 ) En este punto se pueden resaltar que los lı́mites (y con ello la idea de continuidad) en
el plano complejo hereda las sutilezas y dificultades de los lı́mites y continuidades de las funciones en varias
variables. En segundo lugar cabe señalar que la diferencia con las funciones de variable real radica en que
los ǫ y δ son radios de un cı́rculo centrado en f (z0 ) y z0 , respectivamente. Adicionalmente, para el caso de
las funciones complejas no tiene sentido los lı́mites por la derecha y por la izquierda que planteábamos para
funciones de variable real. También es obvio que si
f (z) = u(x, y) + iv(x, y) con u(x, y) y v(x, y) contı́nuas en (x0 , y0 ) ⇒ f (z) contı́nua en z0 = x0 + iy0
8.2.3. Diferenciabilidad de funciones complejas

Una vez más la idea es la misma y la dificultad que subyace es equivalente a las dificultades que enfren-
tamos en las definiciones de derivadas para funciones de varias variables. Diremos entonces que, una función
f (z) univaluada en una región R entonces f (z) será diferencialble en esa región si la derivada
f (z + ∆z) − f (z) (u(x + ∆x, y + ∆y) − u(x, y)) + i (v(x + ∆x, y + ∆y) − v(x, y)) df
lı́m = lı́m = = f ′ (z)
∆z→0 ∆z ∆x,∆y→0 ∆x + i∆y dz
existe y es única. Una vez más, al igual que en el caso de funciones de varias variables, el concepto de lı́mite
(y con éste el de derivada), debe existir sin importar la ruta o forma de aproximación al punto sobre el cual
7A partir de ahora y por razones de simplicidad llamaremos a f (z) función compleja en vez de función de variable compleja

estamos calculando la derivada. Esto es


 (u(x + ∆x, y) − u(x, y)) + i (v(x + ∆x, y) − v(x, y))
 ′
 f (z)∆y=0 = lı́m∆x→0

∆x
∆z → 0 ⇔ ∆x+i∆y → 0 ⇒

 (u(x, y + ∆y) − u(x, y)) + i (v(x, y + ∆y) − v(x, y))

 f ′ (z)∆x=0 = −i lı́m∆y→0
∆y
Un par de ejemplos que ilustran este caso pueden ser f (z) = x2 − y 2 + 2ixy
f (z + ∆z) − f (z) (x + ∆x)2 − (y + ∆y)2 + 2i(x + ∆x)(y + ∆y) − x2 + y 2 − 2ixy

f ′ (z) = lı́m = lı́m
∆z→0 ∆z ∆x,∆y→0 ∆x + i∆y
con lo cual desarrolle y pruebe que, independientemente de la ruta en el plano complejo (∆y = 0; ∆x → 0 o
viceversa)
(∆x)2 − (∆y)2 + 2i∆x∆y
f ′ (z) = lı́m 2x + i2y + = 2x + i2y
∆x,∆y→0 ∆x + i∆y
que es más o menos obvio si hubiéramos notado que f (z) = x2 − y 2 + 2ixy = (x + iy)2 ≡ z 2 con lo cual
(z + ∆z)2 − z 2 2z∆z + (∆z)2

f ′ (z) = lı́m = lı́m = lı́m (2z + ∆z) = 2z
∆z→0 ∆z ∆z→0 ∆z ∆z→0
Ahora bien, las cosas no siempre son ası́. Si consideramos f (z) = 2x + iy es rápido comprobar que no es
diferenciable en el plano complejo, ya que
2x + 2∆x + i(y + ∆y) − 2x − iy 2∆x + i∆y

f ′ (z) = lı́m = lı́m
∆x,∆y→0 ∆x + i∆y ∆x,∆y→0 ∆x + i∆y
el cual, claramente no coincide si las direcciones de aproximación a z0 = x0 + iy0 son distintas, vale decir,
por ejemplo ∆y = 0; ∆x → 0 o ∆x = 0; ∆y → 0.
Como heredamos todas las ideas y métodos del campo real se cumplen todas las reglas de la derivación
para funciones reales. Vale decir
d df (z) dg(z) d df (z) dg(z) d df (g) dg(z)

(f (z) + g(z)) = + ; (f (z)g(z)) = g(z) + f (z) ; (f (g(z)) =
dz dz dz dz dz dz dz dg dz
8.2.4. Funciones Analı́ticas y Condiciones de Cauchy-Riemann

Diremos que una función es analı́tica (holomorfa o regular) en una región R, si es uni-valuada y derivable
en todos los puntos dentro de esa misma región R. Puede darse el caso de que sea analı́tica en la región
excepto en un número finito de puntos (donde es singular). Entonces diremos que es es analı́tica (holomorfa
o regular) en R, excepto en esos puntos.
A partir de dos estrategias (muy particulares) de aproximación a ∆z → 0 tales como ∆y = 0; ∆x → 0
o ∆x = 0; ∆y → 0, podremos encontrar un criterio para identificar donde, una función compleja, f (x), es
analı́tica. Esto es

′ (u(x + ∆x, y) − u(x, y)) + i (v(x + ∆x, y) − v(x, y)) ∆u(x, y) ∆v(x, y)
f (x)∆y=0 = lı́m∆x→0 = lı́m∆x→0 +i
∆x ∆x ∆x

(u(x, y + ∆y) − u(x, y)) + i (v(x, y + ∆y) − v(x, y)) ∆u(x, y) ∆v(x, y)
f ′ (x)∆x=0 = −i lı́m∆y→0 = lı́m∆y→0 −i +
∆y ∆y ∆y

y ambas tienen que coincidir. Con lo cual

∆u(x, y) ∆v(x, y) ∆u(x, y) ∆v(x, y)
f ′ (x)∆y=0 = f ′ (x)∆x=0 ⇔ lı́m +i = lı́m −i +
∆x→0 ∆x ∆x ∆y→0 ∆y ∆y
y equivalentemente
∂u(x, y) ∂v(x, y) ∂u(x, y) ∂v(x, y)
f ′ (x)∆y=0 = f ′ (x)∆x=0 ⇔ +i = −i +
∂x ∂x ∂y ∂y
Con ello hemos encontrado las condiciones necesarias para que una función compleja sea analı́tica, vale decir:
Las condiciones de Cauchy Riemann
∂u(x, y) ∂v(x, y) ∂v(x, y) ∂u(x, y)
= ∧ =− (8.2)
∂x ∂y ∂x ∂y
Ahora tendremos un criterio más expedito para determinar que la función f (z) = 2x + iy no es analı́tica.

u(x, y) = 2x ∂u(x, y) ∂v(x, y) ∂v(x, y) ∂u(x, y)
⇒ = 2 6= 1 = ∧ =0=0=−
v(x, y) = y ∂x ∂y ∂x ∂y
Para el caso f (z) = x2 − y 2 + 2ixy se cumplen las condiciones de Cauchy-Riemann

u(x, y) = x2 − y 2 ∂u(x, y) ∂v(x, y) ∂v(x, y) ∂u(x, y)
⇒ = 2x = ∧ = 2y = −
v(x, y) = 2xy ∂x ∂y ∂x ∂y
pero como esas condiciones son necesarias porque para encontrarlas hemos seleccionado un par de rutas
muy especı́ficas: ∆y = 0; ∆x → 0 y ∆x = 0; ∆y → 0, se requiere exigir algunas condiciones adicionales. Sin
demostración (puede consultar para detalles y demostraciones detalladas las referencias [Byron y Fuller 1970,
Churchill y Brown1989, Knopp 1996]) exigiremos como condición necesaria y suficiente para que una función
sea analı́tica que las cuatro derivadas parciales para u(x, y) y v(x, y), existan, sean contı́nuas en la región R
y que se cumplan las condiciones de Cauchy-Riemann. El punto crucial (adicional) es que las derivadas sean
contı́nuas.
Ejercicio Como ejercicio al lector le sugerimos investigar los dominios del plano complejo para los cuales
las funciones f (z) = |x| − i|y| y f (z) = |z|2 = zz ∗ son analı́ticas
8.2.5. Curiosidades de Cauchy-Riemann

Las funciones analı́ticas satisfacen algunas propiedades adicionales consecuencias de las condiciones de
Cauchy-Riemann.
La primera es que dada una función compleja genérica f (z) = u(x, y) + iv(x, y), si f (z) es análitica,
u(x, y) y v(x, y) serán funciones armónicas conjugadas, ∇2 u(x, y) = ∇2 v(x, y) = 0, i.e. satisfacen la ecuación
de Laplace. Si derivamos apropiadamente las ecuaciones (8.2) respecto a una y otra variable encontramos
que

∂ ∂u(x, y) ∂ ∂v(x, y) ∂ ∂v(x, y) ∂ ∂u(x, y) ∂ 2 u(x, y) ∂ 2 u(x, y)
= = =− ⇒ + =0
∂x ∂x ∂x ∂y ∂y ∂x ∂y ∂y ∂x2 ∂y 2
y equivalentemente

∂ ∂v(x, y) ∂ ∂u(x, y) ∂ ∂u(x, y) ∂ ∂v(x, y) ∂ 2 v(x, y) ∂ 2 v(x, y)
=− =− =− ⇒ + =0
∂x ∂x ∂x ∂y ∂y ∂x ∂y ∂y ∂x2 ∂y 2

es decir, hemos demostrado que las partes reales e imaginarias de una función analı́tica son necesariamente
armónicas. La importancia de este resultado radica, en primer lugar, que no son arbitrarias las funciones
u(x, y) y v(x, y) con las cuales construimos f (z). Ambas deben satisfacer la ecuación de Laplace. En segundo
lugar que ambas están ligadas por las condiciones de Cauchy-Riemann, y esto implica que al conocer una
de las funciones armónicas conjugadas, siempre es posible encontrar (salvo una constante de integración) la
otra. Para ilustrar lo anterior, supongamos la siguiente función armónica conjugada u(x, y) = 2x − x3 + 3xy 2
correspondiente a la parte real de f (z). Es fácil comprobar que es una función armónica, ahora construyamos
la parte imaginaria v(x, y). Esto es
∂u(x, y) ∂v(x, y)
u(x, y) = 2x − x3 + 3xy 2 ⇒ = = 2 − 3x2 + 3y 2 ⇒ v(x, y) = 2y − 3x2 y + y 3 + φ(x)
∂x ∂y
entonces
∂v(x, y) ∂φ(x) ∂u(x, y) ∂φ(x)
= −6xy+ = −6xy = − ⇒ = 0 ⇒ φ(x) = C ⇒ v(x, y) = 2y−3x2 y+y 3 +C
∂x ∂x ∂y ∂x
La segunda curiosidad consecuencia de las ecuaciones (8.2) es que para una función compleja genérica
f (z) = u(x, y) + iv(x, y) en la cual además se cumpla que u(x, y) = const y v(x, y) = const entonces se
cumplirá que ∇u(x, y) · ∇v(x, y) = 0.

∂u(x, y) ∂u(x, y) ∂v(x, y) ∂v(x, y) ∂u(x, y) ∂v(x, y) ∂u(x, y) ∂v(x, y)
∇u(x, y)·∇v(x, y) = i+ j · i+ j = +
∂x ∂y ∂x ∂y ∂x ∂x ∂y ∂y
y por obra de las condiciones de Cauchy-Riemann es inmediato comprobar que se anulan

∂u(x, y) ∂u(x, y) ∂u(x, y) ∂u(x, y)
∇u(x, y) · ∇v(x, y) = − + =0
∂x ∂y ∂y ∂x
Es decir, u(x, y) = const y v(x, y) = const, corresponden a trayectorias mutuamente ortogonales. Esta
“curiosidad” nos permite construir sistemas de coordenadas alternativos en el plano complejo y, sobre todo
saber como establecer su transformación a otros planos complejos. Esto se representa en la figura 8.2 y
será considerado en la sección 8.6 de la página 318.
La tercera curiosidad es un resultado el cual, siendo una formalidad, nos indica que las funciones analı́ticas
f (z) dependen de z y no de su conjugado z ∗ . O dicho de otra manera que z y z ∗ son variables independientes.
Para demostrar esto procedemos primero a convencernos que si f (z) = u(x, y) + iv(x, y) y f (z) analı́tica,
entonces ∂f (z)
∂z ∗ = 0. Sin detenernos a pensar en el significado de la derivada respecto a la variable conjugada,
recordamos que operacionalmente

z + z∗  
x= 

2 ∂f (z) ∂f (z) ∂x ∂f (z) ∂y 1 ∂u(x, y) ∂v(x, y) 1 ∂u(x, y) ∂v(x, y)
⇒ = + = + i − + i
z − z∗   ∂z ∗ ∂x ∂z ∗ ∂y ∂z ∗ 2 ∂x ∂x 2i ∂y ∂y
y= 

2i
arreglando tendremos que es inmediato comprobar que se anula si se cumplen las condiciones (8.2)

∂f (z) 1 ∂u(x, y) ∂v(x, y) i ∂u(x, y) ∂v(x, y) z + z∗ z − z∗
= − + + = 0 ⇒ f (z) ⇔
6 f (x, y) = f ,
∂z ∗ 2 ∂x ∂y 2 ∂y ∂x 2 2i
en otras palabras, la funciones analı́ticas son verdaderas funciones de variable complejas y no, como pudiera
parecer, de dos variables reales interpuestas.

Ejercicios
1. Determine la función f (z) analı́tica cuya parte imaginaria es (y cos y + xsen z)ex
2. Muestre que si f (z) es analı́tica entonces f ∗ (z ∗ ) también lo es.
8.3. Series de Potencias en Variable Compleja

En otros de los Formularios de Métodos Matemáticos incursionamos en el terreno de las series de potencias
en variables reales [Núñez 2006]. En esta sección generalizaremos la idea a series de potencias en variable
compleja z. Esta generalización se conoce como “prolongación” o “continuación” (analı́tica) de una función
real al plano complejo. Entonces8
∞
X ∞
X ∞
X ∞
X
f (z) = an z n ≡ an rn einθ ⇒ an z n es absolutamente convergente si |an |rn converge (8.3)
n=0 n=0 n=0 n=0
Dónde hemos utilizado la forma polar para un número complejo z = reiθ . La conclusión
P∞ más importante de
n
(8.3) es
P∞ que siempre es posible asociarle a una serie de potencias complejas, a
n=0 n z , una de potencias
reales n=0 |an |rn . La convergencia (absoluta) de ésta última condiciona la convergencia de la primera. Por
ello los criterios de convergencia de series reales serán aplicables también en este contexto.
8.3.1. La convergencia y sus criterios

De este modo y como siempre, si suponemos que existe el lı́mite

1 an+1
ρ= = lı́m
R n→∞ an
Dónde R se denomina el radio de convergencia y define una región cı́rcular en torno a un punto z0 .
Si seleccionamos el criterio del cociente de Dálembert, entonces

 |z| < R =⇒


converge


an+1 z n+1 an+1

lı́m = |z| lı́m entonces, en las regiones |z| > R =⇒ diverge
n→∞ an z n+1 n→∞ an 




|z| = R =⇒ indeterminado
Por lo tanto, cuando R = ∞ la serie converge en todo punto y en contraste si R = 0, sólo converge en el
origen. Por su parte si R = R0 la serie converge en una región (un cı́rculo) del plano complejo de radio R0
centrada en z0 = 0.
Entonces se puede analizar el comportamiento de series complejas utilizando el criterio del cociente de
Dálembert,
∞
X zn n!
⇒ lı́m = lı́m 1 = 0 = 1 ⇒ R → ∞ ⇒ converge ∀ z ∈ C
n! n→∞ (n + 1)! n→∞ n + 1
R
n=0
8 Por simplicidad y economı́a consideraremos desarrollos en serie alrededor de z = 0, ya que la generalización a otros puntos
z = z0 es sencilla y no involucra ninguna sutileza conceptual adicional.

igualmente
∞
X (1 + i)n n(1 + i)n+1 n √ n √

⇒ lı́m
= |1+i| lı́m
= 2 lı́m ⇒ R = 1 ⇒ |z| = 2 > 1 = R
n n→∞ (n + 1)(1 + i)n n→∞ n+1 n→∞ n+1
n=0
y por lo tanto esta serie diverge. Es claro que esta serie únicamente convergerá para |z| < 1
8.3.2. Consecuencias y conclusiones para series de potencias complejas

P∞
Dentro del cı́rculo de convergencia la función f (z) = n=0 an z n estará bien definida y disfrutará de las
propiedades ideales para una función bien comportada. Es decir
P∞ P∞ P∞
1. La expansión f (z) = n=0 an z n es única. Vale decir que si existen dos series n=0 an z n y n=0 bn z n ,
convergentes para |z| < R y tienen la misma suma para un entorno de z. Entonces, necesariamente
an ≡ bn .
2. La función f (z) también podrá ser expandida alrededor Pde cualquier otro punto zp contenido en el
∞
entorno de convergecia de radio R, su expansión f (z) = n=0 bn (z − zp )n también será única. El radio
de convergencia para esta segunda serie será Rp = R − |zp |
P∞
3. Por ser una expansión en potencias de z, la función f (z) = n=0 an z n es diferenciable en todo punto
zp en el cı́rculo de convergencia de radio R y la derivada puede ser hecha a partir de la misma expansión
en series de potencias, término a término, de tal forma que
∞
X X∞ ∞
X
df
f (z) = an z n ⇒ = f ′ (z) = n an z n−1 ⇒ f ′ (zp ) = n an zpn−1 (8.4)
n=0
dz n=1 n=1
P∞
Por lo tanto las funciónes f (z) = n=0 an z n ası́ descritas son analı́ticas en el entorno de convergencia
de radio R.
P∞ P∞
4. Como f (z) = n=0 an z n y f ′ (z) = n=1 n an z n−1 tienen el mismo radio de convergencia, podemos
aplicar k veces la afirmación anterior y obtendremos
∞
X ∞
X f k (0)
f ′ (z) = n an z n−1 ⇒ f k (zp ) = n(n−1)(n−2) · · · (n−k+1) an zpn−k para zp = 0 ⇒ ak =
n=1
k!
n=k
con lo cual la expansión de una función analı́tica es en realidad una expansión en series de Taylor
X∞
f n (0) n
f (z) = z
n=0
n!
Con esta última afirmación se cierra la idea que nos hacemos de una función bien comportada o analı́ti-
ca. Es una función infinitamente contı́nua y contı́nuamente diferenciable, la cual puede ser expandida
en series de Taylor. Si bien los fenómenos fı́sicos no requieren, necesariamente, ser descritos por este
tipo de funciones, debido a sus notables propiedades han resultado ser una de las más estudiadas en
Matemáticas [Aleksandrov Kolmogorov y Lavrentiev 1999]. Más adelante, en la sección 8.9 revisaremos
estos conceptos a luz de la Fórmula Integral de Cauchy.
Los detalles de estas afirmaciones que son teoremas se pueden consultar en [Knopp 1996].

8.4. Algunas Funciones Complejas Elementales

Con todos los ingredientes anteriores, la primera función candidata para una continuación analı́tica es la
función exponencial. Es decir
z2 z3 z4 zn
ez = 1 + z + + + + ··· + + ··· claramente R → ∞ con lo cual converge ∀ z ∈ C (8.5)
2 3! 4! n!
Como ejercicio puede ser interensante demostrar que ez1 ez2 = e(z1 +z2 ) . Vale decir

z2 zn z2 zn
ez1 ez2 = 1 + z1 + 1 + · · · + 1 + · · · 1 + z2 + 2 + · · · + 2 + · · ·
2 n! 2 n!
con un poco de álgebra y orden podremos rearreglar la expresión de la forma

z 2
1 z2 z1 z1 z2 z22 zn z n−1 z2 z n−2 z22 z1 z2n−1 zn
z1 z2
e e = 1+ + + + + +···+ 1 + 1 + 1 +···+ + 2
1! 1! 2! 1! 1! 2! n! (n − 1)! 1! (n − 2)! 2! 1! (n − 1)! n!
y mejor aún
z 2
1 z2 z z1 z2 z2 1 n! n!
ez1 ez2 = 1+ + + 1 + + 2 +· · ·+ z1n + z1n−1 z2 + · · · + z1 z2n−1 + z2n
1! 1! 2! 1! 1! 2! n! (n − 1)!1! 1!(n − 1)!
que no es otra cosa que la expansión binomial con lo cual hemos demostrado que ez1 ez2 = e(z1 +z2 ) . Adi-
cionalmente, con la expansión en serie (8.5) podemos hacer un par de extensiones inmeditas: az = ez ln a
y
para z = iy ⇒ eiy = cos y + isen y ⇒ ez = ex+iy = ex (cos y + isen y) (8.6)
Nótese que, como era de esperarse en general z = |z|eiθ , entonces la función f (z) = ez 6= 0 ∀ z y tiene un
perı́odo 2iπ, vale decir: f (z) ≡ f (z + 2iπ). Con lo cual es inmediado e2iπ = cos 2π + isen 2π A partir de la
construcción (8.5), se definen las funciones hiperbólicas y trigonométricas
1 z 1 z 1 iz 1 iz
cosh z = e + e−z ; senh z = e − e−z cos z = e + e−iz ; sen z = e − e−iz (8.7)
2 2 2 2i
Al igual que para el caso real y = ex ⇒ x = ln y entonces w = f (z) = ez ⇒ z = Ln w es decir
z = ln w es la función inversa para w = ez .
Si ew = z, y w = u + iv con z = x + iy ≡ |z|eiθ entonces
 u 
 e = |z| ⇔ u = ln |z| 
ew = eu+iv = eu eiv = |z|eiθ = z ⇒ ⇒ w = Ln z = ln |z| + i(θ + 2nπ)
 
v=θ
Es decir para un determinado valor de n es univaluada, en particular para n = 0 la función f (z) = Ln z

tiene como el valor principal ln z = ln |z| + iθ con −π < θ ≤ π. Es inmediato comprobar que los logaritmos
de números complejos negativos si están definidos. Esto es

Ln − 7 ≡ Ln | − 7|ei(π+2nπ) = ln 7 + i(π + 2nπ) ⇒ ln(−7) = ln 7 + iπ ¡ un número complejo !

Ejercicios
1. Muestre que si definimos f (z)ez como aquella función que derivada es ella misma, que se reduce a la
función de variable real ez → ex si Im z = 0 y la cual, por ser analı́tica, cumple con la condiciones de
Cauchy-Riemann, entonces ez = ex+iy = ex (cos y + isen y)
2. Muestre que a partir de las definiciones (8.7) se obtienen las sempiternas propiedades de esas funciones,
vale decir
cos z = cos(−z); −sen z = sen (−z); cos(z1 ± z2 ) = cos z1 cos z2 ∓ sen z1 sen z2
d cos z d sen z
= −sen z = cos z sen (z1 ± z2 ) = cos z1 sen z2 ± sen z1 cos z2
dz dz
√ !
1 1 + zi 2 3 − 3i
3. Muestre que arctan z = ln y luego úselo para evaluar arctan
2i 1 − zi 7
8.5. Puntos de corte, lı́neas de cortes y ceros de funciones com-

plejas
También mencionamos en el otro formulario [Núñez 2006], que los números complejos se representan por
su forma polar en dos ejes coordenados. Ese diagrama bidimiensional se lo llamamos Diagrama de Argand.
Como en el caso del Análisis de Funciones Reales, existen funciones multivaluadas, a las cuales les debemos
imponer ciertas condiciones para convertirlas en univaluadas. El la idea que si una función es multivaluada,
automáticamente deja de ser analı́tica. El objetivo de esta sección es identificar ese conjunto de condiciones
para detectar en cual región del plano complejo una determinada función es univaluada.
8.5.1. Puntos y lı́neas de corte

Consideremos entonces la función f (z) = z 1/2 y hagamos distintos circuitos cerrados 0 ≤ θ < 2π con el
“vector” z.
f (z) = z 1/2 ≡ r1/2 eiθ/2 → f (z) = r1/2 eiθ/2 → r1/2 ei(θ+2π)/2 = −r1/2 eiθ/2
Visto ası́ nos tendremos que preguntar ahora cual fue el circuito que recorrimos con z, y dependiendo de ese
circuito identificaremos algunos puntos con caracterı́sticas distintas. Si el circuito cerrado descrito por z no
contiene el punto z = 0, la función f (z) = z 1/2 retoma su valor original (ver Figura 8.1 cuadrante superior
izquierdo contorno C1 ). Pero si, como se aprecia en la misma Figura 8.1, el circuito cerrado C2 si contiene
el punto z = 0 entonces la función no retoma su valor original, f (z) → −f (z). También es claro que si el
circuito cerrado lo recorremos dos veces θ → 4π entonces f (z) = z 1/2 retoma su valor inicial. Los puntos
alrededor de los cuales se construye un circuito cerrado en el diagrama de Argand y la función no retoma su
valor inicial se denominan puntos de corte y las lı́neas de corte (o simplemente cortes serán aquellas lı́neas
que separan regiones en las cuales una determinada función es univaluada. Es claro que los puntos de corte
son puntos singulares, en los cuales la función deja de ser analı́tica y existirán si θ toma, valores 0 ≤ θ ≤ 2nπ.
Es decir, puede dar n vueltas.
En este caso, para nuestra función f (z) = z 1/2 , la lı́nea de corte será cualquiera que comience en z = 0 y
continúe para |z| → ∞. Por simplicidad es costumbre tomar las lı́neas de corte a lo largo de los ejes reales o
complejos. De este modo aparece ilustrado en la Figura 8.1 cuadrante superior derecho la lı́nea de corte que
sigue el eje positivo de las x.

Figura 8.1: Los distintos contornos que identifican los puntos de corte
La situación se torna más interesante cuando estas definiciones se analizan a la luz de funciones con más
de un punto de corte. Consideremos la función
p p q
√ √
f (z) = z 2 + 1 ⇒ f (z) = (z − i)(z + i) ≡ (r1 eiθ1 ) (r2 eiθ2 ) = r1 r2 eiθ1 /2 eiθ2 /2 = r1 r2 ei(θ1 +θ2 )/2
analicemos entonces, varios contornos en el plano de Argand. Otra vez la Figura 8.1 ilustra en el cuadrante
inferior los distintos contornos C1 , C2 , C3 y C4 Tal y como se aprecia en esa figura, se dan cuatro caso
1. Contorno C1 no incluye ningún punto de corte, entonces θ1min ≤ θ1 ≤ θ1max y θ2min ≤ θ2 ≤ θ2max ,
con lo cual f (z) retoma su valor inicial luego de recorrer el C1
2. Contorno C2 incluye z = i como punto de corte, entonces 0 ≤ θ1 ≤ 2nπ y θ2min ≤ θ2 ≤ θ2max , por lo
cual f (z) → −f (z)
3. Contorno C3 incluye z = −i como punto de corte, entonces θ1min ≤ θ1 ≤ θ1max y 0 ≤ θ2 ≤ 2nπ, por lo
cual f (z) → −f (z)
4. Contorno C4 incluye ambos como punto de corte,z = i y z = −i, entonces 0 ≤ θ1 ≤ 2nπ y 0 ≤ θ2 ≤ 2nπ,
por lo cual f (z) → f (z) retoma su valor.
De este modo para construir los cortes que impidan que nuestra función se multivaluada podremos selecionar
zcorte > i y zcorte < −i
−i < zcorte < i
8.5.2. Singularidades, polos y ceros de funciones complejas.

Los puntos de corte son sigularidades, esto puntos en los cuales la función f (z) deja de ser analı́tica.
Pero también singulariades aisladas aquellos puntos en los cuales la función no es analı́tica pero en todos los

puntos en su entorno lo es (los puntos de corte no son singularidades aisladas). Una singularidad aisladas de
orden n en el punto z = z0 tendrá la forma
g(z)
f (z) = ↔ lı́m [(z − z0 )n f (z)] = l con l finito distinto de cero
(z − z0 )n z→z0
y donde g(z) es una función analı́tica. Es costumbre denominar a estas singularidades polos. Si l es cero,
será un polo de orden menor a n o la función es analı́tica en ese punto. Si el lı́mite es infinito, entonces el
polo será de orden mayor a n.
Sin demostración afirmaremos algo que parece intuitivo. Si una función f (z) tiene un polo en z = z0
entonces, |f (z)| → ∞ cuando z → z0
Si no se puede determinar un valor finito de n diremos que estamos frente a una singularidad esencial
Veamos algunos ejemplos
Para
1 1 2z
f (z) = − =
1−z 1+z (1 − z)(1 + z)
y es inmediato darse cuenta que tendremos polos de orden 1 en z = 1 y z = −1
Para
senh z exp z − exp(−z)
f (z) = tanh z = = ⇒ exp z = exp(i(2n + 1)π) exp(−z) es un polo
cosh z exp z + exp(−z)
1

es decir donde exp z = − exp(−z), con lo cual z0 = n + 2 iπ y al utilizar la definición
! !
z − n + 21 iπ senh z z − n + 12 iπ cosh z + senh z
lı́m = lı́m =1
z→(n+ 21 )iπ cosh z z→(n+ 12 )iπ senh z
1

donde hemos utilizado el Teorema de L’Hopital y consecuentemente z0 = n + 2 iπ es un polo simple
Existe otro tipo de singularidades conocidas como removibles. Estas singularidades se caracterizan porque
el valor de f (z) → 0/0 cuando z → z0 . El caso más emblemático es la función

sen z 1 z3 z5 z2 z4
f (z) = ⇒ f (z) = z− + ··· = 1 − + ··· ⇒ lı́m f (z) = 1
z z 3! 5! 3! 5! z→0
con lo cual, luego de desarrollar por Taylor la función sen z, se ha removido la singularidad aparente.
El comportamiento de una función compleja en infinito (o cuando tiende a infinito), vale decir cuando
z → ∞ no está tan bien definido como en los casos de funciones de variable real. Es claro como una cantidad
real, digamos |f (z)| o |z| tiende a infinito, pero z es una cantidad “bidimensional” y, en principio, existirı́an
varias formas de tender a infinito. Para precisar el comportamiento de una función compleja de variable
compleja en infinito, hacemos un cambio de variable z = 1/ξ y estudiamos f (1/ξ) con 1/ξ → ∞. De esta
manera
lı́mz→∞ z(1 + z 2 ) ≡ lı́mξ→0 1ξ + ξ13 con lo cual tendrá un polo de orden 3
P∞
lı́mz→∞ exp z ≡ lı́mξ→0 n=0 n! 1ξn y presenta una singularidad esencial para z → ∞
Los ceros de una función compleja (f (z0 ) = 0, entonces llamaremos z0 un cero de f (z)) se clasifican al
igual que los polos. Esto es
f (z) = (z − z0 )n g(z) con n entero positivo y g(z) 6= 0 ∀ z

Figura 8.2: Tranformaciones conformes. Tomado de Eric W. Weisstein. Conformal Mapping. MathWorld–
A Wolfram Web Resource. http://mathworld.wolfram.com/ConformalMapping.html
8.6. Transformaciones conformes

Nos interesará ahora considerar transformaciones entre planos complejos. Esto es
z = x + iy ↔ w = r + is ⇒ w = g(z) = r(x, y) + is(x, y) ↔ z = h(w) = x(r, s) + iy(r, s)
8.6.1. Definiciones y propiedades

Es decir, son transformaciones entre puntos (x, y) ↔ (r, s) correspondientes a dos diagramas de Argand, de
tal modo que existe función inversa función z = h(g(z)) y con w = g(z) y z = h(w) funciones analı́ticas, salvo
en un número finito de polos aislados. Entonces denominaremos a este tipo de transformaciones conformes
si además, en todo punto z y w (excepto en aquellos en los cuales g ′ (z) y por lo tanto h′ (w) son cero o
infinita) cumple con
Curvas contı́nuas en el plano z transforman en curvas contı́nuas en el w
Los ángulos entre dos curvas cualesquiera que se intersecten en el plano z serán los mismos que los que
formen las curvas transformadas en el plano w. Esto es los ángulos entre las curvas serán invariantes
bajo la transformación9
El cambio de escala en la vecindad de puntos transformados es independiente de la dirección en la cual

se mida.
Cualquier función analı́tica en z = x + iy transforma en otra función w = r + is también analı́tica
9 De esta propiedad es donde la transformación hereda su nombre de conforme. Son transformaciones isogonales es decir, que
preservan los ángulos entre curvas que se intersectan que son transformadas

Figura 8.3: Tranformaciones conformes. Cuadrante superior representa las conservación de ángulos y escala
bajo transformaciones y el inferior un ejemplo de transformaciones conforme
La segunda de las afirmaciones es inmediata a partir de la primera. Es decir, si una transformación conforme
de coordenadas tienen inversa y ambas són analı́ticas, es obvio que curvas contı́unas C(z) serán transformadas
˜
a curvas contı́nuas C(w).
El hecho que la transformación conforme preserva el ángulo y las escalas se muestra en la figura 8.3
y puede comprobarse de la siguiente manera. Considere dos curvas, C1 (z) y C2 (z), en el plano complejo
z = x + iy. Supongamos además que estas curvas se intersectan en un punto z = z0 . Entonces, sobre las
tangentes a cada curva, en z0 , definimos otros dos puntos z1 y z2 de tal forma que
 
z1 − z0 = ρeiθ1   w1 − w0 = ρ1 eiφ1
⇒
 
z2 − z0 = ρeiθ2 w2 − w0 = ρ2 eiφ2
Nótese que hemos construido los puntos z1 y z2 sobre las tangentes a z0 a la misma distancia ρ de z0
y, en principio, hemos supuesto que las distancias a los puntos transformados w1 y w2 (las cuales hemos
identificado como ρ1 y ρ2 , respectivamente), no son iguales. Ahora bien, dado que w = g(z) es analı́tica
entonces

dg(z) dw w1 − w0 w2 − w0 ρ1 ρ2
= = lı́m = lı́m ⇒ g ′ (z0 ) = lı́m exp i(φ1 −θ1 ) = lı́m exp i(φ2 −θ2 )
dz z=z0 dz z=z0
z1 →z0 z1 − z0 z2 →z0 z2 − z0 ρ→0 ρ ρ→0 ρ
Es claro que al comparar las magnitudes y las fase demostramos que las transformaciones conformes preservan
las distancias, ρ1 = ρ2 , y los ángulos (φ2 − φ1 ) = (θ2 − θ1 ). Adicionalmente, es muy fácil convecerse que si la
transformación conforme conserva los ángulos entre curvas y las escalas en todas direcciones las figuras son
transformadas en figuras equivalentes quizá ampliadas y rotadas, pero no deformadas.
8.6.2. Algunas consecuencias y ejemplos

Las consecuencias de la última afirmación revisten alguna importancia. Si f = f (z) es anal’tica en el
plano (x, y) y la transformación z = h(w) también lo es, entonces la función F (w) = f (h(w)) necesariamente

es analı́tica en el plano (r, s).

∆F ∆f ∆h ∆f ∆h
= ≡
∆w ∆h ∆w ∆z ∆w
Por hipótesis supusimos que f y h erán analı́ticas, por lo cual es inmediato concluir que debido a que los dos
factores de la derecha son anal’ticos, la función F (w) también lo será.
Esto implica que, tal y como mostramos en la sección 8.2.5 si f (z) = u(x, y) + iv(x, y), es análitica,
entonces u(x, y) y v(x, y) serán funciones armónicas conjugadas, vale decir que satisfacen la ecuación de
Laplace, con lo cual ∇2 u(x, y) = ∇2 v(x, y) = 0. Eso significa que si F = Φ(w) + iΨ(w). En otras palabras,
 2 2
  2 
 ∂ φ+∂ φ =0 
  
 ∂ Φ ∂2Φ 


 
 
 + =0  
 ∂x2 ∂y 2   ∂x2 ∂y 2 
f = φ + iψ ⇒ ⇔ F = Φ + iΨ ⇒

 
 
 

 ∂2ψ ∂2ψ
 
  ∂2Ψ ∂2Ψ
 

 2
+ 2
= 0   2
+ 2
= 0 
∂x ∂y ∂x ∂y
Esto impone que si ℜf (z) = φ es constante en el plano (x, y), también lo será ℜF (w)Φ en (r, s) (¡ Demuéstrelo
!). Esta propiedad derivó una serie de aplicaciones en la solución de la ecuación de Laplace en dos dimensiones.
Si bien es una técnica elegante y útil cuando es posible, no deja de ser limitada porque se restringe a 2D.
Hoy los métodos numéricos para resolver ecuaciones diferenciales en derivadas parciales han superado con
creces este tipo de técnicas.
Los ejemplos son variados.
las siguientes transformaciones representan
traslaciones: w = z + b; rotaciones de ángulo θ: w = zeiθ ; expansiones de escala a : w = az
y pueden ser combinadas como: w = az+b con a y b números complejos. Para la traslación es inmediado.
Para la rotación también si recordamos que z = |z|eiφ con lo cual w = |z|eiφ eiθ = |z|ei(φ+θ)
también la transformación de inversión w = 1/z que transforma los puntos del interior de un cı́rculo
1 1 1
unidad a su exterior y viceversa. Una vez más, w = = iφ
= e−iφ . Entonces es claro que
z |z|e z
0 ≤ |z| ≤ 1 ⇒ ∞ < |w| ≤ 1 ∧ 1 ≤ |z| ≤ ∞ ⇒ 0 < |w| ≤ 1

z − z0
Un caso más interesante lo constituye la transformación w = eiθ , la cual transforma los
z − z0∗
puntos z0 del semiplano superior complejo y > 0 al interior de un cı́rculo unidad en el w−plano (ver
figura 8.3 en la página 319). Para convencernos de ello notamos que

z − z0 z − z0
|w| = eiθ =
z − z0∗ z − z0∗
En general si z0 y z los consideramos en el semiplano complejo superior y ≥ 0, entonces siempre se

cumple que |z−z0 | ≤ |z−z0∗ | con lo cual |w| ≤ 1 y como se cumple para todo z en ese semiplano, entonces
cada uno de esos puntos es transformado dentro de un cı́rculo de radio |w|. Es inmediato convencerse
que, la igualdad se cumple para puntos z sobre el eje real y que el punto z = z0 es llevado al punto
w = 0 Finalmente, notamos que si conocemos como transforman dos puntos z1 → w1 y z2 → w2
entonces podremos determinar la transformación. Esto es, conocer los valores de los parámetros z0 y φ
Este caso lo podemos apreciar si consideramos un par de puntos en el semiplano complejo y conocemos

Figura 8.4: Integrales complejas y circuitos
como tranforman. Digamos z = i sobre el eje imaginario e imponemos que sea transformado a w = 0
entonces es inmediato determinar que z0 = i Por otro lado si imponemos que z = ∞ ⇒ w = 1 entonces
z−i
1 = w = eiθ ⇒ θ = 0 con lo cual w =
z+i
8.7. Integrales complejas

Como siempre, luego de definir la derivada, construimos el concepto de integral a partir de la suma de
Riemann. Esto es
Xn Xn Z z2
Sn = f (ζj )(zj − zj−1 ) si n → ∞ ⇒ |zj − zj−1 | → 0 ⇒ lı́m f (ζj )(zj − zj−1 ) = dz f (z)
n→∞ z1
j=1 j=1
Es decir que si el lı́mn→∞ Sn existe corresponde con la definición de la integral.
8.7.1. Algunas propiedades

Es claro que esta integral es, necesariamente, una integral de lı́nea, ya que z tiene “dos dimensiones”
Z z2 Z z2 Z x2 ,y2 Z x2 ,y2
dz f (z) = (dx + idy) (u(x, y) + iv(x, y)) = (u(x, y)dx − v(x, y)dy)+i (v(x, y)dx + u(x, y)dy)
z1 z1 x1 ,y1 x1 ,y1
(8.8)
con lo cual transformamos una integral compleja en una suma de integrales reales, pero necesitamos definir
el contorno a través del cual vamos de z1 = x1 + iy1 → z2 = x2 + iy2
La integración compleja tendrá las propiedades acostumbradas
R R R
C
dz (f (z) + g(z)) = C dz f (z) + C dzg(z)
R R
C
dz Kf (z) = K C dz f (z) con K una constante real o compleja

Rb Ra
a
dz f (z) = − b dz f (z)
Rb Rm Rb
a
dz f (z) = a dz f (z) + m dz f (z)
R
C
dz |f (z)| ≤ M L donde M = máx |f (z)| y L la longitud de C
Esta última propiedad es importante porque permite establecer cotas a las integrales complejas sin tener que
evaluarlas. De la definición de integral es casi inmediata la demotración

n Z z2 n n n
X X X X
lı́m f (ζj )∆zj = dz f (z) ⇒ f (ζj )∆zj ≤ |f (ζj )| |∆zj | ≤ M |∆zj | ≤ M L
n→∞ j=1
j=1 z1 j=1 j=1
Donde hemos utilizado que |f (ζj )| ≤ M y que la suma de los intervalos ∆zjR= zj − zj−1
esR la longitud L del
recorrido C. Es claro que tomando lı́mites a ambos miembros obtendremos C dz f (z) ≤ C dz |f (z)| ≤ M L
8.7.2. Un par de ejemplos

Por ejemplo, evaluemos la integral compleja f (z) = z −1 a lo largo de diferentes contornos, tal y como se
ilustran en la figura 8.4
un circuito cerrado a lo largo de una circunferencia de radio R
I I Z 2π
dz z −1 ≡ d(Reiθ ) R−1 e−iθ = i dθ = 2πi
0
siguiendo una semicircunferencia desde (R, 0) → (−R, 0). Esto es

Z z2 =(−R,0) Z (R,π) Z π
dz z −1 = d(Reiθ ) R−1 e−iθ = i dθ = πi
z1 =(R,0) (R,0) 0
siguiendo dos lı́neas rectas entre los puntos (R, 0) → (0, R) → (−R, 0). En este caso, procedemos
utilizando la expresión cartesiana para los números complejos. Para ello, vamos a parametrizar z = z(t)
para (R, 0) → (0, R) y z = z(s) cuando (0, R) → (−R, 0). Veamos
Z z3 =(−R,0) Z z2 =(0,R) Z z3 =(0,−R)
dz z −1 = dz z −1 + dz z −1
z1 =(R,0) z1 =(R,0) z2 =(0,R)
para cada una de las integrales se cumple, respectivamente, que
z = (1 − t)R + itR con 0 ≤ t ≤ 1 ∧ z = −sR + i(1 − s)R con 0 ≤ s ≤ 1
con lo cual Z Z Z
z2 =(−R,0) 1 1
dz −1 + i −1 − i
= dt + ds
z1 =(R,0) z 0 1 + t(−1 + i) 0 i + s(−1 − i)
procedemos entonces con la primera de las integrales
Z 1 Z 1 Z 1 Z 1
(−1 + i)dt (−1 + i)((1 − t) − it)dt (2t − 1)dt dt
= 2 2
= 2
+ i 2
0 (1 − t) + it 0 (1 − t) − t 0 1 − 2t + 2t 0 1 − 2t + 2t

es decir
Z 1 1 1 π
(−1 + i)dt 1 1 t−
= ln(1 − 2t + 2t2 )0 + i arctan 2 = 0 + i π − −π =
(1 − t) + it 2 1 2 2 2 2
0 2 0
y, la segunda integral también tendrá el mismo resultado, con lo cual

Z z2 =(−R,0)
dz
= πi ¡ el mismo resultado que a través del arco de circunferencia !
z1 =(R,0) z
Es interesante notar que si regresamos al punto (R, 0) a través del contorno (−R, 0) → (0, −R) →
(R, 0) la integral cerrada se anula, no ası́ cuando nos regresamos a través el arco complementario de
circunferencia. En pocas palabras, como se esperaba, el valor de las integrales de camino, para algunas
funciones, dependeran del camino seleccionado. En la próxima sección veremos a cuáles funciones
corresponderá un mismo valor de la integral cerrada, independientemente del circuito que uno elija.
Queda como ejercicio al lector repetir los mismos pasos anteriores para el caso de f (z) = (z ∗ )−1
Otro ejemplo ilustrativo lo constituye
 R 2π
I Z 2π Z 2π  n = 0 : 0 dθ = 2iπ
dz Rieiθ dθ i
⇒ = n dθ e−inθ ⇒
(z − z0 )n+1 0 R n+1 ei(n+1)θ R 0  i
R 2π
n 6= 0 : Rn 0
dθ (cos nθ − isen nθ) = 0
donde hemos utilizado la forma polar z − z0 ≡ Reiθ e integrado a lo largo de una circunsferencia de
radio R centrada en z = z0
8.8. Teorema Integral de Cauchy

8.8.1. El Teorema y las Regiones
El teorema integral de Cauchy es uno de los dos teoremas básicos en la teorı́a de funciones de variable
compleja. Este teorema considera que si f (z) es analı́tica en una región simplemente conexa, R, en su
contorno C y su derivada f ′ (z) existe y es contı́nua en esta región10 , entonces la circulación a lo largo de
cualquier contorno cerrado C se anula. Esto es
I
dz f (z) = 0
C
Antes que nada, y como parte de ese adiestramiento en lenguaje, precisaremos qué queremos decir (qué quie-
ren decir los matemáticos) con regiones simplemente conexa y múltiplemente conexa
Una región simplemente conexa es aquella que no tiene “huecos”, o dicho de una manera más precisa
y elegante, en la cual una curva Γ puede ser reducida (encogida) a un punto sin salir de la región R. En
la figura 8.5 cuadrante Ia se muestra una región simplemente conexa y en los cuadrantes Ib y Ic regiones
multiplemente conexas. Estas dos últimas figuras clarifican este concepto. Es decir, una región múltiplemente
conexa es aquella que no es simplemente conexa y con eso queremos decir que “tiene huecos”, o lo que es lo
mismo existen curvas que no se pueden reducir a puntos en la región.
10 Esta última condición no es necesaria, pero la demostración del Teorema se torna mucho más sofisticada, y referimos al
lector a los libros especializados, vale decir a las referencias [Churchill y Brown1989, Knopp 1996]

Figura 8.5: Regiones en el plano complejo
Tal y como hemos comentado la demostración rigurosa del Teorema de Cauchy está fuera de los alcances
de estas notas, pero algo se puede hacer si invocamos el Teorema de Stokes (o uno de los Teoremas de Green
en el plano) que vimos cuando estudiamos análisis vectorial. Con ello recordamos la ecuación (8.8), entonces
Z z2 Z x2 ,y2 Z x2 ,y2
dz f (z) = (u(x, y)dx − v(x, y)dy) + i (v(x, y)dx + u(x, y)dy)
z1 x1 ,y1 x1 ,y1
El Teorema de Stokes nos dice que

Z I
∂p ∂q
dxdy + = (pdy − qdx)
R ∂x ∂y C
con lo cual, si una vez más suponemos f (z) = u(x, y) + iv(x, y) y dz = dx + idy, entonces tendremos que
I I Z Z
∂(−v) ∂(−u) ∂(u) ∂(−v)
(udx − vdy) + i (vdx + udy) = dxdy + +i dxdy + =0
C C R ∂x ∂y R ∂x ∂y
y acto seguido, como f (z) es analı́tica, invocamos las condiciones de Cauchy Riemann (ecuación (8.2)) y es
inmediato ver que se anula la integral de circulación.
8.8.2. Algunas observaciones y el Teorema de Morera

De la anterior “demostración” del Teorema de Cauchy Riemann emergen algunas observaciones
La primera es la insistencia de que la condición que la derivada f ′ (z) existe y es contı́nua en esta región
no es necesaria.
La segunda es que el Teorema de Cauchy Riemann, es válido también para regiones múltiplementes
conexas. Consieremos una región como la descrita en la figura 8.5 cuadrante II, es claro que podemos
circular la integral en los siguientes contornos
I Z Z Z Z Z
dz f (z) = dz f (z) ≡ dz f (z)+ dz f (z)+ dz f (z)+ dz f (z) = 0
C ABDEAF GHF A ABDEA AF F GHF FA

R R
y como AF
dz f (z) = − F A dz f (z) entonces
Z Z I I
dz f (z) + dz f (z) = 0 ⇔ dz f (z) + dz f (z) = 0
ABDEA F GHF C1 C2
con lo cual se nota que para regiones múltiplemente conexas, a pesar que las circulaciones son opuestas,
el “observador” que circula por C1 y C2 siempre tiene la región R a su izquierda.
Siguiendo con la reflexión anterior, podemos invertir el sentido de la circulación en el contorno C2 con
lo cual I I I I
dz f (z) − dz f (z) = 0 ⇔ dz f (z) = dz f (z)
C1 C2 C1 C2
Es decir, que si f (z) es analı́tica en una región R, da igual cualquier recorrido por las fronteras de una
región y el valor de la integral permanecerá inalterado.
Más aún este resultado puede extenderse a regiones con n huecos de tal forma que, tal y como ilustra
en en la figura 8.5 cuadrante III
I Xn I
dz f (z) = dz f (z)
C1 j=1 Cj
Con lo cual estamos afirmando que, dada una región que contiene un número finito (¿ numerable ?) n
de singularidades, la integral a lo largo del contorno que encierra la región R es equivalente a la suma
de las integrales que encierran cada una de las n singularidades.
Enunciaremos sin demostración el Teorema de Morera11 , también conocido como el teorema inverso de
Cauchy.
Teorema
H de Morera: Si una función f (z) es continua en una región R encerrada por un contorno C y
C
dz f (z) = 0 entonces f (z) es analı́tica en R
Ejemplo: Considere la función definida en una región R

1 z0 fuera de la región R
f (z) = con
z − z0 z0 dentro de la región R
Si z0 está fuera de la región, entonces f (z) esa analı́tica en R, con lo cual el Teorema de Cauchy
implica que I
dz f (z) = 0
C
Si z0 está dentro de la región, entonces f (z) no es analı́tica en R por cuanto existe una singularidad
z = z0 . Si consideramos C el contorno que bordea a R, como una circunsferencia centrada en z = z0 y
Γ otra circunsferencia que aisla a z0 con un radio |z − z0 | = ǫ (esta situación se ilustra en la figura 8.6
cuadrante I). Entonces, si hacemos z − z0 = z̃ = ǫeiθ el Teorema de Cauchy implica
I I Z 2π Z 2π
dz dz ǫieiθ dθ
= = = i dθ = 2iπ
C z − z0 Γ z − z0 0 ǫeiθ 0
11 Pueden consultar la demostración en la referencia [3]

Figura 8.6: Circulaciones y Polos
8.8.3. Fórmula integral de Cauchy

El ejemplo de la sección anterior nos lleva a una de las expresiones más útiles e importantes del análisis
complejo: La Fórmula Integral de Cauchy la cual dice que si f (z) es analı́tica en una región R encerrada por
un contorno C y consideramos un punto z = z0 contenido en esa región, entonces
I
1 f (z) dz
= f (z0 )
2iπ C z − z0
Para probar esta afirmación supongamos, una vez más un circuito en encierra al polo z = z0 (ver figura 8.6,
cuadrante II). Con lo cual, como f (z) es analı́tica en una región, el Teorema de Cauchy nos garantiza
I I Z 2π Z 2π
1 f (z) dz 1 f (z) dz 1 f (z0 + reiθ )rieiθ dθ 1
= si z−z0 = reiθ ⇒ = f (z0 +reiθ )dθ
2iπ C z − z0 2iπ Γ z − z0 2iπ 0 reiθ 2π 0
si hacemos r → 0 tendremos que

I I Z 2π Z 2π
1 f (z) dz 1 f (z) dz 1 1
= = lı́m f (z0 + reiθ )dθ = lı́m f (z0 + reiθ )dθ = f (z0 )
2iπ C z − z0 2iπ Γ z − z0 r→0 2π 0 2π 0 r→0
Observaciones Surgen también observaciones al respecto
Obvio que es válido para regiones múltiplemente conexas y es fácil demostrarlo. Se lo dejamos al lector
como ejercicio.
Si reacomodamos la expresión para la forma integral podemos hacer en esa fórmula es válida para todo
z I
1 f (ζ) dζ
f (z) =
2iπ C ζ − z

Más aún veremos que es fácil generalizar esta fórmula para derivdas de funciones, vale decir
I
(n) n! f (z) dz
f (z0 ) =
2iπ C (z − z0 )n+1
Veamos con el caso más sencillo y demostremos que para n = 1
I I
′ 1 f (z) dz ′ f (z0 + h) − f (z0 ) 1 f (z) 1 1
f (z0 ) = ⇒ f (z0 ) = lı́m = lı́m − dz
2iπ C (z − z0 )2 h→0 h h→0 2iπ C h z − z0 − h z − z0
tal y como se muestra en la figura 8.6, cuadrante III tenemos que
I I
′ 1 f (z) dz 1 f (z) dz
f (z0 ) = lı́m =
h→0 2iπ C (z − z0 − h)(z − z0 ) 2iπ C (z − z0 )2
Pero mucho más interesante hubiera sido “derivar respecto a una constante”. Este truco implica que
I I I
1 f (ζ) dζ (n) 1 ∂ n f (ζ) n! f (ζ) dζ
f (z) = ⇒ f (z) = dζ = (8.9)
2iπ C ζ − z 2iπ C ∂z n ζ − z 2iπ C (ζ − z)n+1
Esta fórmula es muy util para calcular integrales. Considere, por ejemplo la siguiente integral
I
e2ζ dζ 2iπ (3) 8iπ −2
I= 4
≡ f (−1) con f (z) = e2z ⇒I= e
C (ζ + 1) 3! 3
donde hemos supuesto que el contorno C encerraba el punto z = −1, porque de otro modo la función
e2z
serı́a analı́tica y la integral se anuları́a por el Teorema de Cauchy.
(z + 1)4
8.9. Otra vez Taylor y ahora Laurent

En la sección 8.3.2 consideramos series complejas de potencias. En esta sección revisaremos, desde la pers-
pectiva de haber expresado la derivada n−esima de una función analı́tica en la ecuación (8.9), el equivalente
a las series de Taylor para funciones complejas de variable complejas.
8.9.1. Series de Taylor para funciones analı́ticas

Si f (z) es analı́tica en un cı́rculo de radio R, encerrado por un contorno C y centrado en un punto z = z0 .
Entonces f (z) puede ser expandida en series de potencias (enteras positivas) para todo |z − z0 | < R de la
forma
X∞
f (n) (z0 ) f ′′ (z0 ) f (n) (z0 )
f (z) = (z − z0 )n ≡ f (z0 ) + f ′ (z0 )(z − z0 ) + (z − z0 )2 + · · · + (z − z0 )n + Rn
n=0
n! 2 n!
con el resto Rn (z) definido como

I
(z − z0 )n f (ζ) dζ
Rn (z) =
2iπ C (ζ − z0 )n (ζ − z)
Para probar esta afirmación partimos de la fórmula integral de Cauchy escrita convenientemente
 
I I
1 f (ζ) dζ 1 f (ζ)  1 
f (z) = = dζ   (8.10)
2iπ C ζ − z 2iπ C ζ − z0 1 − z − z0
ζ − z0

de donde
 n+1 
z − z0
I I  2 n 
1 f (ζ) dζ 1 f (ζ)  z − z0 z − z0 z − z0 ζ − z0
f (z) = ≡ dζ 1 + + + ··· + + 
2iπ C ζ −z 2iπ C ζ − z0  ζ − z0 ζ − z0 ζ − z0 ζ −z 
ζ − z0
z − z0
este último corchete proviene de una forma ingeniosa de utilizar una serie geométrica de razón r = .
ζ − z0
Para entenderlo, recordemos que para una serie geométrica, se cumple que
1 − rn+1 1 rn+1 1 rn+1

1 + r + r2 + r3 + · · · + rn = = − ⇒ = 1 + r + r2 + r3 + · · · + rn + (8.11)
1−r 1−r 1−r 1−r 1−r
Entonces
 n+1 
z − z0
I I Xn j 
1 f (ζ) dζ 1 f (ζ)  z − z0 ζ − z0
f (z) = ≡ dζ  +  (8.12)
2iπ C ζ −z 2iπ C ζ − z0 j=0 ζ − z0 ζ −z 
ζ − z0
con lo cual
n
X I n
X
1 f (ζ) f (j) (z0 )
f (z) = (z − z0 )j dζ + Rn (z) = (z − z0 )j + Rn (z) (8.13)
j=0
2iπ C (ζ − z0 )j+1 j=0
j!
donde I
(z − z0 )n f (ζ)
Rn (z) = dζ (8.14)
2iπ C (ζ − z0 )n (ζ − z)
Obvio que la serie (8.13) converge si Rn (z) → 0 cuando n → ∞ y de eso es fácil convencerse al acotar la
ecuación (8.14). Esto es, considerando ζ sobre el contorno C y z en el interior de R, entonces
I I
(z − z0 )n f (ζ) |z − z0 |n f (ζ) |z − z0 |n 1
|Rn (z)| = dζ n
<

n
dζ <
M n 2πR
2iπ C (ζ − z0 ) (ζ − z) 2π C (ζ − z0 ) (ζ − z) 2π R
(8.15)
f (ζ)
iθ
donde, una vez más, hemos utilizado la forma polar ζ̃ = ζ − z0 = Re y hemos acotado < M , con
n ζ − z
z − z0
lo cual es inmediato constatar que lı́mn→∞ = 0 ⇒ Rn (z) → 0, con lo cual la serie converge.
R
Ejemplos Expanda
1
f (z) = alrededor de z = z0
1−z
X∞
1 1 1 2 1 3 (z − z0 )n (z − z0 )n
f (z) = + 2
(z−z 0 )+ 3
(z−z 0 ) + 4
(z−z 0 ) +· · ·+ n+1
+· · · =
1 − z0 (1 − z0 ) (1 − z0 ) (1 − z0 ) (1 − z0 ) n=0
(1 − z0 )n+1

Figura 8.7: Expansión de Laurent
f (z) = ln(1 + z)ST alrededor de z = 0 (Serie de Maclaurin)

∞
X
(−1)n+1 n! n ′ f ′′ (0) 2 f ′′′ (0) 3 z2 z3
f (z) = ln(1+z) = ln(1 + z)|z=0 + z ≡ f (0)+f (0)z+ z + z +· · · = z− + +· · ·
n=1
(1 − z)n+1 z=0 2 3! 2 3

1+z
f (z) = ln alrededor de z = 0 (Serie de Maclaurin)
1−z
X ∞
1+z z2 z3 z2 z3 z3 z5 2z 2n+1
ln ≡ ln(1+z)−ln(1−z) = z− + · · · − −z − − ··· = 2 z + + ··· =
1−z 2 3 2 3 3 5 n=0
2n + 1
8.9.2. Series de Laurent

Hemos dicho que si una función f (z) es analı́tica en una región (digamos que circular) R, entonces puede
ser expandida por series de Taylor. Sin embargo, si f (z) tiene un polo de orden p, digamos, en z = z0 , dentro
de la región R, no será analı́tica en ese punto, mientras que g(z) = (z − z0 )p f (z) si lo será en todos los
puntos de esa región. Entonces f (z) podrá ser expandida como series de potencias (de Laurent) de la forma
X∞ X∞ ∞
X I
k n a−n 1 f (ζ) dζ
f (z) = ak (z−z0 ) = an (z−z0 ) + n
con an = n = 0, ±1, ±2, · · ·
n=−∞ n=0 n=0
(z − z 0 ) 2iπ C (ζ − z)n+1
(8.16)
o equivalentemente
g(z) a−p a−p+1 a−1
f (z) = p
= p
+ p−1
+ ··· + + a0 + a1 (z − z0 ) + a2 (z − z0 )2 + · · · (8.17)
(z − z0 ) (z − z0 ) (z − z0 ) (z − z0 )
P∞ a−n
La suma de todos los términos que tengan potencias negativas, vale decir n=0 (z−z 0)
n , se denomina parte
principal de f (z).

Para demostrar (8.16) o (8.17), recordamos que, tal y como muestra la figura 8.7 cuadrante I, si f (z) es
analı́tica en la región anular, entonces el Teorema de Cauchy, nos garantiza que
I I I I
1 f (ζ) dζ 1 f (ζ) dζ 1 f (ζ) dζ 1 f (ζ) dζ
f (z) = + ≡ −
2iπ C1 ζ − z 2iπ C2 ζ − z 2iπ C1 ζ − z 2iπ C2 ζ − z
donde en el segundo caso hemos supuesto que ambas circulaciones tienen el mismo sentido.
Del mismo modo como procedimos en la ecuación (8.10) re escribimos el segundo par de integrales como
   
I I
1 f (ζ)  1  1 f (ζ) 
 1 

f (z) = dζ  + dζ
2iπ C1 ζ − z0 1 − z − z0 2iπ C2 z − z0  ζ − z0 
1−
ζ − z0 z − z0
y ahora invocando, una vez más la progresión geométrica (8.11) podemos construir expresiones de integrales
equivalentes a la ecuació (8.12). Vale decir
 n   n 
z − z0 ζ − z0
I n−1
X z − z0 j I n−1
X ζ − z0 j
1 f (ζ)  ζ − z0  1 f (ζ)  z − z0 
f (z) = dζ  + + dζ 
 + 
2iπ C1 ζ − z0 j=0 ζ − z0 ζ −z 2iπ C2 z − z0 j=0 z − z0 ζ −z 
ζ − z0 z − z0
y equivalentemente
n−1 I n−1 I
1 X f (ζ) 1 X 1
f (z) = (z − z0 )j dζ +R n1 (z) + dζ f (ζ)(ζ − z0 )j +Rn2 (z)
2iπ j=0 C1 (ζ − z0 )j+1 2iπ j=0 (z − z0 )j+1 C2
| {z } | {z }
aj a−j
(8.18)
Con lo cual queda demostrado la forma funcional de los coeficientes de la expansión de Laurent. La demos-
tración de la convergencia, esto es n → ∞ ⇒ Rn1 (z) → Rn2 (z) → 0 sigue el mismo esquema que utilizamos
para demostrar la convergencia de la ecuación (8.15) y se lo dejamos como ejercicio al lector.
8.9.3. Algunos Ejemplos

En muchos casos las expansiones en series de Laurent no se generan a partir de la fórmula de la ecuación
(8.16) sino a partir de manipulaciones algebráicas y expansiones en Taylor moduladas por otros factores.
El primer y ’ultimo ejemplo lo haremos directamente. Vale decir que como lo vamos a hacer no lo haremos
otra vez. Consideremos el siguiente ejemplo y hag’amoslo directo. Supongamos de entrada que z0 = 0 con lo
cual la regi’on anular en la cual no existen polos ser’a r < |z − z0 | < R ⇒ 0 < |z − z0 | < 1. Utilizando las
f’ormulas de 8.18 construimos la relaci’on
I I I ∞ ∞ I
1 f (ζ)dζ dζ dζ X n X dζ
f (z) = ⇒ aj = j+1
= j+2 (ζ − 1)
= j+2
ζ = j+2−n
z(z − 1) C1 (ζ − z 0 ) C1 ζ C1 ζ n=0 n=0 C1
ζ
conviertiendo a la forma polar tendremos que


∞ I
X X∞  an = −2iπ para n ≥ −1
riθeiθ dθ
= 2iπ δj+2−n,1 ⇒
C1 rj+2−n ei(j+2−n)θ 
n=0 n=0 an = 0 para n < −1

es decir
1 1
f (z) = = − − 1 − z − z2 · · ·
z(z − 1) z
Consideremos los siguientes ejemplos de desarrollo en Series de Laurent
1.
1
f (z) =
z(z − 2)3
Alrededor de las singularidades z = 0 y z = 2
2.
1
f (z) =
(z + 1)(z + 3)
Esta función tienes polos de orden 1 en z = −1 y z = −3. Además expresando f (z) como una suma
de fracciones parciales, tendremos

1 1 1 1 1
f (z) = = −
(z + 1)(z + 3) 2 z+1 2 z+3
a) para 1 < |z| < 3

Expresando f (z) como una suma de fracciones parciales, tendremos

1 1 1 1 1
f (z) = = −
(z + 1)(z + 3) 2 z+1 2 z+3
b) para |z| > 3

c) para 0 < |z + 1| < 2
d ) para |z| < 1
3.
e2z
f (z) =
(z − 1)3
4.
z − sen z
f (z) =
z3
8.10. Integración por el método de los residuos

Desde siempre hemos sabido que las expansiones de funciones en series de potencias dejan “residuos” al
detener la expansión a para una determinada potencial. Esto se puede apreciar claramente en la expresión de
Taylor para funciones analı́ticas (8.13) y, en particular en (8.14). Ahora, las expansiones de Laurent (8.18)
nos muestran otro “residuo”. Explotaremos las series de Laurent para funciones con polos y construiremos
un método para evaluar integrales de funciones en esos puntos. Primero estudiaremos los residuos en general
y luego los utilizaremos para evaluar integrales.

8.10.1. Los residuos de Laurent

Hemos dicho que si f (z) tiene un polo de orden p en z = z0 ∈ R, entonces
I ∞
X a−p a−p+1 a−1
dz f (z) 6= 0 ⇒ f (z) = ak (z−z0 )k = + +· · ·+ +a0 +a1 (z−z0 )+a2 (z−z0 )2 +· · ·
C n=−∞
(z − z0 )p (z − z0 )p−1 (z − z0 )
más aún, siguiendo (8.16) tendremos que los coeficientes de la expansión pueden ser calculados a partir de
I I
1 f (ζ) dζ
an = n = 0, ±1, ±2, · · · si n = −1 ⇒ f (ζ) dζ = 2iπa−1 ≡ 2iπRes f (z) (8.19)
2iπ C (ζ − z)n+1 C
Es decir, la integración a lo largo de un contorno C que aisle al polo z = z0 es proporcional al residuo

correspondiente a la expansión de Laurent alrededor de ese polo. Nos queda entonces calcular el residuo para
ası́ no calcular la integral.
Esta situación se ilustra con el siguiente ejemplo. Supongamos
I
sen z 1 z3 z5 1 1 z 1 iπ
f (z) = 4
= 4
z − + + · · · = 3
− + +· · · ⇒ a−1 = − ⇒ f (ζ) dζ = 2iπa−1 = −
z z 3! 5! z 3!z 5! 3! C 3
En general, si f (z) tiene un polo de orden p en z = z0 ∈ R, entonces

∞
X
dp−1
(z−z0 )p f (z) = a−p +a−p+1 (z−z0 )+· · ·+a0 (z−z0 )p +· · · ⇒ [(z−z 0 )p
f (z)] = (p−1)!a−1 + bn (z−z0 )n
dz p−1 n=1
con lo cual concluimos que

1 dp−1 p
a−1 ≡ Res f (z) = lı́m [(z − z 0 ) f (z)] (8.20)
z→z0 (p − 1)! dz p−1
Si, por ejemplo consideramos



 d 2 d eiz

 z0 = i ⇒ [(z − i) f (z)] =
eiz eiz  dz dz (z + i)2
f (z) = 2 2
≡ ⇒
(z + 1) (z + i)2 (z − i)2 
 d d eiz

 2
 z0 = −i ⇒ [(z + i) f (z)] =
dz dz (z − i)2
con lo cual

eiz 1 d eiz (z + i)2 ieiz − eiz 2(z + i) −4ie−1 − −4ie−1 i
Res = lı́m = lı́m = =−
2 2
(z + 1) z=i z→i 1! dz (z + i) 2 z→i (z + i)2 16 2e
del mismo modo se procede para el caso z = −i

p(z)
Un caso particular y muy útil lo constituyen las funciones racionales del tipo f (z) = y f (z) tiene
q(z)
un polo simple en z = z0 . Esto es q(z0 ) = 0 entonces

(z − z0 )p(z) (z − z0 ) p(z0 )
Res f (z)|z=z0 = lı́m = p(z0 ) lı́m = ′ (8.21)
z→z0 q(z) z→z0 q(z) q (z0 )

porque hemos utilizado el Teorema de L’Hopital. Este caso lo podemos ejemplificar si consideramos una
función


 4 − 3z
 z = 0 ⇒ Res f (z)|z=0 = = −4
4 − 3z 4 − 3z

 2z − 1 z=0
f (z) = 2 ≡ con polos en (8.22)
z −z z(z − 1) 
 4 − 3z


 z = 1 ⇒ Res f (z)|z=1 = =1
2z − 1 z=1
8.10.2. Teorema del Residuo

Hemos visto como calcular las integrales de funciones, en regiones múltiplemente conexas, con polos
simples a partir de residuos. Ahora generalizaremos ese esquema para una región, también múltiplemente
conexa, pero con un número finito de polos. Tal y como se muestra en la figura 8.7 en el cuadrante II,
realizamos una circulación ingeniosa, de tal modo que aislamos los distintos polos. Ahora bien, como la
función es analı́tica en la región bordeada por todos esos contornos, entonces
I I I I
dz f (z) + dz f (z) + dz f (z) + · · · dz f (z) = 0
C C1 C2 Cm
y al cambiar el sentido de circulación comprobamos lo que ya sabı́amos

I I I I I m
X
dz f (z) = dz f (z) + dz f (z) + · · · dz f (z) ⇔ dz f (z) = 2iπ Res f (z)z=z0j
C C1 C2 Cm C j=1
donde hemos utilizado lo que hicimos para la ecuación (8.19)

Con ello podemos enunciar el Teorema del Residuo que ya hemos demostrado
Si f (z) es analı́tica en una región R excepto en un número, m, finito de polos z01 , z02 , z03 , · · · z0m entonces
I m
X
dz f (z) = 2iπ Res f (z)z=z0j
C j=1
4 − 3z
Una vez más ejemplificamos. Se al función f (z) = una función con polos simples en z = 0 y z = 1
z2 − z
correspondientes a residuos 4 y 1, respectivamente, tal y como se vió en la sección (8.10.1). Entonces,
utilizamos los resultado expuestos en el ejemplo (8.22)
I
4 − 3z
dz 2 = 2πi(−4 + 1) = −6πi
C z −z
siempre y cuando el circuito C encierre los dos polos, z = 0 y z = 1, para los cuales hemos calculado los
residuos
Ejercicios
1. Determinar los polos y los residuos correspondientes para cada una de las funciones propuestas
2
2z + 1 z+1 sen z
f (z) = 2 ; f (z) = ; f (z) = ; f (z) = cot z
z −z−2 z−1 z2

2. Evaluar
a) I
dz ez
a lo largo de una circunsferencia con |z| = 5
C cosh z
b) I
(2z 2 + 5)dz
a lo largo de una circunsferencia con |z − 2i| = 6 y
C (z + 2)3 (z 2 + 4)z 2
un cuadrado de vértices z = 1 + i; z = 2 + i; z = 2 + 2i y z = 1 + 2i;
8.10.3. Evaluación de integrales, reales, impropias

El teorema del residuo (8.10.2) es una herramienta poderosa para evaluar algunos tipos de integrales
definidas en variable real. La intención es “extender” el dominio de las funciones de la recta real al Plano
Complejo. Una de las restricciones es que los contornos deben ser cerrados antes de que sea evaluados los
residuos. El punto es que muchas integrales reales tienen contornos abiertos y la posibilidad de evaluar estas
integrales a través del Teorema del Residuo descansa en la forma como se cierran los contornos. En estos casos
se debe estimar las contribuciones de esos contornos adicionales que pemiten cerrar los contornos abiertos.
A continuación expondremos algunas técnicas para cerrar algunos tipos de contornos abiertos.
Figura 8.8: Circuitos y evaluación de integrales reales, impropias
R∞
Integrales impropias del tipo −∞
dx f (x)
Este tipo de integrales implica, si ambos lı́mites existen
Z ∞ Z 0 Z r Z r
dx f (x) = lı́m dx f (x) + lı́m dx f (x) ↔ lı́m dx f (x)
−∞ r→−∞ r r→∞ 0 r→∞ −r

Necesitaremos que el integrando sea una función racional f (x) = p(x)/q(x), donde q(x) 6= 0 ∀ x. Adicional-
mente requeriremos que cuando menos q(x) ∼ x2 p(x). Supuesto todo esto, convertimos nuestra Hfunción ra-
cional en una función de variable compleja f (x) → f (z) y consideramos la integral de circulación, C dz f (z),
sobre un contorno C descrito por el eje real y una semicircunsfrencia Γ en el plano complejo con y ≥ 0, tal y
R ∞ se muestra en el cuadrante I la figura 8.8. La intención es hacer r → ∞ y con ello evaluar la integral
como
0
dx f (x). Es fácil convencerse que
I Z Z r m
X
dz f (z) = dz f (z) + dx f (x) = 2iπ Res f (z)z=z0j
C Γ −r j=1
es decir,
Z r m
X Z
dx f (x) = 2iπ Res f (z)z=z0j − dz f (z)
−r j=1 Γ
Esta esta estrategia es válida porque hemos supuesto que f (x) es racional y que q(x) 6= 0 ∀ x, entonces si
existen polos para f (z) estarán en el plano complejo (no sobre el eje real). Todos
R esos polos serán encenrados
por el contorno C que hemos seleccionado. Más aún, y comprobaremos que Γ dz f (z) → 0 cuandoz → ∞.
Esto es sencillo si notamos que
Z
k k kπ
q(x) ∼ x2 p(x) ⇒ |f (z)| < 2 ⇒ dz f (z) < 2 πr = para |z| = r ≥ 0
|z| Γ r r
con lo cual llegamos a que para este tipo de integrales
Z ∞ Xm
p(x)
dx f (x) = 2iπ Res f (z)z=z0j para f (x) = , con q(x) 6= 0 ∀ x ∧ p(x) ∼ x2 q(x) (8.23)
−∞ j=1
q(x)
Ejemplo Considere evaluar la siguiente integral

Z ∞ Z ∞ Xm
dx dx
4 4
⇒ 4 4
= 2iπ Res f (z)z=z0j
−∞ x + 1 −∞ x + 1 j=1
donde hemos utilizado la expresión (8.23). La extensión analı́tica

1 iπ 3iπ
f (x) → f (z) = tendrá cuatro polos simples: z = e± 4 ; z = e± 4 ;
z4 + 1
correspondientes a las cuatro raı́ces de z 4 = −1. Acto seguido calculamos los residuos invocando la relación
(8.21) que hemos construido para funciones racionales. Esto es
 −3iπ iπ


 iπ 1 e 4 e4
 z = e 4 ⇒ Res f (z)| iπ = = =

p(z) p(z0 )

 z=e 4 4z 3 z=e iπ
4 4 4
Res = ⇒
q(z) z=z0 q ′ (z0 ) 
 −9iπ −iπ


 z = e 3iπ 1 e 4 e 4
 4 ⇒ Res f (z)| 3iπ = = =
z=e 4 4z 3 z=e 3iπ
4 4 4
Hemos considerado únicamente los polos para el semiplano complejo y > 0 ya que seguimos considerando
el circuito descrito en el cuadrante I de la figura 8.8. Quedan dos polos ubicados en el semiplano complejo
y < 0, tal y como se muestra en el cuadrante II de la misma figura 8.8. Consecuentemente, tendremos que
Z ∞ √ Z ∞ Z √
dx 2πi iπ −iπ
π 2 dx 1 ∞ dx 2
4
= e 4 + e 4 = πsen = π ⇒ 4 4
= 4 4
= π
−∞ x + 1 4 4 2 0 x +1 2 −∞ x + 1 4

Ejemplo Para evaluar la siguiente integral

Z ∞
x2 dx z2
2 2 2
⇒ f (z) =
−∞ (x + 1) (x + 2x + 2) (z 2 + 1)2 (z 2 + 2z + 2)
donde hemos realizado la extensión analı́tica f (x) → f (z) y ubicado sus polos de z = i y z = i − 1 en
el semiplano complejo y > 0 y los encerrados por el circuito descrito en el cuadrante I de la figura 8.8.
El primero de estos polos es de segundo orden, mientras que el segundo corresponde a un polo simple.
Consecuentemente, los residuos se calculan invocando la relación general (8.20) arriba expuesta. Con lo cual
para
d z2 −12 + 9i
z = i ⇒ lı́m (z − i)2 =
z→i dz (z − i)2 (z + i)2 (z 2 + 2z + 2) 100
y para
z2 3 − 4i
z = i − 1 ⇒ lı́m (z − i + 1) 2 =
z→i−1 (z + 1)2 (z − i − 1)(z + i − 1) 25
Finalmente, podemos evaluar la integral
Z ∞ X2
x2 dx −12 + 9i 3 − 4i 7π
2 2 2
= 2iπ Res f (z)z=z0j = 2πi + =
−∞ (x + 1) (x + 2x + 2) j=1
100 25 50
Ejercicios Evaluar las siguientes integrales

Z ∞ Z ∞ Z ∞
dx dx dx
; ;
0 (x2 + 1)(x2 + 4)2 0 x4 + x2 + 1 −∞ (x2 + 4x + 5)2
Integrales de funciones racionales de cos θ y sen θ

Ahora mostraremos la estrategia para integrales de funciones racionales de funciones trigonométricas,
G(cos θ, sen θ). La idea es transformar estas integrales en otras de funciones de varible compleja a través
de los cambios de variables que conectan las funciones trigonométricas y los números complejos. Esto es
transformar integrales de la forma
Z 2π I
dz
dθ G(cos θ, sen θ) → f (z)
0 C zi
mediante cambios de variables estándares

iθ dz 1 1 1 1
z = re ⇒ dθ = ; cos θ = z+ ; y sen θ = z− (8.24)
zi 2 z 2i z
Ejemplo En las tablas de integrales encontrábamos12 que

Z 2π
dθ 2π
=√ con |a| > |b|
0 a + bsen θ a − b2
2
veamos como se llega a ese resultado.

12 Encontrábamos porque hoy en dı́a estas integrales las calculamos con manipuladores simbólicos del tipo Maple, Reduce,
Matemathica o Mupad

Haciendo z = reiθ y asumiendo las consecuencias, tal y como se presenta en (8.24) arriba, tendremos que
Z 2π I dz I
dθ zi 2dz
= b 1
= con C una circunferencia |z| = 1
0 a + bsen θ C a+ 2i z− z C bz 2 + 2aiz − b
los polos de √
2 −a ± a2 − b2
f (z) = ⇒ z±0 = i
bz 2 + 2aiz − b b
son los valores de z que anulan el denominador de f (z). Seguidamente verificamos la ubicación de los polos
simples y comprobamos que como |a| > |b| entonces

−a + √a2 − b2 −a − √a2 − b2

|z+0 | = i < 1 y |z−0 | = i > 1
b b
y por lo tanto, sólo el primero de los polos está encerado por el circuito C con |z| = 1 tal y como muestra
en el cuadrante III de la figura 8.8.
Una vez más calculamos el residuo para z+0 a partir de (8.20). Entonces tendremos que
2 2 1 −i
Res f (z)|z=z+0 = lı́m (z − z+0 ) = lı́m = ≡√
z→z+0 bz 2 + 2aiz − b z→z+0 2bz + 2ai bz+0 + ai a + b2
2
finalmente Z I
2π
dθ 2dz 2π
= = 2iπRes f (z)z=z+0 = √
0 a + bsen θ C bz 2 + 2aiz − b a2 − b2
Ejercicios Compruebe las siguientes evaluaciones

Z 2π Z 2π
dθ 2π 2 2 2 cos2 3θ dθ 3π
=√ con a > b + c ; =
0 a + b cos θ + csen θ a2 − b2 − c2 0 5 − 4 cos 2θ 8
Integrales de Fourier
Otro grupo de integrales que pueden ser evaluadas mediante el Teorema de Residuos son las integrales de
Fourier. Integrales que involucran funciones racionales, f(x), que satisfacen las condiciones expuestas arriba
en la Sección 8.10.3 y funciones senos y consenos. Integrales del tipo
Z ∞ Z ∞ I Xm
cos mx
dx f (x) ↔ dx f (x)eimx → dz f (z)eimz = 2iπ Res f (z)eimz z=z0j (8.25)
−∞ sen mx −∞ C j=1
Con m > 0 y los polos correspodientes a los residuos que se muestran en el lado derecho, están ubicados en
el semiplano complejo con y > 0. Es claro que el circuito seleccionado es Γ que muestra el cuadrante II de
la figura 8.8.
Equivalentemente, igualando partes reales e imaginarias
Z ∞ m
X Z ∞ m
X

dx f (x) cos mx = −2π Im Res f (z)eimz z=z0j y dx f (x)sen mx = 2π Re Res f (z)eimz z=z0j
−∞ j=1 −∞ j=1
Otra vez, el circuito C se separa en una semicircunferencia Γ y el eje real. para demostrar que para
evaluar las integrales de Fourier (8.25) se requiere la suma de los residuos nos convencemos que la integral a

lo largo de la semicircunferencia se anula. Esto es fácil si comprobamos que recordamos que y > 0 y m > 0,
entonces si z = x + iy tendremos que
|eimz | = |eimx ||e−my | = e−my < 1 ⇒ |f (z)eimz | = |f (z)| ≤ |f (z)| |eimz |
con lo cual redujimos al de una función racional tratado en la Sección 8.10.3.
Ejemplo: Comprobemos que

Z ∞ Z ∞
dx cos mx π dx sen mx
2 2
= e−km y =0
−∞ x + k k −∞ x2 + k 2
es fácil ver que el polo simple de la continuación analı́tica de f (x) es z0 = ik y su residuo será

eimz eimz eimz e−mk
f (z) = 2 2
⇒ z 0 = ik ⇒ Res 2 2 = =
z +k z + k z=ik 2z z=ik 2ik
y por lo tanto Z ∞
eimx e−mk π
dx = 2iπ = e−mk
−∞ x2+k 2 2ik k
Ejemplo: Evalue Z ∞
xsen πx
dx
−∞ x2 + 2x + 5
Partimos de la continuación analı́tica de
I
zeizπ zeizπ zeizπ
f (x) → f (z) = ⇒ z±0 = −1 ± 2i ⇒ dz = Res
2
z + 2z + 5 C
2
z + 2z + 5 z + 2z + 5 z=−1+2i
2
ya que ese es el único polo encerrado por la circulación Γ. Calculando el residuo tendremos

zeizπ zeizπ e−π(2+i)
Res 2 = lı́m (z + 1 − 2i) = (−1 + 2i)

z + 2z + 5 z=−1+2i z→−1+2i 2
z + 2z + 5 4i
con lo cual
I Z ∞ Z ∞
zeizπ x cos πx xsen πx e−π(2+i) π
dz 2 = dx 2 +i dx 2 = 2iπ(−1 + 2i) = (1 − 2i)e−2π
C z + 2z + 5 −∞ x + 2x + 5 −∞ x + 2x + 5 4i 2
igualando parte real e imaginaria tendremos que

Z ∞ Z ∞
x cos πx π xsen πx
dx 2 = e−2π y dx = −πe−2π
−∞ x + 2x + 5 2 −∞ x2 + 2x + 5
Ejercicios: Compruebe que

Z ∞ Z ∞
cos mx πe−m (1 + m) cos 2πx π √
Para m > 0 dx 2 2
= y dx = √ e−π/ 3
0 (x + 1) 4 0 x4 2
+x +1 2 3

Otras Integrales Impropias

Existen integrales definidas para las cuales el integrando se hace infinito para un determinado punto en
el rango de integración. Esto es, en general
Z b Z x0 −ζ Z b
lı́m |f (x)| → ∞ ⇒ dx f (x) = lı́m dx f (x) + lı́m dx f (x)
x→x0 a ζ→0 a ξ→0 x0 +ξ
donde ζ y ξ tienden a cero de forma independiene, es decir, ambos lı́mites se efectuan independientemente.
Ahora bien, puede darse el caso que uno o ambos lı́mites no existan pero si exista
Z Z ! Z
x0 −ǫ b b
lı́m dx f (x) + lı́m dx f (x) ⇔ V.P. dx f (x)
ǫ→0 a ξ→0 x0 +ǫ a
Diremos entonces que existe el Valor Principal de Cauchy para esa integral. La estrategia en estos casos
será diseñar un circuito tal que evite los polos de la extensiı́on analı́tica de la función. Normalmente se
establece este recorrido rodeando los polos con arcos de circunferencia cuyos radios luego tenderán a cero.
Veamos con un ejemplo esta estrategia de circunsnavegación.
Ejemplo: Consideremos que queremos evaluar la siguiente integral

Z ∞
sen x sen x
dx ↔ lı́m =1
0 x x→−0 x
Si bien el lı́mite está definido, cuando hacemos la extensión analı́tica13 f (x) = sen x/x → f (z) = eiz /z la
función compleja presenta un polo simple en z = 0, con lo cual la integral compleja presenta un polo en la
región de integración. Esto es
Z ∞ I Z −ǫ Z Z R Z
sen x eiz eix eiz eix eiz
dx → dz = dx + dz + dx + dz =0
0 x C z −R x C2 z ǫ x C1 z
donde hemos construido un circuito que rodea el polo z = 0 (cuadrante IV de la figura 8.8.). Es claro que
H iz
C
dz ez = 0 porque la región no contiene ningún polo.
R iz
Ahora mostraremos que C1 dz ez → 0, cuando R → ∞. Para ello, convertimos z = Reiθ ⇒ dz/z = idθ,
entonces
Z Z Z π Z π Z π

eiz π
iz iz iR cos θ −Rsen θ
dz = dθ ie ≤ dθ |e | = dθ |e | |e | = dθ e−Rsen θ
C1 z 0
0 0 | {z } 0
1
con lo cual
 
Z π Z π Z π/2 Z ζ Z π/2
I1 = dθ |eiz | = dθ e−Rsen θ = 2 dθ e−Rsen θ = 2  dθ e|−Rsen θ
{z } + dθ e|−Rsen
{z }
θ
0 0 0 0 ζ
I1 I2
para 0 ≤ ζ ≤ π/2. Es claro que e−Rsen θ es una función decreciente en θ y como estamos tratando de
demostrar que la integral a lo largo del circuito se anula I1 → 0, podremos considerar los máximos valores
13 Nótese que la extensión analı́tica ha sido f (x) = sen x/x → f (z) = eiz /z y no f (x) = sen x/x → f (z) = sen z/z La razón
de esta selección se fundamenta en el comportamiento patológico (oscilante) de la función seno en infinito

para I1 y I2 en el entorno de integración y fijarlos como constantes, al hacer esto tendremos lo máximos
valores que podrá tomar las integrales respectivas. Los máximos valores para I1 y I2 , son, 1 y e−Rζ . Entonces,
Z π Z ζ Z π/2 ! π
iz −Rsen ζ
I1 = dθ |e | ≤ 2 dθ + e dθ = 2 ζ + e−Rsen ζ −ζ < 2ζ + πe−Rsen ζ
0 0 ζ 2
Al considerar que ζ → 0 y R → ∞ comprobamos que I1 → 0.

R iz
Seguidamente nos toca demostrar que I2 = C2 dz ez → 0 cuando ǫ → 0. Para este caso z = ǫeiθ y como
siempre, dz/z = idθ, entonces la integral
Z Z π Z π
eiz iǫ exp(iθ)
I2 = dz = dθ ie ⇒ lı́m I2 = lı́m dθ ieiǫ exp(iθ) = iπ
C2 z 0 ǫ→0 ǫ→0 0
Esto implica que

I Z −ǫ Z R Z R
eiz eix eix eix − e−ix
C
dz
z
=
−R
dx
x
+ iπ +
ǫ
dx
x
=0 | ⇒
{z } ǫ
dx
x
+ iπ = 0
x→−x
con lo cual es claro que

Z R Z R Z ∞
eix − e−ix sen x sen x π
dx = −iπ ⇒ 2i dx = −iπ ⇒ dx =
ǫ x ǫ x 0 x 2
donde hemos hecho los lı́mites R → ∞ y ǫ → 0
Ejercicios: Comprobar las evaluaciones para las siguientes integrales
1. Z Z √
∞ ∞
2π
dx sen x2 = dx cos x2 =
0 0 4
2. Z √ Z √
∞ ∞
ln x π2 2 (ln x)2 3π 3 2
dx 4 =− ; dx 4 =
0 x +1 16 0 x +1 16
3. Z
∞
x−p π sen pα
dx =
0 x2 + 2x cos α + 1 sen pπ sen α
Agradecimientos
Quisiera agradecer a tantos estudiantes entusiastas quienes, nos han señalado montones de gazapos y
errores de transcripción. Ellos han tenido la paciencia de soportarlos. Gracias por esa paciencia.

Bibliografı́a
[Aleksandrov Kolmogorov y Lavrentiev 1999] A. D. Aleksandrov, A. N. Kolmogorov y M. A. Lavrentiev

(1999) Mathematics: Its Content, Methods and Meaning. (Dover Publications, New York ) Existe
traducción por Editorial Alianza Universidad.
[Arfken, Weber y Weber 2000] Arfken, G. B.,Weber, y H., Weber, H.J. (2000) Mathematical Methods
for Physicists 5ta Edición (Academic Press, Nueva York )
[Byron y Fuller 1970] Byron, F.W. y Fuller W.F. (1970) Mathematics of Classical and Quantum Phy-
sics (Dover Publications, New York )
[Chow 2000] T. L. Chow (2000) Mathematical Methods for Physicists: A Concise Introduction
(Cambridge University Press, Cambridge)
[Churchill y Brown1989] R. V. Churchill y J. W. Brown (1989) Complex Variables and Applications
(McGraw-Hill, New York ).
[Dennery y Krzywicki1995] P. Dennery y A. Krzywicki (1995) Mathematics for Physicists (Dover Pu-
blications, New York )
[Gonzalez 2003] A. González-López Variable Compleja Universidad Complutense de Madrid, Madrid
España. Disponible en http://www.ucm.es/info/metodos/pdf/Apuntes/vc-ag/vc-ag.pdf
[Harper 1971] Harper, C. (1971) Introduction to Mathematical Physics (Prentice Hall, Englewood Cliff,
N.J.)
[Knopp 1996] K. Knopp (1996) Theory of Functions, Parts I and II (Dover Publications, New York )
[math-atlas.orgURL] The Mathematical Atlas http://www.math-atlas.org/welcome.html
[Núñez 2005] L.A. Núñez (2005) Los Vectores de Siempre Formulario de Métodos Matematicos de la
Fı́sica 1. Universidad de Los Andes, Mérida Venezuela, Disponible en http://webdelprofesor.ula.
ve/ciencias/nunez/cursos.html
[Núñez 2006] L.A. Núñez (2006) Serie de Series Formulario de Métodos Matematicos de la Fı́sica 2. Uni-
versidad de Los Andes, Mérida Venezuela, Disponible en http://webdelprofesor.ula.ve/ciencias/
nunez/cursos.html
[Riley, Hobson y Bence 2002] Riley, K.F., Hobson, M.P. y Bence, S.J. (2002) Mathematical Methods for
Physics and Engineering (Cambridge University Press, London)
[Spiegel 1959] Spiegel, M. (1967) Variable Compleja (Schaum‘s Outline Series, McGraw Hill New York )
341
[WeissteinURL] Weisstein, E. W., MathWorld http://mathworld.wolfram.com/
[Wyld 1999] H. W. Wyld (1999) Mathematical Methods for Physics (Westview Press, Boulder Co.)

Capı́tulo 9
Ecuaciones Diferenciales Ordinarias

de Primer Orden
343
9.1. Motivación y Origen

En Ciencias, una de las formas de modelar fenómenos fı́sicos es mediante su caracterización a través de
una función matemática, digamos G = G (x, y, z; t). Desde los albores de la actividad cientı́fica contemporánea
es imperioso describir los fenómenos fı́sicos en el lenguaje de las matemáticas. Una las formas (la ideal) para
modelar los cambios de esta función, G (x, y, z; t) , que depende de la posición y del tiempo, es a través
de una ecuación en la cual están involucradas la función, G (x, y, z; t) y sus derivadas. A esa ecuación la
llamaremos Ecuación Diferencial. Existe toda una “fauna” de ecuaciones diferenciales y hoy disponemos de
un importante arsenal de técnicas, métodos y herramientas para encontrar la función G (x, y, z; t) , la cual
será nuestra función incógnita. Este curso trata, parcialmente, de mostrar parte de esta fauna y de indicarles
métodos para resolver un tipo particular de ecuaciones diferenciales: las Ecuaciones Diferenciales Ordinarias.
Empecemos por recordar que desde siempre hemos tratado, la mayor de las veces sin saberlo o sin
explicitarlo, con este tipo de ecuaciones en donde la incógnita no es un número sino un conjunto de números:
una función.
El caso más emblemático lo constituye el conjunto de “fórmulas” que aprendimos en nuestra más tierna
infancia intelectual cuando estudiábamos bachillerato o, más recientemente, en los primeros cursos de Fı́sica
General de la Universidad. En aquellos entonces describı́amos el movimiento de partı́culas en una dimensión,
a través de dos ecuaciones:
t2
Vf = V0 + at y d = V0 t + a (9.1)
2
de memoria repetı́amos que Vf representaba la velocidad final, V0 la velocidad inicial, a la aceleración, t
el tiempo transcurrido y d la distancia recorrida en ese tiempo. El problema consistı́a en encontrar, para
un sinfı́n de situaciones fı́sicas, primeramente el valor de la aceleración del móvil y a partir de las Leyes de
Newton, luego conociendo la velocidad y la posición inicial, encontrábamos la posición, d, y la velocidad, Vf
en todo instante de tiempo. Ası́, mediante diagramas de cuerpo libre y la utilización de las leyes de Newton,
encontrábamos el valor de la aceleración y las “formulitas” (9.1) resolvı́amos el problema.

P  V = V0 + at
X Fext  f
Fext = m a ⇒a= ⇒ 2 (9.2)
m 
 d = V t + at
0
2
Lo más probable
P es que nuestros profesores nos repitieran hasta el cansancio que la sumatoria de fuerzas
externas Fext era constante, y lo más seguro que nosotros en aquellos momentos no comprendiéramos
la trascendencia de esa suposición. El caso más representativo era el del movimiento de un cuerpo bajo la
acción de un campo gravitatorio, más aún: caı́da libre.

 V = V0 − gt
 f
− mg = m a ⇒ a = −g ⇒ 2 (9.3)

 d = V t − gt
0
2
Lo que está detrás de este “cuento” que nos inició en el estudio de la Fı́sica y a muchos de nosotros nos sedujo
para seguir estudiando y aprendiendo a tratar de describir la naturaleza, es, efectivamente, la utilización de
las Leyes de Newton para modelar el fenómeno del movimiento. De este modo


 dx(t)

 V (t) = = V0 + at
X 2
d x(t) dV (t) dt
Fext = m a = m =m ⇒ (9.4)
dt2 dt 
 t2

 x(t) = V0 t + a
2

Sı́ la sumatoria de fuerzas externas es una contante tendremos que

 R
P  V (t) = dt a = t a + C2
dV (t) Fext 
=a= = constante ⇒ (9.5)
 x(t) = R dt (t a + C ) = t a + C t + C
 2
dt m
2 2 1
2
Claramente al identificar
C2 = V (t = 0) = V0 y C1 = x(t = 0) = x0 = 0 (9.6)
reobtenemos nuestras “formulitas” ancestrales. Es importante señalar que
dV (t) dx(t)
=a y = t a + C2 (9.7)
dt dt
constituyen ecuaciones diferenciales donde las funciones incógnitas son la velocidad, V (t), y la posición, x(t),
respectivamente. Ambas funciones se encontraban dentro de un signo de derivada y fueron “despejadas”
mediante un proceso de integración.
La descripción del movimiento de partı́culas es más rica y compleja. El movimiento de una gran cantidad
de partı́culas puede ser simulado a través de una ecuación diferencial del tipo
X ~ (t)
~ ~ d~r(t) d2~r(t) dV
Fext ~r (t) , V (t) = ; t = m ~a = m 2
=m (9.8)
dt dt dt
El carácter vectorial implica tres ecuaciones diferenciales, una por cada dimensión del movimiento, vale decir:



P x d~r(t) d2 x(t) dVx (t)

 F ext ~r (t) , ; t = m ax = m 2
=m

 dt dt dt




X d~r(t)  P d~r(t) d2 y(t) dVy (t)
F~ext ~r (t) , ; t = m ~a ⇒ y
Fext ~r (t) , ; t = m ay = m =m
dt 
 dt dt 2 dt





 P

 z d~r(t) d2 z(t) dVz (t)
 Fext ~r (t) , ; t = m az = m =m
dt dt2 dt
Además del carácter vectorial de la ecuación, las componentes de la fuerza pueden dejar de ser constantes y
depender de no sólo del tiempo, sino del vector posición, del vector velocidad o, de ambas simultáneamente. En
este caso nuestras “formulitas” dejan de ser válidas en general y debemos integrar las ecuaciones diferenciales
para obtener la trayectoria de la partı́cula ~r (t), conocidas: la masa, m, la expresión de la sumatoria de
P
fuerzas externas F~ext , la posición y la velocidad inicial (~r (t0 ) = ~r0 y V
~ (t0 ) = V~0 ). Este problema se conoce
como el problema de condiciones iniciales y es, como hemos dicho antes, la razón de este curso. Antes,
intentaré mostrar como ese conocimiento del movimiento bajo acción de una resultante de fuerzas constante,
es decir el movimiento de una partı́cula con aceleración constante puede resultar muy útil para resolver,
de
P d~
r (t)
forma aproximada, el caso más general que hemos mencionado: F~total = F~ext ~r (t) , ; t . Veamos
dt
con detenimiento que significan estas afirmaciones.
Es claro el tiempo de evolución esta comprendido entre el tiempo inicial y el tiempo final, t0 ≤ t ≤ tf inal .
Supongamos que dividimos ese intervalo de tiempo en N subintervalos
[t0 , tf inal ] = [t0 , t1 ] ∪ [t1 , t2 ] ∪ [t2 , t3 ] ∪ · · · ∪ [ti , ti+1 ] ∪ · · · ∪ [tN −2 , tN −1 ] ∪ [tN −1 , tN = tf inal ] (9.9)

Figura 9.1: Diagrama de Cuerpo Libre de una esfera de corcho que emerge desde el fondo de un tanque de
agua.
de tal modo que en cada uno de esos N subintervalos la aceleración es constante. En estas situación, nuestras

“formulitas” son válidas. Esto es

  P
[t0 , t1 ] 
  Fext (d0 , V0 ; t0 )

 
 V (t 1 ) = V 1 = V 0 + [t1 − t0 ]
⇓   m
V (t0 ) = V0 ⇒ P (9.10)

 
 2

 
 Fext (d0 , V0 ; t0 ) [t1 − t0 ]
 d (t1 ) = d1 = V0 [t1 − t0 ] +
d (t0 ) = d0 m 2
  P
[t1 , t2 ] 
  Fext (d1 , V1 ; t1 )
  [t2 − t1 ]
⇓ 
  V2 = V1 +
 m
V (t1 ) = V1 ⇒ P (9.11)

 
 2

 
 d2 = d1 + V1 [t2 − t1 ] + Fext (d1 , V1 ; t1 ) [t2 − t1 ]

d (t1 ) = d1 m 2
..
.
  P
[ti , ti+1 ] 
  Fext (di , Vi ; ti )
  [ti+1 − ti ]
⇓ 
  Vi+1 = Vi +
 m
V (ti ) = Vi ⇒ P (9.12)

 
 2

 
 Fext (di , Vi ; ti ) [ti+1 − ti ]
 di+1 = di + Vi [ti+1 − ti ] +
d (ti ) = di m 2
..
.
  P
[tN −1 , tN ] 
  Fext (dN −1 , VN −1 ; tN −1 )

 
 V = V + [tN − tN −1 ]
⇓   N N −1
m
V (tN −1 ) = VN −1 ⇒ P

 
 2

 
 Fext (dN −1 , VN −1 ; tN −1 ) [tN − tN −1 ]
 dN = dN −1 + VN −1 [tN − tN −1 ] +
d (tN −1 ) = dN −1 m 2
(9.13)
Nótese que las posiciones y velocidades finales para cada intervalo, son las posiciones y velocidades iniciales
para el intervalo siguiente y que el valor de la aceleración, que es variable, se toma como constante e igual
al valor que tiene en el comienzo del intervalo.
Para analizar este caso consideremos el caso de una esfera de corcho, con Radio R y masa M que se
suelta desde el fondo de un tanque de agua de profundidad h. Queremos conocer con que velocidad llega la
esfera a la superficie.
El diagrama de cuerpo libre se puede observar en la figura 9.1 y la ecuación de Newton para este caso se
expresa como
X d~r(t) dV (t)
~
Fext ~r (t) , ; t = ma ⇒ −mg − KηV (t) + mf g = m (9.14)
dt dt
En la cual hemos identificado
peso ⇒ −mg
Fricción ⇒ −KηV (t) (9.15)
Empuje ⇒ mf g

Como aprendimos también hace algún tiempo el empuje o fuerza de Arquı́mides es igual al peso del fluido
desalojado por el cuerpo. Por ello aparece mf que representa la masa del fluido. Para el caso en el cual el
fluido no es viscoso, es decir, no hay fricción con el fluido, la ecuación se reduce a
X
d~r(t)
F~ext ~r (t) , ; t = ma ⇒ −mg + mf g = ma (9.16)
dt
en la cual claramente la aceleración es constante e igual a

m
f ρf
a=g −1 ≡g − 1 = cte (9.17)
m ρc
donde hemos indentificado ρf la densidad del fluido y ρc la densidad del cuerpo.

Para encontrar la velocidad con la cual llega a la superficie, encontramos primero el tiempo que tarda en
subir y luego evaluamos la velocidad en ese tiempo. Esto es
2 s
ρf t hρc
h=g −1 ⇒t=2 (9.18)
ρc 2 2g (ρf − ρc )
(9.19)
s
ρf hρc
Vf inal = g −1 2 (9.20)
ρc 2g (ρf − ρc )
En el caso general, descrito por la ecuación (9.14), procedemos del mismo modo: encontramos el tiempo
en el cual llega la superficie y luego evaluamos la expresión para la velocidad para ese tiempo. Fı́jense
que la estrategia para resolver el problema fı́sico es la misma, sólo que tendremos que disponer de un
arsenal adicional de herramientas y técnicas para “despejar” la función velocidad. Aprenderemos a resolver
ecuaciones diferenciales de la misma manera que antes resolvı́amos ecuaciones algebraicas. En este caso la
solución exacta para la expresión de la velocidad es
 
tKη
dV (t) g (m − mf )  −
− mg − KηV (t) + mf g = m ⇒ V (t) = e m − 1 (9.21)
dt Kη
Con lo cual  
tKη
dy(t) g (m − mf )  −
= V (t) = e m − 1 (9.22)
dt Kη
y la función posición surge de integrar la ecuación diferencial

 
tKη
g(m − mf )  −
Y (t) = − me m + tKη − m (9.23)
K 2 η2
desafortunadamente la no se puede despejar el tiempo de manera exacta por cuanto la ecuación

 
Kη t
gm (m − mf )  − Kη t 
e m −1+ =h (9.24)
K 2 η2 m

es una ecuación trascendente y debe ser resuelta numéricamente. Haciendo algunas sustituciones simplifica-
doras
4 4
mf = π ξ ρ R3 ; m = π φ ρ R3 ρf = ξρ ρc = φρ y K = 6 π R (9.25)
3 3
Donde ξ y φ representan las densidades relativas del fluido y del cuerpo respecto al agua (de densidad ρ ),
respectivamente. Seguidamente sustituimos los valores numéricos
g = 9,8; R = 0,02; ρ = 103 ; ξ = 1; φ = 0,8; V0 = 0; η = 1,002 × 10−3 (9.26)
la ecuación (9.24) nos queda para h = 10, mts
10 = 12339,72755 (1 − exp(−0,01409062500t)) − 173,8744736t (9.27)
y se obtiene tf inal = 2,876443096 sg. con el cual se evalúa la ecuación para la velocidad
V (t) = 173,8744730 (1 − exp(−0,01409062500t)) ⇒ Vf inal = 6,9063798 m/s (9.28)
En la siguiente tabla se implementan las ecuaciones (9.10) a (9.13) habida cuenta de las simplificaciones
(9.25) y los valores numéricos (9.26) para h = 1/10 ∼ [ti+1 − ti ]
ti (s) Vi (m/s) di (m) V (t) (m/s) d (t) (m)

0.100 0.2449999997 0.01224999998 0.2448275 0.01225
0.200 0.4896547791 0.04898273892 0.4893102 0.04895
0.300 0.7339648246 0.11016371910 0.7334487 0.11009
0.400 0.9779306220 0.19575849150 0.9772434 0.19563
0.500 1.221552656 0.30573265540 1.2206949 0.30553
0.600 1.464831412 0.44005185880 1.4638035 0.43976
0.700 1.707767373 0.59868179800 1.7065698 0.59828
0.800 1.950361022 0.7815882177 1.9489943 0.78106
0.900 2.192612841 0.9887369109 2.1910775 0.98807
1.000 2.434523312 1.220093719 2.4328198 1.21926
1.100 2.676092916 1.475624530 2.6742217 1.47462
1.200 2.917322134 1.755295283 2.9152836 1.75410
1.300 3.158211444 2.059071962 3.1560062 2.05767
1.400 3.398761326 2.386920600 3.3963898 2.38529
Vi y di representan la velocidad y la posición aproximada, tal y como se expresan en las ecuaciones (9.10)
a (9.13). Mientras que V (t) y d (t) ilustran los valores de la velocidad y la posición exactas, calculadas a
partir de las ecuaciones (9.22) y (9.23). Es clara que la aproximación es buena hasta la primera cifra decimal.
9.2. Empezando por el principio

9.2.1. Ejemplos de Algunas ecuaciones diferenciales
Thomas Robert Malthus1 fue uno de los primeros en darse cuenta queÑ la población crece como una razón
geométrica mientras que los medios de subsistencias crecen de manera aritmética. Esta afirmación plasmada
en su Ensayo sobre el Principio de Poblaciones, el cual inspiró a Darwin en la formulación de principio
de selección natural. Malthus, muy religioso y creyente pensaba que esa diferencia en el crecimiento de la
1 En honor al economista polı́tico inglés Thomas Robert Malthus (1766-1834).

población y las necesidades que ellas generaban, erán de procedencia divina y que forzarı́a a la humanidad a
ser más laboriosa e ingeniosa para lograr los medios de subsistencia. Darwin, no tan religioso, lo formuló como
una situación natural presente en todas las especies.
d
Ley de Malthus/Decaimiento Radioactivo y(x) = k y(x) ← y(t) = y0 ek t con y(0) = y0 (9.29)
dx
Para k > 0 la población crece y para k < 0 tenemos una situación de decaimiento: la población decrece con
el tiempo. Este concepto se utiliza los procesos de decaimiento radiactivo.
La ecuación logı́stica o Ley de Verhulst2 se utiliza para describir el crecimiento de la población de una
manera más precisa que la Ley de Malthus. Esta ecuación toma en cuenta le decrecimiento de la población
con el término −y 2
k y0
y ′ = (k − ay) y = ky − ay 2 ← y(t) =
a y0 + (k − a y0 ) e−k t
La Ley de Enfriamiento de Newton que expresa que la tasa de cambio de la temperatura respecto al
tiempo es proporcional a la diferencia de temperatura entre el cuerpo y el medio ambiente.
dT
= k(T − Tm ) ← T = (T0 − Tm ) ek t + T m con T (0) = T0
dt
La Ley de Torricelli la cual establece que (para un tanque cilı́ndrico) la tasa de cambio respecto al tiempo
del la profundidad del agua en un tanque es proporcional a su raı́z cuadrada

dy k√ 1 2
= y ← y(t) = t + y(0)
dt A 2
9.2.2. De Ecuaciones y Ecuaciones Diferenciales

Al igual que desde nuestra más tierna infancia consideramos una ecuación algebráica como aquella que
se cumplı́a para ciertos valores de x = x0 , llamaremos ahora una ecuación diferencial aquella que se cumple
para ciertas funciones i.e.
df (x)
x2 − 4x + 4 = 0 ⇐ x0 = 2 ↔ − f (x) = 0 ⇐ f (x) = ex
dx
Es decir si f (x) es una función contı́nua en un intervalo a ≤ x ≤ b, llamaremos una ecuación diferencial
ordinaria a una expresión que involucre x, f (x) y derivadas de f (x). Utilizaremos para tal efectos varias
notaciones, equivalentes que se justifican por la larga tradición en esto
d2 f (x) df (x)
2
+g(x) −af 2 (x) = k(x) ↔ f ′′ (x)+g(x)f ′ (x)−af 2 (x) = k(x) ↔ fxx (x)+g(x)fx (x)−af 2 (x) = k(x)
dx dx
Se llaman ordinarias porque involucran funciones de una sola variable y derivadas respecto a ella. Otras
ecuaciones diferenciales del tipo
∂ 2 φ(x, y) ∂φ(x, y)
+ g(x) − aφ2 (x.y) = p(y) ↔ φxy (x) + g(x)φxy (x) − aφ2 (xy) = p(y)
∂x∂y ∂x
Las llamaremos ecuaciones diferenciales en derivadas parciales o, simplemente ecuaciones diferenciales par-
ciales, porque contienen funciones (y derivadas) de varias variables.
2 Pierre François Verhulst 1804 - 1849 Matemático Belga con sus más importantes comtribuciones en estadı́stica de-
mográfica

9.2.3. Fauna y Nomenclatura de Ecuaciones Diferenciales Ordinarias

Orden y linealidad
Una ecuación diferencial F[x, y(x), y ′ (x), y ′′ (x), y ′′ (x), · · · , y (n) (x)] = 0 será lineal si sólo parecen funcio-
nes lineales de y(x) y sus derivadas.
df (x) d2 f (x) df (x)

+ f (x) − af 2 (x) = k(x) no lineal o alineal
dx dx2 dx
f ′′ (x) + g(x)f ′ (x) − af (x) = k(x) lineal
El orden de la derivada mayor define el orden de la ecuación diferencial del tipo
F[x, y(x), y ′ (x), y ′′ (x), y ′′ (x), · · · , y (n) (x)] = 0
⇓
dn f (x) d2 f (x) df (x) Pn dk f (x)
an (x) n
· · · + a2 (x) 2
+ a1 (x) + a0 (x)f (x) = g(x) ↔ k=0 ak (x) = g(x)
dx dx dx dxk
será de orden n
Una ecuación diferencial F (x, y(x), y ′ (x), y ′′ (x), y ′′ (x), · · · , y (n) (x), ) = 0 será homogénea (inhomogénea)
si NO contiene términos independientes en f (x)
d2 f (x) df (x)
+ g(x) − af (x) = k(x) lineal inhomogénea
dx2 dx
f ′′ (x) + g(x)f ′ (x) − af (x) = 0 lineal homogénea
Soluciones Explı́citas e Implı́citas

Hay de todo en la viña de las soluciones. Las soluciones heredan su nombre del tipo de función que las
representa, ası́ tendremos soluciónes explı́citas cuando las funciones sean soluciones y sean explı́citas. Esto
es
d2 y(t)
= y(t) + 4 et ← y(t) = et C2 + e−t C1 + 2 tet
dt2
y también
π
y ′ = (x + y)2 ← y(t) = tan(t − C1 ) − t con t − C1 6=
2
Las soluciones serán implı́citas si son representadas por funciones de esa estirpe
√
y= 25 − x2
√
y y ′ + x = 0 ← f (x, y) = x2 + y(x)2 − 25 = 0 ⇒ con − 5 < x < 5
y = − 25 − x2
Se tiene que seleccionar una rama de la función raı́z. Igualmente será solución implı́cita
(y 2 (x) − x) y ′ (x) − y(x) + x2 = 0 ← f (x, y) = x3 + y 3 (x) − 3xy(x) = 0
y esta segunda no es tan fácil de descubrir como solución. Para comprobarla derivamos la solución

d(f (x, y)) d x3 + y 3 (x) − 3xy(x) dy(x) dy(x)
= = 0 ⇒ 3x2 + 3y 2 (x) − 3y(x) − 3x =0
dx dx dx dx

Figura 9.2: Gráfica de la función implı́cita f (x, y) = x3 + y 3 (x) − 3xy(x) = 0
simplificando y agrupando tendremos la solución. Otra vez, la función la función no es univaluada. Al

graficarla (ver Figura 9.2) nos damos cuenta que tenemos tres varias soluciones de funciones univaluadas
2
unas contı́nuas y otras no. La función es univaluada fuera del lóbulo. Esto es para x ≤ 0 ∧ x > 2 3 . Con lo
cual tendremos que seleccionar, dentro del lóbulo, cuál de las partes univaluada corresponde la solución.
Soluciones Generales y Particulares

Veamos las siguientes ecuaciones y soluciones
y ′ = ex ← y(x) = ex + C1
y ′′ = ex ← y(x) = ex + C2 x + C1
y ′′′ = ex ← y(x) = ex + C3 x2 + C2 x + C1
Cada una de las soluciones representan familias de soluciones, una para cada constante. Este tipo de soluciones
las denominaremos soluciones generales. Es decir, llamaremos solución general de una ecuación diferencial
aquella que queda indeterminada por un conjunto de constantes {C1 + C2 + C3 + · · · Cn }. En contraste,
cuando particularizamos los valores de las constantes C3 , C2 , C1 tendremos una solución particular par cada
una de las ecuaciones. Adicionalmente, cuando nos referimos las ecuaciones no lineales el concepto de solución
particular varı́a. Soluciones particulares en este tipo de ecuaciones serán aquellas que se cumplen para rangos
(o puntos) muy particulares. Vale decir

(y ′ )2 + y 2 = 0
← y = 0 única solución
(y ′′ )2 + y 2 = 0
Tamibién en este caso llamaremos a este tipo de soluciones, particulares. De igual modo puede darse casos
para los cuales no exista solución en un determinado intervalo.

|y ′ |2 + 1 = 0
no tienen solución
|y ′′ |2 + 1 = 0

Ecuaciones de la forma

 y(x) = ln(x) + C1 para x > 0
xy ′ = 1 para − 1 < x < 0 ∧ 0 < x < 1 ⇒ y(x) = ln |x| + C ⇒

y(x) = ln(−x) + C1 para x < 0
Tienen soluciones particulares para intervalos de la variables x. Del mismo modo

(y ′ − y)(y ′ − 2y) = 0 ⇒ (y(x) − C1 ex ) y(x) − C2 e2x = 0
tendrá dos soluciones particulares.
Familia de soluciones n−paramétricas

Si y(x) = f (x, C1 , C2 , · · · Cn ) es solución de una ecuación diferencial
F[x, y(x), y ′ (x), y ′′ (x), · · · , y (n) (x)] = 0 ⇒ y(x) = f (x, C1 , C2 , · · · Cn )
para n constantes {C1 , C2 , C3 , · · · Cn } arbitrarias. Entonces diremos que
y(x) = f (x, C1 , C2 , · · · Cn ) es una familia n paramétrica de soluciones
Existe una diferencia entre una solución general de una ecuación y una solución n−paramétrica. La solu-
ción general tiene que contener todas las soluciones una ecuación diferencial determinada. Una solución
n−paramétrica no necesariamente. Veamos

 y(x) = Cx + C 2

y = xy ′ + (y ′ )2 ⇒ 2

 y(x) = −x
4
Uno llega a estar tentado de llamar solución general a la solución 1−paramétrica y(x) = Cx + C 2 . Sin
embargo, deja por fuera otra solución que no tiene que ver con un valor particular de las constantes C.
Otro ejemplo, lo constituye
3 C2 1
y ′ = −2y 2 ⇒ y(x) = 2 ∀ x. Pero también y(x) = 2 es solución, pero y(x) 6= 0
(Cx + 1) x + C̃
Una solución n−paramétrica se denominará solución general si contiene todas las soluciones de una de-
terminada ecuación diferencial.En el caso de ecuaciones diferenciales lineales, las soluciones n−paramétricas
contituyen las soliciones generales a las ecuaciones diferenciales.
Solución particular, valores iniciales vs valores de contorno

Dependiendo de la situación fı́sica que estemos modelando quizá podamos determinar las constantes
arbitrarias de una familia n−paramétrica con información para un único punto x = x0 . Esto es
F[x, y(x), y ′ (x), y ′′ (x), · · · , y (n) (x)] = 0 ⇒ y(x) = f (x, C1 , C2 , · · · Cn )
⇓
z }| {
y(x0 ) ⇒ C1 = c1 y (x0 ) ⇒ C2 = c2 · · · y n−1 (x0 ) ⇒ Cn = cn
′
| {z }
⇓
y(x) = f (x, c1 , c2 , · · · cn )

En este caso diremos que tendremos problema de valores iniciales, ya que determinamos las constantes
arbitrarias a partir de la información de la función y sus derivadas en un solo punto. Si consideramos

y(0) = 0 1
y ′′ + ω 2 y = 0 con ⇒ y(x) = sen ωx
y ′ (0) = 1 ω
Si por el contrario, para determinar el valor de las constantes arbitrarias disponemos de información de
la función y sus derivadas en dos o más puntos, diremos que tendremos un problema de contorno. Esto es
y ′′ + ω 2 y = 0 con y(0) = y(1) = 0 ⇒ y(x) = sen nπωx
Nótese que también pudimos haber tenido información del tipo y(0) = y0 , y ′ (1) = y1′ ; y ′ (0) = y0′ , y ′ (1) = y1′
o y ′ (0) = y0 , y(1) = y1′ y para cada uno de estos caso tendremos una solución distinta.
Demostraremos que los problemas de valores iniciales para ecuaciones diferenciales lineales siempre tienen
solución particular (siempre se pueden determinar las constantes a partir de la información de la función y
las derivadas en UN punto). No ası́ los problemas de valores de contorno.
9.2.4. Métodos elementales de integración

Para comenzar expondremos unos métodos de integración, los cuales si bien son elementales y casi triviales
para este caso, serán utilizados en lo que sigue, con bastante frecuencia.
Integración directa
La integración directa tiene varias variantes las cuales nos hemos tropezado en varias situaciones de
modelaje y que nos han permitido integrar (intuitivamente) ecuaciónes diferenciales. La más directa de
todas ha sido Z Z Z
dy(x)
= f (x) ⇒ dy(x) = dx f (x) ⇒ y(x) = dx f (x) + C
dx
por lo cual, al integrar (analı́tica o numéricamente) tendremos la expresión para la función y(x).
La integración directa fue la estrategia que utilizamos arriba para encontrar las formulitas que nos
aprendimos en bachillerato. Esto es
 R
P  V (t) = dt a = t a + C2
Fext dV (t) 
= = a = constante ⇒
 x(t) = R dt (t a + C ) = t a + C t + C
 2
m dt
2 2 1
2
en la cual al recordar las condiciones iniciales
V (0) = V0 ≡ C2 ⇒ V (t) = V0 + at
t2
x(0) = x0 ≡ C1 ⇒ x(t) = x0 + V0 t + a
2
La primera variante en la estrategia de integración directa es
Z Z
dy(x) dy
= f (y) ⇒ = dx ⇒ F[y(x)] = x + C
dx f (y)

1
Figura 9.3: Familia de soluciones 1−paramétrica para a = 3. En particular han sido tomados los valores
C = −3, −2, −1, 0, 1, 2, 3
donde F[y(x)] será un funcional, desde el cual quizá se pueda despejar y(x). Esta estrategia se ilustra más
o menos ası́
Z Z
dy(x) dy
= −ay (x) con y(0) = 2 entonces ⇒ = −a dx ⇒ yg (x) = Ce−ax ⇒ yp (x) = 2e−ax
dx y
la Figura 9.3 muestra varias soluciones particulares pertenecientes a esta familia, para a = 13 .
Otro ejemplo de integración directa surge de
Z Z
′ 2 yy ′ ydy 1
yy = (y + 1) ⇒ =1⇒ = dx para y 6= −1 ⇒ + ln |y + 1| = x + C
(y + 1)2 (y + 1)2 y+1
que no es otra cosa que una familia de soluciones implı́citas, uniparamétrica. Para una condición inicial
y(2) = 0 entonces
1
y(2) = 0 ⇒ C = −1 ⇒ + ln |y + 1| = x − 1 para y 6= −1
y+1
una vez más esta familia de solucines 1−paramétrica no constituye la solución general de es ecuación diferen-
cial ya que no contiene todas las solucines. En este caso y(x) = −1 también es solución y no está contenida.
Mi primera ecuación separable

Los casos anteriores de integración directa son generalizados por una ecuación que llamaremos separable.
Esto es la función (funcional) de dos variables del lado derecho se supone que es el resultado del producto
de dos funciones de una variable, con lo cual las variables dependientes e independientes se agrupan a lados

distintos de la igualdad.
Z Z
dy(x) dy(x) dy dy
= H[y(x), x] ⇐ = Y (y(x))X(x) ⇒ = X(x) dx ⇔ = X(x) dx
dx dx Y (y) Y (y)
Figura 9.4: Mapa de las Ecuaciones diferenciales explı́citas
Este es el caso con

Z Z
dy(x) dy x2 x2
= x + xy ⇒ = x dx ⇒ ln(1 + y) = +C ⇒ y(x) = Ae 2
dx 1+y 2
con C y A constantes arbitrarias a ser determinadas por las condiciones iniciales.
Mi primera ecuación diferencial exacta y el factor integrador

La mayor de las veces tendremos que idearnos un factor, µ(x), con el cual multipliquemos la ecuación di-
ferencial y la convirtamos en una ecuación diferencial exacta. Lo mostraremos con un ejemplo. Consideremos
la ecuación diferencial

dy(x) −x dy(x) −x dy(x) ? d[µ(x)y(x)]
= e − ay(x) con y(0) = 2 entonces + ay(x) = e ⇒ µ(x) + ay(x) ≡
dx dx dx dx
y, efectivamente, para este caso
Z Z
dy(x) d(eax y(x))
µ(x) = eax ⇒ eax + ay(x)eax = e−x eax ⇒ = eax e−x ⇒ d(eax y(x)) = dx e(a−1)x
dx dx
de forma y manera que
1 (a−1)x 1 2a − 3 1
eax y(x) = e + C ⇒ y(0) = 2 ⇒ C = 2 − = ⇒ yp (x) = e−x + (2a − 3)e−ax
a−1 a−1 a−1 a−1
Un par comentarios son pertinentes:

Llamaremos al término µ(x) factor integrador de la ecuación diferencial. Está relacionado con propie-
dades de simetrı́a de la ecuación, pero en este nivel lo buscaremos tanteando.
La solución general de esa ecuación diferencial toma la forma de yg (x) = (e−x + Ce−ax ) donde el
segundo de los términos yg h (x) = Ce−ax corresponde a la solución general para la ecuación homogénea
asociada a esa ecuación diferencial: dy(x)
dx + ay(x) = 0. El otro término yinh (x) = e
−x
corresponde
dy(x) −x
a la solución particular de la inhomogénea: dx + ay(x) = e . Esta será una propiedad general
para ecuaciones diferenciales lineales de cualquier orden. Resolveremos la ecuación homogénea y luego
encontraremos la solución de la inhomogénea. La solución general será una suma de ambas soluciones
Figura 9.5: Isoclinas para cuatro ecuaciones diferenciales. Cuadrante I muestra la ecuación dy(x) dx = e
−x
−
1
3 y(x) y se muestran las soluciones particulares para las condiciones iniciales y(0) = 0,75, y(0) = 0,50, y(0) =
0, y(0) = −0,50, y(0) = −0,75. El Cuadrante II corresponde a las tangentes generadas a partir de la ecuación
dy(x) y(x)
dx = x . Nótese son curvas integrales radiales que para el punto x = 0 no está definida la curva integral.
En el Cuadrante III represente las tangentes de la ecuación dy(x) dx
x
= − y(x) . Finalmente el Cuadrante IV
contiene las tangentes a la ecuación dy(x)
dx = 1 + x y(x) en ella se han indicado las curvas integrales para
las soluciones particulares correspondientes a las condiciones iniciales y(0) = 0,75, y(0) = 0,50, y(0) =
0, y(0) = −0,50, y(0) = −0,75.
En general
Z x
y ′ + ay = g(x) ⇒ µ(x) = eax ⇒ yg (x) = e−ax dt g(t)eat + Ce −ax
| {z }
x0
| {z } solución de la homogénea
solución de la inhomogénea
la demostración la dejamos como ejercicio para el lector.

Para finalizar la figura 9.4 muestra el mapa de ruta para la resolución de las ecuaciones diferenciales
ordinarias, lineales.

Método de las Isoclinas

Este método se basa en la idea de campo y curvas integrales que vimos cuando estudiamos campos
vectoriales. La idea es bien simple. En general una ecuación diferencial de primer orden (explı́cita respecto a
la derivada) se podrá representar como y ′ = f (y, x). Ahora bien, el lado derecho de esa igualdad lo representa
una función de dos variables, la cual tendrá un valor en cada punto (x, y). Ese valor (por la igualdad que
representa la ecuación diferencial) será el valor de la derivada en ese punto y el valor de la derivada en un
punto, no es otra cosa que la pendiente de la recta tangente a ese punto. Con eso, al construir una gráfica
recordamos las curvas integrales de los campos vectoriales y reconstruimos las curvas solución a partir de sus
tangentes. La Figura 9.5 contiene cuatro ejemplos de estas construcciones. Ası́ tendremos la representación
gráfica para las tangentes de las siguientes ecuaciones diferenciales.
dy(x) 1 dy(x) y(x)

= e−x − y(x) Cuadrante I = Cuadrante II
dx 3 dx x
y también
dy(x) x dy(x)
=− Cuadrante III = 1 + x y(x) Cuadrante IV
dx y(x) dx
Es importante señalar que este método permite obtener las posibles soluciones de una ecuación diferencial
no importa lo complicada que sea.
Puntos Ordinarios y Singulares

Llamaremos un punto ordinario de orden n a un punto xo en el cual la función y sus n−derivadas están
definidas, esto es y(xo ), y ′ (xo ), y ′′ (xo ), · · · , y (n) (xo ). En contraste a un punto ordinario llamaremos punto
extraordinario o singular a un punto xs tal que la función o sus derivadas no se encuentran definidas en éste.
Para ecuaciones diferenciales ordinarias de primer orden, los puntos ordinarios y singulares tienen que ver
con la función y su primera derivada. Nótese que en el cuadrante I y IV de la Figura 9.5 todos los puntos
son ordinarios de orden infinito. En el cuadrante II la función no está definida para xs = 0 con lo cual es un
punto singular, y en el cuadrante III, la función está definida para xs = 0 pero no ası́ su derivada.
9.3. Ecuación Diferenciales de Primer Orden

Ahora de manera un poco más sistemática diremos que una ecuación diferencial de primer orden será un
funcional tal que si es explı́cita respecto a la derivada se podrá despejarla

 dy(x) dy(x)
 = H[y(x), x] ⇔ y ′ ≡ = H(x, y)
′
F[x, y(x), y (x)] = 0 ⇒ dx dx


Q(x, y)dy + P (x, y)dx = 0
9.3.1. Ecuaciones Diferenciales separables

La primera estrategia será la que consideramos arriba en el sentido que la ecuación diferencial sea separa-
ble. Es decir que las variables dependientes e independientes puedan ser agrupadas y, a partir de allı́ intentar
una integración de cada grupo por separado. Esto lo esbozamos arriba, más o menos ası́
Z Z
dy(x) dy dy
⇐ = Y (y(x))X(x) ⇒ = X(x) dx ⇔ = X(x) dx
dx Y (y) Y (y)

o equivalentemente
P2 (y) Q1 (x)
P (x, y)dy + Q(x, y)dx = 0 ⇔ P1 (x)P2 (y)dy + Q1 (x)Q2 (y)dx = 0 ⇔ dy + dx = 0
Q2 (y) P1 (x)
Otro ejemplo será

√ Z Z
1 − x2 p p p p
′
y = √ ⇔ 1 − x2 dx + 5 − y dy ⇒ dx 1 − x2 + dy 5−y
5−y
con lo cual
√
′ 1 − x2 1 p 1 2
y = √ ⇐ x 1 − x2 + arcsenx + (5 + y)3/2 = C para − 1 ≤ x ≤ 1 ∧ y > −5
5−y 2 2 3
Nótese que el el arcsenx es multivaluada por lo tanto debemos restringir el intervalo a su valor principal
− π2 < x < π2
Ejercicio Pruebe que

√ p
1−y p
y′ = x √ ⇐ 1 − x2 − 2 1−y =C para − 1 < x < 1 ∧ y<1
1 − x2
Variaciones sobre separabilidad y coeficientes inhomogéneos

Abrá otras situaciones en las cuales encontremos ecuaciones diferenciales que podremos convertir en
separables:
dy(x) dy 1 dz a 1 dz a dz
= f (ax + by + c) ⇒ dz = adx + bdy ⇒ = − ⇒ − = f (z) ⇒ = bf (z) + a
dx | {z } dx b dx b b dx b dx
z
Veamos
Z Z
dz dz
y ′ = sen2 (x + y) ⇒ dz = dx + dy ⇒ y ′ = −1 + ⇒ z ′ = −1 + sen2 (z) ⇒ =− dx
dx 1 − sen2 (z)
es decir
Z
dz
− =x+C ⇒ − tan z = x + C ⇒ − tan(x + y) = x + C ⇒ y = x + arctan(x + C)
cos2 (z)
Se puede tratar de generalizar el caso anterior puede y considerar ecuaciones diferenciales del tipo

dy(x) a1 x + b1 y + c1
=f
dx a2 x + b2 y + c2
Entonces, se distinguen dos casos dependiendo si las rectas a1 x + b1 y + c1 = 0 y a2 x + b2 y + c2 = 0 son

paralelas o no.
Si son paralelas

a2 b2 dy(x) a1 x + b1 y + c1
= =λ ⇒ =f ≡ f˜(a1 x + b1 y)
a1 b1 dx λ(a1 x + b1 y) + c2

la cual analizamos al comienzo de esta sección y lo ilustraremos con el siguiente ejemplo

2x + 3y − 1 1 ′
y′ = ⇒λ=2 ⇒ z = 2x + 3y − 1 ⇒ dz = 2dx + 3dy ⇒ y′ = (z − 2)
4x + 6y + 2 3
con lo cual
Z Z
1 ′ z ′7z + 4 2z + 2 2 6
(z − 2) = ⇒z = ⇒ dz = dx ⇒ z+ ln(7z + 4) = x + C
3 2z + 2 2z + 2 7z + 4 7 49
Si no son paralelas, se intuye el siguiente cambio de variables

1 du dv
u = a2 x + b2 y + c2 ⇒ du = a2 dx + b2 dy ⇒ dy = −
b2 − b 1 a2 a1

1 du dv
v = a1 x + b1 y + c1 ⇒ dv = a1 dx + b1 dy ⇒ dx = −
a2 − a1 b2 b1
con lo cual
! !
dy(x) a1 x + b1 y + c1 1 f uv 1 f uv
=f ⇒ + du − + dv = 0
dx a2 x + b2 y + c2 a2 (b2 − b1 ) b2 (a2 − a1 ) a1 (b2 − b1 ) b1 (a2 − a1 )

donde la función f uv se conoce como una función homogénea y al igual que la ecuación diferencial que
hereda de ésta su nombre. Este tipo de ecuaciones diferenciales serán consideradas en la próxima sección.
Otro enfoque (equivalente) de este mismo problema puede ser consultado en el problemario de Kiseliov,
Kransnov, Makarenko [8]. En este enfoque el cambio de variables se relaciona con el punto de corte (x0 , y0 )
Para ejemplificar este caso analizaremos un ejemplo sencillo de una función con argumento inhomogéneo
del tipo.

dy(x) a1 x + b1 y + c1  Q(x, y) ∝ a2 x + b2 y + c2
= ⇔ Q(x, y)dy + P (x, y)dx = 0 ⇒
dx a2 x + b2 y + c2 
P (x, y) ∝ a1 x + b1 y + c1
Decimos, entonces que los coeficientes Q(x, y) y P (x, y) son inhomogéneos (ci 6= 0). Su pondremos que las
rectas no son paralelas, por lo cual utilizamos el cambio de variable propuesto anteriormente. Entonces

1 du dv
u = a2 x + b2 y + c2 ⇒ du = a2 dx + b2 dy ⇒ dy = −
b2 − b1 a2 a1

1 du dv
v = a1 x + b1 y + c1 ⇒ dv = a1 dx + b1 dy ⇒ dx = −
a2 − a1 b2 b1
con lo cual convertimos los los coeficientes Q(x, y) y P (x, y) en homogéneos. Esto es
(a2 x + b2 y + c2 )dy + (a1 x + b1 y + c1 )dx = 0

| {z }
⇓
z
}|
{
u v u v
+ du − + dv = 0
a2 (b2 − b1 ) b2 (a2 − a1 ) a1 (b2 − b1 ) b1 (a2 − a1 )
es decir
v v v v
1 u 1 u
P (u, v) = u + = ug1 ; Q(u, v) = u + = ug2 .
a2 (b2 − b1 ) b2 (a2 − a1 ) u a1 (b2 − b1 ) b1 (a2 − a1 ) u
Este tipo de funciones homogéneas serán consideradas en la siguiente sección.

Funciones Homogéneas de grado n y Ecuaciones Diferenciales Homogéneas

Diremos que una función
 x
 n
 si w = y ⇒ f (x, y) = y g(w)

f (x, y) es homogénea de grado n si f (tu, tv) = tn f (u, v) ⇔

 si w = y ⇒ f (x, y) = xn h(w)

x
Las funciones homogéneas indican un comportamiento particular cuando cambiamos la escala de sus va-
riables. Se utilizan con bastante frecuencia en hidrodinámica y termodinámica. Un ejemplo de una función
homogénea de grado 2 tendremos:
y v
f (x, y) = x2 + y 2 ln ⇒ f (tx, ty) = t2 u2 + v 2 ln homogénea de grado 2
x u
Ejercicio: Muestre que

√ x 1 y/x x
f (x, y) = ysen Homogénea de grado ; f (x, y) = e + tan Homogénea de grado 0
y 2 y
Una ecuación diferencial ordinaria de primer orden será homogénea si
Q(x, y) y P (x, y) son homogéneas de grado n ⇒ Q(x, y)dy + P (x, y)dx = 0 homogénea
y en ese caso la estrategia para resolverla pasa por una sustitución del tipo
Q(x, y) y P (x, y) son homogéneas de grado n ⇒ y = ux ⇒ xn p(u)(udx + xdu) + xn q(u)dx = 0
con lo cual la convertimos en separable

du dx
Q(x, y)dy + P (x, y)dx = 0 ⇒ xn+1 du + xn (q(u) + up(u))dx = 0 ⇔ + =0
q(u) + up(u) x
Nótese que exigir que Q(x, y) y P (x, y) sean funciones homogéneas de grado n, equivale a imponer que
dy(x) P (x, y) y y
= ≡F donde F es Homogéna de grado 0
dx Q(x, y) x x
con lo cual estamos diciendo que si los coeficientes Q(x, y) y P (x, y) so funciones homogéneas de grado n, la
ecuación diferencial es invariante de escala.
Como un primer ejemplo consideremos la siguiente ecuación diferencial
p
′ x2 − y 2 + y
y =
x
Esto es
 p p
p 
 Q(tx, ty) → (tx)2 − (ty)2 + ty ⇒ t (x)2 − (y)2 + y
x2 − y 2 + y dx − xdy = 0 ⇒


P (tx, ty) ⇒ tx ⇒ tx
homgénea de grado 1 y por lo tanto al hacer y = ux tendremos
p p Z Z
dx du
x 1 − u2 + u dx − x(udx + xdu) = 0 ⇒ ± 1 − u2 dx − xdu = 0 ⇒ =± √
x 1 − u2

integramos y, finalmente, llegamos a

y y

ln(x) = arcsenu + C ⇒ ln(x) = arcsen +C para < 1 con x > 0
x x
y y

− ln(−x) = arcsenu + C ⇒ − ln(−x) = arcsen +C para < 1 con x < 0
x x
y

y como u = = 1 ⇒ y = ±x también es solución.
x
Para un segundo ejemplo, consideremos la siguiente ecuación diferencial
2x − y + 1
y′ = −
x+y
la cual corresponde al caso en los cuales los coeficientes de la ecuación Q(x, y) y P (x, y) funciones inho-
mogéneas. Tal y como hemos visto un cambio de variable lo convierte en homogéneo, entonces

 u = 2x − y + 1 ⇒ du = 2dx − dy ⇒ dx = 13 (du + dv)
(2x − y + 1) dx + (x + y) dy = 0 ⇒

v =x+y ⇒ dv = dx + dy ⇒ dy = − 31 (du − 2dv)
ası́ nuestra ecuación diferencial tendrá la forma de una ecuación homogénea

1 1
u (du + dv) + v − (du − 2dv) = 0 ⇒ (u − v)du + (u + 2v)dv = 0
3 3
y ahora haciendo el cambio de variables u = tv con lo cual du = tdv + vdt

Z Z
dv t−1
(tv − v)(tdv + vdt) + (tv + 2v)dv = 0 ⇒ (t2 + 2)dv + (tv − v)dt = 0 ⇒ = dt
v t2 + 2
e integrando tendremos que
1 1 t 2 t
ln |v| + ln |t2 + 2| − √ arctan √ = C ⇒ ln |v 2 (t2 + 2)| = √ arctan √ + C̃ para v 6= 0
2 2 2 2 2
y ahora

2x − y + 1 2 2x − y + 1
t→ 2 2
⇒ ln (2x − y + 1) + 2(x + y) = √
arctan √ +C para x + y 6= 0
x+y 2 2(x + y)
La Figura 9.6 ilustra esta familia de soluciones.
Ecuaciones Isóbaras
Las ecuaciones isóbaras generalizan a las ecuaciones homogéneas por cuanto los coeficientes de la ecuación
Q(x, y) y P (x, y) no son funciones homogéneas del mismo grado y se busca una transformación que convierta
la ecuación en homogénea. Dicho de otra manera, si la dimensionalidad en potencias de y es la misma que
la dimensionalidad en potencias de x Diremos que una ecuación diferencial es isóbara si cumple con

 Q(tx, tm y) → tn P (x, y)
Q(x, y)dy + P (x, y)dx = 0 ⇒

P (tx, tm y) → tn−m+1 Q(x, y)

2x − y + 1
Figura 9.6: Solución gráfica para la ecuación y ′ = − . Las curvas azules indican soluciones parti-
x+y
culares y(0) = 7; y(0) = 5; y(0) = 2; y(0) = −7; y(0) = −5; y(0) = −2.
y el cambio de variable que se impone es y = vxm . El exponente m surge de balancear (si es posible) Con lo
cual habrá que estudiar si es posible “balancear” el orden de las dimensionalidades de variables y funciones.
Tratemos con un ejemplo de ilustrar las ecuaciones isóbaras. Consideremos la ecuación

′ 1 2 2 2 2 x→x ↔ dx = dx
y =− y + ⇒ y + dx + 2xydy = 0 ⇒
2xy x x y → z m ↔ dy = mz m−1 dz
En la contabilidad de los exponentes x aporta un peso de 1 mientras que y aporta un peso de m. La intención
es balancear los términos para que la ecuación sea homogénea de grado n. Esto es

2 2 2m 2 1 v
y + dx + 2xydy = 0 ⇒ z + dx + 2xz m mz m−1 dz = 0 ⇒ m = − ⇒ y = vxm ⇒ y = √
x x 2 x
El exponente del primier término es 2m, del segundo −1 del tercero 2m. Al balancear todos los exponentes
tendremos 2m = −1 con lo cual m = − 21

2 2 v2 2 v dv 1 v dx
y + dx + 2xy dy = 0 ⇒ + dx + 2x √ √ − √ dx = 0 ⇒ vdv + =0
x x x x x 2x x x
√
entonces al integrar y devolver el cambio v = y x tendremos
Z Z
dx v2 1
dv v + =0 ⇒ + ln x = c ⇒ y 2 x + ln x = c
x 2 2

9.3.2. Ecuaciones Diferenciales Exactas

Ecuaciones Exactas lineales
El segundo grupo de estrategias apunta a escribir una ecuación diferencial como una derivada total de un
conjunto de funciones. Uno se ayuda en una posible función que pueda acomodar los términos de la ecuación.
Esa función se denomina factor integrador y tiene la forma, para una ecuación diferencial, lineal
d[µ(x)y(x)] dµ(x) dy(x) dy(x)

≡ y(x) + µ(x) = µ(x)g(x) ↔ µ(x) + µ(x)f (x)y(x) = µ(x)g(x)
dx dx dx dx
Para que esas dos ecuaciones sean equivalentes los coeficientes de y(x) tienen que ser iguales. Es decir
Z Z R
dµ(x) dµ(x)
= µ(x)f (x) ⇒ = dx f (x) ⇒ µ(x) = e dx f (x)
dx µ(x)
Con lo cual hemos demostrada que para una ecuación lineal de primer orden, siempre es posible encontrar
un factor integrador µ(x) tal que la ecuación diferencial pueda ser expresada como una derivada total del
factor integrador y la función incognita.
Z
dy(x) d[µ(x)y(x)] 1
+ f (x)y(x) = g(x) ⇒ = µ(x)g(x) ⇒ y(x) = dx µ(x)g(x) + C
dx dx µ(x)
R
dx f (x)
donde µ(x) = e
Ecuaciones exactas no lineales

Este criterio lo podemos extender a ecuaciones que no sean, necesariamente lineales. Ası́ para una ecuación
diferencial que pueda ser escrita como
? ∂Φ(x, y) ∂Φ(x, y)
d [Φ(x, y)] = 0 ⇔ Q(x, y)dy + P (x, y)dx = 0 ⇒ d [Φ(x, y)] = dx + dy = 0
∂x ∂y
donde Φ(x, y) será la función a determinar. Entonces tendremos que la condición necesaria y suficiente para
que una ecuación diferencial sea exacta es

∂Φ(x, y) 
Q(x, y) ⇔ 

∂y  ∂ 2 Φ(x, y) ∂ 2 Φ(x, y) ∂Q(x, y) ∂P (x, y)
⇒ ≡ ⇔ ≡ ⇒ d [Φ(x, y)] = 0
 ∂y∂x ∂x∂y ∂x ∂y
∂Φ(x, y)  

P (x, y) ⇔
∂x
Si esto se cumple entonces, podremos encontrar la función Φ(x, y) integrando respecto a cualquiera de
las variables (ahora consideradas independientes ambas).
Z x0 Z x0
∂Φ(x, y) ∂Φ(x, y) ∂ ∂S(y)
P (x, y) ≡ ⇔ Φ(x, y) = du P (u, y)+S(y) ⇒ Q(x, y) = = du P (u, y) +
∂x x ∂y ∂y x ∂y
entonces
Z x0 Z x0
∂Φ(x, y) ∂P (u, y) ∂S(y) ∂Q(v, y) ∂S(y) v=x ∂S(y)
Q(x, y) = = du + ≡ dv + = Q(v, y)|v=x0 +
∂y x ∂y ∂y x ∂v ∂y ∂y

con lo cual nos queda finalmente otra ecuación diferencial para encontrar S(y) y con ella Φ(x, y). Esto es
Z y0 Z x0 Z y0
∂S(y)
= Q(x0 , y) ⇒ S(y) = dw Q(x0 , w) ⇒ Φ(x, y) = du P (u, y) + dw Q(x0 , w) = C
∂y y x y
Hay que hacer notar que los segmentos de lı́nea que unen el punto (x0 , y0 ) con los puntos genéricos (x, y0 ) ∧
(x0 , y) pertenecen al entorno de (x0 , y0 ). Este tipo de entornos también se denomina multiplemente conexo.
Consideremos los siguientes ejemplos:
Primeramente

 P (x, y) ⇔ cos y
y ′ xseny − y 2 = cos y ⇔ cos y dx − xseny − y 2 dy = 0 ⇒

Q(x, y) ⇔ − xseny − y 2
y verificamos que esta ecuación diferencial es exacta, ya que

Z x0 Z y0
∂Q(x, y) ∂P (x, y)
= = − sen y ⇒ Φ(x, y) = du P (u, y) + dw Q(x, w) = C
∂x ∂y x y
con lo cual, si particularizamos el punto (x0 , y0 ) ≡ (0, 0) tendremos que

Z x0 Z y0
y3
Φ(x, y) = du cos y + dw w2 = C ⇒ x cos y + =C
x y 3
Otro ejemplo será

 
 P (x, y) ⇔ x3 + y 2 x 
∂Q(x, y) ∂P (x, y)
x3 + y 2 x dx + x2 y + y 3 dy ⇒  ⇒ = = 2yx
 ∂x ∂y
Q(x, y) ⇔ x2 y + y 3
y otra vez
Z x0 Z y0
2
Φ(x, y) = du u3 + y 2 u + dw x2 w + w3 = C ⇒ Φ(x, y) = x4 +2x2 y 2 +y 4 = C ⇒ x2 + y 2 =C
x y
Ecaciones exactas no lineales y factor integrador

Del mismo modo, y con la misma idea, podemos incorporar el factor integrador µ(x, y) para extender
la idea a ecuaciones que no sean, necesariamente lineales. Ası́ para una ecuación diferencial que pueda ser
escrita como
?
d [Φ(x, y)] = 0 ⇔ µ(x, y)Q(x, y)dy + µ(x, y)P (x, y)dx = 0
es decir
∂Φ(x, y) ∂Φ(x, y)
d [Φ(x, y)] = dx + dy = µ(x, y)Q(x, y)dy + µ(x, y)P (x, y)dx = 0
∂x ∂y
Entonces tendremos que la condición necesaria y suficiente para que una ecuación diferencial sea exacta,
forzándola con el factor integrador se complica un poco

∂Φ(x, y) 
µ(x, y)Q(x, y) ⇔ 

∂y  ∂ 2 Φ(x, y) ∂ 2 Φ(x, y) ∂µ(x, y)Q(x, y) ∂µ(x, y)P (x, y)
⇒ ≡ ⇔ ≡

 ∂y ∂x ∂x ∂y ∂x ∂y
∂Φ(x, y) 
µ(x, y)P (x, y) ⇔
∂x

y, obviamente, esta condición de integrabilidad dependerá del µ(x, y) que propongamos.

Ası́ si µ(x, y) = µ(x) entonces la condición se lee

∂µ(x) ∂Q(x, y) ∂P (x, y) 1 ∂µ(x) 1 ∂P (x, y) ∂Q(x, y)
Q(x, y) + µ(x) ≡ µ(x) ⇒ = − = f (x)
∂x ∂x ∂y µ(x) ∂x Q(x, y) ∂y ∂x
con lo cual si se cumple que
R
1 ∂P (x, y) ∂Q(x, y) 1 ∂µ(x) dx f (x)
− = f (x) = ⇒ µ(x) = e
Q(x, y) ∂y ∂x µ(x) ∂x
podremos deteriminar el factor integrador. Una vez identificado procedemos a integrar, formalmente Φ(x, y)
Z y Z y
∂Φ(x, y) ∂
Φ(x, y) = µ(x) du Q(x, u) + S(x) ⇒ = µ(x)P (x, y) ≡ µ(x) du Q(x, u) + S(x)
y0 ∂x ∂x y0
y finalmente, una vez más

Z y Z y
∂µ(x)Q(x, u) ∂S(x) ∂µ(x, u)P (x, u) ∂S(x)
µ(x)P (x, y) = du + ⇒ µ(x)P (x, y) = du +
y0 ∂x ∂x y0 ∂u ∂x
con lo cual
Z x Z y Z x
S(x) = du µ(u, y0 )P (u, y0 ) ⇒ Φ(x, y) = µ(x) du Q(x, u) + du µ(u, y0 )P (u, y0 ) + C
x0 y0 x0
Bernoulli y Ricatti
9.3.3. Solución Paramétrica de Ecuaciones Diferenciales

Ecuaciones del Tipo F(y ′ ) = 0, F(x, y ′ ) = 0 y F(y, y ′ ) = 0
Ecuaciones del Tipo F(x, y, y ′ ) = 0, Lagrange y Clairaut
9.4. Soluciones Numéricas a las Ecuaciones Diferenciales

9.4.1. Las Ideas Generales
Dada una ecuación diferencial de segundo orden de la forma

d2 x(t) d x(t)
= F , x(t), t
dt2 dt
siempre se puede convertir en un sistema de dos ecuaciones lineales de primer orden, al extender el espacio
de variables de la forma
) (
d x(t) def d q(t)
dt = p(t) d2 x(t) d x(t) dt = p(t)
def ⇒ 2
= F , x(t), t ⇔ d p(t)
x(t) = q(t) dt dt dt = F (p(t), q(t), t)
este sistema puede ser re-arreglado en forma vectorial

q(t)
d
p(t) p(t) d Q(t)
= ⇔ = F (Q(t),t)
dt F (p(t), q(t), t) dt

Ası́ dado un conjunto de potenciales elásticos y las fuerzas que de ellos derivan,
  x
 kx ←p=1  −k kxk

 


 


 1


 2
←p=2 −kx 
 2 kx

d V (x)


V (x) = ⇒ Fk (x) = − ⇒ Fk (x) =


1
3 kx
3
←p=3 dx 
 −kx2

 


 .. 
 ..

 . 
 .

 1 p 
 p−1 x
p k kxk −k kxk kxk
el sistema dinámico correspondiente a la ecuación de Newton será

 
x(t)
d    
p(t)
d Q(t) p(t)
= F (Q(t),t) ⇒ = 
dt dt 1 p−1 x(t)
m [Fext (x(t), t)] − k kx(t)k kx(t)k
Los Métodos y su Clasificación

Dada una ecuación diferencial de primer orden, dy(x) ′
dx = y (x) = f (y(x), x), con yk el valor de la función
obtenida con el método, con yk = y(xk ), donde xk = x0 + kh y h el paso. Diremos que un método es
de paso único si la determinación de yk+1 sólo involucra un único valor de yk y múltiple paso si para
calcularlo se utilizan varios valores yk , yk−1 , · · · , yk−p . Por otra parte se denomina un método explı́cito si
para determinar yk+1 se utilizan valores anteriores yk , yk−1 , · · · , yk−p y implı́cito si se utilizan una función
del mismo valor yk+1 . Ası́
yk+1 = yk−1 + 2h f (xk , yk )
representa un método explı́cito de paso único mientras que
h
yk+1 = yk + [f (xk , yk ) + f (xk+1 , yk+1 )]
2
será implı́cito de múltiples pasos.
El Rebusque de Taylor
Tal y como hemos dicho arriba, dada una ecuación diferencial, su solución a través de un método de paso
único puede ser escrita como
y ′ (x) = f (y(x), x) ⇒ yk+1 = yk + ϕ (xk , yk , h) con h = xi+1 − xi ;
Lo primero que se puede hacer es expandir por Taylor alrededor del punto x = xk
1 2 1 n
y(x) = y(xk ) + (x − xk ) y ′ (xk ) + (x − xk ) y ′′ (xk ) + · · · + (x − xk ) y (n) (xk ) + · · ·
2! n!

e identificamos
y(xk ) → yk y ′ (x) = f (y(x), x)
y ′ (xk ) → f (yk , xk )

∂ f ∂ f
y ′′ (xk ) → f ′ (yk , xk ) = + y′
∂x x=xx ∂y x=xx k
y=yk y=yk
′′′ ′′ ′ ′
y (xk ) → f (yk , xk ) = ∂x f + ∂y f yk′ = ∂xx f + (∂xy f ) yk′ + [∂yx f + (∂yy f ) yk′ ] yk′ + ∂y f yk′′
..
.
por lo que reconstruimos la serie de Taylor hasta el orden que podamos o requiramos
1 2 ′ 1 1 n (n−1)
yn+1 = yn + h f (yk , xk ) + h f (yk , xk ) + h3 f ′′ (yk , xk ) + · · · + h f (yk , xk ) + · · ·
2! 3! n!
quedando acotado el error por
1
εred = hn+1 f (n) (y(ξ), x(ξ))
(n + 1)!
9.4.2. La idea de la Integración y los Métodos

La idea de integrar una ecuación diferencial ordinaria puede ilustrarse, formalmente de la siguiente forma
Z xk+1
′
y (x) = f (y(x), x) ⇒ yk+1 = yk + dξ f (ξ, y(ξ))
xk
entonces el método se centra en como se aproxima la función dentro de la integral
Euler Se aproxima la función con en el punto anterior

f (xk , yk ) ⇒ yk+1 = yk + h f (xk , yk )
Euler Mejorado o Heuns Se aproxima la función mediante un promedio en los extremos
1
2 [f (xk , yk ) + f (xk+1 , yk+1 )] ⇒ yk+1 = yk + h2 [f (xk , yk ) + f (xk+1 , yk+1 )]
h
⇒ yk+1 = yk + 2 [f (xk , yk ) + f (xk+1 , yk + h f (xk , yk ))]
con h = xi+1 − xi el paso de integración. Nótese además que hemos utilizado Euler otra vez para expresar
yk+1 = yk+1 (yk , xk )
El Método de Euler constituye una expansión por Taylor hasta primer orden por lo que el error es
claramente de segundo orden por cuanto si comparamos con la expansión en series de Taylor correspondiente
tendremos

d y h2 d2 y
yk+1 = yk + h + + ···
dx x=xk 2! dx2 x=xk

h2 d2 y
kεtot k ∝
2! dx2 x=xk
El Método de Euler y el problema de Valores Iniciales

Este método si bien no se utiliza en la práctica en su forma estándar para ecuaciones diferenciales
ordinarias, si ilustra el proceso de discretización de una ecuación diferencial y su solución mediante métodos
numéricos.

Para resolver la ecuación de un oscilador armónico libre que parte del reposo, i.e.

d2 φ(t) 2 2 k dφ(t)
+ ω0 φ(t) = 0 con: ω0 = ; φ (t0 ) = 1; y =0
dt2 m dt t=t0
en la cual φ(t) representa la posición de un cuerpo de masa m unido a un resorte de constante elástica k.
Discretizando mediante diferencia centrada
d2 φ(t) 1 1
h = ti+1 − ti ; 2
≈ 2 [φ(ti+1 ) − 2φ(ti ) + φ(ti−1 )] ≡ 2 [φi+1 − 2φi + φi−1 ]
dt h h
con lo cual la ecuación del oscilador libre queda como
d2 φ(t)
+ ω02 φ(t) = 0 ⇒ φi+1 − 2 − h2 ω02 φi + φi−1 = 0
dt2
esta última ecuación es la versión en diferencias finitas de la ecuación diferencial y es claro que se convierte
en una ecuación algebraica. Finalmente, los dos valores iniciales para la iteración φ0 y φ1 surgen de las
condiciones iniciales
φ0 ≡ φ (t = t0 ) = 1

dφ(t)
= 0 ⇒ φ1 ≈ φ0
dt t=t0
Los Métodos de Runge-Kutta

Es el conjunto de métodos más populares y de mayor uso. La idea del método de Runge-Kutta es producir
resultados equivalentes a desarrollos en Taylor de orden superior a Euler en métodos de un único paso por
lo tanto Z x k+1
y ′ (x) = f (y(x), x) ⇒ yk+1 = yk + dξ f (ξ, y(ξ))

xk
y se aproxima la función con un promedio ponderado.
f (ξ, y(ξ)) ≈ [α f (yk , xk ) + β f (yk + δ f (yk , xk ) hk , xk + γ hk )] con hk = xk+1 − xk
donde α, β, γ y δ son los pesos estadı́sticos a ser determinados. Por lo tanto
yk+1 = yk + [α f (yk , xk ) + β f (yk + δ f (yk , xk ) hk , xk + γ hk )] hk
Expandiendo por Taylor de dos variables

1 2 2
g (x + λ, y + µ) = g (x, y) + [λ ∂x g + µ ∂y g] + λ ∂x g + 2λµ ∂xy g + µ2 ∂y2 g + · · ·
2!
tendremos
yk+1 = yk + [α + β] fk hk + β [γ ∂x fk + δ fk ∂y fk ] h2k +
2
γ 2 δ2 2 2
+β ∂x fk + 2γδ fk ∂xy fk + fk ∂y fk h3k + · · ·
2 2

con fk = f (yk , xk ) y como se ve claramente, queda libertad para escoger
Euler Mejorado o Heuns α = β = 12 ; γ=δ=1
1
yk+1 = yk + fk hk + 2 [∂x fk + fk ∂y fk ] h2k
1
Euler Modificado α = 0; β = 1; γ=δ= 2
1 1

yk+1 = yk + fk hk + 2 ∂x fk + 2 fk ∂y fk h2k
Runge-Kutta de cuarto orden aproxima la función f (ξ, y(ξ)) en cuatro puntos intermedios en el intervalo
xk < x < xk+1 por lo cual
yk+1 = yk + [α κ1 + β κ2 + γ κ3 + δ κ4 ] hk
podemos plantearnos varias formas de hacerlo
hk
yk+1 = yk + [κ1 + 2κ2 + 2κ3 + κ4 ]
6
donde
κ1 = f (xk , yk )

1 1
κ2 = f xk + hk , yk + κ1
2 2

1 1
κ3 = f xk + hk , yk + κ2
2 2
κ4 = f (xk + hk , yk + κ3 )
o también
hk
yk+1 = yk + [κ1 + 3κ2 + 3κ3 + κ4 ]
8
donde
κ1 = f (xk , yk )

1 1
κ2 = f xk + hk , yk + κ1
3 3

1 1
κ3 = f xk + hk , yk + κ2
3 3
κ4 = f (xk + hk , yk + κ3 )
Más aún el método de Fehlberg de 4/5 orden se puede escribir como
yk+1 = yk + hk [C1 κ1 + C2 κ2 + C3 κ3 + C4 κ4 + C5 κ5 + C6 κ6 ] + O(h6 )

κ1 = f (xk , yk )
κ2 = f (xk + a2 hk , yk + b21 κ1 )
κ3 = f (xk + a3 hk , yk + b31 κ1 + b32 κ2 )
κ4 = f (xk + a4 hk , yk + b41 κ1 + b42 κ2 + b43 κ3 )
..
.
κ6 = f (xk + a6 hk , yk + b61 κ1 + b62 κ2 + b63 κ3 + b64 κ4 + b65 κ5 )
la cual puede ser redefinida y truncada para obtener

h i
ỹk+1 = yk + hk C̃1 κ1 + C̃2 κ2 + C̃3 κ3 + C̃4 κ4 + C̃5 κ5 + O(h5 )
Métodos Multipaso
Los métodos multipaso se basan encontrar el valor yn+k como una función de k valores precedentes:
yn+k−1, yn+k−2, yn+k−3, · · · yn . Para k = 1, retomamos los métodos de paso único del tipo Euler o Runge-
Kutta. Será explı́cito (abierto) si el valor yn+k puede ser calculado directamente o implı́cito (abierto) si la
fórmula contiene el valor yn+k deseado.
Otra vez la idea está en aproximar el argumento de la integración formal
Z xi+1
′
y (x) = f (y(x), x) ⇒ yi+1 = yi + dξ f (ξ, y(ξ))
xi−k
nótese en este caso que el punto i + 1 recibe la contribución de k puntos anteriores. El integrando f (ξ, y(ξ))
lo aproximaremos con un polinomio de interpolación de Newton de orden n. Tal que
f (ξ, y(ξ)) → f (ξ) = pn (ξ) + Rn (ξ)
con pn (ξ) el polinomio de interpolación y Rn (ξ) el residuo. Donde i
pn (x) = f [xn ] + (x − xn ) f [xn , xn−1 ] + (x − xn ) (x − xn−1 ) f [xn , xn−1 , xn−2 ] + · · ·

+ (x − xn ) (x − xn−1 ) (x − xn−2 ) · · · (x − x1 ) f [xn , xn−1 , xn−2 , xn−3 , · · · x0 ]
f (n+1) (ζ)
Rn (x) = (x − xn ) (x − xn−1 ) (x − xn−2 ) · · · (x − x0 ) con x0 < ζ < xn
(n + 1)!
haciendo pn (x) ≡ f (xn + αh) con α cero o negativo de tal modo que en términos del operador diferencias
atrasada ∇f (x) = f (x) − f (x − h) siendo h el incremento
α (α + 1) 2 α (α + 1) (α + 2) 3
f (xn + αh) = fn + α∇fn + ∇ fn + ∇ fn +
2! 3!
α (α + 1) (α + 2) · · · (α + r − 1) r
+ ∇ fn
r!

donde hemos denotado fn ≡ f (xn , y(xn )), ∇m fn ≡ ∇m f |x=xn , y α = (x − xi ) /h Por lo tanto

Z xi+1
yi+1 = yi + dξ f (ξ, y(ξ))
xi−k
Z 1
= yi + h dα f (xn + αh)
−k
2 3
α2 α 1 ∇2 fi α ∇ fi
yi+1 = yi + h αfi + ∇fi + α2 + + α2 +α+1 +
2 3 2 2! 4 3!
3 4 1
2 α 3α2 11α ∇ fi
+α + + +3 + ···
5 2 3 4! −k
por razones de conveniencia que son evidentes al hacer el desarrollo, se toman las fórmulas para k = r y k
impar y obtendremos

 yi+1 = yi + h fi + 12 ∇fi + 12
5
∇2 fi + 83 ∇3 fi
k=0
⇒
r=3  251 5 (4)
 R = 720 h f (ζ)
 yi+1 = yi + h [2fi + 0∇fi ]
k=1
⇒
r=1  1 3 (2)
 R = 3 h f (ζ)
 yi+1 = yi + h 4fi − 4∇fi + 38 ∇2 fi + 0∇3 fi
k=3
⇒
r=3  14 5 (4)
 R = 45 h f (ζ)
 i+1 yi + h 6fi − 12∇fi + 15∇2 fi − 9∇3 fi + 33 4
k=5
y = 10 ∇ fi
⇒
r=5  41 7 (6)
R = 140 h f (ζ)
y al expresar las diferencias atrasadas las fórmulas explı́citas (abierta) quedan expresadas como

k=0 h

y = yi + 24 [55fi − 59fi−1 + 37fi−2 − 9fi−3 ] R ∼ O h5
r = 3 i+1
k=1
y = yi + 2hfi R ∼ O h3
r = 1 i+1
k=3
yi+1 = yi + 4h3 [2fi − fi−1 + 2fi−2 ] R ∼ O h5
r=3
k=5
yi+1 = yi + 3h
10 [11fi − 14fi−1 + 26fi−2 − 14fi−3 + 11fi−4 ] R ∼ O h7
r=5
Siguiendo el mis procedimiento se pueden escribir las fórmulas implı́citas (cerradas) para las mismas
“curiosas” situaciones. Para este caso la conveniencia se obtienes para k impar y r = k + 2

 yi+1 = yi + h fi+1 − 21 ∇fi+1 − 12 1 1
∇2 fi+1 − 24 ∇3 fi+1
k=0
⇒
r=3  −19 5 (4)
 R = 720 h f (ζ)
 yi+1 = yi−1 + h 2fi+1 − 2∇fi − 13 ∇2 fi+1 − 0∇3 fi+1
k=1
⇒
r=3  −1 5 (4)
 R = 90 h f (ζ)
 yi+1 = yi−3 + h 4fi+1 − 8∇fi − 20 2 8 3 14 4
k=3 3 ∇ fi+1 − 3 ∇ fi+1 + 45 ∇ fi+1
⇒
r=5  −8 5 (4)
R = 945 h f (ζ)

desarrollando las diferencias atrasadas, tendremos

k=0 h

yi+1 = yi + 24 [9fi+1 + 19fi−1 − 5fi−1 + 9fi−2 ] R ∼ O h5
r=3
k=1
yi+1 = yi−1 + h3 [fi+1 + fi + fi−1 ] R ∼ O h5
r=3
k=3
yi+1 = yi−3 + 2h
45 [7fi+1 + 32fi + 12fi−1 + 32fi−2 + 7fi−3 ] R ∼ O h
7
r=5
Se debe puntualizar lo siguiente respecto a las fórmulas explı́citas e implı́citas de los métodos multipaso
antes mencionados
Los métodos multipasos, normalmente, requieren menos evaluaciones de las funciones que los métodos
monopaso para un mismo nivel de precisión.
Los métodos multipaso requieren de un método monopaso que le permita determinar los yn+k−1, yn+k−2, yn+k−3, · · · , yn
puntos iniciales.
Las fórmulas explı́citas son, normalmente, menos precisas que las implı́citas. La razón se fundamenta
en que, mientras las explı́citas extrapolan la solución al punto yi+1 , las implı́citas la interpolan, por
cuanto la toman en cuenta en el momento de calcularla.
Las fórmulas explı́citas e implı́citas deben ser consideradas como complementarias, por cuanto las
∗
explı́citas pueden predecir el valor de yi+1 necesario para la fi+1 = f (xi+1 , yi+1 ) del cálculo de yi+1 en
la fórmula implı́cita.
Existen varias combinaciones predictor-corrector, entre ellas mencionamos:
Milne de cuarto orden
• Predictor
4h
yi+1 = yi−3 + [2fi − fi−1 + 2fi−2 ]
3
• Corrector
h
yi+1 = yi−1 + [fi+1 − 4fi + fi−1 ]
3
Milne de sexto orden
• Predictor
3h
yi+1 = yi−5 + [11fi − 14fi−1 + 26fi−2 − 14fi−3 + 11fi−4 ]
10
• Corrector
2h
yi+1 = yi−3 + [7fi+1 + 32fi + 12fi−1 + 32fi−2 + 7fi−3 ]
45
Adams Modificado o Adams Moulton
• Predictor
h
yi+1 = yi + [55fi − 59fi−1 + 37fi−2 − 9fi−3 ]
24
• Corrector
h
yi+1 = yi + [9fi+1 + 19fi − 5fi−1 + fi−2 ]
24

El método de extrapolación multipaso más exitoso (conjuntamente con los métodos de paso único del
tipo Runge-Kutta) es el de extrapolación racional de Bulirsch-Stoer en el cual se define un paso superior
de H y una serie de subpaso hη = H/η con el aumento del número de subpasos, en algún momento siguiendo
algún criterio de convergencia se hace una extrapolación (racional) que representa el lı́mite η → ∞.
El método de Bulirsch-Stoer tiene una estrategia diferente al los anteriores y posee, como motor de
aproximación el método del punto medio modificado o salto de rana (leap frog). Este esquema se utiliza con
frecuencia en discretizaciones de ecuaciones diferenciales en derivadas parciales y se basa en aproximar la
derivada por el valor el promedio en los dos extremos:
y(xn ) − y(n−1 )
y ′ (x) = f (y(x), x) ⇒ y ′ (xn ) = f (y(xn ), xn ) =
2h
por lo tanto
z0 ≡ y(x)
z1 = z0 + hf (x, z0 )
..
.
zn+1 = zn−1 − 2hf (x + nh, zn )
para finalmente calcular

1
y(x + H) ≈ yn ≡ [zn + zn−1 + hf (x + H, zn )]
2
Nótese que si reacomodamos
4yn − yn/2
y(x + H) ≈
3
obtendremos un método de cuarto orden que requiere menos evaluaciones de f (y(xn ), xn ) por paso h
9.4.3. Control del Paso

En General para métodos de 4to orden. Tal y como se mencionó en el caso de la integración
numérica, el primer criterio que surge es dividir el paso h en la midad, calcular todo de nuevo y comparar
los resultados a ver si está dentro del los lı́mites de tolerancia que nos hemos impuesto

yh − yh/2
≡ ∆ yh , yh/2 < εmáx ⇒
yh
5 !1/5
εmáx h0 εmáx
≈ ⇒ h0 = ht
∆ yh , yh/2 ht ∆ yh , yh/2
donde hemos denotado h0 como el paso ideal. Esta relación es general para cualquier método de 4 orden de
paso único, multipaso, implı́cito o explı́cito.
Más aún, la práctica ha indicado que
 0,20 0,20

 εmáx ∆0

 Mht ∆ y ,y∗ ≡ Mht ∆0 ≥ ∆1
 ( h h) ∆h
h0 =

 0,25 0,25

 Mh εmáx ∆0
 t ≡ Mht ∆0 < ∆1
∆(yh ,yh ∗
) ∆h

donde 0 < M < 1 un factor de seguridad

Para métodos Runge-Kutta. es importante mencionar que se utilizan mayoritariamente métodos
hasta cuarto orden porque de mayor orden (M , por ejemplo) involucran más de M evaluaciones (y menos
M − 2) de la derivada. Por ello para este tipo de métodos se descubrió que considerando el mismo número de
puntos para la evaluación intermedia se pueden generar métodos de distinto orden, y para colomo de suerte
el menor orden de esta situacion se expresa para métodos de 4 y 5 orden. En particular Runge-Kutta de 5
orden se puede escribir como:
yk+1 = yk + hk [C1 κ1 + C2 κ2 + C3 κ3 + C4 κ4 + C5 κ5 + C6 κ6 ] + O(h6 )
κ1 = f (xk , yk )
κ2 = f (xk + a2 hk , yk + b21 κ1 )
κ3 = f (xk + a3 hk , yk + b31 κ1 + b32 κ2 )
κ4 = f (xk + a4 hk , yk + b41 κ1 + b42 κ2 + b43 κ3 )
..
.
κ6 = f (xk + a6 hk , yk + b61 κ1 + b62 κ2 + b63 κ3 + b64 κ4 + b65 κ5 )
y con los mismos puntos (¡ las mismas evaluaciones !) se puede reescribir para 4 orden como:
h i
ỹk+1 = yk + hk C̃1 κ1 + C̃2 κ2 + C̃3 κ3 + C̃4 κ4 + C̃5 κ5 + O(h5 )
por lo tanto el error se puede estimar

6
X
∆ (yk+1 , ỹk+1 ) = Ci − C̃i ki
i=1
y el control del paso se utiliza exactamente igual

0,20
εmáx
h0 = ht
∆ (yh , ỹh )
Para métodos multipasos y predictor corrector la situación puede tener un refinamiento adicional
antes de proceder a modificar el paso h. El esquema serı́a para un método predictor corrector del tipo
Adams Modificado o Adams Moulton, donde el
Predictor
h
yi+1 = yi + [55fi − 59fi−1 + 37fi−2 − 9fi−3 ]
24
Corrector
h
yi+1 = yi + [9fi+1 + 19fi − 5fi−1 + fi−2 ]
24
se realiza una serie de iteraciones dentro de la fórmula de corrector, i.e.

h
yi+1 = yi + 9f xi+1 , yi+1 + 19f (xi , yi ) − 5f (xi−1 , yi−1 ) + f (xi−2 , yi−2 )
1 24 0

9.5. Algunas Aplicaciones de Ecuaciones Diferenciales de Primer

Orden
Modelar o describir matem’aticamente un fen’omeno es el fin ’ultimo de la ciencias. Las matem’aticas
son el lenguaje de la f’isica. ¿ Cómo describir el chisporroteo de una llama ? ¿ la textura de un pintura al
oleo ? ¿ el tráfico en carreteras durante horas picos ? ¿ el titilar de las estrellas ? Describir matemáticamente
estas situaciones no sólo no es fácil, pero tampoco es única. Son fenómenos complejos y su descripción puede
tener muchos grados de profundidad.
9.5.1. Ley de Malthus/Decaimiento Radioactivo.

Malthus3
d k>0
y(x) = k y(x) y(0) = y0 . (9.30)
dx k<0
y(t) = y0 ek t
Para k < 0 tenemos una situación de decaimiento: la población decrece con el tiempo. Este concepto se
utiliza los procesos de decaimiento radiactivo. El tiempo de vida media se define como el tiempo necesario
para que la mitad de los núcleos decaigan, lo cual es independiente de la cantidad de la muestra y permite
medir la edad de todo aquello que contenga isótopos radioactivos. En particular el C14 del cual se sabe que:
tiene una vida media de 5730 años y que todos los organismos están (o estuvieron) formados por carbono.
Por lo tanto, si sabemos el porcentaje de C14 en una muestra, digamos el 63 % podremos inferir su edad
y(0) = 1
1
y(5730) = ek 5730 = 2
Por lo tanto, despejando k

− ln 2
k=
5730
tendremos finalmente
y(t) = 2−t/5730
de aquı́ obtendremos la edad en años de la muestra
ln 0,63
y(t) = 0,63 ⇒ t = − 5730 ≈ 3819,48
ln 2
Para k > 0 la ecuación 9.30 describe el incremento poblacional. El valor de k se calcula experimentalmente
(promediando sus valores para cada uno de los parámetros). Para la población venezolana k = 0,018
3 En honor al economista polı́tico inglés Thomas Robert Malthus (1766-1834). Quien fue uno de los primeros en darse cuenta
queÑ la población crece como una razón geométrica mientras que los medios de subsistencias crecen de manera aritmética. Esta
afirmación plasmada en su Ensayo sobre el Principio de Poblaciones, el cual inspiró a Darwin en la formulación de principio
de selección natural. Malthus, muy religioso y creyente pensaba que esa diferencia en el crecimiento de la población y las
necesidades que ellas generaban, erán de procedencia divina y que forzarı́a a la humanidad a ser más laboriosa e ingeniosa para
lograr los medios de subsistencia. Darwin, no tan religioso, lo formuló como una situación natural presente en todas las especies.

Figura 9.7: Decaimiento Radioactivo
Población Venezolana (Millones Hab.)

Año Población y(t) = 0,350 e0,018t
1800 (0) 0.350 0.350
1847 (47) 0.750 0.816
1873 (73) 1.000 1.302
1881 (81) 1.750 1.504
1891 (91) 2.100 1.801
1926 (126) 2.850 3.381
1936 (136) 3.200 4.048
1941 (141) 3.850 4.429
1950 (150) 4.350 5.208
1961 (161) 6.800 6.348
1971 (171) 10.800 7.600
1981 (181) 14.100 9.099
9.5.2. La Ecuación logı́stica o Ley de Verhulst

Esta ecuacióon se utiliza para describir el crecimiento de la población de una manera más precisa que la
Ley de Malthus. Esta ecuación toma en cuenta le decrecimiento de la población con el término −y 2
y ′ = (k − ay) y = ky − ay 2
donde k y a son constantes arbitrarias. Esta ecuación es separable y la solución tiene la forma de

y

ln =k t+C
k − ay

Figura 9.8: Población de Venezuela desde 1800
y por lo tanto
k y0
y(t) =
a y0 + (k − a y0 ) e−k t
el crecimiento de la población venezolana desde 1800 puede modelarse con k = 0,018, a = 0,001
9.5.3. La Ley de Enfriamiento de Newton
dT
= k(T − Tm ) T (0) = T0
dt
la solución será
T = (T0 − Tm ) ek t + T m
y para el caso de una torta recien sacada del horno a una temperatura de T0 = 176◦ , y una temperatura
ambiente de Tm = 23◦ , con T (80) = 63◦ ,la gráfica será
también se puede modelar el enfriamiento con una temperatura del ambiente variable esto es
dT
= k(T − Tm (t)) T (0) = T0
dt
tómese, por ejemplo,
πt
Tm (t) = 23 − 10 cos con 0 ≤ t ≤ 24 horas
12
si T (0) = 15◦
dT 1 πt
= T − 23 − 7 cos
dt 4 12

Figura 9.9: Población de Venezuela desde 1800
Figura 9.10: Enfriamiento de una torta recien horneada

Figura 9.11: Variación de la Temperatura Construcciones
con la solución
t t
−23 π 2 + 11 e− 4 π 2 + 21 π sen( π12t ) + 63 cos( π12t ) − 207 + 36 e− 4
T (t) = −
9 + π2
y la siguiente evolución
9.5.4. Interés Compuesto.

Otra de las aplicaciones de las ecuaciones diferenciales es en el cálculo del crecimiento del capital inicial,
depositado en un banco C0 durante un cierto lapso de tiempo y sujeto a un determinada tasa de interés.
Luego del lapso de tiempo, el nuevo capital será

int
C1 = C0 1 +
100
Pasados dos lapsos (años) de tiempo el capital será

int int int
C2 = C1 1 + = C0 1 + 1+
100 100 100
en t lapsos de tiempo,
t
int
C(t) = C0 1+
100
Ahora bien, si el pago de los intereses se hace varias veces durante ese lapso, entonces tendremos

int int int
C2 = C1 1 + = C0 1 + 1+ .
100 · 2 100 · 2 100 · 2

Finalmente, si el interés se paga k veces en cada lapso, entonces

kt
int
C(t) = C0 1 + . (9.31)
100 · k
Si k = 12 entonces se tienen intereses pagaderos sobre saldos mensuales. En el caso de que k = 365, los
intereses son pagaderos sobre saldos diarios. Nótese que si
kt
int int
k →∞⇒ 1+ → e 100 t ;
100 · k
entonces, podemos aproximar este modelo discreto de pagos sobre saldos por uno continuo, i.e.
int
t int
C(t) = C0 e 100 ⇔ C ′ (t) = C(t).
100
Existen situaciones en las cuales los bancos, movidos por la competencia, ofrecen cancelar los intereses sobre
un año hipotético de 360 dı́as. En este caso, el capital crece como:
365t
int
C(t) = C0 1 + . (9.32)
100 · 360
La siguiente tabla muestra una comparación del crecimiento del capital inicial C0 = 1, en un lapso de 10
años, sujeto a intereses del 40 % sobre saldos diarios y siguiendo los tres modelos antes mencionados.
int
t int
kt int
365t
Años C(t) = C0 e 100 C(t) = C0 1 + 100·k . C(t) = C0 1 + 100·360
0 1.0 1.0 1.0
1 1.491497997 1.491824698 1.499797972
2 2.224566275 2.225540928 2.249393957
3 3.317936142 3.320116923 3.373636494
4 4.948695110 4.953032424 5.059773172
5 7.380968843 7.389056099 7.588637542
6 11.00870024 11.02317638 11.38142320
7 16.41945436 16.44464677 17.06983543
8 24.48958329 24.53253020 25.60130455
9 36.52616442 36.59823444 38.39678465
10 54.47870107 54.59815003 57.58741975
9.5.5. Mecánica Elemental.

El estudio del movimiento de los cuerpos sometidos a la acción de un conjunto de fuerzas externas, fue
una de las principales motivaciones para el planteamiento y solución de las ecuaciones diferenciales.
X −−−−−−−− −−−→ −−−−→

−→ −−
→ d mv(t) −−→
F (r(t), v(t), t) = = m a(t) , (9.33)
externas
dt
−−→ −−→
para sistemas con m = cte (partı́culas) y con v(t) la velocidad y r(t) la posición.
−−→
−−→ dr(t)
v(t) = .
dt

Figura 9.12: Velocidad del paracaidista en función del tiempo
Movimientos con Acelaración Constante

Ası́ en carreras de velocidad, en las cuales los autos tienen que generar el máximo posible de velocidad
para una distancia dada tendremos, que la ecuación Newton 10.7 se expresa
F

dv(t) v(t) = v0 + m t
cte = F = m ⇒
dt F 2
x(t) = x0 + v0 t + 12 m t
F
Los valores tı́picos para este caso son v0 = r0 = 0 , a = m = 9,8 m/s2 , y por lo tanto la velocidad final a
los 400 m. es √
vf = 2ax ≈ 89 m/s = 320, 4 Km/h
Fricción en Fluidos
Por su parte, la descripción del movimiento de un paracaidista la ecuación 10.7 se convierte en
X d p(t) d v(t)
F (v(t)) = −mg + cv 2 = = m = m a(t) , (9.34)
externas
dt dt
con c una constante arbitraria que depende de la forma del cuerpo. Integrando esta ecuación separable se
obtiene
1 − exp − 2gt
vt
v(t) = −vt (9.35)
2gt
1 + exp − vt
Donde hemos definido la velocidad terminal

r
mg
vt =
c

Figura 9.13: Posición del paracaidista respecto al tiempo
como la velocidad que anula la sumatoria de fuerzas y a partir de la cual el cuerpo cae sin aceleración.
El tiempo que tarda en alcanzar esa velocidad es estrictamente para t −→ ∞ , sin embargo, una buena
aproximación que surge de la ecuación 9.35, la constituye: t ≫ vt /2g . La velocidad terminal tı́pica en un dı́a
soleado para un paracaidista de 70 Kg., en posición de “águila extendida”, es 54 m/s. (194,4 Km/h.) y por
lo tanto alcanza la velocidad terminal luego de aproximadamente 15 s. esta situación se aprecia claramente
en la figura 9.12.
Por su parte, la posición surge al integrar la ecuación 9.35

2gt
dy(t) 1 − exp − v t
v(t) = = −vt
dt 1 + exp − 2gt
vt
integrando esta ecuación obtendremos

  
vt 2
y0 − y(t) = vt t + ln   (9.36)
g exp − 2gt + 1
vt
Con el comportamiento gráfico que muestra la figura 9.13.
Fuerzas Elásticas
Otra situación muy conocida se presenta bajo la acción de fuerzas elásticas. Ası́, la ecuación 10.7, ahora
se expresa como
X dv(t)
F (x(t)) = −kx(t) = m = m a(t) ,
externas
dt

Figura 9.14: Trayectoria de la Flecha al abandonar el arco.
Utilizando la “regla de la cadena”

dv(t) dv(t) dx(t) dv(t)
= = v(t)
dt dx(t) dt dx(t)
Se convierte en separable y se integra para obtener la velocidad
r
2 2 dx(t) −k x(t)2 + C0
m v(t) = −k x(t) + C1 ⇒ v(t) = = (9.37)
dt m
La posición será r !
k
x(t) = C1 sen t + C2
m
Para analizar el caso del lanzamiento de una flecha (23 g.) por una arco de 30 lb (134 N) el cual un arquero
puede separarlo 0,72 m. se obtiene la velocidad de salida de la flecha como
r s
134
k 0,72
vf = d = 0, 72 = 65 m/s
m 23 × 10−3
Es interesante mencionar que en 100 m la flecha baja una distancia de ≈ 11 m. ¡!
Sistemas de Masa Variable

Otro de los ejemplos interesantes es la evolución de sistemas de masa variable. El primero de los caso
tiene que ver con una barca de masa m0 que tiene una velocidad inicial v0 en su navegar, comienza a llover y
se va llenando de agua. El agua se acumula con una tasa σ (masa por unidad de tiempo). Se pide encontrar
la velocidad de la barca como función del tiempo.
P = mv = const = m0 v0

dm
si dt = σ = cont ⇒ m (t) = m0 + σt y consecuentemente
m0
v (t) = v0
m0 + σt
Un segundo caso tiene que ver con una masa M atada a una cadena de densidad lineal de masa ρ. Esta
masa se impulsa hacia arriba con una velocidad inicial v0 . Se pide encontrar el tiempo en que alcanza la
altura máxima. La ecuación de Newton para este caso se puede expresar como
d (mv) dm dv
−P esoM asa − P esocadena = ⇔ −M g − ρxg = v+ m
dt dt dt
o equivalentemente  M
 +xξ= ρ
dp
−gρξ = donde y
dt 
p = mv = ρξ dξ
dt
con lo cual
dp
−gρξp = p ⇒ −gρξmdξ = pdp ⇒ −gρξρξdξ = pdp
dt
 3 
Z ξ Z p M 2
2 2  ξ3 ρ  p2 (m0 v0 )
− gρ ξ dξ = pdp ⇒ gρ2  − = −
M
ρ m0 v0 3 3 2 2
Z
ρξdξ
t − t0 = s
3
ξ3 ( Mρ ) (m0 v0 )2
2gρ2 3 − 3 + 2
Un Cohete en Movimiento
Finalmente el caso más emblemático es el movimiemto de un cohete que consume una fracción importante
de su combustible. Llamemos v la velocidad de cohete para un instante de tiempo t y v ′ la velocidad de salida
de los gases respecto a tierra. Para ese instante t la cantidad de movimiento del cohete es mv un instante dt
más tarde la cantidad de movimiento será
p′ = (m + dm)(v + dv) + (−dm)v ′ = mv + m dv − dm (v ′ − v)

| {z } | {z } | {z }
cohete gases vel. rel.
Entonces el cambio en la cantidad de movimiento será
dp = p′ − p = mdv − vgases dm
y por lo tanto la ecuación de Newton
dv(t) dm X
m(t) − vgases = F
dt dt externas
Despreciando la resistencia del aire y suponiendo la gravedad constante, tendremos
dv(t) vgases dm
− = −g
dt m dt

Figura 9.15: Velocidad del Cohete
integrando
mi
v = v0 + vgases ln − gt
m(t)
si suponemos que el combustible se quema de la forma
dm
m(t) = mi (1 + αt) ↔ = α = cte
dt
La cantidad
dm

E = vgases
dt
se denomina el empuje del cohete.
9.5.6. Modelado de Concentración/Desliemiento de Soluciones

Otro de los problemas tı́picos donde se aplican exitosamente las ecuaciones diferenciales son los problemas
de manejo de concentraci[on de sustancias en soluciones l[iquidas. El principal objetivo, consiste en plantear
el problema en t[ermino del problema de valores iniciales que gobierna el fen[omeno (ecuaci[on diferencial +
condiciones iniciales). Para ello, en este tipo de problemas, siempre utilizaremos la regla intuitiva de
Tasa de Cambio de la Concentraci[on = Tasa de Ingreso − Tasa de Egreso
As[i, tendremos que para un problema t[ipico en el cual inicialmente se encuentran diluidos en un recipiente
(un tanque) y0 gr de una sustancia en V0 litros de un l[iquido. A este tanque le cae otro l[iquido con una
concentraci[on distinta de la misma sustancia a ventrada lit/min, mientras que vsalida lit/min salen del tanque.
Si suponemos que dentro del tanque sucede alg[un proceso de homogenizaci[on de la soluci[on, la pregunta
t[ipica esque queremos saber la cantidad de sustancia que se encuentra en el tanque en un tiempo t. A la

Figura 9.16: Posición del Cohete
concentraci[on de la sustancia en el l[iquido de entrada (gr/lit), en un tiempo t, la denotaremos como C (t)

gr/lit. La figura (9.17) ilustra este proceso.
Para empezar notemos que, en esta situaci[on el volumen no es constante. Por lo tanto, con el mismo
esp[iritu de la “ley de balanceo” que hemos propuesto, si las velocidades de ingreso y egreso son constantes,
nos queda que la variaci[on del volumen inicial viene dada por la diferencia de estas velocidades, esto es
V ′ (t) = ventrada − vsalida ⇒ V (t) = V0 + (ventrada − vsalida ) t
con lo cual tambi[en hemos integrado una ecuaci[on diferencial para encontrar como variar[a el volumen con
el tiempo.
Para la construcci[on de la ecuaci[on diferencial, procedemos de manera similar y si describimos la can-
tidad de sustancia en el tanque como y (t) , nos queda que la tasa de cambio de la cantidad de sustancia en
el tanque ser[a
gr
lit lit y (t) gr
y ′ (t) = ventrada C (t) − vsalida
mı́n lit mı́n V0 + (ventrada − vsalida ) t lit
| {z } | {z }
Tasa de Ingreso Tasa de Egreso
Por lo tanto la ecuaci[on diferencial tomar[a la forma t[ipica de una ecuaci[on diferencial lineal de primer
orden inhomog[enea
vsal
y ′ (t) + y (t) = vent C (t)
V0 + (vent − vsal ) t

Figura 9.17: Soluciones y tanques
que tendr[a por soluci[on

!
−vsal
y0
vsal
! ((−vent + vsal ) t − V0 ) vent − vsal
−
(−V0 ) vent − vsal
| {z }
y (t) = Respuesta a las Condiciones iniciales !
vsal Z t vsal
− ((−vent + vsal ) t − V0 ) −vent + vsal vent C (u) (u (vent − vsal ) + V 0) ent − vsal
v du
0
| {z }
Respuesta a la Exitaci[on externa
N[otese lo gen[erico de esta soluci[on. Por un lado, la concentraci[on de la sustancia, C (t) , en la soluci[on
que entra al sistema es distinta a la concentraci[on de la sustancia presente en el tanque, m[as a[un, puede
ser variable con el tiempo. Por otro lado esta soluci[on presenta una singularidad (un infinito) cuando la
velocidad de ingreso es igual a la velocidad de egreso. Para este caso en el cual el volumen del tanque
permanece constante tendremos que resolver la ecuaci[on diferencial
Z t „v
salida u
« ! vsalida t
′ vsal −
y (t) + y (t) = vent C (t) ⇒ y (t) = C (u) ventrada e V du + y0 e V
V0 0
Tal y como hemos mencionado varias veces (y seguiremos mencionando) la soluci[on general para una ecua-
ci[on diferencial inhomog[enea se compone de dos soluciones, la soluci[on de la ecuaci[on diferencial homg[enea
m[as la soluci[on de la inhomog[ena.
ygeneral (x) = yhomog[enea (x) + yinhomog[enea (x)

Este ejemplo nos permite constatar el sentido cada una de estas soluciones, vale decir
vsalida t vsalida t Z t „v «
salida u
− −
y (t) = y0e V +e V C (u) ventrada e V du
| {z } 0
Respuesta a las Condiciones Iniciales | {z }
Respuesta a la Exitaci[on externa
En esta es una visi[on que debemos conservar, en general para todas las ecuaciones lineales inhomog[eneas
independientes del orden de la ecuaci[on diferencial, as[i recordando, dada una ecuaci[on diferencial y su
soluci[on tal que se cumple la condici[on inicial y (0) = y0 entonces siempre es posible
Rx Rx
Z x R
d
y (x) + p (x) y (x) = g (x) ⇔ y (x) = y0 e 0 −p(u)du + e 0 −p(u)du g (u) e p(u)du du
dx | {z } 0
soluci[on homg[enea | {z }
Soluci[on inhomog[enea
donde ahora vemos claramente que la soluci[on de la homog[enea da cuenta a las condiciones iniciales del
proceso y la soluci[on de la inhomog[enea provee la respuesta a la exitaci[on externa al sistema.
Este comportamiento de las soluciones es [util si nos planteamos que al tratar de “limpiar” una piscina,
a la cual le hemos añadido el doble de la cantidad de sulfatos permitida, y queremos saber cuanto tiempo
tenemos que mantener abierta una entrada de 120 lits/min de agua sin sulfatos y la salida de la piscina que
responde a 60 lits/min. La piscina en cuesti[on tiene 20 m de longitud, 10 m de ancho y 2 m de profundidad.
Siguiendo los pasos anteriormente planteados, tendremos que
 
lit
60
vsal  mı́n 
y ′ (t) + y (t) = 0 ⇒ y ′ (t) + y (t) 
  =0
V0 + (vent − vsal ) t 5
lit 
4 × 10 lit + (120 − 60) t
mı́n
 
lit
 60 
mı́n y0
y ′ (t) + y (t) 
  = 0 ⇒ y (t) = 20000 3t + 20000
lit
4 × 105 lit + 60 t
mı́n
3
donde el volumen es V = 400m3 = 400 (100cm) = 4 × 108 cm3 = 4 × 108 10−3 lit = 4 × 105 lit.
Con lo cual el tiempo para que la cantidad final decaiga a la mitad de la inicial surge de
2y0
y0 = 20000 ⇒ t ≈ 6,666, 66 minutos !!!!!
3t + 20000

Bibliografı́a
[1] M. L. Abell y J. P Braselton (1994) Differential Equations with MAPLE V (Academic Press, New
York).
[2] F. Ayres (1952) Differential Equations. (Shaum’s Series McGraw-Hill, New York) (Existe Traduc-
ción).
[4] W. E. Boyce y R.C. DiPrima. Elementary Differential Equations and Boundary Problems. (8th
Edition) John Wiley, New York, 2004. (Existe Traducción)
[5] C. H. Edwards, D. E. Penney (2003) Elementary Diffential Equations with Boundary Value
Problems (Prentice Hall, Englewood Cliff, N.J:)
[6] L. Elsgoltz (1969) Ecuaciones Diferenciales y Cálculo Variacional. (Mir, Moscú).

[8] A. Kiseliov, M. Krasnov y G. Makarenko (1969) Problemas de Ecuaciones Diferenciales Ordina-
rias. (Mir, Moscú)
[9] The Mathematical Atlas http://www.math-atlas.org/welcome.html

[10] M. Tenenbaun y H. Pollard (1963) Ordinary Differential Equations (Harper and Row, New York)
[12] Weisstein, E. W., MathWorld http://mathworld.wolfram.com/
390
Capı́tulo 10
Ecuaciones Diferenciales Ordinarias

de Orden Superior
391
10.1. Definiciones para comenzar

Definición
La ecuación diferencial
n
X
a0 (x) y(x) + a1 (x) y ′ (x) + · · · + an−1 (x) y (n−1) (x) + an (x) y (n) (x) = F(x) ⇔ ai (x) y (i) (x) = F(x)
i=0
es lineal de orden n . Obviamente,
F(x) = 0 =⇒ Homogénea
F(x) 6= 0 =⇒ InHomogénea
ai (x) = ai = ctes
Definición
Si los coeficientes ai = ctes entonces la ecuación diferencial lineal y homogénea, de orden n , tiene asociada
un polinomio caracterı́stico de la forma
an rn + an−1 rn−1 + · · · + a2 r2 + a1 r + a0 = 0
Las raı́ces de este polinomio indicarán la forma de la solución.

Definición
Si el polinomio caracterı́stico puede factorizarse
(r − m1 )k1 (r − m2 )k2 (r − m3 )k3 · · · (r − ml )kl = 0
entonces diremos que las raı́ces mk1 , mk2 , mk3 , · · · , mkl tienen multiplicidades k1 , k2 , k3 , · · · , kl , respectiva-
mente.
10.2. Homogéneas, Lineales, de Segundo Orden

La ecuación
a y ′′ + b y ′ + c y = 0 ⇔ a r2 + b r + c = 0
tiene asociada ese polinomio caracterı́stico y sus raı́ces m1 y m2 condicionan la solución de la manera siguiente
1. Si m1 6= m2 y m1 y m2 son reales, entonces la solución es
y = C1 em1 x + C2 em2 x
2. Si m1 = m2 y m1 y m2 son reales, entonces la solución es
y = C1 em1 x + C2 xem1 x
3. Si m1 = α + iβ con β 6= 0 y m2 = m1 = α − iβ, entonces la solución es
y = eα x
(C1 cos βx + C2 sen betax)

Figura 10.1: y(x) = 25 e−4x + 53 ex
Figura 10.2: y(x) = C1 e−4x + C2 ex para C1 = {−1, 0, 1} y C2 = {−1, 0, 1}
Ejemplos
La ecuación
y ′′ + 3y ′ − 4y = 0; y(0) = 1 ∧ y ′ (0) = −1 ⇔ r2 + 3r − 4 = (r + 4)(r − 1) = 0
tiene asociado ese polinomio caracterı́stico y por lo tanto tiene como solución general
2 −4x 3 x
y(x) = C1 e−4x + C2 ex y como solución particular y(x) = e + e
5 5
En la figura 10.1 se encuentra graficada esa soluci’on particular. De igual modo, para distintos valores de
C1 = {−1, 0, 1} y C2 = {−1, 0, 1} tendremos las gráficas representadas en la figura 10.2 ¿ Cuáles son las
condiciones iniciales a las cuales corresponden esos valores de las constantes?
Otra ecuación podr’ia ser
y ′′ + 2y ′ + y = 0; y(0) = 1 ∧ y ′ (0) = −1 ⇔ r2 + 2r + 1 = (r + 1)2 = 0
y por lo tanto tiene como solución general
y(x) = C1 e−x + C2 xe−x y como solución particular y(x) = e−x

Figura 10.3: y(x) = e−x
Figura 10.4: y(x) = C1 e−x + C2 xe−x para C1 = {−1, 0, 1} y C2 = {−1, 0, 1}
La gráfica para esta soluci’on est’a representada en la figura 10.3

Para distintos valores de C1 = {−1, 0, 1} y C2 = {−1, 0, 1} tendremos las gráficas representadas en la
figura 10.4. Cabe seguir preguntando ¿ Cuáles son las condiciones iniciales a las cuales corresponden esos
valores de las constantes?
Finalmente, la ecuación
y ′′ + 4y ′ + 20y = 0; y(0) = 3 ∧ y ′ (0) = −1 ⇔ r2 + 4r + 20 = (r + 2)2 + 16 = 0
con las siguientes soluciones r = −2 ± 4i y por lo tanto tiene como solución general

5
y(x) = e−2x (C1 cos 4x + C2 sen4x) y como solución particular y(x) = e−2x 3 cos 4x + sen4x
4
y su representaci’on gr’afica se encuentra en la figura 10.5 y para distintos valores de las constantes
Al igual que en los casos anteriores, para distintos valores de las constantes de integraci’on, tendremos
las gráficas de la figura 10.6


Figura 10.5: y(x) = e−2x 3 cos 4x + 54 sen4x
Figura 10.6: y(x) = e−2x (C1 cos 4x + C2 sen4x) para C1 = {−1, 0, 1} y C2 = {−1, 0, 1}
10.3. Ecuaciones Diferenciales de Orden n

La ecuación
a0 y(x) + a1 y ′ (x) + · · · + an−1 y (n−1) (x) + an y (n) (x) = 0
con ai = ctes tiene asociada un polinomio caracterı́stico de la forma
an rn + an−1 rn−1 + · · · + a2 r2 + a1 r + a0 = 0
el cual condicionará la solución de la siguiente forma
1. Si m es una raı́z real con multiplicidad k ≧ 2 entonces las k soluciones asociadas con m serán de la
forma
emx , xemx , x2 emx , x3 emx , · · · xk−1 emx
2. Si m y m son parejas de soluciones complejas, α±iβ , del polinomio caracterı́stico y tienen multiplicidad
k , entonces las soluciones correspondientes serán
eαx cos βx; eαx senβx; · · · xk−1 eαx cos βx; xk−1 eαx senβx

Ejemplos
La ecuación
24y ′′′ + 2y ′′ − 5y ′ − y = 0 ⇔ 24r3 + 2r2 − 5r − 1 = (3r + 1)(2r − 1)(4r + 1) = 0
consecuentemente con las raı́ces
1 1 1
m1 = − , m2 = , m3 = − ,
3 2 4
y con la solución de la forma
y(x) = C1 e−x/3 + C2 ex/2 + C3 e−x/4
La ecuación
y ′′′ + 3y ′′ + 3y ′ + y = 0 ⇔ r3 + 3r2 + 3r + 1 = (r + 1)3 = 0
con las raı́ces m = −1 con multiplicidad k = 3 y con una solución de la forma
y(x) = C1 e−x + C2 xe−x + C3 x2 e−x
La ecuación
4y (4) + 12y ′′′ + 49y ′′ + 42y ′ + 10y = 0 ⇔ 4r4 + 12r3 + 49r2 + 42r + 10 = (r2 + 2r + 10)(2r + 1)2 = 0
consecuentemente con las raı́ces
1
m1 = −1 + 3i, m2 = −1 − 3i, m3 = − , con multiplicidad 2
2
Entonces la solución es de la forma
y(x) = e−x (C1 cos 3x + C2 sen3x) + C3 e−x/2 + C4 xe−x/2
La ecuación
y (4) + 4y ′′′ + 24y ′′ + 40y ′ + 100y = 0 ⇔ r4 + 4r3 + 24r2 + 40r + 100 = (r2 + 2r + 10)2 = 0
con las raı́ces
m1 = −1 + 3i, m2 = −1 − 3i, con multiplicidad 2.
Entonces la solución es de la forma
y(x) = e−x (C1 cos 3x + C2 sen3x + C3 x cos 3x + C4 xsen3x)
La ecuación
4y ′′′ + 33y ′ − 37y = 0;
con
y(0) = 0; y ′ (0) = −1; y ′′ (0) = 3 ⇔ 4r3 + 33r − 37 = (r − 1)(4r2 + 4r + 37) = 0
consecuentemente con una solución general de la forma
y(x) = C1 ex + e−x/2 (C2 cos 3x + C3 sen3x)
y con la solución particular
8 x 8 19
y(x) = e − e−x/2 ( cos 3x + sen3x)
45 45 45

8 x 8 19
Figura 10.7: y(x) = 45 e − e−x/2 ( 45 cos 3x + 45 sen3x)
10.4. Algunos Métodos de Solución para Ecuaciones Inhomog’eneas

10.4.1. El Wronskiano
Definición: Independencia y Dependencia Lineal.
Sean n funciones f1 (x), f2 (x), f3 (x), f4 (x), · · · fn (x), cuando menos n − 1 veces diferenciables. Entonces,
el conjunto S = {f1 (x), f2 (x), f3 (x), f4 (x), · · · fn (x)}, se dice linealmente dependiente en el intervalo I, si
existen algunas constantes, c1 , c2 , c3 , c4 , · · · cn distintas de cero tal que
n
X
ci fi (x) = c1 f1 (x) + c2 f2 (x) + · · · + cn fn (x) = 0
i=1
Por el contrario, si no existe ninguna constante ci 6= 0, se dirá que S es linealmente independiente.

Definición:Wronskiano
El conjunto S = {f1 (x), f2 (x), f3 (x), f4 (x), · · · fn (x)} de funciones, cuando menos n−1 veces diferenciables,
conforman el Wronskiano,
W (S) = W (f1 (x), f2 (x), f3 (x), f4 (x), · · · fn (x))
a través del siguiente determinante

f1 (x) f2 (x) ··· fn (x)

f1′ (x) f ′
(x) ··· fn′ (x)
2
W (S) = .. .. .. ..
. . . .
(n−1)
f (n−1)
(x) f2 (x) · · ·
(n−1)
fn (x)
1
Si W (S) 6= 0 al menos en un punto dentro del intervalo I, entonces S es linealmente independiente

Definición: Conjunto Fundamental de Soluciones.
El conjunto S = {f1 (x), f2 (x), f3 (x), f4 (x), · · · fn (x)} de n soluciones no triviales a la ecuación diferencial:
a0 (x) y(x) + a1 (x) y ′ (x) + · · · + an (x) y (n) (x) = 0, (10.1)

Se le denomina conjunto fundamental de soluciones. La combinación lineal

n
X
f (x) = ci fi (x) = c1 f1 (x) + c2 f2 (x) + · · · + cn fn (x)
i=1
también es solución de la ecuación diferencial (10.1) y se denomina como solución general de (10.1). Adicio-
nalmente, si los coeficientes ai (x) son continuos en el intervalo abierto I para todo i = 1, 2, · · · , n , entonces
la ecuación diferencial (10.1) tiene un conjunto fundamental de n soluciones linealmente independientes.
Definición: Soluciones Particulares y Generales.
Dada una ecuación diferencial lineal Inhomogénea
a0 (x) y(x) + a1 (x) y ′ (x) + · · · + an (x) y (n) (x) = F(x) (10.2)
Si yp (x) es solución de (10.2) sin constantes arbitrarias, entonces yp (x) se denomina solución particular de
(10.2). De igual modo, se denominará solución general de (10.2) a la suma de la solución, yh (x), de la ecuación
homogénea (10.1) más la solución particular:
y(x) = yh (x) + yp (x)
10.4.2. Métodos de los Coeficientes Indeterminados

Dada la ecuación diferencial
a0 y(x) + a1 y ′ (x) + · · · + an y (n) (x) = F(x) (10.3)
con a0 , a1 , a2 , · · · an coeficientes constantes, el método de los coeficientes indeterminados se puede esque-

matizar de la siguiente manera
1. Resuelva la ecuación diferencial homogénea
a0 y(x) + a1 y ′ (x) + · · · + an y (n) (x) = 0 (10.4)
y obtenga yh (x).
2. Proponga la forma de la solución particular para la ecuación inhomogénea (10.3) siguiendo el siguiente
procedimiento. Dada F (x) = b0 g0 (x) + b1 g1 (x) + · · · + bn gn (x), con los bi coeficientes constantes,
entonces
a) Si F (x) = P (x), un polinomio, es decir gi (x) = xm entonces proponga como solución particular a
yp (x) = A0 + A1 x + A2 x2 + A3 x3 + · · · + Am xm
b) Si gi (x) = xm ekx entonces proponga como conjunto fundamental de soluciones particulares a
yp (x) = ekx (A0 + A1 x + A2 x2 + A3 x3 + · · · + Am xm )
c) Si gi (x) = xm ekx cos βx o gi (x) = xm ekx senβx, entonces proponga como conjunto fundamental
de soluciones particulares a
ekx (A0 + A1 x + A2 x2 + A3 x3 + · · · + Am xm ) cos βx+

yp (x) =
ekx (Ã0 + Ã1 x + Ã2 x2 + Ã3 x3 + · · · + Ãm xm )senβx

3. Determine el valor de los coeficientes Ai al sustituir la solución propuesta yp (x) en (10.3)
4. Construya las solución general y(x) = yh (x) + yp (x)
Ejemplos
y ′′ + 4y ′ + 4y = 4x2 + 6ex
Tiene como solución de la homogénea
yh = (C1 + C2 x) e−2x
y proponemos como solución particular de la ecuación a
yp = (Ax2 + Bx + C) + Dex
sustituimos su expresión en la ecuación y obtenemos
2A + Dex +
4 (2Ax + B + Dex ) +
4 (Ax2 + Bx + C) + Dex +
= 4x2 + 6ex
de donde surge el siguiente sistema de ecuaciones
4A = 4
8A + 4B = 0
2A + 4B + 4C = 0
9D = 6
y de allı́ el valor de los coeficientes

3 2
A = 1; B = −2; C= ; D=
2 3
y con ellos la solución general
3 2 x
y = (C1 + C2 x) e−2x + x2 − 2x + + e
2 3
Ejercicios
1. La ecuación
y ′′ − 3y ′ + 2y = 2x e3x + 3senx
tiene como solución
3 3x 3 9
y = C1 ex + C2 e2x + x e3x − e + senx + cos x
2 10 10
2. La ecuación
y ′′ − 3y ′ + 2y = 2x2 + 3 e2x
tiene como solución
7
y = C1 ex + C2 e2x + + 3x + x2 + 3x e2x
2

10.4.3. Métodos de Variación de los Parámetros

Dada la ecuación diferencial
a0 y(x) + a1 y ′ (x) + · · · + an y (n) (x) = F(x) (10.5)
El método de variación de los parámetros se puede esquematizar de la siguiente manera
1. Resuelva la ecuación diferencial homogénea
a0 y(x) + a1 y ′ (x) + · · · + an y (n) (x) = 0 (10.6)
y obtenga yh (x).
2. Proponga como solución particular
yp = u1 (x) yh1 + u2 (x) yh2
donde las funciones u1 (x) y u2 (x) son funciones a determinar en el método y las y1 y y2 son las
soluciones a la ecuación homogénea (10.6).
3. Sustituya esta solución propuesta en la ecuación (10.5) para obtener, luego de algún nivel de álgebra
elemental
=0
z }| {
u1 (x) (a0 y1 + a1 y1′ + a2 y1′′ ) +
=0
z }| {
u2 (x) (a0 y2 + a1 y2′ + a2 y2′′ ) +
′
a2 (u′1 y1 + u′2 y2 ) + a1 (u′1 y1 + u′2 y2 )
a2 (u1 y1 + u′2 y2′ ) = F(x)
′ ′
de donde surge el siguiente sistema de ecuaciones algebraico

u′1 y1 + u′2 y2 = 0
a2 (u′1 y1′ + u′2 y2′ ) = F(x)
con sus soluciones de la forma

0 y2 0 y2

F (x)
y2′ F (x)
y2′
u′1 = a2 = a2
= G1 (x)
y1′ y2 W (y1 , y2 )
y1 y2′

y1 y 0
0 1
y′ F (x) ′ F (x)
1 a2
y1 a2 (x)
′
u2 = = = G2 (x)
y1′ y2 W (y1 , y2 )
y1 y2′
e integrando se obtienen los coeficientes respectivos,
Z Z
u1 (x) = G1 (x) dx; u2 (x) = G2 (x) dx
para finalmente obtener la solución general

y = C1 y1 + C2 y2 + u1 (x) y1 + u2 (x) y2
nótese que no incorporamos las constantes de integración en la funciones u1 (x) y u2 (x).

Ejemplo:
La ecuación inhomogénea de Cauchy1 -Euler2
a0 y(x) + a1 x y ′ (x) + · · · + an xn y (n) (x) = F(x)
con los ai = ctes, puede ser resuelta por este método. Consideremos una ecuación de orden 2
c y(x) + b x y ′ (x) + a x2 y ′′ (x) = F(x)
La solución de la homogénea se propone como yh = xm por lo tanto

c y(x) + b x y ′ (x) + a x2 y ′′ (x) = 0
c x + b x mxm−1 + a x2 m(m − 1)xm−2 = 0
m
xm (c + bm + am(m − 1)) = 0
por lo tanto
am2 + (b − a)m + c = 0
con p
−(b − a) ± (b − a)2 − 4ac
m=
2a
por lo tanto
1. Si m1 6= m2 y ambas reales, entonces la solución de la homogénea será
yh = C1 xm1 + C2 xm2
2. Si m1 = m2 y ambas reales, entonces la solución de la homogénea será
yh = xm1 (C1 + C2 ln x)
3. Si m1 = m2 = α + iβ , entonces la solución de la homogénea será
yh = xα (C1 cos(β ln x) + C2 sen(β ln x))
Ahora para lograr la solución de la inhomogénea suponemos el caso m1 6= m2 por lo tanto
y1h = xm1 y2h = xm2

0 xm2 0 xm2
F (x) F (x)
m2 xm2 −1 m2 xm2 −1
a x2 a x2
u′1 =
= = G1 (x)
xm1 xm2 W (y1 , y2 )
m1 x m1 −1
m2 x m2 −1

xm1 0 xm1 0

m1 xm1 −1 F (x) m 1 xm1 −1 F (x)
a x2 a x2
u′2 = =
= G2 (x)
xm1 xm2 W (y 1 , y2 )
m1 xm1 −1 m2 xm2 −1
1 Louis Augustin Baron de Cauchy (1789-1857). Matemático francés, uno de los creadores del análisis matemático
moderno. Estudió, entre otras cuestiones, los criterios de convergencia de series, las funciones de variable compleja y los sistemas
de ecuaciones diferenciales
2 Leonhard Euler (1707-1783). Matemático suizo. Destacó en el estudio de diversas cuestiones del cálculo logarı́tmico y
diferencial, ası́ como de las series algebraicas y la trigonometrı́a.

La siguiente ecuación diferencial

1
x2 y ′′ − xy ′ + 5y =
x
tiene como solución de la homogénea
yh = x (C1 cos(2 ln x) + C2 sen(2 ln x))
la solución particular por el método de variación de los parámetros queda como
yp = u1 (x) yh1 + u2 (x) yh2
calculando los coeficientes respectivos en donde el Wronskiano
W (x cos(2 ln x); x sen(2 ln x)) = 2x
por lo cual los coeficientes quedan

Z Z
xsen(2 ln x) x1 1
u1 = G1 (x) dx = dx = cos(2 ln x)
2x 4
Z Z
x cos(2 ln x) x1 1
u2 = G2 (x) dx = dx = sen(2 ln x)
2x 4
finalmente las solución particular será

1 1 1
yp = x cos2 (2 ln x) + sen2 (2 ln x) = x
4 4 4
y la general
1
y = x (C1 cos(2 ln x) + C2 sen(2 ln x)) + x
4
10.4.4. Métodos de Reducción de Orden

Este método supone, por lo tanto
a0 (x) y(x) + a1 (x) y ′ (x) + a2 (x) y ′′ (x) = F(x)
tendrá como primer solución no trivial para la ecuación homogénea, yh1 (x), entonces la segunda solución
vendrá dada por Z
yh2 (x) = yh1 (x) u(x) dx
donde u(x) es la función incógnita a determinar. Sustituyendo esta expresión en la ecuación homogénea se
obtiene
=0
z }| {Z
′ ′′
(a0 (x) y1 (x) + a1 (x) y1 (x) + a2 (x) y1 (x)) u(x) dx+
+a2 (x) y1 (x) u′ (x) + (2a2 (x) y1′ (x) + a1 (x) y1 (x)) u(x) = 0
resolviendo la ecuación diferencial para u(x) tendremos que:
Z
a1
− a2 dx
e
u(x) =
y12

La ecuación
x+1
(x − 1)y ′′′ + 2y ′′ =
2x2
tiene como solución y1 = C1 x + C2 y como solución general
1
y = C1 x + C2 + C3 ln |x − 1| + x ln |x|
2
10.5. Algunas Aplicaciones de las Ecuaciones de Orden Superior

10.5.1. Mecánica y Electricidad
Una de las más famosas ecuaciones diferenciales, lineales, ordinaria con coeficientes constantes es
d2 u du
α ü + β u̇ + γ u ≡ α 2
+β + γ u = Λ (t)
dt dt
La cual utiliza para describir sistemas mecánicos y toma la forma


 dxx ⇒ Desplazamiento



 ⇒ Velocidad
d2 x dx  dt
m ⇒ masa
m 2 +η + k x = F (t) donde
dt dt 
 η ⇒ Constante de Amortiguamiento



 k ⇒ Constante Elástica

F (t) ⇒ Fuerza Aplicada
y circuitos eléctricos


 Q ⇒ Carga Eléctrica

 dQ

 dt =I ⇒ Intensidad de Corriente
d2 Q dQ 1 
L ⇒ Inductancia
L +R + Q = E (t) donde
dt2 dt C 
 R ⇒ Resistencia



 C ⇒ Capacitancia

E (t) ⇒ Fuerza Electromotriz
Analicemos la ecuación que describe sistemas mecánicos y dejamos la cual describe sistemas eléctricos para
un análisis posterior. El primero de los casos a analizar será el de las oscilaciones libres, vale decir F (t) = 0,
lo cual en el lenguaje de las ecuaciones diferenciales se traduce a ecuaciones diferenciales homogéneas. En
contraste, si F (t) 6= 0, es decir, el caso inhomogéneo, estaremos describiendo oscilaciones forzadas.
10.5.2. Oscilaciones libres

Analicemos pues del caso del oscilador armónico libre, i.e.
r
d2 x k
m 2 +k x=0 ⇒ x (t) = C1 cos (ω0 t) + C2 sen (ω0 t) con ω0 =
dt m
ω0 se denomina la frecuencia natural de oscilación y C1 y C2 las constantes de integración que se determinan
de las condiciones iniciales. Es claro que

C1 = A cos δ
si ⇒ x (t) = C1 cos (ω0 t) + C2 sen (ω0 t) ⇔ x (t) = A cos (ω0 t + δ)
C2 = A sen δ

Figura 10.8: Oscilador armónico libre. Cambios en la posición inicial no afectan la frecuencia natural.
con R la amplitud y δ en ángulo de fase. Obviamente, el perı́odo del movimiento será

r
2π m
T = = 2π
ω0 k
Ejemplo Como un ejemplo analicemos

q el caso de un sistema en el cual m = 0,1 Kg. y k = 0,4 N/m En
k
este caso la frecuencia angular ω0 = m = 2 rad/sg. La ecuación diferencial que describe este movimiento
será 
x (0) = 1; dx ⇒ x (t) = cos(2t)

 dt t=0 = 0;


d2 x 
+4 x=0 ∧ x (0) = 4; dx =0 ⇒ x (t) = 4 cos (2t)
2  dt t=0
dt 



x (0) = −2; dx dt t=0 = 0 ⇒ x (t) = −2 cos (2t)

x (0) = 0; dx ⇒ x (t) = 21 sen(2t)

 dt t=0 = 1;


d2 x 
+4 x=0 ∧ x (0) = 0; dx = 4; ⇒ x (t) = 2 sen (2t)
2  dt t=0
dt 



x (0) = 0; dx
dt t=0 = −2 ⇒ x (t) = − sen (2t)
10.5.3. Oscilaciones Libres Amortiguadas

Consideremos que en el movimiento actúa una fuerza de amortiguación proporcional a la velocidad, por
lo cual el movimiento viene descrito por
d2 x dx d2 x dx
m + η + k x = + 2µ + ω02 x = 0
dt2 dt dt2 dt

Figura 10.9: Oscilador Armónico Libre. Cambios de velocidad incial no afectan la frecuencia natural
la cual constituye una ecuación diferencial lineal homogénea de segundo orden. Las raı́ces del polinomio
caracterı́stico asociado serán
p r q
−η ± η 2 − 4km η η 2 k
r= =− ± − = −µ ± µ2 − ω02
2m 2m 2m m
por lo tanto la solución será
“ “ √ ” ” “ “ √ ” ”
− µ+ µ2 −ω02 t − µ− µ2 −ω02 t
x (t) = C1 e + C2 e
de donde se deducen los siguientes casos
x (t) = C1 er1 t + C2 er2 t ⇐ µ2 − ω02 > 0 Sobreamortiguado
x (t) = (C1 + C2 t) eµ t
⇐ µ2 − ω02 = 0 Crı́tico
n hp i hp io
x (t) = e−µ t
C1 cos ω02 − µ2 t + C2 sen ω02 − µ2 t ⇐ µ2 − ω02 < 0 Subamortiguado
Ejemplo Como un ejemplo analicemos el mismo caso del sistema anterior en el cual m = 0,1 Kg. y
k = 0,4 N/m, sólo que ahora
q la constante de amortiguamiento será η = 0,60,0,40 y 0,15 En todos los caso la
k
frecuencia angular ω0 = m = 2 rad/sg. y la cantidad subradical µ2 − ω02 corresponderá a los tres casos

Figura 10.10: Oscilaciones libres amortiguadas y no amortiguadas. Nótese que el perı́odo es mayor para el
caso subamortiguado
anteriormente mencionados. Las ecuaciones diferenciales que describen este movimiento serán
 
 x (0) = 0  √ √
d2 x dx
⇒ x (t) = 21 + 2√ 7 ( 5−3)t + 1 − √ 7 −(3+ 5)t
dt2 + 6 dt + 4 x = 0 ∧   5
e 2 2 5
e
dx
dt t=0 = 4
 
 x (0) = 0 
d2 x dx
+4 +4 x=0 ∧ ⇒ x (t) = (1 + 6t) e−2t
dt2 dt  dx 
dt t=0 = 4
 
2
 x (0) = 0  h √ √ i
d x dx − 12 t √9 15 15
+ +4 x=0 ∧ ⇒ x (t) = e sen t + cos 2 t
dt2 dt  dx  15 2
dt t=0 = 4

Si en los casos anteriores cambiamos el signo de la velocidad inicial, i.e. dx
dt t=0 = −4 m/s, tendremos la
siguiente representación gráfica.
√ √
x (0) = 1; dx 1 1 ( 5−3)t + 1 + √ 1 −(3+ 5)t
dt t=0 = −4; ⇒ x (t) = 2 − 2 5 e e
√
2 2 5

dx
x (0) = 1; dt t=0 = −4; ⇒ x (t) = (1 + 2t) e−2t
h √ √ i
dx 1 −7 15 15
x (0) = 1; dt t=0 = −4 ⇒ x (t) = e− 2 t √
15
sen 2 t + cos 2 t
En todos los casos dado que r1 , r2 < 0 se tiene que x (t → 0) → 0. El movimiento subamortiguado es

Figura 10.11: Oscilaciones Libres amortiguadas con cambio de signo en la velocidad inicial
periódico y el perı́odo viene descrito por

2π 2 2 !
ω0 T µ 1 µ
Tam =r 2 = r 2 si << 1 ⇒ Tam ≈ T 1+
ω0 2 ω0
1 − ωµ0 1 − ωµ0
el cual siempre sera mayor que el periodo de oscilación natural del sistema.
10.5.4. Oscilaciones Forzadas

Supongamos ahora que existe una fuerza aplicada al sistema tal que
d2 x dx F0
+ 2µ + ω02 x = cos (̟t)
dt2 dt m
Oscilaciones Forzadas no amortiguadas

En este caso µ = 0 y por lo tanto
d2 x F0
2
+ ω02 x = cos (̟t)
dt m
Amplitud modulada ̟ 6= ω0
y tendrá como solución
F0 F0
x (t) = C1 cos (ω0 t) + C2 sen (ω0 t) + cos (̟t) = A cos (ω0 t + δ) + cos (̟t)
| {z } m (ω02 − ̟2 ) m (ω02 − ̟2 )
homogénea | {z }
inhomogénea

Figura 10.12: Oscilador armónico forzado con ̟ = ω02 Nótese el fenómeno de resonancia
con lo cual es la suma de dos movimientos armónicos con distintas frecuencias y amplitudes. Si el cuerpo
parte del reposo, esto es: x (0) = ẋ (0) = 0 entonces

C1 = m ω−F 0

( 02 −̟2 )  F0
⇒ x (t) = 2 − ̟ 2 ) [cos (̟t) − cos (ω0 t)]

 m (ω 0
C2 = 0
dado que

ω0 − ̟ ω0 + ̟
cos (ω0 t) = cos + t
2 2

ω0 − ̟ ω0 + ̟ ω0 − ̟ ω0 + ̟
cos (ω0 t) = cos cos − sen sen
2 2 2 2

ω0 − ̟ ω0 + ̟
cos (̟t) = cos − t
2 2

ω0 − ̟ ω0 + ̟ ω0 − ̟ ω0 + ̟
cos (̟t) = cos cos + sen sen
2 2 2 2

2F0 ω0 − ̟ ω0 + ̟
x (t) = sen t sen t
m (ω02 − ̟2 ) 2 2
| {z }
Envolvente
Ejemplo El mismo sistema anterior en el cual m = 0,1 Kg. y k = 0,4 N/m, cuando parte del reposo
desde el origen de coordenadas y existe una fuerza de excitación F = 0,5 cos (3t) . Por lo tanto la ecuación

Figura 10.13: Oscilador armónico forzado. Nótese la envolvente de la función
diferencial que describe el movimiento sera

 
 x (0) = 0 
d2 x 1 5
+ 4 x = 5 cos (3t) =⇒ x (t) = cos(2t) − cos(3t) ≡ 2 sen t sen t
dt2  dx  | {z } | {z } 2 2
dt t=0 = 0 homogénea inhomogénea | {z }
envolvente
Resonancia ̟ = ω0
En el caso que la frecuencia de la fuerza de excitación coincida con la frecuencia natural del sistema, se
tiene
d2 x F0
+ ω02 x = F0 cos (ω0 t) =⇒ x (t) = C1 cos (ω0 t) + C2 sen (ω0 t) + t sen (ω0 t)
dt2 2mω0
| {z }
envolvente
Ejemplo El sistema anterior (m = 0,1 Kg. y k = 0,4 N/m), cuando parte del reposo desde el origen
de coordenadas y existe una fuerza de excitación F = 0,5 cos (2t) . Por lo tanto la ecuación diferencial que
describe el movimiento sera
 
d2 x  x (0) = 0  5t
+ 4 x = 5 cos (2t) ∧ =⇒ x(t) = sen (2t)
dt2  dx  4
dt t=0 = 0
10.5.5. Oscilaciones Forzadas amortiguadas

En este caso µ 6= 0 y por lo tanto
d2 x dx F0
2
+ 2µ + ω02 x = cos (̟t)
dt dt m

Figura 10.14: Carga en función del tiempo en un circuito RLC sometido a un voltaje constante. Nótese que
el sistema alcanza el régimen estacionario cercano a los 0,3 sg
la cual tendrá como solución

“ “ √ ” ” “ “ √ ” ” !
− µ+ µ2 −ω02 t − µ− µ2 −ω02 t F0 ω02 − ̟2 cos (̟t) + 2µ̟ sen (̟t)
x (t) = C1 e + C2 e + 2 2
m (ω02 − ̟2 ) + (2µ̟)
una vez más se puede convertir en
“ “ √ ” ” “ “ √ ” ”
− µ+ µ2 −ω02 t − µ− µ2 −ω02 t F0 cos (̟t − ζ)
x (t) = C1 e + C2 e + q
| {z } m 2 2 2
solución homogéne ≡régimen transitorio (ω0 − ̟2 ) + (2µ̟)
| {z }
solución inhomogénea ≡ régimen estacionario
donde
ω02 − ̟2 2µ̟
cos (ζ) = q y sen (ζ) = q
2 2 2 2
(ω02 − ̟2 ) + (2µ̟) (ω02 − ̟2 ) + (2µ̟)
Es claro que el término homogéneo en todos sus casos (sobreamortiguado, crı́tico y subamortiguado) tiende a
cero, por ello se considera un término transitorio, no ası́ el término inhomogéneo que permanece oscilando. En
términos Fı́sico se pude decir que el término transitorio representa la disipación de la energı́a inicial que se le
provee al sistema a través de la posición y la velocidad inicial de lanzamiento. Esta energı́a inicial se expresa
a través de las condiciones iniciales se disipa. Si no existiera disipación esta energı́a inicial permanecerı́a por
siempre en el sistema. Finalmente el término inhomogéneo, a través de la fuerza de excitación, impone el
movimiento al sistema. Nótese además que el termino inhomogéneo nunca se hace infinito, ni siquiera para el
caso para el cual tiene un máximo y es aquel en el cual la frecuencia de excitación coincide con la frecuencia
natural del sistema.
1
Ejemplo En un circuito RLC, cuyos componentes son L = 1 henry, R = 40 ohmios y C = 40000 faradios, se
le aplica un tensión de V = 24 voltios. Determine el comportamiento de la carga y la intensidad de corriente
en el circuito.

Figura 10.15: Intensidad en un circuito RLC sometido a un voltaje constante.
La ecuación diferencial que describe el comportamiento del sistema
d2 Q (t) dQ (t) 1 d2 Q (t) dQ (t) 1

L 2
+R + Q = E (t) ⇒ 2
+ 40 + 40000 Q (t) =
dt dt C dt dt 2
d2 I (t) dI (t) 1 dE (t) d2 I (t) dI (t)
L +R + I (t) = ⇒ + 40 + 40000 I (t) = 0
dt2 dt C dt dt2 dt
tomando en cuenta las condiciones iniciales tendremos como solución
  h √ √ √ i
Q (0) = 10−4  1 −20t 47 11 7

  Q(t) = 8000 + e
 2640000 sen 1160t + 8000 cos 1160t
⇒ h
I (0) = dQ

= 10−2 
 
 √ √ √ i
dt  I (t) = dQ = e−20t 1 cos 1160t − 37 11 sen 1160t
t=0 dt 100 6600
Si en vez de un tensión constante de 0,5 V. la fuente de tensión es sinusoidal de la forma E (t) =

1
2 cos (180t) voltios las ecuaciones se transforman en

d2 Q dQ 1 −4 dQ
+ 40 + 40000 Q = cos (180t) con Q (0) = 10 ∧ I (0) = = 10−2
dt2 dt 2 dt t=0
d2 I dI
2
+ 40 + 40000 I = −90sen (180t)
dt dt
con sus correspondientes soluciones a las condiciones iniciales del sistema
( " √ # )
1 √ √
−20t 293 11 91 9 19
Q(t) = e sen 60 11t + cos 60 11t − cos (180t) + sen (180t)
1000 30140 685 274 548
( " # )
1 √ 2461√11 √
−20t 103 81 171
I(t) = e cos 60 11t − sen 60 11t + sen (180t) + cos (180t)
100 274 3014 137 274

Figura 10.16: Carga en función del tiempo en un circuito RLC sometido a un voltaje sinusoidal V (t) =
1
2 cos (180t) . Nótese el régimen transitorio (0 ≤ t . 0,17) y estacionario (t & 0,17) .
Por analogı́a con el caso mecánico procedemos a identificar cantidades


2µ = R L  V0 1
⇒A= q = √
1  1 2 2 2 ̟ − 78400̟2 + 1600000000
4
ω02 = LC L LC − ̟
2 + R
L̟
con ello se puede ver la funcionalidad de la amplitud con la frecuencia excitatriz
10.5.6. Movimiento alrededor de un punto de equilibrio

La fuerza elástica F = −k x más allá de ser el caso más simple, representa la primera aproximación al
movimiento alrededor de un punto de equilibrio estable. Si recordamos que para una fuerza que derive de un
potencial
dV d 12 k x2
F =− ⇒ F = −k x = −
dx dx
mas aun, un punto de equilibrio estable se define aquel en el cual no existen fuerzas externas, vale decir

dV
F |x=x0 = 0 ⇒ − =0
dx x=x0
por lo cual, dado un potencial de una fuerza arbitraria siempre podemos expandirlo en series de Taylor
alrededor de un punto de equilibrio x = x0

dV 1 2 d V
2
1 3 d V
3
V (x) = v (x0 ) + (x − x0 ) + (x − x ) + (x − x ) ···
dx x=x0 2! dx2 x=x0 3! dx3 x=x0
0 0
| {z }
=0

1
Figura 10.17: Intensidad de corriente en un circuito RLC sometido a un voltaje sinusoidal V (t) = 2 cos (180t)
Ası́, en general, alrededor de un

punto de equilibrio x = x0 la primera aproximación de una función potencial
1 2 2 2
seraV (x) ≈ 2! (x − x0 ) ddxV2 ≈ 21 k (x − x0 ) . Ası́, un potencial de la forma
x=x0
1 6 35 50
V (x) = x − 2x5 + x4 − x3 + 12x2
6 4 3
Solución: x5 − 10x4 + 35x3 − 50x2 + 24x Solución: que genera una fuerza
dV (x)
F =− = − x5 − 10x4 + 35x3 − 50x2 + 24x
dx
tendrá dos puntos de equilibrio x = 0 y x = 4. En torno a x = 0 se podrá aproximar con un potencial
parabólico
2 d V (x)
2
1
Ṽ (x) = (x − x0 ) = 12x2
2! dx2 x=x0
tal y como se observa gráficamente
10.5.7. Péndulo Simple con desplazamiento finito.

El caso tı́pico de esta aproximación lo constituye el péndulo simple: una masa m, empotrada a una
varilla, de masa despreciable y de longitud L. La varilla se desplaza un ángulo θ de la vertical y se suelta.
La Figura (10.20) muestra el diagrama de cuerpo libre del Péndulo Fı́sico. Desde la ancestral fı́sica general,
aún en secundaria, era proverbial resolver este problema suponiendo ángulos pequeños. En esas tempranas
épocas de nuestro conocimiento de Fı́sica era limitado y más limitado aún era nuestra capacidad para resolver
ecuaciones diferenciales. A este “problema” se le conoce con el péndulo fı́sico. Como siempre, aproximar es un
arte y exploremos este arte. Como norma general tendremos que se debe aproximar al final. Pero no siempre.
Si suponemos un cuerpo de masa constante, m, las ecuaciones diferenciales que describen el movimiento no

Figura 10.18: Amplitud como función de la frecuencia excitatriz. Nótese el máximo de la amplitud cuando
el sistema entra en resonancia, i.e. ̟ = ω0
pueden ser otras que aquellas que provengan de las ecuaciones de Newton
X −−−−−−−− −−−→ −−−−→

−→ −−
→ d mv(t) −−→
F (r(t), v(t), t) = = m a(t) = m (ar ûr + aθ ûθ ) , (10.7)
externas
dt
Es bueno recordar que hay que expresar la aceleración en un sistema de coordenadas móviles (ûr , ûθ ).
Esto es
dûr dθ (t) dθ (t)
ûr = cos (θ)ı̂+ sen (θ) ̂ =⇒ = (− sen (θ)ı̂+ cos (θ) ̂) = ûθ = θ̇ (t) ûθ
dt dt dt
dûθ dθ (t) dθ (t)
ûθ = − sen (θ)ı̂+ cos (θ) ̂ =⇒ = − (cos (θ)ı̂+ sen (θ) ̂) =− ûr = −θ̇ (t) ûr
dt dt dt
con lo cual
d (r (t) ûr )
~r (t) = r (t) ûr =⇒ ~v (t) = = ṙ (t) ûr + r (t) θ̇ (t) ûθ
dt
y
d ṙ (t) ûr + r (t) θ̇ (t) ûθ
~a (t) = = r̈ (t) − r (t) θ̇2 (t) ûr + 2ṙ (t) θ̇ (t) + r (t) θ̈ (t) ûθ
dt
es claro que si r (t) = L = cte =⇒ṙ (t) = ~v (t) = r̈ (t) = ~a (t) = 0
d (Lûr )
~r (t) = Lûr =⇒ ~v (t) = = Lθ̇ (t) ûθ
dt
y
d Lθ̇ (t) ûθ 2
~a (t) = = −L θ̇ (t) ûr + Lθ̈ (t) ûθ
dt

Figura 10.19: Aproximación por una parábola en torno a x = 0
Ası́, y para este caso particular, las ecuaciones de Newton quedan como

 m ar ≡ −mLθ̇2 (t) = −T + mg cos (θ)
~
m ~a = T + m ~g =⇒ (10.8)

m aθ = mLθ̈ (t) = −mg sen (θ) .
El caso que todos nos aprendimos de memoria, proviene de la suposición θ ≈ sen (θ) ≪ 1 que implica:

 mLθ̇2 (t) = −T + mg
~
m ~a = T + m ~g =⇒ (10.9)

mLθ̈ (t) = −mgθ.
con lo cual, ahora, en este curso, sabemos que lo podemos integrar inmediatamente. Si suponemos que parte
del reposo: θ̇ (0) = 0 y θ (0) = θ0
r r r
g g g
Lθ̈ (t) = −gθ (t) =⇒θ (t) = C1 sen t + C2 cos t =⇒θ (t) = θ0 cos t
L L L
y el perı́odo puede ser integrado
r
g 2 g 2 g 2
θ̇ (t) θ̈ (t) = − θ (t) θ̇ (t) =⇒Etotal ∝ cte = θ̇ (t) + 2 θ (t) =⇒θ̇ (t) = (θ − θ2 ) (10.10)
L L L 0
que no es otra cosa que la energı́a total del sistema. Por lo tanto sabemos que en el instante inicial, si soltamos
la masa desde un ángulo θ0 , la energı́a total es puramente potencial. Es decir

1
Etotal = Epotencial = mgL (1 − cos (θ0 )) = 2mgL sen2 θ0 (10.11)
2
por otro lado, de la ecuación (10.10) podemos obtener el perı́odo de oscilación para el Péndulo Fı́sico
linealizado: r !
g 2 1 θ
ω = θ̇ (t) = (θ − θ2 ) =⇒T = p g arctan p 2
L 0 L θ0 − θ 2

Figura 10.20: Diagrama de Cuerpo Libre, del Péndulo Fı́sico
Este caso también se conoce con el nombre de oscilador armónico simple o péndulo fı́sico linealizado.
Igualmente podemos analizar el caso de general del péndulo amortiguado forzado linealizado. Vale decir,
una masa, m,atada a una varilla sin masa de longitud L,y que oscila, inmersa en un fluido que la frena el
movimiento de la masa con una fuerza, −η ~v (t) y que adicionalmente está excitada por una fuerza exterior
F (t) = F0 cos (̟t) . Recordamos que en este caso la ecuación en la dirección tangente (ûθ ), es
d2 θ (t) dθ (t) d2 θ (t) dθ (t) F0

mL +η + mg θ (t) = F0 cos (̟t) =⇒ + 2µ + ω02 θ (t) = cos (̟t)
dt2 dt dt2 dt mL
r
η g
donde, por costumbre, hemos rebautizado las constantes tales que µ = y ω0 = .
2mL L
Por lo tanto, su solución tendrá la forma
“ “ √ ” ” “ “ √ ” ”
− µ+ µ2 −ω02 t − µ− µ2 −ω02 t F0 cos (̟t − ζ)
θ (t) = C1 e + C2 e + q
| {z } mL 2 2
solución homogéne ≡régimen transitorio (ω02 − ̟2 ) + (2µ̟)
| {z }
solución inhomogénea ≡ régimen estacionario
donde
ω02 − ̟2 2µ̟
cos (ζ) = q y sen (ζ) = q
2 2 2 2
(ω02 − ̟2 ) + (2µ̟) (ω02 − ̟2 ) + (2µ̟)
Hemos aprendido que dependiendo del valor de los coeficientes de la ecuación caracterı́stica del Péndulo
Fı́sico amortiguado libre (F0 = 0) se derivan tres casos posibles:
Subamortiguado: µ2 − ω02 < 0

Sobreamortiguado: µ2 − ω02 > 0

Figura 10.21:
√ Evolución θ (t) vs t del Péndulo Fı́sico libre, para distintos valores de la velocidad inicial
V0 = 3, 5, 40, 7, 8.
Crı́tico µ2 − ω02 = 0
En el caso del Péndulo Fı́sico amortiguado forzado (F0 6= 0) la fı́sica se hace mucho más rica y pueden
2 2
ocurrir fenómenos de resonancia cuando ω02 − ̟2 + (2µ̟) → 0.
Es interesante considerar los gráficos tanto de la evolución del sistema en el espacio directo: θ (t) vs t;
como la evolución del sistema en el espacio de fases ω = θ̇ (t) vs θ (t) . Las figuras (10.23) y (10.25) muestran
la primera de estas evoluciones, es decir, la evolución del ángulo en el espacio directo. Las figuras (10.24) y
(10.26) muestran la evolución del sistema en el espacio de fases. Es claro de la ecuación (10.10), en la cual
aparece ω = θ̇ (t) = θ̇ (θ (t)) ,que las curvas en el diagrama de fase tanto para el caso libre (figura (10.22))
como para los de los casos amortiguados (figuras (10.24) y (10.26)) corresponden a curvas de misma energı́a.
En el caso del Péndulo Fı́sico linealizado libre, corresponden a curvas de energı́a constante. en los otros casos
el sistema va disipando energı́a debido al coeficiente de amortiguación.
Nótese que la disipación obliga al sistema a evolucionar al punto de equilibrio siguiendo trayectorias es-
pirales en el espacio de fases. Claramente más rápidamente en el caso sobreamortiguado que en el subamor-
tiguado. También sabemos que para el caso crı́tico (µ2 − ω02 = 0) el tiempo de evolución del sistema hasta
llegar al punto de equilibrio será menor que en cualquiera de los casos sobreamortiguados. Dejamos al lector
la comprobación de esta última afirmación.
Hemos aprendido que dependiendo del valor de los coeficientes de la ecuación caracterı́stica del Péndulo
Fı́sico amortiguado libre (F0 = 0) se derivan tres casos posibles:
Ahora bien, la situación que nos interesa simular es la del péndulo fı́sico para los casos en los cuales los
ángulos de oscilación no necesariamente sean pequeños.
Denominaremos péndulo libre al caso en el cual no recurriremos a ninguna aproximación respecto al
ángulo de oscilación. Recordemos que para este caso partimos de la ecuación (10.8) en la dirección tangente.
Es decir
!
2
g θ̇ (t) g
Lθ̈ (t) = −g sen (θ) =⇒ θ̇ (t) θ̈ (t) = − sen θ (t) θ̇ (t) =⇒ Etotal ∝ cte = − cos θ (t)
L 2 L

Figura 10.22: Digrama de Fase para el Oscilador Armónico Simple. Nótese que el punto de equilibrio es el
origen de coordenadas.
Al igual que en la ecuación en la dirección tangente linealizada (10.10), nos encontramos con la Energı́a total
del sistema. Con lo cual Es fácil despejar θ̇ (t) = θ̇ (θ (t)) y construir los diagramas de fases del sistema. Otra
vez, las lı́neas del diagrama de fase serán lı́neas de la misma energı́a. Ası́ podemos graficar
r
2g
θ̇ (t) = ± C + cos (θ (t)) (10.12)
L
g
para distintos valores de la constante C = 4, 01; 4, 1; 6; 8; 10; 20 y para el caso = 4. La Figura (10.27)
L
representa el diagrama de fase para estos casos. Las curvas cerradas (aquellas que tienen los valores de ángulos
y velocidades acotadas) representan oscilaciones del sistema, mientras que las curvas abiertas (aquellas en
las cuales las velocidades están acotadas pero no ası́ el valor del ángulo) representan que el sistema rota.
Nótese que el sistema presenta puntos de equilibrio inestable para θ (t) ≈ ±nπ con n = 0, 1, 2. Lo cual era de
esperarse por cuanto corresponde al ángulo en el cual el sistema varilla-masa se encuentran verticalmente
dispuestos y el peso y la tensión son colineales y se anulan momentáneamente.
Otro enfoque, quizá más intuitivo para resolver este problema, pudo haber sido el análisis energético.
Para ello sabemos que, por ser un sistema conservativo, la energı́a total viene definida por

1 2 1 2 θ (t)
Etotal = mL2 θ̇ (t) + mgL (1 − cos (θ (t))) ≡ mL2 θ̇ (t) + 2mgL sen2
|2 {z } | {z } 2 2
Energı́a Potencial
Energı́a Cinética
por consiguiente
s s
2Etotal 4g θ (t) g θmáx θ (t)
θ̇ (t) = ± − sen2 ≡ ±2 sen 2 − sen 2 (10.13)
mL2 L 2 L 2 2
θmáx

donde hemos sustituido Etotal = 2mL sen2 2 con θmáx el ángulo máximo que alcanza el Péndulo Fı́sico,
por cuanto en ese punto la energı́á total es puramente potencial. Nótese que ese ángulo no necesariamente
es el ángulo inicial, debido a que la velocidad incial puede ser distinta de cero.

g
Figura 10.23: Evolución θ (t) vs t del Péndulo Simple, Subamortiguado ( = 4; µ = 0, 5) libre,para distintos
√ L
valores de la velocidad inicial V0 = 3, 5, 40, 7, 8.
La ecuación (10.13) es claramente integrable por separación de variables y conduce a encontrar la expre-
sión para el perı́odo:
s Z
1 L θ(t) dθ
t= r con − π ≤ θ (t) ≤ π y θ0 = θ (0)
2 g θ0 g
sen2 θmáx
2 − sen 2 θ
2
L
La integral anterior, puede ser transformada en otra que aparece en las tablas integrales, si hacemos sen β =
sen( θ2 )
“ ” , con lo cual
θmáx
sen 2

θ

 sen

 sen β = 2

s Z 
 sen θmáx

 2
L ζ(t) dβ
t= q donde   (10.14)
g ζ(0) 
 sen θ(t)
1 − sen θmáx sen2 β
2
2 
 2


 ζ (t) = arcsin  
 sen θmáx
2
π
Es claro que el recorrido entre ζ (0) = 0 =⇒ θ = 0 a θ = θmáx =⇒ ζ (t) = representa un cuarto del
2
perı́do, por consiguiente el perı́odo total del Péndulo Fı́sico será:
s Z π
L 2 dβ
T =4 q
g 0 1 − sen2 θmáx sen2 β
2

g
Figura 10.24: Evolución θ̇ (t) vs θ (t) del Péndulo Fı́sico Subamortiguado libre ( = 4; µ = 0, 5) en el
√ L
Espacio de Fases para distintos valores de la velocidad inicial V0 = 3, 5, 40, 7, 8. Nótese que la disipación
lleva irremediablemente al sistema al punto de equilibrio, vale decir al origen de coordenadas del espacio de
fases.
10.5.8. Disgresión Elı́ptica

En este punto haremos una disgresión respecto a las integrales elı́pticas, su clasificación y algunas de sus
propiedades. En general encontrarán en la bibliografı́á que las integrales elı́pticas se dividen en
Integrales Elı́pticas de Primera Especie
Z ϕ Z x
dβ dt
F (ϕ\α) = p ⇐⇒ F (x|m) = p con 0 ≤ m ≤ 1
0 1 − sen2 α sen2 β 0 (1 − t2 ) (1 − mt2 )
π
las cuales, para el caso particular ϕ = o x = 1, se puede reacomodar como una Integral Elı́ptica de
2
Primera Especie Completa
Z π Z 1
dβ dt
K (m) = 2 p ≡ p con 0 ≤ m ≤ 1 (10.15)
0
2
1 − m sen β 0 (1 − t ) (1 − mt2 )
2
Integrales Elı́pticas de Segunda Especie

s
Z ϕ p Z x
1 − mt2
E (ϕ\α) = 1 − sen2 α sen2 βdβ ⇐⇒ E (x|m) = dt con 0 ≤ m ≤ 1
0 0 (1 − t2 )
π
y si ϕ = o x = 1, entonces se obtiene una Integral Elı́ptica de Segunda Especie Completa
2
s
Z πp Z 1
2 2
1 − mt2
E (m) = 1 − m sen βdβ ≡ dt con 0 ≤ m ≤ 1
0 0 (1 − t2 )

g
Figura 10.25: Evolución θ (t) vs t del Péndulo Fı́sico Sobreamortiguado ( = 4; µ = 3, 5) libre,para distintos
√ L
valores de la velocidad inicial V0 = 3, 5, 40, 7, 8.
Adicionalmente, y también sin perder generalidad, dado que 0 ≤ m ≤ 1, el denominador de la integral

elı́ptica K (m) de la ecuación (10.15) y equivalentemente de la ecuación (10.14) puede ser expandido en series
de potencias. Con lo cual

1 1 2 3 4 2 2 5 6 3 3 35
p = 1 + sen βm + sen β m + sen β m + sen β m4 + · · ·
8 4
1 − m sen2 β 2 8 16 128

1 1 1 1·3
p = π 1+ sen2 β m + sen4 β m2 +
1 − m sen2 β 2 2 2·4

1·3·5
+ sen6 β m3 + O m4
2·4·6
X∞
1 (2n − 1)!! n
p = m sen2n β
1 − m sen2 β n=0
(2n)!!
y siendo una serie uniformemente convergente puede ser integrada término a término como
Z π Z π X∞ X∞ Z π
dβ (2n − 1)!! n (2n − 1)!! n 2
K (m) = 2 p = 2 dβ 2n
m sen β = m sen2n β dβ
0 1 − m sen2 β 0 n=0
(2n)!! n=0
(2n)!! 0
X∞ ∞ 2
(2n − 1)!! n (2n − 1)!! π π X (2n − 1)!!
K (m) = m · = mn
n=0
(2n)!! (2n)!! 2 2 n=0
(2n)!!

g
Figura 10.26: Fı́sico Sobreamortiguado libre ( = 4; µ = 3, 5) en el Espacio de Fases para distintos valores
√ L
de la velocidad inicial V0 = 3, 5, 40, 7, 8. Nótese que la disipación lleva irremediablemente al sistema al
punto de equilibrio, vale decir al origen de coordenadas del espacio de fases.
Del mismo modo se obtiene para las integrales elı́pticas completas de segunda especie que
Z πp "
X∞ 2 #
2 2
π (2n − 1)!! mn
E (m) = 1 − m sen βdβ = 1−
0 2 n=1
(2n)!! 2n − 1
Finalmente podemos mencionar la relación de “recurrencia” de Legendre para las Integrales Elı́pticas com-
pletas. Ella es
π
E (m) K (1 − m) + E (1 − m) K (m) − K (m) K (1 − m) =
2
Las integrales elı́pticas de primera y segunda especie, incompletas y completa deben resolverse numéricamente
y tradicionalmente están tabuladas en algunas tablas integrales 3 . En nuestros dı́ás también pueden ser
resueltas numéricamente utilizando comandos de manipuladores simbólicos4 .
3 Abramowitz, M. y Stegun I.A (1964) Handbook of Mathematical Functions Dover, New York
4 En el caso de MAPLEV se puede proceder directamente evaluando numéricamente la integral (10.14) a través del comando
“ ”
evalf(int(...)) o mediante la función de biblioteca EllipticF(z,k) donde z= β es al argumento del seno y k= sen θ20 el
parámetro (consulte la ayuda de MAPLE para más detalles).

Figura 10.27: Diagrama de Fase para el Péndulo Fı́sico.
10.5.9. ¿Cuán buena es la aproximación lineal ?

Utilizando la expansión en serie de la Integral Elı́ptica completa de primera especie (10.14) del péndulo
fı́sico, tendremos que se cumple
s Z π s
L 2 dβ L π 2 θmáx
T =4 q =4 F \ sen =⇒
g 0 1 − sen2 θmáx sen2 β g 2 2
2
s
∞ 2 2n
L X (2n − 1)!! θmáx
T = 2π sen
g n=0 (2n)!! 2
2π q
θmáx
más aún, dado que sen 2 = 21 θmáx − 1 3 7
+ O θmáx
48 θmáx + 1 5
y que T0 =
3840 θmáx = 2π Lg tendremos
ω0
s
∞ 2
L X (2n − 1)!! 1 1 3 1 5 7
2n
T = 2π θmáx − θmáx + θ + O θmáx =⇒
g n=0 (2n)!! 2 48 3840 máx

1 2 11 4
T ≈ T0 1 + θmáx + θmáx
16 3072
y si realizamos un estimado de las correcciones al problema lineal que conlleva esta expansión veremos que
π
aún para ángulos θmáx = las correcciones son del orden de un pı́rrico 4 %, con lo cual la aproximación
4
lineal resulta bien razonable. Para ángulos θmáx & 1 las correcciones comienzan a ser significativas y todo
este esfuerzo de integración empieza a tener sentido. La siguiente tabla da una idea más clara de este cambio
en el perı́odo del pénulo y los errores relativos porcentuales respecto al perı́odo del péndulo fı́sico linealizado
2π
T0 = ,cuando se considerán distintos valores del ángulo máximo, θmáx
ω0


Figura 10.28: Integración numérica (θ t̃ vs t̃, con 0 ≤ t̃ ≤ 10) del Péndulo Fı́sico, para distintos valores de
dθ(t)
la velocidad angular inicial: = ϕ(t) = 3,5, 3,9, 4, 4,1, 4,5.
dt
2π π π π π π 2π
T0 = = 2,83845 θmáx = θmáx = θmáx = θmáx = θmáx = θmáx =
ω0 12 6 4 3 2 3
T 2,85066 2,88786 2,95191 3,04617 3,35034 3,89685
|T − T0 |
ǫ = 100 0,42821 1,71109 3,84368 6,81916 15,2786 37,1283
T
10.5.10. El Péndulo Fı́sico: Integración Numérica

Tal y como indicamos en la primera sección de este proyecto, procedemos a convertir una ecuación de
segundo orden en un sistema de ecuaciones diferenciales de dos ecuaciones diferenciales de primer orden. Ası́,
del mismo modo que en la ecuación (??) podremos escribir:

 dθ(t) = ϕ(t)

θ̈ (t) = −ω0 sen (θ) =⇒ dt
 dϕ(t) = −ω0 sen (θ(t))

dt
con lo cual podemos adimensionalizar de dos varias formas, dependiendo de las condiciones iniciales del
t 1 d (·)
movimiento. Si adicionalmente hemos adimensionalizado con t̃ = por lo que 0 ≤ t̃ ≤ 1 y =
t f inal t f inal dt̃
d (·) ϕ dθ(t)
y, adcionalmente: ϕ̃ = , con ϕ0 = 6= 0. De este modo el sistema queda escrito
dt ϕ0 dt t=0
dθ(t) d θ(t̃) d θ(t̃)

= ϕ(t) =⇒ = ϕ0 tf inal ϕ̃(t̃) =⇒ = Λ ϕ̃(t̃)
dt dt̃ dt̃
dϕ(t) d ϕ̃(t̃) ω 2 tf inal d ϕ̃(t̃)
= −ω0 sen (θ(t)) =⇒ =− 0 sen θ(t̃) =⇒ = −Γ sen θ(t̃)
dt dt̃ ϕ0 dt̃

Figura 10.29: Digrama de Fase para el Péndulo Fı́sico
Nótese que las cantidades ϕ̃(t̃), θ(t̃), t̃, Γ y Λ son adminensionales. Acto seguido procedemos a integrar
numéricamente el sistema de ecuaciones5 .
La figura (10.28) ilustra la evoluciı́on del ángulo θ (t) vs t, con 0 ≤ t ≤ 10 del Péndulo Fı́sico, para
dθ(t)
distintos valores de la velocidad angular inicial: = θ̇(t) = ϕ(t) = 3,5, 3,9, 4, 4,1, 4,5. Mientras que la
dt
figura (10.29) (y también la figura (10.27)) representan la evolución del sistema en el espacio de fases. θ (t)
dθ(t)
vs = ϕ(t). Las curvas cerradas en esta gráfica corresponden a las curvas oscilantes de la figura (10.28).
dt
Dado que el sistema parte de θ0 = θ (t = 0) y seleccionamos el nivel de energı́á potencial igual a cero allı́,
1
cada una de estas curvas representan un valor de la energı́á cinética inicial. El caso Ec = mL2 θ̇02 = mg2L
2
corresponde a la separatrı́z, vale decir, la órbita que separa las curvas cerradas de las abierta. Es claro que
en este caso le movil “subirá” y alcanzará un equilibrio inestable en la posición vertical. En la figura (10.28)
este caso viene ilustrado por la curva que se convierte en horizontal 0, 25 ≤ t̃ ≤ 0, 5, luego a partir de t̃ ≈ 0, 5,
la inexactitud del cálculo numérico genera pertubaciones que en teorı́á no debieran existir.
1
Ec = mL2 θ̇02 = mg2L
2
10.6. Transformaciones Integrales

10.6.1. Cálculo Operacional
Toda ecuación diferencial puede ser descrita de la siguiente forma
d
F (x) = f (x) =⇒ DF (x) = f (x) (10.16)
dx
5 En MAPLEV podemos integra el sistema de dos maneras distintas. La primera haciendo uso del coman-
do dsolve({sysED,CI}, numeric, vars, options) donde sysED es el sistema de ecuaciones diferenciales, CI sus
condiciones iniciales. Si necesitáramos un análisis gráfico es mucho más útil el paquete DEtools.

donde D (•) es un operador diferencial lineal
D (Axn + Bxm ) = AD (xn ) + BD (xm ) = nAxn−1 + mBxm−1 (10.17)
y en muchos aspectos ese operador diferencial D (•) puede ser tratado como un número más. A saber, para
una ecuación diferencial genérica con coeficientes constantes se tiene

y ′′ − 3 y ′ + 2 y = x2 =⇒ D2 − 3D + 2 y = x2 =⇒ (D − 1) (D − 2) y = x2 (10.18)
más aún
x2 x2 x2
y= =⇒ y = − (10.19)
(D − 1) (D − 2) (D − 2) (D − 1)
por lo cual expandiendo
1 −1
= = −1 − D − D2 − D3 − D4 − · · · (10.20)
D−1 1−D
1 −1 1 1 D D2 D3
= D
=− − − − − ··· (10.21)
D−2 2 1− 2
2 4 8 16
de donde
1 D D2 D3
y= − − − − − ··· x2 − −1 − D − D2 − D3 − D4 − · · · x2 (10.22)
2 4 8 16
por lo tanto tendremos la solución particular de la ecuación y ′′ − 3 y ′ + 2 y = x2
2
x x 1 x2 3 7
y= − − − − −x2 − 2x − 2 = + x+ (10.23)
2 2 4 2 2 4
Las operaciones que se usaron arriba están relacionadas muy estrechamente con las propiedades de la integral
Z ∞
e−st f (t)dt (10.24)
0
10.6.2. Definiciones para Comenzar

En general vamos a definir una transformación integral, F (s) , de una función, f (t) como
Z b
F (s) = K (s, t) f (t)dt = T {f (t)} (10.25)
a
donde K (s, t) es una función conocida de s y t, denominada el núcleo de la transformación. Si a y b son

finitos la transformación se dirá finita, de lo contrario infinita. Dependiendo de la selección del núcleo y los
limites tendremos distintas transformaciones integrales. En Fı́sica las más comunes son:

Nombre F (s) = T {f (t)} f (t) = T−1 {F (s)}

R∞ 1
R γ+i∞
Laplace F (s) = 0
e−st f (t)dt f (t) = 2πi γ−i∞
est F (s)ds
Z ∞ Z ∞
sen(st) 2 sen(ts)
Fourier de senos y cosenos F (s) = f (t)dt f (t) = π F (s)ds
0 cos(st) 0 cos(ts)
Z ∞ Z ∞
2
Fourier compleja F (s) = ei st
f (t)dt f (t) = π e−i st
F (s)ds
−∞ −∞
Z ∞ Z ∞
Hankel F (s) = tJn (st)f (t)dt f (t) = sJn (ts)F (s)ds
0 0
Z ∞
1
R γ+i∞
Mellin F (s) = ts−1 f (t)dt f (t) = 2πi γ−i∞
s−t F (s)ds
0
La idea detrás de la utilidad de las transformaciones integrales puede resumirse en el siguiente esquema
transformación directa −→ relación para F (s)

EDO para f (t)
F (s) = T {f (t)} eventualmente más fácil
↓ ↓
solución directa solución para F (s)
difı́cil más fácil
↓ ↓
←− transformación inversa
se encuentra f (t) se encuentra F (s)
f (t) = T−1 {F (s)}

10.6.3. Tranformada de Laplace

En nuestro caso ilustraremos el uso de transformaciones integrales con la transformada de Lapla-
ce, que denotaremos de manera simbólica como F (s) = L {f (t)} .La siguiente tabla resume las
transformaciones de algunas funciones.
f (t) = L−1 {F (s)} F (s) = L {f (t)}

1
1 ←→ , s>0
s
1
ea t
←→ , s>a
s−a
a
sen (at) ←→ , s>0
s2 + a2
s
cos (at) ←→ , s>0
s2 + a2
n!
tn n>0 ←→ , s>0
sn+1
Γ (p + 1)
tp p > −1 ←→ , s>0
sp+1
a
sen hat ←→ , s > kak
s2 − a2
s
cosh at ←→ , s > kak
s2 − a2
 a 
  
 

 sen (bt)  
 (s − a)
2
+ b2 

ea t
←→ s > kak
  
 s−a 

cos (bt) 
 

2
(s − a) + b2
n!
tn ea t
n∈ℵ ←→ n+1 , s>a
(s − a)

f (t) = L−1 {F (s)} F (s) = L {f (t)}


 0 t<c
e−c t
uc (t) c>0 ←→ s>0
 s
1 t≥c
uc (t) f (t − c) ←→ e−c t F (s)
ec t
f (t) ←→ F (s − c)
1 s

f (c t) ←→ cF c , c>0
Rt
0
f (t − τ ) g (τ ) dτ ←→ F (s) G (s)
δ (t − c) ←→ e−c s
f (n) (t) ←→ sn F (s) − sn−1 f (0) − · · · − f (n−1) (0)

n
(−t) f (t) ←→ F (n) (s)
10.6.4. Ejemplos Sencillos

Como un ejemplo de lo anterior, encontraremos la solución a las siguientes ecuaciones diferenciales
1. Ecuación diferencial inhomogénea, continua, con valores iniciales


 y(0) = 0
y ′′ + y = sen 2t con (10.26)
 ′
y (0) = 1
2
L {y ′′ + y} = L {sen 2t} ⇒ s2 Y (s) − sy (0) − y ′ (0) + Y (s) = (10.27)
s2 + 4
5 2
s2 + 6 as + b cs + d 3 3
Y (s) = = + = − (10.28)
(s2 + 1) (s2 + 4) s2 + 1 s2 + 4 s2 + 1 s2 + 4
mediante la transformada inversa en cada término
n 5 o 
L−1 s23+1 = 53 sen t  
 5 1
n o ⇒ y (t) = sen t − sen 2t (10.29)
2 
 3 3
L −1 3
s2 +4 = 31 sen 2t 
2. Ecuación diferencial, con valores iniciales, inhomogénea a una función escalón:

 
 1 π ≤ t ≤ 2π  y(0) = 1
y ′′ + 4y = h (t) = con (10.30)
  ′
0 0≤t≤π t 1 2π y (0) = 0
y ′′ + y = h (t) = uπ (t) − u2π (t) ⇒ L {y ′′ + 4y} = L {uπ (t) − u2π (t)} (10.31)
e −πs
e −2πs
⇒ s2 + 4 Y (s) − sy (0) − y ′ (0) = − (10.32)
s s

s e−πs e−2πs
Y (s) = + − (10.33)
s2 + 4 s (s2 + 4) s (s2 + 4)
mediante la transformada inversa
s
L−1 = cos 2t (10.34)
s2 + 4

e−πs 1
L−1 = uπ (t) g (t − π) con g (τ ) = L−1 (10.35)
s (s2 + 4) 2
s (s + 4)
por lo tanto

e−πs 1 1 s 1
L−1 = uπ (t) L−1 − 2 = uπ (t) (1 − cos 2 (t − π)) (10.36)
s (s2 + 4) 4 s s +4 4
del mismo modo

−1 e−2πs 1
L = u2π (t) (1 − cos 2 (t − 2π)) (10.37)
s (s2 + 4) 4
recordemos que hemos definido la función escalón como

 0 t<c
uc (t) c>0 (10.38)

1 t≥c
y finalmente la solución será

1 1
y (t) = cos 2t + uπ (t) (1 − cos 2 (t − π)) − u2π (t) (1 − cos 2 (t − 2π)) (10.39)
4 4
3. Ecuación diferencial, con valores iniciales, inhomogénea a una función impulso (delta de Dirac)

 y(0) = 0
y ′′ + 2y ′ + 2y = δ (t − π) con (10.40)
 ′
y (0) = 0
donde la función (distribución) delta de Dirac viene definida por

Z ∞
δ (t − t0 ) = 0 con t 6= t0 y dτ δ (τ − τ0 ) = 1 (10.41)
−∞
con la útil propiedad de Z ∞

dτ δ (τ − τ0 ) f (τ ) = f (τ0 ) (10.42)
−∞
En una de las tablas anteriores hemos mostrado la transformada de Laplace de la función (distribución)
Delta de Dirac: L {δ (t − c)} = e−c s por lo tanto
y ′′ + 2y ′ + 2y = δ (t − π) ⇒ L {y ′′ + 2y ′ + 2y} = L {δ (t − π)} (10.43)
e−π s 1
s2 + 2s + 2 Y (s) = e−π s
⇒ Y (s) = = e−π s 2 (10.44)
(s2 + 2s + 2) (s + 1) + 1

por lo tanto ( )
1 h i
−1 −π s
y (t) = L e 2 = uπ (t) e−(t−π) sen (t − π) (10.45)
(s + 1) + 1
o también 
 0 t<π
y (t) = (10.46)

e−(t−π) sen (t − π) t≥π
10.6.5. Integral de Convolución

Algunas veces es posible identificar la transformada de Laplace H(s) como el producto de dos transfor-
madas de Laplace, F (s) y G(s) las cuales son las transformadas de funciones conocides f (t) y g(t). Pero
eso es algunas veces: en general la transformada del producto de funciones no es el producto
de transformadas. Esas veces están contenidas en el llamado Teorema de Convolución, según el cual se
establece una especie de “producto generalizado” de funciones f y g.
Teorema de Convolución
Sean
F (s) = L {f (t)} y G(s) = L {g(t)} que existen en el intervalo s > a > 0
Entonces
H(s) = F (s)G(s) = L {h(t)} para s > a
donde Z Z
t t
h(t) = L−1 (F (s)G(s)) = f (t − τ ) g(τ ) dτ = f (τ ) g(t − τ ) dτ = (f ∗ g) (t)
0 0
y h(t) se indentifica como la convolución de f y g. Las integrales arriba expuestas se conocen con integrales
de convolución y hemos denotado h(t) = (f ∗ g) (t) para insistir que se trata de un “producto generalizado”
de funciones f y g. que comparte, con el producto ordinario de funciones, las siguientes propiedades
f ∗g =g∗f (conmutatividad)
f ∗ [g + k] = f ∗ g + f ∗ k (distributividad)
f ∗ [g ∗ k] = [f ∗ g] ∗ k (asociatividad)
f ∗0=0∗f =0
sin embargo f ∗ 1 6= f tal y como se puede apreciar de
Z t Z t
(f ∗ 1) (t) = f (t − τ ) 1 dτ = f (t − τ ) dτ 6= f (t)
0 0
en el caso particular de que f (t) = cos (t) tendremos

Z t
τ =t
(cos ∗1) (t) = cos(t − τ ) 1 dτ = sen (t − τ )|τ =0 = sen (0) − sen (t) = −sen (t)
0
y por la misma razón, no hay garantı́a que (f ∗ f ) (t) > 0 ∀ f 6= 0

El ejemplo más emblemático de la aplicación del Teorema de Convolución es el estudio del oscilador
amortiguado y forzado, el cual viene descrito por la ecuación diferencial

dx  x0 = x(0)
ẍ + 2λ ẋ + ω02 x = f (t) con ẋ = (10.47)
dt 
ẋ0 = dx
dt t=0
la transformada de Laplace nos lleva a
s2 X(s) − sx0 − ẋ0 + 2λ sX(s) − 2λ x0 + ω02 X(s) = F (s) (10.48)
resolviendo
2λ x0 + ẋ0 + sx0 F (s)
X(s) = + 2 (10.49)
s2 + 2λs + ω02 s + 2λs + ω02
el primer sumando queda como
2λ x0 + ẋ0 + sx0 x0 (s + λ) ẋ0 + x0 λ

X1 (s) = = + (10.50)
s2 + 2λs + ω02 2 2
(s + λ) + (ω0 − λ ) (s + λ) + (ω02 − λ2 )
2 2
y por lo tanto devolviendo el cambio

q
ẋ0 + λx0
x1 (t) = x0 e−λt cos ωt + sen ωt con ω = ω02 − λ2 (10.51)
ω
F (s)
X2 (s) = (10.52)
s2 + 2λs + ω02
y por el teorema de convolución
Z t
1 −λ(t−τ )
x2 (t) = e sen ω (t − τ ) f (t) dτ (10.53)
0 ω
y por lo tanto la solución general será

Z t
ẋ0 + λx0 1 −λ(t−τ )
x (t) = x0 e−λt cos ωt + sen ωt + e sen ω (t − τ ) f (t) dτ (10.54)
ω 0 ω
10.7. Sistemas de Ecuaciones Diferenciales

10.7.1. Motivación
Cuando consideramos la evolución de sistemas con varios grados de libertad o con varias partı́culas, na-
turalmente arribamos al tratamiento de sistemas de ecuaciones diferenciales. En estos sistemas encontramos
varias variables dependientes de una sola variable independiente. El más natural de los ejemplos es el caso

de un sistema de partı́culas que se mueve en el espacio bajo la acción de fuerzas externas:

~ dr1 (t) dr2 (t) dr3 (t) drn (t) d2 r1 (t)
F1 r1 (t) , r2 (t) , r3 (t) , · · · rn (t) , , , ··· ,t =
dt dt dt dt dt2
2
F~2 r1 (t) , r2 (t) , r3 (t) , · · · rn (t) , dr1 (t) , dr2 (t) , dr3 (t) · · · drn (t) , t = d r2 (t)
dt dt dt dt dt2
2
F~3 r1 (t) , r2 (t) , r3 (t) , · · · rn (t) , dr1 (t) , dr2 (t) , dr3 (t) · · · drn (t) , t = d r3 (t)
dt dt dt dt dt2
..
.
2
F~n r1 (t) , r2 (t) , r3 (t) , · · · rn (t) , dr1 (t) , dr2 (t) , dr3 (t) · · · drn (t) , t = d rn (t)
dt dt dt dt dt2
~i = P F~i
donde, la función F j expresa la sumatoria de fuerzas externas sobre cada partı́cula, vale decir
j
X
dr1 dr2 drn dr1 dr2 drn
F~1
j r1 , r2 , r3 , , · · · rn ,
, , · · · , t = ~
F 1 r , r
1 2 3, r , , · · · r n , , , · · · , t
j
dt dt dt dt dt dt
X
dr1 dr2 drn ~2 r1 , r2 , r3 , , · · · rn , dr1 , dr2 , · · · drn , t
F~2 j r1 , r2 , r3 , , · · · rn , , ,··· ,t = F
j
dt dt dt dt dt dt
..
.
X
dr1 dr2 drn dr1 dr2 drn
F~n j r1 , r2 , r3 , , · · · rn , , ,··· ~
, t = Fn r1 , r2 , r3 , , · · · rn , , ,··· ,t
j
dt dt dt dt dt dt
Pero igual de importante es la posibilidad de convertir una ecuación diferencial ordinaria de orden superior
...
x(n) (t) = F x(n−1) (t) , x(n−2) (t) , , · · · x (t) , ẍ (t) , ẋ (t) , x (t) , t
haciendo el siguiente cambio variable

...
un = x(n−1) (t) ; un−1 = x(n−2) (t) ; · · · u4 = x (t) ; u3 = ẍ (t) ; u2 = ẋ (t) ; u1 = x (t)
en un sistema de ecuaciones diferenciales
u̇n = Fn (un , un−1 , · · · , u4 , u3 , u2 , u1 , t)

u̇n−1 = x(n−1) (t)
..
.
...
u̇3 = x (t)
u̇2 = ẍ (t)
u̇1 = ẋ (t)

que puede ser generalizado a:
u̇n = Fn (un , un−1 , · · · , u4 , u3 , u2 , u1 , t)

u̇n−1 = Fn−1 (un , un−1 , · · · , u4 , u3 , u2 , u1 , t)
..
.
u̇3 = F3 (un , un−1 , · · · , u4 , u3 , u2 , u1 , t)
u̇2 = F2 (un , un−1 , · · · , u4 , u3 , u2 , u1 , t)
u̇1 = F1 (un , un−1 , · · · , u4 , u3 , u2 , u1 , t)
Para garantizar que existe solución al problema de valores iniciales se debe imponer algunas restricciones
sobre las funciones Fi (un , · · · , u3 , u2 , u1 , t) para ello existen un par de teoremas que garantice esa solución
Teorema 1: Sean las funciones F1 , F2 , · · · Fn y sus derivadas

∂1 F1 , ∂1 F2 , · · · ∂1 Fn , · · · ∂i F1 , ∂i F2 , · · · ∂j Fn · · · ∂n F1 , ∂n F2 , · · · ∂n Fn
continua en una región R del espacio (t, u1 , u2 , · · · un ) que contiene al punto t0 , u01 , u02 , · · · u0n que
caracteriza las condiciones iniciales. Entonces existe un intervalo kt − t0 k < h en el cual existe una
única solución u1 = φ1 (t) , u2 = φ2 (t) , · · · , un = φn (t) ,
∂Fi
Hemos denotado ∂j Fi = como la derivada parcial y u0m = um (t0 ) como las condiciones iniciales.
∂uj
Teorema 2 Sea el siguiente sistema lineal de ecuaciones diferenciales
u̇1 = p11 (t) u1 + p12 (t) u2 + · · · p1n (t) un + g1 (t)

u̇2 = p21 (t) u1 + p22 (t) u2 + · · · p2n (t) un + g2 (t)
..
.
u̇n = pn1 (t) u1 + pn2 (t) u2 + · · · pnn (t) un + gn (t)
Si p11 (t) , p12 (t) , · · · p1n (t) · · · pij (t) · · · pnn (t) y g1 (t) · · · gn (t) son funciones continua en el intervalo
α < t < β que contiene al punto t = t0 entonces existe una única solución que satisface las condiciones
iniciales u0m = um (t0 )
10.7.2. Notación Vectorial

El sistema lineal antes mencionado
u̇1 = p11 (t) u1 + p12 (t) u2 + · · · p1n (t) un + g1 (t)

u̇2 = p21 (t) u1 + p22 (t) u2 + · · · p2n (t) un + g2 (t)
..
.
u̇n = pn1 (t) u1 + pn2 (t) u2 + · · · pnn (t) un + gn (t)
puede condensarse en la siguiente ecuación matricial
u̇ = P (t) u + g (t)

en la cual estamos representando

       
u̇1 p11 (t) p12 (t) · · · p1n (t) u1 g1 (t)
 u̇2   p21 (t) p22 (t) · · · p2n (t)   u2   g2 (t) 
       
u̇ =  .  ; P (t) =  .. .. .. .. ; u = ..  y g (t) =  .. 
 ..   . . . .   .   . 
u̇n pn1 (t) pn2 (t) · · · pnn (t) un gn (t)
con el vector solución de la forma  

φ1 (t)
 φ2 (t) 
 
u = Φ (t) =  .. 
 . 
φn (t)
10.7.3. Sistemas Lineales Homogéneos

Dado un sistema de ecuaciones diferenciales con coeficientes constantes de la forma ẋ = A x procedemos
de manera análoga al caso de una sola ecuación con coeficientes constantes
         
ẋ1 a11 a12 · · · a1n x1 x1 (t) ξ1
 ẋ2   a21 a22 · · · a2n   x2   x2 (t)   ξ2 
        r t 
y ′ = ay !  .  =  . .. .. ..   .  =⇒  ..  = e  .. 
 ..   .. . . .   ..   .   . 
ẋn an1 an2 ··· ann xn xn (t) ξn
con a, aij , ξm constantes. Al sustituir las solución x = ξ er t en la ecuación ẋ = A x obtenemos ξ r er t =

ξ er t por lo cual, el problema se reduce a la búsqueda de los autovalores y autovectores del sistema A x = r ξ
    
a11 − r a12 ··· a1n ξ1 0
 a21 a22 − r · · · a2n     
   ξ2   0 
(A − r 1) ξ = 0 =⇒  .. .. .. .   .  =  . 
 . . . ..   ..   .. 
an1 an2 ··· ann − r ξn 0
Es decir, para resolver el sistema de ecuaciones diferenciales lineales con coeficientes constantes, es necesario
resolver el sistema de ecuaciones algebraico. Como un ejemplo, para el caso

1 1 r t 1−r 1 ξ1 0
ẋ = x si x = ξ e =⇒ =
4 1 4 1−r ξ2 0
por lo cual 
 r1 = 3
1−r 1 2
= (1 − r) − 4 = r2 − 2r − 3 = 0 =⇒
4 1−r 
r2 = −1
de donde !
(1)
(1) (1) (1) ξ1
r1 = 3 =⇒ −2 ξ1 + ξ2 =0 =⇒ ξ = (1)
2ξ1
similarmente !
(2)
ξ1
r2 = −1 =⇒ ξ (2) = (2)
−2ξ1

por lo tanto la solución general del sistema será

x1 1 1
x =c1 x(1) (t) + c2 x(2) (t) ⇐⇒ =c1 e3 t + c2 e− t
x2 2 −2
Obviamente el Wronskiano de esta solución

h i 3t
e e− t
W x (t) , x (t) (t) = 3 t
(1) (2) = −4e−2 t =
6 0
2e −2e− t
garantiza que las dos soluciones son linealmente independientes.

Para el caso de matrices hermı́ticas, A = Az vale decir, que la matriz A coincide con su conjugada y
traspuesta, A =(AT ), todos los autovalores son reales y la solución general para un sistema de n ecuaciones
diferenciales lineales con coeficientes constantes es
x (t) =c1 ξ (1) er1 t + c2 ξ (2) er2 t + · · · + cn ξ (n) ern t
Para el caso particular de matrices simétricas (hermı́ticas reales) los autovalores r1 , r2 · · · rn y los autovectores
ξ (1) , ξ (2) · · · ξ (n) ambos son reales.
Para el caso de matrices A no hermı́ticas, consideremos primero que A sea real. Entonces
 
 r1 = λ + iµ  r1 = r̄2
ẋ = A x =⇒ x = ξ er t =⇒ (A − r 1) ξ = 0 =⇒ =⇒
  (1) ¯(2)
r2 = λ − iµ ξ =ξ
por lo cual ξ (1) = a+ib con a y b vectores reales, entonces
x(1) (t) = (a+ib) e(λ+iµ) t = (a+ib) eλ t (cos µt +isen µt)

x(1) (t) = eλ t (a cos µt − bsen µt) + ieλ t (asen µt + b cos µt)
u(t) v(t)
x(1) (t) = u (t) + iv (t)
Ası́, para el caso que los autovalores de la matriz real, A,sean complejos, r1 = λ + iµ; r2 = λ − iµ complejos
y r3 , r4 · · · rn reales, y los autovectores ξ (1) = a+ib; ξ (2) = a−ib; ξ (3) , ξ (4) · · · ξ (n) la solución general sera
x (t) = c1 u (t) + ic2 v (t) + c3 ξ (3) er3 t + c4 ξ (4) er4 t + · · · + cn ξ (n) ern t
como ejemplo

1 −1 r t 1−r −1 ξ1 0
ẋ = x si x=ξ e =⇒ =
5 −3 5 −3 − r ξ2 0
por lo cual

 
 (1) 1

 ξ =
1−r  r1 = −1 + i  2−i
−1
5 = r2 + 2r + 2 = 0 =⇒ =⇒
−3 − r  


r2 = −1 − i 
 1
 ξ (2) =
2+i

finalmente la solución general sera

cos t sen t
x (t) = c1 e− t
+ ic2 e− t
2 cos t + sen t − cos t + 2sen t
Para el caso que los autovalores de la matriz real, A,estén repetidos r1 = r2 = r3 = · · · = rm = ρ y

rm+1 , · · · rn distintos, la solución general sera
n o
x (t) = tm−1 ζ (m−1) + tk−2 ζ (m−2) + · · · ζ (0) eρt + cm+1 ξ (m+1) erm+1 t + · · · + cn ξ (n) ern t
10.7.4. Sistemas Lineales Inhomogéneos

Todo operador lineal hermı́tico A : V −→ V,con n autovectores distintos, definidos por A |uj i = λj |uj i,
tiene una representación matricial diagonal Âij =λi δij mediante una transformación de similaridad TAT−1 = Â
con T una matriz unitaria T−1 = Tz que trasforma la base de A a la base donde Â es diagonal
T
{|v1 i , |v2 i , · · · |vi i · · · |vn i} =⇒ {|u1 i , |u2 i , · · · |ui i · · · |un i} Este teorema es claro: a partir de que sı́ A tiene
n autovalores distintos, tiene n autovectores linealmente independientes los cuales forman base de V y en la
cual la representación matricial del A es diagonal. Pero como siempre es posible pasar de A no diagonal a
Â a diagonal con los mismos autovalores mediante una transformacion de similidaridad TAT−1 = Â queda
demostrado. Esto puede formalizarse de la siguiente manera
z z z
hvi | T | Tz TAT
| {zT} |vj i = |hvi{z
| {zT}AT T |vj i == hui | Â |uj i = λj hui |uj i = λj δij
}| {z }| {z }
1 1 hui | Â |uj i
Nos queda determinar la forma de la matriz unitaria de transformación T. Para ello seleccionamos la
base canónica {|e1 i , |e2 i , · · · |ei i · · · |en i} como base de partida de A con
       
1 0 0 0
 0   1   0   0 
       
 ..   ..   ..   .. 
 .   .   .   . 
|e1 i =       
 0  , |e2 i =  0  , · · · |ei i =  1  , · · · |en i =  0 

       
 .   .   .   . 
 ..   ..   ..   .. 
0 0 0 1
y {|u1 i , |u2 i , · · · |ui i · · · |un i} la base de autovectores en la cual Â es diagonal. Por lo tanto T es la matriz de
transformación de una base a la otra, identificando columna a columna nos damos cuenta que las columnas
de la matriz T son los autovectores de A
 
Xn Xn
|ui i = Tij |ej i ⇒ hej |ui i = hej  Tij |ej i ⇒
j=1 j=1
 (1) (1) (1)

  (1) (2) (n)

u1 u2 ··· un u1 u1 ··· u1
 (2) (2) (2)   (1) (2) (n) 
 u1 u2 un   u2 u2 u2 
hej |ui i = Tij = 
 .. ..

 ⇐⇒ Tz = 
 .. ..
 = T−1

 . .   . . 
(n) (n) (n) (1) (1) (n)
u1 u2 un un un un

(m)
donde hemos denotado ui la componente m del vector j − esimo en la base |ei i (con i = 1, · · · n ). Por lo
tanto, si los n autovalores y autovectores de A son distintos y conocidos, A se dice diagonalizable. Si A es
hermitica, T−1 = Tz y es muy facil construir la inversa de la matriz de transformacion T. Si los autovalores
de A con degenerados, vale decir si el número de autovectores linealmente independientes es menor que n,
entonces A no es diagonalizable y no existe una matriz de transformacion T (T no tiene inversa) tal que
TAT−1 = Â.
Lo que nos ocupa ahora es la solución del sistema de ecuaciones diferenciales inhomogéneo de la forma
  
 a11 a12 · · · a1n

  a21 a22

  a2n 


 A = .  y aij = const

  . . . 

 . .



 an1 an2 · · · ann





  (1) 

 x (t)


  x(2) (t) 
 
x′ (t) = Ax (t) + g (t) con x (t) =  .. 

  . 



 x(n)
(t)





  (1) 

 g (t)



  g (2) (t) 

  

 g (t) =  .. 

  . 

 (n)
g (t)
donde A una matriz constante y diagonalizable, g (t) contı́nua en el intervalo α ≤ t ≤ β. La solución de este
problema pasa por encontrar los autovalores y autovectores de A ⇒ {λ1 , λ2 , · · · λj · · · λn ; |u1 i , |u2 i , · · · |ui i · · · |un i}
construir a partir de ellos la matriz T y su hermitica conjugada T−1 = Tz y a partir de ella hacer un cambio
de variable
x (t) = T y (t) ⇒ T y′ (t) = AT y (t) + g (t) ⇒ y′ (t) = T−1 −1

| {zAT} y (t) + T g (t)
Â
por lo tanto   

 λ1 0 · · · 0

  0 λ2

  0 


 Â =  .. .. 
 . . 
y′ (t) = Â y (t) + h (t) con

 0 0 · · · λn






h (t) = T−1 g (t)
Entonces, por componente quedan
Z t
∗(i)
yi′ (t) = λi yi (t) + hi (t) = λi yi (t) + Tji
∗
gj (t) = yi (t) = eλi t dτ eλi τ uj gj (τ ) + ci eλi t
t0
Veamos algunos ejemplos. Encontremos la soluci’on general de

−t
−2 1 2e
ẋ = x+ ⇒ ẋ = Ax + g(t)
1 −2 3t

Donde los autovalores y autovectores de A son

1 1 1 1
λ1 = −3 ξ1 = y λ2 = −1 ξ2 = ⇒ x(t)gh = C1 e−3t + C2 e−t
−1 1 −1 1
donde x(t)gh es la soluci’on general de la homog’enea. Como A es real y sim’etrica,, constuimos la matriz
de los autovectores, nomalizando los autovectores. Esto es

1 1 1 −1 1 1 −1
T= √ ⇔ T =√
2 −1 1 2 1 1
Ahora cambiando variables y sustituy’endola en la ecuaci’on x = Ty tendremos el siguiente sistema de

ecuaciones −t
−3 0 1 2e − 3t
ẏ = Dx ⇒ y+ √
0 −1 2 2e−t + 3t
con lo cual, como se esperaba
√ 3 √ 3
y˙1 + 3y1 = 2e−t − √ t y y˙2 + 3y2 = 2e−t + √ t
2 2
y la soluci’on es inmediata
√
2 −t 3 t 1 √ 3
y1 (t) = e −√ − + C1 e−3t y y2 (t) = 2e−t + √ (t − 1)C2 e−t
2 2 3 9 2
y devolviendo el cambio de variables tenemos que
 
c1 −3t c2
y1 + y2 √ e + √ + 12 e−t + t − 34 + te−t
x = Ty ⇒ x = ≡ 2 2 
−y1 + y2 c1 −3t
−√ e + c2
√ − 1
e−t
+ 2t − 5
+ te−t
2 2 2 3
es decir
C1 1 C2 1 1 1 1 t 4
x= √ e−3t + √ e−t + e−t + te−t + −
2 −1 2 1 2 −1 1 2 15

Bibliografı́a
York).
ción).
[4] W. E. Boyce y R.C. DiPrima (2004) Elementary Differential Equations and Boundary Pro-
blems. (8th Edition) (John Wiley, New York) . (Existe Traducción)

[8] A. Kiseliov, M. Krasnov y G. Makarenko (1969) Problemas de Ecuaciones Diferenciales Ordina-
rias. (Mir, Moscú).

[10] M. Tenenbaun y H. Pollard. Ordinary Differential Equations Harper and Row, New York 1963.
440
Capı́tulo 11
Series y Ecuaciones Diferenciales

Ordinarias
441
11.1. Otra vez Algebra de Series

Las series se suman
∞
X ∞
X ∞
X
n n n
an (x − x0 ) + bn (x − x0 ) = (an + bn ) (x − x0 )
n=0 n=0 n=0
Las series se multiplican

"∞ #" ∞
# ∞
X n
X n
X n
an (x − x0 ) bn (x − x0 ) = cn (x − x0 )
n=0 n=0 n=0
con
cn = a0 bn + a1 bn−1 + a2 bn−2 + · · · + aj bn−j + · · · + an−2 b2 + an−1 b1 + an b0
Las series se derivan P∞ ∞

d [ n=0 an (x − x0 ) ] X
n
n−1
= an n (x − x0 )
dx n=1
Nótese como cambia el comienzo de la serie.

Los ı́ndices en las series son mudos
∞
X ∞
X ∞
X
n−1 j−1 k
an n (x − x0 ) = aj j (x − x0 ) = ak+1 (k + 1) (x − x0 )
n=1 j=1 k=0
en la última sumatoria hemos hecho k = j − 1, por lo cual j = k + 1.

Las series se igualan
∞
X ∞
X
n n−1
bn (x − x0 ) = an n (x − x0 )
n=0 n=1
X∞ X∞ ∞
X
n k n
bn (x − x0 ) = ak+1 (k + 1) (x − x0 ) = an+1 (n + 1) (x − x0 )
n=0 k=0 n=0
por lo cual
bn = an+1 (n + 1)
si la igualdad hubiera sido
∞
X ∞
X ∞
X
n n−1 n an
n an (x − x0 ) = an n (x − x0 ) = an+1 (n + 1) (x − x0 ) =⇒ an+1 =
n=0 n=1 n=0
(n + 1)
11.2. Un Ejemplo conocido.

Consideremos la conocidad ecuación diferencial
y ′′ + y = 0

se propone encontrar una solución entorno a x = 0 por lo tanto

 ′ P∞
X∞  y = n=1 nan xn
n
y= an x =⇒
 ′′ P∞
n=0 y = n=2 n (n − 1) an xn−2
∞
X ∞
X
y ′′ + y = 0 =⇒ n (n − 1) an xn−2 + an xn = 0
n=2 n=0
∞
X ∞
X
y ′′ + y = 0 =⇒ (k + 2) (k + 1) ak+2 xk + an xn = 0
k=0 n=0
∞
X
y ′′ + y = 0 =⇒ [(k + 2) (k + 1) ak+2 + ak ] xk = 0
k=0
entonces
−ak
(k + 2) (k + 1) ak+2 + ak = 0 =⇒ ak+2 = con k = 0, 1, 2, · · ·
(k + 2) (k + 1)
por lo que
−a0 −a2 −1 (−a0 ) a0 a0

a2 = ; a4 = = · = = ;
2·1 4·3 4·3 2 4·3·2·1 4!
−a4 −a0 a0
a6 = = =−
6·5 6·5·4·3·2·1 6!
en general
k
(−1)
a2k = a0
(2k)!
Similarmente, para los impares se obtiene
−a1 −a3 −1 (−a1 ) a1 a1

a3 = ; a5 = = · = = ;
3·2 5·4 5·4 3·2 5·4·3·2·1 5!
−a5 −a1 −a1

a7 = = =
7·6 7·6·5·4·3·2·1 7!
de donde
k
(−1)
a2k+1 = a1
(2k + 1)!

De este modo, la solución deseada queda como

∞
X (−a0 ) 2 (−a1 ) 3 a0 4 a1 4 (−a0 ) 6 (−a1 ) 7
y= an xn = a0 + a1 x + x + x + x + x + x + x + ···
n=0
2! 3! 4! 5! 6! 7!
   
∞
X    
 x2 x4 x6   x3 x5 x7 
y= n 
an x = a0 1 − + −  
+ · · · + a1 x − + − + · · ·
2! 4! 6! 3! 5! 7! 
n=0 | {z } | {z }
P∞ (−1)k P∞ (−1)k
k=0 (2k)!
x2k k=0 (2k+1)! x
2k+1
∞
X ∞
X k ∞
X k
(−1) (−1)
y= an xn = a0 x2k + a1 x2k+1 = a0 cos x + a1 sen x
n=0
(2k)! (2k + 1)!
k=0 k=0
11.3. Otro Ejemplo menos conocido pero importante

Considere ecuación de Hermite1 la cual aparece en la solución del oscilador armónico cuántico
y ′′ − 2xy ′ + λy = 0
Para resolver esta ecuación alrededor del punto x0 = 0, proponemos la siguiente expansión en series de
potencias como solución:
 ′ P∞
X∞  y (x) = j=1 jaj xj−1
y(x) = aj xj ⇒ P∞
 ′′
j=0 y (x) = j=2 j(j − 1)aj xj−2
entonces la ecuación de Hermite queda como

     
∞
X X∞ X∞
 j(j − 1)aj xj−2  − 2  jaj xj  + λ  aj xj  = 0
j=2 j=1 j=0
reacomodando ı́ndices queda como

" #    
∞
X X∞ X∞
(k + 2) (k + 1)ak+2 xk − 2 jaj xj  + λ  aj xj  = 0
k=0 j=1 j=0
o equivalentemente
∞
X
(2a2 + λa0 ) + [(j + 2) (j + 1)aj+2 − 2jaj + λaj ] xj = 0
j=1
2a2 − (λ − 2j)
a0 = − y aj+2 = aj n≥1
λ (j + 2) (j + 1)
1 Charles Hermite, (1822-1901). Matemático francés, especializado en el estudio de teorı́a de funciones. Profesor en la
Universidad de Parı́s, ofreció importantes aportaciones al álgebra, las funciones abelianas y la teorı́a de las formas cuadráticas.

y tendrá como solución

 
 λ 2 (4 − λ) λ 4 (8 − λ) (4 − λ) λ 6 
y (x) = a0 
1 − 2! x − x − x − · · ·

| 4! {z 6! }
y0
 
 (2 − λ) 3 (6 − λ) (2 − λ) 5 (10 − λ) (6 − λ) (2 − λ) 7 
+ a1 
x + 3! x + x + x + · · ·

| 5! {z 7! }
y1
nótese que para valores pares de λ una u otra serie se corta y genera polinomios de la forma
λ Ecuación de Hermite Polinomio asociado
0 y ′′ − 2xy ′ = 0 y0 (x) = 1
2 y − 2xy ′ + 2y = 0
′′
y1 (x) = x
4 y ′′ − 2xy ′ + 4y = 0 y0 (x) = 1 − 2x2
6 y ′′ − 2xy ′ + 6y = 0 y1 (x) = x − 23 x3
8 y ′′ − 2xy ′ + 8y = 0 y0 (x) = 1 − 10x2 + 35
3 x
4
También, puede ser definido a partir de una ecuación:

2 dλ −x2
Hλ (x) = (−1)λ ex e , λ = 0, 1, 2, .... (11.1)
dxλ
o a través de una relación de recurrencia
Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) = 0
Las ecuaciones antes mencionadas son ecuaciones homogéneas. En el caso que la ecuación diferencial a
resolver por series sea una ecuación inhomogéna, se procederá del mismo modo como se propuso en el caso de
que los coeficientes de la ecuación diferencial fueran constantes. Esto es se resuelve, por series la homogénea
y luego se propone una solución particular, en forma de serie de potencias, la cual se iguala con la expansión,
también en series de potencias, del término inhomogéneo. Como ejemplo, antes de proceder a casos más
generales resolvamos la ecuación de Airy2 , pero inhomogéna planteada arriba. A pesar de su simplicidad,
esta ecuación admite sólo soluciones en forma de serie. ahora el caso de la ecuación homogénea de Airy
y ′′ − xy = 0
Luego, compruebe, siguiendo el procedimiento arriba expuesto que una posible ecuación inhomogénea de
Airy
y ′′ − xy = exp (x)
tiene como solución la siguiente serie de potencias

1 3 1 4 1 1 1
′
y (x) = y (0) 1 + x + · · · + y (0) x + x + · · · + x2 + x3 + x4 + · · ·
6 12 2 6 24
| {z } | {z } | {z }
y1 y2 yih
| {z }
yh
2 George Biddell Airy (1801-1892) Matemático y Astrónomo Inglés con contribuciones importantes en la solución de
ecuaciones diferenciales y su utilización en Astronomı́a. Mejoró significativamente las estimaciones teóricas de la orbita de
Venus y la Luna. Igualmente realizó estudios matemáticos de la formación del arcoiris y la densidad de la tierra.

Nótese que los dos primeros términos corresponden a la solución de la ecuación homogénea y el último
representa la serie que anula el término inhomogéneo. Hemos hecho patente la dependencia de las constantes
de integracón de las condiciones iniciales.
11.4. Método de Diferenciaciones Sucesiva

En general, dada la Ecuación diferencial
n
X
a0 (x) y(x) + a1 (x) y ′ (x) + · · · + an−1 (x) y n−1 (x) + an (x) y n (x) = ai (x) y (i) (x) = F(x) (11.2)
i=o
Si los coeficientes a0 (x) · · · an (x) son funciones analı́ticas en x = x0 (se pueden expresar como una serie
de Taylor de (x − x0 ) que converge al valor de la función con un radio de convergencia de |x − x0 | < ρ),
entonces, la ecuación diferencial 11.2 tendrá como solución única, y = y(x) de la ecuación homogéna una
serie de potencias la cual satisface las n condiciones iniciales
y(x0 ) = c1 ; y ′ (x0 ) = c2 ; y ′′ (x0 ) = c3 ; · · · y ′′ (x0 ) = cn

n
X i
(x − x0 )
Adicionalmente, se expandirá en Taylor la función inhomogénea, esto es F(x) = F (i) (x0 )
y se
i=o
i!
P∞
propondrá una solución particular de la inhomogénea, también en términos de una serie yih (x) = j=0 aj xj .
Otra forma de hacerlo es proceder directamente y conservar el término inhomogéneo y a partir de la
ecuación completa encontrar los coeficientes de la expansión por Taylor alrededor del punto en el cual se
disponga de las condiciones iniciales. La solución en series de Taylor será
x2 x3
yh (x) = y(0) + y ′ (0)x + y ′′ (0) + y ′′′ (0) + · · ·
2! 3!
Ası́ para la siguiente ecuación diferencial
y ′′ − (x + 1) y ′ + x2 y = x; con y(0) = 1; y y ′ (0) = 1.
los coeficientes de la expansión se obtienen de los valores de las derivadas en x0 = 0, los cuales salen de las
condiciones iniciales, de la ecuación diferencial esto es
y(0) = 1; y ′ (0) = 1; y ′′ (0) = (0) + (0 + 1) y ′ (0) − 02 y(0) = 1
y de las derivadas de la ecuación diferencial
y ′′′ (x) = y ′ (x) + (x + 1) y ′′ (x) − 2x y(x) − x2 y ′ (x) + 1

y ′′′ (0) = y ′ (0) + (0 + 1) y ′′ (0) − 2(0) y(0) − 02 y ′ (0) + 1
y ′′′ (0) = 1 + 1 + 1 = 3
finalmente, la solución
x2 x3
yh (x) = 1 + x +
+ + ···
2 2
Esta solución contiene las dos soluciones (la homogénea y la particular de la inhomogénea) sumadas
Dado |x| < 1 y la ecuación diferencial
x 1
y ′′ + y′ − y = exp (2x) ; con y(0) = 1; y y ′ (0) = 1.
1 − x2 1 − x2

compruebe que tiene como solución general por series

1 1 1 1 2 1 3 1 4
y (x) = y (0) 1 + x2 + x4 + x6 + · · · + y ′ (0) x + x + x + x + ···
2 24 80 2 3 8
y al incorporar los valores de las condiciones iniciales se obtiene

1 1 1 1 6 4 7 79
y (x) = 1 + x + x2 + x3 + x4 + x5 + x − x − x8 + · · ·
3 6 30 180 315 10 080
11.5. Métodos de los Coeficientes Indeterminados

En general, para encontrar la solución a la ecuación antes mencionada
n
X
ai (x) y (i) (x) = F(x)
i=o
Se expanden por series de potencias cada uno de los coeficientes a0 (x) · · · an (x), la función F(x) y se expande
también la serie
X∞ j
(x − x0 )
y(x) = cj
j=0
j!
luego de bastante transpiración se despejan los coeficiente c0 · · · cn · · · veamos el ejemplo con la misma
ecuación del ejemplo anterior.
y ′′ − (x + 1) y ′ + x2 y = x; con y(0) = 1; y y ′ (0) = 1.
Como x0 = 0, proponemos la siguiente expansión en series de potencias como solución:

 P∞
X∞  y ′ (x) = j=1 jcj xj−1
y(x) = cj xj =⇒ P∞
 ′′
j=0 y (x) = j=2 j(j − 1)cj xj−2
y al sustituir
∞
X ∞
X ∞
X
j(j − 1)cj xj−2 − (x + 1) jcj xj−1 + x2 cj xj = x
j=2 j=1 j=0
expandiendo
∞
X ∞
X ∞
X ∞
X
j(j − 1)cj xj−2 − jcj xj − jcj xj−1 + cj xj+2 = x
j=2 j=1 j=1 j=0
si hacemos j − 2 = l en el primer término, j − 1 = k en el tercero y j + 2 = m en el cuarto, tenemos

∞
X ∞
X ∞
X ∞
X
(l + 2) (l + 1) cl+2 xl − jcj xj − (k + 1) ck+1 xk + cm−2 xm = x
l=0 j=1 k=0 m=2
acomodando
∞
X ∞
X
((n + 2) (n + 1) cn+2 − ncn − (n + 1) cn+1 ) xn + cm−2 xm = x
n=0 m=2

por lo tanto
c2 − c1 = 0
3 · 2 c3 − c1 − 2 c2 = 1
y la relación de recurrencia para n ≥ 2
(n + 2) (n + 1) cn+2 − ncn − (n + 1) cn+1 − cn−2 = 0
con la cual se obtienen todos los demás coeficientes.

Si la ecuación es
y ′′ + (sin x) y ′ + (exp x) y = 0
se expanden los coeficientes

′′ 1 3 1 5 ′ 1 2 1 3 1 4 1 5
y + x− x + x + ··· y + 1 + x + x + x + x + x + ··· y = 0
6 120 2 6 24 120
se propone la solución en términos de series de potencias

 P∞
X∞  y ′ (x) = j=1 jcj xj−1
y(x) = cj xj ⇒ P∞
 ′′
j=0 y (x) = j=2 j(j − 1)cj xj−2
por lo cual
     
X∞ X ∞ X ∞
 1 1
j(j − 1)cj xj−2  + x − x3 + · · ·  jcj xj−1  + 1 + x + x2 + · · ·  cj xj  = 0
j=2
6 j=1
2 j=0
acomodando
(2c2 + c0 ) + (6c3 + 2c1 + c0 ) x + (12c4 + 3c2 + c1 + c0 ) x2 + (20c5 + 4c3 + c2 + c1 + c0 ) x3 + · · · = 0
2c2 + c0 = 0
6c3 + 2c1 + c0 = 0
12c4 + 3c2 + c1 + c0 = 0
20c5 + 4c3 + c2 + c1 + c0 = 0
..
.
Ejercicio. Utilice el mismo método para la ecuación ejercicio anterior

x 1
y ′′ + 2
y′ − y = e2x ; con y(0) = 1; y y ′ (0) = 1.
1−x 1 − x2

11.6. Los Puntos y las Estrategias

Dada una ecuación diferencial del tipo
Q (x) ′ R (x)
P (x) y ′′ + Q (x) y ′ + R (x) y = 0 ⇒ y ′′ + y + y=0
P (x) P (x)
Q(x) R(x)
Puntos ordinarios Un punto ordinario x = x0 será aquel alrededor del cual p(x) = P (x) y q (x) = P (x)
sean analı́ticas en ese punto o
Q (x)
lı́m p(x) ≡ lı́m = l1 con l1 finito
x→x0 x→x0 P (x)
R (x)
lı́m q (x) ≡ lı́m = l2 con l2 finito
x→x0 x→x0 P (x)
Q(x) R(x)
O también, lo que es lo mismo, que p(x) = P (x) y q (x) = P (x) tengan una expansión en Taylor alrededor
de ese punto x = x0 .
Puntos singulares regulares Un punto x = x0 se llamará punto singular regular si
Q (x)
lı́m (x − x0 ) p(x) ≡ lı́m (x − x0 ) = l3 con l3 finito
x→x0 x→x0 P (x)
2 2 R (x)
lı́m (x − x0 ) q (x) ≡ lı́m (x − x0 ) = l4 con l4 finito
x→x0 x→x0 P (x)
2 2 R(x)
O también, lo que es lo mismo, que p(x) (x − x0 ) = (x − x0 ) Q(x)
P (x) y q (x) (x − x0 ) = (x − x0 ) P (x) tengan
una expansión en Taylor alrededor de ese punto.
Puntos singulares irregulares Ninguna de las anteriores
11.7. Ecuaciónes e intervalos en puntos regulares

La ecuación de Legendre3
(1 − x2 ) y ′′ − 2x y ′ + λ(λ + 1) y = 0
tiene puntos regulares en x 6= ±1 y puntos singulares regulares en x = ±1. Pero es analı́tica en x ∈ (−1, 1)
lo tanto, todos los x son ordinarios si x ∈ (−1, 1). En ese intervalo se propone una solución
∞
X
y(x) = an xn
n=0
3 Adrien Marie Legendre (1752-1833). Matemático francés, encuadrado en la escuela de Parı́s, que surgió tras la revolución
de 1789. Realizó una teorı́a general de las funciones elipticas y divulgó numerosos trabajos de investigadores jóvenes en el campo
del análisis matemático.

por lo tanto
∞
X ∞
X ∞
X
(1 − x2 ) n(n − 1)an xn−2 − 2x n an xn−1 + λ(λ + 1) an xn = 0
n=2 n=1 n=0
multiplicando y acomodando
∞
X ∞
X ∞
X ∞
X
(j + 2)(j + 1)aj+2 xj − n(n − 1)an xn − 2 n an xn + λ(λ + 1) an xn = 0
j=0 n=2 n=1 n=0
expandiendo
0 =2a2 + λ(λ + 1)a0 {(λ + 2)(λ − 1)a1 + (3 · 2)a3 } x+

∞
X
+ {(n + 2)(n + 1)an+2 + (λ + n + 1)(λ − n)an } xn
n=2
donde hemos utilizado

−n(n − 1) − 2n + λ(λ + 1) = (λ + n + 1)(λ − n)
por lo tanto
(λ + 1)λ
a2 = − a0
2
(λ + 3)(λ + 1)λ(λ − 2)
a4 = a0
4!
(λ + 2n − 1)(λ + 2n − 3) · · · (λ + 1)λ(λ − 2) · · · (λ − 2n + 2)
a2n = (−1)n a0
(2n)!
y las potencias impares serán
(λ + 2)(λ − 1)
a3 = − a1
3!
(λ + 4)(λ + 2)(λ − 1)(λ − 3)
a5 = a1
5!
(λ + 2n)(λ + 2n − 2) · · · (λ + 2)(λ − 1) · · · (λ − 2n + 1)
a2n+1 = (−1)n a1
(2n + 1)!
y su solución general de la forma

y(x) = a0 y0 (x) + a1 y1 (x)
con
(λ + 1)λ 2 (λ + 3)(λ + 1)λ(λ − 2) 4
y0 (x) = 1 − x + x + ···
2 4!
(λ + 2)(λ − 1) 3 (λ + 4)(λ + 2)(λ − 1)(λ − 3) 5
y1 (x) = x − x + x + ···
3! 5!
si λ = 2n una de las series se corta solución es un polinomio de potencias pares y si λ = 2n + 1 la otra se
corta en uno de potencias impares

λ Ecuación de Legendre Polinomio Asociado

0 (1 − x2 ) y ′′ − 2x y ′ = 0 y0 (x) = 1
1 (1 − x2 ) y ′′ − 2x y ′ + 2 y = 0 y1 (x) = x
2 (1 − x2 ) y ′′ − 2x y ′ + 6 y = 0 y0 (x) = 1 − 3x2
3 (1 − x2 ) y ′′ − 2x y ′ + 12 y = 0 y1 (x) = x − 35 x3
4 (1 − x2 ) y ′′ − 2x y ′ + 20 y = 0 y0 (x) = 1 − 10x2 + 35
3 x
4
Los polinomios de Legendre son funciones que surgen en problemas de electrostática como solución de la
ecuación de Legendre y son efectivamente polinomios para λ entero. Los Polinomios de Legendre también
pueden ser generados a partir de la Fórmula de Rodrı́gues
1 dn 2
Pn (x) = (x − 1)n , n = 0, 1, 2, .....
n!2n dxn
con P0 (x) = 1. También se dispone de una relación de recurrencia
(n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x)
11.8. El Método de Frobenius

Para la solución de ecuaciones diferenciales lineales ordinarias alrededor de puntos singulares regulares
se utiliza el método de Frobenius4 . Dada una ecuación diferencial
f1 (x) ′ f2 (x)
y ′′ + F1 (x) y ′ + F2 (x) y = 0 ⇐⇒ y ′′ + y + 2 y =0 (11.3)
(x − x0 ) (x − x0 )
donde F1 (x) y F2 (x) tienen singularidades regulares enx = x0 y por lo tanto f1 (x) y f2 (x) son analı́ticas
alrededor de ese punto entonces, la propuesta de solución será una serie de Frobenius
∞
X
m n
y(x) = (x − x0 ) an (x − x0 ) (11.4)
n=0
donde n es entero positivo, pero m puede ser entero positivo (entonces la serie de Frobenius es una serie de
Taylor) o entero negativo (entonces la serie de Frobenius es una serie de Laurent), o un racional. Por lo cual
una serie de Frobenius incluye a las serie de Taylor y Laurent. Para hacer las cosas más simples supongamos,
sin perder generalidad, x0 = 0. Además, como f1 (x) y f2 (x) son analı́ticas entonces
∞
X ∞
X
f1 (x) = bn xn y f2 (x) = cn xn (11.5)
n=0 n=0
por lo tanto
" ∞
# " ∞
#
X X
x2 y ′′ + x f1 (x) y ′ + f2 (x) y = 0 ⇐⇒ x2 y ′′ + x bn xn y′ + cn xn y=0
n=0 n=0
4 Ferdinand Georg Frobenius (1849-1917) Matemático Alemán famoso por sus contribuciones en Teorı́a de Grupos y
métodos para resolver ecuaciones diferneciales.

y con la propuesta de serie de Frobenius

∞
" ∞
# " ∞
#
X X X
m n ′ m−1 n m n−1
y(x) = x an x =⇒ y (x) = mx an x +x nan x
n=0 n=0 n=1
⇓
" ∞
# " ∞
# " ∞
#
X X X
′′ m−2 n m−1 n−1 m n−2
y (x) = m (m − 1) x an x + 2mx nan x +x n (n − 1) an x
n=0 n=1 n=2
sustituyendo
( " ∞
# " ∞
# " ∞
#)
X X X
2 m−2 n m−1 n−1 m n−2
0=x m (m − 1) x an x + 2mx nan x +x n (n − 1) an x +
n=0 n=1 n=2
" ∞
#( " ∞
# " ∞
#) " ∞
#( ∞
)
X X X X X
n m−1 n m n−1 n m n
+x bn x mx an x +x nan x + cn x x an x
n=0 n=0 n=1 n=0 n=0
acomodando
( " ∞
# " ∞
# " ∞
#)
X X X
0= m (m − 1) xm an xn + 2mxm nan xn + xm n (n − 1) an xn +
n=0 n=1 n=2
" ∞
#( " ∞
# " ∞
#) " ∞
#( ∞
)
X X X X X
n m n m n n m n
+ bn x mx an x +x nan x + cn x x an x
n=0 n=0 n=1 n=0 n=0
o
( " ∞
# " ∞
# " ∞
#)
X X X
m n n n
0=x m (m − 1) an x + 2m nan x + n (n − 1) an x +
n=0 n=1 n=2
" ∞
#( " ∞
# " ∞
#) " ∞
#( ∞
)!
X X X X X
+ bn xn m an xn + nan xn + cn xn an xn
n=0 n=0 n=1 n=0 n=0

Expandiendo las series tendremos

 

 

m
0=x a0 [m (m − 1) + b0 m + c0 ] + (11.6)

 | {z }
EI(m)
 

 

m+1
+x a1 [m (m + 1) + b0 (m + 1) + c0 ] + a0 [b1 m + c1 ] + (11.7)

 | {z } 

EI(m+1)
 

 

+ xm+2 a2 [(m + 2) (m + 1) + b0 (m + 2) + c0 ] + a1 [b1 (m + 1) + c1 ] + a0 [b2 m + c2 ] (11.8)

 | {z } 

EI(m+2)



m+3
+x a3 [(m + 3) (m + 2) + b0 (m + 3) + c0 ] + a2 [b1 (m + 2) + c1 ] + (11.9)

 | {z }
EI(m+3)
+a1 [b2 (m + 1) + c2 ] + a0 [b3 m + c3 ]} + · · ·

..
.



+ xm+n an [(m + n) (m + n − 1) + b0 (m + n) + c0 ] + an−1 [b1 (m + n − 1) + c1 ] + (11.10)

 | {z }
EI(m+n)
+ an−2 [b2 (m + n − 2) + c2 ] + an−3 [b3 (m + n − 3) + c3 ] + · · · (11.11)

+a1 [bn−1 (m + 1) + cn−1 ] + a0 [bn m + cn ]} (11.12)
+ ···
la cual puede ser reacomodada aún más, y toma la forma elegante y compacta de
∞
( i−1
)
X X
m
0 = x {a0 EI (m)} + ai EI (m + i) + ak [(m + k) bi−k + ci−k ] xm+i (11.13)
i=1 k=0
donde hemos identificadoEI (m) = m (m − 1) + b0 m + c0 . Como es de esperarse, este polinomio se anula si

los coeficientes de xm · · · xm+i se anulan. La primera de las ecuaciones que surge es la ecuación indicadora o
ı́ndice
a0 6= 0 =⇒ EI (m) = m (m − 1) + b0 m + c0 = 0 (11.14)
que no es otra cosa que un polinomio de segundo grado en m. Al anular el coeficiente de xm+i
( i−1
)
X
ai EI (m + i) + ak [(m + k) bi−k + ci−k ] = 0 (11.15)
k=0
obtendremos la relación de recurrencia para la serie de Frobenius, correspondientes a cada raı́z de la ecuación
indicadora (11.14). Dato que la ecuación indicadora es un polinomio de segundo grado para m, entonces de
allı́ se derivan dos raı́ces m1 y m2 . Dependiendo de como sean estas raı́ces distinguiremos tres casos:

1. m1 6= m2 ∧ m1 − m2 6= N con N entero.
En este caso, la solución en términos de la serie de Frobenius para la ecuación diferencial será
" ∞
# " ∞
#
m1
X m
X
y(x) = C1 kxk 1+ an (m1 ) xn + C2 kxk 2 1 + an (m2 ) xn (11.16)
n=1 n=1
| {z } | {z }
y1 (x) y2 (x)
2. m1 = m2
" ∞
#
m
X
n
y(x) = C1 kxk 1+ an (m) x
n=1
| {z }
y1 (x)
(11.17)
 

 

 " # "∞ #


 X∞ X 
m n m n
+ C2 kxk 1+ an (m) x ln x + kxk Bn (m) x

 


| n=1
{z }
n=0 

 
y1 (x)
| {z }
y2 (x)
3. m1 6= m2 ∧ m1 − m2 = N con N entero positivo.

" ∞
#
m1
X
n
y(x) = C1 kxk 1+ an (m1 ) x
n=1
| {z }
y1 (x)
(11.18)
 

 


 " # " # 

 X∞ X∞ 
m1 n m2 n
+ C2 f kxk 1+ an (m1 ) x ln x + kxk an (m2 ) x

 


 n=1 n=0 

| {z } 
y1 (x)
| {z }
y2 (x)
Donde las constantes an (m1 ) , an (m2 ) , Bn (m1 ) y f, surgen de sustituir estas soluciones en la ecuación
diferencial y resolver por el método de los coeficientes indeterminados. Nótese que hemos indicado explı́cita-
mente que los coeficientes an = an (m1 ) ; an = an (m2 ) ; Bn = Bn (m2 ) corresponden a las series de cada una
de las raı́ces de la ecuacion indicadora.
En resumen, si una ecuación diferencial y ′′ +F1 (x) y ′ +F2 (x) y = 0 presenta puntos sigulares regulares
para F1 (x) y F2 (x) en x = x0 . Lo que se traduce en que
 P∞ n
f (x) f (x)  f1 (x) = n=0 bn (x − x0 )
′′ 1 ′ 2
y + y + 2 y =0 con P∞
(x − x0 ) (x − x0 )  n
f2 (x) = n=0 cn (x − x0 )

es decir, que f1 (x) y f2 (x) sean analı́ticas en torno a x = x0 . Entonces se aplica el método de Frobenius.
Para ello,
1. se propone una solución en series de potencias de Frobenius:
∞
X
y(x) = xm an xn
n=0
con m ∈ ℜ ∧ n ∈ N ,
2. se sustituye en la ecuación diferencial y se aisla el término independiente (de orden cero en n). El
coeficiente de este término se anula e implica la ecuación la indicadora o ı́ndice
a0 6= 0 =⇒ EI (m) = m (m − 1) + b0 m + c0 = 0
que no es otra cosa que un polinomio de segundo grado en m. De esta ecuación emergen dos raı́ces m2
∧ m1 ,en función de estas raı́ces, procedemos de distinto modo
a) si m1 6= m2 ∧ m1 − m2 6= N con N entero entonces tendremos dos series de Frobenius

"∞ # "∞ #
X X
m1 n m2 n
y(x) = C1 x an (m1 ) x + C2 x an (m2 ) x
n=0 n=0
b) si m1 = m2 tenemos que insertar un logaritmo

( "∞ # "∞ #)
X X
y(x) = xm1 (C1 + C2 ln x) an (m) xn + C2 Bn (m) xn
n=0 n=0
c) m1 6= m2 ∧ m1 − m2 = N con N entero positivo, entoces, como por arte de magia

( "∞ #) "∞ #
X X
m1 n m2 n
y(x) = x (C1 + f ln x) an (m1 ) x + C2 x an (m2 ) x
n=0 n=0
3. Seguidamente se determina, según el caso, se determinan las relaciones de recurrecias para los distintos
coeficientes an = an (m1 ) ; an = an (m2 ) ; Bn = Bn (m2 ) ; Gn = Gn (m2 ) a partir de la ecuación (11.15)
( n−1
)
X
an EI (m + n) + ak [(m + k) bn−k + cn−k ] = 0
k=0
tomando en cuenta los coeficientes de los desarrollos en series de potencias de las funciones
∞
X ∞
X
f1 (x) = bn xn y f2 (x) = cn xn
n=0 n=0
m+n
si anulamos los coeficientes de x
n−1
X Pn−1
k=0 ak [(m + k) bn−k + cn−k ]
an EI (m + n) + ak [(m + k) bn−k + cn−k ] = 0 ⇐⇒ an = −
EI (m + n)
k=0
entonces se obtiene la relación de recurrencia, al menos para los casos (11.16) y (11.17) en los cuales
EI (m + n) 6= 0. El caso EI (m + n) = 0, vale decir m1 6= m2 ∧ m1 − m2 = N con N será analizado
en detalle más adelante.

11.8.1. m1 6= m2 ∧ m1 − m2 6= N con N entero.

En ese caso es claro que la resolver la ecuación indicadora y sustituir m1 en el resto de los coeficientes,
se va despejando todos los coeficientes a0 · · · an en términos de a0 . Igualmente al sustituir m2 encontramos
la otra solución y ambas son linealmente independientes y la solución será
"∞ # "∞ #
X X
m1 n m2 n
y(x) = C1 x an x + C2 x an x
n=0 n=0
Ejemplo, encuentre la solución en términos de series de Frobenius de la siguiente ecuación

2 ′′ 1 ′ 2 1
x y +x x+ y − x + y=0
2 2
al dividir por x2 identificamos

P∞ que a x = 0 es un punto singular regular. Proponemos por lo tanto una serie
de Frobenius y(x) = xm n=0 an xn como posible solución. La ecuación indicadora EI (m) = m (m − 1) +
b0 m + c0 = 0 queda ahora, como
  

  b0 = 21 



 ⇐= f1 (x) = 21 + x

  
 
 b1 = 1


m=1    
1 1
⇐= m (m − 1) + m − = 0 ⇐= 
 c0 = − 21 

 2 2  
  

m = −12 
  



 c1 = 0 ⇐= f2 (x) = − 12 − x2

 
 


  
  

c2 = −1
los demás coeficientes b2 = b3 = · · · = bn = · · · = 0 y c3 = c4 = · · · = cn = · · · = 0.
El primer término del coeficiente de xm+n , puede ser escrito en términos de genéricos, como

1 1 1 1 1
EI (m + n) = (m + n) (m + n − 1) + (m + n) + − = m2 + 2mn − m + n2 − n − (11.19)
2
|{z} 2 2 2 2
| {z }
b0 c0
El segundo término de ese mismo coeficiente, es una sumatoria en la cual inervienen los coeficientes de
las expansiones de f1 (x) y f2 (x) (ecuación (11.5)). Como de esta expansión sobrevive b1 = 1 significa
que sólo aparecen el coeficiente para el cual n − k = 1 ⇒ k = n − 1 y como también sobrevive c2 = −1,
tendremos que n − k = 2 ⇒ k = n − 2,también estará presente. Esto es
   
1  + an−2 (−1)
an−1 (m + n − 1) · |{z} (11.20)
| {z }
b1 c2
En definitiva el coeficiente completo se escribe como

1 1 1
an m2 + 2mn − m + n2 − n − + an−1 [m + n − 1] − an−2 = 0 (11.21)
2 2 2

con lo cual la relación de recurrencia general será
an−2 − an−1 [m + n − 1]
an = para n ≥ 2 (11.22)
m2 + 2mn − 21 m + n2 − 12 n − 1
2
Dependiendo del valor de m tendremos una relación de recurrencia para la primera de las series m = 1
1
o para la segunda, m = − . Analicemos cado por caso. Para el caso particular m = 1, se obtiene la
2
relación de recurrencia:
2
an = (an−2 − nan−1 ) para n ≥ 2
2n2 + 3n
y se encuentra a1 al utilizar el coeficiente de xm+1 (ecuación (11.7))

1 1 2
a1 1 (1 + 1) + (1 + 1) − + a0 [1 + 0] = 0 =⇒ a1 = − a0
2 2 5
con lo cual
1 1 4
9 9
n=2 =⇒ a2 = 7 (−2a1 + a0 ) = 7 5 a0 + a0 = 35 a0 =⇒ a2 = 35 a0
2 2 −27

n=3 =⇒ a3 = 27 (−3a2 + a1 ) = 27 35 a0 − 52 a0 = − 945
82
a0 82
=⇒ a3 = − 945 a0
1 1 328 9
571 571
n=4 =⇒ a4 = 22 (−4a3 + a2 ) = 22 945 a0 − 35 a0 = 20790 a0 =⇒ a4 = 20790 a0
.. ..
. .
Ası́ la primera solución será

2 9 82 3 571 4
y1 (x) = a0 x 1 − x + x2 − x + x + ···
5 35 945 20790
1
Del mismo modo se construye la segunda solución linealmente independiente a partir de m = − . Ası́, la
2
1
relación de recurrencia para los coficientes de la serie de Frobenius m = − será:
2

3 2
an = an−2 − n − an−1 para n ≥ 2
2 2n2 − 3n
y
1 1 1 1 1 1
a1 − + − + a0 − =0 =⇒ a1 = −a0
2 2 2 2 2 2
por lo cual
n=2 =⇒ a2 = − 12 a1 + a0 = 12 a0 + a0 = 23 a0 =⇒ a2 = 32 a0
2

n=3 =⇒ a3 = 9 − 23 a2 + a1 = 2
9
−9
4 a0 − a0 = − 13
18 a0 =⇒ a3 = − 13
18 a0
1

n=4 =⇒ a4 = 10 − 52 a3 + a2 = 1
10
65
36 a0 + 23 a0 = 119
360 a0 =⇒ a4 = 119
360 a0
.. ..
. .

Por lo cual, la solución general será

2 9 82 3 571 4
y(x) = C1 x 1 − x + x2 − x + x + ···
5 35 945 20790

1 3 13 119 4
+ C2 x− 2 1 − x + x2 − x3 + x + ···
2 18 360
Nótese que esta solución vale para 0 < kxk < ∞ por cuanto para x < 0, la segunda solución se hace
imaginaria pero se puede resolver haciendo C2 = i C3
Como ejercicio resuelva
2x2 y ′′ − x y ′ − (x + 1) y = 0
11.8.2. m1 = m2 .
Del mismo modo, si tenemos una ecuación diferencial

x2 y ′′ + x [x F1 (x)]y ′ + x2 F2 (x) y = 0 ⇐⇒ L {y} = x2 y ′′ + x f1 (x) y ′ + f2 (x) y = 0 (11.23)
| {z } | {z }
f1 (x) f2 (x)
donde en la cual F1 (x) y F2 (x) tienen singularidades regulares en x = 0 pero f1 (x) y f2 (x) son analı́ticas
para ese punto, vale decir
X∞ X∞
f1 (x) = bn xn y f2 (x) = cn xn
n=0 n=0
se aplica el Método de Frobenius. Pero antes de proceder a ilustrar este caso en al cual ambas raı́ces coinciden,
veamos, un poco de dónde surge la forma general de la solución (11.17). Para ello reacomodemos la ecuación
diferencial (11.23) de la forma

d2 d
x2 y ′′ + x f1 (x) y ′ + f2 (x) y = x2 + x f1 (x) + f2 (x) y ≡ L {y} = 0
dx2 dx
donde L {•} está concebido como un operador lineal. Es ilustrador mostrar de dónde sale la forma curiosa
de la solución de la ecuación diferencial (11.17). Para ello, recordamos que
∞
( n−1
)
X X
m
L {y} ≡= x {a0 EI (m)} + an EI (m + n) + ak [(m + k) bn−k + cn−k ] xm+n
n=1 k=0
si anulamos los coeficientes de xm+n entonces

n−1
X Pn−1
k=0 ak [(m + k) bn−k + cn−k ]
an EI (m + n) + ak [(m + k) bn−k + cn−k ] = 0 ⇐⇒ an = −
EI (m + n)
k=0
considerando EI (m + n) 6= 0 por lo tanto, para los an seleccionados (que anulen el coeficiente xm+n ) y
considerando el caso m1 = m2
2
L {y} (m, x) = {a0 EI (m)} xm = a0 (m − m1 ) xm

Nótese que estamos considerando L {y} (m, x) como una función de m, y x. Por lo cual evaluando en m = m1

2
L {y} (m, x)|m=m1 = a0 (m − m1 ) xm =0
m=m1
pero además podemos intentar derivar respecto a la constante m

∂ {L {y} (m, x)} ∂ d2 d 2 d
2
d ∂y
= x2 2
+ x f1 (x) + f2 (x) y = x 2
+ x f1 (x) + f2 (x)
∂m ∂m dx dx dx dx ∂m

∂y ∂ 2
h
2
i
L (m, x) = a0 (m − m1 ) xm = a0 (m − m1 ) xm ln x + 2 (m − m1 ) xm
∂m ∂m
y comprobamos que también se anula al evaluarla en m = m1
h i
∂y 2
L (m, x) = a0 (m − m1 ) xm ln x + 2 (m − m1 ) xm =0
∂m m=m1 m=m1
n o
∂y
por lo tanto ∂m (m, x) también es solución, con lo cual la segunda toma la forma
m=m1
( " #)
∂y ∂
∞
X
m
L (m, x) = kxk a0 + an (m) xn
∂m m=m1 ∂m
n=1 m=m1
" ∞
# " ∞ #
X X ∂an (m)
m1 n m1 n
= (x ln x) a0 + an (m1 ) x +x x
n=1 n=1
∂m m=m1
y la solución general tendrá la forma

" ∞
#
m1
X
y(x) = C1 kxk 1+ an (m1 ) xn
n=1
| {z }
y1 (x)
 

 


 " # " # 

 X∞ X∞ 
m1 n m1 n
+ C2 kxk 1+ an (m1 ) x ln x + kxk bn (m1 ) x

 

|
 n=1
{z }
n=0 

 
y1 (x)
| {z }
y2 (x)
Analicemos, como ejemplo un caso particular de la ecuación de Bessel5

x2 y ′′ + x y ′ + x2 + ν 2 y = 0
5 Fredrich Wilhel Bessel (1784-1846). Astrónomo y matemático alemán. Aportó notables contribuciones a la astronomı́a
posicional, la geodesia y la mecánica celeste. Particularmente, se dedicó a aumentar la exactitud de las mediciones de la
posición y el movimiento de los astros. La precisión de sus mediciones hizo posible que determinara pequeñas irregularidades
en los movimientos de Urano lo condujo a predecir la existencia de Neptuno. Análogos razonamientos lo llevaron a especular
sobre la presencia de estrellas compañeras en Sirio y Procyon. A partir de datos registrados en el siglo XVII, calculó la órbita
del cometa Halley

Una vez más, la ecuación viene parametrizada por ν y dependiendo de su valor tendremos una familia de
soluciones. Consideremos el caso ν = 0
x2 y ′′ + x y ′ + x2 y = 0
la ecuación indicadora EI (m) = m (m − 1) + b0 m + c0 = 0 nos queda como



 b0 = 1 ⇐= f1 (x) = 1



  


 
 c0 = 0 


 

m = 0 ⇐= m (m − 1) + m = 0 ⇐=  



 c1 = 0 ⇐= f2 (x) = x2

 
 


 
 

  
c2 = 1
los demás coeficientes b1 = b2 = b3 = · · · = bn = 0 y c3 = c4 = · · · = cn = 0. Con lo cual EI (n) =

n (n − 1) + n = n2 , Por lo tanto, la relación de recurrencia se obtiene del coeficiente de xm+n

Pn−1  b1 6= 0 ⇒ n − k = 1 ⇒ k = n − 1
ak [(m + k) b n−k + cn−k ]
an = k=0 dado que
EI (m + n) 
c2 6= 0 ⇒ n − k = 2 ⇒ k = n − 2
Pn−1
k=0 ak (m) [(m + k) bn−k + cn−k ] an−1 (m) (m + n − 1) + an−2 (m)
an (m) = = 2
(m + n) (m + n − 1) + (m + n) (m + n)
tomando m = 0, se tiene

Pn−1  b1 6= 0 ⇒ n − k = 1 ⇒ k = n − 1
k=0 ak (0) [kbn−k + cn−k ]
an (0) = − con
n2 
c2 6= 0 ⇒ n − k = 2 ⇒ k = n − 2
con lo cual
an−2 (0) [c2 ] + an−1 (0) [(n − 1) b1 ] an−2 (0) + an−1 (0) (n − 1)
an (0) = − =− para n ≥ 2
n2 n2
Otra vez, al anular el coeficiente para xm+1 (ecuación (11.7)) se obtiene a1 [0 (0 + 1) + 1 · (0 + 1) + 0] +
a0 [0 · 0 + 0] = 0 ⇒ a1 = 0. Con lo cual es claro que se anulan todos los coeficientes impares, y ası́
a2n−2 (0)
a2n (0) = − 2 para n = 1, 2, 3, · · ·
(2n)
con lo cual

1
n=1 =⇒ a2 (0) = − a0 (0) =⇒ a2 (0) = − 41 a0 (0)
4
1 1 1
n=2 =⇒ a4 (0) = − 2 a2 2(0) =
a0 (0) =⇒ a4 (0) = 2 a0 (0)
(2 · 2) (2 · 2) 22 (2 · 2) 22
" #
1 1 1 −1
n=3 =⇒ a6 (0) = − 2 a4 (0) = − 2 2 a0 (0) =⇒ a6 (0) = 2 a0 (0)
(2 · 3) (2 · 3) (2 · 2) 22 (2 · 3) 23
.. ..
. .
l l
a2l−2 (0) (−1) (−1)
n=l =⇒ a2l (0) = − 2 = 2 a0 (0) =⇒ a2l (0) = 2 a0 (0)
(2l) 22l (l!) 22l (l!)
por lo tanto la primera de las soluciones será

" ∞
#
X (−1)
n
2n
y1 (x) = a0 1 + 2x
n=1 22n (n!)
| {z }
J0 (x)
Donde J0 (x) se conoce como la función de Bessel de primera especie de orden cero.
Para calcular la segunda solución de la ecuación de Bessel se sustituye
∞
X
y2 (x) = J0 (x) ln x + Bn xn en la ecuación x2 y ′′ + x y ′ + x2 y = 0
n=0
para ello se requieren sus derivadas

∞
X ∞
J0 (x) X
y2 (x) = J0 (x) ln x + Bn xn ⇒ y2′ (x) = J0′ (x) ln x + + Bn (0) nxn−1 y
n=0
x n=1
⇓
∞
J0′ (x) J0 (x) X
y2′′ (x) = J0′′ (x) ln x + 2 − + Bn n (n − 1) xn−2
x x2 n=1
entonces
" ∞
#
2 J0′ (x) J0 (x) X
0=x J0′′ (x) ln x + 2 − + Bn n (n − 1) xn−2
+
x x2 n=2
" ∞
# " ∞
#
J0 (x) X X
+x J0′ (x) ln x + + Bn nxn−1 + x2 J0 (x) ln x + Bn xn
x n=1 n=0
con lo cual
 
X∞ X∞ X∞
0 = x2 J0′′ (x) + x J0′ (x) + Jx2 0 (x) ln x + 2 J0′ (x) x + Bn n (n − 1) xn + Bn nxn + Bn xn+2
| {z } n=2 n=1 n=0
=0

y finalmente
∞
X X∞ n
(−1) 2n 2n
B1 x + 22 B2 x2 + Bn n2 + Bn−2 xn = −2 x
2n (n!)2
n=3 n=1 2
es claro que para los coeficientes impares se obtiene b1 = b3 = b5 = · · · = b2n+1 · · · = 0 ya que
X∞ n
(−1) 2n 2n
B1 x + 22 B2 x2 + 32 B3 + B1 x3 + 42 B4 + B2 x4 + 52 B5 + B3 x5 + · · · = −2 x
2n (n!)2
n=1 2
mientras que para las potencias pares tendremos la relación de recurrencia

" #
n+1
1 (−1) n
B2n = 2 2 − b2n−2
(2n) 22(n−1) (n!)
entonces
1
B2 = 2 2
22 (1!)
!
1 4 1 1 1
B4 = 2 − 2 −2 2 =− 1+
(2 · 2) 22 (2!) 22 (1!) 4 22
2 2
" # " #
1 3 1 3 1 1 1 1 1
B6 = 2 2 − b4 = 2 + 1 + = 1 + +
(6) 24 (3!) 6 24 (3!)2 42 22 2 62 42 22 2 3
..
.
 
k+11  k+1
(−1)  + 1 + 1 + · · · + 1 + 1 + 1 = (−1)
B2k =  22k (k!)2 Hk
22k (k!) |k k − 1 k − 2{z
2 3 2
}
Hk
Ası́ la segunda solución puede tomar la forma de

∞
X n+1
(−1)
y2 (x) = J0 (x) ln x + 2 Hn x2n
2n (n!)
n=1 2
y por lo tanto la solución general tendrá la forma

" ∞
#
X (−1)
n+1
2n
y (x) = A1 J0 (x) + A2 J0 (x) ln x + 2 Hn x
n=1 22n (n!)
es costumbre en Fı́sica reacomodar la segunda solución de la forma
" #
2 x X∞ n+1
(−1) 2n
y2 (x) ≡ Y0 (x) = γ + ln J0 (x) + Hn x
π 2 2n (n!)2
n=1 2
donde γ se conoce como la constante de Euler-Mascheroni6 y tiene un valor

1 1 1 1 1
γ = lı́m + + + · · · + + + 1 − ln (n) ∼ = 0,5772
n→∞ n n−1 n−2 3 2
6 Lorenzo Mascheroni (1750-1800) Monje Italiano, nacido en Bergamo, Lombardo-Veneto. Profesor de Algebra y Geometrı́a
en la Universidad de Pavia y luego Rector de la misma. Además de poeta, se destaco por sus contribuciones al Cálculo y a la
Mecánica.

y ası́, finalmente
y (x) = C1 J0 (x) + C2 Y0 (x)
Comportamiento de las funciones de Bessel de orden cero. De primera especie J0 (x) y de segunda
especieY0 (x)
Nótese que tanto la función de Bessel de orden cero, de primera especie, J0 (x) , como la función de Bessel de
orden cero, de segunda especie, Y0 (x) ,tienen un comportamiento oscilatorio cuando x → ∞, que J0 (0) = 1,
mientras que Y0 (x) se comporta como π2 ln x cuando x → 0.
11.8.3. m1 6= m2 ∧ m1 − m2 = N con N entero.

En general, la ecuación indicadora para este caso, m1 − m2 = N ⇒ m1 = N + m2 , con m1 > m2 . Este
caso nos lleva a la ecuación (11.13)
N −1
( n−1
)
X X
m
0 = x {a0 EI (m)} + an EI (m + n) + ak [(m + k) bn−k + cn−k ] xm+n (11.24)
n=1 k=0
( N −1
)
X
+ aN EI (m + N ) + ak [(m + k) bN −k + cN −k ] xm+N + (11.25)
k=0
∞
( n−1
)
X X
+ an EI (m + n) + ak [(m + k) bn−k + cn−k ] xm+n (11.26)
n=N +1 k=0
donde esta m es la menor de las raı́ces y m + N la mayor. Anulando el término {a0 EI (m)} coeficiente de
xm nos lleva a la ecuación indicadora:
EI (m + N ) = (m + N ) (m + N − 1) + b0 (m + N ) + c0 = EI (m) = (m) (m − 1) + b0 (m) + c0 = 0.

por lo tanto EI (m + N ) = 0 anula al coeficiente del término an para n = N , esto es la ecuación (11.12),
consecuentemente eso significa que se derivan dos casos
PN −1
EI (m + N ) = 0 ∧ k=0 ak [(m + N + k) bn−k + cn−k ] = 0
En este caso la solución en serie de Frobenius, partiendo de la raı́z mayor de la ecuación indicadora,
m + N , quedará en términos de a0 y no será linealmente independiente a la solución provista por la
raı́z menor, por consiguiente la solución proveniente de esta raı́z menor, m, será la solución general.
Esto quiere decir que en (11.18) la constante f = 0 y por consiguiente la solución será
" ∞
# "∞ #
m
X m
X
n n
y(x) = a0 kxk 1+ an (m) x + aN kxk an (m + N ) x (11.27)
n=1 n=0
| {z } | {z }
y1 (x) y2 (x)
PN −1
EI (m + N ) = 0 ∧ k=0 ak [(m + N + k) bn−k + cn−k ] 6= 0
En este caso la raı́z mayor de la ecuación indicadora m + N determinará una de las soluciones, la
constante f 6= 0 y la solución general tendrá la forma de
" ∞
#
m1
X
n
y(x) = C1 kxk 1+ an (m1 ) x
n=1
| {z }
y1 (x)
 

 

 " # "∞ #


 X∞ X 
m1 n m2 n
+ C2 f kxk 1+ an (m1 ) x ln x + kxk an (m2 ) x

 


| n=1
{z }
n=0 

 
y1 (x)
| {z }
y2 (x)
La ecuación de Bessel de orden fraccionario puede ilustrar el primero de estos casos, resolvámosla

2 ′′ ′ 2 1
x y +x y + x − y=0
4
una vez más, le expansión en serie de Frobenius de y (x) nos lleva a una ecuación indicadora del tipo


 b0 = 1 ⇐= f1 (x) = 1


1  
  

 1 
m=   
2  1  


c0 = −
4 


⇐= m (m − 1) + m − = 0 ⇐= 
 

−1  4 
 2 1
m=  

  c1 = 0  ⇐= f2 (x) = x − 4
2 
 
 

 
  

  
c2 = 1
los demás coeficientes b1 = b2 = b3 = · · · = bn = 0 y c3 = c4 = · · · = cn = 0. Dado que N = 1 se tiene que la
ecuación (11.12)
 

 

a1 [(m + 1) (m + 1 − 1) + b0 (m + 1) + c0 ] + a0 [b1 (m + 1 − 1) + c1 ] + · · · = 0 (11.28)

 | {z } 

EI(m+N )

 

 


 


 


 

 1
1

1

1

a1 − +1 − + − +1 − + a0 [0] = 0 ⇒ a1 [0] + a0 [0] = 0 (11.29)

 2 2 2 4 


 | {z } 


 ! ! 


 1 

 EI − +1 
2
con lo cual cualquier valor de a1 y a0 estarán permitidos. La relación de recurrencia proviene de anular el
1
coeficiente de xm+n , para m = − . Vale decir
2
X∞
an EI (m + n) + ak [(m + k) bn−k + cn−k ] = 0 ⇒ (11.30)
k=0

1 1 1 1
an − +n − +n−1 + − +n − + an−1 [0] + an−2 [1] = 0 (11.31)
2 2 2 4

an n2 − n = −an−2 (11.32)
los coeficientes serán
1 1
n = 2 =⇒ a2 = − a0 n = 3 =⇒ a3 = − a1
2 6
1 1 1 1
n = 4 =⇒ a4 = − a2 = a0 n = 5 =⇒ a5 = − a3 = a1
12 24 20 120
1 1 1 1
n = 6 =⇒ a4 = − a4 = − a0 n = 7 =⇒ a7 == − a5 = − a1
30 720 42 5040
.. ..
. .
1 1
− 1 1 1 6 − 1 1 5 1 7
y(x) = a0 x 2 1 − x2 + x4 − x + · · · + a1 x 2 − x + x − x + ···
2 24 720 6 120 5040
PN −1
Para considerar el segundo caso, EI (m + N ) = 0 ∧ k=0 ak [(m + N + k) bn−k + cn−k ] 6= 0 analicemos
la ecuación diferencial
x2 y ′′ + x (2 − x) y ′ + 2 − x2 y = 0
una vez más, la expansión en serie de Frobenius de y (x) nos lleva a una ecuación indicadora del tipo
  

  b0 = −2 



 ⇐= f1 (x) = −2 + x

  
 
 b 1 = 1


m=2    
⇐= m (m − 1) − 2m + 2 = 0 ⇐= 
 c0 = 2 

 
 
 

m=1 
  



 c1 = 0 ⇐= f2 (x) = x2 + 2
 
  


  
   

c2 = 1

los demás coeficientes b2 = b3 = · · · = bn = 0 y c3 = c4 = · · · = cn = 0. Dado que N = 1 se tiene que la

ecuación (11.12) para m = 1
a1 [(m + 1) m − 2 (m + 1) + 2] + a0 [m] = a1 [2 − 4 + 2] + a0 [2] = a1 [0] + a0 [1] = 0 (11.33)
y no conduce a nada por cuanto a0 = 0, mientras que, para m = 2 se obtiene
a1 [(m + 1) m − 2 (m + 1) + 2] + a0 [m] = a1 [3 · 2 − 2 · 3 + 2] + a0 [1] = a1 [1] + a0 [1] = 0 (11.34)
por lo cual la relación de recurrencia para m = 2 nos queda

∞
X
an EI (m + n) + ak [(m + k) bn−k + cn−k ] = 0 ⇒ (11.35)
k=0
an [(2 + n) (2 + n − 1) − 2 (2 + n) + 2] + an−1 [1 + n] + an−2 [1] = 0 (11.36)

an n2 + n + an−1 (n + 1) = −an−2 (11.37)
los coeficientes serán

1
n = 2 =⇒ 6a2 = −3a1 − a0 = 3a0 − a0 =⇒ a2 = a0
3
4 1
n = 3 =⇒ 12a3 = −4a2 − a1 = − a0 + a0 =⇒ a3 = − a0
3 36
.. ..
. .

1 1
y1 (x) = a0 x2 1 − x + x2 − x3 + · · ·
3 36
y la segunda solución linealmente independiente será
y2 (x) = u (x) − B1 y1 (x) ln x (11.38)
y queda como ejercicio demostrar la relación de recurrencia para los coeficientes Bn de la serie que describe
∞
!
X
i
u (x) = x Bi x (11.39)
i=0
11.9. Revisitando a Bessel

La Ecuación de Bessel es
x2 y ′′ + xy ′ + x2 − k 2 y = 0; k∈ℜ
obviamente x = 0 es una singularidad regular, por lo tanto el método de Frobenius nos permite afirmar que
si x = x0 corresponde a un polo regular de la ecuación
x2 y ′′ + xP̃ (x) y ′ + Q̃ (x) y = 0;

la solución vendrá expresada de la forma

∞
X
r n
y(x) = (x − x0 ) an (x − x0 )
n=0
con r real y determinado a través de las raı́ces de la ecuación indicadora

r2 + P̃ (x0 ) − 1 r + Q̃(x0 ) = 0
y donde P̃ (x) y Q̃ (x) son funciones analı́ticas en el entorno de x = x0 y por lo tanto

∞
X ∞
X
n n
P̃ (x0 ) = bn (x − x0 ) ∧ Q̃(x0 ) = cn (x − x0 )
n=0 n=0
Para la Ecuación de Bessel

P̃ (x) = 1 ⇒ b0 = 1 ∧ Q̃(x) = x2 − k 2 ⇒ c0 = −k 2 ; c2 = 1
los demás coeficientes b’s y c’s se anulan. La ecuación indicadora y sus raı́ces quedan como
m (m − 1) + m − k 2 = 0 ⇒ m2 = k 2 ⇒ r1,2 = ±k
Donde, para r = k proponemos
∞
X
y1 (x) = xk an xn
n=0
Al hacer las cuentas
∞
X ∞
X

x2 − k 2 y1 (x) = xk an−2 xn − xk k 2 an xn
n=2 n=0
X∞
xy1′ (x) = xk (k + p) an xn
n=0
X∞
x2 y1′′ (x) = xk (k + p) (k + p − 1) an xn
n=0
la ecuación de Bessel queda como

∞
X ∞
X

(k + n) (k + n − 1) + (k + n) − k 2 an xn + an−2 xn = 0
n=0 n=2
∞
X
(2n + 1) a1 x + [k (2n + k) ak + an−2 ] xn = 0
n=2
y por consiguiente obtenemos la relación de recurrencia

an−2
an = −
n (2k + n)
donde es claro que a1 = 0. Adicionalmente, si suponemos
1
a0 =
2k Γ (k + 1)

tendremos
a1 = a3 = a5 = · · · = 0
a0
a2 = −
2 (2k + 2)
a0
a4 =
2 · 4 (2k + 2) (2k + 4)
..
.
n a0
a2n = (−1) 2n
2 n! (k + 1) (k + 2) · · · (k + n)
Por lo tanto, la primera de las soluciones será

∞
X (−1)
n x 2n+k
Jk (x) =
n=0
Γ (n + 1) Γ (n + k + 1) 2
la Función de Bessel, de orden k de primera especie.
Si k = 0 entonces
(−1) x 2n
X∞ n
J0 (x) = 2
n=0 (n!)
2
Para el caso particular de k = m entero positivo la función de Bessel de primera especie toma la forma de
∞
X (−1)
n x 2n+m
Jm (x) =
n=0
n! (n + m)! 2

Para encontrar la segunda solución linealmente independiente de la ecuación de Bessel el método de

Frobenius propone tres casos dependiendo el valor de k

 r1 − r2 6= entero ⇒ k 6= entero
r1 = r2 = r ⇒ k = 0

r1 − r2 = entero ⇒ k = entero
Caso 1: r1 − r2 6= entero ⇒ k 6= entero.

La solución general será de la forma
y(x) = C1 Jk (x) + C2 J−k (x)
donde
∞
X (−1)
n x 2n−k
J−k (x) = x>0
n=0
Γ (n + 1) Γ (n − k + 1) 2
−k
Para x < 0 se debe reemplazar x−k por kxk . Nótese que esta última expresión también es válida para k
semientero, i.e. k = n + 12 .
Caso 2: r1 = r2 = r ⇒ k = 0.
∞
X
K0 (x) = ãn xn + J0 (x) ln x
n=0
y los coeficientes ãn se encuentran mediante el tradicional método de sustituirlos en la ecuación de Bessel
para k = 0
xy ′′ + y ′ + xy = 0;
De donde se obtiene
∞
X ∞
X
xK0 (x) = ãn xn+1 + xJ0 (x) ln x = ãn−2 xn−1 + xJ0 (x) ln x
n=0 n=3
X∞ X∞
′ J0 (x)
K0′ (x) = nãn xn−1 + (J0 (x) ln x) = nãn xn−1 + J0′ (x) ln x +
n=0 n=1
x
X∞
J0 (x)
xK0′′ (x) = n (n − 1) ãn xn−1 + xJ0′′ (x) ln x + 2J0′ (x) −
n=2
x
y por lo tanto
 
∞
X 2 n−1
ã1 + 4ã2 x + n ãn + ãn−2 x + xJ0′′ + J0′ + xJ0  ln x + 2J0′ (x) = 0
| {z }
n=3
= 0
Acomodando y derivando la expresión para J0 tendremos

∞
X ∞
X n+1
2 2n (−1)
ã1 + 4ã2 x + n ãn + ãn−2 xn−1 = −2J0′ (x) = 2 2 x2n−1
n=3 n=1
22n−1 (n!)

Ahora multiplicando la expresión por x y separando las sumatorias en sus términos pares e impares, tendre-
mos
∞ h
X i
2
ã1 x + (2n + 1) ã2n+1 + ã2n−1 x2n+1 = 0
n=1
X∞ h i ∞
X
2 n+1 2n
(2n) ã2n + ã2n−2 x2n + 4ã2 x2 = x2 + (−1) 2x
2n
n=2 n=1 22n (n!)
Por lo cual ã1 = ã3 = ã5 = · · · = 0 mientras que

2 n+1 2n
4ã2 = 1; (2n) ã2n + ã2n−2 = (−1) 2 n>1
22n (n!)
De esta forma los coeficientes quedan como:
1
ã2 =
22
1 1 1 1
ã4 = − 1+ =− 2 1+
2 · 42
2 2 24 · (2!) 2
..
.

n+1
(−1) 1 1 1 1
ã2n = 2 1 + + + + · · · +
22n (n!) 2 3 4 k
La expresión para la solución general de la ecuación de Bessel para k = 0 será

n+1
1 x 2n
X∞
(−1) 1 1 1
K0 (x) = 2 1 + + + + · · · + + J0 (x) ln x
n=0 (n!)
2 3 4 k 2
En Fı́sica, es costumbre expresar esta solución de una forma equivalente pero ligeramente diferente:
n
1 x 2n 2 h x i
∞
2 X (−1) 1 1
Y0 (x) = − 2 1 + + + · · · + + J0 (x) ln + γ
π n=0 (n!) 2 3 k 2 π 2
donde, una vez más, γ = 0,577215664901 · · · es la constante de Euler-Mascheroni.

Caso 3: r1 − r2 = entero ⇒ k = entero.
∞
X
Kk (x) = ãn xk+n + CJn (x) ln x
n=0
Procediendo de forma equivalente a la situación anterior tenemos que la solución general podrá expresarse
(luego de una laboriosa faena) como
1 X (k − n − 1)! x 2n−k Hk x k
k−1
Kk (x) = − − −
2 n=0 n! 2 2k! 2
1 X (−1) [Hn + Hn+k ] x 2n+k
∞ n
− + Jk (x) ln x
2 n=1 n! (k + n)! 2

Y finalmente la Función de Bessel de orden k de segunda especie o Función de Neumann
1 X (k − n − 1)! x 2n−k Hk x k
k−1
Yk (x) = − 2 − −
π n=0 (n!) 2 πk! 2
1 X (−1) [Hn + Hn+k ] x 2n+k 2 h x i
∞ n
− + Jk (x) ln + γ
π n=1 n! (k + n)! 2 π 2
En ambos casos
1 1 1
Hn = 1 + + + ··· +
2 3 n
Más aún
1 X (k − n − 1)! x 2n−k
k−1
2 x
Yk (x) = Jk (x) ln − 2
π 2 π n=0 (n!) 2
∞
1 X (−1)
n x 2n+k
− [ψ(n + 1) + ψ(n + k + 1)]
π n=1 n! (k + n)! 2
Γ′ (n)
donde ψ(n) = es la función Digamma con
Γ(n)
1 1 1
ψ(n + 1) = −γ + 1 + + + ··· +
2 3 n
ψ(1) = −γ
También es costumbre definir la función de Bessel de segunda especie en terminos de las de primera especie
Jk (x) cos kπ − J−k (x)
Nk (x) = Yk (x) =
sen kπ
Nótese que para k = m entero, aparentemente no esta definida. Pero, aplicando la regla de L’Hospital

d
[Jk (x) cos kπ − J−k (x)]

Nm (x) = dk
d
[sen kπ]
dk k=m

d d
−πJn (x) sen nπ + cos nπ Jk (x) − J−k (x)
dk dk
=
π cos nπ

k=m

1 d n d
= Jk (x) − (−1) J−k (x)
π dk dk k=m
De este modo, la soluciónes generales para la ecuación de Bessel, se expresan según el caso en
Zk (x) = C1 Jk (x) + C2 J−k (x); k 6= entero
Z̃k (x) = C1 Jk (x) + C2 Yk (x); k=0 ∨ entero
La funciones Zk (x) y Z̃k (x) se denominan Funciones Cilı́ndricas de orden k

Propiedades de las Funciones de Bessel

11.9.1. Otras Formas de la Ecuación de Bessel

Haciendo los cambios de variables correspondientes llegamos a

1 − 2α ′ 2 α 2 − k 2 ν 2
u′′ (x) + u (x) + βν xν−1 + u(x) = 0
x x2
donde
u(x) = xα Zk (βxν )
o también
u′′ (x) + αxν u(x) = 0
con √
√ 2 α 1+ ν
u(x) = xZ ν+2
1 x 2
ν+2
11.9.2. Relaciones de Recurrencia:

Las funciones de Bessel tienen las siguientes relaciones de recurrencia
xJk+1 (x) − 2k Jk (x) + xJk−1 (x) = 0

Jk+1 (x) + 2Jk′ (x) − Jk−1 (x) = 0
Para demostrar estas relaciones partimos por demostrar la siguiente identidad

k ′
x Jk (x) = xk Jk−1 (x)
−k ′
x Jk (x) = −x−k Jk+1 (x)

De la expresión para Jk (x) se obtiene

" #′
∞
X (−1)
n x 2n+2k ∞
X n
(−1) 2 (n + k) x2n+2k−1
=
n=0
Γ (n + 1) Γ (n + k + 1) 2 n=0
22n+k Γ (n + 1) Γ (n + k + 1)
∞
X n
(−1) x2n+(k−1)
= xk
n=0
22n+(k−1) Γ (n + 1) Γ (n + k)
= xk Jk−1 (x)
Unos cambios apropiados nos llevan a demostrar las segunda de las relaciones y al desarrollar las derivadas
k ′
x Jk (x) = kxk−1 Jk (x) + xk Jk′ (x) = xk Jk−1 (x)
−k ′
x Jk (x) = −kx−k−1 Jk (x) + x−k Jk′ (x) = −x−k Jk+1 (x)
Por lo cual
kJk (x) + xJk′ (x) = xJk−1 (x)

−kJk (x) + xJk′ (x) = −xJk+1 (x)
Al sumar y restar miembro a miembro obtenemos las relaciones de recurrencia. Es obvia la importancia que
adquieren J1 (x) y J0 (x) para generar el resto de las funciones de Bessel.
11.9.3. Funciones de Bessel y Funciones Elementales

1
Las funciones de Bessel de órden semientero, k = 2 se expresa como
r ∞ x 2n
xX
n
(−1)
J1/2 (x) = 3

2 n=0 Γ (n + 1) Γ n + 2 2
pero como
3 3 5 2n + 1 3 1 · 3 · 5 · · · (2n + 1)
Γ n+ = · · ··· =Γ
2 2 2 2 2 2n
se encuentra que
r ∞
xX
n
(−1)
J1/2 (x) = 3
x2n
2 n=0 2n n!Γ 2 1 · 3 · 5 · · · (2n + 1)

x x2 x4 x6
=√ 1− + − + ···
2xΓ 23 2·3 2·4·3·5 2·4·6·3·5·7

1 x3 x5 x7 1
=√ 1− + − + ··· = √ sen x
2xΓ 23 3! 5! 7! 2xΓ 32
3
√
π
Finalmente, y otra vez invocando a las propiedades de la función Gamma: Γ 2 = 2
r
2
J1/2 (x) = sen x
πx

Equivalentemente se puede demostrar que

r
2
J−1/2 (x) = cos x
πx
y ahora utilizando las relaciones de recurrencia tendremos que
1
J3/2 (x) = −J−1/2 (x) + J1/2 (x)
r x
2 h sen x i
= − cos x
πx x
Ası́ mismo
3
J5/2 (x) = −J1/2 (x) + J3/2 (x)
r x

2 3 sen x 3 cos x
= − − sen x
πx x2 x
En general
r
n 2 n+ 1 dn sen x
Jn+ 12 (x) = (−1) x 2 n n = 1, 2, 3, · · ·
π (xdx) x
r
2 n+ 1 dn cos x
Jn+ 12 (x) = x 2 n n = −1, −2, −3, · · ·
π (xdx) x
Las funciones de Bessel de órden semientero son las únicas funciones de Bessel que pueden ser expresadas
en términos de funciones elementales.
11.9.4. Reflexión:
Las funciones de Bessel cumplen con
m
J−m (x) = (−1) Jm (x)
Para el caso k = m entero positivo la Función de Bessel de primera especie toma la forma de
∞
X (−1)
n x 2n+m
Jm (x) =
n=0
n! (n + m)! 2
Si k = −m es un entero negativo los primeros m términos de la serie anterior se anulan ya que Γ(n) → ∞
para n = −1, −2, −3, · · · y la serie se arma como
∞
X (−1) x 2n+m X (−1)
n ∞ x 2l+m
l+m
J−m (x) = =
n=m
n! (n − m)! 2 (l + m)! l! 2
l=0
m
J−m (x) = (−1) Jm (x)

11.9.5. Función Generatriz

La función generatriz para las Funciones de Bessel es
B(x, t) = e 2 (t− t )
x 1
desarrollando las dos series para las exponenciales

xt
x x xn
e 2 = 1 + t + 2 t2 + · · · + n tn + · · ·
2 2 2! 2 n!
x n
x x (−1) xn −n
e 2t = 1 − t−1 + 2 t−2 + · · · + t + ···
2 2 2! 2n n!
Por lo tanto multiplicando ambas series
(∞ )( ∞ ) ∞
X xn X (−1)n xn X
x
B(x, t) = e 2 (t− 1
t ) = t n
t −n
= Jn (x) tn
2n n! 2n n!
n=0 n=0 n=−∞
11.9.6. Representación Integral para las Funciones de Bessel

En la expresión anterior para la función generatriz se realiza el siguiente cambio de varible t = eiθ de este
modo
e 2 (t− t ) = eix sen θ = cos (x sen θ) + i sen (x sen θ)
x 1
y por lo tanto
∞
X
cos (x sen θ) + i sen (x sen θ) = Jn (x) [cos (nθ) + i sen (nθ)]
n=−∞
m
igualando partes reales e imaginarias y recordando que J−m (x) = (−1) Jm (x), para anular los términos
impares en la serie de la parte real y los pares en la de la parte imaginaria, podemos escribir
∞
X
cos (x sen θ) = J0 (x) + 2 J2n (x) cos (2nθ)
n=1
∞
X
sen (x sen θ) = 2 J2n+1 (x) sen ([2n + 1] θ)
n=0
Multiplicando miembro a miembro en la primera de ellas por cos (2kθ) (y por cos ([2k + 1] θ) ) y la segunda
por sen ([2k + 1] θ) (y por sen (2kθ)). Integrando (en 0 ≤ θ ≤ π), también miembro a miembro y término por
término en las series, se obtienen
Z
1 π
J2n (x) = cos (x sen θ) cos (2nθ) dθ
π 0
Z
1 π
0= cos (x sen θ) cos ([2n + 1] θ) dθ
π 0
Z π
1
J2n+1 (x) = sen (x sen θ) sen ([2n + 1] θ) dθ
π 0
Z π
1
0= sen (x sen θ) sen (2nθ) dθ
π 0

Sumando miembro a miembro primera con cuarta y segunda con tercera tendremos la expresión integral
para las funciones de Bessel Z
1 π
Jn (x) = cos (cos (nθ) − x sen θ) dθ
π 0
ya que todos sabemos que
cos (nθ − x sen θ) = cos (2nθ) cos (x sen θ) + sen (2nθ) sen (x sen θ)
11.9.7. Ortogonalidad de las Funciones de Bessel

Ortogonalidad:
Haciendo el caso particular de α = 0 y ν = 1 en la primera de las expresiones equivalentes para la
ecuación de Bessel, tendremos
1 k2
u′′ (x) + u′ (x) + β 2 − 2 u(x) = 0
x x
donde
u(x) = Jk (βx)
multiplicando por x la ecuacion diferencial puede ser reescrita como

′ ′ 2 k2
[xJk (βx)] + β x − Jk (βx) = 0
x
suponiendo k real y positivo, planteamos la ecuación para dos ı́ndices diferentes β1 y β2 por lo tanto quedan
como

′ k2
[xJk′ (β1 x)] + β12 x − Jk (β1 x) = 0
x

′ k2
[xJk′ (β2 x)] + β22 x − Jk (β2 x) = 0
x
Multiplicando apropiadamente por Jk (β1 x) y Jk (β2 x), Integrando y restando miembro a miembro tendremos
que
Z Z 1n o
1 ′ ′
β22 − β12 xJk (β1 x)Jk (β2 x)dx = Jk (β2 x) [xJk′ (β1 x)] − Jk (β1 x) [xJk′ (β2 x)] dx
0 0
Z 1
′
= [Jk (β2 x)xJk′ (β1 x) − Jk (β1 x)xJk′ (β2 x)] dx
0
x=1
= Jk (β2 x)xJk′ (β1 x) − Jk (β1 x)xJk′ (β2 x)|x=0
para βi las raı́ces de los polinomios de Bessel, i.e. Jk (βi ) = 0 podemos deducir que las funciones de Bessel
son ortogonales Z
1
βi2 − βj2 xJk (βi x)Jk (βj x)dx ∝ δij
0
Más aún partiendo de la ecuación de Bessel original se puede llegar a
2 1 ′ 2 β 2 − k2 2
kJk (βx)k = [Jk (β)] + [Jk (β)]
2 2β 2

11.10. Algunas funciones Especiales

11.10.1. Función Gamma e Integrales de Probabilidad
Es la generalización del factorial n! el cual sólo está definido para enteros, mientras que Γ (z) está definida
para toda variable compleja z con parte real positiva.
Γ (z) se define indistintamente como:
Z ∞ Y
Γ (z) = e−t tz−1 dt ≡ (z − 1)! ≡ (z − 1) Re z > 0
0
1 · 2 · 3 · ··· · n
Γ (z) = lı́m nz
z (z + 1) (z + 2) · · · (z + n)
n→∞
∞ z
1 γz
Y z −
= ze 1+ e n
Γ (z) n=1
n
donde n es un entero positivo y

γ = 0,577215664901 · · ·
se conoce como la constante de Euler-Mascheroni:
También es frecuente encontrar Γ (z) con algunas variantes cosméticas:
Z ∞ Z 1 z−1 Z ∞
−t2 2z−1 1 z
Γ (z) = 2 e t dt = ln dt = k e−kt tz−1 dt
0 0 t 0
Para probar la equivalencia de las dos primeras definiciones inventamos las siguiente función de dos variables
Z n n
t
F (z, n) = 1− tz−1 dt Re z > 0
0 n
y como es conocido que n

t
lı́m 1− ≡ e−t
n→∞ n
Entonces Z ∞
lı́m F (z, n) = F (z, ∞) = e−t tz−1 dt ≡ Γ (z)
n→∞ 0
Con lo cual queda demostrada la primera de propuestas de Euler.
Para construir la segunda partimos de la misma función F (z, n) y un cambio estratégico de variable
u = nt . Z n
n
F (z, n) = nz (1 − u) uz−1 du Re z > 0
0
Un par de integraciones por partes nos llevan a comprobar
( Z )
z 1
z n u n 1 n−1 z
F (z, n) = n (1 − u) + (1 − u) u du
z 0 z 0
( 1 Z )
z n−2 z+1 n(n − 1) n(n − 1) 1 n−2 z+1
=n (1 − u) u + (1 − u) u du
z(z + 1) 0 z(z + 1) 0

que el primer término se anula siempre. Repitiendo el proceso n veces

Z 1
z n(n − 1)(n − 2)(n − 3) · · · 3 · 2 · 1
F (z, n) = n uz+n−1 du
z(z + 1)(z + 2)(z + 3) · · · (z + n − 1) 0

z n(n − 1)(n − 2)(n − 3) · · · 3 · 2 · 1
=n
z(z + 1)(z + 2)(z + 3) · · · (z + n)
Una vez más, haciendo

z n(n − 1)(n − 2)(n − 3) · · · 3 · 2 · 1
lı́m F (z, n) = F (z, ∞) = lı́m n ≡ Γ (z)
n→∞ n→∞ z(z + 1)(z + 2)(z + 3) · · · (z + n)
Se completa la equivalencia para la primera y segunda definiciones de Euler.
En particular, de la primera de las definiciones se tiene por integración directa
Z ∞
Γ (1) = e−t dt = 1
0
Z ∞ Z ∞
1 −t −1/2 2 √
Γ = e t dt = e−u du = π
2 0 0
mientras que de la segunda, si z = n = 1, 2, 3, · · · , se obtiene

Γ (n + 1) = n!

1 1 · 3 · 5 · · · · (2n − 1) √
Γ n+ = π
2 2n
Finalmente la tercera de las definiciones de la función Γ (z) viene expresada en término de un producto
infinito (Weierstrass). Este puede demostrarse partiendo de la segunda definición de Euler
1 · 2 · 3 · ··· · n
Γ (z) = lı́m nz
n→∞ z (z + 1) (z + 2) · · · (z + n)
n
1 Y z −1 z
n
1 Y m
= lı́m nz = lı́m 1+ n
n→∞ z m+z n→∞ z m
m=1 m=1
Por lo tanto
n
1 Y z −z ln n
= z lı́m 1+ e
Γ (z) n→∞
m=1
m
Ahora bien, multiplicando y dividiendo por
n
Y Pn
ez/m = ez( )
1
m=1 m
m=1
nos queda ( )
1 n Pn o n
Y z −z/m
= z lı́m ez(( m=1 )−ln n)
1
m lı́m 1+ e
Γ (z) n→∞ n→∞
m=1
m
Donde, la serie exponente del primero de los términos converge a un valor constante y cual ha quedado
bautizado como la constante de Euler-Mascheroni
( n ! )
1 1 1 1 X 1
γ = lı́m 1 + + + + · · · − ln n = lı́m − ln n
n→∞ 2 3 4 n n→∞
m=1
m
γ = 0,5772156649015328606065112 · · ·

Con lo cual queda demostrada la tercera de las propuestas para expresar la Función Gamma
∞ z
1 Y z −
= zeγz 1+ e n
Γ (z) n=1
n
Es fácil comprobar las siguientes propiedades
Γ (z + 1) = z Γ (z)
Z ∞ z−1
x dx π
Γ (z) Γ (1 − z) = =
0 (1 + x) sen πz

1 √
22z−1 Γ (z) Γ z + = πΓ (2z)
2
La primera de ellas (la relación de recurrencia) es trivial y se obtiene integrando por partes la definición
integral de Euler.
Z ∞ Z ∞
−t z

−t z−1 ∞
Γ (z + 1) = e t dt = z e t 0
+z e−t tz−1 dt = zΓ (z)
0 0
El primer sumando de la integración por partes se anula siempre. Esta propiedad es válida ∀z con z 6=
0, −1, −2, · · · .
La segunda de las propiedades (fórmula de reflexión) se comprueba también partiendo de definición
integral de Euler con el siguiente cambio de variable t = u2 .
Z ∞ Z ∞
2 2
Γ (z) Γ (1 − z) = 2 e−u u2z−1 du 2 e−v v 1−2z dv
Z0Z ∞ 0
2z−1
−(u2 +v 2 ) u
=4 e dudv
0 v
si ahora hacemos u = ρ cos ϕ y v = ρ sen ϕ, la integral anterior queda como
Z ∞ Z π/2
−ρ2
Γ (z) Γ (1 − z) = 4 ρe dρ cot2z−1 ϕdϕ
0 0
Z π/2
1
=4· cot2z−1 ϕdϕ
2 0
Finalmente, si
√ −dx
ϕ = arccot x; dϕ = √
2 x (1 + x)
nos queda Z ∞
xz−1 dx π
Γ (z) Γ (1 − z) = =
0 (1 + x) sen πz
Es inmediato volver a comprobar
1 √
Γ = π
2
Del mismo modo, si utilizamos además la relación de recurrencia encontramos
π
Γ (z) Γ (−z) =
−z sen πz

La fórmula de duplicación y puede comprobarse partiendo de la definición del lı́mite de Euler, ası́

22z−1 Γ (z) Γ z + 21 √
= π
Γ (2z)
Hay que hacer notar que en el numerador sustituimos directamente las expresiones para del lı́mite de Euler
y en la del denominador, adicionalmente sustituimos n por 2n
1 · 2 · 3 · ··· · n 1 · 2 · 3 · · · · · 2n 2z
Γ (2z) = lı́m n2z = lı́m (2n)
n→∞ 2z (2z + 1) · · · (2z + n) n→∞ 2z (2z + 1) · · · (2z + 2n)
por lo cual se tiene la siguiente expresión dentro del argumento del lı́mite
!
1 · 2 · 3 · ··· · n 1 · 2 · 3 · ··· · n z+ 21
22z−1 n z n
z (z + 1) (z + 2) · · · (z + n) z + 21 z + 32 · · · z + 1
2 +n

1 · 2 · 3 · · · · · 2n 2z
(2n)
2z (2z + 1) (2z + 2) · · · (2z + 2n)
la cual se reacomoda como

2 1
22z−1 (n!) 2z (2z + 1) (2z + 2) · · · (2z + 2n) n2z+ 2
lı́m 1
3
1
· 2z
2 (z + 1) z + 2 (z + 2) · · · z + 2 + n (z + n) (2n)
n→∞ (2n)! z z +
y 2 1
z z + 21 (z + 1) z + 32 (z + 2) · · · z + n2 2n−1 22z−1 (n!) nz+ 2
lı́m · ·
n→∞ z z + 1 (z + 1) z + 3 (z + 2) · · · z + 1 + n (z + n) (2n)! 22z n2z
2 2 2
Entonces
1 2√
22z−1 Γ (z) Γ z + 2 2n−2 (n!) n
= lı́m
Γ (2z) n→∞ (2n)!
por lo cual se deduce que el valor de lado izquierdo de la ecuación es independiente del valor de z por lo
tanto es el mismo valor para cualquier z y lo evaluamos para z = 21

22z−1 Γ (z) Γ z + 12 1 √
=Γ = π
Γ (2z) 2
con lo cual queda comprobada la fórmula de duplicación.

Otras propiedades que van quedar como curiosidad y sin demostración son:
(1−n)/2 1
Y
n−1
k

Γ (nz) = (2π) nnz− 2 z+
n
k=0

z z! Γ (z + 1)
= =
w w!(z − w)! Γ (w + 1) Γ (z − w + 1)
A partir de Γ (z) se definen otras funciones especiales, las cuales se expresan conjuntamente con sus propie-
dades como

11.10.2. La Funciones Digamma y Poligamma

,
Para evitar tratar con derivadas de los factoriales es costumbre trabajar con sus derivadas logarı́tmicas.
A partir de la segunda definición
1 · 2 · 3 · ··· · n
Γ (z + 1) = z! = lı́m nz
n→∞ (z + 1) (z + 2) · · · (z + n)

1 · 2 · 3 · ··· · n
ln (z!) = ln lı́m nz
n→∞ (z + 1) (z + 2) · · · (z + n)
= lı́m (ln (n!) + z ln n − ln (z + 1) − ln (z + 2) − · · · − ln (z + n))

n→∞
ahora derivando,

d 1 1 1
ln (z!) ≡ F(z) = lı́m ln n − − − ··· −
dz n→∞ (z + 1) (z + 2) (z + n)
y finalmente acomodando, para llegar a la definición más conocida

∞
X
1 1
F(z) = −γ − −
n=1
(z + n) n
También se le conoce como función Psi

Γ′ (z) d d
ψ(z) = = ln (Γ (z)) ≡ F(z − 1) = ln ((z − 1)!)
Γ (z) dz dz
con las siguientes propiedades

1
+ ψ(z)
ψ(z + 1) =
z
ψ(z − 1) − ψ(z) = π cot πz

1
ψ(z) + ψ z + + 2 ln 2 = 2ψ(2z)
2
De donde se pueden deducir

ψ(1) = Γ′ (1) = γ
La función ψ(z) puede ser expresada en términos de integrales definidas, para ello notamos que
Z ∞
Γ′ (z) = e−t tz−1 ln t dt
0
y sustituyendo la identidad de Frullani

Z ∞
e−x − e−xt
ln t = dx
0 x

tendremos
Z ∞ Z ∞ −x
e − e−xt
Γ′ (z) = e−t tz−1 dx dt
x
Z0 ∞ Z ∞ 0
dx
= e−x − e−xt e−t tz−1 dt
x
Z0 ∞ 0
Z Z ∞ Z
dx −x ∞ −t z−1 dx ∞ −t(x+1) z−1
= e e t dt − e t dt
0 x 0 0 x 0
Z ∞
dx h −x −z
i
= Γ (z) e − (x + 1)
0 x
R∞
ya que Γ (z) = k z 0
e−kt tz−1 dt y por lo tanto
Z ∞
dx h −x −z
i
ψ(z) = e − (x + 1)
0 x
También daremos (sin demostración) otras expresiones

Z ∞ −t
e e−tz
ψ(z) = − dt
0 t 1 − e−t
Z 1
1 − xz−1
ψ(z) = −γ + dx
0 1−x
La Función Poligamma se obtiene derivando en forma repetida la Función Digamma

X∞
dm 1
ψ (m) (z + 1) = F(m) (z) = m
F(z) = (−1)m+1
m! m+1 m = 1, 2, 3 · · ·
dz n=1 (z + n)
y cuya serie puede ser expresada en términos de la función Zeta de Riemman

X∞
1
ζ(m) ≡ m
n=1
n
como
F(m) (0) = −1)m+1 m!ζ(m + 1)
de esta forma es posible desarrollar en serie de Maclaurin
z2 z3 n z
n
ln(n!) = −γ + ζ(2) − ζ(3) + · · · + (−1) ζ(n) + · · ·
2 3 n
11.10.3. La Aproximación de Stirling

El comportamiento asintótico de las funciones especiales será tratado en una clase aparte. Pero la impor-
tancia de la Aproximación de Stirling obliga a que se trate en este punto. Supongamos que consideramos el
caso z ≡ x ∈ ℜ. Por lo cual estamos interesados en el caso x ≫ 1. Partimos de
Z Z
1 1 ∞ −t x 1 ∞ −t+x ln t
Γ (x) = Γ (x + 1) = e t dt = e dt
x x 0 x 0

haciendo t = xu tenemos que Z ∞

Γ (x) = xx e−x(u−ln u) du
0
Ahora bien, el integrando tendrá su máximo en u = 1 donde la exponencial tiene su mı́nimo y es entorno a
ese punto que desarrollará en series de Taylor
1 2 1 3 1 4
u − ln u = 1 + (u − 1) − (u − 1) + (u − 1) + · · ·
2 3 4
por lo cual Z Z
∞ ∞
2
− 13 (u−1)3 +··· )
du e−x(1+ 2 (u−1)
1
Γ (x) = xx e−x(u−ln u) du ≈ xx du
0 0
√
Otro cambio de variable v = x (u − 1) nos lleva
Z
xx e−x ∞ − 21 v 2 1 3 1 4 1 5
Γ (x) ≈ √ dve exp √ v − v + 3 v − ···
x −√x 3 x 4x 5x 2
Para valores x ≫ 1 se expande, en series de Taylor los exponenciales que contengan términos √1
x
Z
xx e−x ∞ 1 2 1 1 4 1 5
Γ (x) ≈ √ dve− 2 v 1 + √ v3 − v + 3 v − · · · +
x −∞ 3 x 4x 5x 2
2
1 1 3 1 4 1 5
+ √ v − v + 3 v − ··· +
2! 3 x 4x 5x 2
3 )
1 1 3 1 4 1 5
+ √ v − v + 3 v − ··· + ···
3! 3 x 4x 5x 2
Finalmente, utilizando que

 √
Z ∞  √2π n=0
− 12 v 2
dve vn = 2π · 1 · 3 · 5 · · · · (n − 1) n = 2k
−∞ 
0 n = 2k − 1
e integrando término a término, tendremos que

r
2π x −x 1 1
Γ (x) ≈ x e 1+ + + · · ·
x 12x 288 x2
11.10.4. La función Beta
Z 1
y−1
B(x, y) = tx−1 (1 − t) dt Re x > 0 ∧ Re y > 0
0
Γ (x) Γ (y)
B(x, y) =
Γ (x + y)

La Función Integral de Probabilidad

La función Integral de Probabilidad para una variable compleja arbitraria z como
Z z
2 2
Φ(z) = √ e−t dt
π 0
Obviamente Φ(0) = 0 y Φ(∞) = 1. A partir de esta función se define la Función Error y su complemento
Z z √
2 π
erf(z) = e−t dt =Φ(z)
0 2
Z z √
2 π
erf c(z) = e−t dt = [1 − Φ(z)]
z 2
Función Gamma Incompleta γ (z, α) y

Función Gamma Complementaria Γ (z, α)
Z α
γ (z, α) = e−t tz−1 dt
0
Z ∞
Γ (z, α) = e−t tz−1 dt
α
las cuales claramente cumplen con

γ (z, α) + Γ (z, α) = Γ (z)
y resumen
γ (z + 1, α) = zγ (z, α) − αz e−α
Γ (z + 1, α) = zΓ (z, α) + αz e−α

Bibliografı́a
York).
ción).
[4] W. E. Boyce y R.C. DiPrima. Elementary Differential Equations and Boundary Problems. (8th
Edition) John Wiley, New York, 2004. (Existe Traducción)

[8] A. Kiseliov, M. Krasnov y G. Makarenko. Problemas de Ecuaciones Diferenciales Ordinarias.
Mir, Moscú, 1969.
[9] N. N. Lebevedev (1972) (Special Functions and Their Applications. Dover, New York )

[11] M. Tenenbaun y H. Pollard (1963) Ordinary Differential Equations (Harper and Row, New York).
485

Colección
Libros de Matemática
en PDF
Esta colección no es más que una

recopilación, sin ánimo de lucro y
distribuida solo con fines educativos,
de diferentes obras autoeditadas y
apuntes docentes elaborados por
Universidades, Institutos y Escuelas
Técnicas, que generalmente ponen al
alcance de sus estudiantes, sobre
diferentes temas de matemáticas,
física, ingeniería y ciencias afines,
ahora reunidas bajo el sello del grupo
"Libros de Matemática en PDF".
Libros de Matemática en PDF
Todos los derechos pertenecen a sus respectivos autores.

Solo con fines educativos

Métodos de La Física Matemática - Hector Hernández&Victor Nuñez PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Métodos de La Física Matemática - Hector Hernández&Victor Nuñez PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Métodos de la

Solo con fines educativos

Universidad de Los Andes

Universidad de Los Andes

Universidad Industrial de Santander

1. Los vectores de siempre 10

1.10.1. Los números complejos y su álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2. Espacios Vectoriales Lineales 58

3. Vectores Duales y Tensores 88

Luis A. Núñez Universidad Industrial de Santander 3

3.7. Teorema del Cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

4. Coordenadas Curvilineas 124

5. Campos y Operadores Diferenciales 146

Luis A. Núñez Universidad Industrial de Santander 4

6. Matrices, Determinantes y Autovectores 190

Luis A. Núñez Universidad Industrial de Santander 5

7. Serie de Series 242

8. La Variable Compleja 303

Luis A. Núñez Universidad Industrial de Santander 6

8.6.2. Algunas consecuencias y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

9. Ecuaciones Diferenciales Ordinarias de Primer Orden 343

10.Ecuaciones Diferenciales Ordinarias de Orden Superior 391

Luis A. Núñez Universidad Industrial de Santander 7

10.4.4. Métodos de Reducción de Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402

11.Series y Ecuaciones Diferenciales Ordinarias 441

Luis A. Núñez Universidad Industrial de Santander 8

11.10.4.La función Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483

Luis A. Núñez Universidad Industrial de Santander 9

Los vectores de siempre

1.1. Para comenzar

1.2. Vectores y escalares y álgebra vectorial

1.2.1. Escalares y vectores

Luis A. Núñez Universidad Industrial de Santander 11

Figura 1.1: Vectores y sus operaciones

1.2.2. Algebra de vectores

Luis A. Núñez Universidad Industrial de Santander 12

Figura 1.2: Ejemplos de vectores atados

Luis A. Núñez Universidad Industrial de Santander 13

• tiene un único elemento neutro 0 + ~a = ~a + 0 = ~a ∀~a

La multiplicación de escalares por vectores

• es conmutativa ~aµ = µ~a

1.3. Independencia lineal y las bases para vectores

µ~a + ν~b + γ~c = 0 ⇒ µ=ν=γ=0

Dos vectores linealmente dependientes son colineales. Es claro que

Luis A. Núñez Universidad Industrial de Santander 14

1.4. Productos de vectores

Luis A. Núñez Universidad Industrial de Santander 15

Figura 1.3: Productos de Vectores

El producto escalar es conmutativo ζ = ~a · ~b = ~b · ~a ya el ángulo entre los vectores es el mismo y la

Desigualdad de Cauchy Schwarz. A partir de la deﬁnición de producto interno es inmediata la compro-

Luis A. Núñez Universidad Industrial de Santander 16

1.4.2. Producto vectorial

Otra vez, podemos deducir algunas consecuencias de esta deﬁnición.

El producto vectorial es anticonmutativo. Esto es ~a × ~b = −~b × ~a y se sigue de la deﬁnición que expresa

La multiplicación por un escalar. Nos conduce rápidamente a

Luis A. Núñez Universidad Industrial de Santander 17

1.4.3. Una división fallida

1.4.4. Producto triple o mixto

El producto mixto es cı́clico respecto a sus factores. Esto es

Esta aﬁrmación se verá demostrada más adelante

el producto mixto se anula cuando se repite alguno de sus factores

Luis A. Núñez Universidad Industrial de Santander 18

Figura 1.4: Vectores, bases y componentes