Anda di halaman 1dari 181

Capı́tulo 1

Ondas electromagnéticas

Versión 1 de noviembre de 2016

1.1. Electrodinámica clásica


1.1.1. Ecuaciones de maxwell
Formulaciones
Las ecuaciones Maxwell permiten calcular los campos eléctrico, E(~ ~ r, t), y
~
magnético, B(~r, t), a partir de las densidades de carga eléctrica, ρ(~r, t), y
de corriente eléctrica, ~(~r, t). Se pueden escribir en más de un sistema de
unidades; en particular en el sistema gaussiano tienen la siguiente expresión:
~ = 4πρ ,
∇·E (1.1)
~ = 0,
∇·B (1.2)
~
∇×E ~ = − 1 ∂B , (1.3)
c ∂t
~
∇×B ~ = 4π ~ + 1 ∂ E . (1.4)
c c ∂t
Este sistema presupone unidades cgs y la carga dada en términos de la uni-
dad electrostática de carga, ue [=g1/2 cm3/2 s−1 ], también denominada stat-
coulomb. La carga elemental, dada por el electrón, es
−e ' 4.803 204 × 10−10 ues ,
y los campos eléctrico y magnético expresados en stat-Volt/cm [= g1/2 cm−1/2 s−1 ].
Este sistema integra como constante la velocidad de la luz, c = 299 792 458 cm s−1 .

1
Alternativamente, estas ecuaciones se pueden expresar en el sistema in-
ternacional (SI),
~ = ρ/ε0 ,
∇·E ~ = 0,
∇·B
~ ~
~ = − ∂B ,
∇×E ~ = µ0~ + µ0 ε0 ∂ E .
∇×B (1.5)
∂t ∂t
Estas unidades emplean diferentes unidades para los campos eléctrico y
magnético, con ESI = cEcgs , e introducen las constantes ε = 1/4πc, la
permitividad del vacı́o, y µ0 = 4π/c, la permeabilidad magnética del vacı́o,

de las cuales se calcula la velocidad de la luz, c = 1/ µ0 ε0 .
Las dos formulaciones anteriores presuponen campos en el vacı́o, o en
términos microscópicos. La formulación macroscópica para un medio de per-
mitividad ε y permeabilidad magnética µ es,

∇·D~ = ρ, ~ = 0,
∇·B
~ ~
~ = − ∂B ,
∇×E ~ = ~ + ∂ D ,
∇×H (1.6)
∂t ∂t
~ = εE,
con D ~ el campo de desplazamiento, y H ~ = B/µ,
~ el campo magnético,
~ siendo ahora la inducción magnética.
con B
En lo que sigue se emplearán las expresiones gaussianas, ecs. ?? a ??.

Principio de superposición e invariancia


Las ecuaciones de Maxwell son lineales, por lo que cumplen el principio
de superposición: la suma de dos soluciones es también una solución. Las
ecuaciones son invariantes ante transformaciones de Lorentz y, por tanto,
consistentes con la relatividad especial (cap4).

Ley de Coulomb - caso electrostático


La ley de Coulomb expresa el campo eléctrico ocasionado por una carga
puntual en reposo:
~ q
E(r) = 2 r̂ . (1.7)
r
El campo eléctrico se puede describir en términos de lı́neas de campo que
parten radiálmente de la carga. Las lı́neas convergen o divergen de la carga,
dependiendo de su signo (Figura ??). Se verifica que esta expresión cumple
con la ecuación de Maxwell ?? al integrarla sobre volumen:
Z Z Z  
~ =
∇·E 4πρ ⇒ ~ · n̂ da = 4πq ,
E (1.8)
V V A(V )

2
Figura 1.1: Las lı́neas de campo eléctrico divergen de una carga puntual
positiva. Para una carga negativa se invierten las flechas.

siendo q la integral de ρ(~r) sobre un volumen V que contiene a la carga.


Para un volumen esférico centrado en q, tenemos que el vector normal a
la superficie es radial, n̂ = r̂, y siendo el área de una esfera A = 4πr2 ,
recobramos la ley de Coulomb, ec. ??.
En el caso estacionario, la ecuación ?? queda como ∇× E~ = 0, permitien-
~
do definir el potencial electrostático φ(~r) como E(~r) = −∇φ. El potencial
satisface la ecuación de Poisson, ∇2 φ = −4πρ, que para una carga puntual
situada en ~r0 tiene como solución,
q
φ(~r) = , (1.9)
|~r − r~0 |

de manera compatible con la ec. ??. De acuerdo al principio de superposición


el campo electrostático de un conjunto discreto de N cargas,
N
X
ρ(~r) = qi δ (~r − ~ri )
i=1

está dado por


N
~ r) =
X qi (~r − ~ri )
E(~ .
i=1
|~r − ~ri |3
Para el caso de una distribución continua de cargas ρ(~r) el campo elec-

3
trostático queda como,
 
Z ρ(r~0 ) ~r − r~0
~ r) =
E(~ d3 r0 . (1.10)
|~r − r~0 |3

La ecuación ??, ∇ · B = 0, implica la inexistencia de cargas magnéticas.


Al integrarla sobre un volumen tenemos el mismo número de lı́neas saliendo y
entrando a través de la superficie A que encierra al volumen en consideración,
es decir I
~ · dâ = 0 .
B (1.11)
A
lo cual puede ilustrarse con un volumen de simetrı́a cilı́ndrica (figura ??), en
donde las lı́neas que entran (B~ ·dâ < 0) por la parte inferior de una superficie
son las mismas que salen (B ~ · dâ > 0) por la parte superior: las lı́neas de
campo magnético no divergen o convergen en ningún punto. Un punto de
convergencia corresponderı́a con una carga magnética - o monopolo. Otra
consecuencia de la ec. ?? es la posibilidad de escribir B ~ en términos del
~ ~ ~
potencial vectorial A como B = ∇× A, que por definición satisface ∇· B ~ = 0.

Figura 1.2: Lı́neas de campo magnético atravesando un volumen cilı́ndrico.


El número de lı́neas entrando por un lado de una superficie iguala al número
~ es nula.
de lı́neas salientes; la divergencia de B

4
Ley de Ampere - caso magnetostático
En el caso estacionario, sin dependencia temporal, la ecuación ?? se escribe
como
∇×B ~ = 4π ~j,
c
~ ~
con j = j(~r). Esta ecuación proviene de la ley de Ampere, que se recupera
al integrar sobre una superficie normal a ~j,

~ = 4π I ~ · ~` = 4π I .
Z I
∇×B ⇒ B (1.12)
A c C c
Si consideramos una superficie acotada por un cı́rculo de radio R, normal n̂
y vector tangente ϕ̂ la ley de Ampere resulta en

~ = 2I ϕ̂,
B
Rc
al dividir por 2πR, la circunferencia de C. El campo magnético correspon-
diente a una corriente I que lleva un cable lineal infinito decae como 1/R,
siendo R la distancia a la recta.
Maxwell generalizó la ley de Ampere al introducir la corriente de despla-
zamiento en la ecuación ??. El término añadido por Maxwell corresponde a
la inducción de un campo magnético por un campo eléctrico variable en el
tiempo - fuera del caso magnetostático.

Ley de inducción de Faraday


La ecuación ?? corresponde a la ley de inducción de Faraday, la cual describe
la inducción de un campo eléctrico por un campo magnético dependiente del
tiempo. Al integrar sobre una superficie obtenemos que el voltaje inducido,
φ(~r, t), está dado por el cambio con el tiempo del flujo magnético, Φm :

~ · d`ˆ = 1 ~ · dâ = 1 dΦm ,


I Z
φ(~r, t) = − E B (1.13)
C c A c dt
con C la trayectoria definida por la frontera de la superficie A. Un campo
magnético dependiente del tiempo que atraviesa un circuito induce un campo
eléctrico, o voltaje, (fig. ??).

1.1.2. Ecuación de continuidad


De las ecuaciones de Maxwell puede obtenerse la ecuación de continuidad,
∂ρ
+ ∇ · ~ = 0 , (1.14)
∂t

5
Figura 1.3: Un campo magnético con dependencia armónica en el tiempo
induce un voltaje con misma dependencia temporal al atravesar un circuito.

que describe la conservación de carga eléctrica. La integral de la expresión ??


sobre un volumen cerrado V acotado por una superficie A implica,
dQ
Z
=− ~j · d~a,
dt A

el cambio de la carga Q contenida en V está dada por la “entrada” y “salida”


de lı́neas de corriente a través de la superficie A: donde converge (diverge)
la densidad de corriente aumenta (disminuye) la densidad de carga.

1.1.3. Fuerza de Lorentz y Teorema de Poynting


En presencia de campos electromagnéticos actúa sobre toda carga q, mo-
viéndose con velocidad ~v , la denominada fuerza de Lorentz:

~ + ~v × B
 
F~ = q E ~ . (1.15)
c
La fuerza de Lorentz proporciona una aceleración paralela al campo eléctrico
y perpendicular al campo magnético. En el caso de campos con una direc-
~ y girar
ción fija la tendencia de una carga es moverse en la dirección de E
~
alrededor de las lı́neas de campo magnético B.
El teorema de Poynting proporciona una relación análoga a la ecuación
de continuidad, que se deriva de estimar el trabajo que realiza la fuerza de
Lorentz sobre un conjunto de cargas discretas. Definiendo la densidad de

6
energı́a del campo electromagnético,
1  2 
u≡ E + B2 , (1.16)

y el flujo de energı́a electromagnética, o vector de Poynting:

~≡ c E
 
S ~ ×B
~ , (1.17)

obtenemos de las ecuaciones de Maxwell la relación:
∂u ~ = −~ · E
~.
+∇·S (1.18)
∂t
La diferencia principal entre la ecuación ?? y la ecuación ?? radica en el
término de la derecha: mientras que la carga eléctrica es una cantidad que
se conserva, la energı́a electromagnética puede no conservarse y ser disipada
o producida. El principio de conservación de la energı́a se mantiene ya que
la energı́a electromagnética disipada se convierte en otro tipo de energı́a,
~ corresponde con la ley de Ohm.
como mecánica o térmica. El término ~ · E

1.1.4. Potenciales electromagnéticos


Las ecuaciones de Maxwell pueden escribirse alternativamente en términos
~ y ϕ, derivados de las dos ecuaciones
de los potenciales electromagnéticos, A
~
homogéneas. El potencial vectorial A define al campo magnético,
~ = ∇ × A,
B ~ (1.19)

satisfaciendo automáticamente la ecuación ??, ya que la divergencia de un


rotacional es nula. El campo eléctrico puede definirse entonces a partir de
ambos potenciales, escalar y vectorial:
~
~ = −∇ϕ − 1 ∂ A ,
E (1.20)
c ∂t
dado que la divergencia de un gradiente es cero. Con estas definiciones, la
dos ecuaciones homogéneas de Maxwell se satisfacen automáticamente. La
substitución de los potenciales en las ecuaciones inhomogéneas da:
1∂  ~

∇2 ϕ +∇·A = −4πρ , (1.21)
c ∂t
2~
~− 1 ∂ A −∇ ∇·A~ + 1 ∂ϕ 4π
 
∇2 A 2 2
= − ~ . (1.22)
c ∂t c ∂t c

7
Estas ecuaciones pueden simplificarse aprovechando que los potenciales no
están definidos de manera unı́voca. Dada una función escalar arbitraria ψ,
podemos reemplazar el potencial vectorial A ~ por A ~0 = A~ + ∇ψ y el po-
0
tencial escalar ϕ por ϕ = ϕ − (1/c)(∂ψ/∂t) , sin dejar de cumplir con las
ecuaciones homogéneas de Maxwell. El seleccionar la función ψ de manera
a cumplir ciertas condiciones corresponde a la elección de una norma. En la
práctica hay dos normas que permiten simplificar las ecuaciones ?? y ??: la
norma de Coulomb y la norma de Lorentz.

La norma de Coulomb:
~ = 0,
∇·A (1.23)
es conveniente para tratar problemas de electrostática. La primera de las
ecuaciones de Maxwell queda como una ecuación de Poisson, ∇2 ϕ = −4πρ,
de solución general
ρ(~r0 , t) 3 0
Z
ϕ(~r, t) = d r . (1.24)
|~r − ~r0 |
En el caso estacionario (∂ϕ/∂t = 0, ∂ A/∂t~ = 0), el potencial vectorial
~ = −4π~/c.
también satisface una ecuación de Poisson, ∇2 A

La norma de Lorentz:

∇·A ~ + 1 ∂ϕ = 0 , (1.25)
c ∂t
permite escribir las dos ecuaciones inhomogéneas de Maxwell en forma de
ecuaciones de onda con fuentes:
1 ∂2ϕ 1 ∂2A~ 4π
∇2 ϕ − = −4πρ , ~−
∇2 A = − ~ . (1.26)
c2 ∂t2 2
c ∂t2 c
~ en términos de las
Las ecuaciones ?? pueden integrarse, quedando ϕ y A
densidades de carga y corriente:
ρ(~r0 , t − |~r − ~r0 |/c) 3 0
Z
ϕ(~r, t) = d r , (1.27)
|~r − ~r0 |
~(~r0 , t − |~r − ~r0 |/c) 3 0
Z
~
A(~r, t) = d r , (1.28)
|~r − ~r0 |
Las fuentes de los campos deben ser evaluadas en tret = t − |~r − ~r0 |/c,
manifestando el retrazo temporal causado por la propagación a velocidad
finita de la interacción electromagnética (cap 4).
(Shu 11; Ryb 2.1; Jackson 6)

8
1.2. Ondas electromagnéticas en el vacı́o
1.2.1. Ecuación de onda
En ausencia de cargas y corrientes las ecuaciones de Maxwell dan lugar a
una ecuación de onda para los campos eléctrico y magnético:
1 ∂2E~ 2~
~−
∇2 E = 0 , ∇2 B~ − 1 ∂ B = 0. (1.29)
2
c ∂t2 c ∂t2
2

Nótese que bajo la norma de Lorentz obtenemos el mismo tipo de ecuación,


una ecuación de onda, para ambos potenciales electromagnéticos. La solu-
ción a la ecuación de onda puede deducirse por separación de variables. Si
introducimos la dependencia armónica,
~ = ê± E0 ei(~k·~r±ωt) ,
E ~ = b̂± B0 ei(~k·~r±ωt) ,
B (1.30)
la ecuación de onda resulta en la relación de dispersión
ω 2 − k 2 c2 = 0 . (1.31)
Para la elección de signo k = +ω/c, obtenemos de las ecuaciones de Maxwell:
~k · ê = 0 , ~k × ê E0 = b̂ ω B0
 
(1.32)
c
~k · b̂ = 0 , ~k × b̂ B0 = −ê ω E0 ,
 
(1.33)
c
deduciéndose también |E0 | = |B0 |. Los vectores unitarios {k̂, ê, b̂} son lineal-
mente independientes, formando una base ortonormal. Los campos eléctrico
y magnético son vectores perpendiculares a la dirección de propagación de
la onda electromagnética. El comportamiento de los vectores ê y b̂ define las
caracterı́sticas de polarización de la onda electromagnética (§??), mientras
que el vector ~k define las caracterı́sticas espectrales y de propagación.
La densidad de energı́a de las ondas electromagnéticas se calcula con la
expresión ??, u = E02 /4π, y el flujo de energı́a con el vector de Poynting,
~ = (c/4π)E 2 k̂.
S 0
Un vector dado ~k describe a onda monocromática propagándose en cierta
dirección. La solución más general de la ecuación de onda es una superposión
de ondas monocromáticas moviéndose en todas direcciones
Z
~
~ r, t) =
E(~ ê± (~k) E± (~k) ei(k·~r±ωt) d3 k . (1.34)

La ecuación de onda se cumple si k 2 = ω 2 /c2 dentro de la integral. Cada


valor de ~k representa una componente espectral y el signo ± indica las dos
posibles orientaciones de dicha componente, dado su vector ~k.

9
Figura 1.4: El espectro electromagnético: arriba se muestran los rangos es-
pectrales, en términos de energı́a y longitud de onda del fotón. En medio se
ilustra la absorción de atmósfera mediante una lı́nea horizontal interrumpida
por las ventanas de transparencia, marcando encima de la lı́nea telescopios
espaciales y por debajo instrumentos terrestres. Abajo se ilustra el rango de
emisión térmica y no térmica.

1.2.2. El espectro electromagnético


La relación de dispersión entre el número de onda k y la frecuencia angular
ω puede escribirse en términos de la longitud de onda λ y la frecuencia
ν, como λν = c . Distintos valores de λ, o equivalentemente, de ν definen
distintas regiones del espectro electromagnético (Figura ??). Para este efecto
es importante también la relación de Planck, entre la energı́a de un fotón
y la frecuencia de la onda electromagnética correspondiente, E = hν. Las
regiones del espectro se describen a continuación.

Ondas de radio y banda milimétrica


Históricamente la ondas de radio se han descrito en términos de frecuencias
o por su longitud de onda. El uso más conocido involucra la radio y televisión

10
Figura 1.5: Transparencia atmosférica en el sitio del Caltech Submillimeter
Observatory en Hawái, para una densidad de columna de vapor de agua de
0.5mm en la atmósfera.

comercial que se da en las bandas de AM (100 kHz a 30 MHz), FM (87.5 a


108 MHz) y televisión (VHF, alrededor de 50 MHz y UHF, por encima de
300 MHz). Cada paı́s hace una asignación de bandas del espectro de ondas
radio; en México el encargado de esta partición es el Instituto Federal de
Telecomunicaciones, que mantiene de forma pública el “Cuadro Nacional de
Atribución de Frecuencias”, que abarca desde 3 kHz hasta 300 GHz.
En términos de la observación astronómica, la atmósfera impone un lı́mi-
te inferior a las frecuencias que se estudian comúnmente, al absorber ondas
de radio con ν < ∼ 50 − 100 MHz, debido a la acción de cargas libres en
la ionósfera. La atmósfera se vuelve transparente para ondas de radio en
el rango 100 MHz < ∼ ν <
∼ 30 GHz, equivalente a λ > ∼ 1 cm. En las bandas
milimétrica, 10 mm ∼ λ ∼ 1 mm, y submilimétrica, λ <
> > ∼ 1 mm, toma impor-
tancia el efecto de la absorción por moléculas como O2 y H2 O; esto se ilustra
en la figura ?? que muestra la transparencia en estas bandas en Mauna Kea,
Hawái, un sitio con telescopios milimétricos y submilimétricos. En térmi-
nos astrofı́sicos, la banda milimétrica es también la frontera entre procesos
no-térmicos (radio) y térmicos (mm).

11
Infrarrojo
La banda infrarroja se describe comúnmente en términos de longitudes de
onda, siendo raro el uso de frecuencias por encima de 1 THz. El infrarrojo
lejano cubre aproximadamente 1 mm > ∼λ> ∼ 20 µm; el infrarrojo medio entre
20 y 2 micras, descrito por las bandas atmosféricas LMNQ; y el infrarrojo
cercano entre 2 y 0.8 µm=8000Å, descrito por las bandas JHK. El infrarro-
jo lejano es accesible sólamente desde el espacio, empleando observatorios
espaciales como Spitzer o JWST, y con telescopios en aviones, como SOFIA;
el infrarrojo medio y cercano es parcialmente accesible desde sitios secos a
gran altura.

Visible
El visible está definido por la respuesta del ojo humano, cuya respuesta
abarca los colores del arcoı́ris, contenidos en el intervalo 8000 Å > ∼ λ >∼
4000 Å, que corresponde también a fotones entre 1.5 y 3 eV. Observaciones
fotométricas emplean tradicionalmente las bandas UBVRI, del sistema de
Johnson, que corresponden aproximadamente a los colores ultravioleta (U),
azul (B), visual (V) -entre el verde y el amarillo-, rojo (R) e infrarrojo
cercano (I). Este sistema se ha expandido al infrarrojo para definir la bandas
JHKLMNQ. La tabla 1 muestra los rangos de estas bandas y el flujo de un
objeto de magnitud cero, expresado en Janskys1 .

Visible
Filtro U B V R I
λ0 (Å) 3600 4400 5500 7000 9000
∆λ0 (Å) 68 98 89 220 240
F0 (Jy) 1880 4650 3950 2870 2240
IR cercano IR medio
Filtro J H K L2 M N Q
λ0 (µm) 1.25 1.65 2.20 3.40 5.0 10.2 21.0
∆λ0 (µm) 0.30 0.35 0.40 0.55 0.3 5 8
F0 (Jy) 1770 636 629 312 183 43 10

Cuadro 1.1: Sistema de Johnson extendido al infrarrojo cercano e intermedio.


Léna, “Méthode Physiques de l’observation”, 1996.

1
1 Jy = 10−23 erg cm−2 s−1 Hz−1

12
Ultravioleta
El ultravioleta cercano es observable desde la Tierra, en la banda U, hasta
alrededor de λ >∼ 3200Å, donde el ozono atmosférico y otras moléculas impo-
nen un corte al espectro accesible. Observaciones desde el espacio permiten
estudiar la banda de 3000Å a λ ' 911 Å, lı́mite de ionización del hidrógeno,
donde el medio interestelar mismo se vuelve opaco a la radiación por medio
del efecto fotoeléctrico. Esto convierte al ultravioleta lejano en una banda
mayormente inaccesible, en el que observaciones desde el espacio sólo son
posibles en direcciones privilegiadas con baja densidad de columna de gas
interestelar. Esto se extiende hasta alrededor de λ ∼ 120 Å, o E ∼ 100 eV,
frontera con la banda de rayos X.

Rayos X
Los rayos X se describen en términos de energı́a con hν > ∼ 100 eV, has-
ta alrededor de 511 keV, la masa en reposo del electrón (E = mc2 ). Son
observables exclusivamente desde el espacio, con el factor adicional de la ab-
sorción por efecto fotoeléctrico del medio interestelar en la banda de rayos
X blandos, 0.1–1 keV. Los telescopios espaciales de rayos X, como Chandra
X-ray Observatory y XMM-Newton, son instrumentos sofisticados de altı́si-
ma precisión basados en el principio de enfocar haces mediante reflección
por incidencia rasante, funcional entre 0.1 y 10 keV, . Los rayos X duros,
de decenas o cientos de keVs, se observan normalmente sin colimación, em-
pleando el efecto fotoeléctrico. La introducción de telescopios con máscara
codificada ha permitido mejorar considerablemente la resolución angular de
telescopios como BeppoSAX e INTEGRAL. Más recientemente, NuSTAR ha
extendido el principio de la óptica de incidencia rasante hasta energı́aspor
encima de 10 keV.

Rayos gamma
En principio la radiación γ comprende toda radiación electromagnética con
energı́a mayor a 0.511 MeV, hasta valores arbitrariamente altos. Histórica-
mente fue descubierta como uno de los tres productos de la radioactividad,
siendo los otros rayos α, constituidos por núcleos de helio, y rayos β, consti-
tuidos por positrones e+ . Los rayos γ producto de la radioactividad corres-
ponden a emisiones mono-energéticas debido a transiciones entre niveles de
energı́a en núcleos atómicos que tienen valores entre decenas de keV hasta al-
gunos MeV. Fotones de mayores energı́as son producidos por aniquilación de

13
partı́culas y antipartı́culas, e− e+ → γγ, o procesos que involucran partı́cu-
las relativistas aceleradas previamente. Rayos gamma por debajo de 0.1 a
1 MeV pueden ser estudiados mediante el efecto fotoeléctrico; para energı́as
entre 1-30 MeV se emplea el efecto Compton para su detección con teles-
copios como COMPTEL, instrumento a bordo del Compton Gamma-Ray
Observatory (CGRO) entre 1991 y 2000, que realizó el único mapeo del cielo
a la fecha en la banda 0.7-30 MeV. Rayos γ de alta energı́a, entre 30 MeV y
unos 100 GeV, son estudiados con telescopios de producción de pares, como
CGRO-EGRET en 1991-2000, y más recientemente con Fermi-LAT.
Es posible la detección de fotones con energı́a por encima de 100 GeV
desde la Tierra a través de la detección de cascadas electromagnéticas em-
pleando telescopios de tipo Cherenkov atmosférico, o con detectores de su-
perficie, originalmente diseñados para la detección de rayos cósmicos me-
diante el mismo principio. Los telescopios Cherenkov atmosféricos, como
VERITAS, HESS y MAGIC, registran la emisión debida a partı́culas carga-
das que se mueven más rápido que la velocidad de la luz en el aire, v > c/n
con n el ı́ndice de refracción. La detección directa de partı́culas secunda-
rias de estas cascadas se puede hacer con detectores Cherenkov de agua,
como el High Altitude Water Cherenkov (HAWC) γ-ray observatory insta-
lado en Sierra Negra. HAWC es capaz de detectar fotones con energı́as de
E> 14
∼ 100 TeV = 10 eV, El observatorio de rayos cósmicos Pierre Auger ha
puesto cotas para el flujo de fotones con energı́as E > 2 × 1018 eV.

1.2.3. Polarización de luz monocromática


El comportamiento con el tiempo y el espacio de los vectores E ~ y B,
~ se
describe en términos de la polarización de la onda. Basta concentrarse en
uno de los campos ya que el otro es perpendicular a él en todo momento.
~
Al ser la densidad de energı́a de la onda, ∝ |E(t)| ~
2 + |B(t)|2 = constante,

tenemos que |E|~ aumenta |B|~ disminuye, y viceversa. Para la descripción


de una onda monocromática propagándose en la dirección k̂ = ẑ (ec. ??),
podemos emplear vectores imaginarios expresados en función de x̂ y ŷ:

êE0 = x̂x eiφx + ŷy eiφy . (1.35)

siendo x y y cantidades reales. El campo eléctrico correspondiente está


completamente caracterizado por los valores {x , y , φx , φy }. Podemos vi-
sualizar su comportamiento temporal si fijamos un punto, digamos ~r = 0, y
suponemos que el campo medible es la parte real de E, ~

~ med = R(E)
E ~ = x̂ x cos(ωt − φx ) + ŷ y cos(ωt − φy ) . (1.36)

14
Figura 1.6: Modos de polarización elı́ptica para ∆φ entre 0 y 2π, y conside-
rando x = y ⇒ Q = 0. A la izquierda, ∆φ = nπ/2, obtenemos polarización
lineal, V = 0, o circular, U = 0.

Esta ecuación puede manipularse para dar


2 !2 !
Ex Ey Ex Ey

+ −2 cos ∆φ = sin2 ∆φ , (1.37)
x y x y

con ∆φ = φx − φy . Podemos visualizar el comportamiento del vector E, ~


confinado a una “caja” de lado x por y , considerando algunos casos (ver
figura ??):
~ está
si ∆φ = 0, entonces (Ex /x − Ey /y )2 = 0, por lo que el vector E
restringido a moverse a lo largo de una lı́nea definida por las esquinas

15
inferior izquierda y superior derecha de la caja. Este es el caso de
polarización lineal.

si ∆φ = π, entonces (Ex /x + Ey /y )2 = 0, y el vector E ~ está res-


tringido a moverse a lo largo de una lı́nea entre las esquinas superior
izquierda e inferior derecha de la caja. Este es el segundo modo de
polarización lineal, ortogonal al definido por ∆φ = 0.

si ∆φ = π/2 o ∆φ = 3π/2, obtenemos la ecuación de una elipse


(Ex /x )2 + (Ey /y )2 = 1, y se tiene polarización es elı́ptica. Si además
x = y la elipse viene siendo un cı́rculo y la polarización es circular.
Para ∆φ = π/2, tenemos E ~ = x̂x cos(ωt − φx ) − ŷy sin(ωt − φx ),
que corresponde a rotación en el sentido de las manecillas del reloj, o
polarización izquierda. Si ∆φ = 3π/2, tenemos E ~ = x̂x cos(ωt − φx ) +
ŷy sin(ωt − φx ) que corresponde a rotación en el sentido inverso al de
las manecillas del reloj, o polarización derecha.

1.2.4. Parámetros de Stokes


La polarización de una onda monocromática se describe comúnmente en
términos de los cuatro parámetros de Stokes, medibles observacionalmente:

I ≡ 2x +2y , Q ≡ 2x −2y , U ≡ 2x y cos ∆φ , V ≡ 2x y sin ∆φ . (1.38)

Se cumple la igualdad I 2 = Q2 + U 2 + V 2 donde I representa la amplitud


de la onda. El parámetro Q mide la elipticidad de la polarización, que sólo
puede ser circular para Q = 0; V su linearidad y U la orientación del eje de
la elipse o de polarización lineal. Remitiéndonos a los casos anteriores:

∆φ = 0 ⇒ polarización lineal: tenemos V = 0, U = 2x y > 0.

∆φ = π ⇒ polarización lineal: V = 0, U = −2x y < 0. El signo de U


distingue los dos modos ortogonales de polarización lineal.

∆φ = π/2 ⇒ polarización elı́ptica izquierda: tenemos U = 0, V =


2x y > 0. El valor positivo de V indica que el sentido es izquierdo. Si
Q = 0 la polarización es circular.

∆φ = 3π/2 ⇒ polarización elı́ptica derecha: tenemos U = 0 y V =


−2x y < 0. El signo negativo de V indica que es polarización derecha.
Si Q = 0 la polarización es circular.

16
Polarización ∆φ x , y Q U V χ β
Circular izquierda π/2 x = y 0 0 +I 0/0 +π/4
Circular derecha 3π/2 x = y 0 0 −I 0/0 −π/4
Elı́ptica izquierda 0 < ∆φ < π x 6= y 6= 0 >0 6= 0 >0 6= 0
Elı́ptica derecha π < ∆φ < 2π x 6= y 6= 0 <0 6= 0 <0 6= 0
Lineal (x) 0 − 2π y = 0 +I 0 0 0 0
Lineal (y) 0 − 2π x = 0 −I 0 0 0 0
Lineal (xy) 0 x = y 0 +I 0 +π 0
Lineal (−xy) π x = y 0 −I 0 −π 0

Cuadro 1.2: Algunos modos de polarización para una onda monocromática


con los parámetros fı́sicos y de Stokes correspondientes.

La forma de polarización más general es la elı́ptica, que puede caracteri-


zarse con el ángulo de polarización, χ, y el ángulo de elipticidad, β, mediante

Q = I cos 2β cos 2χ , U = I cos 2β sin 2χ , V = I sin 2β , (1.39)

de forma que tan 2χ ≡ U/Q, y sin 2β ≡ V /I. La tabla ?? resume algunos


modos de polarización y los parámetros correspondientes. Si pensamos en
términos de una elipse de semiejes a, b rotada un ángulo χ, se puede de-
mostrar que a2 = I cos2 β, b2 = I sin2 β. La excentricidad queda dada por
e2 = 1 − tan2 β, o por e2 = 1 − cot2 β para π4 ≤ β ≤ 3π
4 .
En general se trabaja con radiación no monocromática de la cual se
miden valores promedio, sobre tiempo o frecuencia, de los parámetros de
Stokes:
D E D E
I¯ = 2x + 2y , Q̄ = 2x − 2y ,
Ū = h2x y cos(∆φ)i , V̄ = h2x y sin(∆φ)i . (1.40)

En este caso se tiene I¯2 ≥ Q̄2 + Ū 2 + V̄ 2 , y se define el grado de polarización


como, q
Π = Q̄2 + Ū 2 + V̄ 2 /I¯ , (1.41)
¯ de la no polarizada, o “natural”, (1 − Π)I.
distinguiendo la luz polarizada, ΠI, ¯

(Shu 11, 12; Ryb 1.1, 2)

17
1.3. Ondas electromagnéticas en un plasma
El medio interestelar no es estrictamente un vacı́o y es posible medir efectos
de la propagación de las ondas electromágneticas por la presencia de car-
gas y corrientes. Se observan varios efectos importantes que se describen al
considerar estas cargas.
Consideremos la densidad de carga y de corriente de un plasma formado
por electrones de carga −e y densidad numérica ne , e iones de carga +Ze y
densidad numérica ni :

ρ = ne (−e) + ni (Zi e) , ~ = ne~ve (−e) + ni~vi (Zi e) , (1.42)

siendo ~ve y ~vi la velocidad tı́pica de cada especie2 , donde ~ve 6= ~vi . Plantea-
mos ρ = ρe + ρi = 0, y proponemos un comportamiento oscilatorio para la
~
densidad de corriente3 , ~ = ~0 ei(k·~r−ωt) . Generalizando el mismo comporta-
miento para los campos electromagnéticos, podemos escribir las ecuaciones
de Maxwell correspondientes como,

~k · E
~ = ~k · B ω~ 4π ω~
~ = 0, i ~k × E
~ =i B, i ~k × B
~ = ~ − i E . (1.43)
c c c
El comportamiento oscilatorio de ~ es una respuesta del medio a los campos.
De las ecuaciones ?? se desprende (B ~ ⊥ ~k) y (B
~ ⊥ E).
~

1.3.1. Dispersión por electrones en un plasma


Dada la mayor movilidad de los electrones en relación a los iones4 , podemos
considerar que sólo los electrones transportan carga y dan lugar a corrientes.
Se resuelve la ecuación de movimiento de un electrón sujeto a la fuerza de
Lorentz,
~v
 
˙ ~
m~v = −e E + × B , ~ (1.44)
c

para B~ = B ẑ, y E
~ ± = E0 e−iωt (x̂ ± iŷ)/ 2. Nótese que E
~ se refiere al campo
asociado a la onda electromagnética que se propaga en el plasma, mientras
que B~ es el campo magnético del medio interestelar. El término magnético
en la onda se desprecia para |~v |  c. Por otro lado, se considera que los
campos eléctricos del medio interestelar son despreciables, debido a la alta
2
Shu ignora el efecto de los iones. Aquı́ suponemos que ocasionan que la densidad total
de carga sea nula, pero no tienen efecto en la densidad de corriente.
3
lo que equivale a resolver formalmente las ecuaciones en el espacio de Fourier.
4
cuando hay equipartición de energı́a tenemos mi vi2 ' me ve2 , de donde vi  ve .

18
movilidad de los electrones. Bajo las suposiciones anteriores, el movimiento
de los electrones puede restringirse al plano xy,
x̂ ± iŷ −iωt
 
~v = v0 √ e ,
2
de donde
eB −ieE~
~ ∓i
−iωm~v = −eE ~v ⇒ ~v = , (1.45)
c m(ω ± ω` )
siendo ω` ≡ eB/mc la frecuencia de Larmor. Podemos obtener la expresión
para la densidad de corriente,

ine e2 ~
~ = −ne e~ve + ni Zi e~vi ' E, (1.46)
m(ω ∓ ω` )

donde despreciamos la contribución de los iones. La proporcionalidad ~ ∝ E ~


corresponde a una ley de Ohm con conductividad puramente imaginaria
(ec. ??), que nos permite plantear la ec. ?? de manera similar a la expresión
~ ∝ E:
para el vacı́o, ∇ × B ~

ω
 
i~k × E
~ = −i ~.
εE
c
donde introducimos la constante dieléctrica,

ωp2
ε=1− , (1.47)
ω(ω ∓ ω` )
1/2
y definimos la frecuencia de plasma, ωp ≡ 4πne e2 /me ' 5.6 × 104 Hz · ne .
p

La substitución en las ecs. ?? resulta en la relación de dispersión


!
2 ω2
k −ε = 0, (1.48)
c2

1.3.2. Propagación de ondas en un plasma


En entornos astrofı́sicos comunes tenemos ω`  ωp , y podemos aproximar
ε ≈ 1−ωp2 /ω 2 . Si además ω es mucho mayor que ω` , la relación de dispersión
puede escribirse como
1q 2
k= ω − ωp2 . (1.49)
c

19
El número de onda k es imaginario para ω < ωp , lo que implica un comporta-
miento exponencial del campo, E ~ ∝ e±|k|z , y la atenuación correspondiente
de la onda, con una longitud caracterı́stica

`p ∼ 2πc/ωp ≈ 33.6 km · ne−1/2 .

La frecuencia ωp define una frecuencia mı́nima por debajo de la cuál ondas


electromagnéticas no pueden propagarse en un plasma. Un ejemplo relevante
es el de la ionósfera terrestre: entre 300 km y 2000 km de altura existe una
densidad de electrones promedio hne i ∼ 104 cm−3 , e incluso ne < 6
∼ 10 cm
−3

en algunas capas definidas. La presencia de estos electrones libres se traduce


en una frecuencia de corte de decenas MHz, motivo por el cual la ventana de
la radio astronomı́a desde la Tierra empieza a partir de esas frecuencias. En
la práctica, observaciones por debajo de 100 MHz son difı́ciles, en parte por
los efectos de la ionósfera, y en parte por la interferencia de transmisiones de
radio comunicaciones, radio FM y televisión. En forma análoga, la densidad
media de los electrones del medio interestelar, hne i ≈ 0.03 cm−3 , resulta en
la atenuación de ondas electromagnéticas con ν < ∼ 2 kHz.

1.3.3. Medida de dispersión


De la relación de dispersión,

εω 2 − k 2 c2 = 0 ,

calculamos la velocidad de grupo de la onda vg ≡ dω/dk = c ε ≤ c, ya que
para el plasma ε < 1 (ec. ??). La onda se propaga más lentamente que en
el vacı́o, con una velocidad dependiente de la frecuencia. De hecho, si ne es
variable, las ondas pueden no viajar en lı́nea recta.
Una aplicación relevante al medio interestelar proviene del estudio de
pulsares, donde pulsos de distintas frecuencias ω viajan a distintas veloci-
dades, ya que ε = ε(ω), y llegan con distintos retrasos con respecto a una
propagación en el vacı́o. Supóngase un pulsar a una distancia d y ω  ωp .
El tiempo requerido para que una onda de frecuencia ω llegue a la Tierra
está dado por:
( )Z
4πe2 d 2πe2 D
Z d d
dz d 1
t= ' + ne dz = + . (1.50)
0 vg c 2 mω 2 c 0 c mc ω 2

La integral de la derecha define la medida de dispersión, D o a veces DM, ex-


presada normalmente en unidades de cm−3 pc. El ajuste de t de acuerdo a la

20
relación ?? nos da el valor de D, la densidad de electrones integrada a lo largo
de la visual. En la práctica, se grafica el desfasamiento temporal del pulso en

Figura 1.7: Retraso de la llegada del pulso de PSR B1749–28 un pulsar


medido en 32 canales correspondientes a distintas frecuencias de radio. Un
ajuste de tipo ∆t ∝ ν −2 DM permite calcular la medida de dispersión y
obtener una estimación de la distancia al pulsar.

21
distintas frecuencias (figura ??), y se ajusta conforme a ??. El valor prome-
dio de la densidad de electrones, deducido a partir de mediciones en pulsares
con distancias conocidas, da hne i ≈ 0.03 cm−3 . Existe un modelo bastante
completo de la distribución de electrones libres en la Galaxia, obtenido a
partir de mediciones a pulsares (Taylor & Cordes 1993). El valor promedio
de la densidad de electrones es frecuentemente usado para tener una prime-
ra estimación de distancias a otros pulsares, dDM = D/(0.03 cm−3 ). Esta
estimación debe tomarse con cierta precaución ya que puede estar afectada
por sobre-densidades locales de electrones.

1.3.4. Rotación de Faraday


Si ω  ω` , pero el término magnético no es despreciable, podemos aproximar
la relación ?? como
ωp2 ω`
 
ε± = 1 − 2 1 ± . (1.51)
ω ω
Si además ω  ωp , la relación de dispersión puede ser expresada como:

k± = k0 ∓ ∆k , (1.52)

donde k0 c = ω(1 − ωp2 /2ω 2 ) corresponde al término de dispersión y,

ωp2 ω`
∆k = , (1.53)
2ωc
es la diferencia en números de onda con respecto a luz blanca asociada a dos
distintas polarizaciones (derecha o izquierda). Si uno considera una onda ini-
~ = x̂E0 e−iωt ,
cialmente polarizada linealmente a lo largo del eje x̂, es decir E
que recorre una distancia d a lo largo del eje ẑ, el eje de polarización res-
pectivo rota un ángulo ψ dado por,

2πe3
ψ= RM , (1.54)
m2e c2 ω 2

donde RM es la medida de rotación definida como


Z d
RM ≡ ne Bk dz . (1.55)
0

La medición conjunta de las medidas de dispersión y rotación proporciona


una estimación del campo magnético promediado
D E con la densidad de electro-
nes a lo largo de la dirección de la visual, Bk = RM/DM . En casos en los

22
que no es posible medir DM , es posible estimar Bk conociendo la distancia
D E
d al objeto y suponiendo una densidad de electrones, Bk ≈ RM/(hne i d).
Es a través de éstas mediciones que los radioastrónomos han concluido que
el campo magnético promedio en la Galaxia es de 3 microgauss.

(Shu 20; Ryb 8)

23
Capı́tulo 2

Transferencia radiativa
Versión 1 de noviembre de 2016

Los procesos de interacción entre la radiación electormagnéctica y la materia


se describen formalmente a través de la ecuación de transferencia radiativa.
Este formalismo emplea como cantidad básica la intensidad de la radiación,
que se relaciona con cantidades medibles como el flujo de energı́a; la in-
tensidad del campo radiativo varı́a por procesos como absorción, emisión y
dispersión. Este formalismo se describe a continuación.

2.1. Definiciones
2.1.1. Intensidad y cantidades derivadas
La variable fundamental para la descripción del transporte de energı́a ra-
diativa es la intensidad especı́fica, Iν , que se refiere conceptualmente a un
haz de radiación. Se define a partir del flujo de energı́a (E) por unidad de
tiempo (t), área (A), frecuencia (ν) y ángulo sólido (Ω),

dE
= Iν (k̂, ~r, t) k̂ · n̂ dΩ dν , (2.1)
dA dt
con n̂ la normal al elemento de área dA que atraviesa el haz, el cual se propa-
ga en la dirección k̂. Iν es función de la posición, del tiempo, de la frecuencia
y del vector de propagación1 Iν contiene información tanto de la distribución
espacial y espectral del campo de radiación, como de su nivel de isotropı́a.
Las unidades (cgs) de la intensidad especı́fica son [erg cm−2 s−1 Hz−1 Sr−1 ].
1
Formalmente la combinación (k̂, ν) corresponde con el vector ~k = (2πν/c)k̂. El vector
de propagación, k̂ = ẑ cos θ +(x̂ cos φ+ ŷ sin φ) sin θ se relaciona directamente con el ángulo
sólido, dΩ = sin θdθdφ.

1
Figura 2.1: Todos los haces de radiación que salen de (1) con una apertura
dada por el ángulo sólido dΩ1 atraviesan la diferencial de área dA2 = r2 dΩ1 ,
siendo r la distancia entre ambos puntos. De misma manera, aquellos que
pasan por el punto (2) habiendo salido de (1) abarcan un ángulo sólido
dΩ2 = dA1 /r2 . Se desprende que dA1 dΩ1 = dA2 dΩ2 .

El formalismo de transferencia radiativa puede hacerse tanto en términos de


la frecuencia, ν, como de la longitud de onda, λ, relacionadas mediante,
c
Iλ dλ = Iν dν ⇒ Iλ = − Iν . (2.2)
λ2
El signo negativo indica el sentido opuesto en los intervalos de integración.
El caso en que la energı́a radiativa se conserva implica la conservación de
la intensidad especı́fica a lo largo del haz. Considerando un emisor situado
en un punto (1) y un receptor en otro punto (2), tenemos que la cantidad
de energı́a que sale de (1) y llega a (2) está dada por

dE1 = Iν1 dA1 dΩ1 dt dν ,

donde dΩ1 es el ángulo sólido que abarca el receptor (2) visto desde (1). Por
otro lado, la cantidad de energı́a recibida en (2) está dada por

dE2 = Iν2 dA2 dΩ2 dt dν .

Bajo la conservación de la energı́a se tiene dE1 = dE2 , la energı́a emitida


dentro del cono de apertura dΩ1 coincide con la captada en el área dA2 , y

2
la recibida dentro del cono de apertura dΩ2 coincide con la emitida dentro
del área dA1 . En virtud de que dA1 dΩ1 = dA2 dΩ2 (figura 2.1), tenemos

Iν1 = Iν2 . (2.3)

La intensidad especı́fica es constante a lo largo de una trayectoria. Esto


sucede en ausencia de absorbedores o fuentes de radiación.
Partiendo de Iν se definen algunas cantidades fı́sicas asociadas a los
momentos geométricos del campo de radiación.

Intensidad media y densidad de energı́a


La intensidad media de la radiación es el promedio de la intensidad sobre
todas las direcciones; se denota como Jν , y está dada por:
1
Z
Jν ≡ Iν dΩ , (2.4)

teniendo unidades de [erg cm−2 s−1 Hz−1 ]. La intensidad media tiene la mis-
ma forma funcional que la densidad de energı́a, uν , que se define también
integrando la intensidad sobre el ángulo sólido,
1 4π
Z
uν ≡ Iν dΩ = Jν ; (2.5)
c c
el factor c nos permite pasar de flujo a densidad. La presión de radiación
tiene unidades de [erg cm−3 Hz−1 ]; representa la cantidad de energı́a por
unidad de volumen y de rango espectral en forma de radiación.

Flujo de energı́a
El flujo de energı́a es una cantidad que se mide frecuentemente de manera
observacional. Corresponde al primer momento de la distribución angular
de la intensidad, Z
Fν ≡ Iν cos θ dΩ , (2.6)

teniendo unidades de [erg cm−2 s−1 Hz−1 ]. Fν representa la energı́a transpor-


tada por unidad de área, tiempo e intervalo espectral. El término en coseno
corresponde a k̂ · n̂ = cos θ, siendo k̂ la dirección de propagación de la ra-
diación y n̂ la normal al elemento del área emisor o receptor. Para fuentes
distantes con flujo Fν , la intensidad promedio está dada por hIν i = Fν /∆Ω,
suponiendo cos θ = 1.

3
El flujo de energı́a tiene la particularidad de ser cero en el caso isotrópico.
Considerando una superficie con normal el eje ẑ, podemos definir dos compo-
nentes del flujo: la de incidencia paralela a ẑ y la de incidencia anti-paralela.
En coordenadas esféricas,
Z 2π Z π/2 Z 2π Z π/2
Fν+ = Iν cos θ sin θdθdϕ , Fν− = Iν cos θ sin θdθdϕ ,
0 0 0 π
(2.7)
de manera que Fν = Fν+ − Fν− .
Es importante distinguir entre el flujo emitido, Fν1 , y el recibido, Fν2 ;
bajo la conservación de la intensidad se relacionan aproximadamente como
Iν ' Fν1 /∆Ω1 = Fν2 /∆Ω2 , siendo ∆Ω1 el ángulo sólido dentro del cual
se da la emisión y ∆Ω2 el ángulo sólido que abarca la fuente vista por el
observador. Generalmente se tiene ∆Ω2  ∆Ω1 , y el flujo emitido es mucho
mayor que el observado, Fν1  Fν2 .
La forma más común de medir el flujo es mediante el sistema de mag-
nitudes, definidas de manera logarı́tmica en el óptico y bandas aledañas a
partir de:
mν = −2.5 log(Fν /Fν0 ),
siendo Fν0 un flujo de referencia para la frecuencia ν. El sistema de magni-
tudes se define de manera que la estrella Vega tenga magnitud cero en las
distintas bandas fotométricas. En radio-astronomı́a es más común el uso del
Jansky, que tiene la bondad de ser una unidad lineal, definida como

1 Jy ≡ 10−23 erg cm−2 s−1 Hz−1 .

Los flujos de referencia Fν0 aparecen expresados en Jy en la tabla 1.1 del


primer capı́tulo. Otra cantidad de interés en astronomı́a es el brillo del cielo,
expresado comúnmente en magnitudes por segundo de arco cuadrado, que
corresponde con la intensidad especı́fica de la emisión del cielo.

Presión de radiación
La presión de radiación corresponde al segundo momento de la intensidad,
1
Z
Pν ≡ Iν cos2 θ dΩ , (2.8)
c

teniendo unidades de [dyn cm−2 Hz−1 ], equivalentes a unidades de densidad


de energı́a [erg cm−3 Hz−1 ].

4
La intensidad especı́fica y sus momentos caracterizan las componentes
espectrales de un haz de radiación; pueden integrarse sobre frecuencias,
Z ∞ Z ∞ Z ∞
I= Iν dν , u= uν dν , F = Fν dν , ... (2.9)
0 0 0
para obtener las cantidades globales.

2.1.2. Relación con ondas electromagnéticas


En el capı́tulo 1 se definió el flujo y la densidad de energı́a de un campo
electromagnético,
~= c E
S ~ ×B ~ = c |E|
~ 2 k̂ , (2.10)
4π 4π
con S~ el vector de Poynting, que se relaciona con la energı́a recibida o emitida
a través de:
c ~ 2
Z Z Z
~
E = S · n̂ dA dt = |E| k̂ · n̂ dA dt = Iν k̂ · n̂ dA dt dν dΩ . (2.11)

Se puede ir formalmente de la dependencia temporal de los campos a su
descripción espectral a través de la transformada de Fourier. La dependencia
de S~ con los campos es cuadrática, de donde se desprende que la definición
se refiere al flujo por unidad de tiempo o por unidad de frecuencia,
~ −→ erg cm−2 s−1
S(t) ⇔ ~
S(ν) −→ erg cm−2 Hz−1 .
Para poder definir un flujo por unidad de tiempo y de frecuencia es necesario
considerar formalmente intervalos espectrales y temporales que satisfagan
∆ω∆t  1. Siendo ası́, podemos considerar el flujo por unidad de frecuencia
promediado por cada ciclo,
ω D~
  E
~ω =
S S(ω) −→ erg cm−2 Hz−1 s−1 . (2.12)

Un campo de radiación incorporará un conjunto de ondas electromagnéticas
propagándose en todas direcciones,
X ω  c 
~ω (~r) =
S ~ r, ω)|2 k̂ ,
|E(~ (2.13)
2π 4π

~ r, ω) una componente de la transformada de Fourier del campo


siendo E(~
~ r, t) y k̂ la dirección de propagación del mismo. La
eléctrico (de radiación) E(~
intensidad especı́fica Iω considera la distribución angular de S ~ω , de manera
que podemos identificarla con
ωc d n
  o
Iω (~r, k̂) = |E(~r, ω)|2 . (2.14)
8π 2 dΩ

5
Figura 2.2: (a) Campo isotrópico de radiación; (b) campo de una fuente
isotrópica; (c) esfera radiando semi-isotropicamente.

2.1.3. Campo isotrópico de radiación


El cálculo de la densidad de energı́a, el flujo y la presión de radiación se hacen
considerando, con el cuidado requerido, la geometrı́a del mismo (fig. 2.2).
Radiación isotrópica corresponde a una intensidad Iν independiente de la
dirección de propagación k̂. Este caso difiere del de una fuente isotrópica,
en el cual un observador lejano ve radiación proveniente de la dirección de
la fuente y no de todas direcciones. Aquı́ el observador está immerso en el
campo de radiación, observando la misma intensidad en todas las direcciones.
Un ejemplo conocido de radiación isotrópica lo constituye el fondo cósmico
de microondas (CMB). Si Iν no depende de k̂, entonces sale de las integrales
sobre dΩ:
Jν = Iν , al ser la intensidad especı́fica igual a la intensidad media;

Fν = 0, el flujo neto de radiación es nulo, dado que rayos de luz


atraviesan una superficie dada direcciones opuestas;

Pν = uν /3, a partir de la integral de cos2 θ dΩ.

2.2. La ecuación de transferencia radiativa


La conservación de la energı́a de un haz de radiación que se propaga entre
dos puntos (1) y (2), implica Iν1 = Iν2 . Esta igualdad se generaliza a lo largo
de una trayectoria dada por s con la relación,
dIν
= 0. (2.15)
ds
Al considerar procesos de emisión y absorción de radiación por un medio
deja de cumplirse la conservación de la energı́a a lo largo del haz, y tenemos

6
que modificar esta relación para dar lugar a la ecuación de transferencia
radiativa. Los procesos a considerar son: emisión espontánea e inducida,
absorción y dispersión.

2.2.1. Emisión espontánea


Un medio emite radiación como consecuencia de que sus átomos y moléculas
poseen cierta energı́a que puede provenir de choques entre las partı́culas, por
dar un ejemplo. La emisión de radiación es una forma natural de pasar a
un estado de energı́a menor, siguiendo el principio fı́sico de mı́nima energı́a.
De esta forma, la energı́a previamente adquirida por algún proceso fı́sico se
incorpora a la energı́a de un haz de radiación, siguiendo la expresión,

dE = ν dV dΩ dt dν ,

siendo ν el coeficiente de emisión, de unidades de [erg cm−3 s−1 Hz−1 Sr−1 ].


El aumento de la energı́a del haz debido a la emisión espontánea de radiación
se describe como
dIν
= ν . (2.16)
ds
Frecuentemente la emisión espontánea es isotrópica y se describe por unidad
de masa, mediante la emisividad especı́fica:

εν = 4π ν /ρ ,

con unidades de [erg s−1 g−1 Hz−1 ], y siendo ρ la densidad de masa.

2.2.2. Absorción y emisión inducida


El proceso de absorción de radiación puede describirse de manera proba-
bilı́stica fotón por fotón, de forma que la intensidad de radiación absorbida
es directamente proporcional a la intensidad de la radiación incidente,
dIν
= −αν Iν , (2.17)
ds
donde αν es el coeficiente de absorción, con unidades [cm−1 ]. Su inverso es el
camino libre medio, `ν = 1/αν . Para describir las propiedades de absorción
de un medio en términos de la densidad numérica de absorbedores o de su
densidad de masa podemos emplear la sección eficaz, σν , de cada absorbedor,

αν = n σν ,

7
siendo n la densidad numérica de partı́culas. La sección eficaz tiene unidades
de área, [cm2 ]. Alternativamente, se usa el coeficiente de opacidad, κν , que
se relaciona con la densidad de masa,

αν = ρ κν ,

siendo las unidades de κν [g−1 cm2 ].


En condiciones muy particulares, el medio es estimulado por radiación
incidente y emite más radiación del mismo tipo. Esta emisión estimulada
es proporcional a la intensidad de la radiación incidente, y por tanto su
comportamiento es fı́sicamente análogo al de la absorción, y no al de la emi-
sión espontánea. La emisión estimulada se describe como una contribución
negativa al coeficiente de absorción, ανestim < 0.

2.2.3. La ecuación de transferencia radiativa y soluciones


Considerando los procesos de emisión y absorción conjuntamente, obtenemos
la ecuación de transferencia radiativa:
dIν
= −αν Iν + ν . (2.18)
ds
En el caso sin absorción, αν = 0, la solución a la ecuación queda en términos
lineales: Z s
Iν (s) = Iν (s0 ) + ν (s0 ) ds0 .
s0
En el caso sin emisión, ν = 0, la solución a la ecuación de transferencia
queda como un decaimiento exponencial de la intensidad:

Iν (s) = Iν (s0 ) e−τν ,

donde τν es la profundidad óptica, que se define como:


Z s
τν ≡ αν ds0 . (2.19)
s0

Si τν  1 se dice que el medio es transparente u ópticamente delgado;


mientras que si τν  1, el medio es opaco u ópticamente grueso.
Debido en parte a las incertidumbres en estimar distancias y tamaños de
objetos astrofı́sicos, resulta más conveniente expresar la ecuación de trans-
ferencia en términos del espesor óptico:
dIν
= −Iν + Sν , (2.20)
dτν

8
donde Sν ≡ ν /αν es la función fuente (emisión / absorción). Expresada de
esta forma, la ecuación de transferencia (2.20) tiene como solución formal:
Z τν
0
Iν (τν ) = Iν (0)e−τν + Sν (τν0 )e−(τν −τν ) dτν0 . (2.21)
0

En particular, si Sν no depende de τν se tiene:

Iν (τν ) = Iν (0)e−τν + Sν (1 − e−τν ) . (2.22)

Para τν  1 tenemos Iν (τν ) → Iν (0); mientras que si τν  1, Iν (τν ) → Sν .


Este comportamiento es inherente a la ecuación 2.20, donde Iν pierde su
comportamiento inicial en escalas de orden τν ∼ 1, y tiende a adquirir las
caracterı́sticas del medio, descrito por la función fuente.
En el caso particular de emisión estimulada, en lugar de una atenuación
de la intensidad, se obtiene una amplificación exponencial de la misma. Po-
demos ver este caso tomando un coeficiente de opacidad negativo, τν = −τ ∗,
y una función fuente negativa, Sν = −Sν∗ , de donde,

Iν (τν ) = (Iν (0) + Sν∗ ) eτ ∗ ,

una amplificación exponencial para τ ∗  1. Manifestaciones importantes de


este proceso son los máseres Galácticos y extragalácticos.

2.3. Radiación en equilibrio termodinámico


El estudio de la interacción entre materia y radiación en equilibrio termo-
dinámico empieza históricamente con la discusión de Kirchhoff sobre los
procesos involucrados, dando lugar a la ley de Kirchhoff y, posteriormente,
a la distribución de Planck2 . Estos procesos son descritos por la función
fuente, Sν , que en equilibrio se relaciona con la distribución de Planck.

2.3.1. La ley de Kirchhoff


En 1859-60 Gustav Kirchhoff consideró la emisión de radiación por unidad
de tiempo en una dirección k̂, dada por una función Pe (k̂) en un punto dado
(figura 2.3, parte inferior), junto con el proceso de absorción, descrito por la
potencia de la radiación incidente, Pi (−k̂), y un coeficiente de absorción, aλ ,
que indica la fracción de la radiación absorbida por el objeto. Si el objeto
2
Lectura recomendada: ”La teorı́a del cuerpo negro y la discontinuidad cuántica: 1894-
1912”por Thomas S. Kuhn.

9
Figura 2.3: Absorción (arriba) y emi-
sión (abajo) de radiación dentro de un
cono de apertura dΩ en la dirección k̂.
Una fracción aλ de la radiación inciden-
te de longitud de onda λ es absorbida.

está en equilibrio termodinámico, Pe estará dada por una función de la


temperatura y de la longitud de onda, eλ (T ), y el coeficiente de absorción
será también función de la longitud de onda y temperatura, aλ (T ). Si además
existe un equilibrio entre la radiación emitida y absorbida, y la radiación está
en estado de equilibrio termodinámico a la misma temperatura, obtenemos
la ley de Kirchhoff,

eλ (T )
eλ (T ) = aλ (T )Kλ (T ) ⇒ = Kλ (T ) , (2.23)
aλ (T )

donde Kλ (T ) es una función de carácter universal que describe la distribu-


ción en longitud de onda de la radiación en estado de equilibrio termodinámi-
co. Un aspecto fundamental identificado por Kirchhoff, es que el cociente
eλ /aλ depende del material, mientras que la función Kλ es independiente
del mismo. Por tanto, la ley de Kirchhoff (2.23) se cumple para cualquier
objeto en equilibrio termodinámico, independiente de sus propiedades, o de
las de la radiación incidente.
Un aspecto fundamental de la ley de Kirchhoff es el principio de balance
detallado: el equilibrio se cumple no sólo de manera global, {potencia absor-
bida = potencia emitida}, sino también de manera detallada: es decir para
cada dirección, intervalo de ángulo sólido, longitud de onda e incluso para
cada componente de polarización.

2.3.2. El desarrollo de la teorı́a de cuerpo negro


Hacia 1894, Planck se advocó a la búsqueda de la función Kλ , la dis-
tribución espectral de la radiación en equilibrio termodinámico, conoci-
do como el problema del cuerpo negro; un absorbedor ideal, definido por

10
Figura 2.4: Cuerpo negro emitiendo de manera isotrópica (rojo) después de
termalizar radiación anisotrópica incidente (en azul).

aλ = 1 ⇒ eλ (T ) = Kλ (T ), emite con esta distribución espectral y, al


no reflejar la radiación incidente, es completamente negro. En 1879 Stefan
habı́a empleado argumentos termodinámicos para mostrar que la densidad
de energı́a, u, de la radiación contenida en una cavidad de paredes negras
(figura 2.4), debı́a satisfacer u = σT 4 , siendo σ una constante. De ahı́, Wien
dedujo en 1893 que u debı́a cumplir
4π 4π
uλ = Kλ = λ−5 φ(λT ) ⇒ uν = Kν = ν 3 φ(T /ν) ,
c c
siendo φ una función de una sola variable. Esta es la forma original de
la ley de desplazamiento de Wien. El mismo Wien buscó la expresión que
mejor ajustara los datos experimentales de la época, proponiendo en 1896
la expresión Kλ (T ) = bλ−5 e−a/λT , con a y b constantes a determinar.
Planck hizo un estudio de la interacción entre resonadores y campos elec-
tromagnéticos. Usando consideraciones termodinámicas, demostró en 1899
que la ley de distribución de Wien cumple el principio de máxima entropı́a.
Pero experimentos con detectores infrarrojos a principios de 1900, sensibles
entre 12 y 18 µm, mostraron que la distribución de Wien es inadecuada para
longitudes de onda larga, lo que llevó a la búsqueda de una generalización
de la misma. El 19 de octubre de 1900 Planck presentó la expresión,

cλ−5
Kλ = ,
ea/λT − 1
la cual ajustó correctamente los datos experimentales, y cumple con el prin-
cipio de máxima entropı́a. Esta expresión requiere que los intercambios de
energı́a de los resonadores de Planck con el campo de radiación se divida

11
en un número entero de elementos, o cuantos, de dimensiones ε = hν. En
1905, Rayleigh y Jeans mostraron por separado que el postulado cuántico
es incompatible con los principios clásicos, y que bajo el principio clásico de
equipartición de la energı́a la radiación en equilibrio termodinámico deberı́a
cumplir uλ (T ) = 8πkT /λ4 , la distribución de Rayleigh-Jeans.

2.3.3. Espectro de la radiación de cuerpo negro


La distribución espectral de la radiación emitida por un absorbedor y emisor
perfecto en equilibrio termodinámico a una temperatura T está descrita por
la función de Planck, comunmente denotada Bν (T ), dada por

2hν 3 /c2
Bν (T ) ≡ , (2.24)
ehν/kT − 1

donde h ' 6.626 × 10−27 erg s es la constante de Planck. La radiación


de cuerpo negro es isotrópica y no depende de la constitución del objeto,
más allá de ser negro para toda frecuencia. La función de Planck se mues-
tra en la figura 2.5. Sus momentos pueden calcularse directamente bajo la
consideración de isotropı́a.

Intensidad media y densidad de energı́a


La intensidad media es el promedio de la función sobre el ángulo sólido por
lo que, siendo Bν isotrópica,
Z ∞
σ 4
Jν = Bν (T ) ⇒ J= Jν (T )dν ≡ B(T ) = T , (2.25)
0 π

especificando también la integral sobre frecuencias, siendo σ = 2π 4 k 4 /15h3 c2 .


La densidad de energı́a es
4π 4π
uν = Jν = Bν (T ) ⇒ u(T ) = aT 4 ,
c c
donde a = 8π 5 k 4 /15c3 h3 ' 7.56 × 10−15 erg cm−3 K−4 es la constante de
radiación, planteada por Stefan en 1879. La constante de Stefan-Boltzmann,
definida en la ec. 2.25, es σ = ac/4 ' 5.67 × 10−5 erg cm−2 s−1 K−4 .

Flujo de energı́a
Al ser la función de Planck isotrópica, tenemos un flujo de energı́a nulo,
Fν = 0. Sin embargo, al integrar sobre medio hemisferio, de acuerdo a la

12
relación 2.7, tenemos Fν+ = πBν (T ). Esto coincide con el cálculo para una
fuente puntual isotrópica. Si integramos sobre frecuencias obtenemos,

F (T ) = πB(T ) = σT 4 . (2.26)

Presión de radiación
Al tratarse de una emisión isotrópica, tenemos que la presión de radiación
está dada por, pν = uν /3 , de donde p = aT 4 /3 . Esta es formalmente la
ecuación de estado de un gas de radiación.

Distribución en longitud de onda


La Planckiana es una distribución de flujo por unidad espectral, descrita ya
sea en frecuencias o longitudes de onda. Para expresar (2.24) en términos
de λ es necesario conservar el flujo en la banda espectral considerada,

Bν dν = Bλ dλ .

Dado que dν = −c dλ/λ2 , la forma de la distribución de Planck en términos


de λ resulta ser:
2hc2 /λ5
Bλ (T ) = hc/λkT . (2.27)
e −1

Comportamiento y punto máximo


La función de Planck es creciente con respecto a la temperatura:
∂Bν
> 0. (2.28)
∂T
A mayor temperatura es mayor la intensidad del cuerpo negro: el flujo total,
dado por el área bajo la curva, la cual proporcionalmente como T 4 .
El máximo de Bν corresponde a hν/kT = η, siendo η la solución de
η = 3(1 − e−η ) → η ' 2.821. Debido a la dependencia en λ−5 , el máximo
de Bλ corresponde a λkT /hc = 1/ζ donde en este caso ζ es la solución de
ζ = 5(1−e−ζ ) → ζ ' 4.965. Esta relación da lugar a la ley de desplazamiento
de Wien,
λmax T ≈ 0.2898 cm K . (2.29)
Como ejemplo, el fondo de radiación de microondas (Tcmb = 2.726±0.010 K)
tiene sus máximos de emisión en λmax ≈ 1.06 mm y νmax ≈ 160 GHz.

13
Figura 2.5: La función de Planck, Bν (arriba) o Bλ (abajo). A la izquierda
en unidades lineales y a la derecha en logarı́timicas. Las lı́neas punteadas
denotan las aproximaciones de Rayleigh-Jeans y de Wien.

Lı́mite de Rayleigh-Jeans
Para hν/kT  1 la Planckiana tiende a la función de Rayleigh-Jeans,

2ν 2
Iν(RJ) (T ) = kT , (2.30)
c2

14
derivada por Rayleigh y Jeans en 1905 bajo el principio clásico de equi-
partición de la energı́a. Si la función de Rayleigh-Jeans fuera correcta, un
objeto a temperatura ambiente serı́a extremadamente brillante en el ultra-
violeta
R ∞ RJ
extremo, llevando a la divergencia de su integral sobre frecuencias,
0 Iν dν → ∞, conocida en su momento como la catástrofe ultravioleta.

Lı́mite de Wien
Para frecuencias grandes, definidas por hν/kT  1, la función de Planck
tiende a la función de Wien,
2hν 3 −hν/kT
Iν(w) (T ) = e , (2.31)
c2
historicamente la primera descripción de la emisión de cuerpo negro. La
función de Wien es integrable y cumple cualitativamente con la ley de des-
plazamiento, λmax T = constante; pero falla a frecuencias pequeñas donde
predice incorrectamente Iν ∝ ν 3 . Para frecuencias altas la intensidad de la
radiación de cuerpo negro decrece exponencialmente con ν.

Temperaturas astrofı́sicas
La función de Planck permite asignar un valor de temperatura a una me-
dición de flujo o intensidad, particularmente para fuentes resueltas angu-
larmente, y valorar las condiciones fı́sicas del emisor. Los tres principales
estimadores son:
La temperatura de brillo, que se define a partir de la relación

Iν = Bν (Tb ) .

La temperatura de brillo se especifica para una frecuencia determina-


da. En el régimen de Rayleigh-Jeans, de uso muy común en radioas-
tronomı́a, la temperatura de brillo es una medida del flujo,
c2
Tb = Iν .
2ν 2 k
En radioastronomı́a la intensidad se expresa frecuentemente como una
temperatura de antena, que viene siendo el promedio de la temperatura
de brillo sobre el haz de la antena mas el ruido instrumental, caracte-
rizado con la temperatura de ruido. Dado que la temperatura de brillo
es generalmente función de la frecuencia, no se le usa en el régimen de
Wien, donde el flujo cambia rápidamente con T .

15
La temperatura efectiva se define a partir del flujo integrado en el
emisor,
F = σ Te4 .
El flujo medido se relaciona con el emitido mediante el tamaño angu-
lar de la fuente, Fobs = Fem ∆Ωobs /∆Ωem . Para una fuente isotrópica
∆Ωem = π, mientras que ∆Ωobs = πδθ2 , siendo δθ el radio angular de
la fuente observada. En el caso del Sol, Fobs = σ Te4 δθ2 corresponde
con la constante solar, s ' 1367W/m2 .
La temperatura efectiva es una medida del flujo integrado y se usa
frecuentemente para describir tipos de estrellas. La luminosidad de
una estrella está dada por

L∗ = 4πR∗2 σTe4 .

Para el Sol Te ' 5770 K; una estrella roja tiene Te ' 3000 K, mientras
que una estrella azul puede alcanzar Te ' 30 000 K.

La temperatura de color se define a partir del espectro de cuerpo negro


que mejor ajusta a los datos en consideración, independientemente del
flujo total.

2.3.4. Ley de Kirchhoff y radiación térmica


La ley de Kirchhoff, expresada inicialmente por la expresión (2.23), nos dice
que para un cuerpo en equilibrio el cociente entre los coeficientes de emisión
y absorción está dado por la función de Planck,

ν /αν = Bν (T ) , (2.32)

es decir Sν = Bν (T ). Esta relación depende sólo del equilibrio termodinámi-


co del medio, independientemente de las caracterı́sticas de la radiación, des-
critas por Iν . Decimos que la radiación es térmica cuando Sν = Bν (T ).
Más aún: podemos tener un medio estrictamente fuera de equilibrio ter-
modinámico en el que las distribuciones estadı́sticas que describen al medio
corresponden localmente con las de equilibrio termodinámico. En ese caso se
define la temperatura como un parámetro local, T (~r), que cumple la condi-
ción de equilibrio termodinámico local (ETL = LTE, en inglés). En este caso,
la función fuente es la función de Planck evaluada localmente, en términos
de coordenadas o de profundidad óptica: Sν = Bν (T (~r)), o Sν = Bν (T (τν )).

16
En el caso de radiación térmica en el régimen de Rayleigh-Jeans, la
ecuación de transferencia puede escribirse como
dIν dTb
= −Iν + Bν (T (τν )) ⇒ = −Tb + T . (2.33)
dτν dτν
Por un lado, se tiene que la emisión térmica es igual a la emisión de cuerpo
negro si dIν = 0; lo cual se da para medios ópticamente gruesos, τν → ∞.
Para un medio en estricto equilibrio termodinámico, T es independiente de
τν , y la solución de la ecuación de transferencia puede expresarse como una
relación entre la temperatura de brillo y la del medio,

Tb (τν ) = Tb (0) e−τν + T (1 − e−τν ) .

La temperatura de brillo tiende a la del medio en el caso ópticamente grueso.

2.4. Los coeficientes de Einstein


La relación entre los coeficientes de emisión y absorción descrita por la ley de
Kirchhoff proviene de una relación más fundamental entre estos procesos a
nivel microscópico, la cual se cumple independientemente del equilibrio y se
expresa a través de relaciones entre coeficientes introducidos por Einstein.
Los coeficientes de Einstein se derivan considerando un sistema cuántico
idealizado con dos niveles de energı́a: un nivel inferior 1, de energı́a E1 ,
peso estadı́stico g1 , y población n1 (numérica o por unidad de volumen);
y un nivel superior 2, de energı́a E2 , peso estadı́stico g2 , y población n2 .
Las transiciones del nivel inferior al superior son mediante la absorción de
un fotón de energı́a hν0 = E2 − E1 , y las transiciones del nivel superior al
inferior son mediante la emisión de un fotón de misma energı́a (Fig. 2.6).
Siendo que estos sistemas no pueden permanecer indefinidamente en el nivel
superior, el valor de E2 tiene una indeterminación descrita por una función
φ(ν) que representa la probabilidad de emitir o absorber un fotón de energı́a
ν cercana a ν0 (figura 2.6). La función está centrada en ν0 y el ancho natural
de la misma está dado por el principio de indeterminación, ∆E∆t ≥ h̄,
siendo ∆E = h∆ν, y ∆t el tiempo tı́pico de decaimiento desde el nivel 2.
En la práctica otros procesos pueden ensanchar la función φ(ν), como por
ejemplo la distribución de velocidades de las partı́culas y la absorción de
fotones en la frecuencia correspondiente
p a este efecto Doppler térmico, con
un ensanchamiento ∆ν ∝ ν0 kT /mc2 .
Los procesos de interacción de este sistema con la radiación son los mis-
mos que considera la ecuación de transferencia radiativa:

17
la emisión espontánea, caracterizada por el coeficiente A21 que mide
la probabilidad de transición por unidad de tiempo (s−1 ).

La absorción, que depende del flujo incidente de radiación, dado por


Jν para absorción isotrópica. La probabilidad de transición por absor-
ción queda en términos del coeficiente B12 como B12 J¯ donde
Z ∞
J¯ = Jν φ(ν) dν ,
0

representa el flujo de radiación y la respuesta del sistema.

El proceso de emisión estimulada, que depende del flujo incidente de


radiación de manera análoga al proceso de absorción: la probabilidad
de transición queda expresada en términos de un coeficiente de misma
forma, B21 J.¯

Se dice que hay un equilibrio estadı́stico si el número de transiciones 1 → 2


es igual al de transiciones 2 → 1, es decir

A21 /B21
n1 B12 J¯ = n2 B21 J¯ + n2 A21 ⇒ J¯ = , (2.34)
n1 B12 /n2 B21 − 1

siendo ésta una relación fundamental entre las poblaciones de los niveles y
la intensidad de la radiación. Si además se tiene el equilibrio termodinámico,
las poblaciones de los niveles se relacionan a través de la ley de Boltzmann,

n1 /n2 = (g1 /g2 )e−(E1 −E2 )/kT ,

Figura 2.6: Izquierda: sistema cuántico de dos niveles ilustrando el proceso


de emisión espontánea, emisión inducida y absorción. Derecha: función de
probabilidad de que el sistema absorba o emita un fotón de frecuencia ν.

18
de donde
A21 /B21
J¯ = . (2.35)
(g1 B12 /g2 B21 ) e−hν/kT − 1
Identificando esta expresión con la ley de Kirchhoff, Jν = Bν , se obtienen
las relaciones entre los coeficientes de Einstein:
2hν 3
g1 B12 = g2 B21 , A21 = B21 . (2.36)
c2
Estas son propiedades inherentes a los sistemas cuánticos, independientes
de las poblaciones de los niveles de energı́a, que relacionan de manera fun-
damental los procesos de emisión y de absorción. Este tipo de relaciones
se denominan relaciones de balance detallado y pueden emplearse fuera de
equilibrio termodinámico. Los coeficientes de emisión y absorción de estos
sistemas vienen dados por
hν hν
ν = φ(ν)n2 A21 , αν = φ(ν) (n1 B12 − n2 B21 ) . (2.37)
4π 4π
El cociente entre los coeficientes de emisión y absorción es la función fuente,
que en el caso mas general viene dada por

n2 A21 2hν 3 /c2


Sν = = , (2.38)
n1 B12 − n2 B21 n1 g2 /n2 g1 − 1

independientemente de las condiciones fı́sicas del sistema. Si las poblaciones


están en equilibrio y se ajustan a la ley de Boltzmann, entonces tenemos
emisión térmica, Sν = Bν (T ), para ν alrededor de ν0 . Un caso radical-
mente fuera de equilibrio es el de un sistema con una sobrepoblación del
nivel superior tal que n2 g2 < n1 g1 . El coeficiente de absorción es enton-
ces negativo y la radiación incidente es amplificada de manera exponencial,
Iν (s) = Iν (0)e|αν |s , dando lugar a un efecto maser. Esta emisión se obser-
va en regiones con choques que provocan poblaciones de niveles lejanas al
equilibrio termodinámico.

2.5. Dispersión
El proceso de dispersión pura (scattering en Inglés) consiste en la absorción
y re-emisión isotrópica y coherente de radiación. El término coherente indica
que las distribuciones espectrales de la radiación incidente y dispersada son

19
iguales. La dispersión se describe mediante un coeficiente de dispersión3 ,
(d)
αν , que cumple:
ν(d) = αν(d) Jν , (2.39)
donde Jν es la intensidad media de la radiación. En el caso particular de
dispersión sin absorción y sin emisión espontánea tenemos Sν = Jν , y la
ecuación de transferencia queda como:
dIν
= −αν(d) (Iν − Jν ) . (2.40)
ds
Dado que Jν es una integral de Iν , la ecuación 2.40 es de tipo integro-
(d)
diferencial y no es fácilmente soluble. El término αν Iν denota la fracción
de radiación “interceptada” por el dispersor, la cual es re-emitida isotrópi-
(d) (d)
camente a través del término αν Jν . Nótese que si αν depende de ν, la
radiación de distribución espectral localmente, Iν (s) 6= Iν (0), aunque no lo
haga en promedio, Jν (s) = Jν (0). Un ejemplo es la dispersión de Rayleigh
en la atmósfera terrestre, función creciente con la frecuencia, que resulta en
un Sol enrojecido y un cielo azul.
En el caso de radiación térmica podemos considerar la acción conjunta de
dispersión, absorción y emisión espontánea, distinguiendo el coeficiente de
(a)
absorción como αν y suponiendo válida la ley de Kirchhoff para el término
(a) (a)
de absorción, ν = αν Bν . La ecuación de transferencia radiativa queda
como:
dIν  
= − αν(a) + αν(d) (Iν − Sν ) , (2.41)
ds
quedando la función fuente redefinida como:
(a) (d)
αν Bν + αν Jν
Sν ≡ (a) (d)
. (2.42)
αν + αν
(a)
La emisión espontánea está contenida en el término αν Bν , mientras que
(a)
la absorción pura es αν Iν . Los términos de dispersión son aquellos propor-
cionales a αν (d). A la suma de los coeficientes de dispersión y absorción,
(a) (d)
αν + αν se le denomina coeficiente de extinción. Un ejemplo concreto de
su empleo es la corrección de datos fotométricos o espectroscópicos en el
visible por extinción debida a la atmósfera terrestre.

3 (d)
Rybicki emplea σν , ν , aunque esta ya se introdujo para denotar la sección eficaz.

20
2.6. Atmósferas plano paralelas
Una atmósfera plano-paralela está estructurada a lo largo de una sola direc-
ción, que denominaremos ẑ (figura 2.7). Esta aproximación es útil para el
estudio de atmósferas delgadas en estrellas o planetas. Los tres casos que se
presentan son: la deducción de la ecuación de difusión radiativa; la aproxi-
mación de Eddington, incluyendo el caso de una atmósfera gris; y una solu-
ción para la transferencia de energı́a radiativa en atmósferas plano-paralelas
presentada por Simonneau.

2.6.1. La ecuación de difusión radiativa


La ecuación de difusión radiativa se obtiene mediante la aproximación de
Rosseland, que a su vez nos conduce a una relación entre el flujo de energı́a
y el gradiente de temperatura de un medio. Se considera un medio plano-
paralelo estratificado cuyas propiedades fı́sicas dependen únicamente de la
coordenada z. En ese caso, la intensidad de la radiación Iν es función de z y
de µ = cos θ, siendo θ el ángulo de la lı́nea de visión con la normal al plano
del medio. Usamos ds = dz/µ , para escribir la ecuación de transferencia
como:
∂Iν (z, µ)
µ = − (ανa + ανs ) (Iν − Sν (z)) . (2.43)
∂z

Figura 2.7: Geometrı́a de una


atmósfera plano paralela. La
estratificación es vertical, a lo
largo de la dirección z, mien-
tras que la lı́nea de visión co-
rresponde a ds = (±)dz/µ, con
µ = cos θ.

21
El inverso de µ se denomina masa de aire. Podemos despejar Iν planteando
una relación propicia para un proceso de iteración,
µ ∂Iν
 
Iν = Sν − a . (2.44)
αν + ανs ∂z
A orden cero despreciamos el cambio de la intensidad con la profundidad,
(0) (0) (0)
por lo que tenemos Iν (z, µ) = Sν (z). Dado que Sν no depende de µ,
(0) (0)
es isotrópica ⇒ Jν = Sν . Esto es particularmente válido para un medio
(0)
con emisión térmica, Sν = Bν . La aproximación de Rosseland consiste en
suponer que la función fuente está dada por una superposición de funciones
de Planck con T = T (z). Substituyendo en la ecuación 2.44 obtenemos, a
primer orden,
µ dBν
 
(1)
Iν = Bν − a . (2.45)
αν + ανs dz
Podemos entonces calcular el flujo de radiación
Z +1 Z +1
2π dBν
Fν (z) = 2π Iν (z, µ) µdµ = − a s
µ2 dµ
−1 α ν + αν dz −1
4π dBν dT
= − a s
. (2.46)
3(αν + αν ) dT dz
Si integramos sobre frecuencias obtenemos la ecuación de difusión radiativa,
16σT 3 dT
F (z) = − , (2.47)
3αR dz
donde, empleando las propiedades de la función de Planck, definimos la
opacidad de Rosseland como
Z ∞   Z ∞
1 1 dBν dBν
  
≡ dν dν . (2.48)
αR 0 ανa + ανs dT 0 dT
La ecuación de difusión radiativa describe el flujo de energı́a originado por un
gradiente de temperatura. Esta relación de particular utilidad en el estudio
de interiores estelares.

2.6.2. Aproximación de Eddington y atmósfera gris


La aproximación de Eddington para el análisis de atmósferas estelares su-
pone un flujo semi-isotrópico, permitiendo describir la intensidad como una
función lineal de µ,

Iν (τν , µ) = aν (τν ) + µ bν (τν ), (2.49)

22
Figura 2.8: Trayectorias de rayos de luz provenientes del centro del Sol o del
limbo.

donde reemplazamos αν dz por dτν , la profundidad óptica de la atmósfera


medida a lo largo de la vertical. Las funciones aν (τν ) y bν (τν ) se relacionan
con los momentos de la intensidad especı́fica, es decir la intensidad media,
el flujo de radiación y su presión

1 +1
Z +1
c 4π
Z
Jν = Iν dµ = uν = aν , Fν = 2π Iν µdµ = bν ,
2 −1 4π −1 3
Z +1
2π 4π aν
pν = Iν µ2 dµ = .
c −1 3 c
En particular se tiene que campos semi-isotrópicos cumplen la misma rela-
ción entre densidad y presión de radiación que en el caso isotrópico,
1
pν = uν . (2.50)
3
Al substituir la aproximación (2.49) en la ecuación de transferencia radiativa,
µ(∂Iν /∂τν ) = Iν − Sν , se relacionan las funciones aν y bν con Sν .
Entre las aplicaciones más conocidas de la aproximación de Eddington
está la atmósfera gris, en la que la opacidad es independiente de la frecuencia,
τν = τ . Trabajando con las funciones a y b integradas sobre frecuencia,
y suponiendo un medio térmico, S = B = (σ/π)T 4 , podemos relacionar
T = T (τ ) con la temperatura efectiva imponiendo la condición de que en la

23
frontera externa de la atmósfera, τ = 0, el flujo es solamente emergente e
igual a F = σTe4 . Se obtiene
3σ 4 2 3 2
   
I(τ, µ) = Te µ + τ + , 4
T (τ ) = Te4 τ + . (2.51)
4π 3 4 3
Vemos que T (0) ' 0.841Te y que T (τ ) = Te en τ = 2/3. De la forma
completa para la intensidad (2.51) obtenemos la ley de oscurecimiento al
limbo,
I(0, µ) 3 2
 
= µ+ . (2.52)
I(0, 1) 5 3
Bajo las aproximaciones de Eddington y de atmósfera gris, la intensidad en
el limbo solar debe ser 0.4 veces la observada en el centro del disco del Sol.

2.6.3. La solución de Simonneau para el espectro de una


atmósfera plano-paralela
Edouard Simonneau (1981) presenta un tratamiento para estimar el espectro
emergente de una atmósfera estelar, dado el coeficiente de opacidad κλ , en
función de la longitud de onda4 . Para τλ  1, la ecuación de transferencia
puede escribirse como
∂Iλ
µ = Iλ − Bλ (T (z)) , (2.53)
∂τλ
de donde podemos aproximar
dBλ
Iλ = Bλ + µ . (2.54)
dτλ
Proponemos entonces para la intensidad en la superficie (τλ = 0)
(
0 para µ < 0
Iλ (0, µ) = . (2.55)
Bλ (0) + µ [dBλ /dτλ ]0 para µ ≥ 0

De donde calculamos el flujo en la superficie,


Z +1
2π dBλ
Fλ (0) = 2π Iλ µ dµ = πBλ (0) + (0) . (2.56)
−1 3 dτλ
Nótese que en una atmósfera plano-paralela el flujo integrado es constante,
es decir independiente de z 5 .
4
siguiendo el tratamiento original usamos λ en vez de ν
5
el flujo integrado es aproximadamente constante para una atmósfera delgada en una
simetrı́a esférica.

24
Procedemos a integrar sobre λ, tomando en cuenta las definiciones de
opacidad media de Rosseland (ec. 2.48) y de Planck,
Z ∞
1
κp = κλ Bλ dλ , (2.57)
B(T ) 0

recordando αλ = ρκλ . Empleando la relación entre el flujo y la temperatura


efectiva, F = σTe4 ; y entre la integral de la Planckiana y la temperatura
inicial, B(T0 ) = (σ/π)T (0)4 , se obtiene:

4π κp Te4
 
F = πB(0) + B(0) ⇒ T (0)4 = . (2.58)
3 κR 1 + 4κp /3κR

Podemos ahora calcular la temperatura fı́sica en la superficie, T0 = T (0), en


función de la temperatura efectiva, siempre y cuando podamos determinar
κp (ρ, T ) y κR (ρ, T ). En el ejemplo particular de una atmósfera gris, κλ = cte,
tenemos κp = κR , de donde T0 = (3/7)1/4 Te ' 0.8091 Te . Esta expresión se
compara mejor con la solución exacta, T0 ' 0.8112 Te , que la solución de la
aproximación de Eddington, T0 = Te /(2)1/4 ' 0.8409 Te .
Conocida la temperatura al borde de la atmósfera, podemos deducir el
espectro emergente (ec. 2.56) evaluando la Planckiana y su derivada:
( ! )
κp ehc/λkT0 hc
Fλ = πBλ (0) 1 + . (2.59)
3κλ ehc/λkT0 − 1 λkT0

En el régimen de Rayleigh-Jeans Fλ ≈ πBλ (0) (1 + κp /3κλ ), siendo el espec-


tro el de cuerpo negro en valores de λ donde el medio es opaco, κλ  κp .
En la región de Wien, comúnmente en el ultravioleta,
κp hc
  
Fλ ≈ πBλ (0) 1 + ,
3κλ λkT0

siendo Fλ ∝ Bλ (0)/κλ . La mayor incertidumbre para calcular el espectro


ultravioleta radica en conocer κλ .

25
Capı́tulo 3

Termodinámica y mecánica
estadı́stica

Versión 1 de noviembre de 2016

La mecánica estadı́stica tiene como fin una descripción fı́sicamente consis-


tente de sistemas constituidos por muchas partı́culas, de la cual se derivan
propiedades macroscópicas del sistema, que a su vez tienen una descripción
termodinámica - válida en equilibrio termodinámico, por definición.

3.1. Termodinámica
3.1.1. Las leyes de la termodinámica
La termodinámica estudia el comportamiento de sistemas macroscópicos
descritos por variables como energı́a, presión, volumen, temperatura o in-
cluso tensión, magnetización, etc.... La termodinámica no considera el estado
microscópico del sistema, dado por los estados de las partı́culas individuales
que lo componen.
El formalismo de la termodinámica se basa en el concepto de tempera-
tura, definido a partir del concepto de equilibrio termodinámico:
un sistema está en equilibrio termodinámico si las variables que
lo describen no varı́an con el tiempo.
De manera equivalente, dos sistemas están en equilibrio termodinámico
mútuo si al entrar en contacto las variables termodinámicas respectivas no
varı́an. Por definición la termodinámica se aplica a sistemas en equilibrio y
se basa en las leyes brevemente descritas a continuación.

1
Ley cero - definición de temperatura
Si de tres sistemas A, B y C, los sistemas A y B se encuentran cada uno en
equilibrio termodinámico con C, entonces A y B se encuentran en equilibrio
uno con el otro.
La ley cero define el concepto de temperatura a través de los conjuntos
de sistemas en equilibrio mutuo (clases de equivalencia): si A y B están en
equilibrio, entonces TA = TB .

Primera ley - conservación de la energı́a


El cambio en energı́a interna U de un sistema cerrado de temperatura T ,
volumen V , presión P , potencial quı́mico µ, y N partı́culas está dado por,

dU = d−Q − P dV + µ dN +
X
Xı dxı , (3.1)
ı

donde Q representa el cambio de energı́a térmica, o calor. La primera ley


sintetiza la conservación de la energı́a, incluyendo la energı́a interna y la
energı́a térmica, que a su vez incluye la entropı́a. La cantidad Q no está
definida en términos de una diferencial exacta, hecho que denotamos con la
diferencial “inexacta” d− . Esto equivale a decir que Q no es una variable de
estado, al no poderse relacionar un valor de la variable Q a un estado del
sistema. La forma diferencial exacta de la energı́a térmica es

d−Q = T dS

siendo S la entropı́a del sistema. El término en sumatoria a la derecha


en (3.1) indica explı́citamente el conjunto de variables fı́sicas que pueden
almacenar energı́a. Estas se agrupan en pares de variables conjugadas, for-
mados por una variable intensiva (Xı ), independiente de las dimensiones del
sistema, y una variable extensiva (xı ), que depende de las dimensiones del
sistema. La contribución de cada par a la energı́a interna es Xı dxı . Ejem-
plos son el campo magnético H y la magnetización M (→ HdM ), el campo
eléctrico E y la polarización P (→ EdP ).

Segunda ley - comportamiento de la entropı́a


En un sistema cerrado la entropı́a nunca decrece,

dS ≥ 0 . (3.2)

2
Como consecuencia un estado de equilibrio es un estado de máxima entropı́a.
Procesos que implican dS = 0 en un sistema cerrado son reversibles, mientras
que aquellos que implican dS > 0 son irreversibles.
Los principios de máxima entropı́a y mı́nima energı́a establecen que el
equilibrio termodinámico entre dos sistemas requiere no sólo TA = TB (equi-
librio térmico), sino también PA = PB (equilibrio mecánico). El requerimien-
to extra de equilibrio quı́mico se traduce en µA = µB . El equilibrio requiere
una relación entre las variables del sistema denominada ecuación de estado.

Tercera ley - el estado de mı́nima energı́a


La entropı́a de un sistema se anula en el estado para el cual
∂U
 
=0 .
∂S V,N

Este estado corresponde al de mı́nima energı́a interna, el cual define T = 0


y una escala absoluta de temperatura. La tercera ley define el cero absoluto
de temperatura en el punto donde la entropı́a se anula1 .

3.1.2. Termodinámica de un gas ideal clásico


Para definir un sistema termodinámico es necesario especificar su ecuación
de estado, la cual relaciona -o incluso define- la temperatura T con variables
como la presión, P , y volumen, V . La ecuación de estado de un gas ideal
clásico está dada por
P V = N kT , (3.3)
siendo N el número total de partı́culas en el gas y k la constante de Boltz-
mann (k ' 1.380650 × 10−16 erg K−1 ). De esta ecuación se desprende que en
un proceso isotérmico (T constante) que lleva al sistema de un estado 0 a
un estado 1 se cumple P0 V0 = P1 V1 .
Un concepto práctico para describir intercambios energéticos de un sis-
tema es el de los calores especı́ficos, definidos para volumen y presión cons-
tantes: ! !
d−Q d−Q
Cv ≡ , CP ≡ , (3.4)
dT v dT P
1
Para referencias generales a la termodinámica véase los libros de termodinámica de
Garcı́a-Colı́n y Callen

3
respectı́vamente. Para el gas ideal se tiene, empleando d−Q = dU + P dV ,
!
d−Q dU dU dV
 
CV = = , CP = +P = CV + N k , (3.5)
dT V
dT dT dT P

la energı́a interna U siendo independiente de V . Se define el “ı́ndice adiabáti-


co” como el cociente de calores especı́ficos, γ ≡ Cp /Cv . De su definición se
desprende que γ = 1 + N k/CV = 1 + N k/(dU/dT ) y
N kT
U= .
γ−1
Para un gas ideal compuesto por partı́culas monoatómicas tenemos γ = 5/3
y U = 3N kT /2; para un gas ideal compuesto por moléculas diatómicas, se
tiene γ = 7/5 ⇒ U = 5N kT /2.
En el caso de un proceso adiabático (dS = 0), y por tanto reversible,
tenemos T dS = dU + P dV = 0. Usando dU = CV dT = (CV /N k) d(P V ) =
(γ − 1) (P dV + V dP ) llegamos a la relación que caracteriza a un proceso
adiabático,
P V γ = constante . (3.6)

3.1.3. Termodinámica de un gas de fotones


Un gas de fotones cumple la relación P = u/3 = U/3V . La ecuación de
estado se obtiene de la expresión para u(T ). Dado que la densidad de energı́a,
u = U/V , depende solamente de la temperatura tenemos
du 4
 
T dS = V dT + u dV ;
dT 3
y empleando ∂ 2 S/∂V ∂T = ∂ 2 S/∂T ∂V , se llega a la relación:
u(T ) = aT 4 , (3.7)
siendo a una constante por especificar (§2.3). Se desprende que P = aT 4 /3
es la ecuación de estado del gas de fotones. Un proceso adiático cumple
P V 4/3 = cte, equivalente a un ı́ndice γ = 4/3.

3.2. Mecánica estadı́stica


3.2.1. Descripción estadı́stica de un sistema
La mecánica estadı́stica interpreta las variables macroscópicas como la mani-
festación estadı́stica de las propiedades microscópicas individuales de un sis-
tema de muchas partı́culas. En particular, se busca deducir las propiedades

4
termodinámicas del sistema macroscópico basándose en una descripción es-
tadı́stica. Hay cuatro requisitos básicos para dar una descripción estadı́stica
de un sistema fı́sico: (1) especificar el estado del sistema; (2) especificar el
espacio de estados accesibles, o ensemble estadı́stico; (3) especificar la pro-
babilidad de cada estado; (4) hacer el cálculo estadı́stico.

# 1 - Estado de un sistema
La descripción del estado de un sistema puede darse conforme las leyes de
la mecánica clásica o la mecánica cuántica, dependiendo de qué formalis-
mo sea más exacto o incluso más práctico. En mecánica clásica el estado
de una partı́cula en un instante t puede describirse con su posición y mo-
mento, {~x(t), p~(t)}, suponiendo que tenemos el conocimiento necesario para
calcular las fuerzas que actúan sobre la partı́cula. En el caso de un siste-
ma de N partı́culas, requerirı́amos el conjunto de posiciones y momentos,
{~xj , p~j ; j = 1, ..., N }, que basta para especificar el (micro)-estado del siste-
ma; requerimos también conocer la interacción entre las partı́culas, que da
lugar a la fuerza que siente la i-ésima partı́cula, F~i (~x1 , ...~xN ) y de ahı́ cal-
cular cómo evolucionan posiciones y momentos. Esto es posible en principio
pero no siempre en la práctica.
En mecánica cuántica el estado de un sistema queda definido por la
función de onda, ψ(~x1 , . . . , ~xN ), que depende de las 3N coordenadas de las
partı́culas. Frecuentemente la función de onda puede escribirse en términos
de otras variables, concretamente los números cuánticos. Por ejemplo, un sis-
tema formado por dos osciladores armónicos tridimensionales está plenamen-
te definido si especificamos los seis números cuánticos {n1x , n1y , n1z , n2x , n2y , n2z }.
Las funciones de onda ψ{n1x ,n1y ,n1z ,n2x ,n2y ,n2z } son enumerables y podemos
hacer la estadı́stica del sistema. Nótese que hay varios estados con misma
energı́a, E = (n1x + n1y + n1z + n2x + n2y + n2z + 3)h̄ω .
En general, el localizar los estados dentro del espacio-fase de posiciones
y momentos es particularmente ventajoso. Esta descripción no especifica el
estado de cada partı́cula, sino cuantas partı́culas tienen mismo estado defi-
nido por una posición ~x y un momento p~. Cada par {~x, p~} define un punto
en el espacio-fase y la descripción del sistema está completa si se especifica
la ocupación del espacio-fase. El principio de exclusión de Pauli prohibe que
dos partı́culas tengan el mismo estado, dentro de la indeterminación inhe-
rente a la mecánica cuántica, que fija el tamaño de las celdas del espacio
fase a ∆x∆p = h/2π, (Figura 3.1). El lı́mite clásico corresponde a h → 0,
el paso de celdas discretas a continuas. Una descripción cuántica completa
considera el espı́n de las partı́culas, pudiendo ser entero -bosones- o semien-

5
Figura 3.1: La división del espacio
fase en celdas de tamaño ∆x∆p = h̄.

tero -fermiones. Los fermiones cumplen el principio de exclusión de Pauli:


dos partı́culas con mismo espı́n no pueden ocupar la misma celda de espacio-
fase; los bosones no sufren esta restricción, dando lugar a comportamientos
distintos para gases de fermiones y bosones.

# 2 - Ensemble estadı́stico
Podemos especificar un estado arbitrario de nuestro sistema, pero no todos
los estados son consistentes con una medición macroscópica. En particular,
al fijar la energı́a total del sistema a un valor E restringe fuertemente el
conjunto de microestados posibles a aquellos que cumplen esta restricción,
o estados accesibles. Supongamos un sistema de cuatro partı́culas, pudiendo
cada una de ellas tomar como energı́a un valor entero entre 1 y 10. El número
total de estados que uno puede construir es 104 = 10000, de los cuales 35
son accesibles si la energı́a total es E = 8.
La restricción que se impone define el tipo de ensemble estadı́stico en
cuestión. Los dos ensembles que veremos son el canónico, donde la restricción
al sistema está en asignar a la energı́a a un valor E, y el gran canónico, que
restringe energı́a y número de partı́culas, {E, N }.

# 3 - Probabilidad de un estado
La probabilidad de un estado dado está dada por el siguiente postulado
fundamental:
en un sistema aislado en equilibrio todos los estados accesibles
tienen misma probabilidad.

6
En el ejemplo de la sección anterior, si el sistema tiene una energı́a total
E = 8 la probabilidad de que las cuatro partı́culas tengan la misma energı́a
es P (2222) = 1/35.
Este postulado trae implı́cito el principio de máxima entropı́a. El sistema
puede adquirir de manera estadı́stica todos los estados accesibles, maximi-
zando el desorden microscópico del mismo. La entropı́a se define a partir de
Ω, el número de estados accesibles,

S(E) ≡ k ln Ω(E) , (3.8)

estableciendo una conexión entre variables microscópicas (Ω) y macroscópi-


cas (S). En el ejemplo anterior podemos ver que la entropı́a es cero en el
estado de mı́nima energı́a, E = 4 donde Ω = 1 ⇒ S = 0, siendo el único es-
tado accesible r = (1111). En general la entropı́a es una función creciente de
la energı́a; en nuestro ejemplo lo es hasta alcanzar una energı́a por partı́cu-
la  ' max /2, siendo max = 10 la energı́a máxima que pueden alcanzar
nuestras partı́culas. Esta limitación no existe en casos más realistas.

# 4 - Cálculos estadı́sticos
Sea un sistema con energı́a total E y Ω(E) estados accesibles. De estos, sea
Ω(E, y ) el número de aquellos que cumplen una restricción adicional, y = y .
La probabilidad de encontrar al sistema con y = y está dada entonces por
P (y ) = Ω(E; y )/Ω(E) y el valor promedio de la variable y es:

1 X
ȳ = y Ω(E, y ) . (3.9)
Ω(E) 

En la práctica es más conveniente calcular variables termodinámicas a través


de la función de partición, definida mas adelante a partir de las probabilida-
des de cada estado. Notamos que para un sistema con energı́a E y número
de estados Ω(E), al relajar una restricción (por ejemplo, quitar una pared a
un gas confinado en un recipiente) el número de estados accesibles aumenta
irremediablemente: los estados previamente accesibles siguen siendo accesi-
bles y hay nuevos estados accesibles. El aumento en el número de estados al
relajar restricciones corresponde con el aumento de la entropı́a enunciado en
la segunda ley de la termodinámica. Si inicialmente tenı́amos y = y0 (por
ejemplo V = V1 ) la variable y se modifica de forma a maximizar el número
de estados accesibles consistentes con el nuevo valor de y . El proceso es
reversible si Ωf inal = Ωinicial e irreversible si Ωf inal > Ωinicial .

7
3.2.2. Relación entre variables macro y microscópicas
Existen varias relaciones entre variables termodinámicas que se derivan de
las leyes de la termodinámica. En particular la primera ley implica2 :
∂E ∂E ∂E
T = , P =− , µ= . (3.10)
∂S ∂V ∂N
El número de estados accesibles es función de E y las variables extensivas
x, como V y N ; es decir Ω = Ω(E, x). A partir de 3.8 y la primera ley de
la termodinámica, escrita como d ln Ω = βdE − β Xdx, con β = 1/kT ,
P

podemos inferir las relaciones


∂ ln Ω 1 ∂ ln Ω 1 ∂ ln Ω 1 ∂ ln Ω
β= ,X=− ⇒ P = ,µ=− . (3.11)
∂E β ∂x β ∂V β ∂N

3.3. Ensemble canónico y el gas ideal clásico


3.3.1. El ensemble canónico
Sea un sistema A con energı́a total E en contacto y equilibrio termodinámico
con un reservorio de energı́a A0 , que por definición cumple E 0  E (figu-
ra 3.16). Si el sistema conjunto A(0) = A + A0 es cerrado, con energı́a total
E (0) = E + E 0 , entonces la probabilidad de que el sistema A esté en un
estado r es:
Pr = C Ω0 (E (0) − Er ) , (3.12)
Pr = 1. Expandemos ln Ω0 (E 0 ) alrededor de ln Ω0 (E 0 ),
P
con C tal que
r

∂ ln Ω0
 
ln Ω0 (E 0 − Er ) ' ln Ω0 (E (0) ) − Er . (3.13)
∂E 0 0

El equilibrio termodinámico entre A y A0 se establece cuando

∂ ln Ω0 ∂ ln Ω0
0
= ≡ β, (3.14)
∂E ∂E 0
donde por definición β el inverso de la temperatura de A0 , igual a la de
A en equilibrio. Se tiene entonces que Pr ∝ e−βEr y podemos escribir la
probabilidad normalizada del estado r como

e−βEr
Pr = P −βEr . (3.15)
e
r

8
Figura 3.2: Intercambio de
energı́a entre un sistema
canónico y su entorno, hasta
alcanzar el equilibrio termo-
dinámico.

La función de partición asociada a esta distribución de probabilidad está


definida como:
e−βEr .
X
Z≡ (3.16)
r

Es posible calcular las variables termodinámicas intensivas directamente de


Z = Z(β, x), ya que la energı́a de un microestado es función de variables
extensivas, Er = Er (x), y no de variables intensivas como P y µ, de carácter
macroscópico,
∂ ln Z 1 X ∂ ln Z 1 X ∂Er −βEr
 
= (−Er ) e−βEr , = −β e = −βX ,
∂β Z r ∂x Z r ∂x

de donde
∂ ln Z 1 ∂ ln Z 1 ∂ ln Z 1 ∂ ln Z
E=− ,X=− → P =+ , µ=− .
∂β β ∂x β ∂V β ∂N
(3.17)
La expresión 3.17 viene dando la ecuación de estado del sistema. La relación
entre la función de partición y la entropı́a se obtiene identificando 3
∂ ln Z ∂ ln Z
d ln Z = dβ + dx = −Edβ − βXdx = −Edβ − β(dE − T dS) ,
∂β ∂x

es decir d ln Z = −d(Eβ + S/k) resultando en S = k(ln Z + βE).


2
en §3.1 se empleó U para designarP
la energı́a interna; a partir de §3.2 se emplea E.
3
entendiendo que Xdx se refiere a Xdx = −P dV + µdV + . . .

9
3.3.2. Gas ideal clásico
El gas ideal consiste en un conjunto de N partı́culas libres y la energı́a del
sistema está dada por la suma de las energı́as cinéticas individuales:
N
X p  |2
|~
E= . (3.18)
=1
2m

Al hacer h0 → 0, la sumatoria sobre estados tiende a una integral sobre los


valores de ~r y p~ de cada una de las partı́culas,
( )
β X 2 d3 r d3 p
Z
Z= exp − p , (3.19)
2m   h3N
0

que se convierte en un producto de N integrales idénticas, resultando en la


función de partición:
3N/2
2πmkT

N
Z=V . (3.20)
h20

Al derivar ln Z con β obtenemos Ē = 3N/2β = (3/2)N kT , que es la energı́a


total de un gas ideal. La relación 3.17 da la ecuación de estado del gas ideal,
P = (N/V )kT . Para la entropı́a del gas ideal clásico obtenemos

3 2πmk
   
S = N k ln V + ln T + σ con σ = 3/2 ln e . (3.21)
2 h20

Esta expresión tiene dos inconvenientes, uno de los cuales es el no com-


portarse como una variable extensiva - la paradoja de Gibbs. Supongamos
dos sistemas, A y B, donde B duplica al sistema A, es decir VB = 2VA
y NB = 2NA . Siendo la entropı́a una variable extensiva deberı́a cumplirse
SB = 2SA , lo cual no es consistente con (3.21). Gibbs obtuvo la solución a
esta paradoja al considerar que el intercambio de partı́culas microscópicas
idénticas no modifica el estado del sistema y dividir la función de partición
por el número de permutaciones entre partı́culas, igual a N !; es decir,
3N/2
VN 2πmkT

Z= . (3.22)
N! h20

Usando la aproximación de Stirling, ln N ! ' N ln N − N , Gibbs obtuvo


V 3
   
S = N k ln + ln T + σs , (3.23)
N 2

10
donde σs = σ+1. Esta expresión satisface SB = 2SA , resolviendo la paradoja
de Gibbs.
El problema irresoluble es el no cumplir la tercera ley, ya que S → −∞
para T → 0. Como veremos más abajo, el lı́mite de bajas temperaturas es
un caso cuántico.

La distribución de Maxwell Boltzmann


Vimos que la probabilidad asociada a un estado r está dada por Pr ∝ e−βEr .
Esta probabilidad se descompone frecuentemente en un producto de térmi-
nos idénticos, de la forma e−βEı correspondientes a cada partı́cula. Podemos
de ahi definir la función de distribución de momentos, f (~r, p~), que nos di-
ce cuantas partı́culas tienen momento alrededor de un valor p~ y posición
alrededor de ~r:
3/2
1

2 /2mkT
f (~r, p~) = f (~
p) = n e−p , (3.24)
2π mkT

la cual cumple la condición de normalización f (p)d3 r d3 p = N . La función


R

de distribución de momentos del gas ideal se conoce como función de dis-


tribución de Maxwell-Boltzmann. Es mas común definirla en términos de la
velocidad ~v de las partı́culas,
3/2
m

2 /2kT
3
f (~v )d v = n e−mv 4πv 2 dv ,
2πkT
donde se emplea el hecho de que f solo depende de la magnitud de la ve-
locidad y d3 v = 4πv 2 dv. La distribución de Maxwell-Boltzmann se puede
emplear para cálculos como el de la velocidad promedio de las partı́culas o
para estimar la presión del gas, donde se considera la fuerza que las partı́cu-
las ejercen sobre un elemento de superficie cuya normal al eje z:
1
Z
P = mvz2 f (v) d3 v = n m < v 2 > . (3.25)
3

El lı́mite clásico
Un gas ideal puede describirse empleando la mecánica clásica siempre y
cuando la ocupación de las celdas de espacio-fase sea baja. Esta condición
puede plantearse como
[∆x]3 [∆p]3  N h̄3 ,

11
donde [∆x]3 y [∆p]3 indican el rango de posiciones y momentos ocupados por
las N partı́culas. Claramente [∆x]3 = V , mientras que [∆p]3 ' (3mkT )3/2 .
La condición para la aplicabilidad de la estadı́stica clásica viene siendo,
h̄2
n−2/3 kT  , (3.26)
3m
con n = N/V , la densidad numérica. El régimen cuántico se aplica para
temperaturas bajas o densidades altas.

3.4. Ensemble gran canónico: gases cuánticos


3.4.1. Ensemble gran canónico
En el ensemble canónico no se considera el intercambio de partı́culas entre
el sistema A y el reservorio A0 . En el ensemble gran canónico el número de
partı́culas en un estado r no es fijo, y se vuelve a considerar la interacción
de A con el reservorio A0 , con la consideración adicional N 0  N . El sistema
(cerrado) compuesto A(0) = A + A0 cumple las restricciones:
(
E (0) = E + E 0
(3.27)
N (0) = N + N 0
De manera análoga al procedimiento seguido para el ensemble canónico, se
obtiene la función de probabilidad del ensemble gran-canónico,
Pr ∝ exp{−β(Er − µNr )} , (3.28)
donde µ es el potencial quı́mico del sistema. La función de partición gran
canónico está dada como Z = e−β(Er −µNr ) . Podemos relacionar la energı́a
P
r
del sistema y el número de partı́culas con la ocupación de las celdas de
espacio fase: X X
Nr = n , Er = n  ε , (3.29)
 
para obtener:
( )
[exp (−β(ε − µ))]n ,
X Y
Pr ∝ exp −β (n ε − µn ) = (3.30)
 

La sumatoria de la exponencial sobre estados {r} nos da la función de par-


tición: !  
X Y Y X
Z= wn =  wn  , (3.31)
r   n

12
donde w = exp {−β(ε − µ)}. La primera igualdad indica que la función
de partición es la sumatoria sobre todos los estados r del producto sobre
los numeros de ocupación correspondientes a cada estado, definido por un
(r) (r) (r)
conjunto de números de ocupación {n1 , n2 , n3 , . . .}. El término de la
derecha indica un producto sobre todas las celdas de espacio fase de la
sumatoria sobre todos los números de ocupación posibles. Las energı́as ε
dependen de la ubicación de la -ésima celda de espacio-fase pero no de
(r)
su estado de ocupación (es decir de n , por tanto de r), lo cual permite
permutar el producto y la suma sobre estados. Consideremos un ejemplo
simple, el de un sistema con tres microestados posibles representados por
tres celdas de espacio fase,  = {a, b, c} que pueden ser ocupadas por cero o
una partı́cula (n = 0, 1), resultando en ocho estados r con distintos valores
de Er y Nr . En este sistema los dos términos de la igualdad (3.31) se escriben
como:
 
111
X 1
Y
 wn  = 1 + wa + wb + wc + wa wb + wa wc + wb wc + wa wb wc
r=000 =0
 
Y 1
X
 wn  = (1 + wa )(1 + wb )(1 + wc ) , (3.32)
=a,b,c n=0

mostrando que se cumple la igualdad en este caso partı́cular. Puede inferirse


que la igualdad también se cumplirá si aumentamos el número de celdas o
las posibilidades del número de ocupación.
Hay tres casos de particular interés que dan lugar a las tres estadı́sticas
más comunes:
1. Bose-Einstein: partı́culas son indistinguibles sin restricción en cuanto
al número de partı́culas pueden ocupar una celda de espacio-fase: n =
0, 1, 2, . . .. Al considerar al espı́n entre las variables de estado se duplica
la posible ocupación del espacio-fase. De aquı́ se deriva la estadı́stica
de un gas de fotones (ver abajo).
2. Fermi-Dirac: siguiendo el principio de exclusión de Pauli, cada cel-
da de espacio fase sólo puede ser ocupada por cero o una partı́cula:
n = 0, 1. Las partı́culas son indistinguibles y hay que incluir el espı́n
duplicando la posible ocupación del espacio-fase. De este caso se deriva
la estadı́stica de un gas degenerado (ver abajo).
3. Maxwell-Boltzmann: corresponde al caso clásico de números de ocu-
pación muypequeños⇒ β(ε − µ)  1 ⇒ w  1, resultando en
P −βεr
ln Z ≈ N ln re .

13
3.4.2. Gas de fotones
En un gas de bosones no hay restricción en cuanto al número de partı́cu-
las que pueden ocupar un estado dado. La función de partición se obtiene
directamente de la sumatoria del lado derecho de la expresión 3.31

1 Y 1
X 
wn = ⇒ Z= . (3.33)
n =0
1 − w  1 − e−(ε −µ)/kT

La ocupación de cada celda de espacio fase sale de derivar el número total


de bosones de la función de partición:
1 ∂ ln Z X 1 X
N =− = (ε −µ)/kT − 1
= n . (3.34)
β ∂µ  e 

En el caso de un gas de fotones el potencial quı́mico4 es nulo (µ = 0) y


tenemos una ocupación promedio dada por n̄ = (eε /kT − 1)−1 .
El número de ocupación de celdas del espacio fase y el número de fotones
se relacionan a través del número N de celdas de espacio fase. Este se calcula
dividiendo el volumen del espacio fase entre el de cada celda (h), incluyendo
un factor de dos por los dos valores posibles de la helicidad del fotón
!
d3 xd3 p dN ν2
dN = 2 ⇒ =2 3 dν dΩ , (3.35)
h3 dV c

empleando d3 p = p2 dΩdp con p = (hν/c). La densidad de energı́a de radia-


ción isotrópica en equilibrio termodinámico, uν , viene dada por la energı́a de
cada estado (hν), la densidad de estados (ec. 3.35) considerando la isotropı́a,
y la ocupación de cada estado, dando lugar a la función de Planck:
8πν 2 hν
uν (T ) = 3 hν/kT
. (3.36)
c e −1
Al integrar sobre frecuencias obtenemos u(T ) = aT 4 .

3.4.3. Gas ideal de fermiones en degeneración


En este caso un estado dado puede ser ocupado a lo más por una partı́cula,
y la sumatoria sobre ocupaciones es trivial,
Yn o
Z= 1 + e−β(ε −µ) . (3.37)

4
la energı́a “invertida” en la creación del fotón.

14
Figura 3.3: Arriba: ocupación
media de estados n̄ en un
gas de fermiones como fun-
ción de la energı́a del estado,
para µ/kT = 1.0, 5, 10, 20, 50.
La función tiende a un es-
calón centrado en ε = µ, de
ancho ∆E ∼ kT , a medida
que µ/kT aumenta, como se
ilustra en la figura de abajo.

Podemos encontrar el número de fermiones en un estado de energı́a ε , bajo


un potencial quı́mico µ:
1 ∂ ln Z X 1 X
N =− = (ε −µ)/kT
= n , (3.38)
β ∂µ  e
 +1 
n o−1
es decir n̄ = eβ(ε −µ) + 1 , cumpliéndose 0 ≤ n̄ ≤ 1, como corresponde
a los fermiones según el principio de exclusión de Pauli. Si µ  kT , la
distribución del número de ocupación tiende a una función escalón, como se
ilustra en la figura 3.3. El lı́mite T → 0 corresponde al lı́mite de degeneración.
Para un gas ideal degenerado podemos identificar el potencial quı́mico
con la energı́a de Fermi, µ = εf (pf ), siendo pf el momento de Fermi. En
el lı́mite εf /kT → ∞ los estados con energı́a ε < εf están ocupados por
una partı́cula mientras que aquellos con ε > εf están vacios. La energı́a
cinética
q se relaciona con el momento de acuerdo a la expresión general
εf = p2f c2 + m2 c4 −mc2 , siendo m la masa de cada partı́cula; para partı́cu-
las no relativistas εf ≈ p2f /2m mientras que en el lı́mite relativista εf ≈ pf c.

Gas degenerado
Consideremos primero un gas degenerado de electrones (m = me ), corres-
pondiente a materia contenida en una estrella enanas blancas. Tomando en
cuenta que los núcleos son quienes le dan la masa a la estrella, escribimos

15
la densidad de masa como ρ = Γne mH , siendo ne la densidad de electrones,
mH la unidad de masa atómica y Γ el cociente de nucleones a electrones,
el cual tiende a 2 para material procesado (para Fe Γ = 56/26). El número
total de partı́culas es igual al número de estados contenidos en una esfera
de Fermi, multiplicado por el factor de dos debido al espı́n,
Z pf 3
d p 2V 4π 3
Z  
3
N = 2N = 2 d x = 3 p , (3.39)
0 h3 h 3 f

es decir n = kf3 /3π 2 , empleando pf = h̄kf como se hace en buen número de


textos. Combinando ambas expresiones obtenemos el momento de Fermi en
función de la densidad:
!1/3 !1/3
3h3 ρ 3π 2 ρ
pf = ⇐⇒ kf = . (3.40)
8πΓmH ΓmH

Suponiendo un gas ideal no relativista es posible calcular una temperatura


de Fermi, por debajo de la cual el gas está en estado de degeneración
2/3  −2/3
pf 2 ρ Γ

9
kTf = ⇒ Tf ' 2.4 × 10 K . (3.41)
2m 106 g cm−3 1.4
La temperatura de Fermi es muy superior a la del interior de una estrella
enana blanca.
La densidad de energı́a, u, y la presión, P , para un gas degenerado están
dadas por integrales sobre el espacio de momentos derivadas de las integrales
sobre espacio fase:
Z pf Z pf

−3 3
 1  
u= ε 2h d p , P = p~ · ~v 2h−3 d3 p . (3.42)
0 0 3
Usando la forma de energı́a cinética de una partı́cula relativista y la igualdad
~v = p~c2 /ε, obtenemos las integrales planteadas en el libro de Weinberg:

2 pf q 2 2
Z  
u = p c + m 2 c4 − m c2 4πp2 dp,
e e
h3 0
" #
2 pf 1 p2 c2
Z
P = 4πp2 dp . (3.43)
h3 0 3
p
p2 c2 + m2e c4

En vez de intentar resolver las integrales exactamente, distinguimos dos casos


lı́mites: pf  me c2 y pf  me c2 . El primer caso (A) se refiere al lı́mite no

16
relativista y el segundo (B) al caso relativista. Si las partı́culas degeneradas
son electrones, la transición se da para pf = me c2 que implica

8π (ΓmH ) m3e c3
ρ = ρc ≡ ' 0.97 × 106 Γ g cm−3 . (3.44)
3h3
Esta es la densidad tı́pica de una estrella enana blanca. Los dos casos son:
(A) no relativista: ⇒ ρ  ρc :
Equivale a despreciar el término pc frente a me c2 en las integrales de
las ecs. 3.43, dando u = 3P/2, igual que para un gas ideal clásico, y,
 2/3 5/3
3 h2 ρ

P = . (3.45)
π 20me ΓmH
P = Kρ5/3 es la ecuación de estado de un gas de fermiones no relati-
vista.

(B) relativista: ⇒ ρ  ρc :
En cuyo caso el término de momento, pc, domina en las integrales
de las ecuaciones 3.43, resultando en u = 3P , como para un gas de
fotones, y la ecuación de estado,
 1/3 4/3
3 hc ρ

P = , (3.46)
π 8 ΓmH
es decir P ∝ ρ4/3 para un gas degenerado de partı́culas relativistas.

Estrellas degeneradas
La estructura de una estrella degenerada puede investigarse de manera cua-
litativa y semi-cuantitativa con un modelo simplificado. Se puede calcular
la energı́a total de la estrella como la suma de la energı́a interna (térmica)
y gravitacional,
Z R Z R
2 GM (r)
Etot = u(r) 4πr dr − ρ(r) 4πr2 dr , (3.47)
0 0 r
siendo u = Kργ /(γ − 1) la densidad de energı́a, R el radio de la estrella
y M (r) la masa contenida dentro de un radio r. Un ejemplo relativamente
simple es el de una estrella con densidad constante, para la cual encontramos
la expresión
γ−1
KM γ 3 3 GM 2

E(R) = R−3(γ−1) − , (3.48)
(γ − 1) 4π 5 R

17
siendo la configuración de equilibrio determinada por la condición de mı́nima
energı́a, dE/dR = 0. Distinguimos los dos casos:

(A) no relativista: ⇒ ρ  ρc ⇒ γ = 5/3:


La configuración de mı́nima energı́a se da para
2/3
5K 3

R= M −1/3 (3.49)
G 4π

resultando en una relación R ∝ M −1/3 para estrellas degeneradas. Si


empleamos la expresión para K obtenemos
−1/3
h2 M −1/3
4/3
3 M
 
R= 5/3
' 7153 km .
2π 4Gm(Γmh ) M

(B) relativista: ⇒ ρ  ρc ⇒ γ = 4/3:


El mı́nimo de energı́a se da para dE/dR = 0 es decir
1/2  3/2
3 5K

M= , (3.50)
4π G
independientemente del valor de R. Substituyendo el valor de K para
γ = 4/3 se obtiene el lı́mite de masa para una estrella sostenida por
degeneración de electrones

3 (5hc/8G)3/2
M = Mch = ' 3.42 × 1033 g ' 1.72 M . (3.51)
2π (Γmh )2

Esta viene siendo la masa de Chandrasekhar para una estrella con


densidad constante. Si M = Mch tenemos E = 0, mientras que si
M < Mch tenemos E > 0, lo cual corresponde a una estrella fuera
de equilibrio donde la presión termodinámica domina a la gravedad y
por tanto la estrella está en expansión; si M > Mch entonces E < 0,
y la estrella está fuera de equilibrio con la gravedad dominando y por
tanto en colapso.

El mismo análisis puede hacerse para una estrella de neutrones, reempla-


zando me por mN ' mH y Γ = 1. La densidad crı́tica queda como

m4H c3
ρc = ' 6.1 × 1015 g cm−3 , (3.52)
3π 2 h̄3

18
obteniéndose para el caso no relativista
4/3 2 −1/3
3 h M

R= 8/3
' 4.9 km (M/M )−1/3 , (3.53)
2π 4GmN

y una masa lı́mite

3 (5hc/8G)3/2
Mns = ' 6.9 M . (3.54)
2πm2h

El radio de la estrella queda subestimado con respecto a un análisis mas rigu-


roso, en particular porque hemos despreciado la interacción entre partı́culas.
Los valores actualmente aceptados como tı́picos para una estrella de neu-
trones son M∗ ' 1.44 M y R∗ ' 10 km. Para una discusión detallada ver
el libro de Weinberg (1973).

3.5. Reacciones en equilibrio


La mecánica estadı́stica trata también problemas de la creación de un tipo
de partı́culas mediante la destrucción de otras. Este proceso de destrucción
y creación puede darse en un estado de equilibrio entre reacciones de algún
tipo balanceadas por la reacción inversa, por ejemplo:

reacciones quı́micas, como la ionización del hidrógeno y el proceso de


recombinación: H ←→ H+ + e− ;

interacciones electrodinámicas, como la producción de pares y su ani-


quilación: γ + γ ←→ e+ + e− ;

reacciones nucleares, como la fusión de dos núcleos de helio en un


núcleo de berilio y el decaimiento del berilio: 4 He + 4 He ←→ 8 Be.

Cuando se tiene un equilibrio entre una reacción y su inversa se establece una


relación entre las funciones de partición de las partı́culas involucradas que
permite establecer relaciones entre las densidades de las distintas especies.

3.5.1. La ley de acción de masas


La ley de acción de masas permite derivar las relaciones entre densidades de
especies en reacciones en equilibrio. Para deducirla regresamos a un ensem-
ble canónico de partı́culas clásicas pero indistinguibles, donde la función de

19
partición de m especies de partı́culas puede escribirse de la forma,
m m N
Y Y ζ
Z= Z = (3.55)
=1 =1
N !

con ζ = V (2πmkT /h20 )3/2 en el caso partı́cular de un gas ideal. El potencial


quı́mico de la especie  se calcula directamente de la función de partición:
!
1 ∂ ln Z ζ
µ = − ≈ −kT ln , (3.56)
β ∂N N

siendo la aproximación adecuada para N  1. Por otro lado, el equili-


P
brio entre especies en reacción (equilibrio quı́mico) se da cuando µ N 
es mı́nima5 , que equivale a minimizar [ζ /N ]N . Uno puede escribir esta
Q

condición como: 0
m m
ν 0
[ζ /n V ]ν = ζ`0 /n0` V
Y Y 
` , (3.57)
=1 `=1

para una reacción de tipo A + B + C ↔ A0 + B 0 + C 0 siendo {ζ /V, n , ν }


las funciones de partición individuales por unidad de volumen, las densida-
des y el número de partı́culas por reacción del lado izquierdo de la reacción y
{ζ`0 /V, n0` , ν`0 } las mismas cantidades para las especies del lado derecho. Nóte-
se que la función de partición individual se divide por el volumen, eliminando
la dependencia de la relación 3.57 con V . Hay varios ejemplos astrofı́sicos
importantes como la ley de Boltzmann, la ecuación de Saha, el balance entre
reacciones nucleares, el cociente de neutrones a protones en una estrella de
neutrones, etcétera. A continuación vemos dos de ellos.

3.5.2. Ley de Boltzmann


Pensando en el equilibrio entre el número de átomos en un estado n1 y otro
estado n2 , podemos escribir la reacción como (1) *
) (2), de donde la ley de
acción de masas (ec. 3.57) da:

n2 /n1 = ζ2 /ζ1 . (3.58)

El potencial quı́mico para un fotón es cero y por tanto podemos despreciarlos


en estas expresiones. Para un sistema cuántico ζ = g e−E /kT , con g el
5
La condición termodinámica correspondiente es la minimización de la energı́a libre de
Helmholtz, F = −kT ln Z.

20
número de estados de energı́a E (estados degenerados de misma energı́a),
por lo que obtenemos la ley de Boltzmann:
n2 g2
= e(E1 −E2 )/kT . (3.59)
n1 g1
Para un sistema con un número arbitrario de niveles tenemos:

n g e−E /kT
= P −E /kT . (3.60)
n g` e `
`

En la práctica el rápido aumento de la degeneración g con el número de


estados eventualmente se ve compensado por el término exponencial y uno
puede realizar el cálculo considerando un número finito de estados.
Como ejemplo, los estados rotacionales de la molécula de CO se distri-
buyen de acuerdo a E = ( + 1)B con B = h̄2 /2I, siendo I el momento de
inercia de la molécula ( = 0, 1, . . .) y B ' 2.77 K para el CO. Los estados
rotacionales están dados en términos de los armónicos esféricos y para un
número cuántico  la degeneración viene dada por los valores posibles del
número cuántico magnético m ≤ ||, es decir g = 2 + 1, y

n (2 + 1) exp{−( + 1) B/kT }


= .
n 1 + 3e−βB + 5e−2βB + 7e−6βB + 9e−12βB + 11e−20βB + . . .

3.5.3. Ecuación de Saha


Para procesos como la ionización y recombinación del hidrógeno,

H(0) *
) H(1) + e , (3.61)

donde el número entre paréntesis denota el grado de ionización, la ley de


acción de masas queda como:

ζ0 /V ζ1 /V ζe /V
= . (3.62)
n0 n1 ne
Tanto el electrón como el protón (H(1)) son partı́culas libres, por lo que la
ley de acción de masas, al considerar las distintas funciones de partición, da:

ζe /V = 2/λ3e , ζ1 /V = 2/λ3p , ζ0 /V = (g0 /λ3T )eχ/kT , (3.63)



donde λe ≡ h/ 2πme kT = p
h/p, es la longitud de onda de Broglie para un
electrón térmico, λp ≡ h/ 2πmp kT para un ion, y χ > 0 es el potencial

21
de ionización del átomo considerado6 . Los factores de 2 vienen de los dos
estados de espı́n posibles para el electrón y el protón. En estos términos
obtenemos:
n1 2 2
 
= e−χ/kT . (3.64)
n0 ne λ3e g0
Electrones no degenerados tienen una ocupación ∆x∆p  h, por lo que
ne λ3e  1. De hecho la densidad es generalmente varios órdenes de magnitud
menor a λ−3 e , por lo que es común expresar este término mediante una
exponencial, ne λ3e /2 = e−ξ , con ξ tı́picamente entre 10 y 30. La ec. 3.64
puede generalizarse a otros estados de ionización ı 6= 0 y reescribirse como:
nı+1 gı+1 ξ−χı /kT
= e , (3.65)
nı gı
donde gı+1 es el número de estados para la especie ionizada debidos al espı́n
y gı es el número de estados de la especie no-ionizada.
Para que haya un grado de ionización apreciable se requiere que el
término en la exponencial no sea significativamente mayor que uno, lo cual
sucede para kT < ∼ χı /ξ, correspondiente a temperaturas mas de un orden de
magnitud por debajo de χı /k. La dificultad en ionizar un átomo es compen-
sada con creces por la vastedad del espacio fase disponible para el electrón
libre. Como resultado, mientras que el potencial de ionización del hidrógeno
corresponde a 13.6 eV/k ≈ 158, 000 K, es en las estrellas de tipo A, donde
Te ≈ 10, 000 K y ξ ≈ 15, donde la secuencia de Balmer es mas pronunciada.
La ecuación de Saha es básica para obtener la relación entre la intensidad de
las lı́neas espectrales y la temperatura, correspondiendo a la relación entre
tipo espectral y temperatura (fig 3.4).

6
la energı́a del estado ligado es E = −χ y el término de partición es e−E/kT = eχ/kT

22
Figura 3.4: Intensidad de las principales lı́neas espectrales en función de
la temperatura. La secuencia de tipos espectrales se define a partir de las
intensidades de las distintas lı́neas y por tanto la relación entre intensidad
de lı́neas y temperatura define la secuencia espectral como una secuencia de
temperaturas.

23
Capı́tulo 4

Teorı́a Clásica de Procesos


Radiativos
Versión 5 de noviembre de 2016

4.1. Elementos de relatividad especial


4.1.1. Sistema de referencia inercial
Los sistemas de referencia inerciales son aquellos en los que es válida la
primera ley de Newton, o ley de la inercia: un cuerpo permanece en su estado
de movimiento rectilı́neo uniforme. Las transformaciones que nos llevan de
un sistema inercial a otro1 son aquellas con velocidad constante. De acuerdo
a la mecánica clásica, no relativista, si dos observadores inerciales O y O0
emplean coordenadas ~r = {x, y, z} y ~r0 = {x0 , y 0 , z 0 }, respectivamente, la
transformación de un sistema al otro es

~r0 = ~r − ~v t, (4.1)

siendo ~v la velocidad de O0 con respecto O. La transformación inversa tiene la


misma forma y se obtiene directamente cambiando el signo de la velocidad,

~r = ~r0 + ~v t0 , (4.2)

con la suposición t0 = t. La invariancia del tiempo es un principio básico de


las transformaciones galileanas. Si el vector ~x describe la posición de una
partı́cula vista por el observador O, la relación entre la velocidad de esta
1
no se consideran aquı́ traslaciones fijas, ~r0 = ~r + ~r0 , ni rotaciones del sistema de
coordenadas.

1
partı́cula, ~u, medida por los dos observadores,
d~x0 d~x dt d~x
~u0 = = 0 − ~v 0 = − ~v = ~u − ~v , (4.3)
dt0 dt dt dt
empleando dt0 = dt. Al derivar una segunda vez encontramos que la acela-
ración de la partı́cula es la misma, ~a0 = ~a, de acuerdo al principio de inercia
inscrito en la primera ley de Newton.

4.1.2. Postulados de la relatividad y transformaciones de Lo-


rentz
La relatividad especial se fundamenta en dos postulados:
1. las leyes de la fı́sica tienen la misma forma en todo marco de referencia
inercial;
2. la velocidad de la luz es constante y su valor es independiente del
(estado de movimiento del) marco de referencia elegido.
Todos los marcos inerciales de referencia están en movimiento rectilı́neo
uniforme entre sı́. El primer postulado implica que no existe un marco de
referencia en reposo absoluto; alrededor de 1900 se suponı́a que las ecuacio-
nes de Maxwell, y en particular la propagación de la luz con velocidad c,
sólo eran válidas en reposo con respecto al éter, el cual definı́a un marco de
referencia privilegiado. El segundo principio permite establecer a la veloci-
dad de la luz como una constante universal, definida hoy en dı́a con el valor
c = 299 792 458 m/s exáctamente, en contraposición con la invariancia del
tiempo. El segundo postulado ha sido corroborado al punto que el metro se
define formalmente a partir de la definición del segundo y del valor de c.
A partir de los dos postulados es posible deducir la expresión general
para las leyes de transformación de coordenadas, (t, x, y, z) → (t0 , x0 , y 0 , z 0 ),
entre marcos de referencia con movimiento relativo rectilı́neo uniforme. Sean
O y O’ dos marcos de referencia cuyos orı́genes coinciden en t = t0 = 0. Si
en ese punto e instante se emite un pulso de luz, éste se aleja del origen de
forma tal que su posición ~x = xx̂ + y ŷ + z ẑ (y ~x 0 para O’) en función del
tiempo está dada por

x2 + y 2 + z 2 = c2 t2 , x02 + y 02 + z 02 = c2 t02 . (4.4)

Restringiéndonos al caso de movimiento relativo a lo largo del eje x̂, plan-


teamos una transformación lineal entre los sistemas de referencia:

ct0 = A ct + B x , x0 = D ct + E x .

2
Figura 4.1: Dos observadores O y O’ con movimiento relativo ~v = βc x̂
viendo la propagación de una onda luminosa emitida en (x = 0, t = 0) y
(x0 = 0, t0 = 0).

Combinando estas expresiones con (4.4) llegamos a la forma básica de las


transformaciones de Lorentz
(
ct0 = γ (ct − β x) = cγ t − v x/c2 ,

0 (4.5)
x = γ (−βc t + x) = γ (x − v t) ,

donde ~v = βc x̂ es la velocidad relativa entre los marcos de referencia y


γ = (1 − β 2 )−1/2 se denomina el factor de Lorentz. Para partı́culas con ma-
sa, |β| < 1; el factor de Lorentz γ es 1 para β = 0 y crece con |β|, con γ → ∞
para β → ±1. Nótese que las transformaciones de Lorentz involucran even-
tos, definidos por posición y tiempo, y no se restringen a posiciones, como
las transformaciones de Galileo ~x 0 = ~x − ~v t que suponen la invariancia del
tiempo. Las transformaciones de Lorentz forman un grupo que puede repre-
sentarse usando matrices de 4 × 4. Por ejemplo, la transformación debida a
un movimiento lineal sobre el eje x̂ está dada por

ct0
    
γ −γβ 0 0 ct
 x0   −γβ γ 0 0  x 
= .
    
y0 0 0 1 0 y
 
    
z0 0 0 0 1 z

La transformación correspondiente a un movimiento rectilı́neo uniforme a lo

3
Figura 4.2: Marcos de referencia O y O’ con sistemas de ejes paralelos y en
movimiento relativo ~v = βc x̂

largo del eje ŷ es

ct0
    
γ 0 −γβ 0 ct
 x0   0 1 0 0   x 
= .
    
y0 −γβ 0 γ 0  y
 
   
z0 0 0 0 1 z

Consideramos algunas propiedades de las transformaciones de Lorentz.

Forma general de las transformaciones de Lorentz


Las transformaciones de Lorentz son, de manera generalizada, aquellas en las
que se cumple la invariancia de ds2 = −c2 dt2 + dr2 , que mantiene la misma
forma en todos los sistemas inerciales. La transformación correspondiente
~ entre dos sistemas O y O’ con ejes paralelos viene
a una velocidad ~v = βc
dada por la expresión
(
ct0 = γct − γ β~ · ~x
~ + ~x + (γ − 1) (β̂ · ~x)β̂ , (4.6)
~x0 = −γ βct

4
que se representa también mediante la matriz
 
γ −γβx −γβy −γβz
 −γβx 1 + (γ − 1)βx2 /β 2 (γ − 1)βx βy /β 2 (γ − 1)βx βz /β 2 
.
 
−γβy (γ − 1)βy βx /β 2 1 + (γ − 1)βy2 /β 2 (γ − 1)βy βz /β 2

 
−γβz (γ − 1)βz βx /β 2 (γ − 1)βz βy /β 2 1 + (γ − 1)βz2 /β 2
(4.7)
Esta expresión representa cualquier movimiento rectilı́neo uniforme entre
sistemas con ejes paralelos. Las rotaciones entre ejes de coordenadas son
también transformaciones de Lorentz y la forma mas general de estas inclu-
ye combinaciones de rotaciones y movimientos rectilı́neos uniformes.

Jackson §11.7.

Transformación inversa
La transformación inversa se obtiene al invertir la matriz que lleva de (ct0 , x0 )
a (ct, x), o -mas simplemente- reemplazando β por −β. Empleando notación
matricial y omitiendo las coordenadas (y, z), la transformación inversa de
un movimiento a lo largo del eje x̂ es
! ! ! ! ! !
ct0 γ −γβ ct ct γ γβ ct0
= ⇐⇒ = .
x0 −γβ γ x x γβ γ x0

Suma de velocidades
Al combinar dos transformaciones sucesivas paralelas, con v1 = β1 c y v2 =
β2 c, obtenemos una transformación con

γ = γ1 γ2 (1 + β1 β2 ) , β = (β1 + β2 )/(1 + β1 β2 ) ,

congruente con |β| ≤ 1 para cualquier valor de β1 , β2 .

Simultaneidad
De acuerdo al observador en el marco de referencia O, los eventos (t1 =
0, x1 = 0) y (t2 = 0, x2 = X 6= 0) son simultáneos, al ocurrir al mismo
tiempo. De la ecuación (4.5) vemos que los dos mismos eventos no son si-
multáneos para el observador en O’, quien los ubica en (t01 = 0, x01 = 0) y
(t02 = −γβ X/c, x02 = γ X). El concepto de simultaneidad depende del marco
de referencia del observador, y por tanto no es absoluto.

5
Dilatación temporal
Dos eventos que ocurren en un mismo lugar a tiempos distintos definen un
intervalo de tiempo. Podemos pensar que estos corresponden con dos tics
de un reloj. Los describimos como (t1 = 0, x1 = 0) y (t2 = T, x2 = 0) de
acuerdo al observador en O. En el marco de referencia O’ los mismos eventos
quedan descritos por (t01 = 0, x01 = 0) y (t02 = γT, x02 = −γβ cT ). La dila-
tación temporal se manifiesta en el marco de referencia O’, en movimiento
con respecto al reloj, en el cual estos estan separados por un lapso mayor
de tiempo: t02 − t01 ≥ t2 − t1 . Fraseado alternativamente, el lapso de tiempo
entre dos eventos es mı́nimo en el marco de referencia del reloj, en el cual
estos suceden en una sola posición. De aquı́ se deriva la definición del tiempo
propio, que es aquél medido en el marco de referencia donde el intervalo entre
eventos es puramente temporal (§4.1.2).

Contracción espacial
La contracción espacial, también contracción de Lorentz, no es evidente a
primera vista en las transformaciones de Lorentz. La medición de una ba-
rra en reposo de longitud L que realiza O puede describirse con dos eventos,
(t1 = 0, x1 = 0) y (t2 = 0, x2 = L) correspondientes a la medición simultánea
de los extremos de la barra. O’ ve la barra en movimiento y, según él, estos
dos eventos ocurren en (t01 = 0, x01 = 0) y (t02 = −γβ L/c, x02 = γ L). La pri-
mera impresión es que dado que x02 − x01 ≥ x2 − x1 , deberiamos hablar de
una expansión espacial, y no de una contracción.
La sutileza reside en que para obtener en O’ la longitud de la barra
en movimiento, la medición de la posición de ambos extremos debe hacer-
se simultáneamente. Como vimos antes, t01 6= t02 , por lo que la medición
simultánea de las dos puntas de la barra que hace O no son eventos si-
multáneos para O’. La solución consiste en dejar t2 libre, siendo que no se
requiere que la medición en O sea simultánea, y exigir t01 = t02 . Insistimos
que t2 6= t1 no representa ningún problema ya que, justamente, la barra está
en reposo para O, quien por tanto no requiere una medición simultánea.
Consideramos la medición de la barra en O con dos eventos (t1 = 0, x1 = 0)
y (t2 , x2 = L), los cuales corresponden para O’ en la medición simultánea
(t01 = 0, x01 = 0) y (t02 = 0, x02 = L0 ). La transformación de Lorentz relevante
implica, (
ct02 = ct2 − β L = 0 ⇒ t2 = βL/c
(4.8)
L = γ (L0 − β ct2 ) ⇒ L0 = L/γ ≤ L .
Al exigir la simultaneidad en O’ se obtiene la contracción de la barra, L0 ≤ L.

6
4.1.3. Cuadrivectores
El formalismo de la relatividad especial generaliza la mecánica de Newton
mediante el uso de cuadrivectores. Los cuadrivectores son generalizaciones de
vectores espaciales, añadiendo una componente temporal fı́sicamente asocia-
da, y permiten modificar las leyes de la mecánica y electrodinámica clásica
de manera consistente con los postulados de la relatividad. En particular,
el requerimiento de que la velocidad de la luz sea independiente del mar-
co de referencia se cumple por la condición de invariancia implı́cita en la
construcción de los cuadrivectores.
El cuadrivector elemental es el de tiempo y posición el cual ubica un even-
to en el espacio y el tiempo. Este cuadrivector tiene componentes x0 , x1 , x2 , x3 ,
abreviadas como xα . El ı́ndice α toma siempre el valor cero para la compo-
nente temporal y 1,2,3 para las tres componentes espaciales respectivas, las
cuales a veces se abrevian con algún ı́ndice latino, . El cuadrivector define
eventos mediante el tiempo y las coordenadas del mismo,

x0
   
ct !
α
 x1   x  ct
x = = = . (4.9)
   
 x2   y  ~x
x3 z

La invariancia de la velocidad de la luz se refleja en la condición

s2 ≡ −c2 t2 + x2 + y 2 + z 2 = 0 ,

válida para la propagación de la luz en todo marco de referencia. En general


la “separación” en cuatro coordenadas entre dos eventos cumple ds ≤ 0.
Definiendo la norma de un cuadrivector como
3 X
X 3
2
||x|| = ηαβ xα xβ ,
α=0 β=0

donde ηαβ es el tensor métrico de Minkowski2 ,


 
−1 0 0 0
 0 1 0 0 
ηαβ =   = diag(−1, 1, 1, 1) . (4.10)
 
 0 0 1 0 
0 0 0 1
2
Aquı́ expresado en coordenadas cartesianas; la forma del tensor de Minkowski depende
del tipo de coordenadas.

7
Podemos describir la constancia de la velocidad de la luz como ||x||2 = 0.
La construcción de las transformaciones de Lorentz exige que la norma del
cuadrivector de posición sea la misma en diferentes marcos de referencia,
||x|| = ||x0 ||, independientemente de que su valor sea nulo o no. Por defini-
ción las transformaciones de Lorentz conservan la norma del cuadrivector
de posición y si podemos construir otros cuadrivectores cuya norma sea una
cantidad independiente del marco de referencia, estos conservaran su signi-
ficado fı́sico en todo marco de referencia inercial. Las transformaciones de
Lorentz se representan con matrices de la forma Λβα , quedando la transfor-
mación de O a O’ como
x0β = Λβα xα , (4.11)
donde introducimos la convención de que todo ı́ndice repetido como su-
perı́ndice y subı́ndice en una fórmula indica una sumatoria sobre él, es decir
x0β = Λβ0 x0 + Λβ1 x1 + Λβ2 x2 + Λβ3 x3 .
Los cuadrivectores con super-ı́ndice, aα , se denominan contravariantes y
a partir de ellos se construyen los cuadrivectores covariantes,

aα = ηαβ aβ ,

es decir a0 = −a0 y a = a ,  = 1, 2, 3. Esta notación permite emplear la


notación aα aα para la “norma” de un cuadrivector. Un cuadrivector definido
directamente como covariante es el operador de derivación
1∂
 
∂α ≡ ;∇ , (4.12)
c ∂t
el cual permite expresar ecuaciones fı́sicas fundamentales de manera com-
pacta. Un ejemplo es la ecuación de onda ∂µ ∂ µ ψ = 0.
La invariancia del cuadrivector de posición ante transformaciones de Lo-
rentz da lugar a la definición del intervalo entre eventos, s, definido diferen-
cialmente,
ds2 = gαβ dxα dxβ , (4.13)
siendo gαβ el tensor métrico, la generalización del tensor de Minkowski en
relatividad general. En lo que aquı́ concierne, gαβ = ηαβ = diag(−1, 1, 1, 1).
En el formalismo de la relatividad general gαβ describe al campo gravita-
cional, que se calcula a partir de la distribución de masa y energı́a, y ds
describe las trayectorias de partı́culas de prueba en dicho campo.
El intervalo entre dos eventos es proporcional al tiempo medido por un
observador que ve ambos eventos en el mismo lugar. Para este observador

8
dx = dy = dz = 0, por lo que ds2 = −c2 dt2 . Definimos el tiempo propio, τ ,
como aquél medido por el observador “en reposo con un reloj”, es decir3
r
1p 1 dt
dτ ≡ −ds2 = dt2 − 2
(dx2 + dy 2 + dz 2 ) = . (4.14)
c c γ
El tiempo propio es una variable fı́sica unidimensional, es decir escalar, cuya
expresión es la misma en cualquier marco de referencia inercial; es por tanto
un invariante. Con él podemos construir cuadrivectores de norma invariante
al derivar con respecto a dτ . El ejemplo inmediato es el cuadrivector de
velocidades !
α dxα γc
u ≡ = , (4.15)
dτ γ ~v

de norma uα uα = −c2 . Un segundo cuadrivector directamente relacionado


es el de energı́a-momento:
! !
γ mc E/c
pα ≡ muα = = , (4.16)
γ m~v p~

en el cual se generaliza el momento de una partı́cula como p~ = γm~v y su ener-


gı́a como E = γmc2 . Los dos primeros términos de la expansión en serie de
la energı́a para v/c  1 son la energı́a en reposo, mc2 , y la expresión clásica
para la energı́a cinética, (1/2)mv 2 . La norma del cuadrivector de energı́a-
momento, es pα pα = −E 2 /c2 + p2 c2 = −m2 c2 . Nótese que la expresión de
la derecha en la ec. (4.16) es independiente de m y puede generalizarse a
partı́culas sin masa, como fotones, para los cuales E 2 = p2 c2 .
La transformación de Lorentz de la expresión (4.6) se aplica a cualquier
cuadrivector, por ejemplo
(
E 0 /c = γ(E/c − β~ · p~)
~ (4.17)
p~0 = −γ βE/c + p~ + (γ − 1) (β̂ · p~)β̂ .

En problemas de interacciones entre dos partı́culas es útil referirse al marco


de referencia del centro de momento, p~0 = 0. De la expresión anterior se
deduce que este corresponde a una transformación con velocidad β~ = p~c/E.
3
Nótese que de acuerdo a los signos en η, el intervalo s entre dos eventos con relación
de causa y efecto (como salir de un punto y llegar a otro) es negativo.

9
4.1.4. Fotones, efecto Doppler y distorsión de haces
El fotón tiene asociado el cuadrivector de energı́a-momento,
! ! !
α E/c h̄ω/c h̄ω 1
k = = = , (4.18)
p~ h̄~k c k̂

siendo ~k = (ω/c)k̂ el vector de propagación. La norma de este cuadrivector


es nula, de manera consistente con la masa nula del fotón y su propagación
en intervalos nulos, ds = 0.
De la transformación de Lorentz del cuadrivector de energı́a-momento,
vemos que un observador moviéndose con velocidad βc ~ relativa a nosotros,
mide una frecuencia
ω 0 = γω (1 − β~ · k̂) . (4.19)
Si β~ se refiere a la velocidad del emisor de radiación, entonces la cantidades
sin primas denotan al observador: la frecuencia observada como función de
la emitida está dada por
ωem ωem
ωobs = = ;
γ(1 − β~ · k̂) γ(1 + β cos θ)
en el caso especı́fico de una fuente que vemos moverse en la dirección x̂,
emitiendo radiación con k̂ = −x̂, y moviéndose con β~ = β (x̂ cos θ + ŷ sin θ).
Esta expresión describe el efecto Doppler. Notamos que:
el corrimiento al rojo es máximo para cos θ = 1 ⇒ ωobs = ωem /γ(1+β);
que un movimiento perpendicular, cos θ = 0, ocasiona un corrimiento
al rojo, ωobs = ωem /γ;
p
el corrimiento al rojo se da si cos θ > −1/β(1−1/γ) = − (γ − 1)/(γ + 1);
para velocidades bajas esto corresponde a cos θ > −β/2, mientras que
p es cos θ > −1 + 1/γ, equivalente a un cono de
el lı́mite relativista
apertura ∆θ ' 2/γ alrededor de la dirección −x̂.
Existe un efecto adicional en la dirección de propagación de una fuente de
radiación en movimiento. Las direcciones de propagación en ambos marcos
de referencia, dadas por θ y θ0 respectivamente, se relacionan a través de
−β + cos θ
cos θ0 = , (4.20)
1 − β cos θ
con la transformación inversa dada por el cambio el signo de β. Si nos ima-
ginamos una fuente que emite radiación isotrópica moviéndose con una velo-
cidad ~v = βcx̂ con respecto a nosotros, podemos inferir de la ec. (4.20), que

10
la distribución uniforme del haz en ángulo sólido dΩ0 se transforma cómo
dΩ0 = dΩ/γ 2 (1 − β cos θ)2 . Al aumentar β el haz se cierra y la radiación se
corre al azul en la dirección de movimiento, dando lugar a una amplificación
de la intensidad observada, en el efecto conocido como “beaming”. (§4.2.3)

4.1.5. Campos electromagnéticos


~y
Para obtener los campos electromagnéticos partimos de los potenciales A
φ, que se combinan en el cuadrivector
!
α φ
A ≡ ~ . (4.21)
A

Este cuadrivector cumple con la norma de Lorentz en cualquier marco de


referencia inercial, al expresarla de manera covariante:
1 ∂φ ~ = 0.
∂α Aα = 0 ⇐⇒ +∇·A (4.22)
c ∂t

Nótese que la norma de Coulomb, ∇ · A ~ = 0, no es invariante y por tanto


es válida en todo marco de referencia inercial. Las fuentes de los potenciales
electromagnéticos son las densidades de carga, ρ, y de corriente electrica, ~,
que se combinan en el cuadrivector
!
α ρc
 ≡ , (4.23)
~

el cual cumple la ecuación de continuidad


∂ρ
∂α α = 0 ⇐⇒ + ∇ · ~ = 0 , (4.24)
∂t
en todo marco inercial.
La generalización de los campos electromagnéticos requiere extender el
concepto de cuadrivectores al de tensores, donde un escalar es un tensor
de rango cero, un cuadrivector es un tensor de rango uno, y tensores de
rango dos pueden describirse mediante matrices de 4 × 4. Esta generaliza-
ción puede hacerse a tensores de rango arbitrario. Se construyen los campos
electromagnéticos mediante un tensor antisimétrico de rango dos,

F αβ ≡ ∂ α Aβ − ∂ β Aα , (4.25)

11
representable como
 
0 Ex Ey Ez
 −Ex 0 Bz −By 
F αβ =  . (4.26)
 
 −Ey −Bz 0 Bx 
−Ez By −Bx 0

Las ecuaciones de Maxwell se pueden escribir de manera invariante como


4π α
∂β F αβ =  , ∂ α F βγ + ∂ β F γα + ∂ γ F αβ = 0 . (4.27)
c
En la segunda expresión son redundantes todas las ecuaciones con dos ı́ndi-
ces iguales, y sólo tienen sentido aquellas con ı́ndices {012}, {013}, {023},
resultando en las tres componentes de ∇ × E ~ = ∂ B/c∂t;
~ y la {123}, siendo
∇·B ~ = 0. Estas mismas ecuaciones, reemplazadas en (4.25), resultan en la
forma covariante para la ecuación de onda con fuentes:
1 ∂2φ

2
4π α  − c2 ∂t2 + ∇ φ = −4πρ ,

∂ β ∂ β Aα = −  ⇐⇒ (4.28)
c 2~
~

− c12 ∂∂tA + ∇2 A = − 4π
c ~
.

2

La transformación de coordenadas del campo electromagnético se hace


mediante una doble transformación de Lorentz, F 0αβ = Λαγ Λβµ F γµ , resul-
tando en las relaciones entre campos electromagnéticos vistos en distintos
marcos de referencia,

~ ⊥ + ~v × B
 
~0 = E
E ~0 = γ E
~k , E ~⊥ ,
k ⊥
c
~v
 
~ 0 ~ ~ 0 ~ ~
Bk = Bk , B⊥ = γ B⊥ − × E⊥ . (4.29)
c

Un campo puramente eléctrico (B ~ = 0) o puramente magnético (E ~ = 0) se


~ 0 ~ 0
transforma en un campo electromagnético (B 6= 0 y E 6= 0). El escalar
invariante Fαβ F αβ = 2(B 2 − E 2 ) nos dice que existe un marco de referencia
único donde solo uno de los dos campos, E ~ o B,
~ es nulo.

4.1.6. Mecánica relativista y fuerza de Lorentz


Definiendo el cuadrivector de aceleración, aµ = duµ /dτ , podemos escribir la
versión relativista de la ecuación de Newton:
dpµ
F µ = maµ = , (4.30)

12
donde es necesario especificar el cuadrivector de fuerza, F, para definir el
problema. Desarrollamos el término de aceleración, notando que dγ/dt =
~˙ separando en componentes paralela y perpendicular a la velocidad,
γ 3 (β~ · β),
~a = ak β̂ + ~a⊥ , para obtener el cuadrivector de energı́a-momento

γ 4 m ~a · β~
   
γ d(E/c)/dt !
γ 4 m ak β
=  = ,
   
γ 2 m ~a⊥ + γ 4 mak β̂
 
γ d~
p/dt γ 2 m ~a + γ 2 β~ (~a · β)
~
(4.31)
donde E es la energı́a de la partı́cula y

ak ≡ |β̂ · ~a|, a⊥ ≡ |β̂ × ~a| . (4.32)

Se requiere una componente de aceleración paralela a la velocidad para cam-


biar la energı́a de la partı́cula (ak “hace trabajo”); y es más dificil acelerar
~ que en la dirección
una partı́cula relativista en la dirección paralela a β,
perpendicular.
Un caso de interés es el de la fuerza de Lorentz que experimenta una
carga q en un campo electromagnético, dada por F α = (q/c)F αβ uβ , donde
el tensor mixto de campo electromagnético es F αβ = ηβµ F αµ , y uβ es el
cuadrivector de velocidad. Haciendo el álgebra correspondiente obtenemos:
d  d ~ + ~v × B
  
~ · ~v ,
γmc2 = q E (γm~v ) = q E ~ . (4.33)
dt dt c
La primera ecuación denota el cambio de energı́a relacionado al trabajo
hecho en el campo eléctrico, mientras que la segunda ecuación viene siendo
la expresión usual para la fuerza de Lorentz, con el factor γ adicional.

4.2. Campos de una carga en movimiento


4.2.1. Carga en reposo y en movimiento rectilı́neo uniforme
Un electrón en reposo situado en la posición ~re da lugar a los potenciales
−e ~ = 0,
φ(~r) = , A (4.34)
|~r − ~re |

para un observador situado en ~r. De donde E ~ = −eR̂/R2 , B


~ = 0, siendo
~
R = ~r − ~re el vector que va de la carga al observador.
Usando (4.29) podemos encontrar los campos de una carga en movimien-
to rectilı́neo uniforme. Consideramos el caso de un electrón moviéndose de

13
acuerdo a ~re = x̂ vt, visto por un observador en reposo en ~r = ŷ b. En un
marco de referencia en reposo con el electrón tenemos
0 0 0
~ 0 (~r0 , t0 ) = −e ~r = −e x x̂ + y ŷ = −e (−γvtx̂ + bŷ) ,
E ~0 = 0,
B
|~r0 |3 (x02 + y 02 )3/2 [b2 + γ 2 v 2 t2 ]3/2
que con las relaciones (4.29) da,

~ = −e γ (bŷ − vtx̂) ~ = −e γvbẑ /c


E , B .
[b2 + γ 2 v 2 t2 ]3/2 [b2 + γ 2 v 2 t2 ]3/2
El resultado es un caso particular de los potenciales de Liénard-Wiechert.

4.2.2. Potenciales de Liénard-Wiechert


El campo electromagnético producido por una carga q = −e en movimiento
arbitrario se calcula de las ecuaciones 4.24, conociendo las formas funcionales
de ρ(~r, t) y ~(~r, t). Para un electrón siguiendo una trayectoria arbitraria ~re (t),
tenemos

ρ(~r, t) = −e δ [~r − ~re (t)] , ~(~r, t) = −e ~ve (t) δ [~r − ~re (t)] . (4.35)

Se pueden encontrar los potenciales Aα resolviendo las ecuaciones 4.24 me-


diante el método de la función de Green. Es posible deducir también los
potenciales utilizando invariancias. La deducción es mas fácil en cuanto al
cálculo, pero un poco mas difı́cil de seguir. Se da la deducción a continua-
ción. Véase también Jackson §12.11; consultar el capı́tulo 14 de Jackson para
la deducción mediante la función de Green.
Para deducir los campos de una carga en movimiento debemos transfor-
mar al marco del observador el campo de Coulomb que se tiene en un marco
de referencia instantáneamente en reposo con respecto al electrón. Sea O un
marco de referencia inercial y O’ el marco inercial en reposo instantáneo con
respecto al electrón en un instante t0e , distinto a t0 , momento de la medición
(fig. 4.3). En O’ los potenciales están dados por
−e
φ0 (~r0 , t0 ) = , ~ 0 (~r0 , t0 ) = 0 ,
A (4.36)
|~r0 (t0 ) − ~re0 (t0e )|
con A0α A0α = −e2 /|~r0 (t0 ) − ~re0 (t0e )|2 invariante para cierta elección de t0e . Para
encontrar la t0e adecuada, construimos el cuadrivector Rα que describe el
contacto causal entre el electrón y el evento de medición del campo,
!
α ct − cte
R ≡ ,
~r(t) − ~re (te )

14
Figura 4.3: Electrón en movi-
miento arbitrario visto desde
el marco de referencia O. El
vector ~r denota la posición del
observador en el instante t y
~re (te ) la del electrón en el ins-
tante te . El vector R ~ une am-
bos eventos.

que da Rα Rα = 0 en cualquier marco de referencia, por lo que

−c2 (t − te )2 + |~r(t) − ~re (te )|2 = 0 ⇒ te = t − |~r(t) − ~re (te )|/c . (4.37)

Esta expresión define al tiempo retardado, te , como la solución de la ecuación


implı́cita (4.37). La invariancia de Rα se cumple también en el marco de
referencia del electrón (O’),

−c2 (t0 − t0e )2 + |~r0 (t0 ) − ~re0 (t0 )|2 = 0 ,

de donde φ0 (~r0 , t0 ) puede escribirse también como φ0 = −e/c (t0 − t0e ). Hacien-
do el producto escalar de Rα con el cuadrivector de velocidad de la partı́cula
medido en t = te , obtenemos el escalar invariante:

uα Rα = −γc2 (t − te ) + γ~ve (te ) · (~r(t) − ~re (te )) = −c2 t0 − t0e ,




donde ~ve = d~re /dt. El invariante uα Rα nos permite expresar φ0 en términos


de t y te ,
−e/γ −e/γ
φ0 = =  ,
|~r(t) − ~re (te )| − (~ve (te )/c) · (~r(t) − ~re (te )) R 1 − ~ve (te ) · R̂/c

~ = ~r(t) − ~re (te ), la parte espacial de Rα . Esta expresión es la parte


con R
temporal de la expresión covariante para los potenciales,
!
β(−e) uβ (−e) 1
A = α =   . (4.38)
u Rα R 1 − ~ve · R̂/c ~ve /c

15
Estos potenciales son invariantes y toman la forma (4.36) en el marco de
referencia en reposo con el electrón en t0e (~ve0 (t0e ) = 0). La expresión (4.38)
corresponde a los potenciales de Liénard-Wiechert
   
−e ~ r, t) =  −e β~e
φ(~r, t) =    , A(~   . (4.39)
R 1 − R̂ · β~e R 1 − R̂ · β~e
te te

Desde el punto de vista formal, los potenciales de Liénard-Wiechert tienen


una solución avanzada, que se evaluá en el tiempo ta = t + |~r(t) − ~re (ta )|/c.
Esta solución se descarta fı́sicamente al no cumplir con el principio de cau-
salidad, ya que la información de la carga llega al observador después de
la medición del campo. Otra versión de este mismo argumento dice que
los potenciales retardados corresponden con ondas que divergen de la carga
mientras que los potenciales avanzados corresponden con ondas que conver-
gen hacia ella, contrariamente a lo observado en la naturaleza.
Derivando las expresiones para los potenciales de Liénard-Weichert, ob-
tenemos los campos electromagnéticos correspondientes:


 
~ ~ × β)
" #
~ r, t) = e (R̂ − β) e  R̂ × ((R̂ − β)
E(~ + 
R2 γ 2 (1 − R̂ · β)
~ 3
te
Rc ~ 3
(1 − R̂ · β)
te
~ r, t) = R̂ × E(~
B(~ ~ r, t) , (4.40)

donde la posición y velocidad del electrón se evalúan en te . El campos elec-


tromagnético tiene dos componentes: el “campo de velocidad” (∝ 1/R2 ),
generalización del campo de Coulomb; y el campo de aceleración (∝ 1/R),

dependiente de ~a = βc,
 
~˙ − R̂ × (β~ × β)
e  R̂ × (R̂ × β) ~˙ 
~
Erad (~r, t) = 3 ~ rad (~r, t) = R̂×E
 ,B ~ rad (~r, t).
Rc
 
~
1 − R̂ · β
te
(4.41)
La propagación de energı́a electromagnética está descrita por la integra-
ción del vector de Poynting, S~ = (c/4π)(E~ × B),
~ sobre el área,
Z Z  
P = ~ · d~a =
S ~ · R̂ R2 dΩ ,
S

donde escogemos d~a k R̂. La componente de E ~ proporcional a 1/R da una


contribución a la potencia radiada P que no decae con la distancia, por lo que
los campos de radiación pueden transportar energı́a a distancias arbitrarias.

16
Figura 4.4: Origen de referencias O elegido dentro de la zona donde se mueve
la carga y tal que re  r. El observador está indicado del lado derecho, y el
~ va de la posición de la carga en te a la del observador en t.
vector R

Para un campo de radiación el flujo de energı́a es S~ = (c/4π)|E~ rad |2 R̂, y la


expresión para la distribución angular de la potencia radiada es
dP c ~ rad |2 ,
(t) = |RE (4.42)
dΩ 4π
distinguiendo el tiempo de medición, t, y el retardado, te . En la mayorı́a
de los problemas astrofı́sicos, la distancia R entre el observador y la carga
mucho mayor que la región en la cual ésta se mueve, y podemos elegir el
origen de coordenadas tal que re  r, para aproximar

R ≈ r − r̂ · ~re , te ≈ t − r/c + r̂ · ~re (te )/c . (4.43)

A orden cero R ≈ r, con el punto de que la posición del observador, ~r, se


puede considerar constante (fig. 4.4).

4.2.3. Fórmula de Larmor y distribución angular de la ra-


diación
Los patrones de emisión están determinados por la distribución angular de
la potencia (4.42). La expresión general que resulta para la potencia recibida
por un observador que mide un tiempo t al introducir (4.41) no es simple,

˙ ˙ ˙
 
dP (t) e2 a2  1 2(R̂ · β̂)(β~ · β̂) (1 − β 2 )(R̂ · β̂)2 
= + − ,
dΩ 4πc3 (1 − R̂ · β)
~ 4 (1 − R̂ · β)~ 5 ~ 6
(1 − R̂ · β)
te
(4.44)
˙~
siendo ~a = βc la aceleración de la carga. La potencia radiada por la carga
en su propio marco de referencia se describe con el tiempo te = t − R/c, y
está dada por
dP (te ) dP (t)
= (1 − R̂ · β) . (4.45)
dΩ dΩ

17
Figura 4.5: Patron de emisión para un mo-
vimiento no relativista, dado por la fórmu-
la dipolar, ∝ sin2 θ. Las flechas indican la
dirección del vector de aceleración, con res-
pecto a la cual se mide el ángulo θ.

Las expresiones para dP/dΩ se simplifican en casos particulares, como β  1,


~˙ β~ ⊥ β,
β~ k β, ~˙ dando expresiones explı́citas para los patrones de emisión en
función de {θ, φ} que se describen a continuación.

Caso no relativista
Para una carga en movimiento no-relativista (β  1), los campos de radia-
ción están dados por:

~ rad = e R̂ × (R̂ × ~a),


E ~ rad = − e R̂ × ~a,
B (4.46)
Rc2 Rc2
pudiéndose considerar en este caso (no relativista) te ≈ t. La emisión queda
descrita por la fórmula no relativista de Larmor para la potencia radiada
por ángulo sólido,

dP (t) e2 a2 e 2 a2
 
˙
≈ 1 − (R̂ · β̂)2 = sin2 θ , (4.47)
dΩ 4πc3 4πc3
siendo θ el ángulo entre la lı́nea de visión y la aceleración; el patrón de
emisión es independiente de la dirección del vector de velocidad. Al integrar
sobre dΩ hallamos la potencia total radiada en función del tiempo:

2 e2 a2
P (t) = . (4.48)
3 c3
Tres puntos a notar: (i) una carga acelerada radı́a proporcionalmente a a2 e2 ;
(ii) la emisión tiene un patrón de distribución geométrica ∝ sin2 θ (fig. 4.4);
(iii) siendo E ~ rad ∝ R̂ × (R̂ × ~a), si ~a tiene una dirección fija (movimiento
rectilı́neo), entonces Ê también es fija, y la polarización es 100 % lineal.

18
Caso relativista
La expresión de Larmor no relativista (4.48) se generaliza directamente a
una expresión covariante:
2e2
P = 3 aµ aµ , (4.49)
3c
que en un marco de referencia general tiene la forma
 !2 
~
2e2 2  d(γ β)


2
2e2  4 2 
6 2
P (t) = γ − = γ a ⊥ + γ ak , (4.50)
3c dt dt 3c3

siendo ak y a⊥ las componentes de ~a paralela y perpendicular al vector


de velocidad (ec. 4.31). El patrón de emisión para un movimiento altamente
relativista está descrito por la expresión 4.44. La distribución depende de las
direcciones relativas de los tres vectores involucrados. Si fijamos el eje z como
el de la velocidad, β~ = β ẑ, podemos elegir x̂ tal que el plano xz contiene
la aceleración, ~a = ak ẑ + a⊥ x̂ y, R̂ = ẑ cos θ0 + (x̂ cos φ0 + ŷ sin φ0 ) sin θ0 ,
obtenemos la expresión general
ak sin2 θ0 + 2ak a⊥ sin θ0 cos φ0 (β − cos θ0 )
( 2
dP e2
=
dΩ 4πc3 (1 − β cos θ0 )6
)
a2 [(1 − β cos θ0 )2 − (1 − β 2 ) sin2 θ0 cos2 φ0 ]
+ ⊥ , (4.51)
(1 − β cos θ0 )6
que se simplifica en casos particulares:
a⊥ = 0: la potencia radiada por ángulo sólido va de acuerdo al patrón
dipolar dividido por el factor (1 − β cos θ)6 , es decir
dP e2 a2 sin2 θ
= .
dΩ 4πc3 (1 − β cos θ)6
Este patrón se ilustra en la Figura 4.6.
ak = 0: podemos distinguir dos casos particulares. Si R̂ está en el mis-
mo plano (φ0 = 0) entonces
dP e2 a2 (β − cos θ0 )2
= ,
dΩ 4πc3 (1 − β cos θ0 )6
˙
donde θ0 es el ángulo entre R̂ y β~ (fig. 4.6). Si β~ es perpendicular a R̂
obtenemos dP/dΩ ∝ (1 − β cos θ0 )−4 .
Para un análisis riguroso hay que recordar que las coordenadas de la carga
son medidas en te ' t − r/c + r̂ · ~re (te )/c, que no es función lineal de t.

19
Figura 4.6: Patrones de emisión para una carga en movimiento relativista:
izquierda: ~a k ~v , para β ≈ 0 y β ≈ 0.866. La figura de la derecha del recuadro
está reducida un factor de 100. derecha: ~a ⊥ ~v para β ≈ 0 y β = 0.5. La
figura de la derecha del recuadro está reducida un factor de 3.

4.2.4. Distribución espectral de la radiación


Mientras que la potencia mide la energı́a radiada por unidad de tiempo,
P (t) = dE/dt, el espectro está dado por la distribución en frecuencias de
la energı́a radiada, es decir P (ω) = dE/dω. La distribución angular de la
energı́a radiada se relaciona con la derivada en ángulo sólido de ambas,
Z +∞ Z +∞
dE dE dE
= dt = dω , (4.52)
dΩ −∞ dΩdt 0 dΩdω
considerando que frecuencias negativas carecen de significado. A través de (4.42)
es posible encontrar la distribución de energı́a de
Z +∞ Z +∞ Z +∞
dE c c ~
2
dω = |RE(t)|2 dt = RE(ω) dω ,

0 dωdΩ −∞ 4π 2π 0

donde aprovechamos la relación de Parseval,


Z +∞ Z +∞
~
|RE(t)| 2
dt = ~
|RE(ω)|2
dω ,
−∞ −∞

~
con RE(t) ~
y RE(ω) relacionados mediante la transformada de Fourier,
Z +∞ Z +∞
~ 1 ~ iωt ~ 1 ~ −iωt
RE(ω) =√ RE(t)e dt, RE(t) =√ RE(ω)e dω .
2π −∞ 2π −∞
(4.53)

20
~ real se cumple E(−ω)
Para E ~ =E ~ ∗ (ω).
De la expresión (4.41) para el campo de radiación se tiene
2

 
dE e2
Z +∞
R̂ × {( R̂ − ~ × β}
β)

 eiωt dt .

= 2 
dΩdω 4π c −∞ ~ 3
(1 − R̂ · β)


te

Para avanzar usamos la aproximación t ' te + r/c − r̂ ·~re (te )/c para cambiar
la variable de integración, notando dt = (1 − β~ · r̂)dte ,
2

 
dP (ω) dE e2
Z +∞
r̂ × {(r̂ − ~ × β}
β)

iω(t −r̂·~
r /c)

e e
= = 2  e dte ,
dΩ dΩdω 4π c −∞ ~ 2
(1 − r̂ · β)

sacando el término unitario eiωr/c de la integral. Jackson (§14) afirma que


el término en paréntesis es una diferencial exacta,


 
~ × β} ~
" #
r̂ × {(r̂ − β) =
d r̂ × (r̂ × β)
 ,
~ 2
(1 − r̂ · β) dt 1 − r̂ · β~

que permite una integración por partes y reducir la expresión para la distri-
bución espectral y angular a
2
e2 ω 2
Z +∞
dE ~ iω(t−r̂·~re (t)/c) dt ,

= r̂ × (r̂ × β)e (4.54)
dΩdω 4π 2 c −∞

cambiando la variable de integración (muda) a t. La energı́a total radiada


por unidad de frecuencia queda como
2
e2 ω 2
Z Z +∞
dE
~ iω(t−r̂·~
re (t)/c)

P (ω) = = r̂ × (r̂ × β)e dt dΩ. (4.55)
dω 4π 2 c
−∞

Uno no puede conocer el espectro y la potencia radiada mas allá de un lı́mite


∆ω∆t = 1. En un movimiento periódico, podemos definir la energı́a radiada
por unidad de tiempo y frecuencia dividiendo por el periodo T :
dE 1 dE
≡ , (4.56)
dΩdωdt T dΩdω
donde el espectro está dado en frecuencias armónicamente relacionadas,
ωn = nω0 con ω0 = 2π/T y n entero. Esta expresión puede también usarse
para definir la distribución en frecuencias de la potencia un campo observado
por un tiempo T suficientemente largo, para cumplir con ∆ω → 0.

21
4.3. Sistemas de cargas en movimiento
4.3.1. Aproximación dipolar
La aproximación no relativista de la ecuación de Larmor (4.48) puede gene-
ralizarse a un sistema de cargas como

~¨ 2
2|d(t)| ~ =
X
P (t) = , con d(t) qı~rı (t), (4.57)
3c3 ı

el momento dipolar de un conjunto decargas discretas. Los campos de ra-


diación y la distribución angular de la potencia radiada están dados por
¨~ ¨~ ¨~ 2
~ rad (t) = r̂ × (r̂ × d) ,
E ~ rad (t) = − r̂ × d ,
B
dP
(t) =
|d|
sin2 θ ,
rc2 rc2 dΩ 4πc3
(4.58)
donde ~r es la posición del observador con respecto al centro de la distribución
de cargas, y para cada carga se cumple R ~ i = ~r − ~ri ≈ ~r.
El espectro se obtiene de la transformada de Fourier del campo eléctrico
del dipolo,
2
~ rad (ω) = − ω r̂ × (r̂ × d(ω))
E ~ , (4.59)
rc2
~
con d(ω) la transformada de Fourier del momento dipolar, y un factor −ω 2
por la segunda derivada temporal del dipolo. En la expresión (4.54), la apro-
ximación dipolar implica ignorar r̂ · ~re /c dentro de la exponencial armónica,
lo que da

dP (ω) dE ω4 ~ ~
4ω 4 |d(ω)| 2
= = |d(ω)|2 sin2 θ , P (ω) = . (4.60)
dΩ dω dΩ 2πc3 3c 3

La aproximación dipolar a la ecuación de Larmor es válida para distribu-


ciones de carga contenidas en una región de tamaño L  R, siendo R la
distancia entre la carga (en te ) y el punto de medición (en t > te ). Una apli-
cación es el tratamiento de la emisión de frenado, o bremsstrahlung (§4.4).

4.3.2. Expansión multipolar


Un tratamiento mas detallado surge al hacer la transformada de Fourier de
los potenciales vectorial empleando el principio de superposición,

1 α (~x, t0 )
Z
α
A (~r, t) = δ(t0 − t + |~r − ~x|/c) d3 x dt0 . (4.61)
c |~r − ~x|

22
Aquı́ ~x denota la posición de cada elemento de la distribución de carga
y corriente, siendo t0 el tiempo retardado correspondiente a ~x. Nuevamen-
te, empleamos la aproximación del campo lejano, en la cual la región de
densidad de carga y corriente está localizada y tiene dimensiones mucho
menores que la distancia a ella. El origen de coordenadas se sitúa en el cen-
tro de la distribución de cargas y corrientes, lo que nos permite aproximar
R = |~r − ~x| ≈ r − ~r · ~x en el tiempo retardado, o simplemente R ≈ r en el
término inversamente lineal,
1
Z
α
A (~r, t) = α (~x, t − r/c + r̂ · ~x/c) d3 x .
rc
Afuera de la región de carga y corriente, el campo de radiación se comporta
como una superposición de ondas planas, con E ~ =B~ × r̂. Por tanto, basta
determinar A ~ para calcular ambos campos, siendo B ~ = ∇ × A. ~ Se puede
−2
verificar que despreciando términos en r , se tiene B ~ = (1/c)A ~˙ × r̂, y por
tanto E~ = (1/c)(A~˙ × r̂) × r̂.
~
Al considerar la transformada de Fourier de A(t), obtenemos:
−iωr/c
~ r, ω) = e
Z
A(~ ~(~x, ω)eiωr̂·~x/c d3 x , (4.62)
rc
~
con B(ω) ~
= iω r̂ × A(ω)/c, ~
y E(ω) ~
= −iω r̂ × (r̂ × A(ω))/c. El desarrollo en
serie de la exponencial lleva directamente a la expansión multipolar:

e−iωr/c X 1
Z
~
A(~r, ω) = (iωr̂ · ~x/c)n ~(~x, ω)d3 x , (4.63)
rc n=0 n!

la cual converge rápidamente para |ω k̂ ·~x/c|  1 (equivalente a x  λ), per-


mitiendo caracterizar el campo mediante una expansión que generalmente
utiliza pocos términos. A primera vista la condición x  λ no es obvia en
entornos astrofı́sicos; sin embargo, las dimensiones de x se refieren a zonas
en la cuales se aceleran las cargas y emiten, las cuales son microscópicas.
Si tenemos cargas en movimiento relativista, estas “ocupan” una región de
dimensiones L ∼ v/ω ∼ (v/c)λ  λ. Sólo para sistemas electromagnéticos
macroscópicos, como por ejemplo una estrella de neutrones, no se cumple
x  λ. Aún ası́, la ecuación 4.62 sigue siendo aplicable. De los distintos
términos de la expansión definimos:

e−iωr/c
Z
~ dip (~r, ω) =
A ~(~x, ω) d3 x , (4.64)
rc

23
e−iωr/c iω
 Z
~ cuad (~r, ω) =
A r̂ · ~x ~ d3 x , (4.65)
rc c
e−iωr/c iω 2
  Z
~ oct (~r, ω) =
A (r̂ · ~x)2 ~ d3 x . (4.66)
rc c
Utilizando los términos dipolar y cuadrupolar puede escribirse el potencial
en términos de derivadas temporales de los momentos de la distribución de
carga y corriente como
˙
~ d~ ~˙ × r̂ r̂ · Q̈
m
A(~r, t) = + + + ... , (4.67)
rc rc 6rc2
donde m
~ es el momento dipolar magnético y Q el tensor (3D) de momento
cuadrupolar eléctrico, dados por:
1 X X  
m
~ = qi ~xi × ~vi , Qab = qi 3xa xb − |~x|2 δab , (4.68)
2c i i

refiriéndose a y b a las coordenadas {x, y, z} de la i-ésima partı́cula. Los


campos quedán dados por
1 1 ...
 
¨
~ r, t) =
B(~ 2
(m~¨ × r̂) × r̂ + d~ × r̂ + ~ ×r̂ + . . . ,
Q (4.69)
rc 6c
1 1 ...
 
¨
~ r, t) =
E(~ 2
~¨ +
(d~ × r̂) × r̂ + r̂ × m ~ ×r̂) × r̂ + . . . , (4.70)
(Q
rc 6c

donde Q ~ = r̂ · Q = P
a ra Qab . La distribución angular de la potencia radiada
está dada por
dP c ~ 2
= |rB| .
dΩ 4π
La expansión multipolar resulta en los términos correspondientes en la ecua-
ción de Larmor,
¨~ 2 ...
2|d| ~¨ 2 || Q ||2
2|m|
P (t) = + + + ... , (4.71)
3c3 3c3 180 c5
Las dependencias en frecuencias se obtienen al modificar las derivadas tem-
porales por términos iω. (Shu 13, 14; Rybicki §3.1 a 3.3).

24
4.4. Bremsstrahlung
La radiación debida a la aceleración entre cargas se conoce como bremss-
trahlung, radiación de frenado o radiación libre-libre. El problema consiste
en encontrar las caracterı́sticas de la emisión para dos cargas que interaccio-
nan a través de la fuerza Coulombiana. El caso se trata de manera clásica
si la energı́a radiada en la interacción es mucho menor que la energı́a inicial
del sistema; el caso opuesto debe tratarse con un formalismo cuántico. Se
puede emplear la aproximación dipolar en el caso de movimientos no rela-
tivistas (v  c). Nótese que el dipolo de dos partı́culas de misma carga y
misma masa es nulo, y por tanto no hay radiación dentro de la aproximación
dipolar. En consecuencia, dentro de la aproximación dipolar, la interacción
entre dos electrones no produce radiación.

4.4.1. La deflexión de un electrón por un núcleo


Si despreciamos la energı́a radiada en comparación con la energı́a de un
sistema de dos cargas, podemos describir la interacción entre estas a partir
de la solución al problema de dos cuerpos, con una interacción de Coulomb
y la conservación de la energı́a y del momento angular:
1 1 q1 q2
E = m1 |~v1 |2 + m2 |~v2 |2 + , (4.72)
2 2 |~r1 − ~r2 |
~ = m1 ~r1 × ~v1 + m2 ~r2 × ~v2 ,
L (4.73)
donde m1 = me , q1 = −e, m2 = Amp , q2 = Ze, corresponden al problema
de interés, que se simplifica cambiando las coordenas de las partı́culas por
la posición relativa, ~r = ~r1 − ~r2 , y la masa reducida m = m1 m2 /(m1 + m2 ):
1 Ze2 ~ = m ~r × ~v .
E = m|~v |2 − , L (4.74)
2 r
~ podemos describir el movimento en el plano per-
Fijando el eje z paralelo a L,
pendicular en términos de {r(t), ϕ(t)}, resultando una trayectoria elı́ptica,
parabólica, o hiperbólica, determinada por los valores de E y L. En parti-
cular, el problema de bremsstrahlung se refiere a la deflexión de un electrón
libre, con la condición E > 0 y la trayectoria dada por una hipérbola:
a ε2 − 1

1 + ε cos ϕ = , (4.75)
r
1/2
donde a = Ze2 /2E y ε = 1 + 2EL2 /mZ 2 e4 . Notamos que la conser-
vación del momento angular resulta en la ausencia de radiación dipolar
magnética.

25
En el caso de una deflexión tipo bremsstrahlung, es útil plantear el pro-
blema en términos de la velocidad inicial, v0 , y el parámetro de impacto, b,
parámetros equivalentes a E = mv02 /2, y L = mbv0 :
q √ p
v0 = 2E/m = a/τ , b = L/ 2mE = a ε2 − 1 . (4.76)

τ = ma3 /Ze2 =√Ze2 /mv 3 es la escala de tiempo de la interacción y


p

a = Ze2 /mv 2 = b/ ε2 − 1. La aproximación no-cuántica es correcta para


L  h̄, es decir:

b . (4.77)
mv0

4.4.2. Aproximación para deflexiones pequeñas


La solución de problema de dos cuerpos (§4.4.3) muestra que las ası́ntotas de
la trayectoria hiperbólica corresponden con las rectas x = aε ± y(ε2 − 1)−1/2 .
El ángulo de deflexión, definido aquı́ como el ángulo entre estas ası́ntotas,
está dado por tan(∆θ/2) = (ε2 − 1)−1/2 = Ze2 /bmv02 . La condición para
deflexiones pequeñas queda como
Ze2
b . (4.78)
mv02
Nótese que en la figura 4.8 se tomó ε = 2, lo cual resulta en una deflexión
de exáctamente 60◦ , la cual no puede considerarse pequeña.
Una ventaja importante de la aproximación de deflexiones pequeñas es
el dar expresiones correctas, aun tratándose de una aproximación. Podemos
considerar que la trayectoria del electrón es rectilı́nea y su velocidad cons-
tante en magnitud, v = v0 . Si consideramos al ion en reposo,el momento
¨
dipolar eléctrico del sistema es d~ = −e~r y su segunda derivada d~ = −e~a. La
¨
transformada de Fourier de d~ es −ω 2 d(ω):
~
Z +∞
−e
~
−ω 2 d(ω) =√ ~a(t)e−iωt dt . (4.79)
2π −∞

Aproximando la trayectoria como una lı́nea recta (Figura 4.7), la aceleración


~a está dada por
Ze2 (ŷ + x̂ vt/b)
~a = − 2 ,
mb (1 + (vt/b)2 )3/2
de donde
!
Ze2
Z +∞
e b ŷ + sx̂ ω
   
~
d(ω) = √ − 2 exp −i s ds . (4.80)
ω 2 2π mb v 2
(1 + s ) 3/2 v/b
−∞

26
Figura 4.7: Trayectoria y aceleración en una interaccin con deflexión pe-
queña.

La interacción entre el electrón y el núcleo dura un tiempo de orden τ ≈ b/v.


Para frecuencias ω  v/b, la exponencial en la integral oscila muy rápida-
mente, por lo que la integral tiende a un valor muy pequeño. Para ω  v/b,
aproximamos simple y llanamente la exponencial como igual a uno, resul-
tando en dx (ω) = 0 y la integral sobre ŷ da 2, de donde
( √
−(e/ω 2 2π) 2Ze2 /mbv ŷ para ω  v/b ,

~
d(ω) ≈ (4.81)
0 para ω  v/b .

De esta expresión podemos estimar la energı́a radiada por unidad de frecuen-


cia en una colisión con parámetro de impacto b de un electrón con velocidad
asintótica v y un núcleo de carga +Ze,
(
dE 4ω 4 ~ 2 8Z 2 e6 /3πm2 c3 v 2 b2 para b  v/ω ,
(v, b) = 3 |d(ω)| = (4.82)
dω 3c 0 para b  v/ω ,

El espectro de una interacción es mayormente independiente de ω, con corte


para ω  v/b.
Podemos entonces determinar la emisividad de un plasma con densidad
de iones ni , densidad de electrones ne , considerando el flujo de electrones
velocidad v incidiendo en un anillo de radio b y ancho db:

16Z 2 e6
Z bmax
dE(v) dE bmax
 
= ni ne v (v, b) 2πb db = ne ni ln , (4.83)
dtdV dω bmin dω 3c3 m2 v bmin

27
donde el rango finito de valores de b asegura la convergencia de la integral.
El lı́mite superior puede tomarse como bmax ≈ v/ω, generalmente menor
−1/3
a ne , excepto en casos extremos (T ∼ 10 K, ω ∼ 10 MHz). Por otro lado,
tenemos ya identificados dos lı́mites inferiores: el de la validez de la aproxi-
(1)
mación de deflexiones pequeñas, b  bmin ≡ Ze2 /mv 2 ; y el lı́mite cuántico,
(2)
b  bmin ≡ h̄/mv. El lı́mite cuántico es superior al de deflexiones pequeñas
si v/c >∼ Zα, donde α ' 1/137 es la constante de estructura fina. En es-
te caso, podemos tomar bmin = Ze2 /mv 2 dentro de la expresión; en caso
contrario, debemos considerar de alguna forma las correcciones cuánticas.
Finalmente, notamos que la condición de que energı́a radiada sea mucho
menor que E viene siendo (dE/dω)(v/b)  mv 2 /2, lo cual se traduce en
1/3
Ze2 v 16
 
b . (4.84)
mv 2 c 3πZ
Este caso se cumple automáticamente al estar considerando deflexiones pe-
queñas en un movimiento no relativista.
El resultado exacto puede referirse a la aproximación aquı́ tratada defi-
niendo el factor de Gaunt, gf f (v, ω), tal que

dE(v) 16πZ 2 e6
= √ 3 2 ne ni gf f (v, ω) . (4.85)
dtdV dω 3 3c m v

En el caso considerado aquı́, gf f (v, ω) = ( 3/π) ln(bmax /bmin ).

4.4.3. Bremsstrahlung clásico: movimiento hiperbólico


El movimiento de un electrón interaccionando con un núcleo planteado como
un problema clásico (v  c) de dos cuerpos, se reduce al estudio de la
posición relativa entre las partı́culas, ~r, que para mi  me corresponde
prácticamente con la trayectoria del electrón. La dependencia temporal se
describe en términos de ecuaciones paramétricas, siendo más adecuado el
uso de coordenadas cartesianas:
p
x = a (ε − cosh ψ) , y = a ε2 − 1 sinh ψ , t = τ (ε sinh ψ − ψ) , (4.86)

donde τ = Ze2 /mv 3 es la escala de tiempo de la interacción, a2 = Ze2 /mv 2


y el parámetro ψ va de −∞ a +∞.
La figura 4.8 ilustra este movimiento, calculado mediante la expresión
paramétrica. El espectro emitido durante un encuentro se obtiene de la
expresión 4.60, usando la transformada de Fourier del momento dipolar

28
Figura 4.8: Movimiento de una
carga atraı́da por un campo cen-
tral Coulombiano de acuerdo con
la parametrización (4.86). Se tomó
ε = 2 y los puntos están separados
por ∆ψ = 0.1, cubriendo un ran-
go en ψ de ±3, y un movimiento
de abajo hacia arriba. El centro
de atracción está en el origen,√ el
parámetro de impacto es b = 3.
Se muestra el punto mas cercano
de la ası́ntota ψ = +∞, separado
del origen una distancia b.

~
d(ω) = m~r(ω)(q1 /m1 − q2 /m2 ), siendo m la masa reducida y anulándose
d~ para una interacción entre partı́culas idénticas o con mismo cociente carga
masa. Aquı́ usamos (q1 /m1 −q2 /m2 ) ≈ −e/m, y calculamos la transformada
de Fourier de {x, y} empleando la parametrización, de donde se obtiene

a (1)0 a ε2 − 1 (1)
x(ω) = − Hiωτ (iωτ ε), y(ω) = Hiωτ (iωτ ε),
2ω 2ω ε
siendo Z +∞
1
Hp(1) = epψ−ix sinh ψ dψ ,
iπ ∞

la primera función de Hankel de orden p, y H (1)0 su derivada, ambas definidas


a partir de las funciones de Bessel. La expresión para la distribución espectral
de energı́a durante una colisión queda como
( )
dE 2πe2 v 2 ε2 − 1
= 3
(ωτ )2 |Hiωτ
0
(iωτ ε)|2 + |Hiωτ (iωτ ε)|2 . (4.87)
dω 3c ε2

Esta expresión es análoga a la (4.82) deducida para ángulos pequeños, reem-


plazando 2π(ωτ )2 {|H 0 |2 +(1−ε−2 )|H|2 } → 8(a/b)2 = 8/(ε2 −1). Al integrar
sobre valores de b para un plasma con densidad de electrones e iones ne , ni ,
respectivamente, y notando que b db = a2 εdε, se obtiene

dE 4π 2 Z 2 e6 0
= ωτ |Hiωτ (iωτ )|Hiωτ (iωτ ) . (4.88)
dV dωdt 3c3 m2 v

29
Figura 4.9: Movimiento
de una carga atraı́da por
un campo central Coulom-
biano. En el panel inferior
se muestran las posiciones
como función del tiempo
{x(t), y(t)} y en el panel
superior las aceleraciones
{ẍ(t), ÿ(t)}, para el mo-
vimiento ilustrado en la
figura 4.8 (ε = 2).

Este resultado concuerda con el resultado para ángulos pequeños (4.85), con
un factor de Gaunt
√ !
π 3 0
gf f (v, ω) = ωτ |Hiωτ (iωτ )|Hiωτ (iωτ ) . (4.89)
4

A frecuencias bajas, ωτ  1, el comportamiento asintótico de la función de


Hankel da una expresión cası́ idéntica a la de deflexiones pequeñas,
( √ 
3/π ln 2mv 3 /γωZe2 para ωZe2 /mv 3  1 ,

gf f (v, ω) →
1 para ωZe2 /mv 3  1 ,
(4.90)
C
con γ = e ' 1.781073, y C ' 0.57721566 . . . la constante de Euler.

4.4.4. Bremsstrahlung térmico


Las expresiones anteriores se derivaron para electrones con velocidad fija
v. Una situación más general es la de una población de electrones con una
distribución de velocidades, f (~v ), para la cual el espectro viene dado por
el promedio sobre esta distribución. Si la población de electrones está en
equilibrio a una temperatura T , f (v) dv ∝ exp{−mv 2 /2kT } v 2 dv, se tiene
dE(T ) dE(v)
Z
4πν = = f (v)dv
dtdV dν dtdV dν
32πe6
r

= 3
ne ni Z 2 T −1/2 e−hν/kT ḡf f , (4.91)
3mc 3km

30
donde ḡf f es un promedio sobre velocidades del factor de Gaunt y ν la
emisividad del proceso, en este caso isotrópico. Integrando sobre frecuencias
encontramos la potencia radiada por unidad de volumen,
s
dE(T ) 32πe6 2πkT
= ne ni Z 2 ḡB
dtdV 3hmc3 3m
= 1.426 × 10−27 erg s−1 cm−3 T 1/2 ne ni Z 2 ḡB , (4.92)

siendo ḡB el factor de Gaunt promediado sobre frecuencias. El libro de


Rybicki-Lightman da una discusión sobre el factor de Gaunt, el cual es
generalmente del orden de uno.

4.4.5. Absorción libre-libre


De acuerdo con la ley de Kirchhoff, a todo proceso de emisión, descrito por
un coeficiente ν , le corresponde un proceso de absorción con coeficiente de
absorción αν = ν /Bν (T ), con Bν la función de Planck, de donde obtenemos

4e6
r
2π  
αν = ne ni Z 2 T −1/2 ν −3 1 − e−hν/kT ḡf f ,
3mhc 3km  
= 3.7 × 108 cm−1 ne ni Z 2 T −1/2 ν −3 1 − e−hν/kT ḡf f . (4.93)

Una expresión útil en el estudio de estructura estelar es la del promedio de


Rosseland del coeficiente de absorción, dado por el promedio de α−1 con
∂B/∂T cómo función de peso,

αR = 1.7 × 10−25 cm−1 T −7/2 Z 2 ne ni ḡR , (4.94)

con ḡR el promedio correspondiente de la función de Gaunt.

4.4.6. Bremsstrahlung relativista


Aunque en muchos casos es suficiente el considerar el caso clásico, existen
problemas en los cuales es necesario considerar electrones relativistas. Por
ejemplo, la emisión difusa de rayos γ debida a rayos cósmicos y la generación
de cascadas electromagnéticas en la atmósfera.
El tratamiento es más sencillo en un marco de referencia en el cual
el electrón tiene momentáneamente velocidad cero. El regreso al marco de
referencia del observador se simplifica considerando que la potencia radiada
es invariante, como se puede ver en la ecuación (4.49), o por el hecho de que
P = dE/dt es el cociente de dos componentes temporales que se transforman

31
de igual manera. En el caso relativista, el tratamiento no cuántico implica
deflexiones pequeñas, ya que

(1) h̄ (2) Ze2 v


bmin = > bmin = 2
⇒ > Zα,
mv mv c
para el caso general, con Zα ≤ 0.19 para núcleos más ligeros que el hierro.
En su propio marco de referencia, el electrón percibe el campo elec-
tromagnético resultante de la transformación del campo Coulombiano del
núcleo, resultando en una aceleración
~0
eE Ze2 (x̂ γvt0 + ŷγb)
a~0 (t0 ) = − = .
m m [b2 + γ 2 v 2 t02 ]3/2

El desarrollo es completamente análogo al empleado en §4.4.2, obteniéndose,


dE 0 8Z 2 e6 1 γv
(v, b) ≈ para ω 0  , (4.95)
dω 0 3πm2 c3 b2 v 2 b
siendo dE 0 /dω 0 despreciable para ω 0  γv/b. Esta expresión, referida al
marco de movimiento instantáneo del electrón, es idéntica a (4.82), excepto
por el término γ en la frecuencia de corte. La integración sobre parámetros
de impacto debe considerar un flujo de núcleos aumentado por un factor γ
en la dirección de movimiento, de forma que un electrón radı́a
dE 0
Z bmax  0 
dE 16 ni Z 2 e6 γ bmax
 
(v) = γni v 2πbdb = ln .
dt0 dV 0 dω 0 bmin dω 0 3m c2 3 v bmin
La elección de bmin y bmax requiere consideración. En el caso relativista,
la restricción de emplear un tratamiento cuántico es más estricta que la de
deflexiones pequeñas, por lo que bmin = h̄/mv, sin incluir un factor γ ya que
b es transversal a la dirección de movimiento. Por otro lado, si consideramos
átomos neutros, el efecto del apantallamiento de las cargas se manifiesta
con un corte en bmax = 1.4a0 Z −1/3 , con a0 el radio de Bohr, de donde las
pérdidas de energı́a están dadas por (4.85) con

dE 16 ni Z 2 e6  −1/3

= ln 192 Z , (4.96)
dtdV dω 3m2 c4
donde se pierde el factor γ al retornar al marco del observador. El factor
numérico incluye la constante de estructura fina y v/c → 1. La pérdida total
de energı́a resulta de integrar sobre frecuencias, desde cero hasta E/h̄,

dE 16 Z 2 e6 E  −1/3

= ln 192 Z ni dV ,
dt 3h̄m2 c4

32
que corresponde a una pérdida exponencial de energı́a. Esta se puede expre-
sar en términos de la longitud o de la densidad de columna, X,
dE E 716 g cm−2 A
=− , donde X0 = , (4.97)
dX x0 Z(Z + 1.3) ln(183 Z −1/3 ) + 1/8
con A la masa atómica del material involucrado. Esta expresión incorpora
un cálculo más preciso realizado originalmente por Bethe y Heitler. Para
el aire X0 = 36.5 g cm−2 . Un electrón de alta energı́a en la atmósfera, de
espesor total un poco superior a 1000 g cm−2 emite fotones de alta energı́a
al atravesar una densidad de columna del orden de X0 .

4.5. Radiación sincrotrón


La radiación sincrotrón proviene de electrones relativistas en campos magnéti-
cos; para su descripción se requiere ir mas allá de la aproximación dipolar.

4.5.1. Carga en un campo magnético uniforme


El comportamiento de una carga en un campo magnético se describe me-
diante la ecuación de movimiento con la fuerza de Lorentz, ec. 4.33,
d(γmc2 ) d(γm~v ) ~ + ~v × B
 
~ · ~v ,
= −e E = −e E ~ . (4.98)
dt dt c
Considerando solamente un campo magnético (E ~ = 0), la energı́a de la
partı́cula se conserva y la ecuación de movimiento se reduce a
d~v
~ B × ~v ,

dt
con ω ~
~ B ≡ eB/γmc. La norma de este vector se conoce como frecuencia
de sincrotrón, ωB = eBc/E. Estas ecuaciones de movimiento no consideran
las pérdidas por radiación, y en primera aproximación la energı́a E de la
partı́cula se toma como constante. Tomando el eje ẑ como el del campo
magnético, B~ = B ẑ obtenemos como solución,

~v (t) = x̂ v sin α cos(ωB t + φ) + ŷ v sin α sin(ωB t + φ) + ẑ v cos α ,


~r(t) = x̂ r` sin(ωB t + φ) − ŷ r` cos(ωB t + φ) + ẑ v cos α t + ~r0 ,
(4.99)

donde α denota el ángulo entre ~v y B, ~ que junto con las constantes v y


φ, estipula las condiciones iniciales. La posición ~x se escala con el radio de

33
Larmor, r` ≡ v sin α/ωB . El movimiento del electrón es una superposición de
un movimiento rectilı́neo uniforme en el eje ẑ, con velocidad vk = v cos α, y
un movimiento circular uniforme en el plano xy, con velocidad v⊥ = v sin α,
frecuencia ωB y una dirección de giro determinada por la dirección de ω ~ B.

4.5.2. Radiación sincrotrón por un electrón


Potencia total radiada
La potencia total radiada por el electrón viene dada por la expresión de
Larmor (ec 4.49) para ak = 0,

2e2 µ 2e2 4 2 2
P (t) = 3
aµ a = 3
γ a⊥ = re2 c γ 2 β⊥
2 2
B , (4.100)
3c 3c 3
donde re = e2 /mc2 ' 2.8178 × 10−13 cm, es el radio clásico del electrón.
Promediando la componente de velocidad perpendicular al campo magnéti-
co, ∝ sin α, sobre ángulo sólido, tenemos < β 2 sin2 α2 >= 2β 2 /3, con lo que
podemos expresar la potencia promedio radiada por un electrón como
4
P (t) = σT (γ 2 − 1) uB c . (4.101)
3
σT = (8π/3)re2 es la sección eficaz de Thompson, y uB = B 2 /8π es la densi-
dad de energı́a del campo magnético. Esta expresión es análoga a la potencia
radiada por efecto Compton por un electrón en un campo de radiación de
densidad de energı́a urad .
En el tratamiento cinemático se despreciaron las pérdidas de energı́a al
suponer E = γmc2 constante. Un electrón en un campo magnético pierde
energı́a en una escala de tiempo
−1 !
1 dγ 3 mc γ
 
τ≡ = 2 2 2
.
γ dt 2 re B⊥ γ −1

Potencia radiada en función del tiempo


~ = B ẑ
Para tener una idea del espectro de sincrotrón podemos considerar B
y un movimiento circular en el plano xy, es decir α = π/2,

β~ = β (x̂ cos ωB te + ŷ sin ωB te ) , ~re = r` (x̂ sin ωB te − ŷ cos ωB te ) ,

recordando r` = βc/ωB . Al elegir r̂ = x̂ cos θ + ẑ sin θ situamos al observador


con un ángulo θ en relación al plano de movimiento del electrón, y π/2 − θ

34
6

~ = B ẑ
B
5

3
θ
2 x̂

0
0 2 4 6 8 10

Figura 4.10: Izquierda: observador en r̂ = x̂ cos θ + ẑ sin θ, viendo un electrón


moviéndose en el plano xy bajo la acción de B ~ = B ẑ; Derecha: tiempo
retardado para el problema de sincrotrón: te = t−r/c+(β/ωB ) cos θ sin ωB te ,
con β cos θ = 1. Nótese cómo te avanza súbitamente cuanto ωB t = (2n+1)π.

~ de forma que el patrón de emisión, dado por la ec. 4.44,


con respecto a B,
queda como
˙ 2
 
dP (t) ~ 2 − (1 − β 2 )(R̂ · β̂)
e2 v̇ 2  (1 − R̂ · β)
=  ,
dΩ 4πc3 ~ 6
(1 − R̂ · β)
te
( )
e2 ωB
2 β2 (1 − β cos θ cos ωB te )2 − (1 − β 2 ) cos2 θ sin2 ωB te
= ,
4πc (1 − β cos θ cos ωB te )6

˙
donde R̂ ≈ r̂ y el término β~ · β~ en la expresión (4.44) se anula. El tiempo
retardado está dado por

te ≈ t − r/c + r̂ · ~re (te )/c = t − r/c + (β/ωB ) cos θ sin ωB te . (4.102)

El comportamiento de te se muestra en la figura 4.10 para β cos θ ' 1.


Antes de analizar la distribución angular de la potencia radiada, veremos
cualitativamente cuál es la distribución temporal de la misma, considerando
un observador en el plano del movimiento del electrón, θ = π/2,

dP (t) 2 β 2 (β − cos ω t )2
e2 ωB B e
= , (4.103)
dΩ 4πc (1 − β cos ωB te )6

La dependencia cosenoidal en ωB te asegura la periodicidad de la emisión en


t, ya que ωB te + 2π = (ωB t + 2π) − ωB r/c + β sin(ωB te + 2π). Cada vez

35
Figura 4.11: Pulso de la emi-
sión sincrotrón visto en térmi-
nos del tiempo retardado, te y
del tiempo medido por el ob-
servador, t. En este ejemplo se
tomó β = 0.8 ⇒ γ ' 1.67.
El pulso en te tiene duración
∆te ∝ 1/γ, mientras que en t
tiene duración ∆te ∝ 1/γ 3 . Pa-
ra valores grandes de γ, los pul-
sos aparecen como lı́neas.

que el tiempo retardado avanza un ciclo (ωB te → ωB te + 2π), el tiempo


del observador avanza en (ωB t → ωB t + 2π). Por otro lado, es posible ver
que la emisión presenta máximos marcados alrededor de t = 2πn. Para
ωB te  1, β → 1 tenemos
 
ωB te ' ωB t + 1 − 1/2γ 2 ωB te ⇒ te ≈ 2γ 2 t,

y aproximando,
2 2
dP (t) e2 ωB
2 1 − γ 2 ωB
2 t2
e 4e2 ωB
2 6 2 2
8 1 − γ ωB t
≈ 16γ 8 2 t 2 )6 ≈ γ 2 t2 )6 , (4.104)
dΩ 4πc (1 + γ 2 ωB e πc (1 + γ 6 ωB
para ωB te  1. El comportamiento del pulso de sincrotrón se ilustra en la
figura 4.11. La emisión está formada por pulsos de ancho ∆t ≈ 2π/γ 3 ωB ,
repitiéndose con periodo T = 2π/ωB . Esto resulta en un espectro de emisión
que cubre frecuencias desde ωB hasta γ 3 ωB . Formalmente el espectro es
discreto y la emisión se da en frecuencias ωn = nωB con n = 1 → γ 3 .

Distribución angular y espectro sincrotrón


El cálculo del espectro se hace a partir de la expresión (4.54),

e2 ω 2 +∞ 2
Z
dP (ω) dE ~ iω(t−r̂·~re (t)/c) dt
= = r̂ × (r̂ × β)e
dΩ dωdΩ 4π 2 c −∞
2 2
e ω 2 2

= 2
β ê⊥ A⊥ (θ, ω) − êk Ak (θ, ω) , (4.105)
4π c

36
siendo Ak , A⊥ las amplitudes de las componentes de polarización orientadas
a lo largo de los vectores êk = ŷ, ê⊥ = x̂ sin θ − ẑ cos θ, respectivamente,
ambos perpendiculares a r̂. Las componentes de A(θ, ~ ω) están dadas por,
Z +∞
Ak (θ, ω) = sin ωB t · exp {iωt(1 − β cos θ sin(ωB t)/ωB t)} dt
−∞
Z +∞ n  o
≈ ωB t · exp iωt 1/2γ 2 + θ2 /2 + ωB
2 2
t /6 dt,
−∞
1 1
 
≈ ωB 2
+ θ2 √ K2/3 (x),
γ 3
Z +∞
A⊥ (θ, ω) = sin θ exp {iωt(1 − β cos θ sin(ωB t)/ωB t)} dt
−∞
Z +∞ n  o
≈ θ exp iωt 1/2γ 2 + θ2 /2 + ωB
2 2
t /6 dt
−∞
1/2
1 1

≈ ωB θ + θ2 √ K1/3 (x), (4.106)
γ2 3

donde se emplea {ωB t, θ, 1/γ}  1, sin x/x ' 1 − x2 /3! + . . . La variable


adimensional x ≡ (ω/3ωc )(1 + γ 2 θ2 )3/2 introduce la frecuencia de corte

ωc ≡ 3γ 3 ωB /2 .

La distribución espectral y angular de la emisión queda como


2 " #
dP (ω) 3e2 ω γ 2 θ2
  2
= 2 γ 2 1 + γ 2 θ2 2
K2/3 (x) + K 2 (x) .
dΩ 4π c ωc 1 + γ 2 θ2 1/3
(4.107)
El término de la izquierda en los paréntesis cuadrados corresponde a Ak y el
de la derecha a A⊥ . Hemos considerado que el electrón tienen un movimiento
circular uniforme perpendicular a la lı́nea de campo magnético. En un caso
más general se moverá describiendo una hélice con inclinación α con respecto
aB ~ y se tiene ωc ≡ 3γ 3 ωB sin α/2.
Integrando sobre frecuencias se obtiene la distribución angular de la
energı́a total radiada,
" !#
dE e2 c γ5 7 5 γ 2 θ2
= + . (4.108)
dΩ ωB (1 + γ θ )
2 2 5/2 16 16 1 + γ 2 θ2

La emisión consiste en un pulso de ancho ∆θ ≈ 1/γ amplificado sobre la


emisión promedio por un factor γ 5 (fig. 4.12).

37
Figura 4.12: Izquierda: distribución angular de la emisión sincrotrón. Dere-
cha: distribución espectral de la emisión sincrotrón dada por las funciones
F (x) -lı́nea sólida- y G(x) -lı́nea punteada.

Al integrar sobre ángulo sólido se obtiene el espectro emitido, el cual es


una función de ω/ωc de la forma
√ 3
3 e B sin α ω
 
P (ω) = 2
F = Pk (ω) + P⊥ (ω) , (4.109)
2π mc ωc
donde la potencia radiada por cada componente es
! √ 3 !
P⊥ (ω) 3 e B sin α F (ω/ωc ) + G (ω/ωc )
= , (4.110)
Pk (ω) 4π mc2 F (ω/ωc ) − G (ω/ωc )

con F y G las funciones de emisión sincrotrón, dadas por Westfold (1959),


Z ∞
F (x) ≡ x K5/3 (y)dy , G(x) ≡ xK2/3 (x) . (4.111)
x

Kr (x) es la función modificada de Bessel de orden r (Figura 4.12). La función


F (x) tiene como comportamientos asintóticos,
 1/3
4π x
F (x) ≈ √ para x  1 ,
3 Γ(1/3) 2
F (x) ≈ (π/2)1/2 e−x x1/2 para x  1 .
El grado de polarización de la radiación es
P⊥ (ω) − Pk (ω) G(ω/ωc )
Π(ω) = = . (4.112)
P⊥ (ω) + Pk (ω) F (ω/ωc )

38
Esta fórmula describe la emisión por un sólo electrón. En general tendre-
mos una población de electrones y su distribución de energı́a determinará el
espectro total y la polarización correspondiente.
(Rybicki §6; Jackson §14)

4.5.3. Radiación sincrotrón de una población de electrones


Para una población de electrones las distintas energı́as intervienen en el
espectro total a través de distintos valores de γ, y por tanto de ωB y ωc .
En muchos casos es posible describir una población no térmica de electrones
con una ley de potencias válida dentro de un cierto intervalo de energı́as, o
de valores de γ:
N (γ)dγ = C γ −p dγ ,
donde p es el ı́ndice espectral de la distribución de electrones. La potencia
total radiada está dada por:
Z γ2 Z x2
P (ω) = C P (ω)γ −p dγ ∝ ω −(p−1)/2 F (x)x(p−3)/2 dx .
γ1 x1

Los lı́mites de x = ω/ωc corresponden el intervalo de energı́as considerado,


γ1 < γ < γ2 . Si este es suficientemente amplio, la integral tiende a su valor
asintótico (x1 → 0 y x2 → ∞) y

P (ω) ∝ ω −s = ω −(p−1)/2 . (4.113)

El ı́ndice espectral s de la radiación se relaciona con el de la distribución de


electrones a través de s = (p − 1)/2. La forma exacta del espectro, deducida
de integrar 4.109, es:
√ ! 
3C p 19 p 1 ωL e2 ω −(p−1)/2
    
P (ω) = Γ + Γ − ,
2π(p + 1) 4 12 4 12 c 3ωL
(4.114)
con ωL = eB sin α/mc. La polarización queda simplemente como:
p+1
Π= . (4.115)
p + 7/3

4.5.4. Auto-absorción
De acuerdo con el formalismo de transferencia radiativa, a un proceso de
emisión le corresponde un proceso de absorción recı́proco. Para un proceso
en equilibrio, el coeficiente de absorción, αν se deduce de la emisividad, jν ,

39
a través de la ley de Kirchhoff, jν = αν Bν (T ), con Bν la función de Planck.
El caso de radiación sincrotrón no corresponde al de un emisor en equilibrio,
pero es posible obtener el coeficiente de absorción a través de jν = αν Sν .
Consideremos la función fuente como el producto del número de estados por
unidad de volumen de espacio fase (2ν 2 /c3 ), por el flujo de energı́a, dado
por la velocidad de la radiación (c) y la energı́a promedio de cada fotón
 
Sν = 2 ν 2 /c3 c<E > .

Tomando < E >=< γ > mc2 , < γ >' [ω/(eB/mc)]1/2 obtenemos


! 1/2
ν2 ν
Sν = 2 2 mc2 ∝ B −1/2 ν 5/2 , (4.116)
c νL

con la frecuencia de Larmor definida como νL = (1/2π)(eB/mc). Dado que


jν ∝ ν −(p−1)/2 obtenemos αν ∝ ν −(p+4)/2 .
La absorción decrece con ν, siendo mayor para frecuencias bajas. A partir
de cierta frecuencia, νm , el camino libre medio será mayor que el tamaño de la
región emisora y los fotones escapan. Por debajo de esta frecuencia, el medio
es opticamente grueso y el espectro está dado por Sν ∝ ν 5/2 ; mientras que
por encima de esta frecuencia el medio es ópticamente delgado y la emisión
va de acuerdo a jν ∝ ν −(p−1)/2 (ver Rybicki Fig. 6.12).
El valor de νm contiene información acerca de la región emisora. Si esta
está descrita por una esfera de radio R, enel régimen ópticamente grueso
el flujo está dado por Fν = Sν πθ2 , siendo θ = R/r el radio angular de la
fuente. Mediciones interferométricas en radio permiten medir θ, asi como el
punto donde el espectro cambia de ópticamente grueso a delgado, νm y Fm ,
por lo que, a través de ec. 4.116, se deduce el campo magnético B.
(Rybicki 6; Shu 18)

4.6. El efecto Compton


4.6.1. Dispersión de Thomson
Se denomina dispersión de Thomson - o dispersión electrónica- a la disper-
sión de una onda plana electromagnética por un electrón libre. Al incidir la
onda, el electrón oscila de acuerdo a la fuerza de Lorentz,

~ + ~v × B
 
F~ = −e E ~ .
c

40
La dispersión de Thomson se restringe al caso no relativista (v  c), en el
que se puede despreciar el efecto del campo magnético, menor al eléctrico
por un factor ∼ v/c. El movimiento del electrón está dado por
¨ e = −eE ε̂ ei(kz−ωt) ,
m~x
para una onda monocromática propagándose con k̂ = ẑ, y ε̂ el vector de
polarización del campo eléctrico. Si ż(0) = 0, la partı́cula restringe su mo-
vimiento al plano xy; y el término eikz representa una fase, al ser z fija.
La potencia radiada, incluyendo el patrón de emisión, se estima de la
aproximación dipolar para la ecuación de Larmor
¨~ 2
dP |r̂ × (r̂ × d)|
= , (4.117)
dΩ 4πc3
siendo d~ = −e~xe , el momento dipolar para el electrón situado en ~xe , y r̂ el
vector unitario que une al electrón con el observador. La potencia promedio
radiada por el electrón por unidad de ángulo sólido queda como:
!2
dP c e2
   
= |E|2 1 − |r̂ · ε̂0 |2 . (4.118)
dΩ 8π mc2
Podemos cuantificar el efecto de la dispersión Thomson en términos de la
comparación entre la “entrada” (onda plana) y la “salida” (emisión dipolar),
cuantificada por la sección eficaz total, σ, o diferencial, dσ/dΩ:
!2
dP dσ dσ 1 e2  
=< S > ⇒ = 1 − |r̂ · ε̂0 |2 . (4.119)
dΩ dΩ dΩ 2 mc2
Usando r̂ = ẑ cos θ + (x̂ cos φ + ŷ sin φ) sin θ , para polarización lineal (ε̂0 =
x̂), obtenemos un patrón angular ∝ (1 − sin2 θ cos2 φ). Para una onda con
polarización circular o para una onda no polarizada, se obtiene
!2
dσ e2 1
= (1 + cos2 θ) . (4.120)
dΩ mc2 2
La integración sobre ángulo sólido nos da la sección eficaz de Thomson,
!2
8π e2 8π 2
σT = = r , (4.121)
3 mc2 3 e
siendo re ≡ e2 /mc2 ≈ 2.82 × 10−13 cm el radio clásico del electrón.
No hay alteración del espectro incidente: la luz dispersada tiene la misma
frecuencia que la onda incidente. Es al considerar el caso relativista -el efecto
Compton- que obtenemos un cambio en la frecuencia de la radiación.

41
4.6.2. El efecto Compton
El efecto Compton es la dispersión de un electrón por un fotón. En
este caso el fotón es tratado como una partı́cula y la interacción como una
colisión,
γe → γe . (4.122)
Este tratamiento es mas apropiado que el de dispersión Thomson para foto-
nes con energı́as comparables con la de la masa del electrón en reposo, mc2 .
En este caso se considera la colisión en el marco de referencia del electrón,
empleando la conservación del cuadrivector de energı́a y momento,

pe(i) + pγ(i) = pe(f ) + pγ(f ) . (4.123)

El electrón está inicialmente en reposo, por lo que pe(i) = (mc; 0), mientras
que pe(f ) = (γmc; γmβc). ~ El fotón tiene pγ(i) = (h̄ω0 /c)(1; k̂0 ) antes de la
colisón, y pγ(f ) = (h̄ω1 /c)(1; k̂1 ) después. Se puede manipular las ecuacio-
nes para obtener, independientemente del movimiento final del electrón, la
ecuación de Compton que relaciona las energı́as inicial y final del fotón:
h̄ω0
h̄ω1 =  . (4.124)
1 + (h̄ω0 /mc2 ) 1 − k̂0 · k̂1

Expresada en términos de las longitudes de onda final e inicial, la relación


queda como λ1 = λ0 + λc (1 − cos θ), siendo θ el ángulo entre el fotón inci-
dente y el dispersado, y λc ≈ 0.02426 Å la longitud de onda de Compton.
Notamos que ω1 ≤ ω0 , lo cual se desprende de que el fotón le cede energı́a al
electrón. Esto es siempre cierto en el marco de referencia del electrón, pero
no necesariamente en otros marcos de referencia.
Un punto a considerar es que las variables después de la interacción no
estan plenamente definidas: debemos especificar k̂0 · k̂1 para poder calcular
ω1 , asi como el momento y energı́a del electrón después de la colisión. El
proceso es en realidad aleatorio y es descrito probabilisticamente. La proba-
bilidad de que el fotón tenga una energı́a final h̄ω1 dada, está dictada por la
sección eficaz correspondiente. En el caso clásico (Thomson) vemos un en-
semble de fotones que, siguiendo cada uno el proceso cuántico, son emitidos
de acuerdo a la sección eficaz diferencial de Thomson (ecuación 4.119). La
sección eficaz del efecto Compton se obtiene mediante del formalismo de la
electrodinámica cuántica, resultando en la expresión de Klein-Nishima:
2 
dσ r2 ω1 ω0 ω1
 
= e + − sin2 θ . (4.125)
dΩ 2 ω0 ω1 ω0

42
Para ω1 = ω0 recobramos la sección eficaz diferencial de Thomson. Pode-
mos expresar dσ/dΩ como función de cos θ y x = h̄ω0 /mc2 , substituyendo
ec.(4.124) en ec.(4.125), y de ahı́ ver el comportamiento de dσ/dΩ(θ), que se
ilustra en la figura 4.13. Al aumentar la energı́a del fotón, el efecto del mo-
mento que recibe el electrón se manifiesta en que dσ/dΩ es menos isotrópica,
favoreciendo la dispersión con θ pequeñas.

Figura 4.13: Izquierda: sección diferencial de Klein-Nishima para h̄ω0 /mc2 =


0, 0.01, 0.1, 1, 10, 100 (contornos externo a interno). El valor máximo de
dσ/dΩ sobre el eje ẑ corresponde a ±2re2 , y θ = 0 corresponde al eje ẑ.
Derecha: sección diferencial en el marco de referencia del centro de mo-
mento.Aquı́ los contornos son para ω = 0.0, 0.1, 0.3, 1.0, 3.0, 10.0 (contornos
externo a interno) con el contorno mas interno mostrando la tendencia a
cos θ = −1 para altas energı́as. En ambos casos el contorno mas externo
corresponde a la dispersión de Thomson.

Esta expresión es integrable analı́ticamente, obteniendo la sección eficaz


total en términos de x = h̄ω0 /mc2 (Rybicki, fórmula 7.5):

3 1+x 2x(1 + x) 1 1 + 3x
   
σ = σT − ln(1 + 2x) + ln(1 + 2x) − ,
4 x3 1 + 2x 2x (1 + 2x)2
(4.126)
mas sencillamente expresada como σ = σT · f (h̄ω0 /mc2 ). En el régimen no
relativista, x  1, tenemos
26
 
σ ≈ σT 1 − 2x + x2 + . . . , (4.127)
5

43
mientras que en el extremo relativista, x  1, la sección eficaz tiende lenta-
mente a cero:
3 1
 
σ ≈ σT + ln 2x . (4.128)
8x 2

4.6.3. Efecto Compton inverso


En entornos astrofı́sicos el electrón está frecuentemente en movimiento
relativista, de tal manera que en la interacción Compton la transferencia de
energı́a se da del electrón al fotón. En este caso hablamos del efecto Compton
inverso. Formalmente la diferencia entre el efecto Compton y el Compton
reside en el marco de referencia en el cual se describe el proceso.
En el caso general la interacción de un electrón (de momento γ βc)~ con un
fotón (de momento ω k̂) se representa con la conservación del cuadrivector
de energı́a-momento,
! !
h̄ω0 /c + γ0 mc h̄ω1 /c + γ1 mc
pα0 = = pα1 = , (4.129)
h̄ω0 k̂0 /c + γ0 β~0 mc h̄ω1 k̂1 /c + γ1 β~1 mc

representando los sub-ı́ndices 0, 1 antes y después de la interacción. En par-


ticular pα pα = −m2 c2 (1+2γ0 (h̄ω0 /mc2 )(1− k̂0 · β~0 )) es invariante ante trans-
formaciones de Lorentz. Una forma conveniente de tratar este problema es
trasladándose al marco de referencia del centro de momento, el cual cumple
p~0 = 0, deduciéndose la transformación respectiva de la expresión (4.17),

h̄ω0 k̂0 /c + γ0 β~0 mc ω0 k̂0 + γ0 β~0


β~ = p~c/E = ⇒ β~ = , (4.130)
h̄ω0 /c + γ0 mc ω0 + γ0

con la última igualdad escrita con unidades tales que h̄/mc2 = 1.


Por construcción, al hacer la transformación de Lorentz obtendremos un
cuadrivector ! !
α0 ω00 + γ00 ω10 + γ10
p = = , (4.131)
0 0
√ q
con −pα0 pα0
= + = 1 + 2γ0 ω0 (1 − k̂0 · β~0 ) = ω10 + γ10 , indicando el
ω00 γ00
sub-ı́ndice 1 las energı́as del fotón y electrón después de la interacción, vistos
en el marco de referencia de momento nulo. El hecho de que el momento sea
nulo implica, olvidándonos de las primas por un instante,
 1/2
γ β~ + ω k̂ = 0 ⇒ γ = 1 + ω2 . (4.132)

44
Este resultado, junto con la conservación de energı́a, implican

ω10 = ω00 , γ10 = γ00 . (4.133)

La utilidad del centro de momento consiste en que la interacción en este


marco de referencia no cambia las energı́as del fotón y electrón, las cua-
les estan además relacionadas mediante la expresión (4.132). La dispersión
consiste simplemente en una re-orientación de los momentos individuales,
k̂00 → k̂10 , descrita estadı́sticamente por la sección eficaz diferencial4
(
dσ re2 /2 (cos θ − 1)2
= 3
− 2(1 − cos θ)
dΩ (γ + ω) (γ + ω cos θ) (γ + ω)(γ + ω cos θ)
o
+ (γ + ω)2 + (γ + ω cos θ)2 , (4.134)
1/2
donde cos θ = k̂00 · k̂10 y γ = 1 + ω 2 (figura 4.13). Los lı́mites correspon-
dientes son
dσ re2 n o
≈ 1 + cos θ2 para ω  1,
dΩ 2 ( )
re2 5/8 + cos θ/4 + cos θ2 /8
≈ para ω  1. (4.135)
2 ω 2 (1 + cos θ) + 1/2

El primer caso corresponde a la dispersión de Thomson mientras que para


ω  1 hay un marcado incremento de dσ/dΩ alrededor de cos θ = −1, es
decir k̂10 = −k̂10 .
Una vez descrito el proceso en el centro de momento podemos hacer
la descripción general mediante la transformación de Lorentz adecuada. El
valor de la energı́a en el marco de referencia del observador inicial, ω1 , se
~
obtiene de ω10 haciendo la transformación inversa, de velocidad −β.

ω1 = γω10 (1 + β~ · k̂10 ), ω10 = ω00 = γω0 (1 − β


~ · k̂0 ),

de donde
γ02 ω0 (1 − β~0 · k̂0 )(1 + β~0 · k̂10 )
ω1 ' , (4.136)
1 + 2γ0 ω0 (1 − β~0 · k̂0 )
despreciando términos en ω0 /γ0  1. El resultado final depende de si
γ0 ω0 (1 − β~0 · k̂0 ) -la frecuencia del fotón en el centro de momento- es mucho
mayor o mucho menor que uno:
4
Esta expresión corresponde con la fórmula de Klein-Nishima, pero en un marco de
referencia distinto.

45
γ0 ω0 (1 − β~0 · k̂0 )  1:
Despreciando el término en (4.136), obtenemos

ω1 ' γ02 ω0 (1 − β~0 · k̂0 )(1 + β~0 · k̂10 ),

donde el vector k̂10 no está determinado, al dominar la sección eficaz


de Thomson.

γ0 ω0 (1 − β~0 · k̂0 )  1:
El término domina en el denominador y se elimina, quedando
1
ω1 ' γ0 (1 + β~0 · k̂10 ).
2
Esta colisión corresponde al caso ω  1 en el centro de momento, por
lo que el “rebote” es dominante en la sección eficaz y k̂10 → −k̂00 . Un
análisis de la transformación de k̂00 indica que

−γ β~ + k̂0 + (γ − 1)(k̂0 · β̂)β̂


k̂00 = −→ −β̂0 ,
~
γ(1 − k̂0 · β)

de donde k̂10 → β̂0 , resultando finalmente en


1
ω1 ' γ0 (1 + β) ' γ0 .
2
En este caso el fotón adquiere del electrón una energı́a comparable al
total disponible, h̄ω1 ' γ0 mc2 , el cual es menor a γ 2 h̄ω0 .

4.7. Procesos de altas energı́as


4.7.1. Reacciones, canales, diagramas
La colisión entre dos partı́culas intercambiando energı́a, como en el ejem-
plo del efecto Compton, o produciendo nuevas partı́culas es uno de los pro-
cesos mas fundamentales de interacción. Su descripción se basa en la con-
servación de los cuadrivectores de momento, que para la reacción

1 + 2 −→ 3 + 4 , (4.137)

podemos escribir como

q1 + q2 + q3 + q4 = 0 , (4.138)

46
Figura 4.14: Proceso básico de interac-
ción electrodinámica: la absorción de un
fotón (“viborita”) por un electrón (fle-
cha). Rotando este diagrama podemos
representar la creación de un par e+ e−
por un fotón, con la convención de que
una flecha yendo en reversa representa
una anti-partı́cula o la aniquilación e+ e−
en un fotón. Estos procesos no pueden
conservar energı́a y momento simultánea-
mente.

donde q representa ± el cuadrivector de energı́a momento de la -ésima


partı́cula. Escrita como tal, la expresión (4.138) puede describir la reac-
ción (4.137) o, intercambiando signos,

 (I)
 1 + 2 −→ 3 + 4 ,
(II) 1 + 3̄ −→ 2̄ + 4 , (4.139)
(III) 1 + 4̄ −→ 3 + 2̄ ,

donde ̄ representa la anti-partı́cula de . Dentro de una descripción mas


general de estos procesos, se dice que las tres interacciones en (4.139) corres-
ponden a los tres canales de una misma reacción general. Ası́ los tres canales
de la interacción básica entre dos electrones y dos fotones son

 (I)
 γ + e− −→ γ + e− =⇒ efecto Compton,
(II) γ + γ −→ e+ + e− =⇒ producción de pares, (4.140)
 (III) e+ + e− −→ γ + γ

=⇒ aniquilacion de pares.

Otros ejemplos son la interacción entre dos electrones cuyos canales son

e− e− → e− e− , e+ e− → e+ e− , e+ e+ → e+ e+ ,

o la interacción entre dos electrones y dos muones,

e − µ− → e − µ − , e+ e− → µ+ µ− , µ+ µ− → e+ e− .

La descripcion fı́sica de estos procesos se ilustra con los diagramas de


Feynman basados en la interacción básica entre electrones y fotones y algu-
nas reglas de juego. Esta interacción, mostrada en el diagrama (4.14), re-
presenta la emisión o absorción de un fotón (representado por la “viborita”)

47
por un electrón (representado por la flecha yendo de izquierda a derecha).
Usamos la convención de que el proceso (o el tiempo) procede de izquierda a
derecha. Una flecha yendo en sentido opuesto representa una antipartı́cula.
Un detalle importante es que las interacciones representadas por este diagra-
ma no pueden darse de manera aislada ya que no pueden conservar energı́a
y momento simultáneamente. Por ejemplo en el caso del diagrama (4.14), si
~ se deberı́a cumplir
el electrón incidente tiene velocidad βc,

−pα pα = (γ + ω)2 − (γ β~ + ω k̂)2 = γ + 2γω(1 − β~ · k̂) = 1,

lo cual solo es posible si γ = 1, ω = 0.

Figura 4.15: Los tres canales de un mismo proceso: a la izquierda dos dia-
gramas representando la dispersión Compton; en el centro la producción de
un par por dos fotones y a la derecha la aniquilación una partı́cula con su
anti-partı́cula para producir dos fotones.

La utilidad del diagrama (4.14) consiste en ser la base a partir de la cual


se pueden representar todas las interacciones, combinando varios diagramas
básicos en distintas configuraciones. Aun cuando en los vértices no se cumpla
la conservación de energı́a y momento, las combinaciones de diagramas si
pueden cumplirla. La figura 4.15 muestra los diagramas correspondientes a
las reacciones entre dos fotones y dos electrones. Las partı́culas que forman

48
la reacción corresponden con puntas “sueltas” mientras que las partı́culas
que unen dos vértices son denominadas partı́culas “virtuales”.
Los diagramas de Feynman son de utilidad en el cálculo de las secciones
eficaces en cuestión, habiendo una relación cercana entre las secciones efica-
ces de los distintos canales de una reacción genérica. Al ser estos procesos
manifestaciones diversas de un mismo tipo de proceso, las secciones eficaces
son tı́picamente del mismo orden (∼ re2 ) y su cálculo se hace bajo el mismo
formalismo de la electrodinámica cuántica.
(Griffiths; Berestetskii)

4.7.2. El canal de Compton


Hemos descrito el efecto Compton, el cual se manifiesta en condiciones
tı́picas del centro de una estrella como dispersión electrónica. A continuación
describimos brevemente las otras dos reacciones del mismo canal.

Producción de pares
La producción de un par electrón-positrón por dos fotones, denotada
por la reacción γγ → e+ e− , corresponde al diagrama central mostrado en la
figura 4.15. Empleando unidades tales que h̄ = 1, mc2 = 1, la conservación
de energı́a-momento se escribe como
! !
ω0 + ω1 γ0 + γ1
= ,
ω0 k̂0 + ω1 k̂1 γ0 β~0 + γ1 β~1

con la invariancia

−pα pα = 2ω0 ω1 (1 − k̂0 · k̂1 ) = 2 + 2γ0 γ1 (1 − β~0 · β~1 ) . (4.141)

El problema se simplica en el centro de momento aplicando la transformación


de Lorentz con β~ = (ω0 k̂0 + ω1 k̂1 )/(ω0 + ω1 ). Esta transformación no puede
hacerse si k̂0 = k̂1 , ya que β = 1, debido a que un fotón no puede alcanzar
a otro con propagación paralela a la suya. En el centro de momento ambos
fotones tienen una misma energı́a ω y se propagan en direcciones opuestas,
±k̂. Los electrones se comportan de la misma manera, teniendo ambos la
misma energı́a γ, y moviéndose en direcciones opuestas, ±β. ~ En el centro de
momento la conservación de energı́a se escribe simplemente como
 q


 ω = ω0 ω1 (1 − k̂0 · k̂1 )/2
ω = γ, con q

~0 · β~1 )/2.

γ= 1/2 + γ0 γ1 (1 − β

49
Figura 4.16: Sección eficaz diferencial (izquierda) y total (derecha) para la
producción de pares γγ → e+ e− . La sección eficaz diferencial adquiere un
comportamiento bi-polar a medida que ω aumenta. La sección eficaz total
es nula si ω ≤ 1.0 y máxima para ω ≈ 1.25.

La interacción consiste en el cambio de partı́culas y la re-orientación de los


momentos, k̂ → β̂, determinada probabilı́sticamente por la sección eficaz
diferencial, función de ω y cos θ = k̂ · β̂,
! ( )
dσ re2 ω 2 + (ω 2 − 1)(1 + sin2 θ)
(ω 2 − 1)1/2 2(ω 2 − 1)2 sin4 θ)
= − .
dΩ 4 ω3 ω 2 − (ω 2 − 1) cos2 θ (ω 2 − (ω 2 − 1) cos2 θ)2
(4.142)
2
La sección eficaz está indefinida para ω < 1 ⇒ h̄ω < mc . La integración
sobre ángulo sólido da la sección diferencial total,
( ! √ ! )
πre2 2ω 4 + 2ω 2 − 1 ω + ω2 − 1 2(ω 2 − 1)1/2 (ω 2 + 1)
σ(ω) = log √ − .
2ω 2 ω4 ω − ω2 − 1 ω3
(4.143)

Aniquilación electrón-positrón; positronio


En el proceso de aniquilación de pares, e+ e− → γγ, se cumple la misma
relación que para la producción de pares, ec. 4.141. La diferencia es que “de
entrada” ya hay energı́a suficiente para producir los dos fotones. Debido a
que el cálculo de la sección eficaz de este proceso está estrechamente ligada

50
Figura 4.17: Sección eficaz para la aniquilación de pares e+ e− → γγ, en
términos de la velocidad o del factor de Lorentz de los electrones en el
marco de referencia de momento nulo. La sección eficaz diverge para para
electrones lentos, γ → 1.

a la del proceso inverso, las secciones eficaces son proporcionales


! !
dσee→γγ ω2 dσγγ→ee ω2
= , σee→γγ =2 σγγ→ee ,
dΩ ω2 − 1 dΩ ω2 − 1

con el factor de 2 incluido debido a que el electrón y positrón son distingui-


bles mientras que los fotones no lo son. La sección eficaz diferencial sigue el
mismo patrón que el mostrado en la figura 4.16. Por otro lado, la sección
eficaz total se expresa frecuentemente en términos de β, la velocidad de los
electrones en el centro de momento
!" #
1 − β2 3 − β4 1+β
 
σ= πre2 log 2
− 2(2 − β ) .
4β β 1−β

La sección eficaz diverge para γ → 1, como puede verse en la fig. 4.17, con
σ → πre2 /β. Este comportamiento favorece la aniquilación de pares con baja
velocidad relativa y, por tanto, la formación de una lı́nea de aniquilación
delgada a mc2 ' 0.511MeV, observada por OSSE en el centro de la Galaxia.
Cuando se encuentran dos electrones con espines paralelos, el momento
angular de espı́n es h̄ en total. Dado que un fotón transporta un momen-
to angular igual a h̄, no es posible la aniquilación del par produciendo dos

51
fotones. Si los electrones son suficientemente lentos es posible entonces la for-
mación de un sistema ligado análogo al átomo de hidrógeno conocido como
positronio. Dado que, a diferencia de lo que sucede con el hidrógeno, las dos
partı́culas tienen misma masa, la masa reducida del sistema es µ = me /2
y los niveles de energı́a estan a la mitad que los del hidrógeno (es decir
En ' −6.8 eV/n2 ). Una vez formado, el positronio puede adquirir una con-
figuración de momento angular nulo y decaer en dos fotones de 0.511 MeV.
También es posible el decaimiento en tres fotones, e+ e− → γγγ, cuyas ener-
gı́as son (en promedio) menores a 0.511 MeV, pero pueden tomar cualquier
valor. Este tipo de decaimiento se manifiesta en la emisión, observada por
OSSE en el centro de la Galaxia, de un continuo a energı́as menores a la
de la lı́nea de aniquilación. La detección de este continuo de positronio es
evidencia de la presencia de e+ e− lentos en el centrode la Galaxia.

4.7.3. Reacciones de un vértice


Reacciones en campos magnéticos y electrostáticos
La reacciones de un vértice,

e− → γe− , γ → e− e+ , e+ e− → γ,

no pueden ocurrir espóntaneamente, pero si en presencia de un campo


magnético o electrostático que absorba momento o energı́a. En ambos casos
la sección eficaz es de orden αre2 , donde α = e2 /h̄c ' 1/137 es la constante
de estructura fina.
La reacción e− → γe− en un campo magnético corresponde a la emisión
sincrotrón. El otro canal importante de esta reacción es la producción de
pares en un campo magnético, que debe satisfacer una condición equivalente
a E1 E2 > 2 2
∼ (mc ) . Considerando la energı́a de campo magnético, uB =
2
B /8π, dentro de una celda de espacio fase escribimos

E1 B
    
E1 αB 2 λ3c > 2 2
∼ (mc ) ⇒ x≡ >
∼ 1.
mc2 Bc

donde Bc ≡ m2 c3 /eh̄ ' 4 × 1013 Gauss. Una reacción de tres vértices rele-
vante en la vecindad de estrellas de neutrones con B ∼ Bc es el “photon
splitting”, γ → γγ.
La reacción e− → γe− en presencia de un campo electrostático corres-
ponde al bremsstrahlung. La consideracón para el canal de producción de
un par e− e+ en la vecindad de un núcleo cargada viene dada en términos

52
del parámetro de impacto y la carga del núcleo,
Ze2
∼ mc2 ⇒ σ ∼ αb2 ∼ αZ 2 re2 .
b
La cálculo de la sección eficaz para la producción de pares γ → e− e+ da
28 2h̄ω 109
   
σ = α Z 2 re2 log − para h̄ω/mc2  1 .
9 mc2 42

Cascadas electromagnéticas; radiación Čerenkov


Un fotón de alta energı́a en presencia de un campo magnético, elec-
trostático o de radiación puede producir un par, γ → e+ e− . Estos a su vez
pueden interaccionar con el mismo campo, e± → γe± , y producir mas foto-
nes de alta energı́a. El proceso puede entonces multiplicarse dando lugar a
lo que se conoce como una cascada electromagnética. Se cree que son comu-
nes en entornos astrofı́sicos como la magnetósfera de los pulsares. Han sido
detectadas en la atmósfera terrestre y son el principio tras el cual funcionan
los telescopio Čerenkov para detección de rayos γ con energı́as < 12
∼ 10 eV.
Al penetrar la atmósfera, el camino libre medio para que un fotón de
alta energı́a produzca un par es de ∼ 37g cm−2 . Una vez producidos, los
electrones producen fotones por bremsstrahlung tras atravesar una densi-
dad de columna similar. La atmósfera terrestre corresponde a 1033 g cm−2 ,
es decir a 26 caminos libres medios. La cascada electromagnética se detiene
cuando los fotones empiezan a sufrir dispersión Compton en vez de produ-
cir pares (Eγ < ∼ 10MeV) y los electrones empiezan a interaccionar con los
núcleos por ionización en vez de bremsstrahlung (Ee < ∼ 80MeV). Para un
fotón primario de 1 TeV la cascada tiene unas 14 generaciones, generando
partı́culas hasta unos 5000 metros de altura. Estas cascadas pueden ser de-
tectadas directamente mediante arreglos de detectores de partı́culas o por la
radiación Čerenkov emitida por los electrones de alta energı́a. La radiación
Čerenkovse da cuando una partı́cula cargada se mueve a velocidad mayor
que la de la luz en un medio, v ≥ c/n, siendo n el ı́ndice de refracción del
medio. La emisión, producida por el cambio en la orientación de los mo-
mentos dipolares de las moléculas del medio, se radı́a con una potencia por
unidad de longitud dada por:
2πe2 ν 1
 
Iν = 1− 2 . (4.144)
c2 β n(ν)
La emisión es altamente anisotrópica, restringida a un cono de apertura
cos ψ ≈ 1/βn. A primer orden (βn  1) el espectro es ∝ ν, siendo la

53
Figura 4.18: Ilustración de
una cascada electromagnéti-
ca, con los fotones en azul y
los e± en rojo. El desarrollo
de la cascada es el que corres-
ponde a la sección eficaz de
cada proceso, ignorando las
fluctuaciones inherentes a la
cascada.

emisión mas intensa hacia el azul y el ultravioleta. El ı́ndice de refrac-


ción del aire decrece en forma aproximadamente monotónica entre el rojo,
n(7000Å) ≈ 1 + 2.7 × 10−4 , y el ultravioleta, n(3000Å) ≈ 1 + 3.2 × 10−4 . El
umbral para la emisión Čerenkov en la atmósfera es del orden de 22 MeV.
La emisión Čerenkov de una cascada dura unos 10 ns y se extiende en un
cono con una apertura de unos 100 metros de base.

(Rybicki §3.4 y cap. 7; Longair cap. 4; Berestetskii)

54
Capı́tulo 5

Teorı́a Cuántica de Procesos


Radiativos
Versión 12 de diciembre de 2016

5.1. El formalismo Hamiltoniano de la mecánica


clásica
5.1.1. Coordenadas generalizadas y ecuaciones de Hamilton
La mecánica cuántica se estructura a partir del formalismo Hamiltoniano de
la mecánica clásica, alternativo y complementario al enfoque Newtoniano
inicial1 . En la mecánica de Newton el concepto predominante es la trayecto-
ria de cada partı́cula, ~r(t), calculable a partir de la ecuación de movimiento,

d2~r
m = F~ (~r, ~r˙ , t) . (5.1)
dt2

Para resolver esta ecuación es necesario conocer la función F~ , ası́ como la


posición y velocidad de la partı́cula en un tiempo inicial t0 , las condiciones
iniciales. Con esta información es posible en principio obtener la trayecto-
ria de la partı́cula, dada por su posición en función del tiempo ~r(t); esto
es posible incluso para un conjunto de N partı́culas, por lo menos en prin-
cipio. Se considera que el estado del sistema está determinado al propor-
cionar las posiciones y velocidades de todas las partı́culas en un instante t,
{~rk (t), ~vk (t); k = 1, . . . , N }, conociendo las interacciones entre ellas.
1
Una referencia completa para este tema son los capı́tulos 1 a 8 del libro de Goldstein [2]

1
Figura 5.1: La posición de la masa del
péndulo rı́gido tiene tres coordenadas
fı́sicas (x, y, z) pero, por las constric-
ciones del punto fijo de soporte y de
la rigidez del péndulo, ` =constante,
es más conveniente su descripción en
términos de una sola coordenada ge-
neralizada, θ(t).

Las formulaciones Lagrangiana y Hamiltoniana emplean el concepto de


coordenadas generalizadas, particularmente útiles para sistemas con restric-
ciones. Cada coordenada generalizada, q, es una función de las coordenadas
fı́sicas, q = q(~r), y el número de coordenadas generalizadas corresponde con
el número de grados de libertad, el cual es igual o menor que 3N , el nḿero de
coordenadas fı́sicas. Un ejemplo simple es el del péndulo rı́gido que, restrin-
gido a moverse sobre un plano, tiene un sólo grado de libertad, de manera
que su movimiento puede ser descrito con el ángulo θ entre la vertical y el
extremo móvil. (fig. 5.1) A cada coordenada generalizada le corresponde un
momento generalizado definido a partir de la energı́a cinética del sistema,

pk = ∂Ecin /∂ q̇k . (5.2)

El estado de un sistema se especifica con el conjunto de coordenadas y


momentos generalizados, {qk , pk ; k = 1, . . . , n}, siendo n el número de grados
de libertad, con n ≤ 3N . Se define el Hamiltoniano H como la energı́a total
del sistema, cinética mas potencial, especificada en función de {qk , pk }. Las
ecuaciones de movimiento son las ecuaciones de Hamilton,
∂H ∂H
q̇k = , ṗk = − , (5.3)
∂pk ∂qk

equivalentes a (5.1).

2
5.1.2. Cuatro ejemplos clásicos
Ej.1. Partı́cula libre
El Hamiltoniano de una partı́cula libre en tres dimensiones es

p2x p2y p2y


H= + + . (5.4)
2m 2m 2m
Las ecuaciones de movimiento que resultan de las ecuaciones de Hamil-
ton (5.3) son
∂H px ∂H
ẋ = = , ṗx = − = 0, (5.5)
∂px m ∂x
y análogamente para y, z. De ahı́ p~ = constante ⇒ ~r(t) = (~p/m)t +~r(0).

Ej.2. Péndulo rı́gido


En este ejemplo, ilustrado en la figura 5.1, el número de coordenadas genera-
lizadas, uno, es inferior al de coordenadas fı́sicas, tres, dadas las suposiciones
del caso. Pasamos de las coordenadas geométricas (x, y, z) a la coordenada
generalizada θ ignorando z y realizando las transformaciones

x = ` sin θ, y = ` − ` cos θ,

donde suponemos que el péndulo se mueve en un plano y la longitud ` es


constante. Tenemos Ecin = m`2 θ̇2 /2, de donde pθ = ∂Ecin /∂ θ̇ = m`2 θ̇;
nótese que pθ corresponde fı́sicamente con el momento angular del sistema.
El Hamiltoniano queda como

p2θ
H(θ, pθ ) = + mg`(1 − cos θ) ,
2m `2
con las ecuaciones de movimiento

θ̇ = pθ /m`2 , ṗθ = −mg` sin θ .

El movimiento se aproxima al de un oscilador armónico para θ  1.

Ej.3. Oscilador armónico


El Hamiltoniano de un oscilador armónico unidimensional es
p2 1
H= + kx2 , (5.6)
2m 2

3
del cual se obtienen las ecuaciones de movimiento

ẋ = p/m, ṗ = −kx .
2
p se obtiene la ecuación del oscilador armónico, ẍ − ω x = 0,
Derivando ẋ
donde ω = k/m. La solución general es de la forma,
 
x(t) = Aeiωt + Be−iωt , p(t) = mẋ = mω Aeiωt − Be−iωt ,

con dos soluciones independientes (e±iωt ) y dos constantes de movimiento,


A y B, que deben determinarse de las condiciones iniciales, x(0), p(0).
El oscilador tridimensional se puede describir con tres ecuaciones inde-
pendientes del tipo ẍ − ωx2 x = 0 , una para cada coordenada,

p2y
! ! !
p2x 1 1 p2z 1
H= + kx x2 + + ky y 2 + + kz z 2 .
2m 2 2m 2 2m 2

La solución correspondiente es de la forma


   
~r(t) = Ax e+iωx t + Bx e−iωx t x̂ + Ay e+iωy t + By e−iωy t ŷ
 
+ Az e+iωz t + Bz e−iωz t ẑ ,

con las seis constantes determinadas de las condiciones iniciales, ~r(0) y p~(0).
En el caso particular kx = ky = kz ≡ k el problema adquiere simetrı́a esférica
y puede tratarse, tanto en el formalismo clásico como cuántico, como un caso
particular del potencial central U (r) = kr2 /2.

Ej.4. El potencial central


Un potencial central depende solamente de la distancia de la masa al origen,
U (~r) = U (r) . La descripción del potencial central es más conveniente en
coordenadas esféricas,

x = r sin θ cos φ , y = r sin θ sin φ , z = r cos θ .

Expresando la velocidad como ~r˙ = ṙr̂ + rθ̇θ̂ + r sin θφ̇φ̂ tenemos la energı́a
cinética
1 1 1
Ecin = mṙ2 + mr2 θ̇2 + mr2 sin θ2 φ̇2 ,
2 2 2
y podemos aplicar la definición (5.2) para obtener el momento generalizado,

p~ = pr r̂ + (pθ /r) θ̂ + (pφ /r sin θ) φ̂,

4
y la expresión del Hamiltoniano,
p2r p2θ p2φ
H= + + + U (r) . (5.7)
2m 2mr2 2mr2 sin2 θ
Las ecuaciones de Hamilton conducen a seis ecuaciones de movimiento,
, ṗr = p2θ /mr3 + p2φ /mr3 sin2 θ − dU/dr ,

 ṙ = pr /m

θ̇ = pθ /mr2 , ṗθ = p2φ cos θ/mr2 sin3 θ , (5.8)
φ̇ = pφ /mr2 sin2 θ

, ṗφ = 0 .

De estas es posible demostrar la conservación del momento angular2 ,


~ = ~r × p~ = −pθ φ̂ + pφ θ̂ ,
L
sin θ
a partir de la cual podemos expresar el Hamiltoniano como
p2r L2
H= + + U (r) . (5.9)
2m 2mr2
El problema puede visualizarse imponiendo la condición inicial θ = π/2 en
las ecs (5.8), que implica ṗθ = 0 y restringe el problema al plano xy. Identifi-
camos entonces a pφ con el momento angular, L ~ = pφ θ̂. La conservación del
momento angular se plasma en la segunda ley de Kepler: “áreas iguales son
barridas en tiempos iguales”, que es válida para cualquier potencial central.
La parte radial de la ecuación de movimiento,
L2 1 dU
r̈ = 2 3
− , (5.10)
m r m dr
se resuelve conciendo el potencial U (r). Ejemplos relevantes son la partı́cula
libre (U = 0), el oscilador armónico tridimensional (U (r) = kr2 /2), y el
problema de Kepler (U (r) = −GM m/r).
Considerando el problema de Kepler para definir el potencial efectivo a
partir de la expresión (5.9),
L2 GM m
Uef f (r) =2
− . (5.11)
2mr r
que se muestra en la figura 5.2 para tres valores de L, podemos visualizar el
movimiento de la masa m. El potencial efectivo es positivo para radios muy
pequeños, pasa a ser negativo y tiene un valor mı́nimo
min 2 2 3 2
Uef f = −G M m /2L = −GM m/2r0 en r0 = L2 /GM m2 ,
2
la demostración es un poco embrollada, pero se obtiene considerando las derivadas de
los vectores unitarios θ̂ y φ̂

5
Figura 5.2: Potencial efectivo para el problema de Kepler, tomando GM =
1, m = 1 y considerando L = 0.5, 1.0, 1.5, en colores azul, verde y rojo,
respectivamente.

tendiendo a cero para r → ∞. En la gráfica se puede apreciar que para


E = Uef min , el radio sólo puede tener el valor r = r , correspondiendo a
f 0
min
órbitas circulares; si Uef f < E < 0, el valor de r está acotado entre dos
valores, rmin ≤ r ≤ rmax , que corresponden con el periastro y apoastro de
una órbita elı́ptica; si E = 0 tenemos una órbita parabólica con distancia
mı́nima rmin = r0 /2; y si E > 0, tenemos una trayectoria hiperbólica. La
dependencia de r con el tiempo es una función descrita de forma paramétrica.

5.2. Elementos de mecánica cuántica


5.2.1. Los postulados de la mecánica cuántica
Podemos formular la mecánica cuántica a partir de los siguientes postulados
fundamentales:

1. el estado de un sistema fı́sico está plenamente definido por la fun-


ción de onda ψ, la cual contiene todas la información dinámica del
sistema. Esta función puede expresarse en términos de coordenadas,
ψ = ψ(~r, t), o del momento ψ = ψ(~ p, t).

6
Una propiedad importante de esta función en el caso de una partı́cula
puntual, es que su norma representa la probabilidad de hallar a la
partı́cula en una región dada,
Z b
Prob(a ≤ x ≤ b)(t) = |ψ(x, t)|2 dx . (5.12)
a

Para satisfacer que la probabilidad sobre todo el espacio sea uno, la


función de debe ser normalizable.

2. Toda variable fı́sica observable se representa por un operador que actúa


sobre cualquier función de onda modificándola,

Oψ(~
e r , t) = ϕ(~
r, t) , Oψ(~
e p, t) = ϕ(~
p, t) .

A la variable dinámica O se le asocia el operador O.


e Ejemplos de
operadores son los de coordenadas, como x, y momentos, como px ,

x
e φ(~
r, t) = x φ(~r, t), pex φ(~
p, t) = px φ(~
p, t).

Se puede construir otros operadores a partir de ellos: por ejemplo, los


operadores vectoriales de posición, ~er, momento e
p~; y el de momento
~
angular L = ~r × p~. El “sombrero” denota operador; más adelante se
e e e g
supondrá implı́cito y lo omitiremos.

3. El resultado de la observación de una variable dinámica O


e queda ex-
presado en términos de su valor medio, definido como
Z
hOi ≡ hφ|O|φi = φ∗ (~r, t)Oφ(~
e r , t)d3 r,

q
y de su “incertidumbre”, ∆O ≡ hO2 i − hOi2 .

4. Se define el conmutador de dos operadores Ae y B


e como el operador

[A, e ≡A
e B] eBe −B
eAe.

El cuarto postulado establece que los operadores de posición y mo-


mento de una misma coordenada no conmutan:

[x
ei , pej ] = ih̄ δij ⇒ [x
e, p
fx ] = [ye, p
fy ] = [ze, p
fz ] = ih̄ , (5.13)

siendo nulos los conmutadores entre coordenadas y momentos per-


pendiculares. Este postulado contiene implı́citamente al principio de
incertidumbre.

7
Las descripciones en términos de coordenadas o momentos son alternativas y
complementarias: se dice que se sigue la representación de coordenadas, ψ =
ψ(~r, t), o la representación de momentos, ψ = ψ(~ p, t). El cuarto postulado
se satisface definiendo los operadores de posición y momento como

~er ψ(~r, t) = p~ ψ(~r, t) = −ih̄ ∇ψ(~r, t),


~r ψ(~r, t),
e (5.14)
e p, t) = ih̄ ∇p ψ(~
~r ψ(~ p, t), p~ ψ(~
e p, t) = p~ ψ(~
p, t) , (5.15)

donde ∇p indica derivación con respecto a p~. Conociendo el estado de un


sistema a través de su función de onda, es posible calcular el valor e incerti-
dumbre de cualquier variable fı́sica. El último ingrediente es la receta para
calcular la función de onda de un sistema. Esto se hace a partir del postula-
do dinámico, el cual asegura la congruencia entre la mecánica cuántica y la
mecánica clásica:

5. A todo sistema fı́sico se le asocia un operador H tal que la función de


onda ψ cumple la ecuación:
∂ψ
Hψ = ih̄ . (5.16)
∂t

Esta ecuación debe cumplirse tanto en la representación de coordenadas


como en la de momentos. El operador H es el operador Hamiltoniano y tiene
la misma estructura que en mecánica clásica, la suma de las energı́as cinética
y potencial, H = p2 /2m+U. En particular, la ecuación de Schrödinger (5.16)
adquiere, en la representación de coordenadas, donde p~ = −ih̄∇, la forma:

h̄2 2 ∂ψ(~r, t)
− ∇ ψ(~r, t) + U (~r, t)ψ(~r, t) = ih̄ . (5.17)
2m ∂t

5.2.2. Estados estacionarios


Cuando el Hamiltoniano no depende explı́citamente del tiempo, en particular
si el potencial U es independiente de t, es posible obviar la dependencia
temporal en la ecuación de Schrödinger introduciendo estados estacionarios.
Si escribimos la función de onda como ψ(t) = ϕ e−iEt/h̄ , la ecuación de
Schrödinger (5.16) adquiere la forma:

Hϕ = E ϕ . (5.18)

La función ϕ es una función propia, o eigenfunción, del Hamiltoniano y


representa un estado estacionario del sistema. La expresión (5.18) es la forma

8
estacionaria de la ecuación de Schrödinger. En general, hay una familia de
funciones ϕn que satisfacen la ecuación de Schrödinger,

Hϕn = En ϕn , (5.19)

cada una asociada a una energı́a particular En . Es posible tener varios esta-
dos estacionarios con una misma energı́a, en cuyo caso hablamos de estados
degenerados. En general, la ecuación de Schrödinger dependiente del tiempo
(5.16), tiene como solución

ak ϕk (~r)e−iEk t/h̄ ,
X
ψ(~r, t) = (5.20)
k

siendo las funciones ϕk linealmente independientes; los coeficientes ak , que


son independientes del tiempo, pueden ser determinados de las condiciones
iniciales ψ(~r, 0). La normalización |ψ|2 se traduce en |ak |2 = 1. Asimismo,
P

la energı́a del sistema está dada3 por < ψ|H|ψ >= |ak |2 Ek .
P

5.2.3. Sistemas cuánticos básicos


Partı́cula libre - en una dimensión
La ecuación estacionaria de Schrödinger de la partı́cula libre (U = 0), en
una dimensión y bajo la representación de coordenadas, es

h̄2 d2 ϕ(x)
− = E ϕ(x) , (5.21)
2m dx2
de la forma ϕ00 +k 2 ϕ = 0, con k 2 = 2mE/h̄. Tiene dos soluciones linealmente
independientes, dadas por los dos posibles signos de k,

ϕ(x) = Aeikx + Be−ikx , (5.22)

con las constantes A y B determinadas a partir de las (dos) condiciones


iniciales, necesarias para resolver la ecuación de segundo grado. Nótese que
esta solución no es normalizable; la solución más general es de la forma
Z +∞
1
ϕ(x) = √ A(k)eikx dk , (5.23)
2π −∞

donde el factor (2π)−1/2 asegura que ϕ(x) tiene la misma norma que la
función A(k): la normalización de ϕ(x) requiere la de A(k).
3
empleando la notanción de bra (|ψ >) y kets (< ψ|).

9
En la representación de momentos la ecuación (5.21) tiene la forma,
" #
p2
− E ϕ(p) = 0 , (5.24)
2m

se satisface automáticamente para E = p2 /2m, la relación clásica entre


energı́a cinética y momento, y ϕ(p) una función arbitraria, pero normaliza-
da, de manera a poder medir hpi y su incertidumbre ∆p. La relación con la
solución en la representación de coordenadas (ec 5.23) es inmediata. Gene-
ralizando a tres dimensiones, y usando p~ = h̄~k, tenemos
1 1
Z Z
p·~
ϕ(~x) = ϕ(~
p)e i~ x/h̄ 3
d p ⇔ ϕ(~
p) = ϕ(~x)e−i~p·~x/h̄ d3 x .
(2πh̄)3/2 (2πh̄)3/2
(5.25)
Estas relaciones no se restringen al caso de partı́cula libre: las funciones de
onda de las representaciones de coordenadas y momentos se relacionan entre
sı́ a través de la transformada de Fourier.

Oscilador armónico en una dimensión


La relevancia del oscilador armónico radica en gran medida por la forma
cuadrática del desarrollo de un potencial arbitrario alrededor de un punto
de equilibrio:
" #
dU 1 d2 U
 
U (x) = U (x0 ) + (x − x0 ) + (x − x0 )2 + . . . , (5.26)
dx 0 2 dx2 0

con el término en dU/dx nulo en un punto de equilibrio, definido por un


mı́nimo de U (x). El potencial del oscilador armónico es cuadrático y pue-
de expresarse como U = mω 2 x2 /2. La forma genérica de la ecuación de
Schrödinger para el oscilador armónico unidimensional es,

h̄2 d2 ϕ 1
− + mω 2 x2 ϕ = E ϕ . (5.27)
2m dx2 2
Dado que el Hamiltoniano del oscilador tiene la misma dependencia cuadráti-
ca en p que en x, las soluciones en ambas representaciones provienen de la
misma familia de funciones. Sabiendo que la Gaussiana tiene la propiedad de
que su transformada de Fourier es otra Gaussiana, se propone una solución
de la forma ϕ(x) = A exp(−α x2 /2): esta satisface la ecuación de Schrödin-
ger si α = mω/h̄, y E = h̄ω/2; su normalización implica A = (mω/πh̄)1/4 .

10
Yendo un paso más adelante, se puede proponer como solución general
una familia de funciones ϕn (x) = An (α1/2 x) exp(−α x2 /2), siendo An un po-
linomio de grado n, para mostrar que existe un conjunto infinito numerable
de soluciones al oscilador armónico,
1
 
Hϕn = En ϕn con En = n + h̄ω. (5.28)
2
Las funciones de onda son el producto de un polinomio por la Gaussiana,
1/4 r
1 mω mω
 
2
ϕn (x) = √ Hn x e−mωx /2h̄ , (5.29)
2n n! πh̄ h̄

siendo Hn el polinomio de Hermite de grado n,


2
n z2 dn (e−z )
Hn (z) = (−1) e . (5.30)
dz n
Los primeros polinomios de Hermite son,

H0 (z) = 1 , H1 (z) = 2z , H2 (z) = 4z 2 − 2 , H3 (z) = 8z 3 − 12z , . . . (5.31)

Las primeras soluciones al oscilador armónico se muestran en la figura 5.3.


Una formulación alternativa y útil del oscilador armónico la proporcionan
los operadores de ascenso y descenso, a y a† , definidos por4
1 1
a = √ (X + iP ) , a† = √ (X − iP ) , (5.32)
2 2

donde X = (mω/h̄)1/2 x y P = p/(mh̄ω)1/2 son los operadores adimensio-


nales de posición y momento, de manera que:
1 2 1 2
 
Hϕ = h̄ω P + X ϕ = Eϕ . (5.33)
2 2

El Hamiltoniano se puede escribir directamente como H = (a a† − 1/2).


Parte de la utilidad de los operadores de ascenso y descenso radica en la
propiedad:
a† ϕn = (n + 1)1/2 ϕn+1 , a ϕn = n1/2 ϕn−1 , (5.34)
que facilita el álgebra de operadores en osciladores armónicos.
4
a partir de este punto omitiré la notación con tilde para los operadores, bajo el prin-
cipio de que a toda variable fı́sica le corresponde un operador.

11
Figura 5.3: Soluciones del oscilador armónico para n = 0, en azul; n = 1, en
verde; n = 2 en rojo; n = 3 en azul claro. Las gráficas tienen misma escala,
pero con un desplazamiento vertical para mostrarlas juntas.

Potencial central: problema cuántico


La ecuación de Schrödinger para el potencial central se puede escribir como,
" #
p2r L2
+ + U (r) ϕ(r, θ, φ) = E ϕ(r, θ, φ) , (5.35)
2m 2mr2

donde el operador de momento angular, L ~ = ~r × p~, tiene propiedades rele-


~
vantes. Por un lado, las componentes de L no conmutan entre sı́,

[Lx , Ly ] = ih̄Lz [Ly , Lz ] = ih̄Lx [Lz , Lx ] = ih̄Ly , (5.36)

mientras que L2 sı́ conmuta con sus componentes, en particular [L2 , Lz ] = 0.


Esto significa que no es posible medir simultáneamente todas las componen-
tes del momento angular, pero sı́ podemos especificar el valor de L2 y de una
de las componentes, como Lz . Expresados en coordenadas esféricas, estos dos
operadores tienen la forma,
!
2 2 ∂2 1 ∂ 1 ∂2 h̄ ∂
L = −h̄ + + , Lz = , (5.37)
∂θ2 tan θ ∂θ sin2 θ ∂φ2 i ∂φ

12
y la ecuación de Schrödinger queda como,
( )
h̄2 1 ∂ 2 h̄2 1 ∂ ∂ϕ 1 ∂2ϕ
 
− (rϕ)− sin θ+ +U (r)ϕ = E ϕ .
2m r ∂r2 2mr2 sin θ ∂θ ∂θsin2 θ ∂φ2
(5.38)
La parte angular puede resolverse para el caso general mediante el método
de separación de variables, sin requerir conocer el potencial,

ϕn`m (r, θ, φ) = Rn` (r) Y`m (θ, φ) , (5.39)

donde Y`m (θ, φ) son los armónicos esféricos, que satisfacen las ecuaciones de
valores propios

L2 Y`m (θ, φ) = `(` + 1)h̄2 Y`m (θ, φ) , Lz Y`m (θ, φ) = mh̄Y`m (θ, φ) , (5.40)

con ` = 0, 1, . . . ; m = −`, . . . , 0, . . . , +`. Los armónicos esféricos son funcio-


nes normalizables sobre ángulo sólido dadas por
r
(2`+1) (`−m)! m
Y`m (θ, φ) = (−1)m 4π (`+m)! P` (cos θ)e
imφ si (m ≥ 0) ,
r
(2`+1) (`+m)! −m
Y`m (θ, φ) = 4π (`−m)! P` (cos θ)eimφ si (m < 0) . (5.41)

P`m son funciones de Legrendre asociadas. Se muestran los primeros armóni-


cos esféricos en la tabla 5.1.

Y`m (θ, φ) m=0



`=0 1/ 4π m = ±1

∓ 3/8π sin θ e±iφ


p p
`=1 3/4π cos θ m = ±2

q q q
5
3 cos2 θ − 1 15
sin θ cos θ e±iφ 15
sin2 θ e±2iφ

`=2 16π ∓ 8π 32π

Cuadro 5.1: Armónicos esféricos para ` = 0, 1, 2.

13
Dada la solución para la parte angular, al especificar el potencial U (r)
se tiene la ecuación radial para Rn` (r):
( )
h̄2 1 d dRn` `(` + 1)h̄2
 
− 2
r2 + + U (r) Rn` = E Rn` ; (5.42)
2m r dr dr 2mr2

los valores propios de la energı́a son de la forma En` .

5.2.4. Métodos aproximados para resolver la ecuación de


Schrödinger
En general no es posible encontrar la solución exacta a la ecuación de
Schrödinger y es necesario emplear métodos para estimar la función de onda
o por lo menos los valores de la energı́a, en particular la del estado base.

Método variacional
El método variacional permite obtener aproximaciones a la energı́a del es-
tado base de sistemas para los cuales se desconoce la función de onda. Las
soluciones a la ecuación de Schrödinger para un potencial dado

Hϕj = Ej ϕj , j = 0, . . . (5.43)

son linealmente independientes, < ϕi |ϕj >= δij , formando una base de
manera que cualquier función arbitraria Φ puede escribirse como una com-
binación lineal de las funciones ϕj ,

X
Φ= cj ϕj , (5.44)
j=0

|cj |2 = 1
P
con los coeficientes unı́vocamente determinados y cumpliendo
para Φ normalizada. El método variacional consiste en calcular

c∗j hϕj |H|ϕk i ck c∗j ck Ek hϕj |ϕk i =


X X X
hΦ|H|Φi = |c2j | Ej , (5.45)
j,k j,k j

donde hΦ|H|Φi ≥ E0 , ya que cualquier promedio de valores de Ej es nece-


sariamente mayor o igual que el valor mı́nimo. Qué tan buena aproximación
es hΦ|H|Φi de E0 depende de que tan bien se selecciona la funcion Φ, es
decir de que tan cercano esté |c0 |2 de 1. La estrategia común consiste en
seleccionar una función Φ con un parámetro libre, α, y minimizar el valor
de hΦ(α)|H|Φ(α)i. La exactitud del método recae entonces en seleccionar
adecuadamente la forma funcional de Φ.

14
Método de perturbaciones independientes del tiempo
El método de perturbaciones es una herramienta aplicada históricamente
al cálculo de órbitas planetarias por Laplace en el siglo XIX. Este método
se usa para obtener soluciones aproximadas de la ecuación estacionaria de
Schrödinger, Hϕ = Eϕ, cuando el Hamiltoniano puede separarse en un
término soluble, H(0) , y un término perturbativo, H(1) , cuando los valores
propios de las soluciones correspondientes satisfacen E (1)  E (0) . El método
provee términos correctivos para las energı́as y las funciones de onda.
Se considera un Hamiltoniano H = H(0) + H(1) , con funciones propias
(0) (1) (0) (1)
ϕk = ϕk + ϕk , y valores propios Ek = Ek + Ek , donde conocemos
(0) (0) (0) (0)
la familia de soluciones {ϕk ; Ek } de H(0) ϕk = E (0) ϕk . La ecuación
de Schrödinger se desarrolla en cuatro términos, donde podemos eliminar
(0) (0) (0)
H(0) ϕk = Ek ϕk , para obtener
(1) (0) (1) (0) (1) (1) (0) (1) (1)
H(0) ϕk + H(1) ϕk + H(1) ϕk = Ek ϕk + Ek ϕk + Ek ϕk . (5.46)
(0)
Las funciones {ϕk } forman una base que permite desarrollar las funciones
(1)
perturbativas {ϕk }, E X E
(1) (0)
ϕk = ck` ϕ` , (5.47)
`

empleando la notación de bra-kets y con los coeficientes |ck` |  1. Al des-


(1) (1) (1) (1)
D los términos H ϕk y Ek ϕk en la expansión (5.46), y multiplicar
preciar
(0)
por ϕk , obtenemos
D E D E D E
(0) X (0) (0) (0) (0) X (0) (0) (1)
ϕk ck` H(0) ϕ` + ϕk H(1) ϕ` ' ϕk ck` Ek ϕ` +Ek .
` `
(5.48)
Desaparecen los términos en sumatoria y obtenemos la primera corrección
a los niveles de energı́a,
D E
(1) (0) (0)
Ek ' ϕk |H(1) |ϕk . (5.49)
D
(0)
Multiplicando (5.46) por ϕj , con j 6= k, e integrando, obtenemos los
coeficientes ck` que dan la correción a la función de onda
D E
(0) (0)
D
(0) (1)
E ϕk |H(1) |ϕj D
(0) (1)
E
cjk = ϕj |ϕk ' (0) (0)
, ckk = ϕk |ϕk ' 0. (5.50)
Ej − Ek

15
5.3. Estructura de átomos y moléculas
5.3.1. Átomos hidrogenoides
El estudio de los átomos hidrogenoides es una de las aplicaciones más im-
portantes del potencial central, dado por la atracción Coulombiana entre un
núcleo de carga Ze y un electrón de carga −e:

Ze2
U (r) = − . (5.51)
r
La solución a la ecuación (5.42) es una familia infinita y numerable de fun-
ciones Rn` (r) que corresponden a una energı́a
! ! !
me4 Z Ze2 1 mc2 1
En = − = − = − α2 Z , (5.52)
2h̄2 n2 2a0 n2 2 n2

con a0 = h̄2 /me2 ' 5.292 × 10−9 cm el radio de Bohr, α = e2 /h̄c ' 1/137 la
constante de estructura fina, y la masa m es la masa reducida del sistema,
m = me mn /(me + mn ), para un núcleo de masa mn . Los números (n, `)
tienen valores enteros positivos. En este caso, la energı́a es independiente de
`, por lo que existen varias funciones de onda para una energı́a dada, es decir
una degeneración de estados. La función de onda completa es de la forma,

ϕn`m (~r) = Rn` (r)Y`m (θ, φ)χms , (5.53)

con degeneración gn = 2n2 , determinada por los valores que pueden adquirir
los números cuánticos de momento angular, {`, m}, donde |m| ≤ ` < n, y los
dos valores posibles del número cuántico de espı́n, ms = ±1/2. Las funciones
Rn` (r) se relacionan con los polinomios de Laguerre
s 3 `
2 (n − ` − 1)! 2r

Rn` (r) = − e−r/naz Ln+`
2`+1
(2r/naz ) , (5.54)
naz [(n + `)!]3 naz

donde az = a0 /Z, y Lqp (x) son los polinomios generalizados de Laguerre, que
se calculan a través de los polinomios ordinarios de Laguerre, Lp (r),
dq Lp dp
Lqp (x) = Lp (x) = ex xp e−x ,

(x) , (5.55)
dxq dx p

o directamente de la expresión,

p! dp−q
Lqp (x) = (−1)q ex x−q p−q e−x xp .

(5.56)
(p − q)! dx

16
E=0 n→∞ La parte radial de las funciones de onda
de los primeros niveles de sistemas hidro-
E = −0.85 eV n=4 genoides son,
E = −1.51 eV n=3
R1,0 = 2 a−3/2
z e−r/az ,
r
 
R2,0 = 2 (2az )−3/2 e−r/2az ,
1−
E = −3.40 eV n=2 2az
1 r
 
R2,1 = 2 (2az )−3/2 √ e−r/2az .
3 2az
De interés particular para la espectros-
copı́a es la estructura de los niveles de
energı́a de los átomos hidrogenoides. Pa-
ra un electrón alrededor de un núcleo de
masa infinita, las dimensiones están es-
tablecidas por la constante de Rydberg,

1 me e4
R∞ = ' 10 973 731.568 549 m−1 ,
hc 2h̄2
la escala de energı́as,

R∞ hc ' 13.605 691 72 eV ,

y de longitudes de onda,
E = −13.60 eV n=1
1
' 911.267 050 550Å .
Niveles de energı́a R∞
átomo hidrogenoide.

Para un átomo hidrogenoide con núcleo de carga Z y masa M , las lı́neas


correspondientes tienen longitudes de onda
!
1 + me /M n22 n21
 
λn2 →n1 = .
Z 2 R∞ n22 − n21

Algunos sistemas hidrogenoides:

El hidrógeno, siendo el elemento más abundante en el Universo, es de


interés fundamental en astronomı́a. El número de carga es Z = 1. El
isótopo principal está formado por un electrón y un protón, es decir
m/me = 1/(1 + me /mp ) ' 1 + 1/1836.153. El estado base está a

17
una energı́a E1 = −R∞ hc/(1 + mp /me ) ' −13.598 296 eV, y puede
ser ionizado por fotones de longitud de onda λ1→∞ ' 911.763 342 Å.
Las principales series espectroscópicas del hidrógeno están dadas por
transiciones a distintos niveles:

• Serie de Lyman: transiciones al nivel base, n1 → n2 = 1. Las


lı́neas de cada serie se distinguen con letras griegas: la prime-
ra es Lyα (2 → 1) con λ = 1215.684Å; las siguientes son Lyβ
(3 → 1), Lyγ (4 → 1), etc. . . Todas estas lı́neas caen en el rango
ultravioleta y son observables sólo desde el espacio.
• Serie de Balmer: transiciones de tipo n1 → 2. Al caer en el visible,
y ultravioleta cercano, la serie de Balmer ha sido de importancia
histórica para el desarrollo de la astronomı́a. Las lı́neas principa-
les son Hα (3→2), Hβ (4→2), Hγ (5→2), etc. . . Las longitudes
de onda respectivas se muestran en la Tabla 5.2. Todas son de-
tectables desde la Tierra.
• Series de Paschen (n1 → 3), Brackett (n1 → 4), Pfund (n1 → 5):
estas caen en el cercano infrarrojo.
• Lı́neas de recombinación: en radio es posible observar lı́neas de-
bidas a transiciones entre niveles altos, o a la recombinación des-
de niveles n2 muy altos. Un ejemplo muy estudiado es la lı́nea
110 → 109, denominada 109α, con una frecuencia de 5.009 GHz.

El deuterio es el isótopo de hidrógeno formado por un núcleo cons-


tituido por un protón y un neutrón (Z = 1, A = 2); tiene una masa
de 2.013 553 umas ≈ 3, 670.482 955 me . El deuterio es destruido en
el interior de las estrellas, por lo que el observado en el medio inter-
estelar e intergaláctico es de origen primigenio. El estado base está a
−13.609 340 eV ⇒ λ1→∞ ' 911.515 320 Å. Las lı́neas están ligeramen-
te desplazadas hacia el azul con respecto a las del hidrógeno, siendo la
diferencia en Hα de 1.78 Å. Esta diferencia es en principio distinguible
espectroscópicamente, aunque el ensanchamiento de las lı́neas dificulta
esta medición.

El helio ionizado (HeII) observado en el medio interestelar e in-


tergaláctico es mayormente de origen primigenio, aunque también es
producto de la nucleosı́ntesis estelar. El núcleo es Z = 2, A = 4, con
masa 7294.3 veces la del electrón. El estado base tiene una energı́a
E1 ' 54.415 eV y λ1→∞ ' 227.848 Å.

18
El FeXXVI es un núcleo de relevancia en rayos X, siendo que la serie
de Lyman cae en ∆E21 ' 6.38 keV. Nótese que para núcleos altamente
ionizados, con un deficit A de electrones, el estado base está a una
energı́a E1 ≈ 13.6 A2 eV.

El positronio es un sistema ligado exótico de corta vida formado


por un electrón y un positrón. Ha sido detectado por un continuo que
precede a la lı́nea de aniquilación de 0.511 MeV en rayos γ. Tiene Z = 1
y m = me /2. Si su abundancia fuera suficiente, podrı́a ser posible
observar transiciones de la serie de Balmer en el cercano infrarrojo.

Las series espectroscópicas relevantes se muestran en la tabla 5.2.

5.3.2. Estructura fina e hiperfina


Espı́n y momento angular
El electrón posee un momento angular intrı́nseco, S, ~ denominado espı́n, de
~
valor |S| = h̄/2. Existen dos estados para el espı́n, descritos por el número
cuántico ms = ±1/2. El espı́n aparece de manera natural en el tratamiento
relativista de la mecánica cuántica, basado en la ecuación de Dirac. En el
caso no relativista, basta tratar el espı́n añadiendo el número cuántico ms a
cada estado, duplicando ası́ el número de estados por cada electrón del sis-
tema, el cual debe ser especificado con cuatro números cuánticos {n`mms }.
La presencia del espı́n tiene consecuencias importantes en la estructura
de los átomos con más de un electrón. El espı́n actúa como un momento
dipolar magnético,
~ s = −(e/mc)S
µ ~, (5.57)
dando lugar a una contribución al Hamiltoniano en presencia de campos
magnéticos externos, ∆H = −~ ~ el llamado efecto Zeeman. El acopla-
µs · B,
miento espı́n-órbita es otra consecuencia que se mencionan a continuación.

Estructura fina del átomo de hidrógeno


La ecuación de Schrödinger es congruente con el Hamiltoniano clásico; y no
con una solución relativista. Por tanto, la descripción del átomo de hidrógeno
mediante la ecuación de Schrödinger es incompleta. El cálculo relativista se
hace resolviendo la ecuación de Dirac. Las principales correcciones a los
niveles de energı́a se obtienen mediante el método de perturbaciones.

19
Cuadro 5.2: Series espectroscópicas de algunos sistemas hidrogenoides

Serie de Lyman (λ/Å)


Transición Lyα Lyβ Lyγ Lyδ Ly
2→1 3→1 4→1 5→1 6→1
Hidrógeno 1215.684 1025.734 972.548 949.753 937.814
Deuterio 1215.354 1025.455 972.283 949.495 937.559
He+ 303.8 256.3 243.0 237.3 234.4
Li++ 135.0 113.9 108.0 105.479 104.187
Positronio 2430.0 2050.4 1944.0 1898.5 1874.6
Serie de Balmer (λ/Å)
Transición Hα Hβ Hγ Hδ H
3→2 4→2 5→2 6→2 7→2
Hidrógeno 6564.696 4862.738 4341.730 4102.935 3971.236
Deuterio 6562.910 4861.415 4340.549 4101.819 3970.156
He+ 1640.5 1215.2 1085.0 1025.3 992.4
Li++ 729.1 540.1 482.2 455.7 441.0
Positronio 13122.2 9720.2 8678.7 8201.4 7938.1
Serie de Paschen (λ/µm)
Transición α β γ δ
4→3 5→3 6→3 7→3
Hidrógeno 1.8756 1.2821 1.0941 1.0052
Deuterio 1.8751 1.2818 1.0938 1.0049
He+ 0.3204 0.2734 0.2512
Serie de Brackett (λ/µm)
Transición α β γ δ
5→4 6→4 7→4 8→4
Hidrógeno 4.0522 2.6258 2.1661 1.9450 1.8179
Deuterio 4.0511 2.6251 2.1655 1.9445 1.8174
He+ 0.6562 0.5413 0.4860 0.4542
Serie de Pfund (λ/µm)
6→ 5 7→ 5 8→ 5 9→ 5
Hidrógeno 7.4598 4.6537 3.7405 3.2970

20
La corección relativista al momento del electrón es de orden p/mc ∼
αZ 1/2 ' Z 1/2 /137, pequeña para valores comunes de Z; puede descri-
birse mediante una expansión en términos de orden p/mc,

p2 3p4
Ecin = (γ − 1)mc2 ≈ − + ... , (5.58)
2m 8m3 c2
siendo la primera corrección igual a −3p4 /8m3 c2 . El cálculo de per-
turbaciones da
* +
3p4 E1z 2n 3
 
∆Erel = n`m − 3 2 n`m = α2 2 − . (5.59)

8m c 2n ` + 1/2 2

donde E1z ' −13.6 eV · Z es el potencial de ionización para un átomo


hidrogenoide de carga Ze.

El acoplamiento espı́n-órbita: desde el punto de vista del electrón,


el protón en movimiento induce un campo magnético:
~
~ = eL ,
B (5.60)
mcr3
que se acopla con el momento magnético del electrón, aportando una
contribución a la energı́a del sistema con un término ∆E = −~ ~
µs · B;
esta es mı́nima cuando el electrón se alı́nea paralelamente al campo
magnético.
La contribución a los niveles de energı́a está dada por (ecs. 5.57 y 5.60):

~ ·S
~
* +
e2 L
∆Eeo = n`mms − 2 2 3 n`mms ,

m c r
E1z j(j + 1) − `(` + 1) − 3/4
 
= α2 , (5.61)
2n3 `(` + 1/2)(` + 1)

donde el momento angular total del sistema, J~ = L ~ + S,


~ tiene aso-
ciado el número cuántico j = ` + ms = ` ± 1/2, el signo indicando la
~ y S.
orientación relativa entre L ~ Tenemos:

E1z 2n 3
 
2
∆Erel + ∆Eeo =α − . (5.62)
2n2 j + 1/2 2
Existe una degeneración en j con el número cuántico ms : por ejemplo,
el nivel 2S1/2 (n = 2, ` = 0, ms = +1/2 ⇒ j = 1/2) tiene misma
energı́a que el nivel 2P1/2 (n = 2, ` = 1, ms = −1/2 ⇒ j = 1/2).

21
El desplazamiento de Lamb es la corección radiativa debida a la
cuantización del campo electromagnético, la cual considera a este como
un conjunto de fotones virtuales que viven un tiempo ∆t < E/h̄,
creando pares e± que originan una distribución espacial de “carga
virtual”, denominada polarización del vacı́o. La corrección es,
E1z 1 − δ`=0
 
∆Elamb = α3 K(n, `) ± , (5.63)
2n3 π(j + 1/2)(` + 1/2)

donde K(n, 0) es una función creciente con n, que va de K(1, 0) ≈ 12.7


a K(∞, 0) ≈ 13.7, y K(n, ` 6= 0) ∼ 0.05.

Estructura hiperfina
~p ,
El protón tiene un momento magnético asociado a su espı́n S

~p
eS
µ
~ p = γp , (5.64)
mp c

donde la constante γp ≈ 2.7928 considera la estructura del protón que, a


diferencia del electrón, no es una partı́cula puntual. El momento dipolar
del protón tiene un acoplamiento tipo espı́n-órbita, ∆E = −~ ~
µp · eL/mcr 3,

y otro acoplamiento con el espı́n del electrón, ∆E ' −~ µp · µ 3


~ e /r . Para su
~ ~ ~
descripción se usa el momento angular total, F = J + Sp = L + S ~ ~e + S~p , con
el número cuántico asociado, f = ` + ms + msp = ` ± 1/2 ± 1/2.
Para ` = 0, la corrección a los niveles de energı́a está dada por
!
m 4γp 3
 
2
∆Enf = 2α E1z f (f + 1) − . (5.65)
mp 3n3 2

La transición f = 1 → 0 origina un fotón de energı́a  = 16γp E12 /mp c2 ,


correspondiente a una frecuencia /h ' 1420.406 MHz, y una longitud de
onda λ = hc/ ' 21.106 cm. La detección de esta lı́nea en ondas de ra-
dio es fundamental para la astronomı́a, siendo la única técnica conocida de
observación del hidrógeno neutro.

El efecto Zeeman
El momento magnético del átomo, tanto la parte debida al momento an-
~ como la originada en el espı́n, interacciona con un campo
gular orbital, L,
magnético externo B~ resultando en un término adicional al Hamiltoniano
Hz = (eB/2mc) · J, donde J~ = L
~ ~ ~ + S.
~

22
Empleando el método de perturbaciones se encuentra que los niveles de
energı́a se desdoblan de forma proporcional al campo magnético,
j(j + 1) + s(s + 1) − `(` + 1) eh̄B
  
∆Ez = mj 1 + . (5.66)
2j(j + 1) 2mc

El efecto Zeeman desdobla un nivel dado (`, j) en tres, removiendo la de-


generación en mj , y permitiendo la emisión o absorción de fotones entre
transiciones con ∆mj = 0, ±1: se observan lı́neas en la frecuencia de refe-
rencia, ω0 , y en ω± = ω0 ± eB/2mc. En la práctica, el desdoblamiento es
más complicado debido a la dependencia en j, ` y s de ∆Ez , que dan lugar
al efecto Zeeman anómalo.
El efecto Zeeman fue empleado por Hale a principios del siglo XX pa-
ra mostrar que las manchas solares tienen campos magnéticos de miles de
Gauss. El efecto Zeeman en los niveles de la estructura hiperfina del HI, a
21 cm, y de OH, a 18 cm, es la única herramienta confiable para estimar
campos magnéticos en nubes interestelares.
(Ryb 9; Shu 24, 25, 26 . . .)

5.3.3. Átomos con varios electrones


Aproximación de campo central
El Hamiltoniano para un átomo con Z electrones está dado por los términos
de energı́a cinética de los electrones, la atracción del núcleo de carga +Ze,
y un término de repulsión entre electrones
Z Z−1 Z
" 2 #
X p j Ze2 X X e2
H= − + . (5.67)
j=1
2m rj |~r − ~rj |
j=1 i=j+1 i

Ignorando la presencia del término de repulsión entre electrones, el Hamil-


toniano corresponde a la suma de Z sistemas hidrogenoides, la función de
onda es el producto de Z funciones de onda de este tipo y la energı́a es la
suma de las energı́as individuales
Z Z Z
Y m X X E1z
ϕ= Rnj `j Y`j j χms,j , E= Enj = , (5.68)
j=1 j=1 j
n2j

incluyendo el espı́n de cada electrón mediante χms,j . Ası́, el estado del átomo
queda especificado con 4Z números cuánticos,

{nj , `j , mj , ms,j ; j = 1, . . . , Z}.

23
El problema fundamental en la descripción de estos sistemas radica en el
término de repulsiones entre electrones que contiene una doble sumatoria y
no puede ser despreciado5 ,
X X  X 
e2 /rij / Ze2 /ri ' Z(Z − 1)/2Z 2 → 1/2 para Z  1 .
(5.69)
El método de perturbaciones resulta inadecuado para el estudio de átomos
con varios electrones, incluso en el caso del helio, y sólo puede aportar una
descripción cualitativa del sistema.
Un método más apropiado para tratar este problema consiste en apro-
ximar el potencial mediante “algún” potencial central, Vc (r), y un término
residual que pueda ser despreciado, o tratado como una perturbación,
Z
" 2 #
X p j
H= + Vc (rj ) + W . (5.70)
j
2m

La dificultad reside en elegir adecuadamente Vc , de forma que


Z Z
Z X Z
X Ze2 X e2 X
W =− + − Vc (rj ) (5.71)
j=1
rj j=1 i>j
rij j=1

sea despreciable. De la forma de W puede uno inferir las principales propie-


dades de Vc , en partı́cular
(
−Ze2 /r para r → 0
Vc (r) ≈ . (5.72)
−e2 /r para r → ∞

El potencial central debe tener una forma similar a la ilustrada en la figu-


ra 5.4: cuando un electrón está cerca del núcleo, el potencial de los demás
electrones puede ser despreciado de manera que Vc (r) ≈ −Ze2 /r; y cuando
el electrón está a mayor distancia, la carga nuclear queda apantallada por
los demás Z − 1 electrones, resultando en una carga neta ' +e.
La existencia de una aproximación de campo central implica que la fun-
ción de onda puede describirse como un producto de Z funciones de tipo
ϕn`m = Rn` (r)Y`m (θ, φ), con la parte angular descrita mediante armónicos
esféricos con ` < n, |m| ≤ `. El potencial no es Coulombiano por lo que
la parte radial no corresponde con un sistema hidrogenoide: los niveles de
energı́a dependen del momento angular, En` , aún cuando se mantiene la de-
generación con m. La jerarquı́a de los niveles de energı́a con n se mantiene,
5
empleamos la notación abreviada rij = |~ri − ~rj |.

24
Figura 5.4: Un potencial que cumple
con los lı́mites asintóticos, indicados
por las lı́neas punteadas: Vc → −1/r
para r  1,Vc → −Z/r para r  1.

agregando una relación similar con el momento angular,

En` > En0 ` para n > n0 , En` > En`0 para ` > `0 . (5.73)

Los niveles de energı́a adquieren una estructura más compleja que en el


átomo de hidrógeno.

Principio de Pauli y configuración electrónica


El estado de un átomo puede describirse con la superposición de los estados
individuales |n, `, m, ms > de cada electrón,

ϕ = ua (1)ub (2) . . . uk (N ) , (5.74)

donde a, b, . . . k describe el estado del electrón 1, 2, . . . N ; es decir, a puede


corresponder con los números |n, `, m, ms > del primer electrón, b del segun-
do, etc. . . . La función de onda del sistema debe considerar que los electrones
son partı́culas indistinguibles, por lo que no debe depender de si el electrón
1, 2 o k es el que está en el estado a: el estado del sistema está representado
por ϕ = (N !)−1/2 p εp ua (1)ub (2) . . . uk (N ), con ε = ±1, dependiendo de si
P

el término de la sumatoria es una permutación par o impar de un término


de referencia. Esto se puede escribir matricialmente como

u (1) u (2) . . . u (N )
a a a


1

ub (1) ub (2) . . . u b (N )


ϕ = √ . . . .. . (5.75)
N ! .. .. .. .



uk (1) uk (2) . . . uk (N )

25
En esta expresión se puede ver que dos electrones no pueden ocupar el
mismo estado, ya que si a = b entonces ϕ = 0, de acuerdo con el principio
de exclusión de Pauli, inherente a los fermiones.
La configuración de un átomo se define especificando los valores {n, `}
de los orbitales que ocupan sus electrones: n`x indica que x electrones están
ocupando el estado definido por {n, `}, donde x debe ser menor o igual
a 2(2` + 1), la degeneración del estado de momento angular `, incluyendo
el espı́n. Las configuraciones de estados base de los primeros elementos se
muestran en la tabla 5.3 y en la figura 5.5, transcrita de Cohen-Tannoudji.
El llenado de las capas superiores no se da en secuencia con n a partir de
niveles con n ≥ 3, de forma que generalmente el nivel 4s se ocupa antes que
el 3d. Otro punto relevante es el potencial de primera ionización, mostrados
también en la tabla 5.3: un potencial de ionización bajo se relaciona con la
presencia de lı́neas espectrales en el visible; por ejemplo en Na y Mg.

(Cohen-Tannoudji XIV; Shu 27; Rybicki 9.3)

5.3.4. Moléculas diatómicas


En las moléculas diatómicas, formadas por dos núcleos y un cortejo de elec-
trones, es posible diferenciar la estructura de los niveles de energı́a en tres
componentes: electrónica, vibracional y rotacional. Esta separación se da
por los distintos ordenes de magnitud:
los niveles electrónicos tienen energı́as del orden de Ee ∼ e2 /a0 =
h̄/ma20 , que corresponden a energı́as de unidades o decenas de eV.
Los niveles vibracionales, donde la energı́a electrónica actúa como
el resorte que une a los núcleos que están separados por una distancia
del roden del radio de Bohr, tenemos Eel ∼ M ωvib 2 a2 , de donde E
0 vib =
1/2
h̄ωvib ∼ (m/M ) Eel .
Los niveles rotacionales se asocian al momento angular de la molécu-
la, L ∼ M a20 ωrot ∼ h̄, de donde h̄ωrot ∼ (m/M )Eel .
Las transiciones correspondientes a niveles electrónicos, vibracionales y ro-
tacionales caen en el óptico-UV, infrarrojo y milimétrico respectivamente.
Considerando el caso de la molécula de H2 , con dos núcleos A y B,
separados por una distancia R, y dos electrones, 1 y 2, podemos escribir el
Hamiltoniano en dos partes, H = HAB + H12 ,
h̄2 h̄2
HAB = − ∇2A − ∇2 , (5.76)
2MA 2MB B

26
Elemento Z χ (eV) n ` Configuración Capa externa
H 1 13.6 1 0 1s K
He 2 24.6 1 0 1s2 K
Núcleo de He: 2 electrones
Li 3 5.39 2 0 2s L
Be 4 9.32 2 0 2s2 L
B 5 8.30 2 1 2s2 2p L
C 6 11.3 2 1 2s2 2p2 L
N 7 14.5 2 1 2s2 2p3 L
O 8 13.6 2 1 2s2 2p4 L
F 9 17.4 2 1 2s2 2p5 L
Ne 10 21.6 2 1 2s2 2p6 L
Núcleo de Ne: 10 electrones
Na 11 5.14 3 0 3s M
Mg 12 7.64 3 0 3s2 M
Al 13 5.98 3 1 3s2 3p M
Si 14 8.15 3 1 3s2 3p2 M
P 15 10.6 3 1 3s2 3p3 M
S 16 10.4 3 1 3s2 3p4 M
Cl 17 13.0 3 1 3s2 3p5 M
Ar 18 15.8 3 1 3s2 3p6 M
Núcleo de Ar: 18 electrones
K 19 4.34 4 0 4s N

Cuadro 5.3: Configuraciones de estado base de los primeros 19 elementos y


el primer potencial de ionzación respectivo, χ. El potencial de ionización de-
crece con n, tiende a crecer con `, pero aumentando al pasar de un elemento
con Z impar a par, y decreciendo al ir de Z par a impar.

h̄2  2  Z e2
A ZB e2 ZA e2 ZB e2 ZA ZB e2 e2
H12 = − ∇1 + ∇22 − − − − + + .
2me r1A r1B r2A r2B R r12

Aproximación de Born-Oppenheimer
La aproximación de Born-Oppenheimer separa la función de onda en una
parte electrónica y una nuclear,

ϕ ≈ ϕel (~x1 , ~x2 , R) ϕAB (~xA , ~xB ) . (5.77)

27
Figura 5.5: Esquema de niveles energéticos de distintos átomos de acuerdo
a un modelo de potencial central. Entre paréntesis se indica la degeneración
de cada nivel, g` = 2(2` + 1). La posición relativa de los niveles superiores
puede variar entre diferentes átomos. Basada en §XIV, Cohen-Tannoudji.

Las configuraciones electrónica y nuclear se relacionan por la distancia in-


ternuclear, R, que varı́a en una escala de tiempo larga comparada con el
movimiento de los electrones. La substitución de (5.77) en (5.76) permite
separar la ecuación de Schrödinger en dos partes,

Hel ϕel = Eel (R)ϕel , HAB ϕAB + Eel (R)ϕAB = E ϕAB . (5.78)

Esta expresión puede seguirse separando como se ve a continuación.

28
Movimiento translacional e interno
La componente nuclear del Hamiltoniano puede separarse en dos términos
2 /2M + P 2 /2µ, permitiendo describir el movimiento de
cinéticos, HAB = Pcm R
A y B en términos de la translación del centro de masa,

~ cm = MA ~xA + MB ~xB ,
X M = M A + MB ; (5.79)
MA + MB
y el movimiento relativo entre las dos moléculas, descrito por la coordenada
relativa y la masa reducida,
~ = ~xA − ~xB , 1 1 1
R = + . (5.80)
µ MA M B
~ cm )ϕint (R),
La función de onda de los núcleos se separa, ϕAB = ϕtrans (X ~ con
la parte translacional obedeciendo una ecuación de partı́cula libre, mientras
que la interna, fı́sicamente más relevante, sigue un potencial central:
h̄2 2
− ∇ ϕint + Eel (R)ϕint = Eint ϕint . (5.81)
2µ R

Estados rotacionales
La simetrı́a esférica en la ecuación (5.81) nos permite separar la función de
onda en una parte radial y una de armónicos esféricos,
~ = 1 Zint (R)Ym (θ, φ) ,
ϕint (R) (5.82)
R
donde L2 Ym = ( + 1)h̄2 Ym , Lz Ym = mh̄ Ym , y una configuración niveles
rotacionales asociada,
h̄2
Erot = ( + 1) . (5.83)
2µR2

Estados vibracionales
La parte radial de la ecuación de estructura interna,
!
h̄2 d2 Z ( + 1)h̄2
− + Eel (R)Z = Eint − Z, (5.84)
2µ dR2 2µR2
puede resolverse cuando consideramos la estructura de la molécula en un
estado de equilibrio electrónico, alrededor de un mı́nimo de Eel (R). La ex-
pansión en serie omite el término lineal,
1
Eel (R) = Eel (R0 ) + µω02 (R − R0 )2 + . . . , (5.85)
2

29
dando lugar a una ecuación de oscilador armónico

h̄2 d2 Z(x) 1 2 2
− + µω0 x Z(x) = Evib Z(x) , (5.86)
2µ dx2 2

donde x = R − R0 , ω02 = (1/µ) (d2 Eel /dR2 )0 , Evib = Eint − Eel (R0 ) − Erot ;
por lo que tenemos:
1
 
vib
Ev = v + h̄ω0 . (5.87)
2
Recapitulando, la energı́a de la molécula se separa en una parte trans-
lacional y otra interna, E = Etrans + Eint , con la parte interna incluyendo
componentes electrónica, vibracional y rotacional: Eint = Eel + Evib + Erot .
Al considerar un punto de equilibrio de la estructura electrónica, que define
una distancia internuclear R0 , la estructura vibracional se aproxima a la de
un oscilador armónico. La estructura rotacional está dada por los armónicos
esféricos, siendo los niveles de energı́a de la forma Erot = ( + 1)(h̄2 /2µR0 ).
Las estructuras vibracional y rotacional de la molécula dependen entonces de
los parámetros R0 y d2 Eel /dR02 , determinados por la estructura electrónica.

Estructura electrónica del hidrógeno molecular


Incluso dentro de la aproximación de Born-Oppenheimer, la solución de la
estructura electrónica de una molécula es un problema sin solución analı́tica.
Uno de los casos mas tratables es el de la molécula de hidrógeno, donde la es-
tructura electrónica es solución de (5.78), con ϕel = ϕel (~x1 , ~x2 , R). Siguiendo
a Shu §29, normalizamos la ecuación al radio de Bohr y proponemos,

ϕel = c1 u(r1A )u(r2B ) + c2 u(r1B )u(r2A ) , (5.88)

donde u(r) = π −1/2 e−r es la función de onda del estado base del hidrógeno,
{n = 1, ` = 0, m = 0}, y c1 , c2 son coeficientes a determinar. Existen √ dos
soluciones: √
una simétrica y una antisimétrica, correspondientes a c1 = 1/ 2,
y c2 = ±1/ 2, que dan lugar a dos formas para Eel (R),
! !
e2 e2 α±β
 
± ±
Eel (R) =− + Emol = −1 + 2 , (5.89)
a0 a0 1±∆

siendo α, β y ∆ funciones de R:
!
1 ∆ R2
 
−2R
α=e 1+ , β= − e−R (1 + R) , ∆=e −R
1+R+ ,
R R 3

30
Figura 5.6: Energı́a de enlace en un modelo de molécula H2 . La curva su-
perior, en verde, corresponde a E − , positiva para toda R y, por tanto, a
un sistema no ligado. La solución E + corresponde al enlace molecular con
equilibrio en R ' 2.49 a0

±
siendo −e2 /a0 la energı́a asociada a dos átomos de hidrógeno y Emol repre-
senta la energı́a de enlace, mostrada en la figura 5.6.

[3] Pilar§16; Shu §28-30.

5.4. Transiciones radiativas


Hasta aquı́ hemos considerado sistemas cuánticos en estados estacionarios.
Sin embargo, el proceso de absorción o emisión de radiación involucra el
cambio temporal de un sistema cuántico, cuya energı́a crece o decrece. Pa-
ra considerar estos procesos debemos incluir dependencia temporal en el
Hamiltoniano y la transición entre distintos estados estacionarios.

31
5.4.1. Método de perturbaciones dependientes del tiempo
El formalismo de perturbaciones para resolver la ecuación estacionaria de
Schrödinger es particularmente útil para el estudio de la estructura de sis-
temas cuánticos, pero no aporta información acerca del comportamiento
temporal de estos, por ejemplo la interacción con un campo de radiación.
Un desarrollo perturbativo dependiente del tiempo aborda el problema
de Hamiltoniano de la forma H = H(0) + H(1) , donde el primer término es
independiente del tiempo y sus estados estacionarios, {ϕk , Ek }, soluciones
de H(0) ϕk = Ek ϕk , son conocidos. Estos representan la estructura básica
del sistema cuántico y su conjunto constituye una base, de forma que es
posible desarrollar cualquier función de onda en términos de la familia de
estados estacionarios,

ck (t) ϕk (~x)e−iEk t/h̄ ,
X
ψ(~x, t) = (5.90)
k=0

donde los coeficientes ck pueden ser dependientes del tiempo. En ausencia


de una perturbación externa, los coeficientes ck son constantes y la evolu-
ción temporal del sistema está determinada únicamente por los términos
armónicos exp {−iEk t/h̄}.
Si desarrollamos (5.90) dentro de Hψ = ih̄∂ψ/∂t, obtenemos:

ck H(1) ϕk (~x)e−iEk t/h̄ = ih̄ ċk ϕk e−iEk t/h̄ ,


X X
(5.91)
k k

y, vı́a el producto con hϕf | e+iEf t/h̄ ,


D E
ck ϕf |H(1) |ϕk ei(Ef −Ek )t/h̄ ,
X
ih̄ ċ(t) = (5.92)
k

Podemos resolver esta ecuación si consideramos que el sistema está inicial-


mente en un estado estacionario del H(0) , es decir ck (t = 0) = δik , de donde:
Z tD
i E 0
ċf (t) = − ϕf |H(1) |ϕi eiωf i t dt0 , (5.93)
h̄ 0

donde ωf i = (Ef − Ei )/h̄ corresponde a la frecuencia del fotón relacionado


con el proceso de emisión o absorción.
H(1) ϕi representa el estado resultante de la interacción de la perturba-
ción con el sistema, y la probabilidad de que H(1) ϕi corresponda con ϕf es

32
proporcional a |ċf |2 . La probabilidad promedio por unidad de tiempo de que
ocurra la transición i → f es:
Z 2
1 1 T
(1) iωf i t0 0
χf i = hf | H |ii e dt , (5.94)


T h̄ 0

en principio independiente de T . Esta es una tasa de transición y se calcula


conociendo H(1) .

5.4.2. Hamiltoniano con campo electromagnético


Un campo eléctrico actuando sobre una carga altera la energı́a E de la misma,
dE/dt = q E~ · ~v , mientras que un campo magnético, al ejercer una fuerza
perpendicular a ~v , no realiza trabajo. Sin embargo, el campo magnético
afecta el movimiento de la partı́cula y debe ser incluido en el Hamiltoniano,
de forma que las ecuaciones de Hamilton consideren la fuerza de Lorentz.
~ x, t), φ(~x, t)},
Esto se logra incluyendo los potenciales electromagnéticos, {A(~
en el Hamiltoniano clásico,

2

1 q~
H= p
~ − A(~
x , t) + qφ(~
x, t) . (5.95)
2m c

Esta generalización del Hamiltoniano a sistemas cuánticos permite tratar


las transiciones radiativas.
Podemos separar el Hamiltoniano en dos partes, H = Hest + Hint , donde
la parte estática,
p|2
|~
Hest = − eφ(~x) , (5.96)
2m
corresponde a un sistema un electrón, q = −e, ligado en un sistema en estado
estacionario; y,

e  ~ ~  e2  ~ ~ 
Hint = p~ · A + A · p~ + A·A , (5.97)
2mc 2mc2
representa la interacción
 del sistema con el campo electromagnético. El
~ ~
término p~ · A + A · p~ representa la interacción del sistema con un fotón,
mientras que el término (A ~ · A)
~ representa la emisión o absorción simulta-
nea de dos fotones. Al igual que en el caso clásico, tenemos la libertad de
fijar la norma en que trabajamos, siendo más conveniente aquı́ la norma de
Coulomb, ∇ · A ~ = 0, equivalente a p~ · A
~ = 0.

33
En entornos astrofı́sicos comunes el campo electromagnético incidente es
muy débil comparado al potencial Coulombiano, |E| ~  e/a2 , y el fotón emi-
0
tido en el proceso tiene una energı́a comparable al potencial de ionización,
e2 /a0 ∼ h̄ω, por lo que podemos tratar al campo externo como una pertur-
bación dependiente del tiempo, y despreciar el término de dos fotones. La
importancia relativa de los dos términos radiativos en Hint y el estructural
Hest puede evaluarse usando A ∼ B/k ∼ (c/ω)E, y p ∼ αmc,
|(e/2mc) A ~ · p~| |(e2 /2mc2 )(A~ · A)|
~ e A
 
e2 /a0
∼ ∼  ∼ 1,
|p2 /2m| |(e/2mc) A ~ · p~ | c p h̄ω
Para calcular el efecto del término dominante en Hint expresamos el
~ x, t) = A(t)ei~k·~x êα , donde êα denota el vector
potencial vectorial como A(~
de polarización para calcular la integral en la ecuación (5.94),
i T
 
e
Z
~ · p~ i eiωf i t0 dt0 ,

ċf (ω) ≡ − f A
h̄ 0 2mc
2π e
 D
~
E
= −i A(ωf i ) f eik·~x êα · p~ i , (5.98)

h̄ 2mc
donde A(ω) es la transformada de Fourier de A(t). El cálculoD de las probabili- E
~
dades de transición se remite al de los elementos de matriz, f | eik·~x êα · p~ |i .

5.4.3. Aproximación dipolar


La aproximación dipolar considera sólo el primer término en la expansión
~
eik·~x = 1 + i~k · ~x − . . . ,
y es válida cuando (2π/λ)x ∼ a0 /λ  1, que es el caso general. El elemento
de matriz en (5.98) queda como hf |êα · p~ | ii = êα · hf |~
p | ii. Siguiendo a Shu
§23, podemos escribir el operador de momento como,
m
p~ = i (H0 ~x − ~xH0 ) ,

de donde
hf | −e~p | ii = im ωf i d~f i ,
D E
siendo d~f i ≡ f d~ i la matriz correspondiente al dipolo eléctrico, d~ = −e~x.

D E 2
Para radiación no polarizada êα · f d~ i = |d~f i |2 /3, al ser êα básicamen-

te aleatorio, y la probabilidad de transición por unidad de tiempo, o tasa de


transición, queda como:
4π 2 2
D
2 ~
E 2
χf i = ω |A(ω )| f |d|i . (5.99)

fi fi
3h̄2 c2 T

34
5.4.4. Coeficientes de Einstein
Los coeficientes de Einstein se relacionan directamente con las tasas de tran-
sición. Para absorción o emisión estimulada tenemos,

hχf i i = Bf i Jν , (5.100)

con Bf i el coeficiente de Einstein y Jν la intensidad media del campo de


radiación, que puede expresarse en términos del potencial vectorial:

~
ω 2 |A(ω)|2
Jν = . (5.101)
2 cT
Podemos expresar los coeficientes de Einstein en términos de la matriz del
dipolo,
8π 2 2 4ωf3i 2
Bf i = 2 d~f i = Bif , Af i = d~f i . (5.102)
3h̄ c 3h̄c3
(Rybicki §10.3).

5.4.5. Reglas de selección


Las reglas de selección surgen de evaluar los coeficientes en (5.98) mediante
la expansión en términos multipolares, empezando por las transiciones di-
polares ya consideradas. Las reglas de selección van de acuerdo al tipo de
transición en cuestión.

Transiciones dipolares eléctricas


Consideran el alineamiento del dipolo d~ con el vector de polarización êα de
la onda incidente. Para ello conviene separar la integral hf |êα · ~x|ii en una
componente de polarización lineal, hf |z|ii, y otra de polarización circular,
D √ E
f |(x ± iy)/ 2|i . El comportamiento general de estas expresiones puede
visualizarse para el átomo de hidrógeno,

0 0 0
hf |z|ii = n ` m | cos θ|n`m , (5.103)
Z ∞  Z 2π Z π 
∝ rRn0 `0 (r)Rn` (r)dr cos θ Y`0 m0 Y`m dΩ .
0 0 0

La integral sobre r es distinta de cero; la integral sobre armónicos esféricos


es no nula sólo si ∆` = `0 − ` = ±1. Para radiación con polarización lineal
se debe cumplir adicionalmente la restricción ∆m = 0, mientras que para
polarización circular hf |x ± iy| ii difiere de cero para ∆` = ±1, ∆m = ±1.

35
Transiciones cuadrupolares eléctricas
Estas son relevantes cuando las transiciones dipolares no son posibles. Se
deben evaluar los elementos de matriz del tensor de cuadrupolo eléctrico,
hf |Qαβ | ii, donde Qαβ = −e(3xα xβ − r2 δαβ ). Las reglas de selección co-
rrespondientes nos dicen que las transiciones cuadrupolares son permitidas
entre estados con ∆` = 0 y ∆` = ±2, con ∆m = 0, ±1, ±2.

Transiciones dipolares magnéticas


Están relacionadas con la distribución de corrientes de carga, de la forma
hf |~xp~| ii. Son permitidas para ∆` = 0, y ∆m = 0, ±1.

Transiciones estrictamente prohibidas


D E
~
Son aquellas para las cuales f eik·~x êα (~k) · p~ i = 0. Tal vez la más notable

es la transición 2s → 1s de la serie de Lyman α para estados de momento


angular cero del hidrógeno. En estos casos el termino de emisión de dos
fotones del Hamiltoniano (5.97), (e2 /2mc2 )A ~ · A,
~ pasa a ser relevante. El
coeficiente de Einstein para decaimiento espontáneo es mucho menor que
para la transición via un fotón: A2s→1s = 8.2 s−1  A2p→1s = 6.2 × 108 s−1 .

5.4.6. Transiciones hı́bridas


Considerando que el estado inicial o final puede ser un estado del conti-
~
nuo, ϕ = V −1/2 e−ike ·~x , con |~ke | = 2me Ef /h̄, se pueden calcular proba-
p

bilidades de transición entre estados libres y ligados, como por ejemplo la


foto-ionización de un átomo, proceso en el que un fotón incide en un átomo
dejando un electrón libre. Para un átomo de hidrógeno en el estado base,
q
~
ϕi = πa3Z e−|z|/az → ϕf = V −1/2 e−ike ·~x , (5.104)

2
donde Ef = D h̄ωf i − Ze /2a
E z es la energı́a cinética del electrón liberado. Del
i~k·~
x
cálculo de f |e êα · p~|i se obtiene la sección eficaz de fotoionización,

1 8π Z 4 me e10
σbf (ω) ' √ gbf (ω) , (5.105)
n5 3 3 ch̄3 (h̄ω)3

donde la función de Gaunt tiene una estructura modulada con discontinuida-


des que definen los llamados bordes de ionización, ilustrados en la figura 5.7.
La forma de σ muestra la absorción de fotones por foto-ionización desde

36
911Å hasta h̄ω <
∼ 1 keV, abarcando la mayor parte del ultravioleta, hasta
los rayos X blandos. Por encima de estas energı́as se tiene un decaimien-
to ∝ ω −3 que permite estimar la densidad de columna en la dirección de
observación.
(Ryb 10; Shu 21, 22, 23, 24)

Figura 5.7: Sección eficaz para transiciones entre estados ligados y libres -
expresión (5.105). Los picos en σ(ω) corresponden al acceso a las distintas
capas de la configuración electrónica, K, L, M, en un átomo hipotético.

37
Bibliografı́a

[1] Cohen-Tannoudji...

[2] “Classical mechanics”, Goldstein, H., 2nd edition, ed. Addison Wesley.

[3] “Elementary quantum chemistry”, Pilar, F., ed. McGraw-Hill.

[4] Shu...

38
Radiación: Tarea 1
Martes 27-sep-2016 → lunes 10-oct-2016

1. Leyes de Maxwell - I (2 puntos)


Demostrar ∇· E~ = 4πρ integrando sobre un volumen cilı́ndrico de radio
A y altura 2h centrado en una carga puntual q.
2. Leyes de Maxwell - II (3 puntos)

a) Escribir y ejecutar un programa que dibuje las lı́neas del campo


electrostástico producido por dos cargas, una de valor −q ubicada
en −ax̂ y la segunda de valor +q ubicada en +ax̂.
b) Calcular ∇ · E, ~ considerando un paralelelpı́pedo centrado en el
origen y conteniendo ambas cargas.
c) Demostrar que para a → 0 el campo tiende al de un dipolo,
!
~ = 2qa 3x~r − x̂ .
E
r5 r3

3. Atmósfera gris, plano paralela e infinita (3 puntos)


Para una atmósfera gris, plano paralela e infinita, suponer que la in-
tensidad de la radiación (integrada sobre frecuencias) puede escribirse
de la forma,
I(τ, µ) = a0 (τ ) + a1 (τ )µ ,
Suponer también que la función fuente tiene una contribución por
absorción + re-emisión y otra por dispersión monocromática, S =
(1−A) B+A J donde B = (σT 4 /π) es la función de Planck y 0 ≤ A ≤ 1.
Demostrar:
a) que se cumple la relación de Eddington, P = 13 u;
b) que la ecuación de transporte,
∂I
µ =I −S,
∂τ
implica a1 constante, a0 (τ ) = a0 (0) + a1 τ = B(T (τ )); donde a0 (0)
es a0 (τ = 0).

1
c) que la expresión anterior, junto con la condición de que el flujo en
τ = 0 solo tiene una componente emergente (i.e. parte “incidente”
es cero), implican
3 4 2
 
4
T = Te τ + .
4 3
4. Dos fermiones con tres posibles estados individuales (2 puntos)
Para un sistema de dos fermiones con tres posibles estados individuales,
verifique que:    
 xn j 
X Y Y X nj
j ≡  x  j ,
{nj } j j nj

mostrando explicitamente los términos de cada lado de la equivalencia.


Recuerde que las sumatorias o productos se hacen (i) sobre {nj }, los
estados del sistema, (ii) sobre nj , los números de ocupación de estados
individuales, y (iii) sobre j, los estados individuales que puede tener
cada partı́cula.

2
Radiación: solución a la tarea 1
Jueves 6-oct-2016

1. Demostrar ∇ · E ~ = 4πρ integrando sobre un volumen cilı́ndrico de


radio A y altura 2h centrado en una carga puntual q.
Solución:
La igualdad ∇ · E~ = 4πρ es equivalente a
Z
~ · d~a = 4πq,
E

con A el área que encierra al volumen que contiene a la carga q. El vo-


lumen cilı́ndrico se separa en tres partes: la tapa superior, denominada
área 1; la inferior 2; y la lateral 3. La integral a calcular es,
q
Z Z
~ · d~a =
E ~r · n̂ da = I1 + I2 + I3 ,
r3
sobre las tres superficies que acotan al volumen:
La primera superficie tiene fija z = h y se integra sobre d~a =
ẑ RdRdφ, en coordenadas cilı́ndricas; de dónde
Z A Z A
q(RR̂ + hẑ) RdR
I1 = · ẑ 2πRdR = 2πqh ,
0 (R2 + h2 )3/2 0 (R2 + h2 )3/2
" #
1
= 2πq 1 − p 2 2 .
A /h + 1
El cálculo es directo al emplear la variable de integración x =
R2 + h2 .
La segunda integral da el mismo resultado, al considerar z = −h,
n̂ = −ẑ:
Z A " #
q(RR̂ − hẑ) 1
I2 = · (−ẑ) 2πRdR = 2πq 1 − p 2 2 .
0 (R2 + h2 )3/2 A /h + 1

La tercera integral es sobre el costado del cilı́ndro, R = A, n̂ = R̂,


Z +h Z +h
q(AR̂ + z ẑ) dz
I3 = · R̂ 2πAdz = 2πqA
−h (A2 + z 2 )3/2 −h (A2 + z 2 )3/2
+h/A " #
x 1

= 2πq √ = 4πq p 2 2 , (1)
2
x +1 A /h + 1
−h/A

1
de dónde I1 + I2 + I3 = 4πq.

2. a) Escribir y ejecutar un programa que dibuje las lı́neas del campo


electrostático producido por dos cargas, una de valor +q ubicada
en +ax̂ y la segunda de valor −q ubicada en −ax̂.
Solución: Se grafica el campo dado por

~ = q(~r − ax̂) q(~r + ax̂)


E − .
(r2 − 2ax + a2 )3/2 (r2 + 2ax + a2 )3/2

~ considerando un paralelepı́pedo centrado en el


b) Calcular ∇ · E,
origen y conteniendo ambas cargas.
Solución:
El problema está mal escrito; se referı́a al cálculo de la integral
~ Detalle mediante, considero un cubo de lado L > 2a...
de ∇ · E...
y se trata de una sola integral, que está de su .... madre.
c) Demostrar que para a → 0 el campo tiende al de un dipolo,

~ = 2qa 3x~r − x̂ .
 
E
r5 r3
Solución:
Se hace la expansión a primer orden:
!−3/2
2ax a2 3ax
 −3/2  
−3
2
r ± 2ax + a 2
=r 1± 2 + 2 ' r−3 1 ∓ ,
r r r2

de dónde
~r 3ax 3ax ax̂ 3ax 3ax
       
~ '
E +q 3 1+ 2 − 1− 2 −q 3 1+ 2 + 1− 2
r r r r r r
~r 6ax ax̂ 3x~r x̂
   
' +q 3 − 2q 3 = 2qa − 3 . (2)
r r2 r r5 r

3. Atmósfera gris...

a) Demostrar relación de Eddington:


La densidad de energı́a:
Z +1 Z +1 Z +1
1 2π 2π 4π
u= (a0 +a1 µ) 2πdµ = a0 dµ+ a1 µdµ = a0 (τ ) .
c −1 c −1 c −1 c

2
La presión de radiación:
Z +1 Z +1 Z +1
1 2π 2π 4π a0 (τ )
 
P = I 2πµ2 dµ = a0 µ2 dµ+ a1 µ3 dµ = ,
c −1 c −1 c −1 c 3

de donde P = u/3.
b) Para estimar la función fuente calculamos la intensidad media,
Z +1
1
J= I dµ = a0 ,
2 −1

de donde S = (1−A)B +A a0 . La ecuación de transferencia queda


como
∂I da0 da1
µ =I −S ⇒ µ + µ2 = a1 µ − (1 − A) (a0 − B) .
∂τ dτ dτ
La ecuación debe cumplirse para toda µ por lo que deben satis-
facerse simultáneamente

 da1 /dτ = 0
 ⇒ a1 = constante,
da0 /dτ = a1 ⇒ a0 (τ ) = a0 (0) + a1 τ ,
 (1 − A) (a − B) = 0 ⇒ a0 (τ ) = B(τ ) = (σ/π)T 4 (τ ) .

0

De donde obtenemos I(τ, µ) = a0 (0) + a1 τ + a1 µ.


c) La condición de que el flujo en τ = 0 sea solamente emergente
implica
Z +1 Z 0
F+ (0) = I(0, µ) 2πµdµ = σTe4 , F− (0) = I(0, µ) 2πµdµ = 0 .
0 −1

Reemplazando I(0, µ) = a0 (0) + a1 µ, obtenemos


2 2
F+ (0) = πa0 (0) + πa1 = σTe4 , F− (0) = −πa0 (0) + πa1 = 0 ,
3 3
de donde se sigue a0 (0) = (2/3)a1 y

3 2
 
T (τ ) = Te4 τ +
4
.
4 3

4. Dos fermiones con tres posibles estados individuales.


Tenemos los micro-estados j = a, b, c; sus ocupaciones posibles nj =

3
0, 1; y los macro-estados, {nj } = {000, 100, 010, 001, 110, 101, 011, 111} .
De donde, el término de la izquierda:
 
Y nj
xna a xnb b xnc c
X X 
 x  =
j
{nj } j {nj }
= 1 + xa + xb + xc + xa xb + xa xc + xb xc + xa xb xc .

El término de la derecha:
 
Y X nj Y
 xj  = [1 + xj ] = (1 + xa )(1 + xb )(1 + xc )
j nj j
= 1 + xa + xb + xc + xa xb + xa xc + xb xc + xa xb xc .

4
Radiación: Tarea 2
Jueves 17-nov-2016 → lunes 28-nov-2016

1. Atmósferas isotérmica y estandar


La estructura de la atmósfera terrestre puede modelarse mediante las
ecuaciones de equilibrio hidrostático, gas ideal y conservacin de energı́a.
Supóngase que se trata de un gas ideal compuesto de 75 % de nitrógeno
molecular, N2 , y 25 % de oxı́geno molecular, O2 , siendo la ecuación
de estado P = ρkT /µmh , con P presión, ρ densidad de masa, k la
constante de Boltzmann, T la temperatura, µ la masa molecular media,
y mh la unidad de masa atómica. Este gas está en equilibrio hidrostático
con la gravedad, cumpliendo,
dP
= −ρg .
dz
En ambos casos al nivel del mar se tiene una presión P0 = 1 atm y
temperatura T0 = 20◦ C.
a) Supongamos primero una atmósfera isotérmica con T = T0 . Mos-
trar que ésta tiene un perfil exponencial de presión y densidad,
de la forma P (z) = P0 e−z/H . Encontrar la expresión para H y su
valor.
b) Mostrar que una atmósfera adiabática tiene un gradiente fijo de
temperatura; determinarlo, expresándolo en grados centı́grados
por kilómetro.
c) Un modelo más preciso es el de la atmósfera estandar, dado por
un gradiente constante de temperatura, dT /dz = −6,5 K/km. En-
contrar la expresión para los perfiles de temperatura T (z), presión,
P (z), y densidad, ρ(z). ¿A qué altura falla este modelo?
d ) Comparar los perfiles de presión y densidad de los tres casos,
isotérmico, adiabático yestándar, graficándolos hasta la altura máxi-
ma permitida en el inciso (c). ¿Qué tanto concuerdan ambos mo-
delos?
2. Movimiento superlumı́nico
Al poco tiempo del descubrimiento de los cuasares se hicieron observa-
ciones que indicaban que en algunos casos material expulsado por estos

1
objetos se movı́a más rápido que la velocidad de la luz1 . Es posible de-
mostrar que este es un efecto aparente.
Supóngase que un objeto emite una masa luminosa con una velocidad
~v con ángulo θ con respecto a la lı́nea de visión, como se ilustra en la
figura 1.
a) Mostrar que la velocidad trasnversa aparente de la masa luminosa
inferida por el observador (inferida a partir de la distancia y la
velocidad angular) es
v sin θ
vapp = .
1 − (v/c) cos θ

b) Mostrar que vapp puede ser mayor que c. Encontrar el ángulo para
el cual vapp es máximo y mostrar que el valor máximo es vapp = γv.

Figura 1: Emisión de una masa luminosa con un ángulo θ con respecto a la


lı́nea de visión.

3. Colisión relativista
Considerese la colisión de dos partı́culas relativistas, a y b, cuyos cua-
drivectores de energı́a momento son2
! !
Ea0 Eb0
pαa0 = , pαb0 = ,
p~a0 p~b0
con pα0 = pαa0 + pαb0 .
1
¡estrı́ctamente prohibido!
2
Por comodidad usamos unidades con h̄ = c = me = 1.

2
a) Mostrar que la transformación de Lorentz que nos lleva al marco
de referencia de momento nulo está dada por β~ = p~0 /E0 .
b) Aplicando esta expresión al caso general del efecto Compton, en
el cual un fotón de cuadri-momento k0 interactúa con un electrón
con p0 , dados por,
! !
ω0 γ0
k0 = , p0 = ,
ω0 k̂0 γ0 β~0

mostrar que la transformación al centro de momento tiene por


velocidad
ω0 k̂0 + γ0 β~0
β~ = ,
ω0 + γ0
y de ahı́ mostrar que ésta siempre existe.
q
c) Mostrar que en el centro de momento se cumple γ00 = 1 + ω002 .
d ) mostrar que en el centro de momento se cumple γ10 = γ00 y ω10 = ω00 .
Siendo ası́, explicar en qué consiste la interacción vista en el centro
de momento.

3
Radiación: Solución a la tarea 2

1. Atmósferas isotérmica, adiabática y estandar


La atmósfera terrestre se modela con las ecuaciones de equilibrio hi-
drostático, gas ideal y conservacin de energı́a, para un gas ideal com-
puesto de 75 % de nitrógeno molecular, N2 , y 25 % de oxı́geno mole-
cular, O2 . La ecuación de estado es P = ρkT /µmh , con P presión,
ρ densidad de masa, k la constante de Boltzmann, T temperatura, µ
masa molecular media, y mh la unidad de masa atómica. El gas está
en equilibrio hidrostático con la gravedad, dP
dz = −ρg . Al nivel del mar
se tiene una presión P0 = 1 atm y temperatura T0 = 20◦ C.

a) Mostrar que una atmósfera isotérmica con T = T0 tiene un perfil


exponencial de presión y densidad, P (z) = P0 e−z/H . Encontrar
la expresión para H y su valor.

Solución:
La combinación de 75 % de N2 , de peso molecular 2×14, y 25 % de
O2 , de peso molecular 2 × 16, tiene un peso molecular µ = 29. Al
reemplazar la ecuación de estado en la de equilibrio hidrostático,
1 dρ 1 dT µmh g
+ =− . (1)
ρ dz T dz kT

En el caso de la atmósfera isotérmica dT /dz = 0, de temperatura


T0 , tenemos
1 dρ µmh g
=− ⇒ ρ(z) = ρ0 e−z/H0 ⇒ P (z) = P0 e−z/H0 ,
ρ dz kT0

con H0 = kT0 /µmh g ' 8.57049×105 cm, o 8570m, para los datos
especificados y los valores de las constantes mh , g, k.

b) Mostrar que una atmósfera adiabática tiene un gradiente constan-


te de temperatura; determinarlo, expresándolo en grados centı́gra-
dos por kilómetro.

Solución:
La ecuación de conservación de energı́a, en el caso adiabático, es
dU = T dS − P dV = −P dV . Un gas de moléculas diatómicas

1
tiene una energı́a interna dada por U = (5/2)N kT , siendo N el
número total de partı́culas. De donde
5 5 dV
d(N kT ) + P dV = 0 ⇒ N k dT + N kT = 0,
2 2 V
es decir
5 dT dV dn dρ
=− = = ,
2 T V n ρ
siendo n la densidad numérica, n = N/V = ρ/µmh , donde toma-
mos en cuenta que n y V son variables con z. Reemplazando en
la ec. (1), tenemos

7 1 dT µmh g dT 2 µmh g
 
=− ⇒ =− = constante ;
2 T dz kT dz 7 k
con los datos obtenemos

dT /dz = −9.77273 × 10−5 K/cm = −9.77 ◦ C/km .

Notamos que usando la expresión general γ = Cp /Cv obtenemos

dT γ−1 µmh g
 
=− .
dz γ k

c) Un modelo más preciso es el de la atmósfera estandar, dado por


un gradiente constante de temperatura, dT /dz = −6.5 K/km.
Encontrar la expresión para los perfiles de temperatura T (z), pre-
sión, P (z), y densidad, ρ(z). ¿A qué altura falla este modelo?

Solución:
Si T (z) = T0 − θz, con dT /dz = −θ constante, tenemos T (z) = 0
en z = T0 /θ ' 4.51 × 106 cm = 45.1 km, para T0 = 20◦ C y el gra-
diente del modelo estándar. El modelo es inaplicable para valores
mayores de z.

d ) Comparar los perfiles de presión y densidad isotérmico, adiabáti-


co y estándar, graficándolos hasta la altura máxima permitida en
el inciso (c). ¿Qué tanto concuerdan los modelos?

Solución:

2
El modelo adiabático falla a 30 km y el estándar a 45 km. Mues-
tro gráficas hasta 20 km. Para expresar las funciones soluciones,
podemos escribir
1 mg
θ= ,
η k
con η = γ/(γ − 1) = 1 + m/2 = 3.5, para atmósfera adiabática de
partı́culas con m grados de libertad; η ' 4.5 para caso estándar
(⇒ γ ' 1.29); η → ∞ caso isotérmico (⇒ γ → 1). Usando este
coeficiente, la solución general para una atmósfera de gradiente
dT /dz constante queda como

 T (z)
 = T0 (1 − z/ηH0 ) ,
ρ(z) = ρ0 (1 − z/ηH0 )η−1 ,
 P (z) = P (1 − z/ηH )η ,

0 0

con T0 = 293.15 K, P0 = 1 atm = 1.01325 × 106 g cm−1 s−2 ,


ρ0 = P0 µmh /kT0 ' 1.206 × 10−3 g cm−3 ; la solución tiene lı́mi-
te formal T (z) = T0 , ρ(z) = ρ0 e−z/H0 , P (z) = P0 e−z/H0 , para
η → ∞. Las gráficas y código aparecen al final, en las figuras 2 y 3.

2. Movimiento superlumı́nico
Al poco tiempo del descubrimiento de los cuasares se hicieron obser-
vaciones que indicaban movimientos más rápidos que la luz, prohibido
por las leyes de la fı́sica. Este es un efecto aparente: supóngase una
masa luminosa con una velocidad ~v con ángulo θ con respecto a la
lı́nea de visión, como se ilustra en la figura 1.

Figura 1: Emisión de una masa luminosa con un ángulo θ con respecto a la


lı́nea de visión.

3
a) Mostrar que la velocidad transversa aparente de la masa luminosa
inferida por el observador, es
v sin θ
vapp = .
1 − (v/c) cos θ

Solución:
Consideramos un primer fotón emitido en x1 = d, y1 = 0, que
llega al observador en t1 = x1 /c; un segundo fotón es emitido en
un tiempo posterior t, desde x2 = d − v cos θt, y2 = v sin θt, lle-
gando al observador en t2 = t + x2 /c, de manera que la velocidad
aparente según el observador será
∆y y2 − y1 v sin θt
vapp = = = ,
∆t t + x2 /c − x1 /c t + (d − v cos θt − d)/c
v sin θ
= .
1 − (v/c) cos θ

b) Mostrar que vapp puede ser mayor que c. Encontrar el ángulo para
vapp máxima y mostrar que el máximo es vapp = γv.

Solución:
vapp > c ⇒ (v/c) sin θ > 1−(v/c) cos θ ⇒ (v/c) > (sin θ + cos θ)−1 ,
que puede cumplirse para sin θ + cos θ > 1, que a su vez se cum-
ple para 0 < θ < π/2. El ángulo para el cual vapp es máxima se
determina derivando con θ,
dvapp v cos θ v sin θ(v/c) sin θ
= −
dθ 1 − (v/c) cos θ (1 − (v/c) cos θ)2
v cos θ(1 − (v/c) cos θ) − v sin θ(v/c) sin θ
=
(1 − (v/c) cos θ)2
v cos θ − v 2 /c
= = 0,
(1 − (v/c) cos θ)2

es decir cos θ = v/c. Substituyendo en vapp ,


p
max v 1 − v 2 /c2 v
vapp = 2
=p = γv .
1 − (v/c) 1 − v 2 /c2

4
3. Colisión relativista
Considerese la colisión de dos partı́culas relativistas, a y b, cuyos cua-
drivectores de energı́a momento son1
! !
Ea0 Eb0
pαa0 = , pαb0 = ,
p~a0 p~b0
con pα0 = pαa0 + pαb0 .
a) Mostrar que la transformación de Lorentz que nos lleva al marco
de referencia de momento nulo está dada por β~ = p~0 /E0 .

Solución
La transformación de Lorentz del momento es,
p~00 = −γ βE
~ 0 /c + p~0 + (γ − 1)(β̂ · p~0 )β̂ ,

que suponiendo β̂ = p̂0 , queda como


p~00 = γ(~ ~ 0 /c) ,
p0 − βE
siendo el momento p~00 nulo si β~ = p~0 c/E0 .

b) Aplicando esta expresión al efecto Compton, en el cual un fotón


de cuadri-momento k0 interactúa con un electrón con p0 ,
! !
ω0 γ0
k0 = , p0 = ,
ω0 k̂0 γ0 β~0
mostrar que la transformación al centro de momento tiene
ω0 k̂0 + γ0 β~0
β~ = ,
ω0 + γ0
y de ahı́ mostrar que ésta siempre existe.

Solución
E0 = ω0 + γ0 , p~0 = ω0 k̂0 + γ0 β~0 , de donde
ω0 k̂0 + γ0 β~0
β~ = p~0 /E0 = .
ω0 + γ0
Siendo k̂0 unitario y |β~0 | < 1, se asegura |β|
~ < 1.

1
Unidades con h̄ = c = me = 1.

5
q
c) Mostrar que en el centro de momento se cumple γ00 = 1 + ω002 .

Solución
En el centro de momento p~00 = ω00 k̂00 + γ00 β~00 = 0, de donde
q
0 0 0 0
ω00 k̂00 = −γ00 β~00 ⇒ ω02 = γ02 β02 = γ02 − 1 ⇒ γ00 = 1 + ω002 .

d ) mostrar que en el centro de momento se cumple γ10 = γ00 , ω10 = ω00 .


Siendo ası́, explicar en qué consiste la interacción vista en el cen-
tro de momento.

Solución: q
Siendo el marco de momento tenemos también γ10 = 1 + ω102 .
Por lo que la conservación de energı́a queda como
q q
ω00 + 1 + ω002 = ω10 + 1 + ω102 ,

que se cumple solamente si ω00 = ω10 , y por tanto γ00 = γ10 . No-
tamos que no se requiere k̂00 = k̂10 , por lo que el electrón y fotón
pueden modificar la dirección de sus vectores de momento. En el
centro de momento la interacción consiste en la rotación conjunta
de los vectores k̂ 0 y β~ 0 .

# perfiles atmosfericos - radiacion 2016, tarea 2


# grafica perfiles isotermico, adiabatico y estandar - altura z en km

import matplotlib.pyplot as plt


import numpy as np

from matplotlib import rc


rc(’font’,family=’serif’)
rc(’text’,usetex=True)

z=np.linspace(0.0,25.0,1000)
t0=293.15; h0=8.570; p0 = 1013.25; rho_0 = 1.206e-3

#modelo isotermico

6
t_iso = np.linspace(t0,t0,1000)
rho_iso = rho_0 * np.exp(-z/h0)
p_iso = p0 * np.exp(-z/h0)

#modelo adiabatico
eta=3.5
f = (1.0-z/(eta*h0))
t_ad = t0 * f
rho_ad = rho_0 * f**(eta-1.0)
p_ad = p0 * f**eta

#modelo estandar
eta=4.5
f = (1.0-z/(eta*h0))
t_st = t0 * f
rho_st = rho_0 * f**(eta-1.0)
p_st = p0 * f**eta

plt.ion()
plt.axis([0.0,20.0,-200.0,30.0],fontsize=16)
plt.grid()
plt.xlabel("z (km)",fontsize=16)
plt.ylabel("T(C)",fontsize=16)
plt.plot(z,t_iso-273.15); plt.plot(z,t_ad-273.15); plt.plot(z,t_st-273.15)

plt.figure()
plt.axis([0.0,20.0,0.0,1050.0],fontsize=16)
plt.grid()
plt.xlabel("z (km)",fontsize=16)
plt.ylabel("P(mbar)",fontsize=16)
plt.plot(z,p_iso); plt.plot(z,p_ad); plt.plot(z,p_st)

plt.figure()
plt.axis([0.0,20.0,0.0,1.5e-3],fontsize=16)
plt.grid()
plt.xlabel("z (km)",fontsize=16)
plt.ylabel(r"$\rho$(g cm$^{-3}$)",fontsize=16)
plt.plot(z,rho_iso); plt.plot(z,rho_ad); plt.plot(z,rho_st)

7
Figura 2: Perfiles de presión y densidad. Azul corresponde a modelo isotérmi-
co, verde adiabático y rojo estándar. 8
Figura 3: Perfiles de temperatura. Azul corresponde a modelo isotérmico,
verde adiabático y rojo estándar.

Anda mungkin juga menyukai