Anda di halaman 1dari 48

1

Orígenes de la teoría cuántica

1.1 Constantes fundamentales y Física Cuántica 3


1.1.1 Efecto fotoeléctrico 4
1.1.2 La constante cuántica 7

1.2 Límites de validez de la Física Clásica 8


1.2.1 El criterio cuántico 8
1.2.2 Átomo de hidrógeno 9
1.2.3 Electrodinámica Cuántica 10

1.3 Fotones 11
1.3.1 El postulado de Planck 11
1.3.2 Teoría de Einstein para el efecto fotoeléctrico 12
1.3.3 Cantidad de movimiento del fotón: efecto Compton 16
1.3.4 Naturaleza dual de la radiación electromagnética 21

1.4 Espectros atómicos. Átomo de hidrógeno 23


1.4.1 Antecedentes 23
1.4.2 Átomo de Bohr 27
1.4.3 Niveles de energía del átomo de hidrógeno y espectros
atómicos 33

Apéndices
1.A. Dinámica Relativista 35
1.B. Espectros de rayos X. Ley de Moseley 39
1.C. Principio de correspondencia 47

1
2
1.1 Constantes fundamentales y Física Cuántica

Toda teoría física establece relaciones (leyes) entre un conjunto de magnitudes


base. En estas relaciones intervienen las que llamaremos constantes fundamentales de la
teoría, cuyos valores concretos están ligados a una elección arbitraria de las unidades.
Una elección “apropiada” del sistema de unidades permite eliminar, en apariencia, estas
constantes fundamentales reduciéndolas a la unidad.
En las leyes de la Física Clásica, muchas de estas constantes fundamentales no
están escritas explícitamente, ya que las unidades de las magnitudes implicadas se han
elegido de forma que las constantes fundamentales adopten el valor unidad. Esto no
siempre es posible, y así, por ejemplo, la ley de Coulomb en el sistema internacional se
escribe en la forma:
1 q q'
F= ,
4πε 0 r 2
debido a una elección independiente de las unidades eléctricas y mecánicas. En este
caso, 1 / 4πε 0 es una constante fundamental de la teoría. En el sistema CGS, en cambio,
se elige la unidad de carga de forma que la constante fundamental adopte el valor
unidad. La Termodinámica, por ejemplo, puede caracterizarse por la constante de
Boltzmann k B ( E ≈ k B T ); la Mecánica Relativista por la velocidad de la luz en el vacío
( E = m c 2 ); etc.
La aplicación de una teoría física a la interpretación de un determinado proceso
físico debe, por lo tanto, conducir a poder expresar las magnitudes estudiadas en
función de los parámetros físicos del problema y las constantes fundamentales de la
teoría. En muchos casos, un simple análisis dimensional permite obtener una
aproximación fenomenológica de la expresión buscada, salvo factores numéricos que
sólo podremos conocer después de aplicar de forma detallada la teoría considerada.

Ejemplo: Periodo de oscilación de un péndulo simple de masa m , longitud l ,


sometido a la aceleración de la gravedad.
T ∝ (l / g) .
1/ 2

Una aplicación detallada de la Mecánica Clásica nos indica que la constante de


proporcionalidad vale 2π .

Por otro lado, si las constantes que aparecen en una ley empírica no se pueden
obtener a partir de los parámetros característicos del problema estudiado y las
constantes fundamentales de las teorías involucradas, deberemos concluir que esas
teorías son insuficientes. De esta forma, a principios del siglo XX, las teorías clásicas
(Mecánica, Termodinámica, Electromagnetismo…) se mostraron incapaces de explicar
diversos fenómenos, tales como el efecto fotoeléctrico, la radiación del cuerpo negro, la
estabilidad de los átomos que constituyen la materia, etc.

3
1.1.1 Efecto fotoeléctrico

Uno de los ejemplos más claros de las limitaciones de la Física Clásica lo


encontramos en la explicación del efecto fotoeléctrico. Desde finales del siglo XIX se
sabía que la radiación ultravioleta era capaz de arrancar electrones de algunos metales.
En la Fig. 1.1, se presenta el dispositivo experimental que permite estudiar este
fenómeno. Una lámina de metal pulido (por ejemplo, Zn) se ilumina mediante una
fuente de radiación ultravioleta de frecuencia ν e intensidad I , ambas variables a
voluntad. Delante de la lámina se coloca un electrodo colector que recoge los electrones
emitidos por el metal. La lámina metálica y el electrodo colector se conectan a una
diferencia de potencial variable V , a través de un galvanómetro G, que mide la
intensidad que circula por el circuito. Tanto el metal emisor como el electrodo colector
se hallan en el interior de un tubo cerrado, donde se ha practicado el vacío para que los
electrones puedan propagarse sin pérdida de su energía cinética debido a colisiones con
las moléculas del aire.

e
-

E e C
-

G V

Figura 1.1. Esquema del montaje para medir el efecto fotoeléctrico.

En primer lugar, se pone el electrodo colector a un potencial positivo respecto al


metal emisor, de manera que todos los electrones emitidos por E sean captados por C.
Esta diferencia de potencial ha de ser inferior al potencial de ruptura, a partir del cual se
arrancan electrones directamente de E. Si el tubo no está iluminado con radiación
ultravioleta el electrodo E no emite electrones y el galvanómetro G no registra paso de
corriente. Cuando se envía luz ultravioleta sobre el electrodo E se emiten electrones que
son captados por C y el galvanómetro indica paso de corriente. Siempre que se
mantengan ν y V constantes, se observa experimentalmente que la intensidad eléctrica
medida por el galvanómetro (cantidad de electrones emitidos por unidad de tiempo que
son captados por C) es proporcional a la intensidad de la luz incidente sobre la lámina
metálica.
Si ahora se mantienen constantes la intensidad I y la frecuencia ν de la radiación
incidente, y variamos la diferencia de potencial V , se obtiene una gráfica como la que
se muestra en la Fig. 1.2 para dos valores de la intensidad de la radiación incidente.

4
G
I2

I1

Vf V
Figura 1.2. Corriente G medida por el galvanómetro en función de la diferencia de
potencial entre los electrodos E y C para dos valores I1 y I 2 de la radiación incidente.

Por ejemplo, para el caso en que la intensidad de la radiación incidente es I1 , y para


valores positivos y suficientemente grandes de V , todos los electrones emitidos por E
son captados por C y la corriente es constante e igual a su valor de saturación G = G1 .
Cuando V se reduce por debajo de un cierto valor, no todos los electrones emitidos por
E llegan a C y, en consecuencia, la corriente se reduce. Si disminuimos V hasta que
adopte valores negativos, los electrones se ven frenados en su camino hacia C y la
corriente disminuye hasta que V alcanza un valor tal que ningún electrón tiene
suficiente energía cinética al ser emitido como para llegar a C. A este valor de la
diferencia de potencial V se le conoce como potencial de frenado V f .
Si se aumenta la intensidad de la luz incidente, también aumenta proporcionalmente
la corriente de saturación ( G1 / G2 = I1 / I 2 ), pero en cambio, el potencial de frenado V f
se mantiene invariante. En realidad, el potencial de frenado V f es una medida de la
energía cinética máxima de los electrones emitidos ( K max = eV f ) y no depende de la
intensidad de la radiación incidente, como cabría esperar clásicamente.
Si ahora estudiamos como varía esta energía cinética máxima K max , o lo que es lo
mismo V f , en función de la frecuencia ν del haz incidente se obtiene una gráfica como
la de la Fig. 1.3, que por otro lado, es similar a la publicada por Millikan en 1916. En
esta gráfica, se observan tres hechos característicos:

• Por debajo de la frecuencia umbral ν 0 no se emiten electrones sea cual sea la


intensidad del haz incidente.

• Siempre que ν ≥ ν 0 se produce emisión de electrones (corriente G distinta de


cero) por pequeña que sea la intensidad I del haz incidente.

• El potencial de frenado V f es proporcional a la frecuencia ν del haz incidente.

5
Vf

ν0 ν
W

e

Figura 1.3. Potencial de frenado en función de la frecuencia de la radiación incidente.

La dependencia lineal que se muestra en la gráfica anterior se puede expresar de


forma analítica como:
hν W
Vf = −
e e
de donde se puede deducir fácilmente la expresión de la energía cinética máxima de los
electrones emitidos,
K max = hν − W ,
donde h es una constante que no depende de la intensidad de la radiación ni del tipo de
metal utilizado en el experimento, contrariamente a W (energía de extracción de los
electrones) que es característica de cada metal y se conoce con el nombre de función de
trabajo.
Esta constante h habría de poderse explicar clásicamente a partir del estudio de los
procesos de interacción entre la radiación electromagnética y los electrones del metal.
En ese caso, tendría que poderse expresar en función de los parámetros característicos
del electrón (masa y carga) y de las constantes fundamentales del electromagnetismo.
Todas las tentativas en ese sentido fracasaron. Por lo tanto, no tenemos más remedio
que admitir que h es una constante fundamental de un nuevo paradigma, más allá de la
Física Clásica.
Resumiendo lo anterior, hay tres hechos fundamentales en el efecto fotoeléctrico
que no se pueden explicar clásicamente:

• Teniendo en cuenta que la amplitud del campo eléctrico ε crece al aumentar la


intensidad de la onda incidente, y que la fuerza ejercida sobre el electrón es
− e ε , la energía cinética de los fotoelectrones también debería aumentar con la
intensidad del haz luminoso. Sin embargo, tal como hemos visto, K max es
independiente de la intensidad del haz incidente.

• Según la teoría clásica debería haber emisión de fotoelectrones para cualquier


valor de la frecuencia con tal de que la intensidad del haz incidente fuese
suficientemente grande. Sin embargo, para frecuencias menores que ν 0
(frecuencia umbral) no se produce efecto fotoeléctrico, independientemente de
cual sea la intensidad del haz luminoso.

6
• Para un haz de luz suficientemente débil, debería observarse un tiempo de
retraso entre el instante en que la luz empieza a incidir sobre el metal y la
expulsión de los primeros fotoelectrones. Durante ese tiempo, los electrones
absorberían energía del haz incidente, hasta acumular la suficiente para poder
escapar del metal. En lugar de esto, la emisión se produce de forma
“instantánea” cuando la radiación alcanza el metal.

De todo ello se debe concluir que las teorías clásicas no son capaces de explicar el
efecto fotoeléctrico. En realidad, el efecto fotoeléctrico no es único y hay otros muchos
fenómenos, clasificados de “anómalos” en la Física Clásica, que requieren para ser
explicados del nuevo paradigma establecido por la Física Cuántica.

1.1.2 La constante cuántica

h es la constante fundamental que caracteriza la teoría cuántica y se conoce con el


nombre de “constante cuántica” o constante de Planck. Su valor numérico en el sistema
internacional es:
h = 6.62619 × 10 −34 ( S.I.)
Muchas veces se utiliza la constante ℏ = h / 2 π en lugar de h para minimizar el número
de constantes que aparecen en las ecuaciones de diversos modelos cuánticos. Su valor
es:
ℏ = (1.054592 ± 0.000006 ) ×10 −34 (S.I.)

- Análisis dimensional -

De la ecuación que gobierna el efecto fotoeléctrico podemos extraer las


dimensiones de la constante cuántica h . Por ejemplo, de la ecuación K max = hν −W y
en un sistema de unidades en que las magnitudes base son la masa M, la longitud L y el
tiempo T:
[E ] M L2 T −2
[h ] = = = M L2 T −1
[ν ] T −1

Para dar mayor sentido físico a esta expresión vale la pena escribirla en función de
otras magnitudes físicas. Por ejemplo, es evidente que:

[h] = [energía][tiempo]
[h] = M L T L = [cantidad de movimiento][longitud ]
−1

[h] = [momento angular ] = [momento angular ][ángulo]


De esta última expresión podemos concluir que h , y en particular ℏ como veremos
más adelante, son las unidades “naturales” del momento angular en Física Cuántica.
Además, la constante h tiene las mismas unidades que la magnitud de la mecánica
lagrangiana llamada acción, introducida como una integral temporal de la energía o una
integral espacial de la cantidad de movimiento a lo largo de una trayectoria. Por eso, h
aparece algunas veces en la bibliografía con el nombre de “cuanto de acción”.

7
1.2 Límites de validez de la Física Clásica

1.2.1 El criterio cuántico

La constante de Planck caracteriza la Teoría Cuántica y es el patrón natural para la


acción característica de los sistemas cuánticos. También se puede utilizar para delimitar
el dominio de validez de las teorías clásicas. Si una magnitud de tipo acción que
caracteriza un determinado proceso físico es comparable a h , no se pueden despreciar
los efectos cuánticos y el sistema debe ser estudiado en el marco de la Física Cuántica.
De hecho, la receta para saber si las teorías clásicas son aplicables a un determinado
problema físico consiste en determinar la acción característica a partir de las magnitudes
fundamentales del problema y compararla con h .

Acción característica ≈ h ⇒ Física Cuántica

Por lo tanto, es la acción característica implicada en un proceso físico y no el


tamaño del sistema lo que determina la aplicabilidad o no de las teorías clásicas. Por
ello los límites entre los dominios de la Física Clásica y la Física Cuántica no coinciden
exactamente con los que separaran los dominios macroscópicos y microscópicos.
Existen ciertos sistemas físicos macroscópicos con propiedades inexplicables
clásicamente. Por ejemplo: la radiación emitida por un cuerpo negro, los materiales
superconductores, la superfluidez, el magnetismo, la estabilidad de la materia, etc…Por
el contrario, también existen algunos fenómenos que se dan a escala microscópica que
se pueden describir, hasta un cierto grado de aproximación, utilizando teorías clásicas
(por ejemplo, los estados de átomos altamente excitados).
Si admitimos que no existe ningún otro paradigma más allá de la Física Cuántica
deberemos concluir que ningún fenómeno físico puede tener una acción característica
mucho más pequeña que h . En consecuencia, si una acción calculada a partir de una
cierta combinación de magnitudes es mucho más pequeña que h , seguro que no tiene
sentido físico.

Ejemplos:

1. Un reloj con partes móviles de tallas y masas típicas d ≈ 10 −4 m, m ≈ 10 −4 kg y


un tiempo característico τ ≈ 1 s.
A ≈ m d 2 τ −1 = 10 −12 Js ≈ 10 21 h ⇒ Mecánica Clásica

2. Una antena de radio de potencia P = 1 kW que emite a una frecuencia de ν = 1


MHz.
A ≈ Pν −2 = 10 −9 Js ≈ 10 24 h ⇒ Electrodinámica Clásica

3. El átomo de hidrógeno. La energía de ionización del átomo de hidrógeno es


E = 13.6 eV ≈ 2 × 10 −18 J . Su espectro de emisión se caracteriza por una
o
longitud de onda mínima λ ≈ 103 A que corresponde a una frecuencia
ν ≈ 3 × 1015 s-1.
A ≈ Eν −1 = 6.66 × 10 −34 Js ≈ h ⇒ Mecánica Cuántica

8
4. Núcleos. Los niveles de energía o las energías de ligadura entre nucleones se
miden en MeV. Por ejemplo, la energía media de ligadura por nucleón (protón o
neutrón) es típicamente E ≈ 8 MeV = 1.3 × 10 -12 J . Las dimensiones del núcleo,
deducidas de experimentos de dispersión de electrones, se miden en Fermis (
1 F = 10 -15 m ). Con la masa de un nucleón podemos formar una acción
característica:
A ≈ ME r0 = 4.5 × 10 −35 Js ≈ 0.06 h ⇒ Física Cuántica
Es un hecho remarcable que la Física Cuántica, desarrollada en un inicio para
explicar los fenómenos que se dan a escala atómica, siga siendo válida en Física
Nuclear donde las distancias son mucho más pequeñas y las energías mucho más
grandes.

Con la ayuda del análisis dimensional también es posible explorar las relaciones
que una teoría determinada establece entre las magnitudes físicas y los parámetros y
constantes fundamentales del problema. Una evaluación de los órdenes de magnitud
indicará si la elección de los parámetros fundamentales y, en consecuencia, los puntos
de partida de la teoría son razonables o no.

1.2.2 Átomo de hidrógeno

Queremos comprobar la validez de una teoría fenomenológica para explicar el


átomo de hidrógeno que se basa en la hipótesis de que la fuerza de ligadura entre el
protón y el electrón es debida a la interacción de Coulomb. A partir de la expresión
clásica para la fuerza coulombiana:
1 qe q p
F=
4πε 0 r 2
podemos definir la magnitud
q2
e2 = e
4πε 0
El análisis dimensional de esta constante fundamental del problema da como resultado:

[ e ] = ML T
2 3 −2

donde no intervienen magnitudes eléctricas. e 2 mide la intensidad de la interacción


entre dos cargas elementales en unidades puramente mecánicas. Por lo tanto, e 2 debería
intervenir en el cálculo de todas las magnitudes mecánicas del átomo.

e 2 = 2.30 × 10 −28 kg m 3 s −2

El resto de parámetros fundamentales que con e 2 caracterizan nuestra teoría


cuántica del átomo de hidrógeno son: ℏ , que da cuenta de la naturaleza cuántica de las
expresiones buscadas, y las masas de las partículas que intervienen en el problema. Si
además tenemos en cuenta que el deuterio y el tritio tienen propiedades atómicas
análogas a las del hidrógeno, podemos suponer que la masa relevante para el problema
es la del electrón (protón inmóvil en el centro del átomo). A partir de este conjunto de
parámetros fundamentales se pueden definir las unidades de energía, longitud, velocidad
del electrón, etc., que caracterizan el átomo de hidrógeno:

9
[me ] = M ; [ℏ] = ML2T −1; [ e ] = ML T
2 3 −2

• Se llama Rydberg a la cantidad:


me e 4
E= = 13.6 eV ,
2ℏ 2
que constituye un patrón de la energía del átomo de hidrógeno y donde el
factor 2 se introduce por comodidad.

• Se llama radio de Bohr a la unidad de longitud definida por:


ℏ2 o
a0 = = 0 . 53 A
me e 2

Las decenas de eV y los Angstroms están de acuerdo con las energías y


dimensiones típicas del átomo de hidrógeno, luego las hipótesis de nuestra teoría
fenomenológica del átomo de hidrógeno son razonables.

• Las velocidades típicas del electrón en el átomo de hidrógeno son del orden de :
e2
va ≈ = 2 × 10 6 m s -1 ,

mucho más pequeñas que la velocidad de la luz, lo que justifica que c no sea
un parámetro fundamental de la teoría cuántica del átomo de hidrógeno.

Dado que los órdenes de magnitud característicos del átomo de hidrógeno sólo
dependen de la masa, la carga del electrón y ℏ , estos mismos órdenes de magnitud
caracterizarán todos los fenómenos cuánticos ligados a la física del electrón; por
ejemplo, la Física Atómica, la Física Molecular y una gran parte de la Física de la
Materia Condensada, en estado sólido o líquido. El enlace molecular, por ejemplo, es
debido a interacciones residuales entre los electrones externos de los átomos que
constituyen la molécula. Estas interacciones moleculares tienen energías características
menores que las implicadas en los enlaces dentro del átomo. Típicamente, son del orden
del eV.

1.2.3 Electrodinámica Cuántica

Debido a que la combinación e 2 / ℏ es una velocidad, el cociente


e2
α=
ℏc
es un número sin dimensiones. Su valor es independiente del sistema de unidades:
1
= 137.037
α
y se conoce como constante de estructura fina. Esta constante caracteriza la fuerza de
acoplamiento entre la carga eléctrica elemental y el campo electromagnético. Por ello
modernamente se le ha dado el nombre de constante de acoplamiento electromagnético.
Esta constante interviene en todas las situaciones en que son importantes los efectos
cuánticos y relativistas en partículas cargadas. De hecho, α cuantifica los efectos sobre

10
las propiedades de las partículas cargadas debido a la interacción con el campo
electromagnético.
Las unidades naturales de la electrodinámica cuántica (teoría que considera a los
electrones como si sólo estuvieran acoplados a un campo electromagnético) son:

• Para la energía me c 2 = 0.51 MeV


• Para la longitud λC = = 3.8 × 10 −13 m ,
me c
que se conoce como longitud Compton del electrón.

Combinando las definiciones de α y del Rydberg se obtiene la siguiente expresión


para la energía de ligadura del electrón en el átomo de hidrógeno:
1
E = α 2 me c 2
2
El factor α puede interpretarse teniendo en cuenta que la interacción entre el protón y
2

el electrón se realiza a través de un campo electromagnético. El electrón interacciona


con el campo creado por el protón y el protón con el creado por el electrón, de ahí el
factor α 2 en la expresión de la energía de ligadura (o de formación del átomo).

1.3 Fotones

1.3.1 Postulado de Planck

A principios del siglo XX, Planck planteó el postulado que lleva su nombre para
explicar el espectro de radiación de una cavidad radiante (cuerpo negro) y, en particular,
la cuantización de la energía de los osciladores atómicos presentes en las paredes de la
cavidad y que se encuentran en equilibrio termodinámico con la radiación. A este
postulado se le puede dar la siguiente forma generalizada:

• Cualquier sistema físico con un grado de libertad cuya “coordenada” realiza un


movimiento armónico simple, sólo puede tener un valor de la energía total E
que satisfaga la relación
E = nhν ; n = 0, 1, 2, 3,... ,

donde ν es la frecuencia de oscilación y h la constante de Planck.

En este postulado la palabra coordenada se usa en sentido amplio, ya que se refiere


a cualquier magnitud que varíe sinusoidalmente con el tiempo (Ej.: campo eléctrico de
una onda electromagnética, longitud de un resorte, etc.)

• ¿Por qué esta cuantización de la energía no se observa en sistemas clásicos?

Ejemplo: Un resorte de constante k = 10 2 N/m del que pende una masa de 1 kg


que realiza un movimiento armónico simple de amplitud 1 cm.

11
1 k
ν= = 1.59 Hz
2π m
1
E = kA2 = 5 × 10 −3 J
2

La energía del sistema está cuantizada según el postulado de Planck, luego los
cambios en la energía sólo pueden realizarse en incrementos
∆E = hν = 1.05 × 10 −33 J .
Por lo tanto, la variación relativa de la energía es:
∆E / E = 2.1× 10 −31 ,
que no es detectable con ningún equipo experimental.

1.3.2 Teoría de Einstein para el efecto fotoeléctrico

En el modelo original propuesto por Planck para explicar el espectro de radiación


de la cavidad radiante, sólo se cuantizaban los estados energéticos de los osciladores
atómicos. En 1905, Einstein fue un poco más allá y postuló que la energía de una onda
electromagnética también estaba cuantizada (forma general del postulado de Planck).
De esta forma, Einstein cuestiona la validez ilimitada de la teoría de Maxwell que
proponía la distribución continua de la energía del campo electromagnético, y en su
lugar sugiere que la energía de la onda electromagnética estaba cuantizada en paquetes
localizados, que se propagan sin dividirse y sólo pueden ser absorbidos o generados
como unidades completas. Einstein supuso que cada uno de estos paquetes tenía una
energía dada por la relación de Planck-Einstein
E = hν
Esta idea es auténticamente novedosa ya que implica que las ondas electromagnéticas
están constituidos por un conjunto de cuasi-partículas (la energía se propaga localizada
en paquetes que se pueden contar), para referirse a las cuales el químico Gilbert N.
Lewis acuñó el término fotón en 1926. La ecuación de Planck-Einstein establece una
relación entre dos clases de objetos que en Física Clásica son totalmente disjuntos: las
ondas y las partículas. Relaciona la energía, que es un concepto clásicamente asociado a
las partículas, y la frecuencia, clásicamente asociada a las ondas. Esta relación se
establece a través de la constante de Planck (constante cuántica), que es la que modifica
la naturaleza de los conceptos implicados.
La relación de Planck-Einstein caracteriza un nuevo “objeto”, que sólo tiene sentido
en el marco de la Física Cuántica y que pertenece a una clase nueva de objetos físicos
que se llaman “cuantos”. El fotón, en particular, y en general todos los cuantos no son ni
ondas ni partículas, en el sentido clásico de estos términos. En realidad, representan un
nuevo concepto cuántico, que se manifiesta con carácter corpuscular u ondulatorio de
forma indistinta. Sólo en el límite clásico (cuando se ponen en juego muchos fotones y
la acción característica del proceso físico es mucho mayor que h ) recobran su sentido
clásico las propiedades ondulatorias (difracción, interferencias, etc.) de la onda
electromagnética en su conjunto.
A partir de la cuantización de la energía del fotón, Einstein logró dar una
explicación satisfactoria al efecto fotoeléctrico. Para ello estableció dos hipótesis.

• Un haz de luz monocromática de frecuencia ν está formado por un conjunto de


fotones de energía fija hν .

12
• Cada fotón interactúa con un solo electrón, comunicándole la energía hν , que
puede ser suficiente o no para abandonar el metal.

Cuando un fotón del haz incidente choca con un electrón del metal y es absorbido
por éste, le confiere la energía cinética
K = hν − W0 ,
donde W0 es la energía mínima necesaria para arrancar un electrón del metal (energía de
ligadura más pequeña), que normalmente se llama función de trabajo. Si hν < W0 no se
produce la emisión. La frecuencia umbral, a partir de la cual hay emisión de electrones,
corresponde a la condición
W
ν0 = 0 .
h
La función de trabajo es una característica de cada material, en consecuencia, la
frecuencia umbral también depende de la naturaleza del material.
La energía cinética K es la máxima que pueden tener los electrones que emergen
del metal, ya que corresponde a los electrones menos ligados. Por lo tanto, el potencial
de frenado vendrá dado por
eV f = hν − W0 ,
tal como previamente habíamos deducido en el apartado 1.1.1 a partir de razonamientos
empíricos.
La teoría de Einstein también explica porque la emisión del electrón es
prácticamente instantánea. Cada fotón excita un solo electrón, no siendo posible el
proceso por el cual un electrón va capturando fotones de energía hν < W0 hasta llegar a
la energía necesaria para abandonar el metal. Esto es debido a que un electrón que
absorbe una energía hν < W0 pasa a un estado excitado del metal, pero el tiempo de
desexcitación es tan pequeño que la probabilidad de absorber otro fotón en un tiempo
menor es prácticamente nula.

Ejemplos

• La función de trabajo para la mayoría de los metales que son buenos


conductores es del orden de algunos eV (típicamente 2 eV) y la frecuencia
umbral ν 0 ≈ 1014 − 1015 Hz ¿Se puede predecir que para explicar el efecto
fotoeléctrico será necesaria la teoría cuántica?
La acción característica implicada en el fenómeno de absorción de un fotón por
un electrón es
A = W0ν 0−1 = ( 2 eV ) (1.6 × 10−19 J/eV ) / ( 5 × 1014 Hz ) = 6.4 × 10−34 Js
A ≈ h ⇒ Física Cuántica

• Se ilumina una placa metálica mediante una fuente de luz amarilla


o
( λ = 5890 A ). Si la potencia que incide en cada m2 es 1 W, calcular el número
de fotones que inciden sobre la placa por unidad de tiempo y área.
1W 1 J 1 eV eV
= 2 = 6.25 ×1018 2
m 2
m s 1.6 × 10 J
-19
m s

13
Cada fotón tiene una energía
(
c (6.63 ×10 −34 Js) 3 × 108 m/s
E = hν = h =
)
= 3.4 × 10 −19 J = 2.1 eV
λ 5.89 × 10 −7 m
Por lo tanto, el número de fotones N que inciden sobre la placa por unidad de
tiempo y área vale
 eV  1 fotón fotones
N =  6.25 × 1018 2  = 2.98 ×1018 .
 m s  2.1 eV m 2s
Este ejemplo sugiere que la intensidad de una onda electromagnética se puede
considerar como el producto de N por hν (la energía de un fotón). De este
ejemplo, además, se puede ver que incluso para potencias bajas ( ≈ 1W ) el
número de fotones que atraviesan la unidad de área por unidad de tiempo es
enorme, de manera que la energía de cada uno de ellos es muy pequeña. En
consecuencia, la granularidad de la radiación es extremadamente fina y, en la
mayoría de los experimentos ordinarios, es muy difícil detectarla.

• En un experimento de efecto fotoeléctrico en sodio, se observa que el potencial


o o
de frenado es 1.85 V para λ = 3000 A y 0.82 V para λ = 4000 A . determinar el
valor de h , la función de trabajo del Na y la longitud de onda umbral.
hc
eV f = − W0 , por lo tanto
λ
eV f − eV f '
h= ≈ 6.6 ×10 −34 Js ,
c c

λ λ'
la función de trabajo es
hc
W0 = − eV f = 2.27 eV
λ
y la longitud de onda umbral
hc o
λ0 = = 5445 A .
W0

Comentarios

• En realidad, los fotones introducidos por Einstein son “partículas” con un cierto
momento lineal p y una energía E = hν . ¿Cómo se puede asociar un momento
lineal a una entidad física que no tiene masa en reposo?
m0 c 2 m c2
E= fotón
 → E = 0 → m0 = 0 .
1 − v 2 / c 2 v =c 0
Un fotón es una partícula con m0 = 0 y E = hν finita, e igual a su energía
cinética. Su momento lineal se puede evaluar a partir de la relación
E 2 = c 2 p 2 + (m0 c 2 ) 2 ,
teniendo en cuenta que m0 = 0
E hν h
p= = = .
c c λ

14
• Obsérvese que en el efecto fotoeléctrico el fotón es absorbido por el electrón.
Para que esto ocurra el electrón ha de estar ligado a un átomo o a un sólido, ya
que un electrón libre no puede absorber un fotón conservándose en el proceso la
energía y la cantidad de movimiento. Supongamos que el electrón se encuentra
en reposo antes de absorber el fotón de energía E = hν y momento p f = E / c .
Por lo tanto,
E + m0c 2 = m02c 4 + pe2c 2
p f = E / c = pe
y evidentemente este sistema no tiene solución para m0 ≠ 0 . Las fuerzas de
ligadura sirven para transmitir la cantidad de moviendo del fotón al átomo o al
sólido. Debido a que el átomo o el sólido tienen una masa mucho mayor que el
electrón, el sistema puede absorber una gran cantidad de momento sin variar
apreciablemente su energía.

• La interpretación del efecto fotoeléctrico fue una de las razones que se adujeron
en 1921 para conceder a Einstein el premio Nobel. Sin embargo, en el artículo
original, dicha explicación no supone el centro del trabajo, ni siquiera su
motivación principal, sino tan solo una de las aplicaciones de su nueva teoría de
la radiación electromagnética. El efecto de fotoemisión en sólidos, es decir la
emisión de carga negativa (el electrón todavía no había sido descubierto) como
respuesta a la incidencia de luz, había sido descrito por primera vez por Herzt en
1887. Posteriormente, otros científicos contribuyeron a la interpretación del
fenómeno (JJ Thomson descubre que la carga negativa se emite en forma de
electrones) y a la realización de medidas metódicas (Lenard), pero no fue hasta
el trabajo de Einstein en 1905 cuando se propuso la primera descripción teórica
del efecto fotoeléctrico en términos de la absorción de cuantos de luz por los
electrones del metal. Hoy en día, el efecto fotoeléctrico tiene importancia no
sólo porque contribuyo significativamente al desarrollo de las nuevas teorías
cuánticas, sino también porque está en la base de diversas técnicas de
caracterización espectroscópica que han podido desarrollarse en los últimos cien
años, y que se emplean en la actualidad para estudiar sólidos, superficies y,
átomos y moléculas en forma gaseosa.

• La hipótesis de la existencia del fotón es aplicable a la totalidad del espectro


electromagnético y no sólo a la región luminosa. En la Fig. 1.4, se indican las
energías de los fotones correspondientes a cada rango de longitudes de onda y
los procesos físicos que normalmente intervienen en su generación.

15
hν (eV )

107 106 105 104 103 102 101 100 10-1 10-2 10-3 10-4 10-5 10-6 10-7 10-8 10-9
λ (m )
10-13 10-12 10-11 10-10 10-9 10-8 10-7 10-6 10-5 10-4 10-3 10-2 10-1 100 101 102 103 104

Rayos γ Rayos X Ultravioleta Vis. Infrarrojo Micro-ondas Ondas de radio

Núcleos Electrones Electrones valencia Vibraciones moleculares Rotaciones moleculares


internos

Figura 1.4. Espectro electromagnético.

• Posteriormente a la formulación de Planck para explicar el espectro de radiación


del cuerpo negro, Bose y Einstein llegaron a ecuaciones análogas reemplazando
las ondas estacionarias clásicas, presentes en el interior de la cavidad radiante,
por un gas de fotones.

1.3.3 Cantidad de movimiento del fotón: efecto Compton

El efecto Compton es una confirmación más de la naturaleza corpuscular del fotón.


El experimento que lo pone de manifiesto se muestra de forma esquemática en la Fig.
1.5.

Fuente de
rayos X
Colimador

Material θ Detector

Figura 1.5. Esquema del dispositivo para la observación del efecto Compton.

Se envía un haz de rayos X sobre un material y se observa la intensidad dispersada


en función del ángulo θ . El haz de rayos X utilizado en el experimento tiene una
longitud de onda λ bien definida (haz monocromático).
Aunque el fenómeno ya había sido observado previamente, Compton realizó los
primeros experimentos rigurosos en 1923. Compton observó que para cada ángulo de
dispersión de la radiación, aparecía un máximo en la intensidad correspondiente a la
misma longitud de onda λ que el haz incidente, y un máximo secundario a una longitud
de onda más grande. La separación entre estos dos picos se hacía mayor al aumentar el
ángulo de observación θ , tal como se muestra en la Fig. 1.6.

16
θ = 0º

intensidad
θ = 45 º

θ = 90 º

θ = 135 º

0.700 0.750
o
λ( A )
Figura 1.6. Intensidad dispersada en un experimento de efecto Compton en función
del ángulo de dispersión θ .

La Física Clásica sólo explicaba el pico correspondiente a ∆λ = 0 , que se conoce


con el nombre de dispersión Thomson. Según la explicación clásica, los rayos X
penetran en los átomos del material, hacen oscilar los electrones, y como consecuencia
de esta vibración (cargas aceleradas) se emite radiación de la misma frecuencia que la
incidente. De acuerdo con este modelo, la intensidad emitida en función de θ viene
dada por
ne 4 ( 1 + cos2θ )
I (θ ) = I0 ,
2me r 2 c 4
donde I 0 es la intensidad incidente, me y e son la masa y la carga del electrón, r es la
distancia entre el blanco y el detector, y n es el número de átomos dispersores por
unidad de volumen. Esta expresión, debida a Thomson, sólo funciona para longitudes de
onda grandes o θ ≈ 0 . Sobre todo, no funciona bien para longitudes de onda pequeñas.
En particular, para θ > 0 y longitudes de onda pequeñas predice intensidades más
grandes que las observadas.

La intensidad del pico que aparece a λ + ∆λ depende del material que se utiliza
como blanco y es especialmente grande para materiales ligeros (materiales compuestos
por átomos con Z pequeño). Su origen es totalmente inexplicable mediante la Física

17
Clásica, lo que sugiere la existencia de algún mecanismo de dispersión que modifica la
longitud de onda y que no está contemplado en el modelo clásico.
En 1923, Compton da una explicación detallada de este proceso de dispersión a
partir de la siguiente hipótesis cuántica:

• El haz de rayos X está formado por un conjunto de fotones de energía hν , que


chocan inelásticamente con los electrones más débilmente ligados del blanco.
Cada fotón choca con un electrón, y este choque está gobernado por la
conservación del momento lineal y la energía.

Según esta hipótesis los fotones de “retroceso” que emergen del blanco constituyen
la radiación dispersada. Dado que el fotón incidente transfiere parte de su energía E al
electrón, el fotón dispersado deberá tener una energía E ' menor; y en consecuencia,
tendrá una frecuencia menor ( ν ' = E ' / h ) , lo que implica una longitud de onda mayor
(λ ' = c /ν ') . De esta forma se explica el llamado corrimiento Compton ∆λ = λ '−λ .
Comentarios

• ¿En qué se basa la hipótesis de que los fotones chocan con los electrones del
átomo? Se observa experimentalmente que la longitud de onda de la radiación
dispersada es independiente del material que forma el blanco. En consecuencia,
en el proceso de dispersión no interviene el átomo completo.

• ¿Por qué en la dispersión Compton sólo intervienen los electrones menos


ligados? Para electrones muy ligados, la probabilidad de absorción, y por lo
tanto, de que se produzca efecto fotoeléctrico, es mucho mayor que la
probabilidad de que se dé la dispersión Compton. De hecho, la probabilidad de
absorción crece como Z 3 .

Dado que el efecto Compton sólo tiene una probabilidad significativa de producirse
para electrones en que la energía de ligadura sea mucho menor que la energía del fotón
incidente, por simplicidad supondremos que, a efectos del cálculo, los electrones están
libres y en reposo.

y
E = hν E ' = hν '
hν hν '
pf = p' f =
c c

θ
ϕ x

Ee = m0c 2 E ' e = m0 c 2 + K
pe = 0 pe ≠ 0

Figura 1.7. Esquema de la colisión fotón-electrón en el efecto Compton.

18
En consecuencia, vamos a considerar en detalle el proceso de colisión entre un fotón y
un electrón libre en reposo. Para ello utilizaremos las ecuaciones de la Mecánica
Relativista, ya que el fotón siempre debe tratarse en ese contexto y el electrón después
del choque también se mueve en muchos casos a velocidades relativistas. En la Fig. 1.7,
se describe esquemáticamente el proceso de colisión. Aplicando la conservación de la
energía y del momento lineal
hν + m0c 2 = hν ' + m0c 2 + K
hν hν '
= cosθ + pe cosϕ
c c
hν '
0= sinθ − pe sinϕ
c
Elevando al cuadrado y sumando las dos ecuaciones de la conservación del momento
lineal se obtiene:
 hν   hν ' 
2 2
h2
 +
   − 2 2
νν ' cosθ = pe2 ,
 c   c  c
que combinada con la ecuación de la conservación de la energía y la ecuación:
(K +m c )0
2 2
= c 2 p 2 + m02c 4
permite obtener la relación
 1 1 h
c  −  = λ '− λ = ∆λ = ( 1 − cosθ ) ,
ν ' ν  m0c
o
donde h / m0 c = λC es la longitud de onda Compton, que adopta el valor λC = 0.0243 A .
Obsérvese que el corrimiento Compton ∆λ sólo depende del ángulo de dispersión
θ y no de la longitud de onda del haz incidente. Esta expresión predice los corrimientos
Compton observados experimentalmente. La anchura del pico se debe a que el electrón
inicialmente no está en reposo, tal como hemos supuesto en nuestro modelo
simplificado, sino que se mueve con una cierta velocidad alrededor del núcleo.
El desplazamiento Compton varía desde cero, para una colisión rasante, hasta
2h / m0 c = 0.049 Ǻ, para una colisión frontal con θ = 180 º .
En experimentos posteriores realizados por Compton, Wilson, Bothe, Geiger y
Blass, se detectó el electrón emergente después de la colisión, y se mostró que éste
aparece en coincidencia con la detección de un fotón dispersado. También se confirmó
cuantitativamente las predicciones para la energía y la dirección del electrón dispersado,
obtenidas del modelo de Compton.
h 2ν 2
K=
hν + m0 c 2 / ( 1 − cosθ )
cotg ϕ = ( 1 + hν / m0c 2 ) tg θ / 2

Comentarios

• El pico correspondiente a ∆λ = 0 también puede explicarse según el modelo de


Compton. Si el electrón que sufre la colisión con el fotón está fuertemente
ligado o la energía del fotón es muy pequeña, el electrón no es arrancado del
átomo, y podemos considerar que la colisión se produce entre el fotón y el

19
átomo completo. En este caso, la masa M del átomo es la que interviene en el
proceso; por lo tanto, el corrimiento Compton viene dado por:
∆λ =
h
( 1 − cosθ ) .
Mc
Para el átomo más ligero M / m0 ≈ 2000 , por lo tanto
∆λátomo 1
≤ ,
∆λelectrón 2000
que es prácticamente indetectable.

• El efecto Compton se manifiesta con mayor o menor intensidad según la región


del espectro electromagnético que consideremos.

1. La dispersión Compton es muy poco importante cuando la energía de


ligadura del electrón es grande comparada con la energía del fotón.

2. En el espectro visible, microondas y ondas de radio, ∆λ es mucho más


pequeño que λ y el efecto Compton no es detectable. En este caso, la
dispersión Thomson es la dominante y las predicciones clásicas y cuánticas
coinciden.

3. Para rayos X la dispersión Compton se hace importante, particularmente


para átomos con Z pequeño, para los cuales los electrones no están
fuertemente ligados.

4. En la región de los rayos γ, la energía del fotón es tan grande que durante el
proceso de colisión siempre se libera un electrón y domina la dispersión
Compton.

• La interpretación del efecto Compton contribuyó a dar soporte a la hipótesis de


la existencia de los cuantos (fotones) y, en particular, a demostrar la realidad de
la naturaleza corpuscular de las ondas electromagnéticas.

• Es interesante tener en cuenta que Compton además de explicar el origen


cuántico del corrimiento de la longitud de onda también dedujo una expresión
para la intensidad de los rayos X dispersados en función del ángulo (Phys. Rev.
21, 483 (1923)) que reproducía con muy buen acuerdo los resultados
experimentales. Esta ecuación es la siguiente:
1 + cos 2θ + 2α (1 + α )(1 − cos θ )
2
ne4
I (θ ) = I0
1 + α (1 − cos θ ) 
5
2me r 2 c 4
donde α = λC / λ ; y es válida también en el límite clásico correspondiente a
longitudes de onda largas ( α ≈ 0 ), ya que en ese límite se reduce a la expresión
deducida por Thomson. Por lo tanto, la ecuación de Compton para la intensidad
es válida tanto para el límite clásico (dispersión elástica de la radiación) como
para el rango de longitudes de onda en el que se observa efecto Compton
correspondiente a la dispersión inelástica de la radiación.

20
Ejemplo

• Calcular la pérdida porcentual de energía de un fotón que es dispersado un


o
ángulo de 90º por un electrón libre, en los tres casos siguientes: λ1 = 5500 A
o o
(visible), λ2 = 1.0 A (rayos X) y λ3 = 1.88 × 10 −2 A (rayos γ).
El corrimiento Compton para 90º es:
∆λ = λC ( 1 − cosθ ) = λC = 0.0243 A ,
o

independientemente de la longitud de onda del haz incidente. Los haces


dispersados tendrán las siguientes longitudes de onda:
o
λ '1 = 5500 + 0.0243 = 5500.0243 A
o
λ '2 = 1.0 + 0.0243 = 1.0243 A
o
λ '3 = 1.88 × 10 −2 + 0.0243 = 0.0431 A

Por lo tanto, las energías de los fotones incidentes y dispersados son


hc hc
E1 = = 3.61× 10 −19 J = 2.25886 eV E '1 = = 2.25885 eV
λ1 λ '1
E2 = 1.99 ×10 −15 J = 12.43 keV E ' 2 = 12.14 keV
E3 = 1.06 × 10 −13 J = 661 keV E '3 = 288 keV
La variación porcentual en tanto por uno, en cada uno de los casos, es:
 o

visible  λ = 5500 A  → 10 −5
 
 o

rayos X  λ = 1.0 A  → 0.023
 
 o

rayos γ  λ = 1.88 × 10 − 2 A  → 0.565
 

1.3.4 Naturaleza dual de la radiación electromagnética

Hemos visto dos ejemplos de fenómenos (efectos fotoeléctrico y Compton) que se


interpretan suponiendo que la radiación electromagnética está integrada por paquetes de
energía hν y cantidad de movimiento h λ . Además, tanto en la explicación del efecto
fotoeléctrico como del efecto Compton, hemos supuesto que los fotones se comportan
como partículas que colisionan con los electrones, verificándose las leyes de
conservación de la energía y de la cantidad de movimiento. Sin embargo, los
experimentos de difracción e interferencias muestran que la radiación electromagnética
tiene un comportamiento ondulatorio, que en el caso de una onda monocromática está
caracterizado por una longitud de onda λ y una frecuencia ν = c / λ .¿Cómo se pueden
conciliar estos dos conjuntos de experimentos, que parecen conducir a conclusiones
contradictorias acerca de la naturaleza de la luz?
Para entender mejor esta dualidad de comportamientos vamos a imaginar el
siguiente experimento: A través de una pequeña rendija dejamos pasar un haz de luz de
longitud de onda comparable al tamaño de la rendija y observamos la imagen de

21
difracción que se forma sobre una pantalla situada inmediatamente después (ver
esquema en la Fig. 1.8).

rendija

haz de luz

pantalla
Figura 1.8. Difracción de un haz de luz a través de una rendija.

Si la intensidad del haz luminoso es suficientemente grande, estaremos en el límite


clásico y en la pantalla se obtendrá la imagen de difracción correspondiente a la rendija.
Si ahora se repite el experimento con un haz de luz de muy poca intensidad, que permita
detectar la llegada de fotones individuales a la pantalla (por ejemplo, utilizando el efecto
fotoeléctrico), la curva de distribución espacial del número de impactos de fotones, que
alcanzan la pantalla, seguirá la imagen de difracción de la rendija que se había obtenido
en el primer experimento (ver Fig. 1.9).
Cuando en el experimento de difracción por una rendija se pone de manifiesto el
carácter corpuscular de la radiación (para intensidades muy bajas de la radiación), no
podemos predecir la trayectoria que va a seguir un fotón, sólo podremos conocer la
probabilidad de que alcance un punto determinado de la pantalla. La distribución de
probabilidad de los impactos coincidirá con la figura de difracción de la rendija
calculada utilizando las leyes de la Física Clásica.

P(n )

haz de luz

rendija pantalla

Fig. 1.9. Experimento de difracción fotón a fotón de un haz luminoso por una rendija.

22
El fotón pertenece a una familia de cuasi-partículas cuánticas que se conocen con el
nombre genérico de cuantos. Los cuantos tienen una naturaleza dual, y solamente
cuando la acción característica del proceso en el que intervienen es mucho mayor que
h , se manifiestan como ondas o como partículas sin ambigüedades. En los procesos
físicos en que h es comparable a la acción característica del fenómeno, los conceptos
de onda y partícula no están bien definidos, y en consecuencia, un cuanto podrá
manifestarse en cualquiera de las dos formas, dependiendo del experimento que se
realice.

1.4 Espectros atómicos. Átomo de hidrógeno

1.4.1 Antecedentes

Desde mediados del siglo XIX, se sabía que al proporcionar energía a los átomos de
un gas (por ejemplo, calentándolos) estos emitían radiación electromagnética. También
se observó que el espectro de la radiación emitida no era continuo, sino que estaba
formado por algunas longitudes de onda concretas, que eran características de cada
átomo. Este hecho es de gran importancia práctica, ya que convierte a la espectroscopia
en una técnica muy útil para el análisis químico.
Cada átomo tiene un espectro de radiación electromagnética formado por un
conjunto de longitudes de onda discretas (líneas espectrales), que depende únicamente
de la naturaleza del átomo y que lo identifica perfectamente. Por ello, se ha dedicado un
esfuerzo notable al desarrollo de instrumentos de medida de gran sensibilidad y a la
posterior interpretación de los espectros atómicos, lo que en general es muy complicado,
ya que estos están formados por cientos de líneas espectrales.
En la Fig. 1.10, se muestra esquemáticamente el dispositivo que típicamente se usa
para la obtención de los espectros atómicos.

Pantalla o placa
fotográfica

Haz de luz proveniente Prisma o red de


de la fuente difracción

Figura 1.10. Dispositivo experimental para la observación de espectros atómicos.

El haz de luz se consigue excitando un gas monoatómico mediante una descarga


eléctrica. La radiación se colima mediante una rendija y atraviesa un prisma (o una red
de difracción), donde se descompone en sus diferentes componentes espectrales. Sobre
la placa fotográfica se registran, en posiciones diferentes, diversas imágenes de la
rendija (una para cada longitud de onda).

23
Existen básicamente dos tipos de espectroscopias: emisión (que ya ha sido descrita
esquemáticamente en la Fig. 1.10) y absorción. En la primera de ellas, se suministra
energía a los átomos (mediante una descarga eléctrica; colisiones con electrones, rayos
X, etc.; o mediante absorción de luz) y se estudia la radiación electromagnética emitida
en la desexcitación posterior. Un caso particular de este tipo de experimentos es la
espectroscopia de fluorescencia. Se llama fluorescencia resonante al fenómeno por el
cual una sustancia remite radiación de la misma longitud de onda que la previamente
absorbida durante la excitación. En la Fig. 1.11, se muestra un ejemplo típico.

vapor
luz transmitida
de Na

lámpara de
sodio
Fluorescencia
Figura 1.11. Experimento de fluorescencia resonante con átomos de Na.

En los experimentos de absorción, un haz formado por un espectro continuo de


longitudes de onda se hace pasar a través del gas de átomos que se quiere estudiar. En el
espectro de la radiación transmitida, se observa que la intensidad correspondiente a
algunas longitudes de onda determinadas está atenuada (líneas de absorción).
Para caracterizar el espectro de un átomo se suelen utilizar las siguientes
magnitudes:

• Longitud de onda. A cada línea espectral le corresponde una longitud de onda


determinada. Para establecer la equivalencia entre las posiciones de las líneas
espectrales y sus longitudes de onda se utiliza un espectro conocido. Por
ejemplo, una longitud de onda utilizada de forma estándar para calibración es la
línea roja del 86Kr,
o
λvacío = 6057.80211 A .
Las longitudes de onda en el aire son siempre ligeramente más pequeñas. Por
ejemplo, para la línea roja del 86Kr
o
λaire = 6056.12941 A .

• Frecuencia. Esta magnitud tiene un carácter más general que la longitud de onda,
ya que su valor no depende del medio.
c
ν= .
λvacío

24
• Número de ondas. Es una magnitud que se emplea con mucha frecuencia en
espectroscopia. Se define como
ν
ν= =
1
c λvacío
; ( )
ν 86 Kr = 16507.6373 cm-1 .

En general, los espectros atómicos son muy complejos (contienen cientos de


líneas), sin embargo, el espectro del átomo de hidrógeno es relativamente simple, lo
cual no es demasiado sorprendente ya que este átomo tiene un solo electrón. Vamos a
tratar de entender el origen físico de los espectros atómicos estudiando el
correspondiente al átomo de hidrógeno. En un inicio, la mayoría de los espectros de
hidrógeno atómico se obtuvieron de observaciones astronómicas, debido a la dificultad
que existe para aislar hidrógeno atómico (la forma más común del hidrógeno gas es la
molécula H2). De esta forma, se obtuvo un espectro como el que se muestra en la Fig.
1.12.
n 3 4 5 6 7 8
4101.7 3889.1

o
λ (A ) 6562.8 4861.3 4340.5 3970.1 3645.6
Color Rojo Azul Violeta Ultravioleta
Figura 1.12. Espectro visible y ultravioleta cercano del átomo de hidrógeno.

El espectro del átomo de hidrógeno presenta una regularidad obvia en la


distribución de las líneas que lo forman. Esta regularidad indujo a muchos
investigadores a buscar una fórmula empírica que predijera la longitud de onda de las
líneas. En 1885, Balmer descubre una ecuación muy simple que predice la posición de
las primeras seis líneas con un error menor que el 1 por 1000.
1 1 1 
ν = = 1.0972 × 107  − 2  m -1 ; n ≥ 3 .
λvacío 4 n 
Estas seis líneas corresponden a las regiones del visible y el ultravioleta cercano y, en
aquella época, no se conocían más. Animado por el éxito de la fórmula de Balmer,
Rydberg intenta encontrar una ecuación parecida para otros átomos más pesados, y así
propone
1 R
ν= = A− ,
λvacío (n + α )2
donde R es la llamada constante de Rydberg que vale
R = 1.09677576 ×10 7 m -1
para el hidrógeno, n es un número natural y, A y α son constantes que dependen de la
serie espectral y del átomo considerado. Nótese que el valor de la constante de Rydberg
para el átomo de hidrógeno es muy parecido al prefactor propuesto por Balmer en la
fórmula que lleva su nombre. En realidad, las diferencias se deben sólo a errores
experimentales en la determinación realizada por Balmer. La constante de Rydberg
muestra un ligero incremento sistemático de sólo un 0.05% al recorrer todos los
elementos en orden creciente del peso atómico.

25
En 1908, Ritz descubre que ν para muchas líneas espectrales se puede calcular a
partir de diferencias entre los valores de ν para otras líneas espectrales, y que la
constante A para cada serie espectral corresponde a un valor particular de un término
parecido al segundo de la fórmula de Rydberg.
 1 1 
ν=R − 2
; n > m.
 (m + β ) (n + α ) 
2

En la expresión de Ritz, α y β son constantes que sólo dependen del elemento


considerado. La constante m adopta un valor diferente para cada una de las series
espectrales de un elemento. Se debe cumplir que n > m para las líneas de una misma
serie espectral. A partir de esta expresión se puede reproducir la fórmula de Balmer
haciendo α = β = 0 y m = 2 .
En 1908, Paschen encuentra otra serie de líneas espectrales para el hidrógeno en la
región del infrarrojo, que corresponden a α = β = 0 y m = 3 . Posteriormente, se
descubren nuevas series de líneas espectrales para el hidrógeno y, en todos los casos, los
valores de los números de onda correspondientes pueden calcularse a partir de la
fórmula de Ritz con α = β = 0 y diferentes valores de m . Por lo tanto, la fórmula
general que reproduce las series espectrales del átomo de hidrógeno es
 1 1 
ν=R 2 − 2 ; n>m
m n 

Lyman Ultravioleta m =1 n = 2, 3, 4...


Balmer Ultrav.+visible m=2 n = 3, 4, 5...
Paschen Infrarrojo m=3 n = 4, 5, 6...
Brackett Infrarrojo m=4 n = 5, 6, 7...
Pfund Infrarrojo m=5 n = 6, 7, 8...

Hasta aquí, sólo hemos analizado los espectros de emisión de los átomos. La
información que se puede obtener a partir de los espectros de absorción es
esencialmente la misma. De hecho, todas las líneas que aparecen en un espectro de
absorción se corresponden con líneas del espectro de emisión. Pero la afirmación
contraria, en general, no es verdad. Por ejemplo, en el espectro de absorción del átomo
de hidrógeno, sólo aparece la serie de Lyman. Sin embargo, cuando el gas se encuentra
a muy alta temperatura (superficie de una estrella), las líneas que aparecen corresponden
a la serie de Balmer.
La regularidad de los espectros atómicos y el éxito logrado con la fórmula de Ritz
para predecir las series espectrales del hidrógeno condujo a los científicos de la época a
buscar un modelo del átomo que explicara toda esta fenomenología. A principios del
siglo XX (1910), ya había una fuerte evidencia experimental de que los átomos
contenían electrones; por ejemplo, a través de experimentos de efecto fotoeléctrico o
dispersión de rayos X (efecto Compton). Estos experimentos proporcionaron una
estimación del número de electrones Z contenidos en el átomo. Puesto que los átomos
normalmente son neutros, debían contener la misma cantidad de carga positiva y
negativa. En consecuencia, se supuso que el átomo contenía − Ze carga negativa y Ze
carga positiva. Una vez aceptado esto, a los físicos se les planteó el problema de cómo
se encontraba distribuida esta carga en el átomo y se plantearon diversos modelos, que
explicaban con mayor o menor acierto las distintas observaciones experimentales que se
conocían en aquella época.

26
1. Modelo de Thomson. J.J. Thomson propuso un modelo para el átomo según el
cual los electrones se encontraban inmersos en una distribución de carga positiva
continua, de forma esférica, con un radio cuyo orden de magnitud se estimó en
10-10 m (valor obtenido a partir de la densidad de un sólido, su peso atómico y el
número de Avogadro). Este modelo no explicaba correctamente los espectros de
emisión atómicos ya observados en aquella época.

r ≈ 10−10 m

Figura 1.13. Átomo de Thomson.

2. Modelo de Rutherford. En el año 1911, E. Rutherford obtuvo, de experimentos


de dispersión de partículas α por átomos, evidencias definitivas de que la carga
positiva no estaba distribuida a lo largo de todo el átomo, sino concentrada en
una región muy pequeña: el núcleo atómico. Esta hipótesis equivale a suponer
que esencialmente la masa del átomo se halla concentrada en el núcleo, cuyo
radio fue estimado por Rutherford en 10-14 m.

rn ≈ 10 −14 m r ≈ 10−10 m

Figura 1.14. Átomo de Rutherford.

El modelo de Rutherford explicaba correctamente la dispersión de partículas α


(átomos de helio ionizados) por los átomos, pero dejaba ciertas cuestiones sin respuesta;
por ejemplo, la propia estabilidad del átomo. Si los electrones se encontraban en
posiciones estacionarias alrededor del núcleo positivo, el sistema no podía ser estable
debido a las fuerzas electrostáticas. Si los electrones circulaban alrededor del núcleo, en
órbitas similares a las de los planetas, deberían emitir radiación electromagnética
constantemente a expensas de la energía total mecánica (cargas aceleradas) y, en
consecuencia, caerían hacia el núcleo siguiendo una órbita en espiral, en un tiempo de
unos 10-12 s.

27
Por otro lado, la regularidad de los espectros atómicos y la simplicidad de la
fórmula de Ritz llevaron a muchos físicos a pensar que se debían buscar hipótesis
nuevas para explicar de forma completa la estructura atómica.

1.4.2 Átomo de Bohr

La ecuación de Ritz para las líneas espectrales del hidrógeno no podía obtenerse a
partir de modelos clásicos. Por ello, Niels Bohr, en 1913, propuso una teoría que partía
del modelo de Rutherford y que explicaba totalmente el espectro del átomo de
hidrógeno. Esta teoría mezclaba nuevas hipótesis cuánticas con conceptos de la Física
Clásica. En particular, el modelo de Bohr permitía obtener la constante de Rydberg en
función de otras constantes conocidas. Los postulados en los que se basa el modelo de
Bohr son los siguientes:

1. Un átomo está constituido por un núcleo pesado con carga positiva, alrededor
del cual giran los electrones en órbitas estacionarias, de acuerdo con las leyes de
Newton.

2. A pesar de que los electrones están cargados y se mueven con una cierta
aceleración, no emiten radiación electromagnética (como predice el
electromagnetismo clásico), a no ser que cambien de órbita.

3. Sólo se emite radiación electromagnética cuando el electrón pasa de un estado


estacionario con energía Ei a otro estado estacionario con energía E f . La
frecuencia de la radiación emitida viene dada por
E − Ef
ν= i ; Ei > E f .
h
Evidentemente esta ecuación sólo es válida cuando Ei > E f .

4. Del continuo de orbitales posibles en Mecánica Clásica sólo están permitidos


aquellos en los que el momento angular total L es un múltiplo entero de ℏ .

Ef
Ei − E f
Ei ν=
h
Figura 1.15. Átomo de Bohr.

En el modelo de Bohr, los estados estacionarios de los electrones (órbitas


electrónicas) están determinados a partir de la Física Clásica, pero las transiciones entre
estos estados y su estabilidad se explican utilizando nuevas hipótesis cuánticas. Bohr
utilizó conceptos clásicos para proporcionar imágenes físicas útiles, pero sin darles

28
exactamente el mismo significado que tenían clásicamente (por ejemplo, la cuantización
del momento angular). Sin embargo y a pesar del éxito del modelo, Bohr fue uno de los
primeros en ser consciente de que era necesario desarrollar una nueva teoría cuántica
completa.
Vamos a construir un modelo para átomos hidrogenoides (átomos o iones que
contienen un electrón), basado en los postulados de Bohr, que permita interpretar los
espectros atómicos. Supongamos un átomo o un ion, formado por un electrón que gira
en órbitas circulares alrededor de un núcleo de carga Ze . Dado que el núcleo es mucho
más pesado que el electrón, podemos tomar el origen de coordenadas en el centro del
núcleo, ya que éste prácticamente se corresponde con el centro de masas del sistema. En
realidad, estamos analizando un sistema de masa reducida
M me
µ= ,
M + me
que gira alrededor de su centro de masas, debido a la interacción electrostática entre el
núcleo y el electrón. La condición de estabilidad de la órbita es
1 Ze 2 v2
= µ ,
4πε 0 r 2 r
donde ν es la velocidad del electrón y r el radio de la órbita. Si tenemos en cuenta que
el momento angular L es una constante del movimiento y que para una órbita circular
L = µ v r , y además aplicamos la condición de cuantización del momento angular
µ v r = nℏ = L .
Sustituyendo v en la condición de estabilidad de la órbita se obtiene
n2ℏ 2
Ze = 4πε 0
2
,
µr
de donde
n 2ℏ 2
r = 4πε 0 n = 1, 2, 3...
µ Ze 2
y como v = nℏ / µ r
1 Ze 2
v= n = 1, 2, 3...
4πε 0 nℏ
Por lo tanto, la condición de cuantización de L restringe el número de valores posibles
del radio de la órbita a los proporcionados por la expresión anterior para diferentes
valores del número natural n . Por ejemplo, para un átomo de hidrógeno con Z = 1 y
µ ≈ me , la órbita más ligada corresponde a
o
r ≈ 5.3 × 10 −11 m = 0.53 A
y esta órbita es precisamente la que tiene menor energía (órbita más ligada). La
velocidad del electrón es esta órbita es
v ≈ 2.2 × 10 6 m/s
(velocidad máxima del electrón en el átomo de hidrógeno), que es menor del 1% de la
velocidad de la luz. Esto justifica el porqué podemos utilizar la Mecánica Clásica para
el cálculo de las órbitas y no es necesario utilizar una aproximación relativista. Para
valores grandes de Z , la velocidad del electrón se hace relativista y el modelo deja de
ser válido.
Vamos a calcular, ahora, la energía total del sistema cuando el electrón se encuentra
en una órbita permitida.

29
1 Ze 2
K= µv =
2

2 4πε 0 2 r
Ze 2
V =−
4πε 0 r
Por lo tanto, E = K + V viene dada por
Ze 2
E=− .
4πε 0 2r
Sustituyendo la expresión para r se obtiene
µ Z 2e4 1
E=− n = 1, 2, 3...
( 4πε 0 ) 2ℏ n 2
2 2

La cuantización del momento angular total conduce, a su vez, a la cuantización de la


energía total E .
Si ahora utilizamos el tercer postulado de Bohr, podemos calcular la frecuencia de
la radiación emitida cuando el átomo se desexcita desde el estado caracterizado por el
número cuántico n2 hasta el estado n1 (n2 > n1 ) ,
En − En 1 µ Z 2e 4  1 1 
ν= 2 =  − 2 
3  2
h (4πε 0 ) 4π ℏ  n1 n2 
2

y el número de ondas ν vendrá dado por


µ Z 2e 4 1 1
ν=  − .
(4πε 0 ) 4π ℏ c  n12 n22 
2 3

Por ejemplo, para el átomo de hidrógeno Z = 1


µ e4  1 1  1 1
ν=  −  = RH  2− 2 ,
( 4πε 0 ) 4π ℏ3 c  n12 n22 
2
 n1 n2 
que coincide con la expresión empírica deducida por Ritz. La constante de Rydberg
experimental coincide, dentro del error, con el valor que se obtiene a partir de la
expresión anterior. Si se supone que el núcleo tiene masa muy grande respecto al
electrón, µ = me y la constante de Rydberg adopta un valor ligeramente diferente
RH = 109677.584 cm -1
R∞ = 109737.318 cm -1
Las medidas espectroscópicas disponibles hoy en día son tan precisas que permiten
comprobar que la constante de Rydberg correcta para el átomo de hidrógeno es el valor
dado para RH .
En realidad, la constante de Rydberg no es más que la energía del estado
fundamental del átomo de hidrógeno cambiada de signo y expresada en unidades de
inverso de longitud, a partir de la relación E = hν . A partir de la expresión deducida
anteriormente para la energía total del átomo hidrogenoide se puede ver que
E H (n = 1) = −13.6 eV ,
resultado que está en muy buen acuerdo con la energía de ionización medida
experimentalmente.

30
1.4.3 Niveles de energía del átomo de hidrógeno y espectros atómicos

El descubrimiento de la existencia de estados energéticos discretos y bien definidos


en el átomo de hidrógeno tuvo consecuencias muy importantes para el desarrollo
posterior de la Física Cuántica. En la Fig. 1.16 se representa el esquema de niveles
energéticos para el átomo de hidrógeno.

n E(eV)
∞ 0
5 -0.54
4 -0.85
Brackett Pfund
3 -1.51
Paschen

2 -3.39
Balmer

Lyman

1 -13.6

Figura 1.16. Diagrama de niveles del átomo de hidrógeno.

El átomo de hidrógeno no excitado está en el nivel de energía más bajo (n = 1) , que


se conoce con el nombre de estado fundamental. Cuando el átomo absorbe suficiente
energía, por ejemplo de la agitación térmica, transita a uno de los estados excitados con
n > 1 . Existen muchas formas de proporcionar energía a un electrón que está ligado en
un átomo. Por ejemplo, puede chocar con un electrón libre o absorber un fotón. Si la
energía cinética de un electrón incidente sobre un átomo es menor que 13.6 eV y mayor
que 10.21 eV (distancia energética entre el estado fundamental y el primer estado
excitado), como resultado de la colisión el átomo absorbe justo la energía necesaria para
pasar a uno de los estados excitados con n > 1 . Después, el átomo decae
espontáneamente a un nivel más bajo, repitiéndose el proceso de desexcitación hasta
alcanzar de nuevo el estado fundamental. En cada salto energético se libera un fotón de
energía exactamente igual a la diferencia energética entre los dos niveles involucrados.
De acuerdo con la teoría de Bohr, una serie espectral de un espectro de emisión es un
conjunto de líneas que corresponden a transiciones que todas ellas acaban en el mismo
estado final. Por ejemplo, la serie de Balmer corresponde a todas las transiciones que
acaban en n = 2 . La fórmula de Bohr también predice que las líneas espectrales para
una serie dada tienden a una frecuencia límite ( n1 fijo y n2 → ∞ ). Por ejemplo, el valor
límite del número de onda para una serie espectral determinada por n1 viene dado por la
siguiente expresión:

31
RH
ν límite
n
1
=
n12
Si un electrón libre con E > 0 es capturado por el átomo ionizado, se emite un
fotón de energía igual a la que tenía el electrón más la necesaria para pasar al primer
estado ligado. Como la energía del electrón libre puede adoptar cualquier valor (energía
cinética), el fotón emitido durante el proceso de captura puede tener cualquier valor de
la frecuencia por encima del límite de convergencia de la serie espectral que
corresponda al estado ligado. Por lo tanto, el proceso de captura de electrones libres por
átomos ionizados dará lugar a un espectro continuo de emisión.
Cuando Bohr publicó su trabajo, sólo se conocían algunas líneas de la serie de
Balmer (n1 = 2) y de Paschen (n1 = 3) . Su fórmula para ν permitió predecir el resto de
series descubiertas más tarde (Lyman 1914 n1 = 1 ; Brackett 1922 n1 = 4 y Pfund 1924
n1 = 5 ). Otra aplicación espectacular de la fórmula de Bohr fue la interpretación de las
líneas espectrales observadas por E.C. Pickering en 1897, en la radiación de la estrella
ζ-Puppis. Bohr dio una explicación a esta serie espectral con n1 = 3 y n1 = 4 para
Z = 2 , o sea, He ionizado en estados excitados.
Como ya hemos visto, no sólo se pueden excitar átomos mediante colisiones con
cargas aceleradas; también se puede conseguir el mismo efecto mediante la absorción de
fotones. Si la energía del fotón incidente es mayor que la energía de ionización, éste
podrá ser absorbido por el átomo y el electrón liberado tendrá una energía cinética
K = hν − Eion ,
donde Eion es la energía de ionización del átomo. Este es el proceso que hemos llamado
efecto fotoeléctrico, que se puede representar esquemáticamente por
γ + A → A+ + e - .
Supongamos, por ejemplo, que un electrón en el estado fundamental del átomo de
hidrógeno absorbe un fotón de 20 eV. El electrón adquiere suficiente energía para
liberarse del núcleo (el átomo se ioniza) y todavía le quedan 6.4 eV en forma de energía
cinética.
Si la energía del fotón es más pequeña que la energía de ionización, sólo pueden ser
absorbidos aquellos fotones cuya energía sea exactamente igual a alguna diferencia
energética entre niveles del átomo. Podemos esquematizar este proceso como
γ + A → A* .
Dado que el efecto Compton para electrones ligados no está prohibido, no se puede
descartar la absorción de un fotón más energético que la diferencia entre dos niveles,
acompañada de la emisión de la energía sobrante en forma de un fotón de longitud de
onda mayor. Este proceso se puede esquematizar como
γ + A → γ’ + A* ( λ < λ ' ).
De todas formas, la probabilidad de que tenga lugar este proceso es muy pequeña y no
lo vamos a tener en cuenta.
Vamos a estudiar estos fenómenos en un ejemplo concreto: el espectro de absorción
de átomos de hidrógeno. Imaginemos que sobre un gas de átomos de hidrógeno en el
estado fundamental se hace incidir fotones de un continuo de longitudes de onda para
obtener el espectro de absorción. Sólo serán absorbidos aquellos fotones que
corresponden a la serie de Lyman, en la región del ultravioleta. Para el resto de la
radiación visible e infrarroja el H atómico será transparente. Después de ser excitados,
los átomos volverán a su estado fundamental reemitiendo la radiación absorbida en
todas direcciones, con lo cual, la intensidad en la dirección del haz incidente será
ligeramente menor para aquellos valores de λ que corresponden a las transiciones

32
previamente excitadas (ver Fig. 1.11 para el caso del Na). De esta forma, observaremos
líneas más oscuras sobre un fondo continuo de longitudes de onda.
En general, es más fácil interpretar un espectro de absorción que uno de emisión, ya
que el número de líneas espectrales es menor en el primer caso. Es frecuente que en los
espectros de absorción sólo aparezca una seria de líneas, a partir de las cuales se pude
reproducir todo el espectro de emisión. En la práctica, hay que tener en cuenta que no
todas las transiciones están permitidas, ya que existen las llamadas reglas de selección
por las que algunas transiciones están prohibidas.
La espectroscopia de absorción se utiliza frecuentemente en Astrofísica para
identificar los elementos contenidos en la atmósfera de una estrella. La superficie de una
estrella está a muy alta temperatura y prácticamente emite un espectro continuo de
radiación. Cuando esta radiación atraviesa la atmósfera de la estrella, las frecuencias
correspondientes a transiciones atómicas permitidas serán parcialmente absorbidas y
observaremos que la radiación saliente está atenuada para algunas frecuencias
concretas. De esta forma se descubrió el He en la superficie del Sol antes de encontrarlo
en la Tierra. En realidad, el He observado en la superficie del Sol era He monoatómico
ionizado (He+).

33
34
Apéndice 1.A. Dinámica Relativista

En la teoría especial de la relatividad se deben utilizar las transformaciones de


Lorentz, en lugar de las usadas en Física Clásica (transformaciones de Galileo), para
transformar las variables de espacio y tiempo entre dos sistemas que se mueven a
velocidad constante uno respecto al otro. Este hecho se fundamenta en la observación
experimental de que la velocidad de la luz en el vacío es independiente del movimiento
del observador y de la fuente. El uso de las transformaciones de Lorentz lógicamente
implicará modificaciones en las ecuaciones de la Mecánica, respecto a la forma que
adoptan en Física Clásica. Sin embargo, es posible preservar en su forma original las
siguientes tres ecuaciones fundamentales de la Mecánica Clásica:

dp
F= ; donde p es el impulso mecánico de la párticula sobre la que actúa F ;
dt
   
 ∑ p =  ∑ p ; conservación del impulso total en un sistema aislado;
 partículas  inicial  partículas  final
p = mv : impulso lineal de una párticula;

siempre que supongamos que la masa de las partículas es función del módulo de su
velocidad m ≡ m(v ) . La forma explícita de esta función está por determinar. Sin
embargo, sabemos que, en el límite v / c << 1 , m (v ) = m0 , donde m0 es la masa de la
partícula medida clásicamente, ya que en este límite las transformaciones de Lorentz se
reducen a las de Galileo.
Para evaluar la función m(v ) vamos a considerar el siguiente experimento
imaginario. Tal como se muestra en la Fig. 1.A.1, los observadores O1 y O2 se mueven
en direcciones paralelas al eje de las x , con velocidades de magnitud igual pero
direcciones opuestas. Cada uno de los observadores lanza una bola de billar (B1 y B2,
respectivamente), de masa m0 medida cuando están en reposo, de forma que sigan
trayectorias de colisión, tal como se muestra en la Fig. 1.A.1 desde un sistema de
referencia en reposo.

y O2

θ2 f B2 θ 2i

x
θ1i θ1 f
B1

O1

Figura 1.A.1. Colisión entre las dos bolas vista desde un sistema en reposo respecto a
O1 y O2 .

35
Suponiendo válida la conservación del impulso lineal y que la colisión es elástica,
es fácil demostrar que θ1 f = θ 2 f y que los módulos de las velocidades de las bolas son
los mismos antes y después de la colisión.
Sin embargo, según el punto de vista de los observadores O1 y O2, cada uno lanza
su bola para impactar sobre la otra con una velocidad dirigida perpendicularmente al eje
de las x y de módulo u . Por ejemplo, desde un sistema de referencia que se mueve
solidario con O1, la bola B1 es lanzada siguiendo una dirección paralela al eje y con
una velocidad de módulo u (ver Fig. 1.A.2), que supondremos muy pequeña respecto a
c . En cambio, según O1 la bola B2 mantiene una componente x de la velocidad igual a
v , que es la velocidad relativa entre O1 y O2, y que supondremos cercana a c . También,
según O1 la componente y de la velocidad de B2 cambia de signo después de la colisión
pero mantiene constante su magnitud. Para evaluar su magnitud se supone que la
componente y de la velocidad de B2 medida por O2 es u . Transformando esta
velocidad al sistema de referencia de O1 se obtiene u 1 − v 2 / c 2 para la componente y
de la velocidad de B2 medida por O1 (ver Fig. 1.A.2).

u 1 − v2 / c2 v
v B2 u 1 − v2 / c2

y
B1
u

O1
x
Figura 1.A.2. Colisión vista desde el sistema de referencia de O1.

Es obvio de la Fig. 1.A.2 que si las masa de B1 y B2 son iguales no se puede


conservar el impulso mecánico total a lo largo del eje y . Sin embargo, si suponemos
que la masa de las partículas es función del módulo de su velocidad y que v >> u
podremos escribir la siguiente ecuación:
m(u ) u − m(v ) u 1 − v 2 / c 2 = 0 ;
de la que se puede despejar
m(v ) = m(u ) =
1 1
m0 ,
1− v / c
2 2
1 − v2 / c2
donde se ha supuesto que m(u ) = m0 ya que u es muy pequeña respecto a la velocidad
de la luz. Por lo tanto, una teoría de la mecánica relativista, consistente con la
conservación del impulso lineal, requiere que la masa m(v ) de una partícula, medida
cuando ésta se mueve con una velocidad de módulo v , debe ser: su masa en reposo m0
multiplicada por el factor 1 / 1 − v 2 / c 2 . A la masa m(v ) se le llama masa relativista de
la partícula.
Vamos a obtener ahora una expresión para la energía relativista de una partícula de
masa en reposo m0 . Supongamos que la partícula se encuentra inicialmente en reposo

36
en x = 0 . Si se le aplica una fuerza F en la dirección positiva del eje x , la partícula se
moverá debido al trabajo K realizado por la fuerza. En particular, se puede evaluar el
trabajo realizado por F entre 0 y x f a partir de la expresión
xf tf tf
dx
K= ∫
0
Fdx = ∫0
F
dt
dt = ∫
0
Fv dt ,

donde t f es el instante en el que la partícula llega a x f . Si suponemos que sigue siendo


válida la segunda ley de Newton en su forma original (con m(v ) ) tendremos que
tf vf vf

dt = ∫ v dp = [vp ]0 f − ∫ p dv ,
dp
K=∫ v
v

0 dt 0 0

donde la integral se ha calculado por apartes. Substituyendo p en esta expresión por


m0v 2
p = mv =
1 − v2 / c2
( )
y escribiendo v dv como d v 2 / 2 , se obtiene que

( )
vf vf
 m v2  m
vf
d v2  v2 / c2 
K = 0

 1 − v 2 / c 2  0
− 0
2 ∫
0 1 − v2 / c2
= m0c 2 
 1 − v 2 / c 2
+ 1 − v2 / c2 
 0
m0c 2
= − m0c 2
1− v /c 2 2

donde el subíndice f se ha eliminado para simplificar la notación.


En la Mecánica Clásica, el trabajo K , que acabamos de calcular, coincide con la
energía cinética de la partícula en el instante t f . De hecho, la expresión anterior en el
límite clásico v / c << 1 se puede desarrollar como
−1 / 2
 
2  v2  2  1 v 2  m0v 2
K = m0c  1 − 2  − 1   → m c  1 + −1 = .
2 c 2 
v 0
 c   c <<1  2
Por ello, se puede suponer que, en el caso relativista, K también coincide con la energía
cinética relativista de la partícula. Por otro lado, la expresión relativista para K (v ) nos
indica que esta magnitud se obtiene a partir de la diferencia entre una energía que
depende de la velocidad y una energía constante (m0c 2 )
K (v ) = E (v ) − E (0) ,
donde E (v ) = m0c 2 / 1 − v 2 / c 2 = mc 2 y E (0) es el valor de E (v ) para v = 0 . Para
identificar las energías que intervienen en esta expresión es más conveniente reordenar
los términos en la forma
E (v ) = K (v ) + E (0 ) = K (v ) + m0c 2 = mc 2 .
Esta ecuación nos proporciona la energía total (energía relativista) de una partícula que
se mueve con velocidad v , siendo ésta la suma de su energía cinética relativista y una
energía intrínseca E (0) asociada con la partícula cuando se encuentra en reposo
(energía de la masa en reposo). Esta última ecuación establece la famosa relación de
Einstein entre la masa relativista de una partícula y su energía total.
En muchos casos, es conveniente disponer de una expresión para la energía total
relativista que contenga explícitamente el impulso lineal p . Para ello, evaluaremos la
diferencia

37
 1  v2 / c2
m 2c 4 − m02c 4 = m02c 4  − 1 = m 2 4
c = c 2 m 2v 2 = c 2 p 2 ,
1− v / c 1− v /c
2 2 0 2 2

o lo que es lo mismo
m 2c 4 = c 2 p 2 + m02c 4
E = c 2 p 2 + m02c 4
A pesar de que todas las hipótesis que hemos utilizado aquí para deducir las
ecuaciones de la Mecánica Relativista parecen razonables, su justificación última se
obtiene al comparar las predicciones de la teoría con los resultados experimentales.
Por último, es importante hacer notar que a partir de desarrollos más complejos que
los efectuados aquí se puede demostrar que ni la segunda ley de Newton ni las
ecuaciones de Maxwell cambian de forma bajo la acción de una transformación de
Lorentz. Sin embargo, estos mismos cálculos demuestran que tanto la fuerza como los
campos eléctrico y magnético sí cambian ante una transformación de Lorentz.

38
Apéndice 1.B. Espectros de rayos X. Ley de Moseley

Se llama rayos X a la radiación electromagnética que tiene una longitud de onda


entre 10-9 y 10-11 m. Fue descubierta en 1895 por Roentgen. Sus características
principales son su capacidad de penetración en muchos materiales y su alto poder
ionizante. La forma más habitual de producir rayos X consiste en bombardear un cierto
material con electrones muy energéticos (10-100 keV), utilizando un dispositivo
experimental similar al que se muestra en la Fig. 1.B.1.

vacío

F
e-
A

- +
V
Figura 1.B.1. Dispositivo experimental para la producción de rayos X (tubo de rayos
X).

Los electrones producidos en el filamento F por efecto termoeléctrico son acelerados


por la diferencia de potencial V y finalmente inciden sobre el ánodo colector A. En la
mayoría de los casos, los electrones incidentes van perdiendo su energía cinética en
choques sucesivos con los átomos del material del que esta formado el ánodo, lo que
aumenta la energía cinética de los átomos y, en consecuencia, su temperatura. Ahora
bien, algunos electrones pueden perder casi toda su energía en un solo choque “frontal”
y desacelerarse bruscamente. Se sabe que cuando una carga se acelera o desacelera
emite radiación que se conoce con el nombre de bremsstrahlung. Por lo tanto, cuando
un electrón muy energético pierde su energía en una colisión emite radiación en forma
de un pulso muy energético. Este efecto es equivalente a un efecto fotoeléctrico inverso:
un electrón pierde su energía emitiendo un fotón que tiene una energía máxima
correspondiente a la energía cinética del electrón.
K i − K f = hν .
La frecuencia máxima de la radiación será
ν 0 = Ki / h
y la longitud de onda mínima
λ0 = hc / K i .
Teniendo en cuenta que la energía cinética máxima de los electrones es función del
potencial acelerador V
K i = eV
y por lo tanto,

39
hc 12400 o
= λ0 = A.
eV V ( Voltios )
Esta expresión se conoce con el nombre de fórmula de Duane y Hunt, y sirve para
calcular la longitud de onda menor del espectro de emisión. Es importante resaltar
que λ0 no depende del material del que está constituido el ánodo.
Por encima de λ0 todos los valores de la longitud de onda son posibles y se obtiene
una distribución continua de radiación, que es lo que se conoce con el nombre de
radiación de bremsstrahlung. En la Fig. 1.B.2 se muestran algunos espectros de
bremsstrahlung producidos por electrones de diferentes energías (diferente voltaje
acelerador). Tal como se puede ver en la fórmula de Duane y Hunt la longitud de onda
umbral λ0 (V ) es inversamente proporcional al voltaje acelerador.

10
Intensidad relativa

50 kV

8
40 kV
6

4
30 kV

2
20 kV
0
0 0.2 0.4 0.6 0.8 o 1.0
λ (A )
Figura 1.B.2. Espectros de bremsstrahlung para diferentes valores del potencial
acelerador.

Superpuestos a los espectros continuos de bremsstrahlung aparecen unos picos muy


agudos cuya posición depende de la naturaleza del blanco, pero no de la energía cinética
de los electrones incidentes sobre él. Estos picos, que están localizados en unas
longitudes de onda muy precisas (distintas para cada material), proporcionan una
magnífica extensión y confirmación de la teoría de Bohr.

40
k β kα

10

Intensidad relativa
W

6 Mo

4 Cr

0
0.3 λ0 0.5 o 0.7 0.9
λ (A )
Figura 1.B.3. Espectros de rayos X para blancos de Cr, Mo y W bombardeados con
electrones de 35 kV.

En la Fig. 1.B.3, se muestran algunos espectros de rayos X, producidos por


electrones de 35 keV que inciden sobre blancos de diferente naturaleza. Obsérvese que
λ0 es común para los tres espectros, como corresponde a que la energía cinética
máxima de los electrones sea la misma para todos ellos. Para el Mo aparecen dos picos
muy agudos superpuestos al continuo de radiación de frenado. En realidad, estos picos
constituyen espectros de emisión de rayos X, que son característicos de cada material y
son similares a los espectros ópticos; pero a diferencia de la complejidad que presentan
estos últimos, existe una notable semejanza entre las líneas de los espectros de rayos X
para los distintos elementos. Además, los espectros de rayos X suelen ser mucho más
simples que la mayoría de los espectros ópticos.
El físico británico H.G.J. Moseley fue el primero (1913-1914) que estudió
exhaustivamente los espectros de rayos X de diversos elementos. Moseley observó que
las líneas, que forman un espectro de rayos X, se agrupan en conjuntos que constituyen
series análogas a las de los espectros ópticos. Así por ejemplo, detectó una serie de
líneas de longitud de onda muy corta (radiación muy energética) a la que dio el nombre
de radiación K, y a sus distintas componentes (líneas) Kα, Kβ, Kγ… Las líneas más
intensas de un espectro de rayos X son siempre las líneas Kα y Kβ. Posteriormente, se
descubrieron otras series de longitud de onda mayor (menos energéticas) a las que se
llamó: L, M, N…
A partir de sus estudios espectroscópicos, Moseley propuso una fórmula muy
sencilla que predice las frecuencias de las líneas de emisión para los elementos
comprendidos entre el Ca ( Z = 20 ) y el Zn ( Z = 30 )
1 ν
= = C R (Z − σ ) ,
2

λ c
donde R es la constante de Rydberg y, C y σ son parámetros que dependen de la línea
espectral considerada. Por ejemplo, la línea Kα se puede reproducir con

41
1 1
C ≈ 0.75 =  2 − 2  y σ ≈ 1 .
1 2 
Sustituyendo estos valores en la expresión de Moseley se obtiene
ν 2  1 1 
= R (Z − 1)  2 − 2  ,
c 1 2 
que es análoga a la fórmula de Ritz para la serie de Lyman, con un número atómico
efectivo Z − 1 . Moseley también encontró una relación equivalente para la línea Kβ,
( )
pero con C = 1 / 12 − 1 / 32 ; y las expresiones correspondientes para la serie L.
Utilizando esta fórmula, Moseley determina el número atómico de los elementos
(Z ) y los clasifica en una tabla periódica, dejando los huecos para nuevos elementos
que serían descubiertos más tarde. Para ello utiliza las líneas Kα de los distintos
elementos (σ ≈ 1) y la expresión
ν ∝ (Z − 1) ,
donde la constante de proporcionalidad es prácticamente la misma para todos los
elementos (ver Fig. 1.B.5).
La explicación a los espectros de rayos X obtenidos por Moseley fue dada por
Kossel, basándose en un modelo muy simple para la estructura electrónica de un átomo
multielectrónico. Kossel supuso que los electrones se disponían en niveles discretos
alrededor del núcleo, de manera que en cada nivel sólo cabía un cierto número máximo
de electrones, tal como se muestra en la Fig. 1.B.4. También supuso que sólo cuando un
nivel está lleno se encuentra en equilibrio estable.

Kα Kβ


K

L
M
N

Figura 1.B.4. Modelo de Kossel para un átomo multielectrónico.

Según el modelo de Kossel el origen de las líneas espectrales observadas por


Moseley era el siguiente: cuando un electrón suficientemente energético choca contra
un átomo del blanco puede arrancar un electrón de la primera capa (K). De esta forma,
se genera un hueco en el primer nivel y el átomo se vuelve inestable. Este hueco es
ocupado por un electrón de las órbitas más externas, por ejemplo L ó M, emitiendo un
fotón en el proceso cuya energía es igual a la diferencia energética entre los dos niveles.
Si el electrón procede del nivel L ( n = 2 ) da lugar a la radiación Kα, si procede de la
capa M ( n = 3 ) da lugar a la radiación Kβ, etc. Un proceso análogo explica el origen de
las series L (hueco en la capa n = 2 ) o de las series M (hueco en la capa n = 3 ).

42
Vamos a considerar, en detalle, un modelo sencillo para un átomo que tiene m 1
electrones en la primera capa, m2 en la segunda, etc. El átomo pierde un electrón de la
primera capa debido a un choque con un electrón libre, de manera que se queda con
m1 − 1 electrones en el primer nivel. Supongamos que:

• Cada capa sólo puede tener un número máximo de electrones mi y sólo es


estable en ese caso.

• Los electrones giran en órbitas circulares de Bohr alrededor del núcleo. Todas
estas órbitas están en el mismo plano.

• Los electrones están sometidos a un campo central, creado por el núcleo y el


resto de los electrones que se encuentran en órbitas de radio menor. Las capas
electrónicas se comportan como distribuciones de carga superficial en equilibrio.

Si trabajamos en el sistema CGS ( 1 / 4πε 0 = 1 ) para simplificar, podemos escribir el


campo eléctrico en cada región del átomo como:

Ze Z ef
ε (r ) = ; 0 < r ≤ r1 Z
r 2
Z − m1 + 1
Z − m1 + 1
ε (r ) = e ; r1 < r ≤ r2 Z − m1 + 1 − m2
r2

e
ε (r ) = ; rn < r 1
r2
r1 r2 rn r
En el gráfico de la derecha se representa la carga efectiva Z ef que nota un electrón
a una distancia r del núcleo. Es evidente que Z ef (0 ) = Z y que Z ef (∞ ) = 1 . Los radios
de las diversas capas pueden calcularse utilizando la fórmula de Bohr, y teniendo en
cuenta la carga efectiva Z ef que “ve” cada electrón dependiendo de la capa en que se
encuentra, obteniéndose
ℏ2
r1 =
µ Ze 2
ℏ 2 22
r2 =
µ e 2 (Z − m1 + 1)

ℏ2n2
rn =
µ e 2 Z ef
La energía potencial en las diversas regiones del espacio puede escribirse en la
siguiente forma

43
Ze 2 e 2 (m1 − 1) e 2 m2 e 2 mn
V (r ) = − + + +⋯+ ; 0 < r ≤ r1
r r1 r2 rn
Z − m1 + 1 e 2 m2 e 2 mn
V (r ) = − e 2
+ +⋯+ ; r1 < r ≤ r2
r r2 rn

e2
V (r ) = − : r > rn
r
De forma que el campo eléctrico es discontinuo al atravesar cada capa, mientras que las
constantes del potencial se han elegido de manera que éste sea continuo en todas las
regiones del espacio. Teniendo en cuenta que para un electrón que gira en una órbita
circular de radio r
2 2
v 2 Z ef e 1 2 1 Z ef e
m = 2 → mv = ,
r r 2 2 r
podemos escribir la energía total (E = K + V ) para las dos primeras capas como
µ e4 m1 − 1 2 m2 2 m
E1 = − 2
Z2 + e + e + ⋯ + n e2
2ℏ r1 r2 rn
µ e4
E2 = − 2 2
(Z − m1 + 1)2 + m2 mn 2
e2 + ⋯ +
e
2ℏ 2 r2 rn
Un electrón de la capa 2, que pase a ocupar un hueco en la capa 1, emitirá un fotón
de energía
µ e4  3
hν = E2 − E1 = 2 
(Z − m1 + 1)2 − (m1 − 1)2  ,
2ℏ  4 
que está de acuerdo con la fórmula empírica propuesta por Moseley,
ν
= C R (Z − σ ) ,
2

c
para Z grande, donde tenemos K = 0.75 y σ = m1 − 1 = 1 para la línea Kα. Esto implica
que la primera capa es estable para m1 = 2 .
El modelo expuesto es muy inexacto para otras líneas, ya que el apantallamiento
electrónico considerado es sólo una primera aproximación. A pesar de esto, la fórmula
empírica de Moseley funciona muy bien para la línea Kα, como lo demuestra el hecho
de que si representamos ν en función de Z se obtiene una línea recta en un amplio
rango de valores de Z (ver Fig. 1.B.5).

44
ν ≈ (Z − 1)
20

ν (108 Hz1/2 )

10

0
0 10 20 30 40 50
Número atómico Z

Figura 1.B.5. ν en función del número atómico para la línea Kα.

Esta recta corta al eje de abscisas en Z = 1 , lo que confirma que σ = 1 y, por lo tanto, la
primera capa debe contener 2 electrones en su configuración estable.
Si se hace el mismo tipo de gráfica para la línea Lα (ver Fig. 1.B.6), el punto de
corte con el eje de abscisas está en Z = 7.5 , lo que implica que sumando los electrones
de la primera y la segunda capa debe haber entre 8 y 9 electrones. En realidad, el
número de electrones que pueden contener en total las dos primeras capas en su
configuración estable es de 10.

16 ν ≈ (Z − 7.5)
ν (10 Hz
8 1/2
)
12

0
0 20 40 60 80
Número atómico Z
Figura 1.B.6. ν en función del número atómico para la línea Lα.

45
Ejemplos:

1. El Mo ( Z = 42 ) tiene una línea Kα que corresponde a una longitud de onda


o
λα = 0.71 A ¿Cuál es la predicción que se puede obtener para esta línea
utilizando la formula de Moseley?
Según la fórmula de Moseley:
ν 1  1 1 
= = 2 − 2 R (Z − σ ) .
2

c λ  n f ni  
Para la línea Kα, n f = 1 y ni = 2 ; y σ = 1 , por lo tanto

R (Z − 1) .
31
=
2

λ 4
Si tomamos el valor de la constante de Rydberg correspondiente a masa del
núcleo infinita
R∞ = 109737.318 cm -1
1 o
= 1.383 × 108 cm -1 → λ = 0.72 A
λ
en muy buen acuerdo con el resultado experimental.

2. La línea más intensa del espectro de rayos X emitido por una muestra de
o
composición desconocida corresponde a una longitud de onda de 2.16 A . ¿Cuál
es el elemento constituyente de la muestra?
La radiación de máxima intensidad en un espectro de rayos X corresponde a la
línea Kα, cuya longitud de onda puede calcularse utilizando la fórmula de
Moseley:

= R (Z − 1) → Z =
1 3 4
+ 1 ≈ 25 ⇒ manganeso .
2

λ 4 3λ R

3. Estimar el voltaje de aceleración mínimo necesario para que un tubo de rayos X


con un ánodo de 26Fe emita la línea Kα de su espectro.
La energía de un electrón en la capa K es
µ e4
EK = − 2 2 Z ef2 = −13.6 Z ef2 eV ≈ -9.2 × 103 eV ,
2ℏ 1
por lo tanto
V ≈ 9.2 × 103 V .
En realidad, la carga efectiva del núcleo para un electrón en la capa K es
aproximadamente Z − 2 .

46
Apéndice 1.C. Principio de correspondencia

La teoría cuántica antigua no proporcionaba ningún método que permitiera


determinar las intensidades de las líneas espectrales; es decir, no se podía calcular la
probabilidad de transición entre niveles, ni estimar el tiempo de vida de un estado
excitado. En particular, para justificar la ausencia de ciertas líneas espectrales se
buscaron reglas de selección totalmente empíricas. En 1923, Bohr intento subsanar estas
deficiencias de la teoría proponiendo un postulado complementario que se llamo
principio de correspondencia y que se puede resumir en los dos puntos siguientes:

1. Las predicciones de la teoría cuántica para el comportamiento de cualquier


sistema físico deberán corresponder a las predicciones de la Física Clásica en el
límite para el cual los números cuánticos que especifican el estado del sistema
son muy grandes.

2. Una regla de selección es cierta sobre todo el rango de valores de un número


cuántico. Por lo tanto, una regla de selección aplicable en el límite clásico
(límite para números cuánticos muy grandes) debe ser también válida en el
rango cuántico.

En cuanto al primer punto, es obvio que las predicciones de la teoría cuántica deben
corresponderse con las de la Física Clásica en el límite para el cual el sistema se
comporta clásicamente. Bohr supuso que el límite entre las dos teorías se encontraba en
el rango de los números cuánticos muy grandes. Hoy en día, se sabe que el criterio de
Bohr no es siempre cierto y se dice que un sistema se comporta clásicamente cuando la
acción característica implicada es mucho mayor que h .
En los inicios de la Física Cuántica, se utilizó con mucha frecuencia el principio de
correspondencia para explicar reglas de selección observadas en el dominio cuántico.

Ejemplos

1. Oscilador armónico de frecuencia ν . La teoría cuántica predice que los estados


energéticos de un oscilador armónico son de la forma E = nhν . Supongamos
que la partícula que realiza el movimiento armónico simple está cargada.
Clásicamente emitirá radiación electromagnética de frecuencia ν . En cambio,
de acuerdo con las predicciones cuánticas, la radiación se emitirá sólo cuando el
sistema transite de un estado ni a un estado n f ( ni > n f ) . La energía del fotón
emitido en la transición será
Ei − E f = ( ni − n f ) hν
y su frecuencia
ν f = ( ni − n f )ν .
Por lo tanto, para que las predicciones clásica y cuántica coincidan, y ν f = ν se
deberá cumplir que
ni − n f = 1 .
Un argumento similar, referido a la absorción de radiación, conduce a la
condición:
ni − n f = −1 .

47
De todo ello podemos concluir que ∆ n = ±1 es una regla de selección de las
transiciones permitidas en un oscilador armónico, para todo el rango de valores
del número cuántico n .

2. Átomos de Rydberg. Son átomos en que un electrón ha sido excitado a un nivel


energético inusualmente alto. Los átomos de Rydberg constituyen una buena
ilustración de la continuidad entre los dominios clásico y cuántico. Pueden
alcanzar diámetros de 10−2 mm y la vida media de estos estados excitados puede
llegar a ser de hasta 1 s (los valores típicos para números cuánticos “pequeños”
son del orden de 10−8 s ). Los átomos de Rydberg se observaron por primera vez
en 1965, en el espacio interestelar (n hasta 350). Posteriormente, se obtuvieron
en el laboratorio (excitación mediante láser) átomos de Rydberg en estados con
n entre 10 y 290.
Cuando un electrón de capas externas de un átomo es excitado a un nivel
energético de n muy grande, prácticamente “ve” toda la carga del núcleo
apantallada por el resto de los electrones excepto + e ; por lo tanto, se comporta
como un electrón en un nivel de un átomo hidrogenoide. El radio de la órbita es
proporcional a n 2 y su energía es inversamente proporcional a n 2
rn = a0 n 2
1
En = −13.6 ( eV )
n2
Por lo tanto, los átomos de Rydberg se parecen en muchos aspectos a los átomos
hidrogenoides, pero en estados altamente excitados.
Cuando el electrón se desexcita del estado ni al n f , la frecuencia de la
radiación emitida es
 1 1  n2 − n2
ν = Rc  2 − 2  = Rc i 2 2 f .
n 
 f ni  ni n f
Supongamos que n f = n − 1 y ni = n
2n − 1
ν = Rc ,
( n − 1)
2
n2
que para n muy grande se pude aproximar por
2
ν ≃ Rc 3 .
n
Clásicamente, el electrón debe emitir radiación de la misma frecuencia que la del
movimiento de revolución del electrón alrededor del núcleo, por lo tanto
v me e 4 2 2
ν cl = n = = Rc 3 .
2π rn ( 4πε 0 ) 4π ℏ n
2 3 3
n
En consecuencia, las predicciones clásica y cuántica coinciden si se cumple la
regla de selección ∆ n = ±1 . Evidentemente, esta regla de selección sólo es
aplicable en el límite de números cuánticos muy grandes y no es extrapolable a
todo el rango de valores de n . Este ejemplo ilustra que la segunda parte del
principio de correspondencia es sólo una hipótesis razonable, que se cumple en
algunos casos, pero que no tiene validez general.

48

Anda mungkin juga menyukai