Anda di halaman 1dari 41

Captulo 10

T
opicos de Algebra
Linear. II
Conte
udo
10.1
10.2
10.3
10.4

10.5
10.6
10.7

Uma Topologia M
etrica em Mat (C, n) . . . . . . . . . . . . . . . . . . . . .
Exponenciais, Logaritmos e Fun
c
oes Analticas de Matrizes . . . . . . . .
10.2.1 A Exponenciac
ao de Matrizes e os Grupos GL(C, n) e GL(R, n) . . . . . .
A F
ormula de Lie-Trotter e a F
ormula do Comutador . . . . . . . . . . . .
Aplica
c
oes Lineares em Mat (C, n) . . . . . . . . . . . . . . . . . . . . . . . .
10.4.1 Alguns Fatos Gerais sobre Aplicac
oes Lineares em Mat (C, n) . . . . . . . .
10.4.2 Alguns Exemplos Especficos de Aplicac
oes Lineares em Mat (C, n) . . . . .
A F
ormula de Baker, Campbell e Hausdorff . . . . . . . . . . . . . . . . . .
A F
ormula de Duhamel e Algumas de suas Conseq
u
encias . . . . . . . . .
Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

. 445
. 448
. . 455
. 458
. 461
. . 461
. . 466
. 471
. 476
. 481

presente captulo diferencia-se do anterior por explorar aspectos mais topologicos de algebras de matrizes.
Portanto, uma certa familiaridade com as nocoes basicas de espacos metricos (vide Captulo 25, pagina 1203)
e u
til. Discutiremos a definicao de funcoes analticas de matrizes, em particular, a exponencial e o logaritmo.
Nosso principal objetivo, porem, e provar as seguintes relacoes: para matrizes A, B Mat (C, n), valem:

F
ormula de Lie-Trotter1 :

exp (A + B) =



m
1
1
A exp
B
.
m
m

(10.1)







m2
1
1
1
1
A exp
B exp A exp B
.
m
m
m
m

(10.2)

lim

exp

F
ormula do comutador:


exp [A, B] =

lim

exp

Serie de Lie:

exp(B)A exp(B) = A +

X

i
1 h
B, B, . . . , [B , A] .
m! |
{z
}
m=1
m vezes

(10.3)

F
ormula de Baker-Campbell-Hausdorff2 (sobre a convergencia, vide comentario adiante):




1
1
1
A, [A, B] +
B, [B, A] + .
exp(A) exp(B) = exp A + B + [A, B] +
2
12
12

(10.4)

F
ormula de Duhamel3 :

exp(A + B) = exp(A) +



exp (1 s)(A + B) B exp sA ds ,

da qual se obtem a serie de Duhamel:


"
Z t
Z t Z t1 Z
X
t(A+B)
tA

1+
et1 A Bet1 A dt1 +
e
= e
0

m=2

1 Marius

m
tm1 Y

tk A

tk A

Be

k=1

Sophus Lie (18421899). Hale Freeman Trotter (1931).


Frederick Baker (18661956). John Edward Campbell (18621924). Felix Hausdorff (18681942).
3 Jean Marie Constant Duhamel (17971872).
2 Henry

444

(10.5)

dtm dt1 .

(10.6)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

445/2119

Uma outra relacao u


til que obteremos e a chamada F
ormula de Duhamel para derivadas de exponenciais: se A() for
uma famlia de matrizes em Mat (C, n) que depende contnua e diferenciavelmente de um parametro , entao vale


Z 1
d
d  A() 
(1s)A()
=
e
e
A() esA() ds .
(10.7)
d
d
0
A serie dentro da exponencial no lado direito de (10.4) e um tanto complexa, mas envolve apenas comutadores
m
ultiplos de ordem cada vez maior de A e B. A expressao completa encontra-se em (10.60), pagina 471. Ao contr
ario
das formulas que lhe precedem e sucedem, a formula de Baker-Campbell-Hausdorff nao e valida para quaisquer matrizes
A e B pois, no caso geral, a convergencia da serie do lado direito so pode ser
para matrizes suficientemente
 estabelecida

pequenas, a saber, tais que kAkC e kBkC sejam ambas menores que 12 ln 2 22 0, 12844 . . . (a definicao da norma

operatorial k kC de matrizes sera apresentada adiante). Claro e que, nos casos felizes em que os comutadores m
ultiplos
das matrizes A e B se anulam a partir de uma certa ordem, a serie do lado direito sera finita e, portanto, convergente.
Comentamos ao leitor mais avancado que as expressoes acima (e, mutatis mutantis, suas demonstracoes abaixo) valem
n
ao apenas para algebras de matrizes, mas tambem no contexto mais geral de algebras- de Banach com unidade.
As formulas acima sao empregadas em varias areas da Fsica (como na Mecanica Quantica, na Mecanica Estatstica
e na Teoria Quantica de Campos) e da Matematica (como na Teoria de Grupos). Faremos uso delas, por exemplo, nos
Captulos 21 e 22. Suas provas serao apresentadas, pela ordem, na Proposicao 10.12, pagina 458, na Proposicao 10.14,
p
agina 467, no Teorema 10.1 da Secao 10.5, pagina 471 e na Secao 10.6, pagina 476. A u
nica demonstracao que se pode
classificar como complexa e a da formula de Baker-Campbell-Hausdorff, as demais sao simples. No correr das paginas
seguintes outras identidades u
teis, nao listadas acima, serao obtidas.

10.1

Uma Topologia M
etrica em Mat (C, n)

Discutiremos nesta secao uma topologia metrica natural em Mat (C, n) a qual usaremos na Secao 10.2 para definir certas
funcoes analticas de matrizes, tais como a exponencial e o logaritmo.
Recordando, Mat (C, n) e o conjunto de todas as matrizes complexas n n e GL(C, n) Mat (C, n) e o conjunto
de todas as matrizes complexas n n inversveis. Como ja observamos, GL(C, n) e um grupo.
Normas de matrizes. A norma operatorial

Seja V um espaco vetorial de dimensao finita, comopCn ou Rn , dotado de uma norma k kV . Para Cn u =
(u1 , . . . , un ), por exemplo, podemos adotar kukCn := |u1 |2 + + |un |2 . Vamos denotar por L(V ) o conjunto de
bem sabido que L(V ) e igualmente um espaco vetorial. Por exemplo,
todas as aplicacoes lineares de V em V . E
n
n
L(C ) = Mat (C, n) e L(R ) = Mat (R, n).
Com uso da norma de V e possvel definir uma norma tambem em L(V ). Para A L(V ) define-se
kAkL(V ) := sup
uV
u6=0

kAukV
.
kukV

E. 10.1 Exerccio. Mostre que k kL(V ) assim definida e, de fato, uma norma no espaco vetorial L(V ).
Observac
oes.

Note que
kAkL(V ) =

sup

kAukV .

uV
kukV =1

Para A L(V ), a norma kAkL(V ) definida acima e denominada norma operatorial induzida pela norma k kV . Como comentaremos abaixo,
uma conseq
h
a outras normas em L(Cn ) e L(Rn ) que n
ao a norma operatorial, mas que s
ao equivalentes `
aquela. E
uencia imediata da definic
ao
de norma operatorial que
kAukV kAkL(V ) kukV ,
(10.8)
para todo vetor u V .

A norma operatorial tem a seguinte propriedade importante: para A, B L(V ) quaisquer, tem-se
kABkL(V ) kAkL(V ) kBkL(V ) .

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

446/2119

Essa propriedade e denominada sub-multiplicatividade da norma k kL(V ) . Nem toda norma em Mat (C, n) possui essa
propriedade.

E. 10.2 Exerccio importante. Mostre isso. Sugestao: use (10.8).

Em Mat (C, n) e possvel provar que kA kMat (C, n) = kAkMat (C, n) e que kAk2Mat (C, n) = kA AkMat (C, n) (propriedade
Vide Teorema 38.11, p
agina 1898.

Observac
ao.
C ).

importante comentar que o procedimento de construcao de normas em L(V ) pode ser repetido. Como L(V ) e
E
igualmente um espaco vetorial normado e de dimensao finita, podemos definir uma norma em L(L(V )) (o conjunto de
todas as aplicacoes lineares de L(V ) em L(V )) definindo para A L(L(V ))
kAkL(L(V )) :=

sup
AL(V )
A6=0

kAAkL(V )
.
kAkL(V )

E assim por diante para todos os espacos de aplicacoes L(L( L(V )) ).

Vamos a um exemplo. Tomemos V = Cn , L(V ) = Mat (C, n). Seja uma matriz X Mat (C, n) fixa. Com ela
poderemos definir um elemento denotado por ad[X] de L(Mat (C, n)) por
A Mat (C, n) .

ad[X]A := [X, A] = XA AX,

evidente que ad[X] e uma aplicacao linear de Mat (C, n) em Mat (C, n), ou seja, um elemento de L(Mat (C, n)).
E
Note-se que
kad[X]kL(Mat (C, n)) =

sup
AL(V )
A6=0

kXA AXkMat (C, n)

kAkMat (C, n)

sup
AL(V )
A6=0

kXAkMat (C, n) + kAXkMat (C, n)


2kXkMat (C, n) .
kAkMat (C, n)

Daqui para a frente denotaremos a norma operatorial de matrizes em Cn por k kC ou simplesmente por k k. Alem da
norma operatorial, ha outras normas que podem ser definidas em L(Cn ). Para A Mat (C, n) podemos, por exemplo,
definir as seguintes normas:
kAk

:=

kAk1

:=

kAk2

kAkp

max

a, b = 1, ..., n
n X
n
X
a=1 b=1

:=

(10.9)

|Aab | ,

n X
n
X
a=1 b=1

:=

|Aab |,

n X
n
X
a=1 b=1

|Aab |

(10.10)

|Aab |p

!1/2

!1/p

(10.11)

com p 1 .

(10.12)

A expressao (10.12) generaliza (10.10) e (10.11). A norma kAk2 e por vezes denominada a norma de Frobenius4 da matriz
A.
E. 10.3 Exerccio. Mostre que (10.9)-(10.12) de fato definem normas em Mat (C, n). (Note que (10.10)-(10.11) sao
casos particulares de (10.12)). Use a desigualdade de Minkowski (pagina 1236) para (10.12).
6
E. 10.4 Exerccio. A norma de Frobenius (10.11) tem uma interpretacao interessante. Mostre que,
hA, Bi = Tr (A B) =
4 Ferdinand

Georg Frobenius (18491917).

n X
n
X
a=1 b=1

Aab Bab ,

(10.13)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

447/2119

A, B Mat (C, n), define


p um produto
p escalar em Mat (C, n). Mostre que (10.11) e a norma associada a esse produto
escalar, ou seja, kAk2 = hA, Ai = Tr (A A).
6
importante lembrar o Teorema 3.2, p
Observac
ao. E
agina 202, que afirma que em espacos vetoriais de dimens
ao finita todas as normas
ao todas equivalentes. Note-se,
s
ao equivalentes. Assim, em Mat (C, n) a norma operatorial kAkC e as normas kAk e kAkp com p 1 s
ao e necessariamente compartilhada por
por
em, que a propriedade de sub-multiplicatividade kABkC kAkC kBkC da norma operatorial n
outras normas. Devido `
a equivalencia de todas as normas matriciais, tem-se em geral kABk ckAk kBk para alguma constante c > 0.

Seja D Mat (C, n) uma matriz diagonal: D = diag (d 1 , . . . , dn ) com dk


E. 10.5 Exerccio.
kDkC = max{|d1 |, . . . , |dn |}, ou seja, para matrizes diagonais kDkC = kDk .

C.

Mostre que

Equival
encia entre normas matriciais

Aqui denotaremos a norma operatorial de uma matriz A por kAk.

Sejam ei , i = 1, . . . , n os vetores da base canonica de Cn , ou seja, os vetores cuja j-esima componente e (ei )j = ij .
Se A Mat (C, n), e claro que a i-esima componente do vetor Aej e (Aej )i = Aij . Da,
n
X
kAej k2C
|Aij |2 .
=
kej k2C
i=1

Logo, para todo j,


kAk

2
kAvkC
:= sup

2
kvkC
vCn
v6=0

kAej k2C
max
=
2
j=1, ..., n kej kC

max

j=1, ..., n

( n
X
i=1

|Aij |

(10.14)

Pn
Tem-se tambem o seguinte. Para qualquer vetor v Cn , vale (Av)i =
j=1 Aij vj . Assim, pela desigualdade de
Cauchy-Schwarz (3.17), pagina 199,

!
n
n
n
X
X
X
|Aij |2 kvk2C .
|vk |2 =
|(Av)i |2
|Aij |2
j=1

Da,

2
kAvkC
=

n
X
i=1

Logo,

n
n X
X
2
|Aij |2 kvkC
|(Av)i |2
.
i=1 j=1

kAk2 := sup

vCn
v6=0

Como

n
X
i=1

|Aij |2

max

i=1, ..., n

j=1

k=1

n X
n
X
kAvk2C
|Aij |2 .

kvk2C
i=1 j=1

(10.15)



|Aij |2 , segue de (10.14) que
kAk2

Logo, para todo i, j vale |Aij | kAk, ou seja,

max

max |Aij |2 .

j=1, ..., n i=1, ..., n

kAk kAk .

De (10.15) vemos tambem que


kAk2
Conclumos assim que em Mat (C, n)

n X
n
X
i=1 j=1

|Aij |2

n X
n
X
i=1 j=1

kAk2 = n2 kAk2 .

kAk kAk nkAk .

(10.16)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

448/2119

A expressao (10.16) mostra-nos que caso tenhamos uma seq


uencia de matrizes Am com kAm k 0 quando m ,
entao cada elemento de matriz (Am )ij tambem converge a zero quando m . E vice-versa: Se (Am )ij 0 para todos
ij quando m , entao kAm k 0 quando m .

Nota.

Antes de prosseguirmos, comentemos tambem que as duas desigualdades (10.16) s


ao optimais, ou seja, n
ao podem ser melhoradas
para matrizes genericas. Por exemplo, e evidente que k1k = 1 e que k1k = 1. Assim, pelo menos nesse caso tem-se a igualdade na primeira
desigualdade de (10.16). H
a tambem um caso em que se tem a igualdade na segunda desigualdade de (10.16). Considere-se a matriz M cujos
elementos de matriz s
ao todos iguais a 1, ou seja, Mij = 1 para todos i, j. Seja o vetor u de Cn cujas componentes s
ao todas iguais a 1, ou
kM
uk
C
elementar ver que M u = nu. Logo
seja, ui = 1 para todo i. E
= n. Portanto, kM k n e kM k = 1. Assim, kM k nkM k e, da
kukC
segunda desigualdade de (10.16), conclumos que, nesse caso, kM k = nkM k .

A desigualdade (10.15) significa que kAk kAk2 . Ao mesmo tempo, a desigualdade (10.14) mostra que
nkAk2 =

n
X
j=1

Logo, conclumos que em Mat (C, n)

kAk2

n X
n
X
j=1 i=1

|Aij |2 = kAk22 .

1
kAk2 kAk kAk2 .
n

(10.17)

E. 10.6 Exerccio. Mostre que em Mat (C, n)


1
kAk1 kAk nkAk1 .
n2
Sugest
ao: Mostre primeiro que kAk

n
X

i, j=1

(10.18)

|Aij | n2 kAk ou seja


kAk kAk1 n2 kAk .

e, entao, use (10.16).


E. 10.7 Exerccio. Mostre que as desigualdades (10.19) tambem nao podem ser melhoradas.

(10.19)

6
6

Nota. As expressoes (10.16), (10.17), (10.18) e (10.19) mostram-nos de modo explcito que em Mat (C, n) as normas k k, k k , k k1 e
k k2 s
ao equivalentes (vide definic
ao `
a p
agina 201). Como j
a mencionamos, em espacos de dimens
ao finita todas as normas matriciais s
ao
equivalentes (Teorema 3.2, p
agina 202).

*
A importancia de se introduzir uma norma em L(V ) e que podemos dessa forma introduzir uma nocao de distancia
entre elementos desse conjunto, ou seja, podemos definir uma metrica em L(V ) por d(A, B) = kA Bk. Deixamos para
o leitor a tarefa de demonstrar que isso de fato define uma metrica em L(V ). Com isso, fazemos de L(V ) um espaco
dotado de uma topologia metrica. Fora isso, o importante Teorema 38.2 demonstrado `a pagina 1877 afirma que L(V )
ser
a um espaco metrico completo se V o for. Logo, como Cn e Rn sao sabidamente espacos vetoriais completos, assim o
possvel dessa forma falar de convergencia de seq
uencias
ser
ao Mat (C, n), Mat (R, n), assim como L(Mat (C, n)) etc. E
e series de matrizes de Mat (C, n), Mat (R, n), assim como de elementos de L(Mat (C, n)) etc. Abaixo faremos uso
repetido desse fato fundamental.

10.2

Exponenciais, Logaritmos e Funco


es Analticas de Matrizes

No estudo da teoria de grupos e em outras areas e muito conveniente definir certas funcoes de operadores lineares, tais
como exponenciais, logaritmos etc. Ja abordamos a definicao da exponenciacao de matrizes nos captulos 9 e 13. Vamos
aqui tentar uma abordagem mais geral.

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

449/2119

S
eries de pot
encias de matrizes

Seja A Mat (C, n) uma matriz n n complexa e seja {am m N} uma seq
uencia de n
umeros complexos. A
express
ao
N

X
X
m
am Am = a0 1 + a1 A + a2 A2 + a3 A3 +
am A = lim
N

m=0

m=0

e dita ser uma serie de potencias convergente, caso o limite acima exista em Mat (C, n).
Nota.

Adotaremos sempre a convenc


ao que A0 = 1.

A seguinte proposicao e fundamental:


Proposic
ao 10.1 A seria de potencias

am Am e convergente se

m=0

m=0

m
|am | kAkC
< .

P
m
A importancia dessa proposicao reside no fato que
e uma serie numerica e, portanto, mais simples
m=0 |am |kAkC
de lidar.
N
X
am Am . Teremos para M < N ,
Prova. Sejam as somas parciais SN :=
m=0


N
X

kSN SM kC =

m=M +1



am A

m

N
X

m=M +1

m
|am | kAkC
.

PN

m
Agora, como a serie numerica m=0 |am | kAkC
converge, sN := m=0 |am | kAkm
C e uma sequencia de Cauchy. Logo
PN
m
m=M+1 |am | kAkC pode ser feito menor que qualquer > 0 dado, desde que escolhamos M e N grandes o suficiente.
Logo SN e tambem uma seq
uencia de Cauchy no espaco metrico completo Mat (C, n). Portanto, S N converge em
Mat (C, n) quando N .

Fun
co
es analticas de matrizes

A Proposicao 10.1 conduz `a seguinte definicao. Seja r > 0 e Dr = {z C| |z| < r} o disco aberto de raio r centrado
em 0 no plano complexo. Seja f : Dr C uma funcao analtica em Dr . Como bem
f pode ser expressa em
P sabemos,
m
termos de uma serie de potencias (serie de Taylor centrada em z0 = 0): f (z) =
f
z
,
onde
fm = f (m) (0)/m!.
m=0 m
P

m
bem sabido tambem que essa serie e absolutamente convergente em Dr :
E
< , se |z| < r. Podemos
m=0 |fm | |z|
entao definir

X
f (A) :=
fm Am
m=0

para toda a matriz A com kAkC < r, pois a proposicao acima garante que a serie de matrizes do lado direito converge a
alguma matriz de Mat (C, n), que denotamos por f (A), fazendo uma analogia obvia com a funcao numerica f .
A seguinte proposicao sobre essas funcoes de matrizes sera freq
uentemente usada no que seguira.

Proposic
ao 10.2 I. Sejam f e g duas func
oes analticas no mesmo domnio Dr . Definamos (f + g)(z) := f (z) + g(z)
e (f g)(z) := f (z)g(z), z Dr . Entao, para A Mat (C, n) com kAkC < r teremos f (A) + g(A) = (f + g)(A) e
f(A)g(A) = g(A)f (A) = (f g)(A).
II. Sejam f e g duas funco
es analticas, com domnios Drf e Drg , respectivamente, e tais que a imagem de g esteja
contida no domnio de f . Podemos entao definir f g(z) := f (g(z)). Ent
ao, para A Mat (C, n) com kAkC < rg
teremos f (g(A)) = f g(A).
2
Prova. Exerccio.
Note-se que a parte I da proposicao acima afirma que existe um homomorfismo da algebra das funcoes analticas em
um domnio Dr C e Mat (C, n).

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

450/2119

Vamos mais adiante usar o seguinte resultado, que essencialmente afirma que as matrizes f (A) definidas acima, com
f analtica em um domnio Dr C, dependem continuamente de A.

Proposic
ao 10.3 Seja f P
funca
o complexa analtica em um domnio Dr C, com f tendo a serie de Taylor absoluta
mente convergente f (z) = k=0 fk z k , |z| < r. Seja tambem Bm , m N, uma seq
uencia de matrizes de Mat (C, n) tais
que limm kBm kC = 0. Ent
ao, para todo A Mat (C, n) com kAkC < r tem-se
lim f (A + Bm ) = f (A) .

2
Prova. Comecemos com um comentario sobre o enunciado do teorema. Para que f (A + B m ) esteja definido e necessario
que kA + Bm kC < r. Como kA + Bm kC kAkC + kBm kC e kAkC < r, a condicao e satisfeita para m grande o suficiente,
pois limm kBm kC = 0. Assim, estaremos supondo que m e grande o suficiente de modo que kBm kC < para algum
tal que kAkC + < r. Feita essa ressalva, passemos `a demonstracao.
A prova da proposicao segue como conseq
uencia das duas observacoes seguintes. A primeira e que para quaisquer
matrizes X, Y Mat (C, n) e qualquer k inteiro positivo tem-se a seguinte identidade algebrica:
Xk Y k =

k1
X

X p (X Y ) Y k1p .

p=0

(10.20)

Para provar isso, basta expandir a soma do lado direito e mostrar, apos alguns cancelamentos, que obtem-se o lado
esquerdo (faca!).
P
A segunda observacao e que se f eP
analtica em Dr , sua derivada tambem o e. Assim, f (z) = k=0 kfk z k1 converge
k1
absolutamente para |z| < r, ou seja,
< sempre que |z| < r.
k=0 k|fk | |z|
Assim,

f (A + Bm ) f (A) =

k=0

Usando (10.20) com X = A + Bm e Y = A, teremos


f (A + Bm ) f (A) =

fk

k=0



fk (A + Bm )k Ak .

k1
X

(A + Bm )p Bm Ak1p .

p=0

Logo,
kf (A + Bm ) f (A)kC kBm kC

k=0

|fk |

k1
X
p=0

p
kAkk1p
.
kA + Bm kC
C

Agora, como dissemos, kA + Bm kC < kAkC + < r e, obviamente, kAkC < kAkC + < r. Portanto,
kf (A + Bm ) f (A)kC kBm kC

k=0

|fk |

k1
X
p=0

(kAkC + )k1 = kBm kC

k=0

k|fk | (kAkC + )k1 .

Como comentamos acima, a soma do lado direito e finita. Como, porem, kBm kC 0 para m , teremos
limm kf (A + Bm ) f (A)kC = 0, que e o que queramos provar.
Exponenciais e logaritmos de matrizes

Com as definicoes apresentadas acima, podemos definir exponenciais e logaritmos de matrizes. Temos,
exp(A) eA :=

X
1 m
A
m!
m=0

(10.21)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

451/2119

para toda matriz A Mat (C, n), pois a serie de Taylor da funcao exponencial converge absolutamente em todo o plano
complexo.
Analogamente, podemos definir
ln(1 + A) =

X
(1)m1 m
A
m
m=1

(10.22)

para toda matriz A Mat (C, n) com kAkC < 1, pois a serie de Taylor da funcao ln(1 + z) converge absolutamente em
D1 .
Nota.


Para kA 1kC < 1 podemos definir ln(A) por ln(A) := ln 1 + (A 1) .

E. 10.8 Exerccio. Usando a Proposicao 10.2, mostre que (exp(A))m = exp(mA) para toda matriz A Mat (C, n) e
todo m Z. Mostre tambem que

exp ln(1 + A) = 1 + A
para toda matriz A Mat (C, n) com kAkC < 1 e que


ln exp(B) = B

para toda matriz B Mat (C, n) com k exp(B) 1kC < 1.


Note que




X 1

m
B
k exp(B) 1kC =


m!
m=1

Assim, a condicao k exp(B) 1kC < 1 e satisfeita se kBkC < ln 2.

X
1
kBkC
kBkm
1.
C = e
m!
m=1

Sobre a exponencial de matrizes temos o seguinte:


ao exp :
Proposic
ao 10.4 Existe uma bola aberta Br (0) de raio r > 0 centrada em 0 em Mat (C, n) tal que a aplicac
Mat (C, n) Mat (C, n) definida acima e um homeomorfismo (em verdade, um difeomorfismo) entre B r (0) e sua
imagem, exp(Br (0)), a qual e uma vizinhanca aberta da matriz identidade 1.
2
Prova. Temos que, para todo A Mat (C, n), exp(A) 1 = A + (A), onde (A) :=

X
1 m
A . E facil ver que
m!
m=2

0 para kAk 0. exp(A) 1 e contnua e diferenciavel em uma vizinhanca de 0 (em verdade, em toda parte) e
sua derivada em 0 e a identidade. A afirmacao da Proposicao 10.4 segue ent
ao do bem conhecido Teorema da Aplicacao
Inversa (vide, por exemplo, [169]).
k(A)k
kAk

Junto com o u
ltimo exerccio, isso prova a seguinte proposicao:
Proposic
ao 10.5 Para toda matriz A Mat (C, n) com kA 1kC < 1 tem-se

exp ln(A) = A .

Para toda matriz B Mat (C, n) com kBkC < ln 2 tem-se


ln exp(B) = B .

Exponenciais de matrizes diagonaliz


aveis e o Teorema Espectral

(10.23)

Se A Mat (C, n) e diagonalizavel, o Teorema Espectral (Teorema 9.6, pagina 374) e o Calculo Funcional (Teorema
9.7, pagina 376) permitem obter express
Pr oes simples para a exponencial exp(A) em termos dos autovalores e dos projetores
espectrais de A. De fato, seja A = k=1 k Ek a decomposicao espectral de A, com {1 , . . . , r } sendo seus autovalores

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

452/2119

distintos (1 r n) e Ek sendo seus projetores espectrais (dados, por exemplo, comoPem (9.56), pagina 377). Pelo
n
1 a
C
alculo Funcional, Teorema 9.7, pagina 376, temos para o polinomio de Taylor p n (x) = a=0 a!
x que
pn (A) =

r
X

k=1

Tomando-se o limite n , segue facilmente que


eA =

r
X


pn k Ek .
ek Ek ,

k=1

express
ao essa de grande utilidade na determinacao explcita da exponencial de matrizes diagonalizaveis.
oes para o logaritmo de
E. 10.9 Exerccio. Usando tambem o Teorema Espectral e o Calculo Funcional, obtenha express
6
matrizes diagonalizaveis (em situacoes nas quais ele esteja definido).
Exponenciais de matrizes. Comutatividade

Para dois n
umeros complexos z e w e bem conhecida a validade da propriedade exp(z) exp(w) = exp(z + w) da funcao
exponencial. Podemos nos perguntar: sera essa propriedade valida tambem para matrizes? A resposta e que em geral tal
relacao n
ao e valida, apenas em certos casos especiais. A questao de determinar o produto de exponenciais de matrizes
tem grande importancia em varias manipulacoes algebricas e muito do que seguira abordara esse problema.
Lembremos a primeiramente a seguinte proposicao.
Proposic
ao 10.6 Se A, B Mat (C, n) s
ao duas matrizes que comutam, ou seja, AB = BA, entao
eA+B = eA eB = eB eA .

(10.24)

2
A propriedade (10.24) e familiar quando A e B sao n
umeros, mas nao e obvia quando A e B sao matrizes. De fato a
relacao acima e geralmente falsa caso A e B sejam matrizes que nao comutam. No caso em que A e B nao comutam o
produto eA eB pode ser computado com uso da formula de Baker-Campbell-Hausdorff, discutida na Secao 10.5, pagina
471.
Prova da Proposicao 10.6. Pela definicao
eA+B = 1 +

X
X
1
1
(A + B)m =
(A + B)m ,
m!
m!
m=1
m=0

onde convencionamos que (A + B)0 = 1. Como A e B comutam, vale a regra do binomio de Newton5
m  
X
m p mp
m
A B
.
(A + B) =
p
p=0
E. 10.10 Exerccio.
exemplos.

Por que? Vale a regra do binomio de Newton no caso de A e B nao comutarem? Teste alguns

Assim,
eA+B =

 
X
m
X
m
X
X
1 m p mp
1
A B
=
Ap B mp .
m!
(m

p)!p!
p
m=0 p=0
m=0 p=0

Agora, vale a seguinte regra de mudanca de ordem de somas:

X
m
X

X
X
( ) =
( ) .

m=0 p=0
5 Isaac

Newton (16431727).

p=0 m=p

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

E. 10.11 Exerccio. Por que?


Logo,
e

A+B

453/2119

X
1 p
1
Ap B mp =
A
=
(m p)!p!
p!
p=0
p=0 m=p
X

Agora, com a mudanca de variavel l = m p,

1
B mp
(m

p)!
m=p

X
1
1 l
B mp =
B = eB .
(m

p)!
l!
m=p
l=0

Assim,
eA+B =
Analogamente se prova que eA+B = eB eA .

X
1 p B
A e = eA eB .
p!
p=0

*
Podemos nos perguntar: o que ocorre se A e B nao comutarem? Ha alguma maneira de calcular exp(A+B) em termos
de produtos de exp(A) e exp(B) nesse caso? A resposta a essas questoes e dada por tres formulas muito importantes,
a formula de Lie-Trotter, a formula do comutador e a formula de Baker-Campbell-Hausdorff, das quais trataremos mais
adiante.
Algumas propriedades de fun
c
oes analticas de matrizes

Os exerccios seguintes, os quais sao muito simples de provar, apresentam afirmativas freq
uentemente usadas sobre
funcoes analticas de matrizes.
E. 10.12 Exerccio. Usando a definicao (10.21), mostre que
P 1 exp(A)P = exp P 1 AP
para matrizes n n reais ou complexas A e P , sendo P inversvel.
E. 10.13 Exerccio. Usando a definicao (10.21), mostre que

e que
exp(A)T = exp AT

(10.25)

exp(A) = exp (A )

para A Mat (C, n) ou A Mat (R, n).

Os exerccios acima podem ser facilmente generalizados:


E. 10.14 Exerccio. Seja f (z) :=

m=0

fm z m uma serie de potencias convergente para |z| < r0 para algum r0 > 0. Entao

para A Mat (C, n) com kAk < r0 tem-se


!T

X
X
m
m
=
fm AT
fm A
m=0

m=0

fm A

m=0

fm (A )m ,

m=0

X

ou seja, f (A)T = f AT e f (A) = f (A ), onde f (z) :=
fm z m = f (z). Prove essas afirmativas. Prove tambem que
m=0

P 1

m=0


ou seja, P 1 f (A)P = f P 1 AP .

fm Am

P =

m=0

fm P 1 AP

m

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

454/2119

Tambem muito u
til e a afirmacao contida no seguinte exerccio:
E. 10.15 Exerccio.

Sejam f (z) =

fm z

e g(z) =

m=0

m=0

gm z m duas series de potencias convergentes em |z| < r1 e

|z| < r2 , respectivamente. Sejam A e B Mat (C, n) duas matrizes com kAk < r 1 e kBk < r2 tais que AB = BA. Entao
f(A)g(B) = g(B)f (A). Prove isso.
6
O determinante de exponenciais de matrizes

O Teorema de Decomposicao de Jordan (Teorema 9.21, pagina 407) permite-nos demonstrar o resultado a seguir,
muito u
til, sobre o determinante de exponenciais de matrizes. Uma primeira demonstracao do mesmo foi apresentada
na Proposicao 9.14, pagina 363.
Proposic
ao 10.7 Seja A Mat (C, n) ou A Mat (R, n). Entao vale que

det eA = eTr(A) .

(10.26)

suficiente que provemos (10.26) para matrizes complexas primeiro, pois matrizes reais podem ser obtidas de matrizes
E
complexas do limite quando a parte imaginaria dos elementos de matriz vai a zero e a continuidade, tanto do lado direito
quanto do lado esquerdo de (10.26) em relacao aos elementos de matriz de A, garante a validade daquela expressao para
matrizes reais tambem.
Para a prova precisamos de um lema preparatorio simples.
Lema 10.1 Se D Mat (C, n) e uma matriz diagonal complexa n n, entao

det eD = eTr(D) .

Igualmente, se N Mat (C, n) e uma matriz nilpotente complexa n n, entao



det eN = eTr(N) = 1 .

Prova. A parte referente `a matriz diagonal e a mais facil. Suponhamos que D e a matriz diagonal D = diag (d 1 , . . . , dn),
sendo que os elementos da diagonal sao os autovalores de D. Segue que eD e a matriz diagonal D = diag ed1 , . . . , edn .

Assim, pela Proposicao 9.4, pagina 356, det eD = ed1 ++dn = eTr(D) .

Tratemos agora da parte referente `a matriz nilpotente N . Iremos provar provar que se N e nilpotente todos os
autovalores de eN sao iguais a 1. Pela Proposicao 9.30, pagina 402, os autovalores de N sao todos nulos, Assim, se
e um autovetor de N teremos eN = , ou seja, e autovetor de eN com autovalor 1. Infelizmente, isso nao nos
permite concluir diretamente que todos os demais autovetores de eN tem a mesma propriedade mas, como veremos, isso
e verdade.
k
X
1 m
Vamos supor que o ndice de N seja k, ou seja, N k+1 = 0. Assim, eN = 1 +
N . Seja 6= 0 um autovetor
m!
m=1
de eN com autovalor e suponhamos que 6= 1. De eN = tem-se
( 1) =

k
X
1 m
N
m!
m=1

(10.27)

e, assim, aplicando N k a ambos os lados, conclumos que ( 1)N k = 0, ja que no lado direito aparecem potencias
como N k+1 , N k+2 etc., todas nulas. Como 6= 1, devemos ter N k = 0. Retornando a (10.27), podemos re-escreve-la
como
k1
X 1
N m
( 1) =
m!
m=1

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

455/2119

eliminando o termo com N k . Aplicando N k1 a ambos os lados, conclumos que ( 1)N k1 = 0, ja que no lado
direito aparecem potencias como N k , N k+1 etc., todas nulas. Como 6= 1, devemos ter N k1 = 0. Prosseguindo
dessa forma concluiremos por fim que N = 0. Assim, eN = 1 = , provando que = 1, uma contradicao.

A conclusao e que todos os autovalores de eN sao iguais a 1, e pela Proposicao 9.4, pagina 356, det eN = 1.
Notemos
 que, pela Proposicao 9.30, pagina 402, os autovalores de N sao todos nulos e, assim, Tr(N) = 0. Logo,
det eN = 1 = eTr(N) . Isso completa a prova do lema.
Prova da Proposi
c
ao 10.7. Pelo Teorema de Decomposicao de Jordan, existe uma matriz inversvel T tal que
A = T 1 (D + N )T , onde D e diagonal, N e nilpotente e DN = N D. Logo,

eA = exp T 1 (D + N )T = T 1 exp(D + N )T = T 1 exp(D) exp(N )T .
Portanto,








det eA = det T 1 eD eN T = det T 1 det eD det eN det (T ) = det eD det eN ,

pois det T 1 = 1/ det (T ). Assim, pelo Lema 10.1, pela Proposicao 9.11 e pela propriedade (9.33),
det eA

completando a prova.

10.2.1

= eTr(D) eTr(N) = eTr(D+N ) = eTr(T

(D+N )T )

= eTr(A) ,

A Exponenciac
ao de Matrizes e os Grupos GL(C, n) e GL(R, n)

Recordemos que GL(C, n) (respectivamente, GL(R, n)) designa o grupo das matrizes inversveis complexas (reais)
n n. Aqui discutiremos a relacao entre a exponenciacao de matrizes e esses grupos. Essa discussao tera um papel mais
relevante quando tratarmos da teoria dos grupos de Lie e algebras de Lie nos Captulos 21 e 22.
Em primeiro lugar, tem-se a seguinte proposicao elementar:
Proposic
ao 10.8 A aplicac
ao exp definida em (10.21) e uma aplicac
ao de Mat (C, n) em GL(C, n) (ou, correspondentemente, de Mat (R, n) em GL(R, n)).
2
evidente pela definicao (10.21) que exp(0) = 1. Tudo o que se deseja provar e que para qualquer A Mat (C, n)
Prova. E
entao exp(A) e inversvel. Ora, por (10.24), e elementar constatar que exp(A) 1 = exp(A).
Tem-se tambem o seguinte:
ao sao
Proposic
ao 10.9 Para n 2 as aplicaco
es exp : Mat (C, n) GL(C, n) e exp : Mat (R, n) GL(R, n) n
injetoras.
2
Prova. Para matrizes complexas, basta constatar que, no exemplo das matrizes diagonais na forma D = diag (2k 1 i, . . . , 2kn i, )
com kl Z, tem-se exp(D) = 1.

0 1
,
Para matrizes reais, considere-se a matriz real A() := J onde J :=

1 0

tem-se para m
(10.21),

N,

R.

Como facilmente se ve,

A()2m = (1)m ()2m 1 e A()2m+1 = (1)m ()2m+1 J. Da, como facilmente se verifica por

cos
exp(A()) = cos()1 + sen ()J =

sen

sen
.

cos

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

456/2119

facil,
Logo, exp(A(2k)) = 1 para todo k Z. Assim a exponenciacao de matrizes reais 2 2 nao pode ser injetora. E
a partir desse exemplo, construir outros para matrizes reais n n com n 2.
Agora demonstraremos duas proposicoes nas quais as matrizes reais e complexas se diferenciam.
Proposic
ao 10.10 As aplicaco
es exp : Mat (R, n) GL(R, n), n 1, nao sao sobrejetoras.

Proposic
ao 10.11 As aplicaco
es exp : Mat (C, n) GL(C, n), n 1, sao sobrejetoras.

Prova da Prop. 10.10. Pela Proposicao 10.26, o determinante da exponencial de qualquer matriz real e positivo. Ora,
existem em GL(R, n) matrizes com determinante negativo. Logo, a exponenciacao de matrizes reais nao pode ser
sobrejetora.
` pagina 10.2.1 fazemos alguns coment
A
arios adicionais sobre a Proposicao 10.10.
Prova da Prop. 10.11. A Proposicao 10.11 afirma que toda matriz complexa inversvel n n pode ser escrita como
exponencial de outra matriz complexa n n. Provemos isso. Seja A GL(C, n). Pelo Teorema da Decomposicao
de Jordan (Teorema 9.21, pagina 407) existe uma matriz inversvel P tal que P 1 AP = D + N com D diagonal, N
nilpotente, DN = N D, sendo que D tem na diagonal principal os autovalores da matriz A. Esse u
ltimo fato diz-nos que
D nao tem autovalores nulos e, portanto, e tambem inversvel.
Podemos assim escrever D + N = D(1 + D 1 N ). O que faremos agora e provar os seguintes fatos:
1. D pode ser escrita como D = eF para alguma matriz F conveniente.
2. 1 + D 1 N pode ser escrita como 1 + D 1 N = eG para alguma matriz G conveniente.
3. Podemos escolher F e G de modo que F G = GF .
Desses tres fatos conclumos que P 1 AP = exp(F + G) e, portanto, A = exp (M ), onde M = P (F + G)P 1 , provando
o que desejamos.
Prova de 1. Sejam 1 , . . . , l os autovalores distintos de D. Pelo Teorema Espectral (vide Teorema 9.6, pagina 374, ou
l
X
j Ej , onde as matrizes Ej satisfazem (9.64) e (9.65) e, de acordo
Teorema 9.8, pagina 379) podemos escrever D =
j=1

1
com (9.66), podem ser expressas como polinomios em D (um fato que sera usado mais abaixo): E j = mj (
mj (D). (Os
j)
polinomios mj foram definidos na demonstracao do Teorema 9.8). Seja, para cada j, um n
umero complexo f j escolhido
de forma que exp(fj ) = j . Encontrar tais fj s sempre e possvel pois os j s sao nao-nulos, ja que D e inversvel. Se
definirmos
l
X
fj Ej
F :=
j=1

e facil constatar por (9.64) e (9.65) que exp(F ) = D (faca!). Isso prova 1. Note que, pelo que comentamos acima, vale
F =

l
X
j=1

fj
mj (D) ,
mj (j )

(10.28)

ou seja, F pode ser expressa como um polinomio em D.


Prova de 2. Como D 1 e N comutam (por que?), segue que D 1 N e nilpotente de ordem, digamos, k, ou seja
k+1
D1 N
= 0. Assim, para z C escolhido de modo que kzD 1 N k < 1, o logaritmo de 1 + zD 1 N esta bem
definido e vale (vide (10.22))
k
X
m
(z)m
.
(10.29)
D 1 N
G(z) =
m
m=1

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

457/2119

Sabemos pela Proposicao 10.5 que nesse caso em que kzD 1 N k < 1, ou seja, |z| < 1/kD 1 N k, temos
exp(G(z)) = 1 + zD 1 N .

(10.30)

Queremos agora provar que essa igualdade vale para todo z. Usando novamente o fato que as matrizes D 1 e N comutam
k+1
entre si, o fato que D1 N
= 0 e o fato que a soma em (10.29) e finita, teremos
k
X
m
(z)m
exp(G(z)) = exp
D1 N
m
m=1

k
Y



m
(z)m
1
=
exp
D N
m
m=1
=

k
Y

m=1

"

1+

k
X
(1)l (z)ml
l=1

l!

ml

ml

Como as somas a produtos acima sao finitos (conseq


uencia da nilpotencia de D 1 N ), constatamos que exp(G(z)) e um
polinomio em z para todo z C. Ora, ja verificamos acima que, quando |z| e pequeno, exp(G(z)) e igual ao polinomio em
z dado por 1 + zD1 N . Como polinomios sao funcoes analticas em toda parte isso implica que exp(G(z)) = 1 + zD 1 N
para todo z C. Em particular, para z = 1, o que significa que 1 + D 1 N = exp(G), onde
G G(1) =

k
X
(1)m+1
m
m=1

D1 N

m

E. 10.16 Exerccio. Usando a definicao (10.31), prove explicitamente que exp(G) = 1 + D 1 N .

(10.31)

Prova de 3. Por (10.28), F e um polinomio em D. Assim, F comuta com D 1 e com N . Logo, por (10.31), F comuta
com G. Isso e o que queramos provar e, assim, a prova da Proposicao 10.11 esta completa.

Coment
arios sobre a Proposic
ao 10.10

Sobre matrizes reais e possvel dizer mais que o enunciado da Proposicao 10.10 e sua prova. Em verdade, nao sao
apenas as matrizes com determinante negativo que estao fora da imagem da exponenciacao de matrizes reais. Ha algumas
com determinante positivo que tambem estao fora. Se M e uma matriz real inversvel, ent
ao seus autovalores sao as
razes do polinomio caracterstico p(x) = det(x1 M ). Como M e real, esse polinomio tem coeficientes reais e, como
e bem sabido, as razes de polinomios com coeficientes reais ou sao n
umeros reais ou sao pares de n
umeros complexos

0 1
sao i.
complexo-conjugados uns dos outros. Por exemplo, as razes do polinomio caracterstico da matriz

1 0

De qualquer forma, uma matriz com determinante positivo pode, digamos, ter duas razes negativas distintas simples,
como e, por exemplo, o caso da matriz

1 0

0 1

0 0

0
.

(10.32)

Isso posto, estudemos os autovalores das matrizes da forma eA com A real. Esses sao as razes do polinomio caracterstico p(x) = det(x1 eA ). Como toda matriz real e tambem membro de Mat (C, n) podemos aplicar o Teorema
da Decomposicao de Jordan (Teorema 9.21, pagina 407) e afirmar que existe uma matriz inversvel complexa P tal que
P 1 AP = D + N com D diagonal, N nilpotente, DN = N D, sendo que D tem na diagonal os autovalores da matriz
real A. Assim, pela propriedade do determinante,

p(x) = det(x1 eA ) = det P 1 (x1 eA )P = det(x1 eD eN ) .

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

458/2119

facil de ver da6 que os autovalores de eA sao os elementos da diagonal da matriz diagonal eD , que sao, como comentamos
E
acima, exponenciais dos autovalores da matriz real A. Podemos nos perguntar: podem os elementos da diagonal de e D
serem n
umeros negativos? A resposta e sim, mas para isso e necessario que A tenha um autovalor complexo cuja parte
imagin
aria seja da forma (2k + 1), com k inteiro. Ora, como A e real, existe pelo que comentamos acima, um outro
autovalor complexo de A cuja parte imaginaria e da forma (2k + 1), pois os autovalores complexos aparecem em pares
complexo-conjugados. Isso diz-nos que os autovalores negativos de eA tem multiplicidade par! Ora, isso nem sempre e
o caso para matrizes inversveis, como mostra o exemplo do u
ltimo paragrafo. Assim, matrizes reais com determinante
positivo e com pelo menos um autovalor negativo com multiplicidade mpar nao estao na imagem da exponencial de
nenhuma matriz real. Tal e o caso da matriz de (10.32). Em verdade, mesmo matrizes com determinante positivo e com
autovalores
negativos com multiplicidade par podem nao estar na imagem da exponencial. Tal e o caso das matrizes

1 a
com
a 6= 0 (mostre isso).
0 1

10.3

A F
ormula de Lie-Trotter e a F
ormula do Comutador

H
a duas expressoes envolvendo produtos de exponenciais de matrizes que sao bastante u
teis. Sao as formulas conhecidas
como formula de Lie-Trotter7 e f
ormula do comutador. A formula de Lie-Trotter e importante nao apenas no estudo de
grupos de Lie matriciais mas tambem na Mecanica Estatstica e na Mecanica Quantica, onde e freq
uentemente empregada.
A formula de Lie-Trotter, por exemplo, e usada na Mecanica Estatstica para relacionar sistemas quanticos de spin a
sistemas classicos de spin.
Proposic
ao 10.12 Para quaisquer matrizes A, B Mat (C, n) valem:
F
ormula de Lie-Trotter:

exp A + B
F
ormula do Comutador:

exp [A, B] =

lim

exp



m
1
1
A exp
B
.
m
m

(10.33)







m2
1
1
1
1
A exp
B exp A exp B
.
m
m
m
m

(10.34)

lim

exp

Prova. Vamos primeiramente provar a formula de Lie-Trotter8 e posteriormente passar `a formula do comutador.
Comecamos definindo, para m N,






1
1
1
A exp
B
e
Tm := exp
(A + B) .
Sm := exp
m
m
m
Note-se que (Tm )m = exp (A + B) e que tudo o que desejamos e provar que (Sm )m converge a exp (A + B), ou seja,
lim k(Sm )m (Tm )m kC = 0 .

Precisamos, portanto, estudar (Sm )m (Tm )m . Para isso, e u


til empregarmos a identidade algebrica (10.20). Daquela
relacao e das propriedades da norma operatorial, segue que
m

k(Sm ) (Tm ) kC
6 Pois

m1
X
p=0

kSm kpC kSm Tm kC kTm km1p


.
C

(10.35)

numa base conveniente a matriz eD eN e uma matriz triangular superior, tendo na diagonal principal os elementos da diagonal de

eD .
7 A f
ormula de Lie-Trotter foi originalmente demonstrada por Lie (Marius Sophus Lie (18421899)) e posteriormente generalizada por v
arios
autores, entre eles Trotter (Hale Freeman Trotter (1931)) em On the Product of Semi-Groups of Operators. Proc. Amer. Math. Soc. 10,
545551 (1959). O leitor poder
a encontrar v
arias dessas generalizac
oes (por exemplo para operadores auto-adjuntos n
ao-limitados agindo em
espacos de Hilbert) em [205]. O assunto e ainda hoje objeto de pesquisa.
8 Para a f
ormula de Lie-Trotter seguiremos aqui a demonstrac
ao de [205].

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

459/2119

Pela definicao, temos para qualquer matriz M Mat (C, n)



X
X
1
1 k


k exp (M ) kC =
M
kM kkC = ekM kC .


k!
k!

k=0

Assim,






1

A
kSm kC
exp


m
C

k=0






exp 1 B e(kAkC +kBkC )/m


m
C

e kTm kC e(kAkC +kBkC )/m . Retornando a (10.35), teremos


k(Sm )m (Tm )m kC e(kAkC +kBkC )(m1)/m

m1
X
p=0

kSm Tm kC mkSm Tm kC e(kAkC +kBkC ) .

Na u
ltima desigualdade usamos que (m 1)/m < 1 e que kSm Tm kC nao depende de p.

Como se ve da u
ltima expressao, tudo o que temos de fazer para mostrar que k(S m )m (Tm )m kC vai a zero quando
m e provar que kSm Tm kC vai a zero com 1/m2 quando m cresce. Isso e feito escrevendo as expressoes explcitas
para Sm e Tm em termos da serie de Taylor da funcao exponencial:

Sm Tm = exp






1
1
1
A exp
B exp
(A + B)
m
m
m

"

X mk
1
1+ A+
Ak
m
k!
k=2

#"

# "
#

X
X
1
1
mk k
mk
k
1+ B+
.
B 1 + (A + B) +
(A + B)
m
k!
m
k!
k=2

k=2

Expandindo-se a u
ltima linha, e identificando os termos em 1/m, e facil constatar que
S m Tm = 1 +

1
1
1
1
1
Sm ,
A + B 1 (A + B) + 2 Sm =
m
m
m
m
m2

onde Sm e uma serie, um tanto complicada, mas convergente em norma e tal que lim m kSm kC = finito. Assim,
1
mkSm Tm kC
kSm kC e, portanto, lim k(Sm )m (Tm )m kC = 0. Isso demonstrou a formula de Lie-Trotter. O
m
m
estudante mais avancado pode facilmente convencer-se que precisamente a mesma demonstracao se aplica ao contexto
de operadores limitados agindo em espacos de Banach.
Para a formula do comutador usaremos outro procedimento. Definimos








1
1
1
1
A exp
B exp A exp B
Um := exp
m
m
m
m
e teremos

Um =

"

X mk
1
1
1+ A+
A2 +
Ak
2
m
2m
k!
k=3

#"

X mk
1
1
1+ B+
B2 +
Bk
2
m
2m
k!

"

k=3

X (m)k
1
1
2
1 A+
A
+
Ak
m
2m2
k!
k=3

#"

X (m)k
1
1
2
1 B+
B
+
Bk
m
2m2
k!
k=3

Com um pouco de paciencia podemos expandir o produto dos quatro fatores do lado direito e constatar (faca!) que
os termos envolvendo 1/m se cancelam e o termo proporcional a 1/m2 e AB BA (outros termos como (1/m2 )A2 e
(1/m2 )B 2 tambem se cancelam. Verifique!). Ou seja, ficamos com
Um = 1 +

1
1
(AB BA) + 3 Rm ,
2
m
m

(10.36)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

460/2119

onde m13 Rm sao os termos restantes da expansao. Rm e uma expressao complicada, mas envolvendo series convergentes
e de tal forma que limm kRm kC e finito.

Isso diz que para m grande o suficiente a norma de Um 1 e pequena e, assim, podemos tomar o logaritmo de Um ,
definido por ln(Um ) = ln(1 + (Um 1)). Por (10.36) e pela expansao do logaritmo teremos



1
1
1
1
(AB BA) + 3 Rm ,
ln(Um ) = ln 1 + (Um 1) = ln 1 + 2 (AB BA) + 3 Rm =
m
m
m2
m
ou seja,

1
R ,
(10.37)
m m
onde Rm e novamente uma expressao complicada, mas envolvendo series convergentes e de tal forma que lim m kRm kC
1
e finito. Como limm m
Rm = 0 podemos escrever, pela Proposicao 10.3,



1
exp [A, B] = lim exp [A, B] + Rm .
m
m
m2 ln(Um ) = [A, B] +

Agora, por (10.37),

Logo,




m2

2
1
exp [A, B] + Rm = exp m2 ln(Um ) = exp ln(Um )
= (Um )m .
m
exp [A, B]

Isso e o que desejavamos provar9 .

lim (Um )m .

A demonstracao que apresentamos da formula do comutador pode ser usada para obter-se uma outra demonstracao
da formula de Lie-Trotter. Isso e o conte
udo exerccio que segue.
E. 10.17 Exerccio.
acima.

Demonstre a formula de Lie-Trotter usando as ideias da prova da formula do comutador, exibida

Uma segunda vers


ao da f
ormula de Lie-Trotter

A formula da Lie-Trotter e por vezes evocada (notadamente na Mecanica Estatstica) em uma forma ligeiramente
diferente:




m


1
1
1
A exp
B exp
A
exp (A + B) = lim exp
.
(10.38)
m
2m
m
2m
E. 10.18 Exerccio. Demonstre (10.38) a partir de (10.33). Sugestao: verifique primeiramente que, para todo m
vale






m




m



1
1
1
1
1
1
1
exp
A exp
B exp
A
A exp
B exp
A
A
= exp
exp
2m
m
2m
2m
m
m
2m
e, em seguida, use (10.33), tomando adequadamente o limite m .

N,




1
1
1
A exp m
B exp 2m
A e auto-adjunta se A e
A vantagem de (10.38) sobre (10.33)
reside
no fato de que exp 2m


1
1
A exp m
B nao e. Em certas aplicacoes (notadamente na Mecanica Estatstica) e
B o forem, enquanto que exp m
importante preservar a auto-adjuncao dos aproximantes de exp(A + B) usados na formula da Lie-Trotter.
9O

estudante pode estar curioso (ou perplexo) sobre o por qu


e de n
ao finalizamos a demonstrac
ao partindo de (10.37), escrevendo
2
ln(Um ) = ln((Um )m ) e tomando diretamente da o limite m . A raz
ao e que o fato de Um ser pr
oximo de 1 em norma n
ao
2
2
garante que (Um )m tambem o seja. Assim, o logaritmo de (Um )m pode n
ao fazer sentido. Para evitar esse transtorno l
ogico e mais
conveniente finalizar a demonstrac
ao com uso da func
ao exponencial de matrizes, para a qual tais problemas de definic
ao n
ao ocorrem.

m2

JCABarata. Notas para um Curso de Fsica-Matem


atica.

10.4

Vers
ao de 27 de maio de 2015.

Captulo 10

461/2119

Aplicac
oes Lineares em Mat (C, n)

O conjunto de matrizes Mat (C, n) e naturalmente um espaco vetorial complexo de dimensao finita n 2 , pois combinacoes
lineares de matrizes complexas n n sao novamente matrizes complexas n n, com a matriz nula fazendo o papel de
vetor nulo. Em areas relacionadas `a Teoria de Grupos e `a Mecanica Quantica (Informacao Quantica) ha interesse no
estudo de aplicacoes lineares agindo no espaco vetorial Mat (C, n). Na Secao 10.4.1 apresentaremos alguns fatos gerais
sobre tais aplicacoes lineares e na Secao 10.4.2, pagina 466, vamos exibir e estudar algumas dessas aplicacoes lineares
de interesse especfico e discutir suas relacoes. Os resultados aos quais chegaremos tem interesse por si so, mas nossa
intencao e tambem a de preparar a demonstracao da formula de Baker-Campbell-Hausdorff, a ser realizada na Secao
10.5, pagina 471.

10.4.1

Alguns Fatos Gerais sobre Aplicac


oes Lineares em Mat (C, n)

Como espaco vetorial complexo, Mat (C, n) pode ser dotado de diversos produtos escalares. O mais relevante, talvez,
n X
n
X



Aij Bij , com A, B
e que empregaremos no que segue, e aquele definido em (10.13): A, B := Tr A B =
i=1 j=1

Mat (C, n).

Dizemos que uma colecao {F , {1, . . . , n2 }} de n2 elementos


 linearmente independentes de Mat (C, n) e uma


F
base ortonormal em Mat (C, n), se valer hF , F i = Tr F
= .

Mat (C, n) possui uma base natural de vetores que, coincidentemente, e uma base ortonormal em relacao ao produto
escalar acima. Trata-se da base composta pelas n2 matrizes E a, b , com a, b {1, . . . , n}, onde E ab e a matriz cujo
elemento ij e nulo a menos que i = a e que j = b, em cujo caso (E a, b )ij = 1. Em smbolos,

E a, b ij = ia jb .

Note-se que E a, b = E b, a . Claro esta que toda matriz A Mat (C, n) pode ser escrita na forma
A =

n X
n
X

Aab E a, b

a=1 b=1

e que

n X
n
X

a, b

(E a, b )ij (E c, d )ij =
E , E c, d =
i=1 j=1

mostrando que E

a, b

n
X
i=1

! n
X
jb jd = ac bd ,
ia ic
j=1

, a, b {1, . . . , n} e uma base ortonormal em Mat (C, n).



O espaco L Mat (C, n) das aplica
co
es lineares de Mat (C, n) em si mesmo

Uma aplicacao L : Mat (C, n) Mat (C, n) e dita ser uma aplicacao linear se satisfizer
L(zA+ wB) = zL(A) +wL(B)

para todos z, w C e todas A, B Mat (C, n). Denotaremos por L Mat (C, n) o conjunto de todas as aplicacoes


lineares de Mat (C, n) em


 si mesmo. E bastante claro que L Mat (C, n) e tambem um espa
 co vetorial complexo,
 pois
se L, M L Mat (C, n) e z, w C, definimos zL + wM como o elemento de L Mat (C, n) dado por zL + wM (A) :=
zL(A) + wM(A) para todo A Mat (C, n).



Podemos dotar L Mat (C, n) de um produto escalar atraves do seguinte procedimento. Seja F , {1, . . . , n2 }
uma base ortonormal em Mat (C, n). Definimos para L, M a expressao.
n2


X


:=
L, M
Tr L(F ) M(F ) .
=1

evidente que trata-se de uma forma sesquilinear e e facil ver que e uma forma sesquilinear Hermitiana, pois
E
n2
n2




X
X


L, M =
Tr M(F ) L(F ) = M, L ,
Tr L(F ) M(F ) =
=1

=1

(10.39)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

462/2119

tambem claro que


onde usamos que Tr(A) = Tr(A ) para toda A Mat (C, n). E
n2


X


Tr L(F ) L(F ) 0
L, L :=
=1






para todo L L Mat (C, n) . Tem-se tambem que L, L = 0 implica que Tr L(F ) L(F ) = 0 para todo , o que

implica que L(F ) = 0 para todo , o que, por sua vez implica que L = 0, pois os F compoem uma base em Mat (C, n).
interessante ainda mostrar que (10.39)
Isso estabeleceu que (10.39) e, de fato, um produto escalar em L Mat (C, n) . E
independe da particular base ortonormal adotada em Mat (C, n). Para ver isso, seja {G , {1, . . . , n2 }} uma outra
base ortonormal em Mat (C, n) e escrevamos
2

n
X

=1

Teremos


Tr (G ) F G .

n2
n2 X
n2 X
 

 

X


L, M =
Tr (G ) F Tr (G ) F Tr L(G ) M(G ) .

(10.40)

=1 =1 =1

Agora,
2

n
X

=1

n2

 


 

X

Tr (F ) G Tr (G ) F
=
Tr (G ) F Tr (G ) F
=1

= Tr (G )

Retornando com isso a (10.40), obtemos

n
X

=1




Tr (F ) G F = Tr (G ) G = .

n2
n2
n2 X




X
X

Tr L(G ) M(G ) ,
Tr L(G ) M(G ) =
L, M =
=1 =1

=1

estabelecendo a independencia que desejavamos provar.


Uma identidade para o traco de elementos de Mat (C, n)

A seguinte identidade e importante e sera empregada adiante: para toda A Mat (C, n) vale
Tr(A)1 =

n X
n
X
a=1 b=1


E a, b AE a, b .

(10.41)


Para demonstra-la, determinemos o elemento ij da matriz E a, b AE a, b . Pela regra de produto de matrizes, temos




E a, b AE a, b

ij

n X
n
X
k=1 l=1

E a, b

A E a, b
ik kl

lj

n X
n
X

E a, b

k=1 l=1

ki

Akl E a, b

lj

n X
n
X

ka ib Akl la jb = Aaa ib jb .

k=1 l=1

Logo, o elemento ij da matriz do lado direito de (10.41) vale


n X
n
X
a=1 b=1

Aaa ib jb =

n
X

a=1

Aaa

n
X
b=1

ib jb = Tr(A) ij ,

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

463/2119

que e o elemento ij da matriz Tr(A)1, provando (10.41).


Uma das razoes pelas quais a relacao (10.41) e relevante e que a mesma pode ser estendida para outras bases

2
orgonormais em
 Mat (C, n). Seja {F , {1, . . . , n }} uma base ortonormal em Mat (C, n), ou seja, tal que

hF , F i = Tr F F = . Afirmamos que vale


2

Tr(A)1 =

n
X

=1


F AF .

(10.42)

Para a demonstracao, observemos que podemos escrever


2

a, b

n
X

Gab F ,

=1

para certas constantes Gab


segue facilmente tambem que

C, pois as matrizes F

formam uma base. Usando a ortonormalidade dessas matrizes,

n X
n
n X
n


X
X




Gab = Tr F E a, b =
F kl E a, b kl =
F kl ka lb =
k=1 l=1

k=1 l=1

ab

Assim, temos por (10.41) que


2
2

n X
n
n X
n X
n2 X
n2
n
n
X
X
X
X



ab

ab

Tr(A)1 =
G F A
G F =
F ab F ab F AF
a=1 b=1

Agora,

=1

a=1 b=1

Portanto,

Tr(A)1 =

ab

(10.44)

a=1 b=1 =1 =1

=1

n X
n
X

(10.43)

n X
n
X

=1 =1

como queramos provar.

ab

= Tr F

= .

n
X


F AF ,
F AF =
=1

Segue de (10.42), tomando-se A = 1, que


2

n
X

=1


F F = n1 .

(10.45)

De (10.42) vamos extrair uma importante conclusao sobre a forma geral de aplicacoes lineares de Mat (C, n) em si
mesmo.

A forma geral de elementos de L Mat (C, n)


Afirmamos que se F , {1, . . . , n2 } e uma base ortonormal em Mat (C, n), ent
ao L pode ser escrita na forma
2

L(A) =

n X
n
X

=1 =1


F AF ,

A Mat (C, n) ,

(10.46)

para certas constantes C independentes de A. Demonstremos essa afirmacao. Como as matrizes F compoem
uma base ortonormal e L(A) Mat (C, n), podemos escrever
2

A =

n
X

=1


 
Tr F A F .

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

464/2119

Logo,
2

L(A) =

n
X

=1

n2


X
 
 
Tr F A L(F ) =
L(F )Tr F A

(10.42)

=1

onde

n X
n
X

L(F ) F

=1 =1

n
X

M AF ,
F AF =
=1

n
X

Como M Mat (C, n), podemos escrever M =


base ortonormal em Mat (C, n)) com

=1

Pn2

=1

L(F ) F

n
X

=1

(ja que


, {1, . . . , n2 } e tambem uma



 
Tr L(F ) F F F .

(10.47)

Portanto,
2

L(A) =

n X
n
X

=1 =1

como queramos mostrar.

AF ,


A forma geral de elementos de L Mat (C, n) . Uma segunda abordagem

Ha uma segunda demonstracao daforma geral (10.46), a qual e, talvez, mais elegante e instrutiva. Para ,
{1, . . . , n2 }, seja T L Mat (C, n) definido por


F AF


para toda A Mat (C, n). Vamos mostrar que a colecao T , , {1, . . . , n2 } e ortonormal em relacao ao
produto escalar (10.39). De fato,
T (A) :=

n2
n2




X
X





:=
Tr T (F ) T (F ) =
Tr F (F ) F F F F
T , T
=1

=1

= Tr F

(F ) F F

=1

n
X

F F

(10.42)


  

Tr F Tr F F
F

 
  
= ,
= Tr F F Tr F F

como desejavamos estabelecer.





2
Com isso, vemos
 que T , , {1, . . . , n } e uma base ortonormal em L Mat (C, n) e que todo elemento
L L Mat (C, n) pode ser univocamente escrito na forma
2

L =

n X
n
X

T ,

=1 =1

para certas constantes C, as quais sao dadas por

n2
n2




X
X

= T , L =
Tr T (F ) L(F ) =
Tr (F ) (F ) F L(F ) ,
=1

=1

(10.48)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

465/2119

tal como em (10.47). A relacao (10.48) e precisamente (10.46). Da independencia dos T vemos que a representacao
(10.48) e (10.46) determina L univocamente.
Operaco
es Lineares em Mat (C, n) que preservam auto-adjunticidade


Importante no contexto da Fsica Quantica e a identificacao de quais elementos de L Mat (C, n) levam matrizes
auto-adjuntas em matrizes auto-adjuntas. O resultado a seguir fornece a resposta a essa questao.

Proposic
ao 10.13 Uma aplicaca
o L L Mat (C, n) leva matrizes auto-adjuntas em matrizes auto-adjuntas se e
somente se satisfizer L(A) = L(A ) para toda A Mat (C, n).

Se L L Mat (C, n) for escrita na forma geral (10.46) ou (10.48),
2

L =

n X
n
X

T ,

(10.49)

=1 =1

uma condica
o necess
aria e suficiente para que tenhamos L(A) = L(A ) para toda A Mat (C, n) e que valha =
para todos , {1, . . . , n2 }. Por fim, uma condica
o necess
aria e suficiente para que isso se de e que existam
constantes reais d R, {1, . . . , n2 } e matrizes M Mat (C, n), {1, . . . , n2 } tais que
2

L(A) =

n
X

=1


d M A M ,

(10.50)

para toda A Mat (C, n). As matrizes M podem ser escolhidas ortonormais:

Tr (M ) M = ,

para toodos , {1, . . . , n2 }.


Em outras palavras, essa proposicao estabelece que L L Mat (C, n) preserva a propriedade de auto-adjunticidade
de matrizes de Mat (C, n) se e somente se existir uma base ortonormal M Mat (C, n), {1, . . . , n2 } e n
umeros

Pn2

2
reais d R, {1, . . . , n } tais que L(A) = =1 d M
A M para toda A Mat (C, n).

Prova da Proposicao 10.13. Seja L L Mat (C, n) dotada da propriedade que L(B) = L(B) para toda B Mat (C, n)
satisfazendo B = B. Se A Mat (C, n), podemos escrever A = Re (A) + iIm (A) com Re (A) e Im (A) sendo
 as matrizes

1

:= 12 (A + A ) e Im (A) := 2i
(A

A
).
Teremos,
L(A)
=
L
Re
(A)
+ iL Im (A)
.
auto-adjuntas definidas
por
Re
(A)





Logo, como L Re (A)


e
L
Im
(A)
s
a
o,
por
hip
o
tese,
auto-adjuntas,
segue
que
L(A)
=
L
Re
(A)

iL
Im
(A)
=

L Re (A) iIm (A) = L(A ), como desejavamos constatar.
Vamos agora supor, reciprocamente, que L(A) = L(A ) para toda A Mat (C, n). Se B Mat (C, n) satisfaz
B = B, teremos L(B) = L(B ) = L(B), provando que L(B) e auto-adjunta.


Se L L Mat (C, n) satisfaz L(A) = L(A ), ou seja, L(A) = L A , para toda A Mat (C, n), temos, pela
f
ormula geral (10.46), que

n X
n
X

=1 =1

AF

= L(A) = L A

n X
n
X

=1 =1

AF ,

ou seja,
2

n X
n
X

=1 =1

T =

n X
n
X

T .

=1 =1

Pela unicidade da representacao (10.48), conclumos que = para todos , {1, . . . , n2 }. A recproca e
evidente.

Se L L Mat (C, n) e da forma (10.50), e evidente que L(A) = L(A ) para todaa A Mat (C, n). Seja agora

L L Mat (C, n) da forma geral (10.46) ou (10.48), com = para todos , {1, . . . , n2 }. Isso diz-nos

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

466/2119

que a matriz Mat (C, n2 ), cujos elementos de matriz sao , e uma matriz auto-adjunta e, portanto, pode ser
2

diagonalizada por uma


 matriz unitaria (Teorema 9.14, pagina 389). Assim, existe u Mat (C, n ) com = u du, com
d = diag d1 , . . . , d , sendo d os autovalores reais de Assim, escrevemos, para toda A Mat (C, n),
2

L(A) =

n X
n
X

=1 =1

AF

n X
n X
n
X

u d u F

=1 =1 =1
2

n
X

=1

onde

AF

n
X

u F

=1

n
X

=1

u F

n
X

=1


d M A M ,

M :=

n
X

u F ,

=1

provando (10.50). Note-se que, como u Mat (C, n2 ) e unitaria, vale


2

Tr (M ) M

10.4.2

n X
n
X

u u Tr (F ) F
=
|
{z
}
=1 =1

n
X

u (u ) = .

=1

Alguns Exemplos Especficos de Aplicac


oes Lineares em Mat (C, n)


Nesta secao apresentaremos alguns elementos de L Mat (C, n) dotados de interesse especial e estudaremos suas propriedades, tendo como objetivo maior a demonstracao da formula de Baker, Campbell e Hausdorff na Secao 10.5, pagina
471. Alguns dos resultados que obteremos, porem, sao de utilidade na Teoria de Grupos, na Mecanica Quantica e outas
areas.
As aplicaco
es ad

Dada uma matriz X Mat (C, n) fixa podemos definir uma aplicacao linear ad[X] em Mat (C, n), ad[X] :
Mat (C, n) Mat (C, n) por
ad[X](A) := [X, A] = XA AX .
para toda matriz A Mat (C, n).

As aplicaco
es Ad

Analogamente, seja G GL(C, n) uma matriz inversvel fixa. Podemos definir uma aplicacao linear Ad[G] em
Mat (C, n), Ad[G] : Mat (C, n) Mat (C, n) por
Ad[G](A) := GAG1 .
Definindo a exponencia
c
ao de ad

Denotaremos por (ad[X])p ou ad[X]p a p-esima potencia de ad[X]:


h
i

ad[X]p (A) = X, X, . . . , [X , A] .
|
{z
}
p vezes

Aqui, p = 1, 2, . . .. Para facilitar a notacao em aplicacoes futuras, convencionaremos que ad[X] 0 (A) = A para toda
matriz A Mat (C, n).

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

467/2119

Dado que ad[X] e uma aplicacao linear em um espaco vetorial de dimensao finita, sua exponencial e bem definida.
Definimos Exp[ad[X]] como sendo a aplicacao linear no espaco das matrizes complexas nn, Exp[ad[X]] : Mat (C, n)
Mat (C, n) dada por

X


m
1
Exp ad[X] (A) :=
ad[X] (A)
m!
m=0

:= A +

A+

X
m
1
ad[X] (A) ,
m!
m=1

X

i
1 h
X, X, . . . , [X , A] ,
m! |
{z
}
m=1
m vezes

para toda A Mat (C, n). A convergencia da serie e automaticamente garantida pelas observacoes da Secao 10.2.
A relac
ao entre ad e Ad

Ha uma relacao elegante entre as aplicacoes ad e Ad, a qual se expressa na seguinte proposicao:

Proposic
ao 10.14 Seja X Mat (C, n) qualquer. Entao




Ad exp(X) = Exp ad[X] ,

(10.51)

ou seja, para toda matriz A Mat (C, n) vale

exp(X)A exp(X) = A +

X
m
1
ad[X] (A) ,
m!
m=1

(10.52)

ou seja,
exp(X)A exp(X) = A +

X

i
1 h
X, X, . . . , [X , A]
m! |
{z
}
m=1
m vezes

= A + [X, A] +


i
 1h
1
X, X, [X, A] + .
X, [X, A] +
2!
3!

(10.53)

Coment
arios.

A express
ao (10.52) ou (10.53) e comummente denominada s
erie de Lie, mas alguns autores tambem a denominam f
ormula
de Baker-Campbell-Hausdorff. Reservaremos esse nome apenas para a express
ao (10.60), adiante.

As express
oes (10.52) e (10.53) s
ao empregadas de v
arias formas na Mec
anica Qu
antica, na Mec
anica Estatstica Qu
antica e na Teoria
Qu
antica de Campos, especialmente na Teoria de Perturbaco
es e nas Teorias de Calibre.

Prova. Seja t R e sejam A e X matrizes complexas n n fixas quaisquer. Definamos

X


m
tm
1 (t) := Exp ad[tX] (A) = A +
ad[X] (A)
m!
m=1



2 (t) := Ad exp(tX) (A) = exp(tX)A exp(tX) .

Vamos mostrar que 1 (t) = 2 (t) para todo t provando para isso que ambas satisfazem a mesma equacao diferencial
linear com a mesma condicao inicial.

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

468/2119

trivial constatar que 1 (0) = 2 (0) = A. Pela definicao tem-se


E
d
1 (t) =
dt

m
tm1
ad[X] (A)
(m

1)!
m=1

!
m1
tm1
= ad[X]
ad[X]
(A)
(m 1)!
m=1

X
m
tm
ad[X] (A)
= ad[X]
m!
m=0




= ad[X] Exp ad[tX] (A)


= ad[X] 1 (t) .

Em resumo, 1 (t) satisfaz

Analogamente, calculemos

d
dt 2 (t).


d
1 (t) = ad[X] 1 (t) .
dt

Aplicando a regra de Leibniz10 ,

d
2 (t) =
dt

d
(exp(tX)A exp(tX))
dt

= X exp(tX)A exp(tX) exp(tX)A exp(tX)X


= ad[X] exp(tX)A exp(tX)

Em resumo, 2 (t) satisfaz


= ad[X] 2 (t) .


d
2 (t) = ad[X] 2 (t) .
dt

Constatamos assim que 1 (t) e 2 (t) satisfazem a mesma equacao diferencial com a mesma condicao inicial. Pelo
Teorema de existencia e unicidade de solucoes de sistemas de equacoes diferenciais lineares com coeficientes constantes
discutido na Secao 13.2, isso implica que 1 (t) = 2 (t) para todo t R e, em particular para t = 1, que e a afirmacao
do teorema.
Coment
ario. O teorema acima e sua demonstracao exemplificam uma situacao nao muito incomum, onde apresenta-se um resultado que

e muito difcil de ser provado por um procedimento mas muito f


acil de ser demonstrado por outro. Tente o leitor demonstrar a identidade
(10.52) expandindo as exponenciais do lado direito em suas series de Taylor, ou seja, escrevendo
X

X
(1)l k
X AX l
exp(X)A exp(X) =
k!l!
k=0 l=0

e reordenando as somas de modo a obter o lado esquerdo de (10.52)! Ainda que seja possvel provar (10.52) dessa forma, um tal procedimento

e muitssimo mais complexo que aquele que empregamos, e que faz apenas uso de um fato b
asico bem conhecido da teoria das equaco
es
diferenciais.

E. 10.19 Exerccio. Tenha a ideia certa antes de tentar resolver qualquer problema.
A aplicac
ao diferencial exponencial dexp

Seja F (t) uma matriz complexa n n cujos elementos de matriz (F (t))ij sao funcoes diferenciaveis em relacao a t.
d
(F (t))ij . Em palavras, F (t) e obtida diferenciando cada elemento de
Seja tambem F (t) a matriz cujo elemento ij e dt
matriz de F (t).
10 Gottfried

Wilhelm von Leibniz (16461716).

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

469/2119

d
exp(F (t))? O estudante apressado poderia imaginar que
Vamos nos colocar o seguinte problema: como calcular dt
d

e, todavia, em geral falso, pois essa regra de derivacao nao vale para matrizes!
dt exp(F (t)) = exp(F (t))F (t). Isso
Isso e assim, pois a matriz F (t) nao necessariamente comuta com a matriz F (t). Tem-se, em verdade, que para todo
m = 1, 2, 3, . . .,

m1
X
d
d
F (t)k F (t)F (t)mk1 .
(F (t))m =
F (t) F (t) =
{z
}
dt
dt |
k=0
m vezes
Conseq
uentemente,
n1
X
X 1

d
exp F (t) =
F (t)k F (t)F (t)nk1 .
(10.54)
dt
n!
n=1
k=0

Isso motiva a seguinte definicao. Para X Mat (C, n) fixo, definimos uma aplicacao linear dexp[X] : Mat (C, n)
ao diferencial exponencial, por
Mat (C, n), denominada aplicac
dexp[X](A) :=

E. 10.20 Exerccio.

(10.55)

k=0

para todo A Mat (C, n).

n1
X
X 1
X k AX nk1 ,
n!
n=1

Mostre que a serie do lado direito esta bem definida, ou seja, que e convergente para todos X e A.

Com essa definicao podemos, por (10.54), escrever






d
exp F (t) = dexp F (t) F (t) .
(10.56)
dt
Para uma expressao alternativa para a derivada da exponencial de uma matriz dependente de um parametro, vide equacao
(10.78), pagina 477.
Por razoes que ficarao claras adiante quando provarmos a formula de Baker, Campbell e Hausdorff, e conveniente
expressar dexp[X] em termos de ad[X]. Como veremos, e possvel fazer isso e o resultado esta expresso na Proposicao
10.15 que apresentaremos e demonstraremos a seguir.
Antes, porem, duas definicoes. Para z C definimos a funcao complexa (z) por
(z) :=

X
(1)m m
1 ez
=
z .
z
(m + 1)!
m=0

(10.57)

Como a serie de Taylor do lado direito converge para todo z C, (z) e uma funcao inteira, ou seja, e analtica em toda
parte.
Pelos nossos coment
arios da Secao 10.2, podemos definir para todo X Mat (C, n) uma aplicacao linear [X] :
Mat (C, n) Mat (C, n) dada por
[X] := (ad[X]) ,
(10.58)
ou seja, [X] e a aplicacao que a todo A Mat (C, n) associa a matriz [X](A) dada por
[X](A) =

X
(1)m
ad[X]m (A) .
(m
+
1)!
m=0

(10.59)

Pelos coment
arios da Secao 10.2 a serie do lado direito converge para todos X, A Mat (C, n).

Proposic
ao 10.15 Com as definico
es apresentadas acima, vale para todos A, X Mat (C, n) a express
ao
dexp[X](A) = exp(X) [ad[X]](A) ,
ou seja,

X
(1)m
ad[X]m (A)
dexp[X](A) = exp(X)
(m + 1)!
m=0

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

470/2119

Tambem como comentado acima, e in


util tentar provar a proposicao partindo de (10.55) e aplicando forca-bruta. A
demonstracao usara uma serie de truques elegantes.
Prova. Vamos definir, para A, X Mat (C, n) fixas e t R,
H(t) := t dexp[tX](A) .
A ideia e descobrir uma equacao diferencial que H(t) satisfaz e, em seguida, resolve-la. Note-se que, pela definicao,
H(0) = 0. Como veremos, resolver a equacao diferencial e tarefa relativamente facil. Um pouco mais trabalhoso e
encontrar a equacao diferencial. Para isso temos que calcular a derivada de H(t) em relacao a t.
Pela definicao de H(t) e de dexp[tX](A) em (10.55), tem-se
d
H(t) =
dt

n1
X
X tn

d
d
(t dexp[tX](A)) =
dt
dt
n1
X
X

n=1 k=0

= A+

n=1 k=0

n!

X AX

nk1

X
n
X
tn k
tn1
X k AX nk1 =
X AX nk
(n 1)!
n!
n=0
k=0

X
n
X
tn

n=1 k=0

n!

X k AX nk = A +

n
X
t
Xn
= A 1+
n!
n=1

= A exp(tX) + tX

k=1

X
n
X
tn

n=1 k=1

n!

X
n
X
tn1

n=1 k=1

= A exp(tX) + tX

n
X
n
X
X
t
tn k
AX n +
X AX nk
n!
n!
n=1
n=1

n!

n1
X
X tn1

n=1 k=0

n!

X k AX nk = A exp(tX) +

X
n
X
tn

n=1 k=1

k1

AX

nk

n!

X k AX nk

X k AX nk1

= A exp(tX) + X (t dexp[tX](A)) = A exp(tX) + XH(t) .


Em resumo, H(t) satisfaz a equacao diferencial
d
H(t) = XH(t) + A exp(tX) ,
dt
com a condicao inicial H(0) = 0.
Como estudamos `a pagina 531 da Secao 13.2.2, a solucao geral da equacao matricial
Z t

d
M(t) = XM(t) + G(t)
e
M(t) = exp(tX)M(0) +
exp (t s)X G(s)ds .
dt
0

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

471/2119

Assim, como H(0) = 0 e G(t) = A exp(tX), teremos


H(t)


exp (t s)X A exp(sX) ds

exp(tX)

exp(sX)A exp(sX) ds = exp(tX)

(10.51)

exp(tX)



Exp ad[sX] (A) ds = exp(tX)



Ad exp(sX) (A) ds

t X

(s)m
ad[X]m (A) ds
m!
m=0

Z t

X
X
(1)m tm+1
(1)m
m
sm ds = exp(tX)
ad[X] (A)
ad[X]m (A)
exp(tX)
m!
(m
+
1)!
0
m=0
m=0

t exp(tX)

(10.59)

X
(1)m tm
ad[X]m (A)
(m
+
1)!
m=0

t exp(tX) [tX](A) .

Essa expressao vale para todo t R. Tomando t = 1, teremos H(1) = exp(X)[X](A), ou seja,
dexp[X](A) = exp(X) [X](A) ,
que e o que queramos provar.
Reunindo todos esses resultados, estamos agora preparados para provar a formula de Baker, Campbell e Hausdorff.

10.5

A F
ormula de Baker, Campbell e Hausdorff

A presente secao e dedicada `a demonstracao da celebre F


ormula de Baker-Campbell-Hausdorff. Seguiremos com diversas
modificacoes o tratamento de [111]. O resultado principal que desejamos provar encontra-se expresso no seguinte teorema:
Teorema 10.1 (F
ormula
) Para A, B Mat (C, n) tais que kAkC e kBkC sejam

 de Baker-Campbell-Hausdorff
1
2
ambas menores que 2 ln 2 2 0, 12844 . . ., vale
exp(A) exp(B) = exp(A B) ,

com

A B := A + B +

k, l0 a1 , b1 0
k+l>0 a1 +b1 >0

ak , bk 0
ak +bk >0

(1)k
l!(k + 1)(b1 + + bk + 1)

k
Y

1
a
!bi !
i
i=1

ad[A]a1 ad[B]b1 ad[A]ak ad[B]bk ad[A]l (B) . (10.60)


Os primeiros termos de (10.60) s
ao


1
1
1
A B = A + B + [A, B] +
A, [A, B] +
B, [B, A] + .
2
12
12

(10.61)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

472/2119

Coment
ario.

A express
ao (10.60) e a c
elebre f
ormula de Baker11 , Campbell12 e Hausdorff13 , que desempenha um papel importante no
estudo de grupos de Lie e outras
areas. Advertimos que, devido `
a sua complexidade e devido `
a restrica
o quanto `
a norma das matrizes A e
B, a f
ormula de Baker-Campbell-Hausdorff tem um escopo de aplicaco
es relativamente limitado no que concerne a c
omputos de produtos de
exponenciais. A mesma f
ormula, porem, presta-se `
a demonstrac
ao de v
arios teoremas, especialmente na teoria dos grupos de Lie. Uma situac
ao
interessante na qual a f
ormula de Baker-Campbell-Hausdorff pode ser empregada e aquela na qual comutadores de ordem suficientemente
grande das matrizes A e B se anulam, pois a o lado direito de (10.60) ou (10.61) tem um n
umero finito de termos. Tal ocorre nas chamadas
a
lgebras de Lie nilpotentes. O leitor que procura um exemplo simples do uso de (10.61) pode interessar-se em ler sobre o chamado grupo de
Heisenberg na Sec
ao 21.2.2, p
agina 1009.

Prova do Teorema 10.1. A estrategia que empregaremos para provar a formula de Baker, Campbell e Hausdorff e
muito semelhante `aquela empregada na demonstracao da Proposicao 10.15. Seja, para A, B Mat (C, n) fixas tais que
kAkC < ln(2)/2 e kBkC < ln(2)/2, a matriz14


G(t) := ln exp(A) exp(tB) ,
(10.62)
para t [1, 1]. Vamos identificar uma equacao diferencial satisfeita por G(t) e, em seguida, resolve-la.

Comecemos procurando calcular a derivada de G(t) em relacao a t. Isso e uma tarefa mais difcil do que parece e
conveniente calcular primeiro a derivada de exp(G(t)). Por um lado, temos que
procederemos de modo indireto. E
exp(G(t)) = exp(A) exp(tB)

e, portanto,

d
d
exp(G(t)) = exp(A) exp(tB) = exp(A) exp(tB)B .
dt
dt
Por outro tem-se, pela definicao da aplicacao dexp, que

Portanto,




d
exp(G(t)) = dexp G(t) G (t) .
dt



dexp G(t) G (t) = exp(A) exp(tB)B .

Usando a Proposicao 10.15, pagina 469, essa u


ltima igualdade pode ser escrita como
 


exp G(t) G(t) G (t) = exp(A) exp(tB)B ,

o que implica que





G(t) G (t) = exp(G(t)) exp(A) exp(tB)B = exp(tB) exp(A) exp(A) exp(tB)B = B .
Resumindo, tem-se




G(t) G (t) = B .

(10.63)

A ideia que agora perseguiremos e tentar inverter essa expressao de modo a obter G (t) (que aparece no argumento de
no lado esquerdo). Para isso faremos uso do seguinte lema:
Lema 10.2 Sejam as func
oes complexas
(z) :=

1 ez
,
z

zC,

z ln(z)
,
z1
sendo que a primeira ja fora definida em (10.57). Entao vale
(z) :=

|z 1| < 1 ,

(ez )(z) = 1
para todo z C tal que |z| < ln 2.
11 Henry

(10.64)

Frederick Baker (18661956).


Edward Campbell (18621924).
13 Felix Hausdorff (18681942).
14 A condi
c
ao kAkC < ln(2)/2 e kBkC < ln(2)/2 garante que k exp(A) exp(tB) 1kC < 1 para todo t [1, 1]. Assim, o logaritmo de
exp(A) exp(tB) em (10.62) est
a definido.
12 John

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

473/2119

Prova. Usando a expansao em serie de Taylor da funcao ln, podemos escrever


(z) := z

X (1)k1
ln(z)
ln(1 + (z 1))
= z
= z
(z 1)k1 ,
z1
z1
k

(10.65)

k=1

mostrando que (z) e analtica na regiao |z 1| < 1. Agora, se |z| < ln 2, tem-se |ez 1| < 1, pois ez 1 =
|ez 1|

X
1 m
z e
m!
m=1

X
X
1
1
|z|m <
(ln 2)m = eln 2 1 = 1 .
m!
m!
m=1
m=1

Assim, ez esta dentro da regiao onde e analtica, onde vale que



 z 
1 ez
e z
= 1,
(ez )(z) =
ez 1
z
que e o que queramos provar.
O uso que faremos desse lema e o seguinte. Seja X Mat (C, n) qualquer. Por analogia com a definicao de [X] em
(10.58), definimos






= Ad exp(X) .
[X] := Exp ad[X]

Assim, se kad[X]k < ln 2 (para ficarmos no domnio de validade de (10.64)), teremos






[X][X] := Exp ad[X] ad[X] = id ,

onde id e a aplicacao identidade: id(A) := A, para toda A Mat (C, n). Portanto, assumindo que kad[G(t)]k < ln 2
teremos, aplicando [G(t)] a (10.63),


G (t) = G(t) (B) .
(10.66)

Essa e a equacao diferencial procurada e que e satisfeita por G(t), com a condicao inicial G(0) = A.

Note-se que para que as manipulacoes de acima sejam validas e necessario (para ficarmos no domnio de validade de
(10.64)) que kadG(t)k < ln 2. Afirmamos que, para tal, e suficiente ter-se
!
ln 2
2
1
<
.
(10.67)
kAkC , kBkC < ln 2
2
2
2
De fato, para que se tenha kadG(t)k < ln 2 e suficiente que kG(t)kC < ln(2)/2. Se Z(t) := exp(A) exp(tB), ent
ao
G(t) = ln(Z(t)) e teremos
kG(t)kC = k ln(Z(t))kC = k ln 1 + (Z(t) 1))kC




X
1
1
kZ(t) 1kkC = ln
.
k
1 kZ(t) 1kC

(10.68)

k=1

Agora,




kZ(t) 1kC = exp(A) exp(tB) 1





(exp(A) 1) (exp(tB) 1) + (exp(A) 1) + (exp(tB) 1)

kexp(A) 1kC kexp(tB) 1kC + kexp(A) 1kC + kexp(tB) 1kC



 
 

ekAkC 1 ekBkC 1 + ekAkC 1 + ekBkC 1
kAkC +kBkC

(10.67)

<

2
2
1 = 1
.
2
2
2

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Logo, por (10.68),


kG(t)kC < ln

1
11+

2
2

Captulo 10

474/2119

ln 2
,
2

como desejamos.
Para prosseguir devemos escrever (10.66) de forma mais conveniente. Pela definicao da aplicacao Ad, e bem facil ver
que
h i
i
h i
h
Ad eX eY = Ad eX Ad eY .

E. 10.21 Exerccio. Verifique.


Assim,


G(t)










= Exp ad[G(t)]
= Ad exp G(t)
= Ad exp(A) exp(tB)

 







= Exp ad[A] Exp ad[tB] .
= Ad exp(A) Ad exp(tB)

A equacao diferencial (10.66) para G(t) assume, portanto, a forma







G (t) = Exp ad[A] Exp ad[tB] (B) ,

(10.69)

com G(0) = A como condicao inicial. Isto posto, nossa tarefa agora e resolver (10.69), o que pode ser feito por uma
simples integracao. Teremos, portanto,
Z t
Z t 





G(t) G(0) =
G (s) ds =
Exp ad[A] Exp ad[sB] (B) ds .
0

Tomando-se t = 1 teremos

ln eA eB

= A+






Exp ad[A] Exp ad[sB] (B) ds .

(10.70)

Estando ja na reta final, resta-nos calcular a integral do lado direito, o que pode ser feito com o uso da expansao em
o que faremos. Por (10.65), teremos
serie de dada em (10.65) e um pouco de paciencia. E





Exp ad[A] Exp ad[sB] (B)
=

"

k1







 X
(1)k1 
(B)
Exp ad[A] Exp ad[sB] id
Exp ad[A] Exp ad[sB]
k
k=1

k1
X








(1)k1 
Exp ad[A] Exp ad[sB] id
Exp ad[A] Exp ad[sB] (B)
k
k=1

"

X
(1)k1 

k=1

#
k1






Exp ad[A] Exp ad[sB] id
Exp ad[A] (B) , (10.71)

onde, na u
ltima passagem, usamos o fato obvio que




Exp ad[sB] (B) = Ad exp(sB) (B) = exp(sB)B exp(sB) = B .

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

475/2119

Desejamos
ltima expressao diretamente em termos das aplicacoes ad[A] e ad[sB]. O u
ltimo fator,

escrever esta u
Exp ad[A] , e simplesmente

X


1
Exp ad[A] =
ad[A]l .
(10.72)
l!
l=0

Fora isso,

X




1
ad[A]a ad[sB]b id =
Exp ad[A] Exp ad[sB] id =
a!b!
a=0
b=0

a, b0
a+b>0

sb

1
ad[A]a ad[B]b .
a!b!

Com isso,

k1




Exp ad[A] Exp ad[sB] id
X

a1 , b1 0
a1 +b1 >0

sb1 ++sk1
ad[A]a1 ad[B]b1 ad[A]ak1 ad[B]bk1 . (10.73)
a1 !b1 ! ak1 !bk1 !

ak1 , bk1 0
ak1 +bk1 >0

Inserindo-se (10.72) e (10.73) em (10.71), tem-se


Z
Z

1
0






Exp ad[A] Exp ad[sB] (B) ds =

1X

0 k=1 l=0

a1 , b1 0
a1 +b1 >0

1
0

R1
0

1
ai !bi !

ad[A]a1 ad[B]b1 ad[A]ak1 ad[B]bk1 ad[A]l (B) ds .

sb1 ++bk1 ds = (b1 + + bk1 + 1)1 , temos






Exp ad[A] Exp ad[sB] (B) ds =

X
k=1 l=0

i=1

ak1 , bk1
ak1 +bk1 >0

Trocando-se a integral pelas somas e usando que


Z

k1
Y

(1)k1 sb1 ++bk1


l!k
0

a1 , b1 0
a1 +b1 >0

X
X

k=0 l=0

(1)k1
l!k(b1 + + bk1 + 1)

ak1 , bk1 0
ak1 +bk1 >0

a1 , b1 0
a1 +b1 >0

ak , bk 0
ak +bk >0

k1
Y
i=1

(1)k
l!(k + 1)(b1 + + bk + 1)

1
ai !bi !

k
Y

1
a
!bi !
i
i=1

ad[A]a1 ad[B]b1 ad[A]ak1 ad[B]bk1 ad[A]l (B)


!

ad[A]a1 ad[B]b1 ad[A]ak ad[B]bk ad[A]l (B) .


(10.74)

Na u
ltima igualdade fizemos apenas a mudanca de vari
aveis k k + 1.
Retornando a (10.70), temos ent
ao

ln eA eB
onde

A B := A +

X
X
k=0 l=0

a1 , b1 0
a1 +b1 >0

ak , bk 0
ak +bk >0

= AB ,

(1)k
l!(k + 1)(b1 + + bk + 1)

k
Y

1
a
!b !
i=1 i i

ad[A]a1 ad[B]b1 ad[A]ak ad[B]bk ad[A]l (B) . (10.75)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

476/2119

facil ver que o termo com k = l = 0 nas somas do lado direito e igual a B. Com essa identificacao, finalmente
E
chega-se
a (10.60).
Como ja comentamos, a convergencia e garantida se kAkC e kBkC forem ambas menores que


1
2
0, 12844 . . ..
2 ln 2 2
E. 10.22 Exerccio importante. Colecionando os termos com a1 + b1 + + ak + bk + l 2 em (10.60), mostre que os
primeiros termos de A B sao aqueles dados em (10.61), pagina 471.
6
*
Coment
ario.

Um coment
ario que adiantamos e que, como discutiremos melhor no Captulo 22, p
agina 1109 (vide, em especial, a Proposic
ao
22.10, p
agina 1130), o produto expresso em (10.60), define uma estrutura de grupo em sub-
algebras de Lie nilpotentes de Mat (C, n). De
fato, e possvel provar que e um produto associativo (pois o produto de exponenciais de matrizes e associativo) e e f
acil ver que A 0 = A
e que A (A) = 0 para toda matriz A. Com isso, a matriz nula e o elemento neutro do grupo e A e a inversa de A. Isso tambem mostra
que e por vezes possvel construir um produto associativo a partir de outro n
ao-associativo, como o comutador de matrizes.

10.6

A F
ormula de Duhamel e Algumas de suas Conseq
u
encias

Nesta secao demonstraremos a F


ormula de Duhamel15 :
Z 1


exp(A + B) = exp(A) +
exp (1 s)(A + B) B exp sA ds ,

(10.76)

uencias. A demonstracao e
v
alida para quaisquer matrizes A, B Mat (C. n), e estudaremos algumas de suas conseq
simples. Diferenciando-se es(A+B) esA em relacao a s, tem-se






d s(A+B) sA
d sA
d
=
es(A+B) esA
e
+ es(A+B)
e
e
ds
ds
ds




sA
s(A+B)
sA
s(A+B)
(A) e
=
e
(A + B) e
+e
= es(A+B) B esA .

Integrando-se ambos os lados entre 0 e t, obtem-se


e

de onde segue que


e

t(A+B)

1 =

t(A+B) tA

tA

= e

es(A+B) B esA ds ,

es(A+B) B e(st)A ds ,

A mudanca de vari
avel de integracao s t s conduz a
Z t
et(A+B) = etA +
e(ts)(A+B) B esA ds .

(10.77)

Para t = 1, isso reduz-se a (10.76), que e o que queramos provar. De (10.77) podem ser extradas varias relacoes u
teis,
que trataremos agora.
Derivada de uma exponencial em rela
c
ao a um par
ametro

Uma das conseq


uencias mais u
teis da formula de Duhamel e uma relacao para a derivada da exponencial de uma
matriz que depende de um parametro. Seja A() Mat (C. n) uma matriz que depende contnua e diferenciavelmente
15 Jean

Marie Constant Duhamel (17971872).

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

477/2119

de um parametro . Ent
ao vale
d  A() 
=
e
d

e(1s)A()


d
A() esA() ds .
d

(10.78)

Essa relacao tem aplicacoes em equacoes diferenciais e na Mecanica Estatstica (dentro e fora do equilbrio). Alguns
autores tambem denominam-na formula de Duhamel. O leitor deve compara-la `a expressao alternativa (10.56). Passemos
a` demonstracao.
Sendo A() diferenciavel, vale, para todo suficientemente pequeno,
A( + ) = A() +
onde

d
A() + R(, ) ,
d

1
lim R(, ) = 0 .

(10.79)

(10.80)

Tem-se, entao,
d
exp(A())
d

def.

(10.79)

(10.76)



1
lim
exp(A( + )) exp(A())
0




d
1
exp A() + A() + R(, ) exp (A())
0
d
lim





Z 1
dA
1 A()
dA
e
+
e(1s)(A()+ d ()+R(, ))
() + R(, ) esA() ds eA()
0
d
0
lim

lim

Z

(1s)(A()+ dA
d ()+R(, ))

+ lim

Z



dA
sA()
() e
ds
d

(1s)(A()+ dA
d ()+R(, ))



1
sA()
R(, ) e
ds

e(1s)A()


Z 1



dA
1
() esA() ds +
e(1s)A() lim R(, ) esA() ds
0
d
0

e(1s)A()


dA
() esA() ds ,
d

(10.80)

como queramos demonstrar.


Iterando a f
ormula de Duhamel

Na expressao (10.77) exponenciais do tipo e(A+B) aparecem em ambos os lados. Isso sugere que podemos inserir
iterativamente (10.77) dentro de si mesma de modo a obter outras expressoes recorrentes, como apresentado nas passagens

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

478/2119

auto-explicativas abaixo. Partindo de (10.77) e repetindo a iteracao duas vezes, tem-se


Z t
et(A+B) = etA +
e(ts1 )(A+B) B es1 A ds1
0

Z t
Z
+
e(ts1 )A +

tA

= e

tA

= e

= etA +
Z tZ
tA

= e

(ts1 )A

e
t

s1 A

Be

ds1 +

Z tZ


Z
(ts1 s2 )A
e
+

(ts1 )A

s1 A

Be

ts1 s2

ds1 +

ts1

ts1 s2

(ts1 s2 s3 )(A+B)

Be

s3 A

ds3

ts1

B es2 A B es1 A ds2 ds1

e(ts1 s2 )A B es2 A B es1 A ds2 ds1

e(ts1 s2 s3 )(A+B) B es3 A B es2 A B es1 A ds3 ds2 ds1 .

m=2

e(ts1 s2 )(A+B) B es2 A B es1 A ds2 ds1

Z tZ
0

ts1

ts1

B es1 A ds1

Z tZ

ds2

e(ts1 )A B es1 A ds1 +

Repetindo-se N vezes o procedimento, teremos


"
Z t
N Z tZ
X
t(A+B)
tA
e
= e
1+
es1 A B es1 A ds1 +
+

Be

Z tZ
0

s2 A

ts1

(ts1 s2 )(A+B)

ts1

ts1 sm

ts1

e(ts1 sm+1 )(A+B)

ts1 sm1

(s1 ++sm )A

m1
Y

Be

smk A

k=0

m
Y

k=0

dsm ds1


B esm+1k A dsm+1 ds1 ,

(10.81)

para todo N N, N 2, sendo que convencionamos definir a produtoria de matrizes da esquerda para a direita, ou seja,
L
Y
na forma
Mk = M1 ML (e necessario fixar uma convencao devido `a nao-comutatividade do produto de matrizes).
k=1

Com as mudancas de variaveis


t1

= t s1 ,

s1

= t t1 ,

t2

= t (s1 + s2 ) ,

s2

= t1 t2 ,

= t (s1 + + sm ) ,

sm

..
.

tm

..
.

podemos re-escrever as integrais entre colchetes acima na forma


"
Z
Z t
N Z t Z t1
X
t(A+B)

1+
et1 A B et1 A dt1 +
e
=
0

Z tZ
0

m=2

ts1

ts1 sm

tm1 m1
Y

e(ts1 sm+1 )(A+B)

k=0

m
Y

k=0

= tm1 tm ,

tmk A

tmk A

Be

dtm dt1 etA


B esm+1k A dsm+1 ds1 .

(10.82)

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Captulo 10

Vers
ao de 27 de maio de 2015.

479/2119

E. 10.23 Exerccio. Verifique!

Substituindo A A e B B na expressao acima, tomando a adjunta da expressao resultante e usando o fato que,

para qualquer matriz M Mat (C, n), vale (exp (M )) = exp(M ), obtem-se
#
"
Z tm1 Y
Z t
m
N Z t Z t1
X


et1 A B et1 A dt1 +


etk A B etk A dtm dt1
et(A+B) = etA 1 +
0

Z tZ

ts1

m=2

ts1 sm

"m+1
Y

sk A

k=1

k=1

e(ts1 sm+1 )(A+B) dsm+1 ds1 .

(10.83)

E. 10.24 Exerccio. Verifique!

Para matrizes ou elementos de uma algebra- de Banach e possvel tomar o limite N nas expressoes (10.81)(10.83), como na proposicao que segue.
ao,
Proposic
ao 10.16 Sejam matrizes A, B Mat (C, n). Ent

t(A+B)

tA

= e

"

1+

es1 A B es1 A ds1

Z tZ
X

m=2

ts1

ts1 sm1

(s1 ++sm )A

m1
Y

smk A

Be

k=0

dsm ds1 , (10.84)

ou, equivalentemente,
"

et(A+B) = etA 1 +

et1 A B et1 A dt1 +

Z tZ
X

m=2

t1

m
tm1 Y

etk A B etk

k=1


A

dtm dt1 ,

(10.85)

para todo t R, a convergencia sendo uniforme para t em compactos. As expans


oes em serie acima sao denominadas
series de Duhamel.
2
Prova. A prova consiste em mostrar que o limite N de (10.81) ou (10.83) existe. Tomemos provisoriamente

t [T, T ] para algum T > 0. Para [T, T ], tem-se ke A k e| |kAk eT kAk . Seja M := max eT kAk , eT kA+Bk .
Tem-se
Z Z

m
Z tm1 Y
Z tm1
Z t Z t1
m
t t1


M 2 kBk|t|


tk A
tk A
2m
m

dtm dt1 M kBk


e
Be
dtm dt1 =


0 0

m!
0
0
0
0
k=1

e, analogamente,

Z Z

Z ts1 sm
m
t ts1

Y



t(s1 ++sm+1 )(A+B)
sm+1k A
e

dsm+1 ds1
Be

0 0

0
k=0

(M kBk|t|)m+1
(m + 1)!

As duas desigualdades provam a convergencia uniforme para t [T, T ]. Como T e arbitrario, a convergencia se da
para todo t R.
Na Secao 13.4, pagina 540, apresentamos uma generalizacao da expressao (10.85), a chamada serie de Dyson para da
teoria de perturbacoes (vide, em particular, a expressao (13.29)). Vide tabem Exerccio E. 13.8, pagina 542.

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

480/2119

Outros resultados an
alogos

O metodo de demonstracao da formula de Duhamel apresentado acima pode ser empregado na obtencao de outros
resultados. Sejam novamente matrizes A, B Mat (C, n). Ent
ao, vale
tB

[A, e ] =

e(ts)B [A, B]esB ds .

(10.86)

Para a prova, observamos que


obtem-se

d
ds


esB AesB = esB [A, B]esB (justifique!). Integrando-se ambos os lados de 0 a t,
Z t
tB
tB
esB [A, B]esB ds .
(10.87)
e
Ae A =
0

tB

Multiplicando-se `a esquerda por e chega-se `a expressao (10.86). Expressoes como (10.86) sao empregadas na teoria de
perturbacoes na Mecanica Quantica.

JCABarata. Notas para um Curso de Fsica-Matem


atica.

10.7

Vers
ao de 27 de maio de 2015.

Captulo 10

481/2119

Exerccios Adicionais

E. 10.25 Exerccio. Seja A uma matriz n n diagonalizavel e seja


A =

r
X

k Ek

k=1

sua representacao espectral, onde 1P


, . . . , r sao seus r autovalores distintos (1 r n) e Ek sao seus projetores espectrais,
r
satisfazendo Ea Eb = a, b Ea e 1 = k=1 Ek .
a) Mostre que

exp(A) =

r
X

ek Ek .

(10.88)

k=1

b) Usando esse fato calcule exp(tA1 ) e exp(tA2 ) para as matrizes A1 e A2 dadas por

0
2
,
A1 =

9i 1 6i

2i
A2 =

3 8i

E. 10.26 Exerccio. As chamadas matrizes de Pauli sao definidas por

0 1
,
1 :=

1 0

0 i

2 :=

i
0

1 + 5i
.

0
1
.
3 :=

0 1

a) Mostre que as mesmas satisfazem as seguintes relacoes algebricas: para todos a, b = 1, 2, 3 valem
[a , b ] := a b b a
{a , b } := a b + b a
a b

= 2i

3
X

abc c ,

c=1

= 2ab 1 ,
= ab 1 + i

3
X

abc c .

c=1

b) Mostre que as quatro matrizes 1, 1 , 2 , 3 formam uma base em Mat (C, 2): toda matriz complexa 2 2 pode ser
escrita como uma combinacao linear das mesmas.
c) Mostre que as matrizes 1, 1 , 2 , 3 sao ortonormais em relacao ao seguinte produto escalar definido em Mat (C, 2):
hA, Bi := 12 Tr (A B).
d) Obtenha a representacao espectral das matrizes de Pauli.
e) Seja ~ := (1 , 2 , 3 ) um vetor de comprimento 1 de R3 , ou seja, k~k = 1. Seja, ~ ~ := 1 1 + 2 2 + 3 3 , onde
k sao as matrizes de Pauli, definidas acima. Prove que

exp (i~ ~) = cos() 1 + i sen () ~ ~ .
Sugestao: Obtenha a decomposicao espectral de ~ ~ e use (10.88).

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

Varias das expressoes acima obtidas sao empregadas na Mecanica Quantica.

482/2119

E. 10.27 Exerccio. Sabemos pelo Exerccio E. 10.26, pagina 481, que as matrizes 1, 1 , 2 , e 3 formam uma base em
Mat (C, 2). Sejam A, B Mat (C, 2). Escrevendo-se A = a0 1 + ~a ~ e B = b0 1 + ~b ~, prove que valem as relacoes

e
Prove a partir disso que
e[A, B]


AB BA = 2i ~a ~b ~

(10.89)


2
(AB BA)2 = 4 ~a ~b 1 .

(10.90)




sen 2 ~a ~b 

 
= cos 2 ~a ~b 1 + i
~a ~b ~ .


~a ~b

(10.91)

para o caso em que ~a ~b 6= ~0 e e[A, B] = 1 se ~a ~b = ~0.

Sugestao: Use os fatos sobre matrizes de Pauli provados no Exerccio E. 10.26, pagina 481.
O fato (vide (10.90)) de a matriz (AB BA)2 ser sempre um multiplo da matriz identidade para quaisquer matrizes A e
B e especfico de duas dimensoes e nao e geralmente valido em mais de duas dimensoes. Encontre exemplos.
6
E. 10.28 Exerccio. Este e um exerccio sobre exponenciacao de matrizes nilpotentes com algumas observacoes sobre o
grupo de Lorentz em 2 + 1-dimensoes. O grupo de Lorentz e discutido na Secao 21.6, pagina 1067.
0 1 0 
Mostre que N := 1 0 1 e uma matriz nilpotente de ndice 3, ou seja, que N 2 6= 0, mas N 3 = 0. Mostre, com isso,
01 0

que D(q) := eqN , com q R, e dada por

1 +

D(q) =
q

2
q
2

q2
2

q
1
q

2
q2

q
.

q2
1 2

(10.92)

Verifique explicitamente, usando o lado esquerdo de (10.92), que valem D(0) = 1 e D(q 1 )D(q2 ) = D(q1 + q2 ) para todos
q1 , q2 R. As matrizes D(q) representam, assim, o que se chama de um subgrupo uniparametrico, cujo gerador e N .
As matrizes D(q) desempenham um papel no estudo do grupo de Lorentz (no caso, em 2 + 1-dimensoes), estando
relacionadas `as chamadas translacoes horosfericas: umtipo de transformacao de Lorentz que mantem invariante um vetor tipo
1
luz dado. No caso, o vetor tipo luz e o vetor := 0 . De fato, N = 0 e, portanto, D(q) = para todo q R. Verifique!
1

A transformacao de Lorentz D(q) e obtida por uma combina


 0 1e 0rota
 coes, no senguinte sentido. A matriz
 0 0 0 cao de boots
N pode ser escrita na forma N = L + M1 , onde L := 0 0 1 e M1 := 1 0 0 . A matriz L e o gerador das rotacoes
00 0
01 0
espaciais e a matriz M1 e o gerador de boots na direcao 1. Pela formuta de Trotter, vale
in
h
q 
q
D(q) = eqL+qM1 = lim exp
L exp
M1
.
n
n
n


A matrix exp nq L representa uma rotacao espacial de nq e matrix exp nq M1 representa um boost na direcao 1 com
q
rapidez n . Assim, podemos dizer informalmente que a transformacao de Lorentz D(q) e obtida por uma sucessao de rotacoes
infinitesimais intercaladas a boots infinitesimais na direcao 1.
curioso notar que as componentes espaciais de apontam na direcao 2, mas para que se mantenha esse vetor tipo luz
E
invariante por uma transformacao de Lorentz e preciso combinar boots na direcao 1 com rotacoes espaciais, na forma acima
6
esclarecida.

JCABarata. Notas para um Curso de Fsica-Matem


atica.

Vers
ao de 27 de maio de 2015.

Captulo 10

483/2119

Parte IV
Equac
oes Diferenciais

484

Anda mungkin juga menyukai