Anda di halaman 1dari 556

Fundamentos da Teoria Ergodica

Krerley Oliveira e Marcelo Viana

ii

Pref
acio
Em termos simples, a Teoria Erg
odica e a disciplina matematica que estuda
sistemas din
amicos munidos de medidas invariantes. Comecaremos por dar as
definicoes precisas destas nocoes e por analisar as principais motivacoes para o
seu estudo, apos o que mencionaremos alguns momentos marcantes da historia
desta disciplina. Ao final do pref
acio esbocaremos o conte
udo deste livro e a
sua organizacao, bem como os requisitos desejaveis para o seu estudo.

Sistemas din
amicos
H
a varias definicoes, mais ou menos gerais, do que e um sistema dinamico. N
os
nos restringiremos a dois modelos principais. O primeiro deles, ao qual nos
referiremos na maior parte do tempo, sao as transformacoes f : M M em
algum espaco M . Heuristicamente, pensamos em f como associando a cada
estado x M do sistema o estado f (x) M em que o sistema se encontrara
uma unidade de tempo depois. Trata-se portanto de um modelo de dinamica
com tempo discreto.
Tambem consideraremos fluxos, que sao modelos de sistemas dinamicos com
tempo contnuo. Lembre que um fluxo em M e uma famlia f t : M M , t R
de transformacoes satisfazendo
f 0 = identidade

f t f s = f t+s para todo t, s R.

(0.0.1)

Fluxos aparecem, por exemplo, associados a equacoes diferenciais: tome como


f t a transformacao que associa a cada ponto x o valor no tempo t da solucao
da equacao que passa por x no tempo zero.
Num caso e no outro, sempre suporemos que o sistema dinamico e mensur
avel, ou seja, que o espaco M est
a munido de uma -algebra de subconjuntos ditos mensur
aveis e que essa -algebra e preservada pela dinamica: a preimagem de qualquer conjunto mensuravel tambem e um conjunto mensuravel.
Na maior parte dos casos, M sera um espaco topologico, ou ate um espaco
metrico, munido da menor -algebra que contem todos os abertos (-algebra de
Borel). De fato, em muitas das situacoes que consideraremos ao longo do livro,
suporemos mesmo que M e uma variedade e que a dinamica e diferenci
avel.
iii

iv

Medidas invariantes
Sempre consideraremos medidas definida na -algebra do espaco M . Dizemos
que e uma probabilidade se (M ) = 1. Na maior parte dos casos trataremos
com medidas finitas, isto e, tais que (M ) < . Neste caso sempre podemos
transformar numa probabilidade : para isso basta definir
(E) =

(E)
(M )

para cada conjunto mensuravel E M.

Em geral, uma medida diz-se invariante pela transformacao f se


(E) = (f 1 (E))

para todo conjunto mensuravel E M.

(0.0.2)

Heuristicamente, isto significa que a probabilidade de um ponto estar num dado


conjunto e igual `
a probabilidade de que a sua imagem esteja nesse conjunto.
Note que a definicao (0.0.2) faz sentido, uma vez que, por hipotese, a preimagem de qualquer conjunto mensuravel ainda e um conjunto mensuravel.
No caso de fluxos, substitumos a relacao (0.0.2) por
(E) = (f t (E))

para todo mensuravel E M e todo t R.

(0.0.3)

Por que estudar medidas invariantes?


Como em todo ramo da Matem
atica, parte importante da motivacao e intrnseca
e estetica: estas estruturas matematicas tem propriedades profundas e surpreendentes que conduzem `a demonstracao de belssimos teoremas. Igualmente
fascinante, ideias e resultados da Teoria Erg
odica se aplicam em outras areas
da Matem
atica que a priori nada tem de probabilstico, por exemplo a Combinat
oria e a Teoria dos N
umeros.
Outra raz
ao para este estudo e que muitos fenomenos importantes na Natureza e nas ciencias experimentais sao modelados por sistemas dinamicos que
deixam invariante alguma medida interessante. O exemplo mais importante, historicamente, veio da Fsica: sistemas hamiltonianos, que descrevem a evolucao
de sistemas conservativos na mecanica newtoniana, correspondem a fluxos que
preservam uma medida natural, a medida de Liouville. Alias veremos que sistemas din
amicos muito gerais possuem medidas invariantes.
Ainda outra motivacao fundamental para que nos interessemos por medidas
invariantes e que o seu estudo pode conduzir a informacao importante sobre
o comportamento din
amico do sistema, que dificilmente poderia ser obtida de
outro modo. O Teorema de Recorrencia de Poincare, um dos primeiros que
estudaremos neste livro, ilustra bem o que acabamos de dizer: ele afirma que a
orbita de quase todo ponto, relativamente a qualquer medida invariante finita,

regressa arbitrariamente perto do ponto inicial.

Breve apresentac
ao hist
orica
A palavra erg
odico e o resultado da concatenacao de duas palavras gregas, ergos
= trabalho e odos = caminho, e foi introduzida pelo fsico L. Boltzmann, no

v
seculo 19, no seu trabalho sobre a teoria cinetica dos gases. Os sistemas em que
L. Boltzmann, J. C. Maxwell, J. C. Gibbs, os principais fundadores da teoria
cinetica, estavam interessados sao descritos por um fluxo hamiltoniano, ou seja,
uma equacao diferencial da forma
 


H
H
H
H
dqn dp1
dpn
dq1
=
.
,...,
,
,...,
,...,
,
,...,
dt
dt dt
dt
p1
pn
q1
qn
Boltzmann acreditava que as
orbitas tpicas do fluxo preenchem toda a superfcie
de energia H 1 (c) que as contem. A partir desta hip
otese erg
odica, ele deduziu
que as medias temporais de grandezas observaveis (funcoes) ao longo de orbitas
tpicas coincidem com as respectivas medias espaciais na superfcie de energia,
um fato crucial para a sua formulacao da teoria cinetica.
De fato, esta hip
otese e claramente falsa e, com o tempo, tornou-se usual
chamar hip
otese erg
odica ao que seria uma consequencia dela, a saber, que
as medias temporais e espaciais sao iguais. Sistemas para os quais vale esta
igualdade foram chamados erg
odicos. E pode dizer-se que boa parte da Teoria
Erg
odica, tal como ela se desenvolveu ao longo do seculo 20, foi motivada pelo
problema de decidir se a maioria dos sistemas hamiltonianos, especialmente
aqueles que aparecem na teoria cinetica dos gases, sao erg
odicos ou n
ao.
Um avanco fundamental ocorreu nos anos trinta, quando os matematicos J.
von Neumann e G. D. Birkhoff provaram que medias temporais existem para
quase toda
orbita. No entanto, em meados dos anos cinquenta, o grande matematico russo A. N. Kolmogorov observou que muitos sistemas hamiltonianos
n
ao s
ao erg
odicos. Este resultado espectacular foi muito expandido por V. Arnold e por J. Moser, no que veio a ser chamado teoria KAM em homenagem aos
tres.
Por outro lado, ainda nos anos trinta, E. Hopf tinha dado os primeiros
exemplos importantes de sistemas hamiltonianos erg
odicos, os fluxos geodesicos de superfcies com curvatura negativa. O seu resultado foi generalizado
por D. Anosov, nos anos sessenta, para variedades de qualquer dimensao. De
fato, Anosov tratou uma classe bem mais geral de sistemas, tanto com tempo
contnuo como com tempo discreto, que sao chamados sistemas de Anosov, ou
sistemas globalmente hiperb
olicos. Uma classe ainda mais ampla de sistemas,
chamados uniformemente hiperb
olicos, foi introduzida por S. Smale, e constituiu
um importante foco da teoria dos Sistemas Din
amicos ao longo das u
ltimas
decadas.
Nos anos setenta, Ya. Sinai desenvolveu a teoria das medidas de Gibbs dos
sistemas de Anosov, conservativos ou dissipativos, que foi logo em seguida estendida por D. Ruelle e por R. Bowen para sistemas uniformemente hiperb
olicos,
constituindo uma das maiores realizacoes da teoria erg
odica diferenci
avel. N
ao
podemos deixar de mencionar, nesta breve lista de contribuicoes fundamentais,
a introducao da nocao de entropia por Kolmogorov e Sinai no final dos anos
cinquenta, e a demonstracao, por D. Ornstein cerca de dez anos depois, de que
a entropia e um invariante completo para deslocamentos (shifts) de Bernoulli:
dois deslocamentos de Bernoulli sao equivalentes se, e somente se, eles tem a
mesma entropia.

vi

Hist
orico sucinto
Este livro foi desenvolvido a partir de notas de curso que escrevemos para os
participantes de minicursos ministrados na Escola de Verao do Departamento
de Matem
atica da Universidade Federal de Pernambuco (Recife), em janeiro
de 2003, e do encontro Novos Talentos em Matem
atica da Fundacao Calouste
Gulbenkian (Lisboa), em setembro de 2004.
Nos dois casos, o p
ublico estava formado majoritariamente por alunos jovens que n
ao tinham contato previo com a Teoria Erg
odica (em muitos casos
nem mesmo com a Teoria da Medida) e tornava-se necessario fornecer material
bastante acessvel que permitisse a esses alunos acompanhar minimamente as
ideias principais a serem expostas. Ainda neste est
agio, o texto foi utilizado
por colegas, tais como o professor Vanderlei Horita (UNESP), para ministrar
minicursos a p
ublicos com um perfil semelhante.
Ao longo do desenvolvimento do texto, buscamos preservar o carater elementar dos captulos iniciais, especialmente os Captulos 1 e 2, de tal forma que eles
possam ser utilizados de forma independente, com um mnimo de pre-requisitos.
Sobretudo a partir do minicurso ministrado no Coloquio Brasileiro de Matematica (IMPA, Rio de Janeiro) de 2005, este projeto foi adquirindo objetivos
mais abrangentes. Gradualmente, fomos evoluindo para tentar apresentar num
texto coerente, com formato de livro de texto, o material que consideramos
formar o n
ucleo central da Teoria Erg
odica. Para isso nos inspiramos fortemente
na nossa propria experiencia como pesquisadores da area, buscando reunir numa
apresentacao unificada as nocoes e resultados que se mostraram importantes
para o extraordinario desenvolvimento que esta area tem vivido nas u
ltimas
decadas.
Uma preocupacao importante foi tentar manter o texto o mais possvel autocontido. De fato, a Teoria Erg
odica se apoia em diversas disciplinas da Matematica, com destaque para a Teoria da Medida, a Topologia e a Analise. Nos
Apendices coligimos as principais nocoes e resultados destas disciplinas que sao
u
teis para o restante do texto. De um modo geral, as demonstracoes sao omitidas, j
a que existem diversos excelentes textos sobre estes temas. Uma excecao
sao os resultados sobre medidas em espacos metricos (Apendice A.3), para as
quais optamos por incluir provas dos fatos que mais nos interessam.
Por outro lado, pressupomos que o leitor conhece os conceitos e resultados

fundamentais da Algebra
Linear, inclusive a forma canonica de Jordan.

Organizac
ao do texto
O corpo principal do livro est
a formado pelos Captulos 1 a 12, que podem ser
organizados do seguinte modo:
Os Captulos 1 a 4 formam uma especie de ciclo b
asico, no qual apresentamos as nocoes e resultados fundamentais da Teoria Erg
odica - invariancia,
recorrencia e ergodicidade - bem como alguns exemplos principais. O
Captulo 3 introduz os resultados fundamentais (teoremas erg
odicos) em
torno dos quais est
a constituda toda a teoria.

vii
O Captulo 4, onde introduzimos a nocao de ergodicidade, e um dos pontos
fulcrais deste texto. Os dois captulos seguintes (Captulos 5 e 6) desenvolvem alguns temas importantes relacionados com essa nocao: decomposicao
de medidas invariantes em medidas erg
odicas e sistemas admitindo uma
u
nica medida invariante.
Os Captulos 7 a 9 tratam temas bastante diversos - perda de memoria,
problema do isomorfismo e entropia - mas se estruturam de forma coerente
em torno da ideia de estudar sistemas cada vez mais ca
oticos: sistemas
misturadores, sistemas com espectro de Lebesgue, sistemas de Kolmogorov
e sistemas de Bernoulli.
O Captulo 9 e outro ponto fulcral do texto. Alem de apresentar a nocao de
entropia, buscamos dar ao leitor a oportunidade de observar este conceito
riqussimo sob diversos pontos de vista. Essa teoria se articula naturalmente com o conte
udo do Captulo 10, onde desenvolvemos a vertente
topol
ogica da nocao de entropia.
Os Captulos 11 e 12 sao dedicados a uma classe paradigmatica de sistemas, as transformacoes expansoras, que nos permitem exibir uma aplicacao concreta (e espetacular!) de muitas das ideias gerais apresentadas
ao longo do texto. Vemos o Teorema de Ruelle e suas aplicacoes como o
culminar natural de todo o texto.
Exemplos e aplicacoes tem um papel fundamental em qualquer disciplina
matematica e isso e particularmente verdade no caso da Teoria Erg
odica. Por
esta raz
ao, dedicamos particular atencao `a apresentacao de situacoes concretas
que ilustram e valorizam os resultados gerais. Tais exemplos e construcoes sao
introduzidos gradativamente, buscando para cada um o contexto que melhor
realca a sua relevancia. Tipicamente, eles reaparecem em captulos subsequentes
para ilustrar os conceitos fundamentais que vamos introduzindo.
Os exerccios incluidos em cada secao tem uma funcao tripla. Num nvel
mais rotineiro, eles permitem adquirir familiaridade com os conceitos e o uso dos
resultados apresentados no texto. Tambem deixamos para os exerccios alguns
argumentos e demonstracoes que n
ao sao usados na sequencia do texto ou que
pertencem a
areas afins mais elementares (Topologia, Teoria da Medida etc).
Finalmente, exerccios mais sofisticados testam a compreensao global da teoria
apresentada. Para facilidade do leitor, numa secao ao final do livro apresentamos
solucoes mais ou menos detalhadas de todos os exerccios.

Como utilizar este livro


Os coment
arios a seguir se destinam, prioritariamente, ao leitor que vai utilizar
este livro para ministrar um curso.
O conte
udo dos Captulos 1 a 12 e adequado para um curso anual, ou
uma sequencia de dois cursos semestrais. Se o leitor dispoe desse tempo, poder
a tentar cobrir a grande maioria do material, possivelmente reservando alguns t
opicos para seminarios apresentados pelos alunos. As seguintes secoes

viii
sao especialmente adequadas para esse fim: Secao 1.5, Secao 2.5, Secao 3.4,
Secao 4.4, Secao 6.4, Secao 7.3, Secao 7.4, Secao 8.3 Secao 8.4, Secao 8.5,
Secao 9.5, Secao 9.7, Secao 10.4, Secao 10.5, Secao 11.1, Secao 11.3, Secao 12.3
e Secao 12.4. Neste formato, o teorema de Ruelle (Teorema 12.1) constitui a
conclusao natural para o curso.
Os Apendices fornecem referencias para material que e pre-requisito para
o curso. Em princpio, eles n
ao serao objeto de apresentacao em aula, exceto
pontualmente, em caso de necessidade.
Caso o leitor disponha apenas de um semestre, sera necessario selecionar o
material mais fundamental para apresentacao em aula. A sugestao dos autores
e buscar cobrir o seguinte programa:
Captulo 1: Secoes 1.1, 1.2 e 1.3.
Captulo 2 Secoes 2.1 e 2.2.
Captulo 3: Secoes 3.1, 3.2 e 3.3.
Captulo 4: Secoes 4.1, 4.2 e 4.3.
Captulo 5: Secao 5.1 (mencionar o teorema de Rokhlin).
Captulo 6: Secoes 6.1, 6.2 e 6.3.
Captulo 7: Secoes 7.1 e 7.2.
Captulo 8: Secao 8.1 (mencionar o teorema de Ornstein).
Captulo 9: Secoes 9.1, 9.2, 9.3 e 9.4.
Captulo 10: Secoes 10.1 e 10.2.
Captulo 11: Secao 11.1.
Neste formato, o curso poder
a ser encerrado com a demonstracao do princpio
variacional para a entropia (Teorema 10.1) ou com a construcao de medidas
invariantes absolutamente contnuas para transformacoes expansoras em variedades (Teorema 11.1.2).
Em qualquer dos casos, procuramos elaborar o texto de tal forma que o
professor possa se concentrar na apresentacao das ideias e resultados centrais,
deixando a cargo do aluno estudar por si mesmo muitas das demonstracoes e
resultados complementares. A secao final, com as dicas e solucoes dos exerccios,
e parte desse esforco para facilitar o estudo autonomo do aluno. De fato, dedicamos bastante esforco a fazer que as demonstracoes sejam amig
aveis, detalhando
cuidadosamente os argumentos e incluindo referencias explcitas aos resultados
anteriores que est
ao sendo utilizados, bem como aos pontos do texto onde as
nocoes pertinentes foram introduzidas. Alem disso, a par da presenca regular de
exemplos e dos exerccios ao final de cada secao, n
ao hesitamos em apresentar a
mesma nocao de dois ou mais pontos de vista sempre que isso nos pareceu u
til
para a sua compreens
ao em profundidade.

ix

Agradecimentos
A elaboracao deste texto se estendeu por mais de uma decada. Ao longo desse
tempo recebemos sugestoes, coment
arios e crticas construtivas de um grande
n
umero de colegas e alunos. A lista que mencionamos a seguir est
a certamente
incompleta e desde j
a nos desculpamos a qualquer um que tenha sido omitido
inadvertidamente.
A primeira versao do material nos Apendices A.1-A.2 foi escrita por Joao
Gouveia, Vtor Saraiva e Ricardo Andrade, os quais atuaram como monitores
do minicurso no evento Novos Talentos em Matem
atica 2004, que mencionamos
previamente.
Diversos colegas utilizaram versoes variadas do texto para ministrar minicursos e nos brindaram com as conclusoes de suas experiencias. Alem de
Vanderlei Horita (UNESP), Nivaldo Muniz (UFMA) e Meysam Nassiri (Teer
a),
gostaramos de ressaltar os copiosos coment
arios de Vtor Ara
ujo (UFRJ e,
agora, UFBA), que influenciaram significativamente o modo como o texto foi
evoluindo. Francois Ledrappier (Paris) nos ajudou com algumas quest
oes relativas aos sistema resultantes de substituicoes.
Sucessivas geracoes de alunos dos cursos de p
os-graduacao do IMPA e da
UFAL nos facultaram testar o texto na sala de aula. O retorno dado por Aline
Gomes Cerqueira, Ermerson Araujo, Rafael Lucena e Xiao-Chuan Liu nos permitiu corrigir muitas das debilidades do texto. Edileno de Almeida Santos,
Felippe Soares Guimaraes, Fernando Nera Lenarduzzi, Italo Dowell Lira Melo,
Marco Vinicius Bahi Aymone e Renan Henrique Finder escreveram boa parte
das dicas para os exerccios dos Captulos 1 a 8 e dos apendices.

Krerley Oliveira

e Marcelo Viana

1 Departamento de Matem
atica, Universidade Federal de Alagoas, Campus A. C. Sim
oes
s/n, 57072-090 Macei
o, Brasil. krerley@mat.ufal.br.
2 IMPA, Estrada D. Castorina 110, 22460-320 Rio de Janeiro, Brasil. viana@impa.br.

Conte
udo
1 Medidas Invariantes e Recorr
encia
1.1 Medidas Invariantes . . . . . . . . . . . . . . . . . .
1.1.1 Exerccios . . . . . . . . . . . . . . . . . . . .
1.2 Teorema de recorrencia de Poincare . . . . . . . . . .
1.2.1 Versao mensuravel . . . . . . . . . . . . . . .
1.2.2 Teorema de Kac . . . . . . . . . . . . . . . .
1.2.3 Versao topol
ogica . . . . . . . . . . . . . . . .
1.2.4 Exerccios . . . . . . . . . . . . . . . . . . . .
1.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Expansao decimal . . . . . . . . . . . . . . .
1.3.2 Transformacao de Gauss . . . . . . . . . . . .
1.3.3 Rotacoes no crculo . . . . . . . . . . . . . . .
1.3.4 Rotacoes em toros . . . . . . . . . . . . . . .
1.3.5 Transformacoes conservativas . . . . . . . . .
1.3.6 Fluxos conservativos . . . . . . . . . . . . . .
1.3.7 Exerccios . . . . . . . . . . . . . . . . . . . .
1.4 Inducao . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Transformacao de primeiro retorno . . . . . .
1.4.2 Transformacoes induzidas . . . . . . . . . . .
1.4.3 Torres de Kakutani-Rokhlin . . . . . . . . . .
1.4.4 Exerccios . . . . . . . . . . . . . . . . . . . .
1.5 Teoremas de recorrencia m
ultipla . . . . . . . . . . .
1.5.1 Teorema de recorrencia m
ultipla de Birkhoff .
1.5.2 Exerccios . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

1
2
3
4
4
5
7
8
9
10
11
16
18
18
19
21
22
22
24
27
28
29
30
33

2 Exist
encia de Medidas Invariantes
2.1 Topologia fraca . . . . . . . . . . . . . . . . . . .
2.1.1 Definicao e propriedades da topologia fraca
2.1.2 Teorema Portmanteau . . . . . . . . . . . .
2.1.3 A topologia fraca e metriz
avel . . . . . . .
2.1.4 A topologia fraca e compacta . . . . . . .
2.1.5 Teorema de Prohorov . . . . . . . . . . . .
2.1.6 Exerccios . . . . . . . . . . . . . . . . . . .
2.2 Demonstracao do teorema de existencia . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

35
36
36
37
39
40
42
43
44

xi

.
.
.
.
.
.
.
.


CONTEUDO

xii
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

48
49
49
50
52
53
53
54
57
58
60
61
63

3 Teoremas Erg
odicos
3.1 Teorema erg
odico de Von Neumann . . . . . . . . .
3.1.1 Isometrias em espacos de Hilbert . . . . . .
3.1.2 Enunciado e prova do teorema . . . . . . .
3.1.3 Convergencia em L2 () . . . . . . . . . . .
3.1.4 Exerccios . . . . . . . . . . . . . . . . . . .
3.2 Teorema erg
odico de Birkhoff . . . . . . . . . . . .
3.2.1 Tempo medio de visita . . . . . . . . . . . .
3.2.2 Medias temporais . . . . . . . . . . . . . . .
3.2.3 Teorema de von Neumann e consequencias .
3.2.4 Exerccios . . . . . . . . . . . . . . . . . . .
3.3 Teorema erg
odico subaditivo . . . . . . . . . . . .
3.3.1 Preparacao da demonstracao . . . . . . . .
3.3.2 Lema fundamental . . . . . . . . . . . . . .
3.3.3 Estimativa da funcao . . . . . . . . . .
3.3.4 Majoracao da funcao + . . . . . . . . . . .
3.3.5 Expoentes de Lyapunov . . . . . . . . . . .
3.3.6 Exerccios . . . . . . . . . . . . . . . . . . .
3.4 Tempo discreto e tempo contnuo . . . . . . . . . .
3.4.1 Fluxos suspens
ao . . . . . . . . . . . . . . .
3.4.2 Transformacoes de Poincare . . . . . . . . .
3.4.3 Exerccios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

65
66
66
68
69
70
71
71
72
75
77
78
79
81
82
83
85
86
87
87
90
92

4 Ergodicidade
4.1 Sistemas erg
odicos . . . . . . . . . . .
4.1.1 Conjuntos e funcoes invariantes
4.1.2 Caracterizacao espectral . . . .
4.1.3 Exerccios . . . . . . . . . . . .
4.2 Exemplos . . . . . . . . . . . . . . . .
4.2.1 Rotacoes em toros . . . . . . .
4.2.2 Expansao decimal . . . . . . .
4.2.3 Deslocamentos de Bernoulli . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

95
96
96
97
100
101
101
103
105

2.3

2.4

2.5

2.2.1 Exerccios . . . . . . . . . . . . . .
Coment
arios de Analise Funcional . . . .
2.3.1 Dualidade e topologias fracas . . .
2.3.2 Operador de Koopman . . . . . . .
2.3.3 Exerccios . . . . . . . . . . . . . .
Produtos semi-diretos e extensoes naturais
2.4.1 Medidas em produtos semi-diretos
2.4.2 Extensoes naturais . . . . . . . . .
2.4.3 Exerccios . . . . . . . . . . . . . .
Progress
oes aritmeticas . . . . . . . . . .
2.5.1 Teorema de van der Waerden . . .
2.5.2 Teorema de Szemeredi . . . . . . .
2.5.3 Exerccios . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.


CONTEUDO
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

109
112
113
117
118
121
122
122
125
128
132
132
134
141

5 Decomposi
c
ao Erg
odica
5.1 Teorema da decomposicao erg
odica . . . . . . . . . .
5.1.1 Enunciado do teorema . . . . . . . . . . . . .
5.1.2 Desintegracao de uma medida . . . . . . . . .
5.1.3 Particoes mensuraveis . . . . . . . . . . . . .
5.1.4 Prova do teorema da decomposicao erg
odica .
5.1.5 Exerccios . . . . . . . . . . . . . . . . . . . .
5.2 Teorema da desintegracao de Rokhlin . . . . . . . .
5.2.1 Esperancas condicionais . . . . . . . . . . . .
5.2.2 Criterio de -aditividade . . . . . . . . . . . .
5.2.3 Construcao das medidas condicionais . . . . .
5.2.4 Exerccios . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

143
143
144
145
147
148
150
151
151
153
155
157

6 Unicidade Erg
odica
6.1 Unicidade erg
odica . . . . . . . . . . . . . . . . . . .
6.1.1 Exerccios . . . . . . . . . . . . . . . . . . . .
6.2 Minimalidade . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Exerccios . . . . . . . . . . . . . . . . . . . .
6.3 Medida de Haar . . . . . . . . . . . . . . . . . . . . .
6.3.1 Rotacoes em toros . . . . . . . . . . . . . . .
6.3.2 Grupos topol
ogicos e grupos de Lie . . . . . .
6.3.3 Translacoes em grupos compactos metriz
aveis
6.3.4 Od
ometros . . . . . . . . . . . . . . . . . . .
6.3.5 Exerccios . . . . . . . . . . . . . . . . . . . .
6.4 Teorema de Weyl . . . . . . . . . . . . . . . . . . . .
6.4.1 Ergodicidade . . . . . . . . . . . . . . . . . .
6.4.2 Unicidade erg
odica . . . . . . . . . . . . . . .
6.4.3 Demonstracao do teorema de Weyl . . . . . .
6.4.4 Exerccios . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

159
159
161
161
163
164
164
165
169
171
174
175
176
177
179
181

4.3
4.4

4.2.4 Transformacao de Gauss . . . . . . .


4.2.5 Endomorfismos lineares do toro . . .
4.2.6 Argumento de Hopf . . . . . . . . .
4.2.7 Exerccios . . . . . . . . . . . . . . .
Propriedades das medidas erg
odicas . . . .
4.3.1 Exerccios . . . . . . . . . . . . . . .
Coment
arios sobre sistemas conservativos .
4.4.1 Sistemas hamiltonianos . . . . . . .
4.4.2 Teoria de Kolmogorov-Arnold-Moser
4.4.3 Pontos periodicos elticos . . . . . .
4.4.4 Fluxos geodesicos . . . . . . . . . . .
4.4.5 Sistemas de Anosov . . . . . . . . .
4.4.6 Bilhares . . . . . . . . . . . . . . . .
4.4.7 Exerccios . . . . . . . . . . . . . . .

xiii
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.


CONTEUDO

xiv
7 Correla
co
es
7.1 Sistemas misturadores . . . . . . . .
7.1.1 Propriedades . . . . . . . . .
7.1.2 Mistura fraca . . . . . . . . .
7.1.3 Caracterizacao espectral . . .
7.1.4 Exerccios . . . . . . . . . . .
7.2 Deslocamentos de Markov . . . . . .
7.2.1 Ergodicidade . . . . . . . . .
7.2.2 Mistura . . . . . . . . . . . .
7.2.3 Exerccios . . . . . . . . . . .
7.3 Intercambios de intervalos . . . . . .
7.3.1 Minimalidade e ergodicidade
7.3.2 Mistura . . . . . . . . . . . .
7.3.3 Exerccios . . . . . . . . . . .
7.4 Decaimento de correlacoes . . . . . .
7.4.1 Exerccios . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

183
184
184
187
190
191
192
196
199
201
202
205
207
210
210
214

8 Sistemas Equivalentes
8.1 Equivalencia erg
odica . . . . . . . . . . . .
8.1.1 Exerccios . . . . . . . . . . . . . . .
8.2 Equivalencia espectral . . . . . . . . . . . .
8.2.1 Invariantes de equivalencia espectral
8.2.2 Autovetores e mistura fraca . . . . .
8.2.3 Exerccios . . . . . . . . . . . . . . .
8.3 Espectro discreto . . . . . . . . . . . . . . .
8.3.1 Exerccios . . . . . . . . . . . . . . .
8.4 Espectro de Lebesgue . . . . . . . . . . . .
8.4.1 Exemplos e propriedades . . . . . .
8.4.2 O caso invertvel . . . . . . . . . . .
8.4.3 Exerccios . . . . . . . . . . . . . . .
8.5 Espacos de Lebesgue e isomorfismo erg
odico
8.5.1 Isomorfismo erg
odico . . . . . . . . .
8.5.2 Espacos de Lebesgue . . . . . . . . .
8.5.3 Exerccios . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

217
218
220
220
221
222
225
226
229
229
230
233
236
237
237
239
244

9 Entropia
9.1 Definicao de entropia . . . . . . . . . . . .
9.1.1 Entropia em Teoria da Informacao
9.1.2 Entropia de uma particao . . . . .
9.1.3 Entropia de um sistema dinamico .
9.1.4 Exerccios . . . . . . . . . . . . . .
9.2 Teorema de Kolmogorov-Sinai . . . . . . .
9.2.1 Particoes geradoras . . . . . . . . .
9.2.2 Semicontinuidade da entropia . . .
9.2.3 Transformacoes expansivas . . . .
9.2.4 Exerccios . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

247
248
248
249
254
258
259
260
262
264
265

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.


CONTEUDO
9.3

9.4

9.5

9.6

9.7

xv

Entropia local . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.1 Prova do teorema de Shannon-McMillan-Breiman .
9.3.2 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.1 Deslocamentos de Markov . . . . . . . . . . . . . .
9.4.2 Transformacao de Gauss . . . . . . . . . . . . . . .
9.4.3 Endomorfismos lineares do toro . . . . . . . . . . .
9.4.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
Entropia e equivalencia . . . . . . . . . . . . . . . . . . .
9.5.1 Automorfismos de Bernoulli . . . . . . . . . . . . .
9.5.2 Sistemas com entropia nula . . . . . . . . . . . . .
9.5.3 Sistemas de Kolmogorov . . . . . . . . . . . . . . .
9.5.4 Sistemas exatos . . . . . . . . . . . . . . . . . . . .
9.5.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
Entropia e decomposicao erg
odica . . . . . . . . . . . . . .
9.6.1 Afinidade da decomposicao erg
odica . . . . . . . .
9.6.2 Demonstracao do teorema de Jacobs . . . . . . . .
9.6.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
Jacobianos e f
ormula de Rokhlin . . . . . . . . . . . . . .
9.7.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . .

10 Princpio variacional
10.1 Entropia topol
ogica . . . . . . . . . . . . . . . . . .
10.1.1 Definicao via coberturas abertas . . . . . .
10.1.2 Conjuntos geradores e conjuntos separados
10.1.3 C
alculo e propriedades . . . . . . . . . . . .
10.1.4 Exerccios . . . . . . . . . . . . . . . . . . .
10.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . .
10.2.1 Transformacoes expansivas . . . . . . . . .
10.2.2 Deslocamentos de tipo finito . . . . . . . .
10.2.3 Entropia topol
ogica de fluxos . . . . . . . .
10.2.4 Transformacoes diferenci
aveis . . . . . . . .
10.2.5 Endomorfismos lineares do toro . . . . . . .
10.2.6 Exerccios . . . . . . . . . . . . . . . . . . .
10.3 Pressao . . . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Definicao via coberturas abertas . . . . . .
10.3.2 Conjuntos geradores e conjuntos separados
10.3.3 Propriedades . . . . . . . . . . . . . . . . .
10.3.4 Coment
arios sobre Mecanica Estatstica . .
10.3.5 Exerccios . . . . . . . . . . . . . . . . . . .
10.4 Princpio variacional . . . . . . . . . . . . . . . . .
10.4.1 Prova da cota superior . . . . . . . . . . . .
10.4.2 Aproximando a press
ao . . . . . . . . . . .
10.4.3 Exerccios . . . . . . . . . . . . . . . . . . .
10.5 Estados de equilbrio . . . . . . . . . . . . . . . . .
10.5.1 Exerccios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

266
267
271
271
272
273
274
276
276
277
278
281
286
287
287
289
291
294
295
299

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

301
302
302
305
309
311
312
312
314
317
319
321
323
324
324
326
328
332
333
334
336
338
341
341
346


CONTEUDO

xvi
11 Transforma
co
es Expansoras
11.1 Transformacoes expansoras em variedades . . . . .
11.1.1 Lema de distorcao . . . . . . . . . . . . . .
11.1.2 Existencia de medidas erg
odicas . . . . . .
11.1.3 Unicidade e conclusao da prova . . . . . . .
11.1.4 Exerccios . . . . . . . . . . . . . . . . . . .
11.2 Din
amica das transformacoes expansoras . . . . . .
11.2.1 Ramos inversos contrativos . . . . . . . . .
11.2.2 Sombreamento e pontos periodicos . . . . .
11.2.3 Decomposicao dinamica . . . . . . . . . . .
11.2.4 Exerccios . . . . . . . . . . . . . . . . . . .
11.3 Entropia e pontos periodicos . . . . . . . . . . . . .
11.3.1 Taxa de crescimento dos pontos periodicos .
11.3.2 Aproximacao por medidas atomicas . . . .
11.3.3 Exerccios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

347
348
349
352
354
356
357
360
361
365
368
369
370
371
373

12 Formalismo Termodin
amico
12.1 Teorema de Ruelle . . . . . . . . . . . . .
12.1.1 Medida de referencia . . . . . . . .
12.1.2 Distorcao e propriedade de Gibbs .
12.1.3 Densidade invariante . . . . . . . .
12.1.4 Construcao do estado de equilbrio
12.1.5 Pressao e autovalores . . . . . . . .
12.1.6 Unicidade do estado de equilbrio .
12.1.7 Exatidao . . . . . . . . . . . . . .
12.1.8 Medidas absolutamente contnuas .
12.1.9 Exerccios . . . . . . . . . . . . . .
12.2 Teorema de Livsic . . . . . . . . . . . . .
12.2.1 Exerccios . . . . . . . . . . . . . .
12.3 Decaimento de correlacoes . . . . . . . . .
12.3.1 Dist
ancias projetivas . . . . . . . .
12.3.2 Cones de funcoes H
older . . . . . .
12.3.3 Convergencia exponencial . . . . .
12.3.4 Exerccios . . . . . . . . . . . . . .
12.4 Dimens
ao de repulsores conformes . . . .
12.4.1 Dimens
ao de Hausdorff . . . . . .
12.4.2 Repulsores conformes . . . . . . .
12.4.3 Distorcao e conformalidade . . . .
12.4.4 Existencia e unicidade de d0 . . . .
12.4.5 Cota superior . . . . . . . . . . . .
12.4.6 Cota inferior . . . . . . . . . . . .
12.4.7 Exerccios . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

375
376
377
379
381
384
385
388
390
391
393
393
396
397
398
404
407
411
412
412
414
416
419
421
422
423

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.


CONTEUDO
A Elementos de Medida, Topologia e An
alise
A.1 Espacos de medida . . . . . . . . . . . . . . .
A.1.1 Espacos mensuraveis . . . . . . . . . .
A.1.2 Espacos de medida . . . . . . . . . . .
A.1.3 Medida de Lebesgue . . . . . . . . . .
A.1.4 Aplicacoes mensuraveis . . . . . . . .
A.1.5 Exerccios . . . . . . . . . . . . . . . .
A.2 Integracao em espacos de medida . . . . . . .
A.2.1 Integral de Lebesgue . . . . . . . . . .
A.2.2 Teoremas de convergencia . . . . . . .
A.2.3 Produto de medidas . . . . . . . . . .
A.2.4 Derivacao de medidas . . . . . . . . .
A.2.5 Exerccios . . . . . . . . . . . . . . . .
A.3 Medidas em espacos metricos . . . . . . . . .
A.3.1 Medidas regulares . . . . . . . . . . .
A.3.2 Espacos metricos separ
aveis completos
A.3.3 Espaco das funcoes contnuas . . . . .
A.3.4 Exerccios . . . . . . . . . . . . . . . .
A.4 Variedades diferenci
aveis . . . . . . . . . . . .
A.4.1 Variedades e aplicacoes diferenci
aveis .
A.4.2 Espaco tangente e aplicacao derivada .
A.4.3 Transversalidade . . . . . . . . . . . .
A.4.4 Variedades riemannianas . . . . . . . .
A.4.5 Exerccios . . . . . . . . . . . . . . . .
A.5 Espacos Lp () . . . . . . . . . . . . . . . . .
A.5.1 Espacos Lp () com 1 p < . . . .
A.5.2 Produto interno em L2 () . . . . . . .
A.5.3 Funcoes essencialmente limitadas . . .
A.5.4 Convexidade . . . . . . . . . . . . . .
A.5.5 Exerccios . . . . . . . . . . . . . . . .
A.6 Espacos de Hilbert . . . . . . . . . . . . . . .
A.6.1 Ortogonalidade . . . . . . . . . . . . .
A.6.2 Dualidade . . . . . . . . . . . . . . . .
A.6.3 Exerccios . . . . . . . . . . . . . . . .
A.7 Teoremas espectrais . . . . . . . . . . . . . .
A.7.1 Medidas espectrais . . . . . . . . . . .
A.7.2 Representacao espectral . . . . . . . .
A.7.3 Exerccios . . . . . . . . . . . . . . . .
Dicas e solu
co
es dos exerccios

xvii

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

425
425
426
428
431
435
436
439
439
441
442
444
446
448
448
451
452
454
454
454
456
458
459
460
461
462
462
463
464
465
465
466
467
468
469
470
472
474
475

xviii

CONTEUDO

Captulo 1

Medidas Invariantes e
Recorr
encia
A Teoria Erg
odica estuda o comportamento de sistemas dinamicos relativamente
a medidas que permanecem invariantes sob a acao da dinamica. Mais precisamente, busca-se descrever as propriedades que sao validas para quase toda a
trajetoria do sistema, relativamente `a medida invariante. Comecaremos, na
Secao 1.1, por definir estas nocoes de sistema dinamico e de medida invariante.
As razes da teoria remontam `a primeira metade do seculo 19. De fato,
em 1838 o matematico frances Joseph Liouville observou que todo sistema da
Mecanica Newtoniana (com conservacao da energia) admite uma medida invariante natural no seu espaco de configuracoes. Alem disso, em 1845 o grande
matematico e fsico alem
ao Carl Friedrich Gauss observou que uma certa transformacao no intervalo que tem um papel importante na Teoria dos N
umeros
admite uma medida invariante que e equivalente `a medida de Lebesgue. Estes
sao dois dos exemplos de aplicacao da Teoria Erg
odica que apresentaremos na
Secao 1.3. Muitos outros surgir
ao ao longo deste livro.
O primeiro resultado importante foi devido ao grande matematico frances
Henri Poincare, ao final do seculo 19. Ele estava especialmente interessado no
movimento dos corpos celestes, tais como planetas e cometas, o qual e descrito
por certas equacoes diferenciais que resultam da Lei da Gravitacao de Newton.
A partir da observacao de Liouville, Poincare mostrou que para quase todo
estado inicial do sistema, ou seja, quase todo valor das posicoes e velocidades
iniciais, a solucao da equacao diferencial regressa arbitrariamente perto desse
estado inicial, a menos que va para infinito. Mais ainda, ele apontou que essa
propriedade de recorrencia n
ao e exclusiva dos sistemas da Mecanica Celeste:
ela vale sempre que o sistema admite uma medida invariante. Este sera o tema
da Secao 1.2.
Ele reaparecer
a na Secao 1.5 num contexto mais elaborado: consideramos um
n
umero finito de sistemas din
amicos que comutam entre si e buscamos retornos
simult
aneos das
orbitas de todos esses sistemas `a vizinhanca do estado inicial.
1


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Este tipo de resultados tem importantes aplicacoes em Combinatoria e Teoria


dos N
umeros, como veremos mais tarde.
A ideia de recorrencia tambem est
a por tras das construcoes que apresentamos na Secao 1.4. A ideia b
asica e fixar um subconjunto do domnio com medida
positiva e considerar o primeiro retorno a esse conjunto. Frequentemente, essa
transformacao de primeiro retorno e mais facil de analisar e, por outro lado, ela
pode ser usada para entender o comportamento da transformacao original.

1.1

Medidas Invariantes

Seja (M, B, ) um espaco de medida e seja f : M M uma transformacao


mensuravel. Dizemos que a medida e invariante por f se
(E) = (f 1 (E))

para todo conjunto mensuravel E M .

(1.1.1)

Nesse caso tambem dizemos que f preserva . Note que a definicao (1.1.1)
faz sentido, uma vez que a pre-imagem de um conjunto mensuravel por uma
transformacao mensuravel ainda e um conjunto mensuravel. Heuristicamente,
ela significa que a probabilidade de um ponto estar num dado conjunto e igual
a probabilidade de que a sua imagem esteja nesse conjunto.
`
possvel, e conveniente, estender esta definicao a outros tipos de sistemas
E
din
amicos alem das transformacoes. Estamos especialmente interessados em
fluxos, ou seja, famlias de transformacoes f t : M M , onde t R, satisfazendo
as seguintes condicoes:
f 0 = id

f s+t = f s f t para todo s, t R.

(1.1.2)

Isto tambem implica que toda a transformacao f t e invertvel e a sua inversa e


f t . Fluxos aparecem naturalmente associados a equacoes diferenciais do tipo
X((t)) = , onde X e um campo de vetores, do seguinte modo: sob condicoes
adequadas sobre X, para cada ponto x existe uma u
nica solucao t 7 x (t) da
equacao que satisfaz x (0) = x; ent
ao f t (x) = x (t) define um fluxo no domnio
M da equacao diferencial.
Dizemos que uma medida e invariante pelo fluxo (f t )t se ela e invariante
por cada uma das transformacoes f t , ou seja, se
(E) = (f t (E))

para todo mensuravel E M e todo t R.

(1.1.3)

Proposi
c
ao 1.1.1. Sejam f : M M uma transformac
ao mensur
avel e
uma medida em M . Ent
ao f preserva se, e somente se,
Z
Z
d = f d.
(1.1.4)
para toda func
ao -integr
avel : M R.
Demonstrac
ao. Suponhamos que a medida e invariante. Vamos mostrar que
a relacao (1.1.4) e valida para classes de funcoes sucessivamente mais amplas.

1.1. MEDIDAS INVARIANTES

Inicialmente, observe que por hip


otese (B) = (f 1 (B)) para todo conjunto
mensuravel B. Como,
Z
Z
XB d = (B) e (f 1 (B)) = (XB f ) d,
isto mostra que (1.1.4) e valida para as funcoes caractersticas. Ent
ao, por
linearidade da integral, (1.1.4) e valida para funcoes simples. Em seguida, vamos
usar um argumento de aproximacao para concluir que (1.1.4) vale para toda
funcao integravel. Dada qualquer funcao integravel : M R, considere uma
sequencia (sn )n de funcoes simples convergindo para e tal que |sn | || para
todo n. Tal sequencia existe, pela Proposicao A.1.33. Ent
ao, usando o teorema
da convergencia dominada (Teorema A.2.11) duas vezes:
Z
Z
Z
Z
d = lim sn d = lim (sn f ) d = ( f ) d.
n

Isto mostra que (1.1.4) vale para toda funcao integravel se e invariante. A
recproca tambem segue imediatamente dos argumentos que apresentamos.

1.1.1

Exerccios

1.1.1. Seja f : M M uma transformacao mensuravel. Mostre que uma


medida de Dirac p e invariante por f se, e somente se, p e ponto fixo de
f . Mais geralmente, a probabilidade p,k = k 1 p + f (p) + + f k1 (p) e
invariante por f se, e somente se, f k (p) = p.
1.1.2. Prove a seguinte versao da Proposicao 1.1.1. Sejam M um espaco
metrico, f : M M uma transformacao mensuravel e uma medida em M .
Mostre que se
Z
Z
d =

f d.

para toda funcao contnua limitada : M R ent


ao f preserva a medida .

1.1.3. Prove que se f : M M preserva uma medida ent


ao, dado qualquer
k 2, o iterado f k preserva . Decida se a recproca e verdadeira.
1.1.4. Suponha que f : M M preserva uma probabilidade . Seja B M
um conjunto mensuravel que satisfaz qualquer uma das seguintes condicoes:
1. (B \ f 1 (B)) = 0;
2. (f 1 (B) \ B) = 0;
3. (Bf 1 (B)) = 0;
4. f (B) B.

Mostre que existe C M tal que f 1 (C) = C e (BC) = 0.

1.1.5. Seja f : U U um difeomorfismo C 1 de um aberto U Rd . Mostre


que a medida de Lebesgue m e invariante por f se, e somente se, | det Df | 1.

1.2

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Teorema de recorr
encia de Poincar
e

Vamos estudar duas versoes do teorema de Poincare. A primeira (Secao 1.2.1)


est
a formulada no contexto de espacos de medida (finita). O teorema de Kac,
que provaremos na Secao 1.2.2 complementa este resultado de forma quantitativa. A segunda versao do teorema de recorrencia (Secao 1.2.3) supooe que o
ambiente e um espaco topologico com certas propriedades adicionais. Tambem
provaremos uma terceira versao do teorema de recorrencia, devida a Birkhoff,
cuja formulacao e puramente topologica.

1.2.1

Vers
ao mensur
avel

O nosso primeiro resultado afirma que, dada qualquer medida invariante finita,
quase todo ponto de qualquer conjunto mensuravel E regressa a E um n
umero
infinito de vezes:
Teorema 1.2.1 (Recorrencia de Poincare). Seja f : M M uma transformac
ao mensur
avel e seja uma medida finita invariante por f . Seja E M
qualquer conjunto mensur
avel com (E) > 0. Ent
ao, para -quase todo ponto
x E existem infinitos de valores de n para os quais f n (x) tambem est
a em E.
Demonstrac
ao. Representemos por E0 o conjunto dos pontos x E que nunca
regressam a E. Inicialmente, vamos provar que E0 tem medida nula. Para isso,
comecamos por observar que as suas pre-imagens f n (E0 ) sao disjuntas duas-aduas. De fato, suponhamos que existem m > n 1 tais que f m (E0 ) intersecta
f n (E0 ). Seja x um ponto na interseccao e seja y = f n (x). Ent
ao y E0 e
f mn (y) = f m (x) E0 , que est
a contido em E. Isto quer dizer que y volta
pelo menos uma vez a E, o que contradiz a definicao de E0 . Esta contradicao,
prova que as pre-imagens sao disjuntas duas-a-duas, como afirmamos.
Observando que (f n (E0 )) = (E0 ) para todo n 1, porque e invariante,
conclumos que

n=1

X
 X
f n (E0 ) =
(f n (E0 )) =
(E0 ).
n=1

n=1

Como supomos que a medida e finita, a expressao do lado esquerdo e finita. Por
outro lado, `
a direita temos uma soma de infinitos termos, todos iguais. O u
nico
jeito desta soma ser finita e que as parcelas sejam nulas. Portanto, devemos ter
(E0 ) = 0, tal como foi afirmado.
Agora, denotemos por F o conjunto dos pontos x E que regressam a
E apenas um n
umero finito de vezes. Como consequencia direta da definicao,
temos que todo ponto x F tem algum iterado f k (x) em E0 . Ou seja,
F

k=0

f k (E0 )

1.2. TEOREMA DE RECORRENCIA


DE POINCARE

Como (E0 ) = 0 e e invariante, temos:


(F )

k=0

 X
 X
f k (E0 )
f k (E0 ) =
(E0 ) = 0
k=0

k=0

Portanto, (F ) = 0 como queramos provar.


Observe que o Teorema 1.2.1 implica um resultado analogo para sistemas
com tempo contnuo. De fato, suponha que e uma medida invariante finita de
um fluxo (f t )t . Segue imediatamente da definicao que e invariante pela respectiva transformacao f 1 , chamada tempo 1 do fluxo. Aplicando o Teorema 1.2.1
`a transformacao tempo 1, conclumos que, dado qualquer conjunto E M com
medida positiva, para quase todo x E existem tempos tj + tais que
f tj (x) E. Valem observacoes analogas para as outras versoes do teorema de
recorrencia, que apresentaremos posteriormente. Por outro lado, o teorema
que apresentamos a seguir e especfico de sistemas com tempo discreto.

1.2.2

Teorema de Ka
c

Seja f : M M uma transformacao mensuravel e seja uma medida finita


invariante por f . Seja E M qualquer conjunto mensuravel com (E) > 0.
Considere a funcao tempo de primeiro retorno E : E N {} definida da
seguinte forma:
E (x) = min{n 1 : f n (x) E}
(1.2.1)
sempre que o conjunto do lado direito for n
ao vazio, isto e, se x tiver algum
iterado em E; caso contr
ario, E (x) = . De acordo com o Teorema 1.2.1, a
segunda alternativa so ocorre para um conjunto de pontos com medida nula.
O resultado que vamos apresentar a seguir mostra que esta funcao e integravel e exibe o valor da sua integral. Para o enunciado precisamos da seguinte
notacao:
E0 = {x E : f n (x)
/ E para todo n 1} e
E0 = {x M : f n (x)
/ E para todo n 0}.

Ou seja, E0 e o conjunto dos pontos de E que nunca regressam a E e E0 e o


conjunto dos pontos de M que nunca entram em E. Note que (E0 ) = 0, pelo
teorema de recorrencia de Poincare.
Teorema 1.2.2 (Kac). Seja f : M M , uma medida invariante finita e E
um subconjunto com medida positiva. Ent
ao a func
ao E e integr
avel e
Z
E d = (M ) (E0 ).
E

Demonstrac
ao. Para cada n 1, defina
En = {x E : f (x)
/ E, . . . , f n1 (x)
/ E, mas f n (x) E}

En

= {x M : x
/ E, f (x)
/ E, . . . , f

n1

(x)
/ E, mas f (x) E}.


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Ou seja, En e o conjunto dos pontos de E que retornam a E pela primeira vez


exatamente no momento n,
En = {x E : E (x) = n},
En

e
e o conjunto dos pontos que n
ao est
ao em E e que entram em E pela
claro que estes conjuntos sao menprimeira vez exatamente no momento n. E
sur
aveis e, portanto, E e funcao mensuravel. Alem disso, os conjuntos En , En ,
n 0 sao disjuntos dois-a-dois e a sua uniao e todo o espaco M . Portanto
(M ) =

n=0

X


(En ) + (En ) .
(En ) + (En ) = (E0 ) +

(1.2.2)

n=1

Agora observe que

En+1
f 1 (En ) = En+1

para todo n.

(1.2.3)

De fato, f (y) En quer dizer que o primeiro iterado de f (y) que est
a em E e

f n (f (y)) = f n+1 (y) e isto ocorre se, e somente se, y En+1


ou y En+1 . Isto
prova a igualdade (1.2.3). Logo, pela invariancia de ,

) + (En+1 ) para todo n.


(En ) = (f 1 (En )) = (En+1

Aplicando esta relacao repetidas vezes, obtemos que


(En )

(Em
)

m
X

(Ei ) para todo m > n.

(1.2.4)

i=n+1

A relacao (1.2.2) implica que (Em


) 0 quando m . Portanto, tomando
o limite quando m na igualdade (1.2.4), obtemos:

(En ) =

(Ei ),

(1.2.5)

i=n+1

Para finalizar a demonstracao, substituimos (1.2.5) na igualdade (1.2.2). Desta


forma obtemos que
Z

X
X
 X
(Ei ) =
n(En ) =
E d,
(M ) (E0 ) =
n=1

i=n

n=1

como queramos demonstrar.

Em alguma situacoes, por exemplo quando o sistema (f, ) e erg


odico (esta
propriedade sera definida e estudada em detalhe mais tarde) o conjunto E0 tem
medida zero. Ent
ao a conclusao do teorema de Kac diz que
Z
(M )
1
(1.2.6)
E d =
(E) E
(E)
para todo conjunto mensuravel E. O lado esquerdo desta igualdade e o tempo
medio de retorno a E. A igualdade (1.2.6) diz que o tempo medio de retorno e
inversamente proporcional `
a medida de E.

1.2. TEOREMA DE RECORRENCIA


DE POINCARE

n1 k
Observa
c
ao 1.2.3. Por definicao, En = f n (E) \ k=0
f (E). O fato de que
a soma (1.2.2) e finita implica que a medida deste conjunto converge para zero
quando n . Isto sera u
til mais tarde.

1.2.3

Vers
ao topol
ogica

Agora suponhamos que M e um espaco topologico, munido da sua -algebra de


Borel B. Dizemos que um ponto x M e recorrente para uma transformacao
f : M M se existe uma sequencia nj em N tal que f nj (x) x.
Analogamente, dizemos que x M e recorrente para um fluxo (f t )t se existe
uma sequencia tj + em R tal que f tj (x) x quando j .
No proximo teorema supomos que o espaco topologico M admite uma base
enumer
avel de abertos, ou seja, existe uma famlia enumeravel {Uk : k N} de
abertos tal que todo aberto de M pode ser escrito como uniao de elementos Uk
dessa famlia. Esta hip
otese e satisfeita na maioria dos exemplos interessantes.
Teorema 1.2.4 (Recorrencia de Poincare). Suponhamos que M admite uma
base enumer
avel de abertos. Seja f : M M uma transformac
ao mensur
avel
e seja uma medida finita em M invariante por f . Ent
ao, -quase todo ponto
x M e recorrente para f .
k o conjunto dos pontos x Uk
Demonstrac
ao. Para cada k representamos por U
k tem medida
que nunca regressam a Uk . De acordo com o Teorema 1.2.1, todo U
nula. Consequentemente, a uni
ao enumeravel
[
=
k
U
U
kN

tem medida nula. Portanto, para demonstrar o teorema sera suficiente que
e recorrente. Isso e facil, como
mostremos que todo ponto x que n
ao est
a em U
e seja U uma vizinhanca qualquer de x. Por definicao,
vamos ver. Seja x M \ U
existe algum elemento Uk da base de abertos tal que x Uk e Uk U . Como
, tambem temos que x
k . Em outras palavras, existe algum
x n
ao est
a em U
/U
n 1 tal que f n (x) est
a em Uk . Em particular, f n (x) tambem est
a em U .
Como a vizinhanca U e arbitraria, isto prova que x e um ponto recorrente.
Observe que as conclusoes dos Teoremas 1.2.1 e 1.2.4 n
ao sao verdadeiras,
em geral, se omitirmos a hip
otese de que a medida e finita:
Exemplo 1.2.5. Seja f : R R a translacao de 1 unidade, isto e, a trans facil verificar que f
formacao definida por f (x) = x + 1 para todo x R. E
deixa invariante a medida de Lebesgue em R (que e infinita). Por outro lado,
nenhum ponto e recorrente para f . Portanto, pelo teorema de recorrencia, f
n
ao pode admitir nenhuma medida invariante finita.
No entanto, e possvel estender estes enunciados para certos casos de medidas
infinitas: veja o Exerccio 1.2.2.
Para terminar, apresentamos uma versao puramente topologica do Teorema 1.2.4, chamada teorema de recorrencia de Birkhoff, que n
ao faz qualquer
mencao a medidas invariantes:

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Teorema 1.2.6 (Recorrencia de Birkhoff). Se f : M M e uma transformac


ao contnua num espaco metrico compacto M , ent
ao existe algum ponto
x X que e recorrente para f .
Demonstrac
ao. Considere a famlia I de todos os conjuntos fechados n
ao-vazios
X M que sao invariantes, no sentido de que f (X) X. Esta famlia e n
aovazia, uma vez que M I. Afirmamos que um elemento X I e minimal
para a relacao de inclusao se, e somente se, a orbita de todo ponto x X e
densa em X. De fato, e claro que se X e fechado invariante ent
ao X contem o
fecho da
orbita de qualquer dos seus pontos. Logo, para ser minimal X precisa
coincidir com qualquer desses fechos. Reciprocamente, pela mesma raz
ao, se X
coincide com o fecho da orbita de qualquer dos seus pontos ent
ao ele coincide
com qualquer subconjunto fechado invariante, ou seja, X e minimal. Isto prova
a nossa afirmacao. Em particular, qualquer ponto x num conjunto minimal
e recorrente. Logo, para provar o teorema basta mostrar que existe algum
conjunto minimal.
Afirmamos que todo conjunto totalmente ordenado {X } I admite algum
minorante. De fato, considere X = X . Observe que X e n
ao-vazio, uma
vez que os X sao compactos e constituem uma famlia totalmente ordenada.
claro que X e fechado e invariante por f e tambem que ele e um minorante
E
para o conjunto {X }. Isto prova a nossa afirmacao. Agora podemos aplicar o
Lema de Zorn para concluir que I realmente contem elementos minimais.
O Teorema 1.2.6 tambem segue imediatamente do Teorema 1.2.4 juntamente
com o fato, que provaremos mais tarde, que toda transformacao contnua num
espaco metrico compacto admite alguma medida de probabilidade invariante.

1.2.4

Exerccios

1.2.1. Mostre que o seguinte enunciado e equivalente ao Teorema 1.2.1, isto e,


qualquer um deles pode ser obtido a partir do outro. Seja f : M M uma
transformacao mensuravel e seja uma medida invariante finita. Seja E M
qualquer conjunto mensuravel com (E) > 0. Ent
ao existe N 1 e um conjunto
D E com medida positiva, tal que f N (x) E para todo ponto x D.
1.2.2. Seja f : M M uma transformacao invertvel e suponha que e uma
medida invariante n
ao necessariamente finita. Seja B M um conjunto com
medida finita. Mostre que, dado qualquer conjunto mensuravel E M com
medida positiva, quase todo ponto x E regressa infinitas vezes a E ou tem
apenas um n
umero finito de iterados em B.
1.2.3. Seja f : M M uma transformacao invertvel e suponha que e
uma medida invariante -finita: existe uma sequencia crescente de subconjuntos
mensuraveis Mk com (Mk ) < para todo k e k Mk = M . Dizemos que um
ponto x vai para infinito se, para qualquer k, existe apenas um n
umero finito de
iterados de x que est
ao em Mk . Mostre que, dado qualquer conjunto mensuravel
E M com medida positiva, quase todo ponto x E regressa a E infinitas
vezes ou vai para infinito.

1.3. EXEMPLOS

1.2.4. Sejam f : M M uma transformacao, n


ao necessariamente invertvel,
uma probabilidade invariante e D M um conjunto com medida positiva.
Prove que quase todo ponto de D passa uma fracao positiva do tempo em D:
lim sup
n

1
#{0 j n 1 : f j (x) D} > 0
n

para -quase todo ponto x D. [Observacao: Da para substituir lim sup por
lim inf no enunciado, mas a prova desse fato ter
a que esperar ate o Captulo 3.]
1.2.5. Seja f : M M uma transformacao mensuravel que preserva uma
medida finita . Dado qualquer conjunto mensuravel A M com (A) > 0,
seja n1 < n2 < a sequencia dos valores de n tais que (f n (A) A) > 0. O
objetivo deste exerccio e mostrar que o conjunto VA = {n1 , n2 , . . . } e sindetico,
ou seja, que existe C > 0 tal que ni+1 ni C para todo i.
1. Mostre que para qualquer sequencia crescente k1 < k2 < existem
j > i 1 tal que (A f (kj ki ) (A)) > 0.
2. Dada qualquer sequencia infinita = (lj )j de n
umeros naturais, denote
por S() o conjunto de todas as somas finitas de elementos contguos de
. Mostre que VA intersecta S() qualquer que seja .
3. Deduza que o conjunto VA e sindetico.
1.2.6. Mostre que se f : [0, 1] [0, 1] e uma transformacao mensuravel preservando a medida de Lebesgue m ent
ao m-quase todo ponto x [0, 1] satisfaz
lim inf n|f n (x) x| 1.
n

[Observacao: Boshernitzan [Bos93] provou um resultado bastante mais geral:


lim inf n n1/d d(f n (x), x) < para -quase todo ponto e toda probabilidade
invariante por f : M M , se M e um espaco metrico separ
avel cuja medida
de Hausdorff d-dimensional e -finita.]

ao
aurea e seja f : [0, 1] [0, 1] a transformacao
1.2.7. Seja = (1+ 5/2 a raz
definida por f (x) = (x + ) [x + ]. Dado x, verifique que n|f n (x) x| =
n2 | qn | para todo n, onde (qn )n e a sequencia de n
umeros racionais dada
por qn= [x + n]/n. Usando que as razes do
polinomio R(z) = z 2 + z 1 sao
e 5, mostre que lim inf n n2 | qn | 1/ 5. [Observacao: Isto mostra que
a constante 1no Exerccio 1.2.6 n
ao pode ser substituda por nenhuma outra
ao e conhecido se 1 e a menor constante que vale para toda
menor que 1/ 5. N
transformacao no intervalo.]

1.3

Exemplos

Em seguida vamos descrever alguns exemplos simples de medidas invariantes


por transformacoes ou por fluxos, que nos ajudam a interpretar o significado do
teorema de recorrencia de Poincare, bem como obter conclusoes interessantes.


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

10

1.3.1

Expans
ao decimal

O nosso primeiro exemplo e a transformacao definida no intervalo [0, 1] do seguinte modo


f : [0, 1] [0, 1], f (x) = 10x [10x]

onde [10x] representa o maior inteiro menor ou igual a 10x. Em outras palavras,
f associa a cada x [0, 1] a parte fracionaria de 10x. O grafico da transformacao
f est
a representado na Figura 1.1.
1

2/10

4/10

6/10

8/10

Figura 1.1: Transformacao parte fracionaria de 10x


Afirmamos que a medida de Lebesgue no intervalo e invariante pela transformacao f , isto e, ela satisfaz a condicao
(E) = (f 1 (E))

para todo conjunto mensuravel E M.

(1.3.1)

Esse fato pode ser verificado da seguinte forma. Comecemos por supor que E
e um intervalo. Ent
ao, conforme ilustrado na Figura 1.1, a pre-imagem f 1 (E)
consiste de dez intervalos, cada um deles dez vezes mais curto do que E. Logo, a
medida de Lebesgue de f 1 (E) e igual `a medida de Lebesgue de E. Isto mostra
que (1.3.1) e satisfeita no caso de intervalos. Como consequencia, essa relacao
e satisfeita sempre que E e uma uniao finita de intervalos. Agora, a famlia das
uni
oes finitas de intervalos e uma algebra que gera a -algebra de Borel de [0, 1].
Portanto, para concluir a demonstracao basta usar o seguinte fato geral:
Lema 1.3.1. Seja f : M M uma transformac
ao mensur
avel e uma medida
finita em M . Suponha que existe uma
algebra A de subconjuntos mensur
aveis
de M tal que A gera a -
algebra B de M e (E) = (f 1 (E)) para todo E A.
Ent
ao o mesmo vale para todo conjunto E B, isto e, a medida e invariante
por f .
Demonstrac
ao. Comecemos por provar que C = {E B : (E) = (f 1 (E))}
e uma classe mon
otona. Para isso, seja E1 E2 . . . uma sequencia de elementos em C e seja E =
cio A.1.9),
i=1 Ei . Pelo Teorema A.1.14 (veja o Exerc

11

1.3. EXEMPLOS
temos que
(E) = lim (Ei ) e
i

(f 1 (E)) = lim (f 1 (Ei )).


i

Ent
ao, usando o fato de que Ei C,
(E) = lim (Ei ) = lim (f 1 (Ei )) = (f 1 (E)).
i

Logo E C. De modo inteiramente analogo se mostra que a intersecao de


qualquer sequencia decrescente de elementos de C est
a em C. Isto prova que C
e de fato uma classe mon
otona.
Agora e f
acil obter a conclusao do lema. Note que C contem A, por hipotese.
Portanto, usando o teorema das classes mon
otonas (Teorema A.1.18), segue que
C contem a -algebra B gerada por A. Isto e precisamente o que queramos
provar.
Agora vamos explicar como, a partir do fato de que a medida de Lebesgue e
invariante pela transformacao f , podemos obter conclusoes interessantes usando
o teorema de recorrencia de Poincare. A funcao f tem uma relacao direta com
o algoritmo da expansao decimal: se x e dado por
x = 0, a0 a1 a2 a3
com ai {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e ai 6= 9 para infinitos valores de i, ent
ao a sua
imagem e dada por
f (x) = 0, a1 a2 a3 .
Com isso, fica f
acil escrever a expressao do iterado n-esimo, para qualquer n 1:
f n (x) = 0, an an+1 an+2

(1.3.2)

Agora, seja E o subconjunto dos x [0, 1] cuja expansao decimal comeca


com o dgito 7, ou seja, tais que a0 = 7. De acordo com o Teorema 1.2.1, quase
todo elemento de E tem infinitos iterados que tambem est
ao em E. Levando
em conta a expressao (1.3.2), isto quer dizer que existem infinitos valores de n
tais que an = 7. Portanto, provamos que quase todo n
umero x cuja expans
ao
decimal comeca por 7 tem infinitos dgitos iguais a 7.
Claro que no lugar de 7 podemos considerar qualquer outro dgito. Alem
disso, tambem podemos considerar blocos com varios dgitos (Exerccio 1.3.2).
Mais tarde provaremos um resultado muito mais forte: para quase todo n
umero
x [0, 1], todo dgito aparece com frequencia 1/10 na expansao decimal de x.

1.3.2

Transformac
ao de Gauss

O sistema que apresentamos nesta secao est


a relacionado com outro importante algoritmo em Teoria dos N
umeros, a expansao de um n
umero em fracao
contnua, cuja origem remonta ao problema de achar a melhor aproximacao

12

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

racional para um n
umero real qualquer. Vamos descrever este algoritmo sucintamente.
Dado um n
umero x0 (0, 1), sejam
 
1
1
e
x1 =
a1 .
a1 =
x0
x0
Note que a1 e um n
umero natural, x1 [0, 1) e tem-se
x0 =

1
.
a1 + x1

Supondo que x1 seja diferente de zero, podemos repetir o processo, definindo


 
1
1
a2 =
e
x2 =
a2 .
x1
x1
Ent
ao
x1 =

1
a1 + x2

e portanto x0 =
a1 +

1
a2 + x2

Por recorrencia, para cada n 1 tal que xn1 (0, 1) define-se




1
1
e
xn =
an =
an = G(xn1 )
xn1
xn1
e tem-se

x0 =

a1 +

(1.3.3)

a2 +
+

1
an + xn

Pode mostrar-se que a sequencia


1

zn =

a1 +

(1.3.4)

a2 +

1
an

converge para x0 quando n , e e usual traduzir este fato escrevendo


1

x0 =

a1 +

a2 +
+

1
an +

que e chamada expans


ao em frac
ao contnua de x0 .

(1.3.5)

13

1.3. EXEMPLOS

Note que a sequencia (zn )n definida pela relacao (1.3.4) consiste de n


umeros
racionais. De fato, mostra-se que estes sao os n
umeros racionais que melhor
aproximam o n
umero x0 , no sentido de que zn est
a mais proximo de x0 do
que qualquer outro n
umero racional com denominador menor ou igual que o
denominador de zn (escrito em forma irredutvel). Observe tambem que para
obter (1.3.5) suposemos que xn (0, 1) para todo n N. Se encontramos algum
xn = 0, o processo p
ara nesse momento e consideramos (1.3.3) a expansao em
fracao contnua de x0 . Claro que este u
ltimo caso ocorre somente se x0 e um
n
umero racional.
O algoritmo de expansao em fracao contnua est
a intimamente conectado
com o sistema din
amico no intervalo [0, 1] que vamos descrever a seguir. A
transformac
ao de Gauss G : [0, 1] [0, 1] e definida por
 
1
1
= parte fracionaria de 1/x,
G(x) =
x
x
se x (0, 1] e G(0) = 0. O gr
afico de G pode ser esbocado facilmente, a partir
da seguinte observacao: para todo x em cada intervalo Ik = (1/(k + 1), 1/k] a
parte inteira de 1/x e igual a k e, portanto, G(x) = 1/x k. Veja a Figura 1.2.
1

...

1/4

1/3

1/2

Figura 1.2: Transformacao de Gauss


A expansao em fracao contnua de qualquer n
umero x0 (0, 1) pode ser
obtida a partir da transformacao de Gauss, da seguinte forma: para cada n 1
o n
umero natural an e determinado por
Gn1 (x0 ) Ian .
e xn e simplesmente o n-esimo iterado Gn (x0 ) de x0 . Este processo termina
se encontrarmos algum xn = 0; como explicamos anteriormente, isto so pode
acontecer se o n
umero x0 for racional (veja o Exerccio 1.3.4). Em particular,
existe um conjunto com medida de Lebesgue total tal que todos os iterados de
G est
ao definidos para os pontos deste conjunto.

14

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

O que torna esta transformacao interessante do ponto de vista da Teoria


Erg
odica e que G admite uma probabilidade invariante que e equivalente `a
medida de Lebesgue no intervalo. De fato, considere a medida definida por
Z
c
dx para cada mensuravel E [0, 1],
(1.3.6)
(E) =
1
+
x
E
onde c e uma constante positiva. Note que a integral est
a bem definida, ja que
a funcao integranda e contnua no intervalo [0, 1]. Alem disso, essa funcao toma
valores no intervalo [c/2, c] e, portanto,
c
m(E) (E) c m(E)
2

(1.3.7)

para todo conjunto mensuravel E [0, 1]. Em particular, e de fato equivalente


` medida de Lebesgue m, isto e, as duas medidas tem os mesmos conjuntos com
a
medida nula.
Proposi
c
ao 1.3.2. A medida e invariante por G. Alem disso, se escolhermos
c = 1/log2 ent
ao e uma probabilidade.
Demonstrac
ao. Vamos utilizar o seguinte lema:
Lema 1.3.3. Seja f : [0, 1] [0, 1] uma transformac
ao tal que existem intervalos abertos I1 , I2 , . . . disjuntos dois-a-dois tais que
1. a uni
ao k Ik tem medida de Lebesgue total em [0, 1] e
2. a restric
ao fk = f | Ik a cada Ik e um difeomorfismo sobre (0, 1).
Seja : [0, 1] [0, ) uma func
ao integr
avel (para a medida de Lebesgue) com
X

(y) =

xf 1 (y)

(x)
|f (x)|

(1.3.8)

para quase todo y [0, 1]. Ent


ao a medida = dx e invariante por f .
Demonstrac
ao. Seja = E a funcao caracterstica de um conjunto mensuravel
E [0, 1] qualquer. Pela formula de mudanca de variaveis,
Z

(f (x))(x) dx =

Ik

(y)(fk1 (y))|(fk1 ) (y)| dy.

Note que (fk1 ) (y) = 1/f (fk1 (y)). Portanto, a relacao anterior implica que
Z

(f (x))(x) dx =

Z
X

k=1 Ik
Z 1
X
k=1

(f (x))(x) dx
(f 1 (y))
(y) k1
dy.
|f (fk (y))|

(1.3.9)

15

1.3. EXEMPLOS

Usando o teorema da convergencia mon


otona (Teorema A.2.9) e a hipotese
(1.3.8), vemos que a u
ltima expressao em (1.3.9) e igual a
Z 1
Z 1

X
(fk1 (y))
dy =
(y)(y) dy.
(y)
|f (fk1 (y))|
0
0
k=1
R1
R1
Deste jeito mostramos que 0 (f (x))(x) dx = 0 (y)(y) dy. Como = dx
e = XE , isto quer dizer que (f 1 (E)) = (E) para todo conjunto mensuravel
E [0, 1]. Portanto, e invariante por f .
Para concluir a demonstracao da Proposicao 1.3.2 devemos mostrar que a
condicao (1.3.8) vale para (x) = c/(1 + x) e f = G. Seja Ik = (1/(k + 1), 1/k)
e seja Gk a restricao de G a Ik . Note que G1
k (y) = 1/(y + k) para todo k. Note
tambem que G (x) = (1/x) = 1/x2 para todo x 6= 0. Portanto,

X
X
(G1
1 2 X
c
c(y + k)
k (y))
=
. (1.3.10)
=
(G1 (y))|
y
+
k
+
1
y
+
k
(y
+
k)(y
+ k + 1)
|G
k
k=1
k=1
k=1

Observando que

1
1
1
=

,
(y + k)(y + k + 1)
y+k y+k+1
vemos que a u
ltima soma em (1.3.10) pode ser escrita na forma telescopica:
todos os termos, exceto o primeiro, aparecem duas vezes, com sinais contrarios,
e portanto se cancelam. Logo a soma e igual ao primeiro termo:

k=1

c
c
=
= (y).
(y + k)(y + k + 1)
y+1

Isto mostra que a igualdade (1.3.8) e realmente satisfeita e, portanto, podemos


usar o Lema 1.3.1 para concluir que e invariante.
Finalmente, usando a primitiva c log(1 + x) da funcao (x) vemos que
Z 1
c
dx = c log 2.
([0, 1]) =
1
+
x
0
Logo, escolhendo c = 1/ log 2 obtemos que e uma probabilidade.
Esta proposicao permite utilizar ideias de Teoria Erg
odica, aplicadas `a transformacao de Gauss, para obter conclusoes interessantes em Teoria dos N
umeros.
Por exemplo (veja o Exerccio 1.3.3), o n
umero 7 aparece infinitas vezes na expans
ao em fracao contnua de quase todo n
umero x0 (1/8, 1/7), isto e, tem-se
an = 7 para infinitos valores de n N. Mais tarde provaremos um fato muito
mais preciso, que implica o seguinte: para quase todo x0 (0, 1) o n
umero 7
aparece com frequencia
64
1
log
log 2
63
na sua expansao em fracao contnua. Tente intuir desde ja de onde vem este
n
umero!

16

1.3.3

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Rotac
oes no crculo

Considere na reta R a relacao de equivalencia que identifica quaisquer n


umeros
cuja diferenca e um n
umero inteiro, isto e:
xy

x y Z.

Representamos por [x] R/Z a classe de equivalencia de qualquer x R e


denotamos por R/Z o espaco de todas as classes de equivalencia. Este espaco
sera chamado de crculo e tambem sera denotado por S 1 . A raz
ao de ser desta
terminologia e que R/Z pode ser identificado de maneira natural com o crculo
unit
ario no plano complexo, por meio da aplicacao
: R/Z {x C : |z| = 1},

[x] 7 e2xi .

(1.3.11)

Note que est


a bem definida: a expressao e2xi n
ao depende da escolha do
representante x na classe [x], uma vez que a funcao x 7 e2xi e periodica de
perodo 1. Alem disso, e uma bijecao.
O crculo herda da reta uma estrutura de grupo abeliano, dada pela operacao
[x] + [y] = [x + y].
Observe esta definicao est
a bem formulada: a classe de equivalencia do lado
direito n
ao depende da escolha dos representantes x e y das classes do lado
esquerdo. Dado R, chamamos rotac
ao de angulo a transformacao
R : R/Z R/Z,

[x] 7 [x + ] = [x] + [].

Note que a aplicacao que lhe corresponde em {z C : |z| = 1}, via a identificacao (1.3.11), e o que chamaramos de rotacao de angulo 2, ou seja, e a
imediato da derestricao ao crculo unit
ario da transformacao z 7 e2i z. E
finicao que R0 e a identidade e R R = R+ para todo e . Em particular,
toda rotacao R e invertvel e a inversa e R .
Tambem podemos munir S 1 com uma estrutura natural de espaco de probabilidade, da seguinte forma. Seja : R S 1 a projecao canonica que associa a
cada x R a respectiva classe de equivalencia [x]. Primeiramente, dizemos que
um conjunto E R e mensuravel se 1 (E) e um subconjunto mensuravel da
reta. Em seguida, seja m a medida de Lebesgue na reta. Definimos a medida
de Lebesgue no crculo da seguinte forma:

(E) = m 1 (E) [k, k + 1) para qualquer k Z.

Note que o lado esquerdo desta igualdade n


ao depende de k, uma vez, por
definicao, 1 (E) [k, k + 1) = 1 (E) [0, 1) + k e a medida m e invariante
por translacoes.
claro da definicao que e uma probabilidade. Alem disso, e invariE
ante por toda rotacao R (trata-se da u
nica medida de probabilidade com esta
propriedade, como veremos no Exerccio 1.3.8). Isto pode ser mostrado da seguinte forma. Por definicao, 1 (R1 (E)) = 1 (E) para todo conjunto

17

1.3. EXEMPLOS

mensuravel E S 1 . Seja k a parte inteira de . Como m e invariante por


translacoes,


m ( 1 (E) ) [0, 1) = m 1 (E) [, + 1)


= m 1 (E) [, k + 1) + m 1 (E) [k + 1, + 1)

Note que 1 (E) [k + 1, + 1) = 1 (E) [k, ) + 1. Portanto, a expressao
no lado direito da igualdade anterior pode ser escrita como



m 1 (E) [, k + 1) + m 1 (E) [k, ) = m 1 (E) [k, k + 1) .
Combinando estas duas igualdades obtemos que



R1 (E) = m 1 (R1 (E) [0, 1)) = m 1 (E) [k, k + 1) = (E)

para todo conjunto mensuravel E S 1 .


A din
amica da rotacao R : S 1 S 1 apresenta dois comportamentos bem
distintos, dependendo do valor de . Se e racional, digamos = p/q com p Z
e q N, ent
ao
Rq ([x]) = [x + q] = [x] para todo [x].
Como consequencia, todo ponto x S 1 e periodico de perodo q. No caso
contr
ario temos:
Proposi
c
ao 1.3.4. Se e irracional ent
ao O([x]) = {Rn ([x]) : n N} e um
subconjunto denso de R/Z para todo [x].
Demonstrac
ao. Afirmamos que o conjunto D = {m + n : m Z, n N} e
denso em R. De fato, considere um n
umero qualquer r R. Dado qualquer
> 0, podemos escolher p Z e q N tais que |q p| < . Note que o n
umero
a = q p e necessariamente diferente de zero, uma vez que e irracional.
Suponhamos que a e positivo (o outro caso e analogo). Subdividindo a reta
em intervalos de comprimento a, vemos que existe um n
umero inteiro l tal que
0 r la < a. Isto implica que
|r (lq lp)| = |r la| < a < .
Como m = lq e n = lq sao inteiros e e arbitrario, isto mostra que r est
a no
fecho do conjunto D, para todo r R.
Agora, dados y R e > 0, podemos tomar r = y x e, usando o par
agrafo
anterior, podemos encontrar m, n Z tais que |m + n (y x)| < . Isto
equivale a dizer que a distancia de [y] ao iterado Rn ([x]) e menor que . Como
x, y e sao arbitrarios, isto mostra que toda orbita O([x]) e densa.
Em particular, segue que todo ponto do crculo e recorrente para R (isto
tambem e verdade quando e racional). A proposicao anterior tambem ter
a
varias implicacoes interessantes no estudo das medidas invariantes de R . Entre
outras coisas, veremos posteriormente que se e irracional ent
ao a medida de
Lebesgue e a u
nica medida de probabilidade que e preservada por R . Relacionado com isso, veremos que as
orbitas de R se distribuem de modo uniforme
em S 1 .


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

18

1.3.4

Rotac
oes em toros

As nocoes que acabamos de apresentar podem ser generalizadas para qualquer


dimensao, como vamos explicar em seguida. Para cada d 1, considere a
relacao de equivalencia em Rd que identifica dois vetores se a sua diferenca e
um vetor com coordenadas inteiras:
(x1 , . . . , xd ) (y1 , . . . , yd )

(x1 y1 , . . . , xd yd ) Zd .

Chamamos toro de dimens


ao d ou, simplesmente, d-toro o espaco
Td = Rd /Zd = (R/Z)d
das classes de equivalencia desta relacao. Seja m a medida de volume em Rd .
A operacao
[(x1 , . . . , xd )] + [(y1 , . . . , yd )] = [(x1 + y1 , . . . , xd + yd )]
faz de Td um grupo abeliano. A rotac
ao associada a um vetor = (1 , . . . , d )
e
R : Td Td , R ([x]) = [x] + [].
A aplicacao

: [0, 1]d Td ,

(x1 , . . . , xd ) 7 [(x1 , . . . , xd )]

e sobrejetora e nos permite definir a medida de probabilidade


 de Lebesgue no
d-toro, por meio da seguinte formula: (B) = m 1 (B) para todo B Td
tal que 1 (B) e mensuravel. Esta medida e invariante por R para todo .
Dizemos que um vetor = (1 , . . . , d ) e racionalmente independente se para
quaisquer n
umeros inteiros n0 , n1 , . . . , nd temos que
n 0 + n 1 1 + + n d d = 0

n0 = n1 = = nd = 0.

Caso contr
ario dizemos que e racionalmente dependente. Pode mostrar-se que
e racionalmente independente se, e somente se, rotacao e uma transformacao
minimal, ou seja, a
orbita O([x]) = {Rn ([x]) : n N} e um subconjunto denso
de Td para todo [x]. A este respeito, veja os Exerccios 1.3.9- 1.3.10 e tambem
o Corol
ario 4.2.3.

1.3.5

Transformac
oes conservativas

Seja M Rk um aberto do espaco euclidiano Rd e seja f : M M um


difeomorfismo de classe C 1 . Isto quer dizer que f e uma bijecao e tanto ele
quanto a sua inversa sao derivaveis com derivada contnua. Representaremos
por vol a medida de Lebesgue, ou medida de volume, em M . A formula de
mudanca de variaveis afirma que, para qualquer conjunto mensuravel B M ,
Z
| det Df | dx.
(1.3.12)
vol(f (B)) =
B

Daqui se deduz facilmente o seguinte fato:

19

1.3. EXEMPLOS

Lema 1.3.5. Um difeomorfismo f : M M de classe C 1 deixa invariante a


medida de volume se, e somente se, o valor absoluto | det Df | do seu jacobiano
e constante igual a 1.
Demonstrac
ao. Suponha primeiro que o valor absoluto do jacobiano e igual 1
em todo ponto. Considere um conjunto mensuravel E e seja B = f 1 (E). A
formula (1.3.12) d
a que
Z
1 dx = vol(B) = vol(f 1 (E)).
vol(E) =
B

Isto significa que f deixa invariante o volume e, portanto, provamos a parte


sedo enunciado.
Para provar a parte somente se, suponha que | det Df | fosse maior que 1 em
algum ponto x. Ent
ao, como o jacobiano e contnuo, existiria uma vizinhanca
U de x e algum n
umero > 1 tais que
| det Df (y)|

para todo y U.

Ent
ao a f
ormula (1.3.12) aplicada a B = U daria
Z
vol(f (U ))
dx vol(U ).
U

Denotando E = f (U ), isto implica que vol(E) > vol(f 1 (E)) e, portanto, f n


ao
deixa invariante o volume. Do mesmo modo se mostra que se o valor absoluto
do jacobiano e menor que 1 em algum ponto ent
ao f n
ao deixa invariante o
volume.

1.3.6

Fluxos conservativos

Agora vamos considerar o caso de fluxos f t : M M , t R. Suporemos que o


fluxo e de classe C 1 , no sentido de que a aplicacao (t, x) 7 f t (x) e de classe C 1 .
Ent
ao cada transformacao f t e um difeomorfismo C 1 : a inversa e f t . Como f 0
e a identidade e o jacobiano varia continuamente, obtemos que det Df t (x) > 0
em todo ponto.
Aplicando o Lema 1.3.5 neste contexto, obtemos que o fluxo deixa invariante
a medida de volume se, e somente se,
det Df t (x) = 1 para todo x U e todo t R.

(1.3.13)

No entanto esta conclusao n


ao e muito u
til na pratica porque, em geral, n
ao
temos uma expressao explcita para f t , e portanto n
ao e claro como verificar
a condicao (1.3.13). Felizmente, existe uma expressao razoavelmente explcita
para o jacobiano, de que iremos falar em seguida, que pode ser usada em muitas
situacoes interessantes.
Suponhamos que M e um aberto de Rd e o fluxo f t : M M corresponde
`as trajetorias de um campo de vetores F : M Rd de classe C 1 . Em outras

20

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

palavras, t 7 f t (x) e a solucao da equacao diferencial


dy
= F (y)
dt

(1.3.14)

que tem x como condicao inicial (quando tratando de equacoes diferenci


aveis
sempre suporemos que as suas solucoes est
ao definidas para todo tempo).
A f
ormula de Liouville exprime o jacobiano de f t em termos do divergente
div F do campo de vetores:
Z t

t
det Df (x) = exp
div F (f s (x)) ds para todo x e todo t.
0

Lembre que o divergente de um campo de vetores F e o traco da sua matriz


jacobiana, isto e
F
F
div F =
+ +
.
(1.3.15)
x1
xd
Combinando a f
ormula de Liouville com (1.3.13) obtemos
Lema 1.3.6 (Liouville). O fluxo (f t )t associado a um campo de vetores F de
classe C 1 deixa invariante a medida de volume se, e somente se, o divergente
de F e identicamente nulo.

Podemos generalizar esta discuss


ao para o caso em que M e uma variedade
riemanniana qualquer, de dimensao d 2. Por simplicidade, suponhamos que
a variedade e orient
avel. Neste caso, a medida de Lebesgue e dada por uma dforma diferenci
avel , chamada forma de volume, que se escreve em coordenadas
locais como = dx1 dxd . Isto significa que o volume de qualquer conjunto
mensuravel B contido num domnio de coordenadas locais (x1 , . . . , xd ) e dado
por
Z
(x1 , . . . , xd ) dx1 dxd .
vol(B) =
B

Seja F um campo de vetores de classe C 1 em M . Escrevendo

F (x1 , . . . , xd ) = (F1 (x1 , . . . , xd ), . . . , Fd (x1 , . . . , xd )),


podemos definir o divergente de F como sendo
div F =

(F )
(F )
+ +
x1
xd

(a definicao n
ao depende da escolha das coordenadas locais). Ent
ao temos a
seguinte versao do teorema de Liouville (a prova pode ser encontrada no livro
de Sternberg [Ste58]):
Teorema 1.3.7 (Liouville). O fluxo (f t )t associado a um campo de vetores F
de classe C 1 preserva a medida de volume na variedade M se, e somente se,
div F = 0 em todo ponto.
Ent
ao, segue do teorema de recorrencia para fluxos que, se a variedade M
tem volume finito (por exemplo, se M e compacta) e div F = 0, ent
ao quase
todo ponto e recorrente para o fluxo de F .

21

1.3. EXEMPLOS

1.3.7

Exerccios

1.3.1. Utilizando o Lema 1.3.3, de outra prova de que a transformacao expansao


decimal f (x) = 10x [10x] preserva a medida de Lebesgue no intervalo.
1.3.2. Prove que, para quase todo n
umero x [0, 1] cuja expansao decimal
contem o bloco 617 (por exemplo x = 0, 3375617264 ), esse bloco aparece
infinitas vezes na expansao. V
a mais longe e mostre que, de fato, o bloco 617
aparece infinitas vezes na expansao decimal de quase todo x [0, 1].
1.3.3. Para (Lebesgue) quase todo n
umero x0 (1/618, 1/617) o n
umero 617
aparece infinitas vezes na sua expansao em fracao contnua, isto e, an = 617
para infinitos valores de n N.
1.3.4. Seja G a transformacao de Gauss. Mostre que um n
umero x (0, 1) e
racional se, e somente se, existe n 1 tal que Gn (x) = 0.

1.3.5. Considere a sequencia 1, 2, 4, 8, . . . , an = 2n , . . . das potencias de 2. Mostre que dado qualquer dgito i {1, . . . , 9}, existe uma quantidade infinita de
valores n tais que an comeca com este dgito.

1.3.6. Prove a seguinte extensao do Lema 1.3.3. Suponha que f : M M e


um difeomorfismo local de classe C 1 de uma variedade riemanniana compacta
M . Seja vol a medida de volume em M e seja : M [0, ) uma funcao
contnua. Mostre que f preserva a medida = vol se, e somente se,
X

xf 1 (y)

(x)
= (y) para todo y M.
| det Df (x)|

No caso em que f e invertvel isto significa que f preserva a medida se, e


somente se, (x) = (f (x))| det Df (x)| para todo x M .
1.3.7. Mostre que se A e uma matriz n n com coeficientes inteiros e determinante diferente de zero, ent
ao a transformacao fA : Td Td definida por
fA ([x]) = [A(x)] preserva a medida de Lebesgue de Td .
1.3.8. Mostre que a medida de Lebesgue em S 1 e a u
nica probabilidade no
crculo S 1 que e invariante por todas as rotacoes. De fato, ela e a u
nica probabilidade invariante por todas as rotacoes racionais de S 1 .
1.3.9. Suponha que = (1 , . . . , d ) e vetor racionalmente dependente. Mostre
que existe alguma funcao contnua : Td C n
ao constante tal que R = .
Conclua que existem abertos U e V , n
ao vazios, disjuntos e invariantes por R ,
ou seja, tais que R (U ) = U e R (V ) = V . Deduza que nenhuma orbita O([x])
da rotacao R e densa em Td .
1.3.10. Suponha que = (1 , . . . , d ) e vetor racionalmente independente. Mostre que se V Td e aberto, n
ao vazio, invariante por R , ent
ao V e denso no
toro. Conclua que nZ Rn (U ) e denso no toro, qualquer que seja o aberto n
ao
vazio U . Conclua que existe [x] cuja orbita O([x]) pela rotacao R e densa em
Td . Deduza que O([y]) e densa em Td para todo [y].

22

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

1.3.11. Seja U um aberto de R2d e H : U R uma funcao de classe C 2 .


Representamos as variaveis em R2d por (p1 , . . . , pd , q1 , . . . , qd ). O campo de
vetores hamiltoniano associado a H e definido por


H
H
H
H
.
,...,
,
,...,
F (p1 , . . . , pd , q1 , . . . , qd ) =
q1
qd
p1
pd
Verifique que o fluxo definido por F preserva o volume.
1.3.12. Seja f : U U um difeomorfismo de classe C 1 preservando a medida
de Lebesgue num aberto U de Rd . Seja H : U R uma integral primeira de f ,
ou seja, uma funcao de classe C 1 tal que H f = H. Seja c um valor regular
de H e seja ds a medida de volume definida na hipersuperfcie Hc = H 1 (c)
pela restricao da metrica riemanniana de Rd . Mostre que a restricao de f `a
hipersuperfcie Hc preserva a medida ds/k grad Hk.

1.4

Indu
c
ao

Nesta secao vamos descrever certas construcoes, baseadas no teorema de recorrencia de Poincare, que permitem associar a um dado sistema (f, ) outros
sistemas intimamente relacionados com ele, que chamamos sistemas induzidos
por (f, ). O seu interesse resulta do seguinte. Por um lado, em muitos casos
o sistema induzido pode ser construdo de modo a ter melhores propriedades
globais que o sistema original, o que torna a sua analise mais acessvel. Por outro
lado, a partir das propriedades do sistema induzido e possvel obter conclusoes
interessantes a respeito do sistema original.

1.4.1

Transformac
ao de primeiro retorno

Seja f : M M uma transformacao mensuravel e uma probabilidade invariante. Seja E M um conjunto mensuravel com (E) > 0 e seja (x) = E (x)
o tempo de primeiro retorno de x a E, tal como foi definido em (1.2.1). A
transformac
ao de primeiro retorno ao domnio E e definida por
g(x) = f (x) (x)
num subconjunto com medida total de E. Tambem denotamos por E a restricao de aos subconjuntos mensuraveis de E.
Proposi
c
ao 1.4.1. A medida E e invariante pela transformac
ao g : E E.
Demonstrac
ao. Para cada k 1, denote por Ek o conjunto dos pontos x E
tais que (x) = k. Por definicao, g(x) = f k (x) para todo x Ek . Seja B um
subconjunto mensuravel qualquer de E. Ent
ao
(g 1 (B)) =

k=1

(f k (B) Ek ).

(1.4.1)


1.4. INDUC
AO

23

Por outro lado, como e f -invariante,






B = f 1 (B) = f 1 (B) E1 + f 1 (B) \ E .

(1.4.2)

Analogamente,



f 1 (B) \ E = f 2 (B) \ f 1 (E)


= f 2 (B) E2 + f 2 (B) \ (E f 1 (E)) .

Substituindo em (1.4.2), obtemos

1
2
[


 X
f k (E) .
B =
f k (B) Ek + f 2 (B) \
k=0

k=1

Repetindo este argumento sucessivamente, obtemos que


n1
n
[


 X
f k (E) .
B =
f k (B) Ek + f n (B) \

(1.4.3)

k=0

k=1

claro que a u
Vamos passar aoS
limite quando n . E
ltima parcela e majorada
n1
por f n (E) \ k=0 f k (E) . Logo, usando a Observacao 1.2.3, ela converge
para zero quando n . Deste modo, conclumos que


 X
f k (B) Ek .
B =
k=1

Juntamente com (1.4.1), isto mostra que (g 1 (B)) = (B) para todo subconjunto mensuravel B de E. Isto e, a medida E e invariante por g.
Exemplo 1.4.2. Considere a transformacao f : [0, ) [0, ) dada por
f (0) = 0

f (x) = 1/x se x (0, 1) e

f (x) = x 1 se x 1.

Considere E = [0, 1]. O tempo de primeiro retorno a E e dado por


(0) = 1

(x) = k + 1 se x (1/(k + 1), 1/k] com k 1.

Ent
ao a transformacao de primeiro retorno a E e dada por
g(0) = 0 e

g(x) = 1/x k se x (1/(k + 1), 1/k] com k 1.

Em outras palavras, g e a transformacao de Gauss. Vimos na Secao 1.3.2 que


a transformacao de Gauss admite uma probabilidade invariante equivalente `a
medida de Lebesgue em [0, 1). Segue, usando as ideias que apresentaremos na
proxima secao, que a transformacao original f admite uma medida (infinita)
invariante equivalente `
a medida de Lebesgue em [0, ).


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

24

1.4.2

Transformac
oes induzidas

Na direcao contr
aria, dada uma medida invariante qualquer de g : E E,
podemos construir uma certa medida invariante para f : M M . Alias,
para isto g n
ao precisa ser a transformacao de primeiro retorno: a construcao
que vamos apresentar a seguir e valida para qualquer transformac
ao induzida
de f , ou seja, qualquer transformacao da forma
g : E E,

g(x) = f (x) (x),

(1.4.4)

onde : E N e uma funcao mensuravel (basta que esteja definida num subconjunto com medida total em E). Como antes, denotamos por Ek o conjunto
dos x E tais que (x) = k. Ent
ao definimos:
(B) =

X
X

n=0 k>n

(f n (B) Ek ),

(1.4.5)

para todo conjunto mensuravel B M .


Proposi
c
ao 1.4.3.
A medida definida em (1.4.5) e invariante por f e saR
ao
tisfaz (M ) = E d. Em particular, e finita se, e somente se, a func
e integr
avel com respeito a .
Demonstrac
ao. Primeiro, provamos a invariancia de . Pela definicao (1.4.5),
X
X

 X
 X
f n (B) Ek .
f (n+1) (B) Ek =
f 1 (B) =
n=1 kn

n=0 k>n

Podemos reescrever a expressao acima como:

X

 X
 X
f k (B) Ek .
f n (B) Ek +
f 1 (B) =
n=1 k>n

(1.4.6)

k=1

A respeito da u
ltima parcela, observe que

k=1



 X

f k (B) Ek = g 1 (B) = B =
B Ek ,
k=1

uma vez que e invariante por g. Substituindo esta igualdade em (1.4.6), vemos
que

X


 X
 X
B Ek = B
f n (B) Ek +
f 1 (B) =
n=1 k>n

k=1

para todo conjunto mensuravel B E. A segunda afirmacao na proposicao e


uma consequencia direta das definicoes:
Z
X
X

X
X
X
(M ) =
(f n (M ) Ek ) =
(Ek ) =
k(Ek ) =
d.
n=0 k>n

Isto completa a demonstracao.

n=0 k>n

k=1


1.4. INDUC
AO

25

interessante analisar como esta construcao se relaciona com a construcao


E
da secao anterior quando g e a transformacao de primeiro retorno de f e a
medida e a restricao | E de alguma medida invariante de f :
Corol
ario 1.4.4. Se g e a transformac
ao de primeiro retorno de f a E, ent
ao
1. (B) = (B) = (B) para todo conjunto mensur
avel B E.
2. (B) (B) para todo conjunto mensur
avel B M .
Demonstrac
ao. Por definicao, f n (E) Ek = para todo 0 < n < k. Isto
implica que, dado qualquer conjunto mensuravel B P
E, todas as parcelas com
n > 0 na definicao (1.4.5) sao nulas. Logo, (B) = k>0 (B Ek ) = (B)
tal como afirmado na primeira parte do enunciado.
Considere qualquer conjunto mensuravel B M . Ent
ao,




B = B E + B E c = (B E) + B E c

X


(1.4.7)
=
B Ek + B E c .
k=1


Como e invariante, (B E c ) = f 1 (B) f 1 (E c ) . Ent
ao, tal como na
igualdade anterior



B E c = f 1 (B) E f 1 (E c ) + f 1 (B) E c f 1 (E c )

X


=
f 1 (B) Ek + f 1 (B) E c f 1 (E c ) .
k=2

Substituindo em (1.4.7), obtemos


1
1 X
\


 X
f n (E c ) .
B =
f n (B) Ek + f 1 (B)
n=0

n=0 k>n

Repetindo este argumento sucessivamente, obtemos que


N
N X
\


 X
f n (E c )
B =
f n (B) Ek + f N (B)
n=0 k>n

N
X

n=0 k>n

k=0

f n (B) Ek

para todo N 1.

Passando ao limite quando N , conclumos que (B) (B).


Alem disso, o teorema de Kac nos diz que,
Z
Z
d = (M ) (E0 ).
d =
(M ) =
E

Portanto, segue do Corol


ario 1.4.4 que = se, e somente se, (E0 ) = 0.


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

26

Exemplo 1.4.5 (Manneville-Pomeau). Dado d > 0, seja a o u


nico n
umero em
(0, 1) que satisfaz a(1 + ad ) = 1. Ent
ao defina f : [0, 1] [0, 1] da seguinte
forma:
f (x) = x(1 + xd ) se x [0, a] e

f (x) =

xa
se x (a, 1].
1a

O gr
afico de f est
a representado no lado esquerdo da Figura 1.3. Observe que
|f (x)| 1 em todo ponto, sendo que a igualdade ocorre apenas para x = 0.
Seja (an )n a sequencia no intervalo [0, a] definida por a1 = a e f (an+1 ) = an
para n 1. Tambem escrevemos a0 = 1. As propriedades desta sequencia sao
estudadas no Exerccio 1.4.2.
f

...

a1
a2

a3 a2 a1

a3 a2 a1

Figura 1.3: Construcao de tranformacao induzida


Agora considere a aplicacao g(x) = f (x) (x), onde
: [0, 1] N,

(x) = 1 + min{n 0 : f n (x) (a, 1]}.

Em outras palavras, (x) = k e portanto g(x) = f k (x) para todo x (ak , ak1 ].
O gr
afico de g est
a representado no lado direito da Figura 1.3. Note que a
restricao a cada intervalo (ak , ak1 ] e uma bijecao sobre (0, 1]. Um ponto crucial
e que a transformacao induzida g e expansora:
|g (x)|

1
>1
1a

para todo x [0, 1].

Pode mostrar-se, usando as ideias que desenvolveremos no Captulo 11, que g


admite uma u
nica probabilidade invariante equivalente `a medida de Lebesgue
em (0, 1]. Alem disso, a densidade de relativamente `a medida de Lebesgue
est
a limitada de zero e infinito. Ent
ao a medida f -invariante em (1.4.5) e
equivalente `
a medida de Lebesgue. Resulta (veja o Exerccio 1.4.2) que esta
medida e finita se, e somente se, d (0, 1).


1.4. INDUC
AO

1.4.3

27

Torres de Kakutani-Rokhlin

possvel e u
E
til generalizar a construcao anterior ainda mais, abrindo mao
da propria transformacao f : M M . Mais precisamente, dada uma transformacao g : E E, uma medida em E invariante por g, e uma funcao
mensuravel : E N, vamos mostrar como construir uma transformacao
f : M M e uma medida invariante por f tais que E pode ser identificado
com um subconjunto de M , g e a transformacao de primeiro retorno de f a E,
com tempo de retorno dado por , e a medida restrita a E coincide com .
Esta transformacao f e chamada torre de g com tempo . A medida e
finita se, e somente se, e integravel com respeito a . Elas sao construdas da
seguinte forma. Comecamos por definir:
M = {(x, n) : x E e 0 n < (x)}
=

k1
[
[

k=1 n=0

Ek {n}.

Ou seja, M consiste de k c
opias de cada conjunto Ek = {x E : (x) = k},
empilhadas umas sobre as outras. Chamamos cada k>n Ek {n} de n-esimo
andar de M . Veja a Figura 1.4.

...
andar k
andar k 1

...
andar 2
andar 1
E1

E2

E3

Ek

terreo

Figura 1.4: Torre de g com tempo


Em seguida definimos f : M M da seguinte forma:

(x, n + 1) se n < (x) 1
f (x, n) =
.
(g(x), 0)
se n = (x) 1
Em outras palavras, a din
amica eleva cada ponto (x, n) um andar de cada
vez, ate alcancar o andar (x) 1; a essa altura o ponto cai diretamente para
(g(x), 0), no andar terreo. O andar terreo E {0} se identifica naturalmente
com o conjunto E. Alem disso, a transformacao de primeiro retorno a E {0}
corresponde precisamente a g : E E.


CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

28

Finalmente, a medida fica definida por


| (Ek {n}) = | Ek
claro que a restricao de ao andar terreo coincide
para todo 0 n < k. E
com . Alem disso, e invariante por f e
Z

X
(M ) =
k(Ek ) =
d.
E

k=1

Isto completa a construcao da torre de Kakutani-Rokhlin.

1.4.4

Exerccios

1.4.1. Seja f : S 1 S 1 a transformacao f (x) = 2x mod Z. Mostre que


a funcao (x) = min{k 0 : f k (x) (1/2, 1)} e integravel relativamente
a medida de Lebesgue. Enuncie e prove um resultado correspondente para
`
qualquer transformacao g : S 1 S 1 de classe C 1 que esteja C 1 proxima de
f , ou seja, tal que supx {kg(x) f (x)k, kg (x) f (x)k} seja suficientemente
pequeno.
1.4.2. Considere a medida e a sequencia (an )n definidas no Exemplo 1.4.5.
Verifique que e sempre -finita. Mostre que (an )n e decrescente e converge
para zero. Alem disso, existem c1 , c2 , c3 , c4 > 0 tais que

c1 aj j 1/d c2 e c3 aj aj+1 j 1+1/d c4 para todo j.
(1.4.8)
Deduza que a medida g-invariante e finita se, e somente se, d (0, 1).

1.4.3. Seja : a aplicacao definida no espaco = {1, . . . , d}Z por


((xn )n ) = (xn+1 )n . Descreva a transformacao g de primeiro retorno ao conjunto {(xn )n : x0 = 1}.

1.4.4. [Lema de Kakutani-Rokhlin] Seja f : M M uma transformacao invertvel e seja uma medida de probabilidade invariante sem atomos tal que
(nN f n (E)) = 1 para todo E M com (E) > 0. Mostre que para todo
n 1 e todo > 0 existe um conjunto mensuravel B M tal que os iterados
B, f (B), . . . , f n1 (B) sao disjuntos dois-a-dois e o complementar da sua uniao
tem medida menor que . Em particular, isto vale para todo sistema invertvel
aperi
odico, ou seja, cujo conjunto dos pontos periodicos tem medida nula.
1.4.5. Seja f : M M uma transformacao e seja (Hj )j1 uma colecao de
subconjuntos de M tal que se x Hn ent
ao f j (x) Hnj para todo 0 j < n.
Seja H o conjunto dos pontos que pertencem a Hj para infinitos de valor de j,

ou seja, H =
k=1 j=k Hj . Para y H defina (y) = min{j 1 : y Hj }
(y)
e T (y) = f
(y). Observe que T e uma aplicacao de H em H. Alem disso,
mostre que
lim sup
n

1
#{1 j n : x Hj } > 0
n

lim inf
k

k1
1
1X
(T i (x)) .
k i=0

1.5. TEOREMAS DE RECORRENCIA


MULTIPLA

29

1.4.6. Seja f : M M uma transformacao preservando uma medida . Sejam


(Hj )j1 e : M N como no Exerccio 1.4.5. Considere a sequencia de funcoes
(n )n definida por 1 (x) = (x) e n (x) = (f n1 (x) (x)) + n1 (x) para n > 1.
Suponha que
lim sup
n

1
#{1 j n : x Hj } > 0
n

para quase todo x M .

Mostre que n+1 (x)/n (x) 1 para -quase todo ponto x M . [Observacao:
Dizemos que a sequencia (n )n e n
ao lacunar.]

1.5

Teoremas de recorr
encia m
ultipla

Vamos considerar famlias finitas de transformacoes fi : M M , i = 1, . . . , q


que comutam entre si, isto e, tais que
fi fj = fj fi

para todo i, j {1, . . . , q}.

O objetivo e mostrar que os resultados da Secao 1.2 se estendem para este


contexto: obtemos pontos que sao simultaneamente recorrentes por todas as
transformacoes.
O primeiro resultado nesta linha generaliza o teorema de recorrencia de
Birkhoff (Teorema 1.2.6):
Teorema 1.5.1 (Recorrencia m
ultipla de Birkhoff). Seja M um espaco metrico
compacto e sejam f1 , . . . , fq : M M transformac
oes contnuas que comutam
entre si. Ent
ao existe a M e existe uma sequencia (nk )k tal que
lim fink (a) = a
k

para todo i = 1, . . . , q.

(1.5.1)

A demonstracao deste teorema sera dada na Secao 1.5.1. A seguir, discutimos a seguinte generalizacao do teorema de recorrencia de Poincare:
Teorema 1.5.2 (Recorrencia m
ultipla de Poincare). Seja (M, B, ) um espaco
de probabilidade e sejam fi : M M , i = 1, . . . , q transformac
oes mensur
aveis
que preservam e que comutam entre si. Ent
ao, para qualquer conjunto E M
com medida positiva, existe n 1 tal que

E f1n (E) fqn (E) > 0.

Em outras palavras, existe algum tempo n tal que os iterados de um subconjunto com medida positiva de pontos de E retornam a E, simultaneamente
para todas as transformacoes fi , nesse momento n.
A demonstracao do Teorema 1.5.2 n
ao sera apresentada aqui; veja o livro de
Furstenberg [Fur77]. Vamos apenas mencionar algumas consequencias diretas
e, mais tarde, usaremos o teorema para provar o teorema de Szemeredi sobre
existencia de progressoes aritmeticas em subconjuntos densos dos n
umeros
inteiros.

30

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Observe, primeiramente, que o conjunto dos retornos simult


aneos e sempre
infinito. De fato, seja n qualquer iterado como no enunciado. Aplicando o
Teorema 1.5.2 ao conjunto F = E f1n (E) fqn (E), obtemos que existe
m 1 tal que
(m+n)

E f1


(E) fq(m+n) (E)


F f1m (F ) fqm (F ) > 0.

Em outras palavras, m + n tambem e um retorno simult


aneo a E, para algum
subconjunto de E com medida positiva.
Segue que, para qualquer conjunto E M com (E) > 0 e para -quase
todo ponto x E existem infinitos iterados n que sao retornos simult
aneos de x
a E, ou seja, que satisfazem fin (x) E para todo i = 1, . . . , q. De fato, suponha
que existisse um subconjunto F E com medida positiva tal que todo ponto
de F tem um n
umero finito de retornos simult
aneos a E. Por um lado, a menos
de substituir F por um subconjunto adequado, podemos supor que todos esses
retornos simult
aneos dos pontos de F ao conjunto E sao menores que um dado
k 1 fixado. Por outro lado, usando o par
agrafo anterior, existe n > k tal
que G = F f1n (F ) fqn (F ) tem medida positiva. Ora, e imediato da
definicao que n e um retorno simult
aneo a E para todo x G. Isto contradiz a
escolha de F , provando a nossa afirmacao.
Outra consequencia simples e o teorema de recorrencia m
ultipla de Birkhoff
(Teorema 1.5.1). De fato, se fi : M M , i = 1, 2, . . . , q sao transformacoes
contnuas num espaco metrico compacto que comutam entre si, ent
ao existe
alguma probabilidade invariante comum a todas essas transformacoes (este
fato sera verificado no proximo captulo, no Exerccio 2.2.2). A partir daqui
podemos argumentar exatamente como na demonstracao do Teorema 1.2.4. Ou
seja, considere qualquer base enumeravel {Uk } da topologia de M . De acordo
k Uk com mecom o par
agrafo anterior, para cada k existe um conjunto U

dida nula tal que todo ponto de Uk \ Uk tem infinitos retornos simult
aneos a
k tem medida nula e todo ponto do seu complementar e
= k U
Uk . Ent
ao U
simultaneamente recorrente, no sentido do Teorema 1.5.1.

1.5.1

Teorema de recorr
encia m
ultipla de Birkhoff

Vamos tratar o caso em que as transformacoes f1 , . . . , fq sao homeomorfismos


de M , que e suficiente para os nossos objetivos no presente captulo. O caso
geral pode ser deduzido facilmente (veja o Exerccio 2.4.7) usando a ideia de
extensao natural, que apresentaremos no proximo captulo.
O teorema pode ser reformulado do seguinte modo u
til. Considere a transformacao F : M q M q definida no espaco produto M q = M M por
F (x1 , . . . , xq ) = (f1 (x1 ), . . . , fq (xq )). Denote por q a diagonal de M d , ou seja,
o subconjunto dos pontos da forma x = (x, . . . , x). O Teorema 1.5.1 afirma,
precisamente, que existe a
q e existe (nk )k tal que
lim F nk (
a) = a
.
k

(1.5.2)

1.5. TEOREMAS DE RECORRENCIA


MULTIPLA

31

A demonstracao sera por inducao no n


umero q de transformacoes. O caso
q = 1 est
a contido no Teorema 1.2.6. A seguir, considere qualquer q 2
e suponha que o enunciado e verdadeiro para qualquer famlia formada por
q 1 homeomorfismos que comutam entre si. Vamos provar que ele tambem e
verdadeiro para a famlia f1 , . . . , fq .
Denote por G o grupo (abeliano) gerado pelos homeomorfismos f1 , . . . , fq .
Dizemos que um conjunto X M e G-invariante se g(X) X para todo g G.
Considerando tambem a inversa g 1 , vemos que isto implica g(X) = X para
todo g G. Tal como fizemos no Teorema 1.2.6, podemos usar o lema de
Zorn para concluir que existe algum conjunto X M n
ao-vazio fechado Ginvariante minimal (Exerccio 1.5.2). O enunciado do teorema n
ao e afetado se
substituirmos M por X. Portanto, n
ao constitui restricao supor que o espaco
ambiente M e minimal. Essa suposicao sera usada da seguinte forma:
Lema 1.5.3. Se M e minimal ent
ao para todo aberto n
ao-vazio U M existe
um subconjunto finito H G tal que
[
h1 (U ) = M.
hH

Demonstrac
ao. Dado qualquer x M , o fecho da orbita G(x) = {g(x) : g G}
e um subconjunto n
ao-vazio de M , fechado e G-invariante. Portanto, a hipotese
de que M e minimal implica que a orbita G(x) e densa em M . Em particular,
existe g G tal que g(x) U . Isto prova que {g 1 (U ) : g G} e uma cobertura
aberta de M . Por compacidade, segue que existe uma subcobertura finita. Essa
e, precisamente, a afirmacao no lema.
Consideraremos o produto M q munido da distancia dada por

d (x1 , . . . , xq ), (y1 , . . . , yq ) = max{d(xi , yi ) : 1 i q}.

Note que a aplicacao M q , x 7 x = (x, . . . , x) e um homeomorfismo e,


mesmo, uma isometria para esta escolha da distancia. Todo aberto U M
e q via esse homeomorfismo. Dado qualquer
corresponde a um aberto U
g G, representaremos por g : M q M q o homeomorfismo definido por
g(x1 , . . . , xq ) = (g(x1 ), . . . , g(xq )). O fato de que G e abeliano implica que g
comuta com F ; note tambem que todo g preserva a diagonal q . Ent
ao a
conclusao do Lema 1.5.3 pode ser reescrita na seguinte forma:
[
1 (U
e ) = q .
h
(1.5.3)
hH

Lema 1.5.4. Dado > 0 existem x


, y q e n 1 tais que d(F n (
x), y) < .

Demonstrac
ao. Defina gi = fi fq1 para cada i = 1, . . . , q 1. A hipotese de
que os fi comutam entre si implica que o mesmo vale para os gi . Ent
ao, pela
hipotese de inducao, existe y M e (nk )k tal que
lim gink (y) = y
k

para todo i = 1, . . . , q 1.

32

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

Denote xk = fqnk (y) e considere x


k = (xk , . . . , xk ) q . Ent
ao,
nk
F nk (
xk ) = (f1nk fqnk (y), . . . , fq1
fqnk (y), fqnk fqnk (y))
nk
= (g1nk (y), . . . , gq1
(y), y)

converge para (y, . . . , y, y) quando k . Isto prova o lema com x


= x
k ,
y = (y, . . . , y, y) e n = nk para qualquer k suficientemente grande.
Em seguida, mostraremos que o ponto y no Lema 1.5.4 e arbitrario:
Lema 1.5.5. Dados > 0 e z q existem w
q e m 1 satisfazendo
d(F m (w),
z) < .
e = bola aberta de centro z
Demonstrac
ao. Dados > 0 e z q , considere U
e raio /2. Pelo Lema 1.5.3 e pela observacao (1.5.3), podemos encontrar um
1 (U
e ), h H cobrem q . Como
conjunto finito H G tal que os conjuntos h
os elementos de G sao (uniformemente) contnuos, existe > 0 tal que
d(
x1 , x
2 ) <

x1 ), h(
x2 )) < /2 para todo h H.
d(h(

Pelo Lema 1.5.4 existem x


, y q e n 1 tais que d(F n (
x), y) < . Fixe h H
1 e

tal que y h (U ). Ent


ao,



n (
n (
y ) + d h(
y), z < /2 + /2.
d h(F
x)), z d h(F
x)), h(

x). Como h
comuta com F n , a desigualdade anterior d
Tome w
= h(
a que
n
d(F (w),
z) < , como queramos provar.
Usando o Lema 1.5.5, mostraremos que e possvel tomar x
= y no Lema 1.5.4:
Lema 1.5.6 (Bowen). Dado > 0 existem v q e k 1 com d(F k (
v ), v) < .
Demonstrac
ao. Dados > 0 e z0 q , considere as sequencias j , mj e zj ,
j 1, definidas por recorrencia da seguinte forma. Inicialmente, tome 1 = /2.
z1 ), z0 ) < 1 .
Pelo Lema 1.5.5 existem z1 q e m1 1 tais que d(F m1 (
z , z1 ) < 2 implica
Por continuidade de F m1 , existe 2 < 1 tal que d(
z ), z0 ) < 1 .
d(F m1 (
Em seguida, dado qualquer j 2:
zj ), zj1 ) < j .
Pelo Lema 1.5.5 existem zj q e mj 1 tais que d(F mj (
z , zj ) < j+1 implica
Por continuidade de F mj , existe j+1 < j tal que d(
z ), zj1 ) < j .
d(F mj (

1.5. TEOREMAS DE RECORRENCIA


MULTIPLA

33

Em particular, para quaisquer i < j,


zj ), zi ) < i+1
d(F mi+1 ++mj (

.
2

Como q e compacto, podemos encontrar i, j com i < j tais que d(


zi , zj ) < /2.
Tome k = mi+1 + + mj . Ent
ao
d(F k (
zj ), zj ) d(F k (
zj ), zi ) + d(
zi , zj ) < .
Isto completa a demonstracao do lema.
Agora estamos prontos para concluir a demonstracao do Teorema 1.5.1. Para
tal, consideremos a funcao
: q [0, ),

(
x) = inf{d(F n (
x), x
) : n 1}.

Observe que e semicontnua superiormente: dado qualquer > 0, todo ponto x


admite alguma vizinhanca V tal que (
y ) < (
x)+ para todo y V . Isso segue
imediatamente do fato de que e dada pelo nfimo de uma famlia de funcoes
contnuas. Ent
ao (Exerccio 1.5.4), admite algum ponto de continuidade a
.
Vamos mostrar que este ponto satisfaz a conclusao do Teorema 1.5.1.
Para isso, comecamos por observar que (
a) = 0. De fato, suponha que (
a)
e positivo. Ent
ao, por continuidade, existem > 0 e uma vizinhanca V de a

tais que (
y ) > 0 para todo y V . Ent
ao,
d(F n (
y ), y)

para todo y V e todo n 1.

(1.5.4)

Por outro lado, de acordo com (1.5.3), para todo x


q existe h H tal que
h(
x) V . Como as transformacoes h sao uniformemente contnuas, podemos
fixar > 0 tal que

z ), h(
w)
d(
z , w)
< d h(
< para todo h H.
(1.5.5)
Pelo Lema 1.5.6, existe n 1 tal que d(
x, F n (
x)) < . Ent
ao, usando (1.5.5) e

lembrando que F comuta com todo h,



x), F n (h(
x)) < .
d h(

Isto contradiz (1.5.4). Esta contradicao mostra que (


a) = 0, tal como afirmamos.
Em outras palavras, existe (nk )k tal que d(F nk (
a), a
) 0 quando
k . Isto significa que (1.5.2) e satisfeita e, portanto, a prova do teorema
est
a completa.

1.5.2

Exerccios

1.5.1. Mostre, por meio de exemplos, que a conclusao do Teorema 1.5.1 e falsa,
em geral, se as transformacoes fi n
ao comutam.

34

CAPITULO 1. MEDIDAS INVARIANTES E RECORRENCIA

1.5.2. Seja G o grupo abeliano gerado por homeomorfismos f1 , . . . , fq : M M


num espaco metrico compacto que comutam entre si. Mostre que existe X M
minimal para a relacao de inclusao na famlia dos fechados, G-invariantes, n
ao
vazios.
1.5.3. Mostre que se : M R e uma funcao semicontnua superiormente num
espaco metrico compacto ent
ao atinge o seu supremo, isto e, existe p M tal
que (p) (x) para todo x M .
1.5.4. Mostre que se : M R e uma funcao semicontnua (superiormente ou
inferiormente) num espaco metrico compacto ent
ao o conjunto dos pontos de
continuidade de contem uma intersecao enumeravel de subconjuntos abertos
e densos de M . Em particular, o conjunto dos pontos de continuidade e denso
em M .
1.5.5. Seja f : M M uma transformacao mensuravel preservando uma medida finita . Dado k 1 e A M com medida positiva, mostre que para quase
todo x A existe n 1 tal que f jn (x) A para todo 1 j k.
1.5.6. Sejam f1 , . . . , fq : M M homeomorfismos de um espaco metrico compacto que comutam entre si. Por definicao, o conjunto n
ao errante (f1 , , fq )
e o conjunto dos pontos x M tais que para toda vizinhanca U de x existem
n
n1 , . . . , nq 1 tais que f1n1 fq q (U ) intersecta U . Prove que (f1 , , fq ) e
um compacto, n
ao-vazio.

Captulo 2

Exist
encia de Medidas
Invariantes
Neste captulo provaremos o seguinte resultado, que garante a existencia de
medidas invariantes para uma classe muito ampla de transformacoes:
Teorema 2.1 (Existencia de medidas invariantes). Seja f : M M uma
transformac
ao contnua num espaco metrico compacto. Ent
ao existe pelo menos
uma medida de probabilidade em M que e invariante por f .
O ponto principal na demonstracao e considerar uma certa topologia no conjunto M1 (M ) das medidas de probabilidade em M , que chamamos de topologia
fraca . A ideia e que duas medidas sao consideradas proximas se as integrais
que elas d
ao a (muitas) funcoes contnuas limitadas est
ao proximas. A definicao
precisa e as propriedades da topologia fraca serao apresentadas na Secao 2.1.
A propriedade crucial, que torna esta topologia t
ao u
til para provar o teorema
de existencia, e que ela faz de M1 (M ) um espaco compacto (Teorema 2.1.5).
A demonstracao do Teorema 2.1 sera dada na Secao 2.2. Tambem veremos,
por meio de exemplos, que as hipoteses de continuidade e compacidade n
ao
podem ser omitidas.
Na Secao 2.3 vamos inserir a construcao da topologia fraca numa perspectiva mais ampla de Analise Funcional e tambem aproveitaremos a oportunidade
para introduzir a nocao de operador de Koopman de uma transformacao, que
sera muito u
til a seguir. Em particular, ele nos permite usar ferramentas de
Analise Funcional para dar uma demonstracao alternativa do Teorema 2.1, como
veremos.
Na Secao 2.4 descreveremos construcoes explcitas de medidas invariantes
para duas classes importantes de sistemas: produtos semi-diretos e extensoes
naturais (ou limites inversos) de transformacoes n
ao invertveis.
Finalmente, na Secao 2.5 discutiremos algumas aplicacoes importantes da
ideia de recorrencia m
ultipla (Secao 1.5) no ambito da Aritmetica Combinatorica. O Teorema 2.1.5 tem um papel importante nos argumentos e essa e a raz
ao
de termos adiado esta discuss
ao para o presente captulo.
35

36

2.1

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Topologia fraca

Nesta secao M sempre sera um espaco metrico. O nosso objetivo e definir a


topologia fraca no conjunto M1 (M ) das medidas borelianas de probabilidade
em M e discutir as suas propriedades principais.
Representamos por d(, ) a funcao distancia em M e por B(x, ) a bola de
centro x M e raio > 0. Dado B M , denotamos d(x, B) = inf{d(x, y) :
y B} e chamamos -vizinhanca de B ao conjunto B dos pontos x M tais
que d(x, B) < .

2.1.1

Definic
ao e propriedades da topologia fraca

Dada uma medida M1 (M ), um conjunto finito = {1 , . . . , N } de funcoes


contnuas limitadas i : M R e um n
umero > 0, definimos
Z
Z



V (, , ) = { M1 (M ) :
i d i d < para todo i}. (2.1.1)

Note que a intersecao de dois quaisquer conjuntos desta forma contem algum
conjunto desta forma. Isto assegura que a famlia {V (, , ) : , } pode ser
tomada como base de vizinhancas de cada M1 (M ).
A topologia fraca e a topologia definida por estas bases de vizinhancas. Em
outras palavras, os abertos da topologia fraca sao os conjuntos A M1 (M )
tais que para todo elemento A existe algum V (, , ) contido em A.
Observe que esta topologia depende apenas da topologia de M e n
ao da sua
distancia. Observe tambem que ela e Hausdorff: a Proposicao A.3.3 implica
que se e sao probabilidades distintas ent
ao existe > 0 e alguma funcao
contnua limitada : M R tal que V (, {}, ) V (, {}, ) = .

Lema 2.1.1. Uma sequencia (n )nN converge para uma medida M1 (M )


na topologia fraca se, e somente se,
Z
Z
dn d para toda func
ao contnua limitada : M R.

Demonstrac
ao. Para provar a parte somente se, considere qualquer funcao
contnua limitada e forme o conjunto = {}. Como (n )n , temos que
dado qualquer > 0 existe uma ordem n
tal que n V (, , ) para todo
nn
. Mas isto significa, precisamente, que
Z
Z


dn d < para todo n n
.

R
R
Em outras palavras, a sequencia
d.
R ( dn )n converge para
R
A recproca afirma que se ( dn )n converge para d, para toda funcao
contnua limitada ent
ao, dados quaisquer e existe uma ordem a partir da
qual n V (, , ). Para verificar esse fato, escrevemos = {1 , . . . , N }. A
hip
otese garante que para cada i existe n
i tal que
Z
Z


i dn i d < para todo n n
i .

2.1. TOPOLOGIA FRACA

37

Tomando n
= max{
n1 , . . . , n
N }, temos n V (, , ) para todo n n
.

2.1.2

Teorema Portmanteau

Vamos agora discutir outras maneiras u


teis de definir a topologia fraca . De
fato, nas relacoes (2.1.3), (2.1.4), (2.1.5) e (2.1.2) apresentaremos outras escolhas naturais de vizinhancas de uma probabilidade M1 . Em seguida,
no Teorema 2.1.2, provaremos que todas estas escolhas d
ao origem `a mesma
topologia em M1 (M ), que e a topologia fraca .
Uma variacao direta da definicao da topologia fraca e obtida tomando como
base de vizinhancas a famlia de conjuntos
Z
Z


V (, , ) = { M1 (M ) : i d i d < para todo i}. (2.1.2)
onde > 0 e = {1 , . . . , N } e uma famlia finita de funcoes Lipschitz. A
proxima definicao e formulada em termos dos fechados de M . Dada qualquer
famlia finita F = {F1 , . . . , FN } de fechados de M e dado qualquer > 0,
considere
Vf (, F , ) = { M1 : (Fi ) < (Fi ) + para todo i}.

(2.1.3)

A construcao seguinte e analoga, apenas substituindo fechados por abertos.


Dada qualquer famlia finita A = {A1 , . . . , AN } de abertos de M e dado qualquer
> 0, considere
Va (, A, ) = { M1 : (Ai ) > (Ai ) para todo i}.

(2.1.4)

Chamamos conjunto de continuidade de qualquer conjunto boreliano B cujo


bordo B tem medida nula para . Dada uma famlia finita B = {B1 , . . . , BN }
de conjuntos de continuidade de e dado qualquer > 0, considere
Vc (, B, ) = { M1 : |(Bi ) (Bi )| < para todo i}.

(2.1.5)

Dadas duas topologias T1 e T2 num mesmo conjunto, dizemos que T1 e mais


fraca que T2 (ou T2 e mais forte que T1 ) se todo subconjunto que e aberto para
T1 tambem e aberto para T2 . Dizemos que as duas topologias sao equivalentes
se elas contem exatamente os mesmos abertos.
Teorema 2.1.2. As topologias definidas pelas bases de vizinhancas (2.1.1),
(2.1.3), (2.1.4), (2.1.5) e (2.1.2) s
ao todas equivalentes.
claro que a topologia (2.1.2) e mais fraca que a topologia
Demonstrac
ao. E
(2.1.1), j
a que toda funcao Lipschitz e contnua.
Para mostrar que a topologia (2.1.3) e mais fraca que a topologia (2.1.2),
considere qualquer famlia finita F = {F1 , . . . , FN } de subconjuntos fechados de
M . De acordo com o Lema A.3.4, para cada > 0 e cada i, existe uma funcao
Lipschitz i : M [0, 1] tal que XFi i XFi . Observe que Fi = Fi ,


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

38

porque Fi e fechado, e portanto (Fi ) (Fi ) quando 0. Fixe > 0


suficientemente pequeno para que (Fi ) < /2 para todo i. Seja o conjunto
das funcoes 1 , . . . , N obtidas deste modo. Observe que
Z
Z


i d i d < /2 (Fi ) (Fi ) < /2 (Fi ) (Fi ) +
para todo i. Em outras palavras, V (, , /2) est
a contido em Vf (, F , ).

E f
acil ver que as topologias (2.1.3) e (2.1.4) sao equivalentes. De fato, seja
F = {F1 , . . . , Fn } uma famlia finita de fechados e seja A = {A1 , . . . , AN }, onde
claro que
cada Ai e o complementar de Fi . E
Vf (, F , ) = { M1 : (Fi ) < (Fi ) + para todo i}

= { M1 : (Ai ) > (Ai ) para todo i} = Va (, A, ).

Em seguida, vamos mostrar que a topologia (2.1.5) e mais fraca que as


topologias equivalentes (2.1.3) e (2.1.4). Dada qualquer famlia finita B =
{B1 , . . . , BN } de conjuntos de continuidade de seja, para cada i, Fi o fecho e Ai o interior de Bi . Denote F = {F1 , . . . , FN } e A = {A1 , . . . , AN }.
Como (Fi ) = (Bi ) = (Ai ),
(Fi ) < (Fi ) + (Bi ) < (Bi ) +

(Ai ) > (Ai ) (Bi ) > (Bi )


para todo i. Isto significa que Vf (, F , )Va (, A, ) est
a contido em Vc (, B, ).
Finalmente, provemos que a topologia (2.1.1) e mais fraca que a topologia (2.1.5). Seja = {1 , . . . , N } uma famlia finita de funcoes contnuas
limitadas. Fixemos um inteiro tal que sup |i (x)| < para todo i. Para
cada i, as pre-imagens 1
ao disjuntas duas-a-duas. Portanto,
i (s), s [, ] s
1
(s)
=
0
exceto
para
um
conjunto
enumer
avel de valores de s. Em partii
cular, podemos escolher k N e pontos = t0 < t1 < < tk1 < tk = tais
que tj tj1 < /2 e ({1
ao cada
i (tj )}) = 0 para todo j. Ent
Bi,j = 1
i ((tj1 , tj ])

e conjunto de continuidade para . Alem disso,


Z
k
k
k
X
X
X
tj (Bi,j ) /2
tj1 (Bi,j ) >
tj (Bi,j ) i d
j=1

j=1

j=1

e valem desigualdades analogas para as integrais relativamente a . Segue que


Z
Z
k

X
i d i d
|(Bi,j ) (Bi,j )| + /2
(2.1.6)
j=1

ao a relacao
para todo i. Denote B = {Bi,j : i = 1, . . . , N e j = 1, . . . , k}. Ent
(2.1.6) implica que Vc (, B, /(2k)) est
a contido em V (, , ).
Veremos no Exerccio 2.1.3 que a topologia fraca em M1 (M ) e separ
avel
sempre que o espaco metrico M e separ
avel. Na proxima secao vamos mostrar
que, nas mesmas condicoes, ela tambem e metriz
avel.

2.1. TOPOLOGIA FRACA

2.1.3

39

A topologia fraca
e metriz
avel

Agora suponha que o espaco metrico M e separ


avel. Ent
ao M1 (M ) munido
da topologia fraca e um espaco separ
avel (Exerccio 2.1.3). Nesta secao vamos
mostrar que esse espaco tambem e metriz
avel: e possvel exibir distancias em
M1 (M ) que induzem a topologia fraca .
Dados , M1 (M ), defina D(, ) como sendo o nfimo de todos os
n
umeros > 0 tais que
(B) < (B ) +

e (B) < (B ) +

para todo boreliano B.

(2.1.7)

Lema 2.1.3. A func


ao D e uma dist
ancia em M1 (M ).
Demonstrac
ao. Comecemos por mostrar que se D(, ) = 0 ent
ao = . De
fato, a hip
otese implica que
e
(B) (B)

(B) (B)

representa o fecho. Quando


para todo subconjunto boreliano B M , onde B
B e um fechado estas desigualdades significam que (B) = (B). Como vimos anteriormente, duas medidas que coincidem nos subconjuntos fechados sao
necessariamente iguais.
Deixamos a verificacao das demais condicoes na definicao de distancia ao
cuidado do leitor (Exerccio 2.1.5).
Esta distancia e denominada metrica de Levy-Prohorov. No que segue representaremos por BD (, r) a bola relativamente a D com centro em M1 (M )
e raio r > 0.
Proposi
c
ao 2.1.4. Se M e espaco metrico separ
avel ent
ao a topologia induzida
pela dist
ancia D coincide com a topologia fraca em M1 (M ).
Demonstrac
ao. Seja > 0 e seja F = {F1 , . . . , FN } uma famlia finita de fechados de M . Fixe (0, /2) tal que (Fi ) < (Fi ) + /2 para todo i. Se
BD (, ) ent
ao
(Fi ) < (Fi ) + < (Fi ) + para todo i,
o que significa que Vf (, F , ). Isto mostra que a topologia induzida pela
distancia D e mais forte que a topologia (2.1.3) a qual, como vimos anteriormente, e equivalente `
a topologia fraca .
Resta provar que se M e separ
avel ent
ao a topologia fraca e mais forte que
a topologia induzida por D. Dado > 0, fixemos (0, /3). Para isso, seja
{p1 , p2 , . . . } um subconjunto enumeravel denso de M . Para cada j, as esferas
B(pj , r) {x : d(x, pj ) = r}, r > 0 sao disjuntas duas-a-duas. Portanto, e
possvel encontrar r > 0 arbitrariamente pequeno tal que (B(pj , r)) = 0 para
todo j. Fixemos um tal r, com r (0, /3). A famlia {B(pj , r) : j = 1, 2, . . . } e
uma cobertura enumer
avel de M por conjuntos de continuidade de . Fixemos
k 1 tal que o conjunto U = kj=1 B(pj , r) satisfaz

U > 1 .
(2.1.8)


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

40

Em seguida, consideremos a particao (finita) P de U definida pela famlia


{B(pj , r) : j = 1, . . . , k}: os elementos de P sao os conjuntos maximais P U
tais que, para cada j, ou P est
a contido em B(pj , r) ou P e disjunto de B(pj , r).
Veja a Figura 2.1. Em seguida, seja E a famlia de todos as unioes finitas de
elementos de P. Note que o bordo de todo elemento de E est
a contido na uniao
dos bordos dos B(pj , r), 1 j k e, consequentemente, tem medida nula. Ou
seja, todo elemento de E e conjunto de continuidade de .

Figura 2.1: Particao definida por uma cobertura


Se Vc (, E, ) ent
ao
|(E) (E)| <

para todo E E.

Em particular, (2.1.8) juntamente com (2.1.9) implicam que



U > 1 2.

(2.1.9)

(2.1.10)

Agora, dado um subconjunto boreliano B qualquer, denote por EB a uniao dos


elementos de P que intersectam B. Ent
ao EB B e portanto a relacao (2.1.9)
d
a que
|(EB ) (EB )| < .

Observe que B est


a contido em EB U c . Alem disso, EB B porque todo
elemento de P tem diametro menor que 2r < . Estes fatos, juntamente com
(2.1.8) e (2.1.10) implicam que
(B) (EB ) + < (EB ) + 2 (B ) + 2

(B) (EB ) + 2 < (EB ) + 3 (B ) + 3.

Como 3 < , estas relacoes implicam que BD (, ).


Pode mostrar-se que se M e espaco metrico completo separ
avel ent
ao a
metrica de Levy-Prohorov em M1 (M ) e completa (e separ
avel, de acordo com o
Exerccio 2.1.3). Veja, por exemplo, o Teorema 6.8 do livro de Billingsley [Bil68].

2.1.4

A topologia fraca
e compacta

Nesta secao suporemos que o espaco metrico M e compacto. Vamos provar o


seguinte fato:

2.1. TOPOLOGIA FRACA

41

Teorema 2.1.5. O espaco M1 (M ) munido da topologia fraca e compacto.


Como j
a sabemos que M1 (M ) e metriz
avel, basta provar o seguinte:
Proposi
c
ao 2.1.6. Toda sequencia (k )kN em M1 (M ) admite alguma subsequencia que e convergente na topologia fraca .
Demonstrac
ao. Seja {n : n N} um subconjunto enumeravel denso na bola
unit
aria de C 0 (MR) (lembre do Teorema A.3.13). Para cada n N, a sequencia
de n
umeros reais n dk , k N e limitada por 1. Portanto, para cada n N
existe uma sequencia (kjn )jN tal que
Z
n dkjn converge para algum n
umero n R quando j .

Alem disso, cada sequencia (kjn+1 )jN pode ser escolhida como subsequencia da
anterior (kjn )jN . Definamos j = kjj para cada j N. Por construcao, (j )jN
e uma subsequencia de (kjn )jN a menos de um n
umero finito de termos. Logo
Z

n dj
n para todo n N.
j

Daqui se deduz facilmente que


() = lim
j

dj existe

(2.1.11)

para toda funcao C 0 (M ). De fato, suponha primeiro que est


a na bola
unit
aria de C 0 (M ). Dado qualquer > 0 podemos encontrar n N tal que
k n k . Ent
ao
Z
Z


dj n dj
para todo j. Como

n dj converge (para n ), segue que


Z
Z
lim sup dj lim inf dj 2.
j

R
Como e arbitrario, conclumos que limj dj existe. Isto prova (2.1.11)
quando a funcao est
a na bola unit
aria. O caso geral reduz-se imediatamente a
esse, substituindo por /kk. Assim, completamos a prova de (2.1.11).
Finalmente, e claro que o operador : C 0 (M ) R definido por (2.1.11)
e linear e positivo: () min 0 sempre que 0 em todo ponto.
Alem disso, (1) = 1. Logo, pelo Teorema
A.3.11, existe alguma probabilidade
R
boreliana em M tal que () = d para toda funcao contnua . Agora
a igualdade em (2.1.11) pode ser reescrita
Z
Z
d = lim dj para toda C 0 (M ).
j

De acordo com o Lema 2.1.1, isto quer dizer que a subsequencia (j )jN converge para na topologia fraca .


CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

42

Conforme observamos anteriormente, o Teorema 2.1.5 e uma consequencia


imediata da proposicao que acabamos de demonstrar.

2.1.5

Teorema de Prohorov

O teorema que vamos enunciar nesta secao d


a um criterio muito geral para
compacidade de uma famlia de medidas de probabilidade. De fato, a classe de
espacos metricos M a que ele se aplica inclui praticamente todos os exemplos
interessantes.
Defini
c
ao 2.1.7. Um conjunto M de medidas num espaco topologico e justo
se para todo > 0 existe um subconjunto compacto K tal que (K c ) < para
toda medida M.
Note que quando M se reduz a uma u
nica medida esta definicao corresponde
exatamente `
a Definicao A.3.6. Claramente, esta propriedade e hereditaria: se
um conjunto e justo ent
ao todo subconjunto dele tambem e justo. Note tambem
que se M e um espaco metrico compacto ent
ao o espaco M1 (M ) de todas as
medidas de probabilidade constitui um conjunto justo. Portanto o resultado a
seguir generaliza o Teorema 2.1.5:
Teorema 2.1.8 (Prohorov). Seja M um espaco metrico separ
avel completo.
Um conjunto K M1 (M ) e justo se, e somente se, toda sequencia em K possui
alguma subsequencia convergente em M1 (M ).
Demonstrac
ao. Vamos provar apenas a condicao necessaria, que e a parte mais
u
til do enunciado. No Exerccio 2.1.8 convidamos o leitor a provar a recproca.
Suponha que K e justo. Considere uma sequencia crescente (Kl )l de subconjuntos compactos de M tais que (Klc ) 1/l para todo l e todo K. Fixe
uma sequencia qualquer (n )n em K. Afirmamos, inicialmente, que para cada l
existe uma subsequencia (nj )j e existe uma medida l em M tal que l (Klc ) = 0
e (nj | Kl )j converge para l , no sentido de que
Z
Z
dl para toda funcao contnua : Kl R. (2.1.12)
dnj
Kl

Kl

Este fato e uma consequencia simples do Teorema 2.1.5: a menos de restringir


a uma subsequencia, podemos supor que o limite bl = limn n (Kl ) existe (note
que 1 bl 1 1/l); segue
 do teorema que a sequencia de restricoes normalizadas (n | Kl )/n (Kl ) n admite subsequencia convergente para alguma
probabilidade l M1 (Kl ); para concluir a prova da afirmacao basta tomar
considerar l uma probabilidade em M , com l (Klc ) = 0, e tomar l = bl l .
Em seguida, usando um argumento diagonal analogo ao da Proposicao 2.1.6,
podemos escolher a subsequencia (nj )j de tal forma que (2.1.12) vale, simultaneamente, para todo l 1. Observe que a sequencia (l )l e mon
otona n
ao
decrescente: dados k > l e qualquer funcao contnua : M [0, 1],
Z
Z
Z
Z
dl = lim
dnj lim
dnj = dk .
j

Kl

Kk

2.1. TOPOLOGIA FRACA

43

Analogamente, para quaisquer k > l e qualquer funcao contnua : M [0, 1],


Z
Z
Z
dk dl = lim
dnj lim sup nj (Klc ) 1/l.
j

Kk \Kl

Usando o Exerccio A.3.5, podemos traduzir estes fatos em termos de medidas


de conjuntos: para todo k > l e todo boreliano E M ,
l (E) k (E) l (E) + 1/l.

(2.1.13)

Defina (E) = liml l (E) para cada boreliano E. Afirmamos que e uma
imediato da definicao que () = 0 e que e aditiva.
probabilidade em M . E
Alem disso, (M ) = liml (Kl ) = liml bl = 1. Para mostrar que e -aditiva,
usaremos o criterio da continuidade no vazio. Considere qualquer sequencia
decrescente (Bn )n de borelianos de M com n Bn = . Dado > 0, escolha l
tal que 1/l < . Como l e -aditiva, o Teorema A.1.14 d
a que l (Bn ) < para
todo n suficientemente grande. Logo, (Bn ) l (Bn ) + 1/l < 2 para todo
n suficientemente grande. Isto prova que ((Bn ))n converge para zero e, pelo
Teorema A.1.14, segue que e realmente -aditiva.
A definicao de implica (veja o Exerccio 2.1.1 ou o Exerccio 2.1.4) que
(l )l converge para na topologia fraca . Portanto,
dado
R
R > 0 e dada uma
funcao contnua limitada : M R qualquer, | dl d| < para todo
l suficientemente grande. Fixe l satisfazendo tambem sup ||/l < . Ent
ao,
Z
Z
Z
Z
Z
dl | 2
dnj
| dnj dl | |
dnj | + |
Klc

Kl

Kl

R
para todo j suficientemente grande. Isto mostra que | dnj d| < 3
sempre que j e suficientemente grande e, portanto, (nj )j converge para na
topologia fraca .

2.1.6

Exerccios

2.1.1. Seja M um espaco metrico e seja (n )n uma sequencia em M1 (M ).


Mostre que as seguintes condicoes sao todas equivalentes:
1. (n )n converge para uma probabilidade na topologia fraca .
2. lim supn n (F ) (F ) para todo fechado F M .
3. lim inf n n (A) (A) para todo aberto A M .
4. limn n (B) = (B) para todo conjunto de continuidade B de .
R
R
5. limn dn = d para toda funcao Lipschitz : M R.

2.1.2. Fixe qualquer subconjunto denso F da bola unit


aria de C 0 (M ). Mostre
que uma sequencia (n )nN de probabilidades em M converge na topologia
fraca para alguma M1 (M ) se, e somente se,
Z
Z
dn converge para
d, para todo F .

44

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

2.1.3. Mostre que o conjunto das medidas com suporte finito e denso em
M1 (M ), relativamente `a topologia fraca . Supondo que o espaco metrico M e
separ
avel, conclua que M1 (M ) tambem e separ
avel.
2.1.4. A topologia uniforme em M1 (M ) e definida pelo sistema de vizinhancas
Vu (, ) = { M1 (M ) : |(B) (B)| < para todo B B}
e a topologia pontual e definida pelo sistema de vizinhancas
Vp (, B, ) = { M1 (M ) : |(Bi ) (Bi )| < para i}
onde > 0, n 1 e B = {B1 , . . . , BN } e uma famlia finita de conjuntos
mensuraveis. Verifique que a topologia uniforme e mais forte que a topologia
pontual a qual, por sua vez, e mais forte que a topologia fraca . Mostre, por
meio de exemplos, que essas relacoes podem ser estritas.
2.1.5. Complete a demonstracao do Lema 2.1.3.
2.1.6. Sejam Vk , k = 1, 2, . . . variaveis aleat
orias reais, ou seja, funcoes mensur
aveis Vk : (X, B, ) R em algum espaco de probabilidade (X, B, ). A
func
ao de distribuic
ao de Vk e a funcao mon
otona Fk : R [0, 1] definida por
Fk (a) = ({x X : Vk (x) a}). Diz-se que (Vk )k converge em distribuic
ao
para uma variavel aleat
oria V se limk Fk (a) = F (a) para todo ponto de continuidade a da funcao de distribuicao F da variavel aleat
oria V . O que isto tem
que ver com a topologia fraca ?
2.1.7. Seja (n )nN uma sequencia de probabilidades convergindo para uma
probabilidade na topologia fraca . Seja B um conjunto de continuidade para
com (B) > 0. Mostre que as restricoes normalizadas (n | B)/n (B) convergem para a restricao normalizada ( | B)/(B) quando n . O que pode
ser dito se substituirmos conjunto de continuidade por subconjunto fechado, ou
por subconjunto aberto?
2.1.8. (Recproca do teorema de Prohorov) Mostre que se K M1 (M ) e tal
que toda sequencia em K admite alguma subsequencia convergente em M1 (M ),
ent
ao K e justo.

2.2

Demonstrac
ao do teorema de exist
encia

Comecemos por introduzir uma notacao u


til. Dado f : M M e qualquer
medida em M denota-se por f e chama-se
 iterado (ou imagem) de por
f a medida definida por f B = f 1 (B) para cada conjunto mensuravel
B M . Note que e invariante por f se, e somente se, f = .
Lema 2.2.1. Sejam uma medida e uma func
ao mensur
avel limitada. Ent
ao
Z
Z
df = f d.
(2.2.1)

DO TEOREMA DE EXISTENCIA

2.2. DEMONSTRAC
AO

45

Demonstrac
ao. Se e a funcao caracterstica de um conjunto mensuravel B
ent
ao a relacao (2.2.1) significa que f (B) = (f 1 (B)), o que e verdade por
definicao. Pela linearidade da integral, segue que (2.2.1) vale sempre que e
uma funcao simples. Finalmente, como toda funcao mensuravel limitada pode
ser aproximada uniformemente por funcoes simples (veja a Proposicao A.1.33),
segue que a conclusao do lema e verdadeira em geral.
Proposi
c
ao 2.2.2. A aplicac
ao f : M1 (M ) M1 (M ) e contnua relativamente `
a topologia fraca .
Demonstrac
ao. Seja > 0 e = {1 , . . . , n } uma famlia qualquer de funcoes
contnuas limitadas. Como f e contnua, a famlia = {1 f, . . . , n f }
tambem consiste de funcoes contnuas limitadas. Pelo lema anterior,
Z
Z
Z
Z
| i d(f ) i d(f )| = | (i f ) d (i f ) d|
e portanto o lado esquerdo e menor que se o lado direito for menor que . Isto
quer dizer que

f V (, , ) V (f , , )) para todo , e
e este u
ltimo fato mostra que f e contnua.

A esta altura, o Teorema 2.1 pode ser deduzido de um resultado classico


sobre operadores contnuos em espacos vetoriais topologicos, conhecido como
teorema do ponto fixo de Schauder-Tychonoff.
Um espaco vetorial topol
ogico e um espaco vetorial V munido de uma topologia relativamente `
a qual as duas operacoes (adicao de vetores e produto de
um vetor por um escalar) sao contnuas. Um conjunto K V diz-se convexo se
(1 t)x + ty K para todo x, y K e todo t [0, 1].
Teorema 2.2.3 (Schauder-Tychonoff). Seja F : V V uma transformac
ao
contnua num espaco vetorial topol
ogico V . Suponha que existe um conjunto
compacto convexo K V tal que F (K) K. Ent
ao F (v) = v para algum
v K.
O Teorema 2.1 corresponde ao caso em que V = M(M ) e o espaco das
medidas complexas, K = M1 (M ) e o espaco das probabilidades em M , e F = f
e a acao de f em M(M ).
No entanto, a situacao do Teorema 2.1 e bem mais simples do que o caso
geral do teorema de Schauder-Tychonoff, porque o operador f alem de ser
contnuo tambem e linear. Isso permite dar uma demonstracao direta e elementar do Teorema 2.1, que tambem tem a vantagem de fornecer alguma informacao
adicional sobre a medida invariante.
Para fazer isso, seja uma probabilidade qualquer em M : por exemplo, a
medida de Dirac em um ponto qualquer. Forme a sequencia de probabilidades
n =

n1
1X j
f
n j=0

(2.2.2)

46

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

onde fj e a imagem de pelo iterado f j . Pelo Teorema 2.1.5, esta sequencia


tem algum ponto de acumulacao, ou seja, existe alguma subsequencia (nk )kN
e alguma probabilidade M1 (M ) tais que
nk 1
1 X
fj
nk j=0

(2.2.3)

na topologia fraca . Agora e suficiente provar o seguinte:


Lema 2.2.4. Todo ponto de acumulac
ao de uma sequencia (n )nN do tipo
(2.2.2) e uma probabilidade invariante por f .
Demonstrac
ao. A relacao (2.2.3) afirma que dada uma famlia = {1 , . . . , n }
de funcoes contnuas limitadas e para todo > 0 tem-se
Z
k 1 Z
1 nX

j

(i f ) d i d < /2
nk j=0

(2.2.4)

para todo i e todo k suficientemente grande. Pelo Lema 2.2.2, temos que
f = f lim
k

nk 1
nk

1 X
1 X
fj = lim
fj .
k nk
nk j=0
j=1

(2.2.5)

Agora observe que


nk Z
k 1 Z

1 nX
1 X
j

(i f ) d
(i f j ) d
nk j=0
nk j=1
Z
Z

1
2
=
sup |i |
i d (i f nk ) d
nk
nk

e esta u
ltima expressao e menor que /2 para todo i e todo k suficientemente
grande. Juntando este fato com (2.2.4), conclumos que
Z
nk Z
1 X


(i f j ) d i d <
nk j=1

(2.2.6)

para todo i e todo k suficientemente grande. Isto significa que


nk
1 X
fj
nk j=1

quando k . Mas (2.2.5) significa que esta mesma sequencia converge para
f . Por unicidade do limite, segue que f = .
Agora a demonstracao do Teorema 2.1 est
a completa. Os exemplos simples
a seguir mostram que nenhuma das duas hipoteses do teorema, continuidade e
compacidade, pode ser omitida.

DO TEOREMA DE EXISTENCIA

2.2. DEMONSTRAC
AO

47

Exemplo 2.2.5. Considere f : (0, 1] (0, 1] dada por f (x) = x/2. Suponha
que f admite alguma probabilidade invariante; o objetivo e mostrar que isso
n
ao acontece. Pelo teorema de recorrencia (Teorema 1.2.4), relativamente a
essa probabilidade quase todo ponto de (0, 1] e recorrente. Mas e imediato que
n
ao existe nenhum ponto recorrente: a orbita de qualquer x (0, 1] converge
para zero e, em particular, n
ao acumula no ponto inicial x. Portanto, f e um
exemplo de transformacao contnua num espaco n
ao compacto que n
ao admite
nenhuma probabilidade invariante.
Exemplo 2.2.6. Modificando um pouco o exemplo, podemos mostrar que o
mesmo fenomeno pode ocorrer em espacos compactos, se a transformacao n
ao e
contnua. Considere f : [0, 1] [0, 1] dada por f (x) = x/2 se x 6= 0 e f (0) = 1.
Pela mesma raz
ao que antes, nenhum ponto x (0, 1] e recorrente. Portanto,
se existe alguma probabilidade invariante ela tem que dar peso total ao u
nico
ponto recorrente, que e x = 0. Em outras palavras, precisa ser a medida de
Dirac 0 suportada em zero, que e definida por
0 (E) = 1 se 0 E

0 (E) = 0 se 0
/ E.

Mas a medida 0 n
ao e invariante por f : tomando E = {0} temos que E tem
medida 1 mas a sua pre-imagem f 1 (E) e o conjunto vazio, que tem medida
nula. Portanto, esta transformacao tambem n
ao tem nenhuma probabilidade
invariante.
O nosso terceiro exemplo e de natureza um pouco diferente:
Exemplo 2.2.7. Consideremos f : [0, 1] [0, 1] dada por f (x) = x/2. Trata-se
de uma transformacao contnua num espaco compacto. Logo, pelo Teorema 2.1,
ela admite alguma probabilidade invariante. Pelos mesmos argumentos que
usamos no caso anterior, se conclui que de fato h
a uma u
nica probabilidade
invariante, que e a medida de Dirac 0 suportada no ponto zero. Note que neste
caso a medida 0 e de fato invariante.
Mencionamos este u
ltimo caso para enfatizar as limitacoes do Teorema 2.1
(que sao inerentes `
a sua grande generalidade): as medidas que ele garante existirem podem ser completamente triviais; por exemplo, neste caso quando falamos
de quase todo pontoestamos nos referindo apenas ao ponto x = 0. Por isso,
um objetivo importante em Teoria Erg
odica e encontrar medidas invariantes
mais sofisticadas, com propriedades adicionais (por exemplo, serem equivalentes `a medida de Lebesgue) que as tornem mais interessantes.
Como uma aplicacao imediata do Teorema 2.1, temos a seguinte demonstracao alternativa do teorema de recorrencia de Birkhoff (Teorema 1.2.6). Suponha
que f : M M e uma transformacao contnua num espaco metrico compacto.
Pelo Teorema 2.1, existe alguma probabilidade f -invariante . Por outro lado,
todo espaco metrico compacto admite uma base enumeravel de abertos. Portanto, podemos aplicar o Teorema 1.2.4, para concluir que -quase todo ponto
e recorrente. Em particular, o conjunto dos pontos recorrentes e n
ao vazio, tal
como afirma o Teorema 1.2.6.

48

2.2.1

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Exerccios

2.2.1. Prove a seguinte generalizacao do Lema 2.2.4. Seja f : M M uma


transformacao contnua num espaco metrico compacto, uma probabilidade
em M e (In )n uma sequencia de intervalos de n
umeros naturais tais que #In
converge para infinito quando n vai para infinito. Ent
ao qualquer ponto de
acumulacao da sequencia
1 X j
n =
f
#In
jIn

e uma probabilidade f -invariante.

2.2.2. Seja f1 , . . . , fq : M M uma famlia finita qualquer de transformacoes


contnuas num espaco metrico compacto que comutam entre si. Prove que
existe alguma medida de probabilidade que e invariante por fi para todo
i {1, . . . , q}. Alem disso, a conclusao permanece valida para qualquer famlia
infinita enumer
avel {fj : j N} de transformacoes que comutam entre si.

2.2.3. Seja f : [0, 1] [0, 1] a transformacao expansao decimal. Mostre que,


para cada k 1, existe alguma probabilidade invariante cujo suporte e formado
por exatamente k pontos (em particular, f admite infinitas probabilidades invariantes). Determine se existem probabilidades invariantes tais que
(a) o suporte de e infinito enumeravel;
(b) o suporte de e n
ao enumeravel mas tem interior vazio;

(c) o suporte de tem interior n


ao vazio mas e singular com relacao `a
medida de Lebesgue m.
2.2.4. Prove o teorema de existencia de medidas invariantes para fluxos: todo
fluxo contnuo (f t )tR num espaco metrico compacto admite alguma medida de
probabilidade invariante.
2.2.5. Mostre que a transformacao f : [1, 1] [1, 1], f (x) = 1 2x2 admite
alguma medida de probabilidade invariante equivalente `a medida de Lebesgue
no intervalo.
2.2.6. Seja f : M M uma transformacao mensuravel invertvel e seja m uma
probabilidade em M tal que m(A) = 0 se, e somente se, m(f (A)) = 0. Dizemos
que o par (f, m) e totalmente dissipativo se existe um conjunto mensuravel
W M cujos iterados f j (W ), j Z sao disjuntos dois-a-dois e a sua uniao
tem medida total. Mostre que se (f, m) e totalmente dissipativo ent
ao f admite
alguma medida invariante, -finita, equivalente `a medida m. Essa medida e
necessariamente infinita.
2.2.7. Seja f : M M uma transformacao mensuravel invertvel e seja m uma
probabilidade em M tal que m(A) = 0 se, e somente se, m(f (A)) = 0. Dizemos
que o par (f, m) e conservativo se n
ao existe conjunto mensuravel W M com
medida positiva cujos iterados f j (W ), j Z sao disjuntos dois-a-dois. Mostre
que se (f, m) e conservativo ent
ao, para todo conjunto mensuravel X M ,
m-quase todo ponto de X regressa a X infinitas vezes.

2.3. COMENTARIOS
DE ANALISE
FUNCIONAL

49

2.2.8. Suponha que (f, m) e conservativo. Mostre que f admite uma medida
invariante -finita equivalente a m se, e somente se, existem conjuntos X1
Xn com M = n Xn e m(Xn ) < para todo n, tais que a
transformacao de primeiro retorno fn a cada Xn admite uma medida invariante
n finita e absolutamente contnua com respeito `a restricao de m a Xn .
2.2.9. De exemplos de pares conservativos (f, m) tais que f n
ao admite medidas invariantes finitas equivalentes a m. [Observacao: Ornstein [Orn60] deu
exemplos em que f n
ao admite sequer medidas invariantes -finitas equivalentes
a m.]

2.3

Coment
arios de An
alise Funcional

A definicao da topologia fraca no espaco das probabilidades e um caso especial


de uma construcao geral em Analise Funcional que vamos relembrar a seguir.
Ela nos conduzir
a a introduzir uma certa isometria linear Uf do espaco L1 (),
denominada operador de Koopman do sistema (f, ). Estes operadores sao de
grande utilidade em Teoria Erg
odica pois permitem fazer uso de ferramentas
de Analise no estudo das propriedades de medidas invariantes. Para ilustrar
este fato, daremos uma demonstracao alternativa do Teorema 2.1 a partir de
propriedades espectrais do operador de Koopman.

2.3.1

Dualidade e topologias fracas

Seja E um espaco de Banach, ou seja, um espaco vetorial munido de uma norma


completa. Seja E o seu dual, isto e, o espaco dos funcionais lineares contnuos.
O dual e tambem um espaco de Banach, com a norma
kgk = sup


 |g(v)|
: v E \ {0} .
kvk

(2.3.1)

A topologia fraca no espaco E e a topologia definida pela base de vizinhancas


V (v, {g1 , . . . , gN }, ) = {w E : |gi (v) gi (w)| < para todo i},

(2.3.2)

onde g1 , . . . , gN E . Em termos de sequencias, ela satisfaz


(vn )n v

(g(vn ))n g(v) para todo g E .

A topologia fraca no dual E e a topologia definida pela base de vizinhancas


V (g, {v1 , . . . , vN }, ) = {h E : |g(vi ) h(vi )| < para todo i},
onde v1 , . . . , vN E. Ela satisfaz
(gn )n g

(gn (v))n g(v)

para todo v E.

Esta u
ltima topologia e not
avel devido ao seguinte fato:

(2.3.3)

50

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Teorema 2.3.1 (Banach-Alaoglu). A bola unit


aria fechada de E e compacta

para a topologia fraca .


A construcao que realizamos anteriormente corresponde ao caso em que E
e o espaco C 0 (M ) das funcoes contnuas e E e o espaco M(M ) das medidas complexas num espaco metrico compacto M : de acordo com o teorema de
Riesz-Markov (Teorema A.3.12) M(M ) corresponde ao dual de C 0 (M ) quando
R
identificamos cada medida M(M ) com o funcional linear I () = d.
Note que a definicao da norma (2.3.1) d
a
R
 | d|

kk = sup
: C 0 (M ) \ {0} .
sup ||

Em particular, o conjunto M1 (M ) das medidas de probabilidade est


a contido
na bola unit
aria de M(M ). Como este subconjunto e fechado na topologia
fraca , conclumos que o Teorema 2.1.5 tambem segue diretamente do teorema
de Banach-Alaoglu.
Agora consideremos uma transformacao contnua f : M M qualquer em
M e consideremos a sua acao f : M(M ) M(M ), 7 f no espaco das
medidas complexas. Ent
ao f e um operador linear em M(M ) e e contnuo
relativamente `
a topologia fraca . Existe outro operador linear contnuo naturalmente associado a f , a saber Uf : C 0 (M ) C 0 (M ), 7 f . Agora observe
que estes operadores sao duais (lembre do Lema 2.2.1):
Z
Z
Z
Uf () d = ( f ) d = d(f ).
(2.3.4)
Estas consideracoes motivam a nocao que apresentaremos na proxima secao.

2.3.2

Operador de Koopman

Sejam (M, B) um espaco mensuravel, f : M M uma transformacao mensur


avel e uma medida invariante por f . O operador de Koopman e o operador
linear
Uf : L1 () L1 (), Uf () = f.
Note que Uf est
a bem definido e e uma isometria, isto e, ele preserva a norma
do espaco L1 ():
Z
Z
Z
kUf ()k1 = |Uf ()| d = || f d = || d = kk1
(2.3.5)
uma vez que e invariante. Alem disso, Uf e um operador linear positivo:
Uf () 0 em -quase todo ponto sempre que 0 em -quase todo ponto.
Resumimos estes fatos na seguinte proposicao:
Proposi
c
ao 2.3.2. O operador Uf : L1 (M ) L1 (M ) induzido por f e linear,
positivo e uma isometria.

2.3. COMENTARIOS
DE ANALISE
FUNCIONAL

51

A propriedade (2.3.5) implica que o operador Uf e injetivo. Em geral Uf


n
ao e sobrejetivo (veja o Exerccio 2.3.5). Claro que se f e invertvel ent
ao Uf
e um isomorfismo: o inverso e o operador de Koopman Uf 1 da inversa de f .
Podemos tambem considerar versoes do operador de Koopman definidas nos
espacos Lp (),
Uf : Lp () Lp (), Uf () = f
para qualquer p [1, ]. A Proposicao 2.3.2 permanece valida em todos estes
casos: todos estes operadores sao isometrias lineares positivas.
Quando M e um espaco metrico compacto e f e contnua, e particularmente interessante observar a acao de Uf restrita ao espaco C 0 (M ) das funcoes
contnuas:
Uf : C 0 (M ) C 0 (M ).

claro que este operador e contnuo relativamente `a norma da convergencia


E
uniforme. Conforme vimos anteriormente, o dual de C 0 (M ) est
a identificado
de maneira natural com o espaco M(M ) das medidas complexas em M . Alem
disso, a relacao (2.3.4) mostra que o operador dual
Uf : C 0 (M ) C 0 (M )
corresponde precisamente `
a acao f : M(M ) M(M ) da transformacao f
quando fazemos essa identificacao. Esse fato vai nos permitir usar resultados de
Teoria Espectral para dar outra demonstracao do Teorema 2.1.
Para isso precisamos lembrar algumas nocoes da teoria de operadores positivos. O leitor interessado poder
a encontrar mais detalhes e demonstracoes no
livro de Deimling [Dei85].
Seja E um espaco de Banach. Um subconjunto fechado e convexo C e
chamado de cone de E, se ele satisfaz:
C C para todo 0

e C (C) = {0}.

(2.3.6)

Dizemos que o cone C e normal quando


inf{kx + yk : x, y C tais que kxk = kyk = 1} > 0.
Fixemos um cone C de E. Dado um operador linear contnuo T : E E,
diremos que T e um operador positivo sobre C se T (C) C. Dado um funcional
linear contnuo : E R, diremos que e um funcional positivo sobre C se
(v) 0 para todo v C. Por definicao, o cone dual C e o cone em E
formado por todos os funcionais positivos sobre C.
0
Exemplo 2.3.3. C+
(M ) = { C 0 (M ) : 0} e um cone normal de C 0 (M )
(Exerccio 2.3.3). Pelo teorema de Riesz-Markov (Teorema A.3.11), o cone dual
se identifica naturalmente com o espaco das medidas (positivas) finitas em M .

Denotaremos por r(T ) o raio espectral do operador linear contnuo T :


p
r(T ) = lim n kT n k.
n

52

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Representando por T : E E o operador dual de T , vale que r(T ) = r(T ).


O resultado a seguir e uma consequencia do teorema de Banach-Mazur; veja a
Proposicao 7.2 no livro de Deimling [Dei85]:
Teorema 2.3.4. Seja C um cone normal num espaco de Banach E e seja
T : E E um operador linear positivo sobre C. Ent
ao, r(T ) e autovalor do

operador dual T : E E e admite algum autovetor v C .


Como aplicacao deste resultado, vamos dar uma prova alternativa da exis0
tencia de probabilidades invariantes. Considere o cone C = C+
(M ) em E =
0

C (M ). Conforme j
a observamos, o cone dual C e o espaco das medidas posi claro da definicao que o operador T = Uf e positivo sobre
tivas finitas em M . E
C. Alem disso, o seu raio espectral e igual a 1, uma vez sup |T ()| sup ||
para todo C 0 (M ) e T (1) = 1. Logo, pelo Teorema 2.3.4, existe alguma
medida finita em M que e autovetor do operador dual T = f associado ao
autovalor 1. Em outras palavras, a medida e invariante. Multiplicando por
uma constante adequada, podemos supor que e uma probabilidade.

2.3.3

Exerccios

2.3.1. Seja 1 o espaco P


das sequencias somaveis de n
umeros complexos, munido

da norma k(an )n k1 = n=0 |an |. Seja o espaco das sequencias limitadas


e seja c0 o espaco das sequencias convergentes para zero, ambos munidos da
norma k(an )n k = supn0 |an |.
(a) Verifique que , 1 e c0 sao espacos de Banach.
P
(b) Mostre que a aplicacao (an )n 7 [(bn )n 7 n an bn ] define isomorfismos
isometricos entre e o dual (1 ) e entre 1 e o dual (c0 ) .
2.3.2. Mostre que uma sequencia (xk )k em 1 (escreva xk = (xkn )n para cada
k) e convergente na topologia
P da norma se, e somente se, ela e convergente na
topologia fraca, ou seja, se ( n an xkn )k converge qualquer que seja (an )n .
[Observacao: Isso n
ao implica que as duas topologias sejam iguais. Porque?]
Mostre que afirmacao torna-se falsa se substituirmos a topologia fraca pela
topologia fraca .
0
2.3.3. Verifique que C+
(M ) e um cone normal.

2.3.4. Seja R : S 1 S 1 uma rotacao irracional e seja m a medida de Lebesgue


no crculo. Calcule os autovalores e os autovetores do operador de Koopman
U : L2 (m) L2 (m). Mostre que o espectro de U coincide com o crculo
unit
ario {z C : |z| = 1}.
2.3.5. Mostre, por meio de exemplos, que o operador de Koopman Uf pode
n
ao ser sobrejetivo.
2.3.6. Seja U : H H uma isometria de um espaco de Hilbert. Pelo Exerccio A.6.8, a imagem de U e um subespaco fechado de H. Conclua que existem


2.4. PRODUTOS SEMI-DIRETOS E EXTENSOES
NATURAIS

53

subespacos fechados V e W tais que U (V ) = V , os iterados de W sao ortogonais


a V e entre si, e

M
U n (W ).
H=V
n=0

Alem disso, U e um isomorfismo se, e somente se, W = {0}.

2.3.7. Seja : E R um funcional convexo contnuo em um espaco de Banach


separ
avel E, derivavel em todas as direcoes num ponto u E. Prove que existe,
no maximo, um funcional linear limitado T : E R tangente a em u, ou seja,
tal que T (v) (u+v)(u) para todo v E. Se e derivavel em u, a derivada
D(u) e um funcional linear tangente a em u. [Observacao: O teorema de
suavidade de Mazur (Teorema 1.20 no livro de Phelps [Phe93]) afirma que o
conjunto dos pontos onde e derivavel e, consequentemente, existe um u
nico
funcional tangente a e residual em E.]

2.4

Produtos semi-diretos e extens


oes naturais

Nesta secao vamos descrever duas construcoes u


teis em Teoria Erg
odica. A
primeira construcao modela a situacao em que temos dois sistemas dinamicos
acoplados da seguinte forma: um sistema e autonomo mas o outro n
ao, porque
a evolucao do segundo depende da evolucao do primeiro. A segunda construcao
associa um sistema invertvel a qualquer sistema dinamico dado; alem disso, as
medidas invariantes dos dois sistemas est
ao em correspondencia biunvoca. Isto
permite reduzir ao caso invertvel muitos enunciados sobre sistemas gerais, n
ao
necessariamente invertveis .

2.4.1

Medidas em produtos semi-diretos

Sejam (X, A) e (Y, B) espacos mensuraveis. Chamamos produto semi-direto a


qualquer transformacao mensuravel F : X Y X Y da forma F (x, y) =
(f (x), g(x, y)). Representamos por : X Y X a projecao canonica. Por
definicao,
F = f .
(2.4.1)
Seja m uma probabilidade em X Y invariante por F e seja = m a sua
projecao para X. Ent
ao, usando a invariancia de m,
f = f m = F m = = m,
ou seja, e invariante por f . A proxima proposicao d
a uma recproca parcial
para esta conclusao: sob hip
oteses apropriadas, toda a medida invariante por f
e projecao de alguma medida invariante por F .
Proposi
c
ao 2.4.1. Suponha que X e um espaco metrico completo separ
avel,
Y e um espaco metrico compacto e F e contnua. Ent
ao, para toda medida
de probabilidade em X invariante por f existe alguma medida m em X Y
invariante por F , tal que m = .

54

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Demonstrac
ao. Dada qualquer medida de probabilidade invariante em X,
seja K M1 (X Y ) o conjunto das medidas em X Y tais que = .
Considere qualquer K. Ent
ao, F = f = f = . Isto mostra que K
e invariante por F . Em seguida, note que a projecao : X Y X e contnua
e, consequentemente, o operador e contnuo relativamente `a topologia fraca .
Portanto, K e fechado em M1 (X Y ). Pela Proposicao A.3.7, dado qualquer
> 0 existe um
K X tal que (K c ) < . Ent
ao K Y e compacto
 compacto
c
c
e (K Y ) = (K ) < para todo K. Isto prova que o conjunto K e
justo. Considere qualquer K. Pelo teorema de Prohorov (Teorema 2.1.8), a
sequencia
n1
1X j
F
n j=0
admite algum ponto de acumulacao m K. Argumentando como na prova do
Lema 2.2.4 conclumos que m e invariante por F .

2.4.2

Extens
oes naturais

Dada uma transformacao sobrejetiva f : M M e sempre possvel encontrar


M
que e invertvel. Por extens
uma extensao f : M
ao queremos dizer que
M tal que f = f . Este fato e
existe uma aplicacao sobrejetiva : M
muito u
til porque permite reduzir a prova de muitos enunciados do caso geral ao
caso de transformacoes invertveis. Conforme comentaremos no Exemplo 2.4.2, a
hip
otese de que f e sobrejetiva pode ser removida em muitos casos interessantes.
o conjunto de todas as pre-
Para comecar, tomamos para M
orbitas de f , ou
seja, o conjunto de todas as sequencias (xn )n0 indexadas pelos n
umeros inteiros
n
ao-positivos e satisfazendo f (xn ) = xn+1 para todo n < 0. Consideramos a
M que associa a cada sequencia (xn )n0 o seu termo x0 de
aplicacao : M
) = M . Finalmente, definimos f : M
M
como
ordem zero. Observe que (M
sendo o deslocamento `a esquerda:
f(. . . , xn , . . . , x0 ) = (. . . , xn , . . . , x0 , f (x0 )).

(2.4.2)

claro que f est


E
a bem definida e satisfaz f = f . Alem disso, ela e
invertvel: a inversa e o deslocamento `a direita
(. . . , yn , . . . , y1 , y0 ) 7 (. . . , yn , . . . , y2 , y1 ).
um espaco mensuravel,
Se M e um espaco mensuravel podemos tornar M
munindo-o da -algebra gerada pelos cilindros mensur
aveis
: xi Ai para i = k, . . . , 0},
[Ak , . . . , A0 ] = {(xn )n0 M

(2.4.3)

onde k 0 e Ak , . . . , A0 sao subconjuntos mensuraveis de M . Ent


ao e
aplicacao mensuravel, uma vez que
1 (A) = [A].

(2.4.4)


2.4. PRODUTOS SEMI-DIRETOS E EXTENSOES
NATURAIS

55

Alem disso, f e mensuravel se f for:


f1 ([Ak , . . . , A0 ]) = [Ak , . . . , A2 , A1 f 1 (A0 )].

(2.4.5)

A inversa de f tambem e mensuravel, ja que


f([Ak , . . . , A0 ]) = [Ak , . . . , A0 , M ].

(2.4.6)

um espaco
Analogamente, se M e um espaco topologico podemos tornar M
topol
ogico, munindo-o da topologia gerada pelos cilindros abertos [Ak , . . . , A0 ],
onde k 0 e Ak , . . . , A0 sao subconjuntos abertos de M . As relacoes (2.4.4) e
(2.4.6) mostram que e f1 sao contnuas, enquanto que (2.4.5) mostra que f e
contnua se f for. Observe que se M admite alguma base enumeravel de abertos
U, ent
ao os cilindros [Ak , . . . , A0 ] com k 0 e A0 , . . . , Ak U constituem uma
.
base enumer
avel de abertos para M
um espaco
Se M e um espaco metrico, com distancia d, podemos tornar M
metrico munindo-o da distancia
d x
, y) =

0
X

2n min{d(xn , yn ), 1}

(2.4.7)

n=

onde x = (xn )n0 e y = (yn )n0 . A seguinte observacao e uma consequencia


imediata da definicao: se x
e y est
ao numa mesma pre-imagem 1 (x) ent
ao
x, y) para todo j 0.
fj (
d(
x), fj (
y )) 2j d(
Portanto, toda pre-imagem 1 (x) e um conjunto est
avel, ou seja, um conjunto

onde a transformacao f e uniformemente contrativa.


Exemplo 2.4.2. Dada uma transformacao g : M M qualquer, considere
n

Mg =
n=1 g (M ). E claro g(Mg ) Mg . Suponha que
(a) M e compacto e g e contnua

ou

(b) #g 1 (y) < para todo y.

Ent
ao (Exerccio 2.4.3), a restricao f = (g | Mg ) : Mg Mg e sobrejetiva.
Esta restricao contem a din
amica interessante de g. Por exemplo, supondo
que o conjunto f n (M ) e mensuravel para todo n, toda probabilidade invariante
por g tambem e probabilidade invariante por f . De modo semelhante, todo
ponto recorrente por g tambem e ponto recorrente por f , pelo menos no caso
(a). Assim, tambem nos referiremos `a extensao natural de f = (g | Mg ) como
extensao natural de g.
Um conjunto M tal que f 1 () = e chamado conjunto invariante
de f . Vale uma nocao analoga para a transformacao f. A proxima proposicao
mostra que todo conjunto invariante fechado de f admite um u
nico levantamento
a um conjunto invariante fechado de f:
Proposi
c
ao 2.4.3. Suponha que M e um espaco topol
ogico. Se M e um
= 1 () e o u
conjunto fechado invariante de f ent
ao
nico conjunto fechado
= .
invariante de f satisfazendo ()

56

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

= 1 () tambem
Demonstrac
ao. Como e contnua, se e fechado ent
ao
e invariante por f:
e fechado. Alem disso, se e invariante por f ent
ao
= ( f)1 () = (f )1 () = 1 () = ,

f1 ()
um conjunto invariante fechado de f tal que
Na direcao recproca, seja

() = . E claro que 1 (). Para provar a outra inclusao, devemos


Escrevamos
mostrar que, dado qualquer x0 , se x
1 (x0 ) ent
ao x
.
x
= (xn )n0 . Considere n 0 e qualquer vizinhanca de x da forma
V = [An , . . . , A0 ],

An , , A0 abertos de M .

Pela definicao da extensao natural, x0 = f n (xn ) e, portanto, xn f n () = .


= implica que existe algum ponto yn
tal
Ent
ao, a hip
otese de que ()
n

que (
yn ) = xn . Como e invariante por f , temos que f (
yn ) . Alem
disso, a propriedade (
yn ) = xn implica que
f n (
yn ) = (. . . , yn,k , . . . , yn,1 , yn,0 = xn , xn1 , . . . , x1 , x0 ).
Portanto f n (
yn ) V , ja que V contem x
e a sua definicao so envolve as
coordenadas com ndices j {n, . . . , 0}. Isto mostra que x e acumulado por
Como
e fechado, segue que x

elementos de .
.
Agora seja
uma medida invariante por f e seja =
. A propriedade

f = f implica que e invariante por f :


=
= .
f = f
= f
Dizemos que
e um levantamento de . O proximo resultado, uma especie de
versao da Proposicao 2.4.3 para medidas, e devido a Rokhlin [Rok61]:
Proposi
c
ao 2.4.4. Suponha que M e um espaco metrico completo separ
avel
e que f : M M e contnua. Ent
ao, toda probabilidade invariante por f
invariante por
admite um u
nico levantamento, ou seja, u
nica medida
em M

f e tal que
= .
A unicidade e imediata e n
ao depende das hipoteses sobre o espaco M e a
transformacao f . De fato, se
e um levantamento de ent
ao (2.4.4) e (2.4.5)
implicam que a medida de cada cilindro est
a unicamente determinada:

([Ak , . . . , A0 ]) =
([Ak f k (A0 )]) = (Ak f k (A0 )).

(2.4.8)

A prova da existencia usa ideias que serao desenvolvidas no Captulo 5 e sera


proposta ao leitor no Exerccio 5.2.4. Esses argumentos se estendem para sistemas em espacos de Lebesgue, conforme observaremos no Exerccio 8.5.7. Mas o
enunciado de existencia n
ao e valido para espacos de probabilidade arbitrarios
(veja o exemplo no Exerccio 1.15 no livro de Przytycki, Urba
nski [PU10]).


2.4. PRODUTOS SEMI-DIRETOS E EXTENSOES
NATURAIS

2.4.3

57

Exerccios

2.4.1. Seja M um espaco metrico compacto e seja X um conjunto de aplicacoes


contnuas f : M M , munido de uma probabilidade . Considere o produto
semidireto F : X N M X N M definido por F ((fn )n , x) = ((fn+1 )n , f0 (x)).
Mostre que F admite alguma probabilidade invariante m da forma m = N .
Alem disso, uma medida m dessa forma e invarianteR por F se, e somente se,
a medida e estacion
aria para , isto e, (E) = f (E) d(f ) para todo
conjunto mensuravel E M .
M
a sua
2.4.2. Sejam f : M M uma transformacao sobrejetiva, f : M
M a projecao canonica. Mostre que se g : N N
extensao natural e : M
e uma transformacao invertvel tal que f p = p g para alguma aplicacao
tal que p = p
p : N M ent
ao existe uma u
nica transformacao p : N M
e p g = f p. Suponha que M e N sao espacos topologicos compactos e
que as aplicacoes p e g sao contnuas. Mostre que se p e sobrejetiva ent
ao p e
M
).
sobrejetiva (portanto, g : N N e uma extensao de f : M
2.4.3. Verifique as afirmacoes no Exemplo 2.4.2.
2.4.4. Mostre que se (M, d) e um espaco metrico separ
avel completo ent
ao o

mesmo vale para o espaco (M , d) das pre-orbitas de qualquer transformacao


contnua sobrejetiva f : M M .
2.4.5. O objetivo deste exerccio e do seguinte e generalizar a nocao de extensao
natural para transformacoes que comutam entre si. Seja M um espaco compacto
e sejam f1 , . . . , fq : M M transformacoes contnuas sobrejetivas que comutam
o conjunto das sequencias (xn1 ,...,nq )n1 ,...,nq 0 , indexadas pelas
entre si. Seja M
q-uplas de inteiros n
ao positivos, tais que
fi (xn1 ,...,ni ,...,nq ) = xn1 ,...,ni +1,...,nq

para todo i e todo (n1 , . . . , nq ).

M a aplicacao que envia (xn1 ,...,nq )n1 ,...,nq 0 no ponto x0,...,0 .


Seja : M
M
a transformacao que envia (xn1 ,...,ni ,...nq )n1 ,...,nq 0
Para cada i, seja fi : M
em (xn1 ,...,ni +1,...nq )n1 ,...,nq 0 .
e um espaco compacto. Alem disso, M
e metriz
(a) Mostre que M
avel se M
e metriz
avel.
M
e um homeomorfismo com fi = fi .
(b) Mostre que cada fi : M
Alem disso, estes homeomorfismos comutam entre si.
e n
(c) Mostre que e contnua e sobrejetiva. Em particular, M
ao vazio.
2.4.6. Seja M um espaco compacto e sejam g1 , . . . , gq : M M transformacoes
n
n
contnuas que comutam entre si. Defina Mg =
n=1 g1 gq (M ).
n

(a) Verifique que Mg = n1 ,...,nq g1n1 gq q (M ), onde a intersecao e sobre


todas as q-uplas (n1 , . . . , nq ) com ni 1 para todo i.

58

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

(b) Mostre que gi (Mg ) Mg e que a restricao fi = gi | Mg e sobrejetiva, para


todo i.
claro que estas restricoes fi comutam entre si.]
[Observacao: E
2.4.7. Use a construcao nos Exerccios 2.4.5 e 2.4.6 para estender a demonstracao do Teorema 1.5.1 para o caso em que as transformacoes fi n
ao sao necessariamente invertveis.

2.5

Progress
oes aritm
eticas

Nesta secao vamos provar dois resultados fundamentais da Aritmetica Combinat


orica, o teorema de van der Waerden e o teorema de Szemeredi, a partir dos
teoremas de recorrencia m
ultipla (Teorema 1.5.1 e Teorema 1.5.2) que foram
apresentados na Secao 1.5.
Chamamos partic
ao do conjunto dos n
umeros inteiros a qualquer famlia
finita de conjuntos S1 , . . . , Sk Z disjuntos dois-a-dois e cuja uniao e todo o Z.
Lembre que uma progress
ao aritmetica (finita) e uma sequencia da forma
m + n, m + 2n, . . . , m + qn,

com m Z e n, q 1.

O n
umero q e chamado comprimento da progressao.
O seguinte resultado foi obtido, originalmente, pelo matematico holandes
Bartel van der Waerden [vdW27] nos anos 20 do seculo passado:
Teorema 2.5.1 (van der Waerden). Dada qualquer partic
ao finita {S1 , . . . , Sl }
de Z existe algum j {1, . . . , l} tal que Sj contem progress
oes aritmeticas de
todos os comprimentos. Em outras palavras, para todo q 1 existem m Z e
n 1 tais que m + in Sj para todo 1 i q.
Algum tempo depois, os matematicos h
ungaros P
al Erd
os e P
al Turan [ET36]
formularam a seguinte conjectura, que e mais forte que o teorema de van der
Waerden: todo conjunto S Z cuja densidade superior e positiva contem
sequencias aritmeticas de comprimento arbitr
ario. Esta conjectura foi demonstrada por outro matematico h
ungaro, Endre Szemeredi [Sze75], quase quatro
decadas mais tarde. Para enunciarmos o teorema de Szemeredi precisamos introduzir a nocao de densidade superior de um subconjunto de Z.
Chamamos intervalo do conjunto Z dos n
umeros inteiros qualquer subconjunto I da forma {n Z : a n < b}, com a b em Z. O cardinal do intervalo
e o n
umero #I = b a.
A densidade superior Ds (S) de um subconjunto S de Z e o n
umero
Ds (S) = lim sup
#I

#(S I)
#I

onde I representa qualquer intervalo em Z. Do mesmo modo se define a densidade inferior Di (S), trocando limite superior por limite inferior. Em outras

2.5. PROGRESSOES
ARITMETICAS

59

palavras, Ds (S) e o maior n


umero D tal que existe uma sequencia de intervalos
Ij Z satisfazendo
#Ij e

#(S Ij )
D
#Ij

e Di (S) e o menor n
umero nessas condicoes.
No proximo lema colecionamos algumas propriedades simples destas nocoes.
A demonstracao do lema fica a cargo do leitor (Exerccio 2.5.1).
Lema 2.5.2. Tem-se 0 Di (S) Ds (S) 1 e Di (S) = 1 Ds (Z \ S) para
todo S Z. Alem disso, se S1 , . . . , Sl e uma partic
ao de Z ent
ao
Di (S1 ) + + Di (Sl ) 1 Ds (S1 ) + + Ds (Sl ).
Exemplo 2.5.3. Seja S o conjunto dos n
umeros pares. Dado qualquer intervalo
I Z, temos que #(S I) = #I/2 se o cardinal de I e par e #(S I) =
(#I 1)/2 se o cardinal de I e mpar, onde o sinal e positivo se o menor
elemento de I e um n
umero par e e negativo caso contrario. Desta observacao
segue, imediatamente, que Ds (S) = Di (S) = 1/2.
Exemplo 2.5.4. Seja S o seguinte subconjunto de Z:
{1, 3, 4, 7, 8, 9, 13, 14, 15, 16, 21, 22, 23, 24, 25, 31, 32, 33, 34, 35, 36, 43, . . .}.
Isto e, para cada k 1 inclumos em S um bloco de k inteiros consecutivos e omitimos os k inteiros seguintes. Este conjunto contem intervalos com comprimento
arbitrariamente grande. Portanto Ds (S) = 1. Por outro lado, o complementar de S tambem contem intervalos com comprimento arbitrariamente grande.
Portanto, Di (S) = 1 Ds (Z \ S) = 0.
Observe que em qualquer destes dois exemplos o conjunto S contem progressoes aritmeticas de qualquer comprimento. De fato, no Exemplo 2.5.3 o
conjunto S ate contem progressoes aritmeticas de comprimento infinito. Isso
n
ao e verdade no Exemplo 2.5.4, uma vez que nesse caso o complementar de S
contem intervalos arbitrariamente longos.
Teorema 2.5.5 (Szemeredi). Se S e um subconjunto de Z com densidade superior positiva, ent
ao ele contem progress
oes aritmeticas de comprimento arbitr
ario.
Observe que o teorema de van der Waerden e realmente uma consequencia
facil do teorema de Szemeredi. De fato, segue do Lema 2.5.2 que se S1 , . . . , Sl
e uma particao de Z ent
ao existe j tal que Ds (Sj ) > 0. Pelo Teorema 2.5.5, tal
Sj contem progressoes aritmeticas de comprimento arbitrario.
As primeiras demonstracoes destes resultados foram de natureza combinatorica. Furstenberg (veja [Fur81]) observou que eles podem tambem ser deduzidos de ideias da Teoria Erg
odica: mostraremos na Secao 2.5.1 como obter
o teorema de van der Waerden a partir do teorema de recorrencia m
ultipla de

60

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Birkhoff (Teorema 1.5.1); argumentos analogos d


ao o teorema de Szemeredi a
partir do teorema de recorrencia m
ultipla de Poincare (Teorema 1.5.2), como
veremos na Secao 2.5.2.
A teoria de Szemeredi continua sendo uma area de pesquisa muito ativa. Em
particular, outras demonstracoes do Teorema 2.5.5 vem sendo dadas por diversos
autores. Recentemente, a teoria culminou no seguinte resultado espetacular do
matematico inges Ben Green e do matematico australiano Terence Tao [GT08]:
existem progress
oes aritmeticas arbitrariamente longas formadas por n
umeros
primos.
O conjunto dos n
umeros primos n
ao tem densidade positiva e, portanto, o
teorema de Green-Tao n
ao e consequencia do teorema de Szemeredi. No entanto,
este u
ltimo tem um papel importante na sua demonstracao. Por outro lado, o
teorema de Green-Tao e um caso particular de outra conjectura devida a Erd
os:
se S N e tal que a soma dos inversos diverge, ou seja, tal que
X1
= ,
n

nS

ent
ao S contem progressoes aritmeticas de qualquer comprimento. Esta afirmacao mais geral permanece em aberto.

2.5.1

Teorema de van der Waerden

Nesta secao vamos demonstrar o Teorema 2.5.1. A ideia e reduzir a conclusao


a uma afirmacao sobre o deslocamento `a esquerda
: ,

(n )nZ 7 (n+1 )nZ

no espaco = {1, 2, . . . , l}Z das sequencias bilaterais com valores no conjunto


{1, 2, . . . , l}, a qual sera provada por meio do teorema de recorrencia m
ultipla
de Birkhoff.
Observe que toda particao {S1 , . . . , Sl } de Z em l subconjuntos determina
um elemento = (n )nZ de , definido por n = i n Si . Reciprocamente,
todo define uma particao de Z em subconjuntos
Si = {n Z : n = i},

i = 1, . . . , l.

Vamos mostrar que para todo e todo q 1, existem m Z e n 1 tais


que
m+n = = m+qn .
(2.5.1)
Em vista do que acabamos de observar, isto significa que para toda particao
{S1 , . . . , Sl } e todo q 1 existe i {1, . . . , l} tal que Si contem alguma progressao aritmetica de comprimento q. Como a famlia dos Si e finita, isso implica
que algum Sj contem progressoes aritmeticas de comprimento arbitrariamente
claro que uma progressao aritmetica de comprimento q contem progrande. E
gressoes aritmeticas de todos os comprimentos menores que q. Portanto, segue

2.5. PROGRESSOES
ARITMETICAS

61

que Sj contem progressoes aritmeticas de todos os comprimentos, tal como e


afirmado no teorema. Resta provar a afirmacao em (2.5.1).
Para tal, consideremos em a distancia d(, ) = 2N (,) , onde


N (, ) = max N 0 : n = n para todo n Z com |n| < N .

Note que

d(, ) < 1

se, e somente se, 0 = 0 .

(2.5.2)


Como o espaco metrico (, d) e compacto, o fecho Z = n () : n Z da
trajetoria de e tambem um compacto. Alem disso, Z e invariante pelo deslocamento. Consideremos as transformacoes f1 = , f2 = 2 , . . . , fq = q
claro que as fi comutam entre si. Portanto, podedefinidas de Z em Z. E
mos aplicar o Teorema 1.5.1 para concluir que existe Z e uma sequencia
(nk )k tal que
lim fink () =
k

para todo i = 1, 2, . . . , q.

Observe que fi j = i nj . Em particular, podemos fixar n = nj tal que os


iterados n (), 2n (), . . . , qn () est
ao todos a distancia menor que 1/2 do
ponto . Consequentemente,

d in (), jn () < 1 para todo 1 i, j q.
Ent
ao, como est
a no fecho Z da orbita de , podemos encontrar m Z tal
que m () est
a t
ao proximo de que

d m+in (), m+jn () < 1 para todo 1 i, j q.

Levando em conta a observacao (2.5.2) e a definicao do deslocamento , isto


quer dizer que m+n = = m+qn , como pretendamos provar. Isto completa
a demonstracao do teorema de van der Waerden.

2.5.2

Teorema de Szemer
edi

Agora vamos demonstrar o Teorema 2.5.5. Para isso, usaremos o mesmo tipo de
dicion
ario entre particoes de Z e sequencias de inteiros que foi usado na secao
anterior para provar o teorema de van der Waerden.
Considere S um conjunto com densidade superior positiva, isto e, tal que
existe c > 0 e existem intervalos Ij = [aj , bj ) de Z tais que
lim #Ij = e
j

lim
j

#(S Ij )
c.
#Ij

Associamos a S a sequencia = (j )jZ = {0, 1}Z definida por:


j = 1 j S.

62

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Considere o deslocamento : e o subconjunto A = { : 0 = 1} de


. Note que A e um aberto e tambem um fechado, uma vez que tanto ele quanto
o seu complementar sao cilindros de . Note tambem que, para qualquer j Z,
j () A j = 1 j S.
Logo, para mostrar o teorema de Szemeredi basta provar que para todo k N
existem m Z e n 1 tais que
m+n (), m+2n (), . . . , m+kn () A.

(2.5.3)

Para tal, considere a sequencia j de probabilidades definidas em por:


j =

1 X
i ()
#Ij

(2.5.4)

iIj

Como o conjunto M1 () das probabilidades em e compacto (Teorema 2.1.5),


a menos de substituir (j )j por uma subsequencia, podemos supor que ela converge na topologia fraca para alguma probabilidade de .
Observe que e uma probabilidade -invariante pois, para toda funcao
contnua : R, vale
Z
i
1 X
1 h
( ) dj =
( bj ()) ( aj ())
( i ()) +
#Ij
#Ij
iIj
Z
i
1 h
= dj +
( bj ()) ( aj ())
#Ij
R
R
e, passando ao limite quando j , isto d
a que ( ) d = d. Observe
tambem que (A) > 0. De fato, como A e fechado, o Teorema 2.1.2 garante que
(A) lim sup j (A) = lim sup
j

#(S Ij )
c.
#Ij

Dado qualquer k 1, considere as transformacoes fi = i para i = 1, . . . , k. E


claro que estas transformacoes comutam entre si. Ent
ao, estamos em condicoes
de aplicar o Teorema 1.5.2 e concluir que existe algum n 1 tal que

A n (A) kn (A) > 0.

Como A e aberto, isto implica (Teorema 2.1.2) que


l A n (A) kn (A) > 0

para qualquer l suficientemente grande. Pela definicao de l em (2.5.4), isto


quer dizer que existe algum m Il tal que
m () A n (A) kn (A).
Em particular, m+in () A para todo i = 1, . . . , k, como queramos provar.

2.5. PROGRESSOES
ARITMETICAS

2.5.3

63

Exerccios

2.5.1. Demonstre o Lema 2.5.2.


2.5.2. Mostre que a conclusao do Teorema 2.5.1 ainda vale para particoes de
subconjuntos finitos de Z, desde que sejam suficientemente grandes. Mais precisamente: dados q, l 1 existe N 1 tal que, dada qualquer particao do
conjunto {1, 2, . . . , N } em l subconjuntos, algum desses subconjuntos contem
progressoes aritmeticas com comprimento q.
2.5.3. Um ponto x M e dito super n
ao errante se, dada qualquer vizinhanca
U de x e dado qualquer k 1, existe n 1 tal que kj=0 f jn (U ) 6= . Mostre
que o Teorema de van der Warden e equivalente ao seguinte enunciado: toda
aplicacao invertvel num espaco metrico compacto tem algum ponto super n
ao
errante.
2.5.4. Prove a seguinte generalizacao do teorema de van der Waerden para
dimensao arbitraria (teorema de Gr
unwald): dada qualquer particao finita Nk =
S1 Sl e qualquer q 1, existem j {1, . . . , l}, d N e b Nk tais que
b + d(a1 , . . . , ak ) Sj

para quaisquer 1 ai q e 1 i k.

64

CAPITULO 2. EXISTENCIA
DE MEDIDAS INVARIANTES

Captulo 3

Teoremas Erg
odicos
Neste captulo apresentaremos alguns dos resultados fundamentais da Teoria
Erg
odica. Para motivar o tipo de enunciado, consideremos um conjunto mensur
avel E M com medida positiva e um ponto x M qualquer. Queremos
analisar o conjunto dos iterados de x que visitam E, isto e,
{j 0 : f j (x) E}.
Por exemplo, o teorema de recorrencia de Poincare afirma que, para quase todo
x E, este conjunto e infinito. Gostaramos de ter informacao mais precisa, de
natureza quantitativa. Chamamos tempo medio de visita de x a E o valor de
(E, x) = lim

1
#{0 j < n : f j (x) E}.
n

(3.0.1)

No caso de fluxos temos uma nocao analoga, definida por



1
m {0 t T : f t (x) E}
T T

(E, x) = lim

(3.0.2)

(m e a medida de Lebesgue na reta). Seria interessante saber, por exemplo,


em que condicoes este tempo medio de visita e positivo. Antes de abordar este
problema, e necessario responder a uma quest
ao ainda mais b
asica: os limites
em (3.0.1)-(3.0.2) existem?
Estas perguntas remontam ao trabalho do fsico austraco Ludwig Boltzmann
(1844-1906), fundador da teoria cinetica dos gases. Boltzmann era partid
ario
da teoria atomica, que na epoca ainda era muito controversa, segundo a qual a
materia gasosa est
a formada por um grande n
umero de min
usculas partculas
em movimento e que se chocam continuamente. Em princpio, seria possvel
descrever o comportamento de um g
as aplicando as leis da Mecanica Newtoniana
a cada uma das suas partculas (moleculas). Na pratica isso n
ao e realista,
porque o n
umero de moleculas e enorme.
O problema da teoria cinetica dos gases era, ent
ao, explicar o comportamento
dos gases no nvel macroscopico, como resultado estatstico da combinacao de
65


CAPITULO 3. TEOREMAS ERGODICOS

66

todos esses movimentos das suas moleculas. Para formular matematicamente


a sua teoria, Boltzmann precisou de fazer uma suposicao, que ficou conhecida
como hip
otese erg
odica. Em linguagem moderna, a hipotese erg
odica afirma
que, para os sistemas (fluxos hamiltonianos) que descrevem o movimento das
partculas de um g
as, o tempo medio de visita a qualquer subconjunto mensur
avel
E existe e e igual `
a medida de E, para quase todo ponto x.
O esforco para validar (ou invalidar) esta hipotese conduziu a importantes
avancos tanto em Matem
atica (Teoria Erg
odica, Sistemas Din
amicos) quanto
em Fsica Te
orica (Mec
anica Estatstica). O que nos interessa neste captulo
sao os resultados matematicos relativos `a existencia do tempo medio de visita.
A quest
ao de saber quando (E, x) = (E) para quase todo x sera tratada no
Captulo 4.
Representando por a funcao caracterstica do conjunto E, podemos reescrever a expressao no lado direito de (3.0.1) como:
n1
1X
(f j (x)).
n n
j=0

lim

(3.0.3)

Isto sugere uma generalizacao natural da nossa pergunta inicial: o limite acima
existe para funcoes muito gerais, por exemplo, para todas as funcoes integraveis?
O teorema erg
odico de von Neumann (Teorema 3.1.5) afirma que, de fato, o
limite em (3.0.3) existe no espaco L2 (), para toda funcao L2 (). O teorema
erg
odico de Birkhoff (Teorema 3.2.3) vai mais longe e afirma que h
a convergencia
em -quase todo ponto, para toda funcao L1 (). Em particular, o limite
em (3.0.1) est
a bem definido para -quase todo x (Teorema 3.2.1).
Daremos uma demonstracao direta do teorema de von Neumann e tambem
mostraremos como ele pode ser deduzido do teorema erg
odico de Birkhoff.
Quanto a este u
ltimo, iremos obte-lo como caso particular de um resultado
ainda mais forte, o teorema erg
odico subaditivo de Kingman (Teorema 3.3.3).
Este teorema afirma que n /n converge em quase todo ponto, para qualquer
sequencia de funcoes n tal que m+n m + n f m .
Todos estes resultados permanecem validos para fluxos, conforme comentaremos na Secao 3.4.

3.1

Teorema erg
odico de Von Neumann

Nesta secao enunciamos e provamos o teorema erg


odico de von Neumann.

3.1.1

Isometrias em espacos de Hilbert

Seja H um espaco de Hilbert e seja F um subespaco fechado de H. Ent


ao
H = F F ,

(3.1.1)


3.1. TEOREMA ERGODICO
DE VON NEUMANN

67

onde F = {w H : v w = 0 para todo v F } e o complementar ortogonal


de F . A projecao PF : H F associada `a decomposicao (3.1.1) e chamada
projec
ao ortogonal sobre F . Ela est
a unicamente caracterizada por
kx PF (x)k = min{kx vk : v F }.
Observe que PF (v) = v para todo v F e, por consequencia, PF2 = PF .
Exemplo 3.1.1. Considere o espaco de Hilbert L2 (), com o produto interno
Z
= d.
Se 0 e a funcao constante igual a 1 e F e o subespaco gerado por 0 em L2 (),
ou seja, o espaco das funcoes constantes, ent
ao a projecao ortogonal PF () e
dada por
Z
PF () =

d.

De fato, como F e gerado por 0 , temos que PF () = c0 para algum c R.


Para calcular a constante c, note que
Z
0
= d.
(PF () ) 0 = 0 c =
0 0
O operador adjunto U : H H de um operador linear contnuo U : H H
est
a definido pela relacao
U u v = u U v

para todo u, v H.

(3.1.2)

O operador U diz-se uma isometria se ele preserva o produto interno:


Uu Uv = u v

para todo u, v H.

(3.1.3)

Isso e equivalente a dizer que U preserva a norma de H (veja o Exerccio A.6.9).


Outra condicao equivalente e U U = id . De fato,
U u U v = u v para todo u, v

U U u v = u v para todo u, v.

A propriedade U U = id implica que U e injetivo; em geral, uma isometria


pode n
ao ser sobrejetiva. Veja os Exerccios 2.3.5 e 2.3.6.
Exemplo 3.1.2. Se f : M M preserva uma medida ent
ao, como vimos na
Secao 2.3.2, o seu operador de Koopman Uf : L2 () L2 () e uma isometria.
Chamamos conjunto dos vetores invariantes de um operador linear contnuo
U : H H ao subespaco
I(U ) = {v H : U v = v}.
Observe que I(U ) e um subespaco vetorial fechado, uma vez que U e contnuo.
Quando U e uma isometria, temos que I(U ) = I(U ):


CAPITULO 3. TEOREMAS ERGODICOS

68

Lema 3.1.3. Se U : H H e uma isometria ent


ao U v = v se, e somente se,
U v = v.
Demonstrac
ao. Como U U = id , e claro que U v = v implica U v = v. Agora
suponha que U v = v. Ent
ao hU v, vi = hv, U vi = hv, vi = kvk2 . Logo, usando
que U preserva a norma de H,
kU v vk2 = hU v v, U v vi = kU vk2 2hU v, vi + kvk2 = 0.
Isto significa que U v = v.
Para encerrar esta breve discuss
ao, citamos um resultado classico de Analise
Funcional, devido a Marshall H. Stone, que permite reduzir o estudo dos operadores de Koopman de sistemas a tempo contnuo ao caso discreto:
Teorema 3.1.4. Seja Ut : H H, t R um grupo a 1-par
ametro de operadores
unit
arios num espaco de Hilbert. Suponha que o grupo e fortemente contnuo,
isto e,
lim Ut v = Ut0 v, para todo t0 R e v H.
tt0

Ent
ao existe um u
nico operador auto-adjunto A : H H tal que Ut = e2itA
para todo t R.
O leitor pode encontrar a demonstracao no livro de Yosida [Yos68] e uma
aplicacao simples est
a dada no Exerccio 3.1.5.

3.1.2

Enunciado e prova do teorema

Teorema 3.1.5 (von Neumann). Seja U : H H uma isometria num espaco


de Hilbert H, e seja P a projec
ao ortogonal sobre o subespaco I(U ) dos vetores
invariantes por U . Ent
ao,
n1
1X j
U v = Pv
n n
j=0

lim

para todo v H.

(3.1.4)

Demonstrac
ao. Seja L(U ) o conjunto dos vetores v H da forma v = U u u
) o seu fecho. Afirmamos que
para algum u H e seja L(U
) .
I(U ) = L(U

(3.1.5)

Isto pode ser verificado da seguinte forma. Considere quaisquer v I(U ) e


). Pelo Lema 3.1.3, temos que v I(U ), ou seja U v = v. Alem disso,
w L(U
), existem un H, n 1 tais que U uk uk w. Ent
por definicao de L(U
ao
hv, U un un i = hv, U un i hv, un i = hU v, un i hv, un i = 0
) .
para todo n e, como consequencia, hv, wi = 0. Isto prova que I(U ) L(U

) . Ent
Em seguida, considere qualquer v L(U
ao, em particular,
hv, U u ui = 0 ou seja, hU v, ui hv, ui = 0


3.1. TEOREMA ERGODICO
DE VON NEUMANN

69

para todo u H. Isto quer dizer que U v = v. Usando Lema 3.1.3 uma vez
) I(U ) e, portanto, a
mais, deduzimos que v I(U ). Isto mostra que L(U
prova de (3.1.5) est
a completa. Como consequencia, usando (3.1.1),
)
H = I(U ) L(U

(3.1.6)

Agora vamos verificar a igualdade (3.1.4), sucessivamente, quando v I(U ),


), e no caso geral. Suponha primeiro que v I(U ). Por um
quando v L(U
lado, P v = v. Por outro lado,
n1
n1
1X
1X j
U v=
v=v
n j=0
n j=0

para todo n. Logo esta sequencia converge para v quando n . Isto prova
(3.1.4) neste caso.
Em seguida suponha que v L(U ). Ent
ao, por definicao, existe u H tal
imediato que
que v = U u u. E
n1
n1

1X j
1 X j+1
1
U v=
U
u U j u = (U n u u).
n j=0
n j=0
n

A norma desta u
ltima expressao est
a majorada por 2kuk/n e, portanto, converge
para zero quando n . Isto mostra que
lim
n

n1
1X j
U v=0
n j=0

para todo v L(U ).

(3.1.7)

). Ent
Mais em geral, suponha que v L(U
ao, existem vk L(U ) convergindo
para v quando k . Observe que
n1
n1
X
1 n1
1X
1X j

Ujv
U vk
kU j (v vk )k kv vk k
n j=0
n j=0
n j=0

para todo n e todo k. Juntamente com (3.1.7), isto implica que


n1
1X j
lim
U v=0
n n
j=0

).
para todo v L(U

(3.1.8)

), isto mostra que


Como a relacao (3.1.5) implica que P v = 0 para todo v L(U

(3.1.4) vale tambem quando v L(U ).


).
O caso geral de (3.1.4) segue imediatamente, ja que H = I(U ) L(U

3.1.3

Converg
encia em L2 ()

Dada uma transformacao mensuravel f : M M que preserva uma probabilidade em M , dizemos que uma funcao mensuravel : M R e invariante se
f = em -quase todo ponto. O seguinte resultado e um caso particular
do Teorema 3.1.5:


CAPITULO 3. TEOREMAS ERGODICOS

70

Teorema 3.1.6. Para qualquer L2 () a sequencia


n1
1X
fj
n j=0

(3.1.9)

converge em L2 () para a projec


ao ortogonal da func
ao no subespaco das
func
oes invariantes. Se f e invertvel, ent
ao a sequencia
n1
1X
f j
n j=0

(3.1.10)

tambem comverge em L2 () para .

Demonstrac
ao. Seja U = Uf : L2 () L2 () o operador de Koopman de uma
transformacao f : M M que preserva uma medida finita . Note que uma
funcao est
a em I(U ) se, e somente se, f = em -quase todo ponto.
Seja a projecao ortogonal de em I(U ). Pelo Teorema 3.1.5, a sequencia em
(3.1.9) converge para em L2 (). Isto prova a primeira afirmacao.
A segunda afirmacao e analoga, considerando U = Uf 1 , ou seja U = Uf1 .
Obtemos que a sequencia em (3.1.10) converge para a projecao ortogonal de
no espaco I(Uf1 ). Observando que I(Uf1 ) = I(Uf ), conclumos que o limite
desta sequencia e a mesma funcao que obtivemos antes.

3.1.4

Exerccios

3.1.1. Mostre que sob as hipoteses do teorema de Von Neumman vale a seguinte
conclusao mais forte:
n1
X
1
f j P ().
lim
nm n m
j=m

3.1.2. Use o exerccio anterior para mostrar que dado A M com (A) > 0,
o conjunto dos valores de n N tais que (A f n (A)) > 0 e sindetico (veja
Exerccio 1.2.5).
3.1.3. Prove que o conjunto F = { L1 () : e f -invariante} e um subespaco
fechado de L1 ().
3.1.4. Enuncie e prove uma versao do Teorema de Von Neumann para fluxos.
3.1.5. Seja uma probabilidade invariante por um fluxo contnuo ft : M M
num espaco metrico compacto M . Sejam Ut : L2 () L2 (), t R o grupo a
1-par
ametro de operadores unit
arios dados por Ut = ft e A : L2 () L2 ()
o operador auto-adjunto associado (dado pelo Teorema 3.1.4). Mostre que 0 e
um auto-valor simples de A se, e somente se, toda funcao L2 () que satisfaz
Ut = para todo t R e constante em -quase todo ponto.


3.2. TEOREMA ERGODICO
DE BIRKHOFF

3.2

71

Teorema erg
odico de Birkhoff

O teorema que apresentamos nesta secao foi demonstrado por George David
Birkhoff 1 , um dos maiores matematicos americanos da sua geracao e autor de
muitas outras contribuicoes fundamentais em Din
amica. O teorema de Birkhoff
melhora bastante o teorema de von Neumann porque a sua conclusao e formulada em termos de convergencia em -quase todo o ponto, que e uma propriedade
mais forte do que convergencia em L2 ().

3.2.1

Tempo m
edio de visita

Comecamos por enunciar a versao do teorema para tempos medios de visita:


Teorema 3.2.1 (Birkhoff). Seja f : M M uma transformac
ao mensur
avel
e uma probabilidade invariante por f . Dado qualquer conjunto mensur
avel
E M , o tempo medio visita
1
#{j = 0, 1, . . . , n 1 : f j (x) E}
n
R
existe em -quase todo ponto x M . Alem disso, (E, x) d(x) = (E).
(E, x) = lim
n

Observe que se (E, x) existe para um certo ponto x M ent


ao
(E, f (x)) = (E, x).

(3.2.1)

De fato, por definicao,


n

1X
XE (f j (x))
n n
j=1

(E, f (x)) = lim

n1

1
1X
XE (f j (x)) XE (x) XE (f n (x))
n n
n
j=0

= lim


1
XE (x) XE (f n (x))
n n

= (E, x) + lim

Como a funcao caracterstica e limitada, o u


ltimo limite e igual a zero. Isto
prova a igualdade (3.2.1).
O exemplo a seguir mostra que o tempo medio de visita n
ao existe para todo
ponto, em geral:
Exemplo 3.2.2. Considere o n
umero x (0, 1) definido pela expansao decimal
x = 0, a1 a2 a3 . . . , onde ai = 1 se 2k i < 2k+1 com k par e ai = 0 se
2k i < 2k+1 com k mpar. Ou seja,
x = 0, 10011110000000011111111111111110 . . .,
1 Seu

filho, Garret Birkhoff, tamb


em foi um matem
atico, bem conhecido por seus trabalhos

devida a ele a noca


em Algebra.
E
o de dist
ancia projetiva, que usaremos na Seca
o 12.3.


CAPITULO 3. TEOREMAS ERGODICOS

72

onde os blocos alternantes de 0s e de 1s tem comprimentos dados pelas sucessivas


potencias de dois. Seja f : [0, 1] [0, 1] a transformacao definida na Secao 1.3.1
e seja E = [0, 1/10). Isto e, E e o conjunto dos pontos cuja expansao decimal
facil ver que se n = 2k 1 com k = 2q ent
comeca com o dgito 0. E
ao
n1
1 + 22 + 24 + + 2k2
1
1X
XE (f j (x)) =
= .
n j=0
2k 1
3

Por outro lado, se n = 2k 1 e k = 2q + 1 ent


ao, quando q ,
n

1X
1 + 22 + 24 + + 2k1
1 2k+1 1
2
XE (f j (x)) =
=
.
n j=0
2k 1
3 2k 1
3
Assim, o tempo medio de visita de x ao conjunto E n
ao existe.

3.2.2

M
edias temporais

Conforme observamos anteriormente


(E, x) = lim
n

n1
1X
(f j (x)),
n j=0

onde = XE .

O proximo enunciado generaliza o Teorema 3.2.1 para o caso em que e uma


funcao integravel qualquer:
Teorema 3.2.3 (Birkhoff). Seja f : M M uma transformac
ao mensur
avel
e seja uma probabilidade invariante por f . Dada qualquer func
ao integr
avel
: M R, o limite
n1
1X
(f j (x))
(3.2.2)
(x)

= lim
n n
j=0
existe em -quase todo ponto x M . Alem disso, a func
ao definida desta
forma e integr
avel e satisfaz
Z
Z
(x)
d(x) = (x) d(x).
Um pouco mais adiante obteremos este teorema como caso particular de
um resultado mais geral, o teorema erg
odico subaditivo. O limite e chamado
media temporal, ou media orbital, de : A proposicao a seguir mostra que as
medias temporais sao constantes ao longo de orbitas, em -quase todo ponto,
generalizando a igualdade (3.2.1):
Proposi
c
ao 3.2.4. Seja : M R uma func
ao integr
avel. Ent
ao,
(f
(x)) = (x)

para -quase todo ponto x M .

(3.2.3)


3.2. TEOREMA ERGODICO
DE BIRKHOFF

73

Demonstrac
ao. Por definicao,
n
n1

1
1X
1X
j
(f (x)) = lim
(f j (x)) + (f n (x)) (x)
(f
(x)) = lim
n n
n n
n
j=1
j=0


1
(f n (x)) (x)
n n

= (x)

+ lim
Vamos precisar do seguinte lema:

Lema 3.2.5. Se e uma func


ao integr
avel ent
ao limn n1 (f n (x)) = 0 para
-quase todo ponto x M .
Demonstrac
ao. Fixe qualquer > 0. Como e invariante, temos que


{x M : |(f n (x))| n} = {x M : |(x)| n}

X

|(x)|
< k + 1} .
=
{x M : k

k=n

Somando sobre todo n N, obtemos que

 X

|(x)|
{x M : |(f n (x))| n} =
k {x M : k
< k + 1}

n=1
k=1
Z
||
d.

Como e integravel, por hip


otese, todas estas expressoes sao finitas. Isso implica que o conjunto B() dos pontos x tais que |(f n (x))| n para infinitos
valores de n tem medida nula (veja o Exerccio A.1.6). Segue imediatamente
da definicao de B() que para todo x
/ B() existe algum p 1 tal que
|(f n (x))| < n para todo n p. Agora considere o conjunto B =
i=1 B(1/i).
Ent
ao B tem medida nula e para todo x
/ B vale que lim(1/n)(f n (x)) = 0.
Aplicando o Lemma 3.2.5 `
a funcao = obtemos a igualdade (3.2.3). Isto
completa a demonstracao da Proposicao 3.2.4.
Em geral, o subconjunto com medida total onde vale a convergencia (3.2.2)
no Teorema 3.2.3 depende da funcao que estamos considerando. No entanto,
em alguns casos e possvel escolher esse conjunto independentemente da funcao.
Um exemplo u
til desta situacao e o seguinte:
Teorema 3.2.6. Suponha que M e um espaco metrico compacto e f : M M
e uma aplicac
ao contnua. Ent
ao existe um conjunto mensur
avel G M com
(G) = 1 tal que
n1
1X
(f j (x)) (x)

(3.2.4)
n j=0
para todo x G e toda func
ao contnua : M R.


CAPITULO 3. TEOREMAS ERGODICOS

74

Demonstrac
ao. Pelo teorema erg
odico de Birkhoff, para cada funcao contnua
existe um conjunto G() M com (G()) = 1 tal que (3.2.4) e valido para
todo x G(). Pelo Teorema A.3.13, o espaco C 0 (M ) das funcoes contnuas
admite algum subconjunto {k : k N} enumeravel denso. Tomemos
G=

G(k ).

k=1

claro que (G) = 1. Portanto basta provar que (3.2.4) vale para toda funcao
E
contnua sempre que x G. Isso pode ser feito da seguinte maneira. Dado
C 0 (M ) e qualquer > 0, tomemos k N tal que


k k k = sup |(x) k (x)| : x M .

Ent
ao, dado qualquer ponto x G,
lim sup
n

lim inf
n

n1
n1
1X
1X
(f j (x)) lim
k (f j (x)) + = k (x) +
n n
n j=0
j=0

n1
n1
1X
1X
(f j (x)) lim
k (f j (x)) = k (x) .
n n
n j=0
j=0

Isto implica que


lim sup
n

n1
n1
1X
1X
(f j (x)) lim inf
(f j (x)) 2.
n
n j=0
n j=0

Como e arbitrario, segue que o limite (x)

existe, conforme afirmado.


Em geral n
ao e possvel dizer nada sobre a velocidade da convergencia no
Teorema 3.2.3. Por exemplo, segue de um teorema de Kakutani e Petersen
(confira as p
aginas 94 a 99 do livro de Petersen [Pet83]) que se a medida
e erg
odica e n
ao atomica ent
ao, dada qualquer sequencia (an )n de n
umeros
positivos com limn an = 0, existe alguma funcao mensuravel limitada tal que
Z
n1

1 1 X
lim sup
(f j (x)) d = +.
an n j=0
n

Dizemos que uma medida invariante e erg


odica se f 1 (A) = A a menos
de medida nula implica que (A) = 0 ou (Ac ) = 0. O estudo das medidas
erg
odicas sera o tema do proximo captulo.
Outra observacao interessante e que n
ao existe um analogo do teorema
erg
odico de Birkhoff para medidas invariantes infinitas. De fato, suponha que
e medida invariante -finita, mas infinita, de uma transformacao f : M M .
Dizemos que um conjunto mensuravel W M e errante se as pre-imagens
f i (W ), i 0 sao disjuntas duas-a-duas. Suponha que e erg
odica e conservativa, ou seja, todo conjunto errante tem medida nula. Ent
ao, dada qualquer
sequencia (an )n de n
umeros positivos,


3.2. TEOREMA ERGODICO
DE BIRKHOFF
ou lim inf n

1
an

Pn1
j=0

75

f j = 0 em quase todo ponto, para toda L1 ();

ou existe (nk )k tal que limk


ponto, para toda L1 ().

1
an k

Pnk 1
j=0

f j = em quase todo

Este resultado e outros fatos correlatos est


ao demonstrados na Secao 2.4 do livro
de Aaronson [Aar97].

3.2.3

Teorema de von Neumann e consequ


encias

O teorema de von Neumann (Teorema 3.1.6) tambem pode ser deduzido diretamente do teorema de Birkhoff, como vamos mostrar a seguir.
Considere qualquer funcao L2 () e seja a sua media temporal. Comecamos por mostrar que L2 () e a sua norma satisfaz kk
2 kk2 . Para
isso, note que
||
lim
n

n1
2
 1 n1
X
2
1X
f j | .
| f j | e, portanto, | lim
n
n j=0
n j=0

Ent
ao, pelo lema de Fatou (Teorema A.2.10),
hZ

h
2 i1/2
| d
lim inf
n

Z  n1
2 i1/2
1X
| f j | d
.
n j=0

(3.2.5)

Podemos usar a desigualdade de Minkowski (Teorema A.5.3) para majorar a


sequencia do lado direito:
n1 Z
2 i1/2
i1/2
h Z  1 n1
X
1 Xh
| f j | d
| f j |2 d

.
n j=0
n j=0

(3.2.6)

R
1/2
Como e invariante por f , a expressao do lado direito e igual a
||2 d
.
Portanto, (3.2.5) e (3.2.6) implicam que kk
2 kk2 < .
Pn1
Agora vamos mostrar que (1/n) j=0 f j converge para em L2 ().
Inicialmente, suponha que a funcao e limitada, isto e, que existe C > 0 tal
que || C. Ent
ao

1 n1

X
f j C

n j=0

para todo n

||
C.

Ent
ao podemos usar o teorema da convergencia dominada (Teorema A.2.11)
para concluir que
lim
n

Z  n1
Z 
n1
2
2
1X
1X
lim
f j d =
f j d = 0,
n n
n j=0
j=0


CAPITULO 3. TEOREMAS ERGODICOS

76

Pn1
ou seja, que (1/n) j=0
f j converge para em L2 (). Falta estender esta
conclusao para uma funcao qualquer em L2 (). Para isso, consideremos uma
sequencia (k ) de funcoes limitadas tal que (k )k converge para . Por exemplo

(x) se |(x)| k
k (x) =
0
caso contrario.
Denotemos por k as respectivas medias temporais. Dado qualquer > 0,
fixemos k0 tal que k k k2 < /3 para todo k k0 . Note que k( k ) f j k2
e igual a k k k2 para todo j 0, porque a medida e invariante. Logo,

1 n1

X
( k ) f j k k k2 < /3 para todo n 1 e k k0 . (3.2.7)

n j=0
2

Observe tambem que k e a media temporal da funcao k . Portanto,


o argumento do par
agrafo anterior d
a que
k k k2 k k k2 < /3 para todo k k0 .

(3.2.8)

Por hip
otese, para cada k 1 existe n0 (k) 1 tal que
1 n1

X

k f j k < /3 para todo n n0 (k).

n j=0
2

(3.2.9)

Somando (3.2.7), (3.2.8), (3.2.9) obtemos



1 n1

X
f j <

n j=0
2

para todo n n0 (k0 ).

Isto completa a prova do teorema de von Neumann a partir do teorema de


Birkhoff.
No Exerccio 3.2.5 propomos uma generalizacao destas conclusoes para um
espaco Lp () qualquer.
Corol
ario 3.2.7. A media temporal de qualquer func
ao L2 () coincide
com a projec
ao ortogonal P () de no subespaco das func
oes invariantes.
Pn1
Demonstrac
ao. Por um lado, o Teorema 3.1.6 d
a que (1/n) j=0 f j converge
2
para P () em L (). Por outro lado, acabamos de mostrar que essa sequencia
converge para em L2 (). Por unicidade do limite, P () = .

Corol
ario 3.2.8. Se f : M M e invertvel ent
ao as medias temporais de
qualquer func
ao L2 () para f e para f 1 coincidem em -quase todo ponto:
lim
n

n1
n1
1X
1X
f j = lim
fj
n n
n j=0
j=0

em -quase todo ponto.

(3.2.10)


3.2. TEOREMA ERGODICO
DE BIRKHOFF

77

Demonstrac
ao. O limite do lado esquerdo de (3.2.10) e a projecao ortogonal de
no subespaco das funcoes invariantes por f 1 , enquanto que o limite do lado
direito e a projecao ortogonal de no subespaco das funcoes invariantes por f .
claro que estes dois subespacos sao exatamente o mesmo. Logo os dois limites
E
coincidem em L2 ().

3.2.4

Exerccios

3.2.1. Seja X = {x1 , . . . , xr } um conjunto finito e seja : X X uma permutacao. A permutacao e chamada de cclica se ela admite uma (
unica)
orbita de cardinalidade r.
1. Dada uma permutacao cclica e uma funcao : X R prove que
n1
(x1 ) + + (xr )
1X
( i (x)) =
.
n n
r
i=0

lim

2. Mais geralmente, prove que para toda permutacao e funcao


n1
1X
(x) + ((x)) + + ( p1 (x))
( i (x)) =
.
n n
p
i=0

lim

onde p 1 e a cardinalidade da orbita de x.


3.2.2. Verifique que o Lema 3.2.5 tambem pode ser deduzido do teorema erg
odico de Birkhoff.
3.2.3. Uma funcao : Z R e dita uniformemente quase peri
odica se para
cada > 0 existe L() N tal que todo intervalo {n + 1, . . . , n + L()} no
conjunto Z tem algum elemento tal que |(k + ) (k)| < para todo k Z.
Chamaremos de um -quase perodo de f .
(a) Prove que se e uniformemente quase periodica ent
ao ela e limitada.
(b) Mostre que para todo > 0 existe 1 tal que
(n+1)

1X
1 X
(j)
(j)| < 2 para todo n 1.
|
j=n+1
1=1

(c) Mostre que a sequencia (1/n)


quando n .

Pn

j=1

(j) converge para algum n


umero real

(d) Mais geralmente, prove que limn (1/n)


Z e e independente de x.

Pn

l=1

(x + k) existe para todo x

3.2.4. Prove que para Lebesgue quase todo ponto x [0, 1], a media geometrica
dos n
umeros inteiros a1 , . . . , an , . . . na expansao de x em fracao contnua converge para algum valor, ou seja, existe b R tal que limn (a1 a2 an )1/n = b.
[Observacao: Compare com o Exerccio 4.2.11.]


CAPITULO 3. TEOREMAS ERGODICOS

78

3.2.5. Seja : M R uma funcao integravel e seja a sua media temporal,


dada pelo Teorema 3.2.3. Mostre que se Lp () para algum p > 1 ent
ao
Lp () e vale kk
p kkp . Alem disso,
n1
1X
fj
n j=0

converge para no espaco Lp ().


3.2.6. Prove o teorema de Birkhoff para fluxos: se e uma probabilidade
invariante por um fluxo f e L1 () ent
ao a funcao
1
T T

(x)

= lim

est
a definida em -quase todo ponto e

(f t (x)) dt

d =

d.

3.2.7. Prove que se um homeomorfismo f : M M de um espaco metrico M


so admite uma medida invariante e ela e tal que (A) > 0 para todo aberto
n
ao vazio A M , ent
ao toda orbita de f e densa em M .

3.3

Teorema erg
odico subaditivo

Dizemos que uma sequencia de funcoes n : M R e subaditiva para uma


transformacao f : M M se
m+n m + n f m

para todo m, n 1.

(3.3.1)

Exemplo 3.3.1. A sequencia n : M R diz-se aditiva se vale a igualdade


em (3.3.1), ou seja, se m+n = m + n f m para todo m, n 1. Por exemplo,
toda soma temporal
n1
X
(f j (x))
n (x) =
j=0

facil verificar que toda sequencia aditiva e


constitui uma sequencia aditiva. E
desta forma, com = 1 .
No proximo exemplo usamos a nocao de norma de uma matriz quadrada,
que e definida do seguinte modo. Seja A uma matriz quadrada de dimensao
d 2. Ent
ao
o
n kAvk
: v Rd \ {0}
(3.3.2)
kAk = sup
kvk

Compare com a Equacao 2.3.1. Segue diretamente da definicao que a norma do


produto de duas matrizes e menor ou igual que o produto das normas dessas
matrizes:
kABk kAk kBk .
(3.3.3)


3.3. TEOREMA ERGODICO
SUBADITIVO

79

Exemplo 3.3.2. Seja A : M GL(d) uma funcao mensuravel com valores


no conjunto GL(d) das matrizes quadradas invertveis de dimensao d. Defina
n (x) = A(f n1 (x)) A(f (x))A(x) para todo n 1 e x M . Ent
ao a
sequencia n (x) = log kn (x)k e subaditiva. De fato,
m+m (x) = n (f m (x))m (x)
e portanto, usando (3.3.3),
m+n (x) = log kn (f m (x))m (x)k

log km (x)k + log kn (f m (x))k = m (x) + n (f m (x)).

para todo m, n e x.
Lembre que, dada uma funcao : M R representamos por + : M R
a funcao definida por + (x) = max{(x), 0}.
Teorema 3.3.3 (Kingman). Seja uma probabilidade invariante para uma
transformac
ao f : M M e seja n : M R, n 1 uma sequencia subaditiva
1
de func
oes mensur
aveis tal que +
ao a sequencia (n /n)n con1 L (). Ent
verge em -quase todo ponto para uma func
ao mensur
avel : M [, +).
Alem disso, + L1 () e
Z
Z
Z
1
1
n d = inf
n d [, +).
d = lim
n n
n n
A prova do Teorema 3.3.3 que vamos apresentar e devida a Avila, Bochi [AB],
os quais se inspiraram na demonstracao do Teorema 3.2.3 dada por Katznelson,
Weiss [KW82]. Um ponto importante e que o teorema erg
odico de Birkhoff n
ao
e usado no argumento. Isso nos permitira obter o teorema de Birkhoff como
corol
ario do Teorema 3.3.3.

3.3.1

Prepara
c
ao da demonstrac
ao

Uma sequencia (an )n em [, +) e dita subaditiva se vale am+n am + an


para todo m, n 1.
Lema 3.3.4. Se (an )n e uma sequencia subaditiva ent
ao
lim
n

an
an
= inf
[, ).
n n
n

(3.3.4)

Demonstrac
ao. Se am = para algum m ent
ao, pela subaditividade, temos
que an = para todo n > m. Ent
ao os dois lados de (3.3.4) sao iguais a ,
e portante o lema e valido neste caso. A partir daqui suporemos que an R
para todo n.
Seja L = inf n (an /n) [, +) e seja B qualquer n
umero real maior do
que L. Ent
ao podemos encontrar k 1 tal que
ak
< B.
k


CAPITULO 3. TEOREMAS ERGODICOS

80

Para n > k, podemos escrever n = kp + q, onde p e q sao n


umeros inteiros tais
que p 1 e 1 q k. Ent
ao, por subaditividade,
an akp + aq pak + aq pak + ,
onde = max{ai : 1 i k}. Logo,
an
pk ak

+ .
n
n k
n
Observe que pk/n converge para 1 e /n converge para zero quando n .
Portanto, uma vez que ak /k < B, temos
L

an
<B
n

para todo n suficientemente grande. Fazendo B L, conclumos que


lim

an
an
= L = inf
.
n
n
n

Isto completa o argumento.


Agora seja (n )n como nas hipoteses do Teorema 3.3.3. Por subaditividade,
n 1 + 1 f + + 1 f n1 .
+
Esta relacao permanece valida quando colocamos +
n e 1 no lugar de n e 1 .
+
1
+
1
Logo, a hip
otese de que 1 L () implica que n L () para todo n. Alem
disso, a hip
otese de que (n )n e subaditiva implica que
Z
an = n d, n 1,

e uma sequencia subaditiva em [, +). Logo, pelo Lema 3.3.4, o limite


L = lim
n

an
an
= inf
[, ).
n n
n

existe. Defina : M [, ] e + : M [, ] por


(x) = lim inf
n

n
(x)
n

e + (x) = lim sup


n

n
(x).
n

claro que (x) + (x) para todo x M . Vamos provar que


E
Z
Z
d L + d,

(3.3.5)

desde que toda funcao n seja limitada por baixo. Consequentemente, as duas
funcoes e + coincidem em -quase todo ponto e a sua integral e igual a L.
Desta forma o teorema ficara demonstrado neste caso. Ao final, removemos a
condicao de limitacao usando um truque de truncagem.


3.3. TEOREMA ERGODICO
SUBADITIVO

3.3.2

81

Lema fundamental

Nesta secao suporemos que > em todo ponto. Fixado > 0, defina,
para cada k N,



Ek = x M : j (x) j (x) + para algum j {1, . . . , k} .

claro que Ek Ek+1 para todo k. Alem disso, a definicao de (x) implica
E
que M = k Ek . Logo (Ek ) 1 quando k . Defina tambem
k (x) =

(x) +
1 (x)

se x Ek
se x Ekc .

Segue da definicao que k (x) (x) + para todo x M . O passo crucial


na prova do teorema e a seguinte estimativa:
Lema 3.3.5. Para todo n > k 1 e -quase todo x M ,
n (x)

nk1
X

k (f i (x)) +

i=0

n1
X

i=nk

max{k , 1 }(f i (x)).

Demonstrac
ao. Tome x M tal que (x) = (f j (x)) para todo j 1 (isso
vale em -quase todo ponto; veja o Exerccio 3.3.1). Considere a sequencia,
possivelmente finita, de n
umero inteiros
m0 n 1 < m1 n 2 < m2 . . .

(3.3.6)

definida indutivamente da seguinte forma (veja tambem a Figura 3.1).


Ekc

Ekc
n1

m0

Ekc
n1

m1

Ekc
nl

m1

Ekc
m0

Ekc

ml

Ekc

Ekc
nl

ml

nl+1 n

Figura 3.1: Decomposicao da trajetoria de um ponto


Defina m0 = 0. Seja nj o menor inteiro maior ou igual a mj1 tal que
ao, pela definicao de Ek , existe mj tal que
f nj (x) Ek (caso exista). Ent
1 mj n j k e
mj nj (f nj (x)) (mj nj )( (f nj (x)) + ).

(3.3.7)


CAPITULO 3. TEOREMAS ERGODICOS

82

Isto completa a definicao da sequencia (3.3.6). Agora, dado n k, seja l 0 o


maior n
umero inteiro tal que ml n. Pela subaditividade,
nj 1

nj mj1 (f mj1 (x))

1 (f i (x))

i=mj1

para todo j = 1, . . . , l tal que mj1 6= nj , e analogamente para nml (f ml (x)).


Assim,
l
X
X
i
(3.3.8)
mj nj (f nj (x))
n (x)
1 (f (x)) +
j=1

iI

onde I =

lj=1 [mj1 , nj )

1 (f i (x)) = k (f i (x))

[ml , n). Observe que


para todo

i lj=1 [mj1 , nj ) [ml , min{nl+1 , n}),

j
a que f i (x) Ekc em todos esses casos. Alem disso, como e constante em
orbitas (veja o Exerccio 3.3.1) e k + , a relacao (3.3.7) nos d

a que
mj 1

mj 1

mj nj (f nj (x))

i=nj

( (f i (x)) + )

k (f i (x))

i=nj

para todo j = 1, . . . , l. Deste modo, usando a equacao (3.3.8) conclumos que


min{nl+1 ,n}1

n (x)

k (f (x)) +

i=0

n1
X

1 (f i (x)).

i=nl+1

Como nl+1 > n k, o lema est


a provado.

3.3.3

Estimativa da fun
c
ao

Na direcao de provar (3.3.5), nesta secao vamos provar o seguinte lema:


R
Lema 3.3.6. d = L

Demonstrac
ao. Suponha, por um instante, que n /n est
a uniformemente limitado por baixo, ou seja, que existe > 0 tal que n /n para todo n. Aplicando o lema de Fatou (Teorema A.2.10) `a sequencia de funcoes n
ao-negativas
n /n + , obtemos que e integravel e
Z
Z
n
d lim
d = L.
n
n
Para provar a outra desigualdade, observe que o Lema 3.3.5 implica que
Z
Z
Z
nk
k
1
n d
k d +
max{k , 1 } d
(3.3.9)
n
n
n


3.3. TEOREMA ERGODICO
SUBADITIVO

83

Note que max{k , 1 } max{ +, +


ltima funcao e integravel.
1 } e que esta u
Portanto, o lim sup da u
ltima parcela em (3.3.9) quando Rn e menor ou
igual que zero. Ent
ao, fazendo n obtemos que L k d para todo k.
Logo, fazendo k , conclumos que
Z
L d +
R
Finalmente, fazendo 0 obtemos que L d. Isto prova o lema quando
n /n est
a uniformemente limitado por baixo.
Agora resta remover essa hip
otese. Defina, para cada > 0,
n = max{n , n} e

= max{ , }.

A sequencia (n )n satisfaz as hip


oteses do Teorema 3.3.3, ou seja, ela e subaditiva e a parte positiva de 1 e integravel. Alem disso, = lim inf n (n /n).
Ent
ao, o argumento do par
agrafo anterior mostra que
Z
Z
1

n d.
(3.3.10)
d = inf
n n
Pelo teorema da convergencia mon
otona (Teorema A.2.9), tambem temos que
Z
Z
Z
Z
n d = inf n d e
d = inf d.
(3.3.11)

Combinando as relacoes (3.3.10) e (3.3.11), obtemos que


Z
Z
Z
Z
1
1
n d = inf
n d = L.
d = inf = inf inf
n n

n n
Isto completa a demonstracao do lema.

3.3.4

Majorac
ao da fun
c
ao +

R
Para completar a prova de (3.3.5), vamos mostrar que + d L desde que
inf n n seja finito para todo n. Comecamos por provar o seguinte resultado
auxiliar:
Lema 3.3.7. Para todo k fixado,
lim sup
n

kn
n
= k lim sup
.
n
n
n

Demonstrac
ao. A desigualdade e clara, uma vez que kn /kn e subsequencia
de n /n. Para mostrar a desigualdade contraria, escrevemos n = kqn + rn com
rn {1, . . . , k}. Pela subaditividade,
n kqn + rn f kqn kqn + f kqn


CAPITULO 3. TEOREMAS ERGODICOS

84

+
onde = max{+
em
1 , . . . , k }. Observe que n/qn k quando n . Al
1
disso, como L (), podemos usar o Lema 3.2.5 para ver que f n /n
converge para zero em -quase todo ponto. Assim, dividindo a relacao anterior
por n e tomando o lim sup quando n n
os obtemos que

1
1
1
1
1
lim sup n lim sup kqn + lim sup f kqn = lim sup kq ,
n
n
n
k
q
n
n
q
n
como afirmado no lema.
Lema 3.3.8. Suponha que inf n n > para todo n. Ent
ao

+ d L.
Pn1
Demonstrac
ao. Para cada k fixado e n 1, considere n = j=0 k f jk .
Observe que
Z
Z
n d = n k d para todo n,
(3.3.12)

uma vez que f k preserva a medida . Como a sequencia (n )n e subaditiva,


n kn para todo n. Logo, usando o Lema 3.3.7,
= lim inf
n

e, portanto,

kn
n
n
lim sup
= k lim sup
= k+
n
n
n
n
n
Z

d k

+ d.

(3.3.13)

Observe tambem que a sequencia (n )n e aditiva: m+n = m + n f km para


todo m, n 1. Como 1 = k e majorada por inf k , tambem temos que a
funcao 1+ e limitada e, por consequencia, integravel. Assim, podemos aplicar o
Lema 3.3.6, juntamente com a igualdade (3.3.12), para concluir que
Z
Z
Z
n
d = lim inf
d = k d.
(3.3.14)
n
n
Juntando as relacoes (3.3.13) e (3.3.14) obtemos que
Z
Z
1
+ d
k d.
k
R
Finalmente, tomando o nfimo sobre k obtemos que + d L.

Os Lemas 3.3.6 e 3.3.8 provam a relacao (3.3.5) e, portanto, o Teorema 3.3.3


quando inf k > para todo k. No caso geral, defina
n = max{n , n} e

= max{ , } e

+ = max{+ , }

para cada constante > 0. Os argumentos anteriores podem ser aplicados `a


sequencia (n )n para todo > 0 fixado. Portanto, + = em -quase todo
ponto para todo > 0. Como e + + quando , segue que
= + em -quase todo ponto. A prova do Teorema 3.3.3 est
a completa.


3.3. TEOREMA ERGODICO
SUBADITIVO

3.3.5

85

Expoentes de Lyapunov

Como observamos anteriormente, toda sequencia de somas orbitais


n =

n1
X
j=0

f j,

n1

e aditiva e, em particular, subaditiva. Portanto, o teorema erg


odico de Birkhoff
(Teorema 3.2.3) e um caso particular do Teorema 3.3.3.
Outra consequencia importante do teorema erg
odico subaditivo e o teorema
de Furstenberg-Kesten, que enunciamos a seguir.
Seja f : M M uma transformacao mensuravel e seja uma probabilidade
invariante. Seja : M GL(d) uma funcao mensuravel com valores no conjunto
GL(d) das matrizes quadradas invertveis de dimensao d. Seja 1 : M GL(d)
a funcao definida por 1 (x) = matriz inversa de (x). O cociclo definido por
e a sequencia de funcoes
n (x) = (f n1 (x)) (f (x))(x)

n (x) = inversa de n (f n (x))

para todo n 1 e x M .

Teorema 3.3.9 (Furstenberg-Kesten). Se log+ kk L1 () ent


ao
max (x) = lim
n

1
log kn (x)k
n

1
existe em -quase todo ponto. Alem disso, +
max L () e
Z
Z
Z
1
1
log kn k d = inf
log kn k d
max d = lim
n n
n n

Se log+ k1 k L1 () ent
ao

min (x) = lim


n

1
log kn (x)k
n

existe em -quase todo ponto. Alem disso, min L1 () e


Z
Z
Z
1
1
n
log k k d = sup
log kn k d.
min d = lim
n
n
n
n

Para deduzir este resultado do Teorema 3.3.3 basta observar que as sequencias
n
min
n
max
(x)k
n (x) = log k (x)k e n (x) = log k

sao subaditivas (lembre do Exemplo 3.3.2).


O teorema erg
odico multiplicativo de Oseledets, que vamos enunciar a seguir,
refina muito a conclusao do teorema de Furstenberg-Kesten. Ele afirma que, nas
mesmas condicoes do Teorema 3.3.9, para -quase todo x M existe um n
umero
inteiro positivo k = k(x) e existem n
umeros reais 1 (x) > > k (x) e uma
filtracao
Rd = Vx1 > > Vxk > Vxk+1 = {0}
(3.3.15)

tal que, para todo i {1, . . . , k} e para -quase todo x M ,


CAPITULO 3. TEOREMAS ERGODICOS

86

(a1) k(f (x)) = k(x) e i (f (x)) = i (x) e (x) Vxi = Vfi(x) ;


(b1) lim

1
log kn (x)vk = i (x) para todo v Vxi \ Vxi+1 ;
n

(c1) lim

X
1
di (x)i (x), onde di (x) = dim Vxi dim Vxi+1 .
log | det n (x)| =
n
i=1

Alem disso, os n
umeros k(x) e 1 (x), . . . , k (x) e os subespacos Vx1 , . . . , Vxk
dependem mensuravelmente do ponto x.
Os n
umeros i (x) sao chamados expoentes de Lyapunov de relativamente a
f no ponto x. Eles satisfazem 1 = max e k = min . Por esta raz
ao, tambem
chamamos max (x) e min (x) de expoentes de Laypunov extremais no ponto x.
Cada di (x) e chamado multiplicidade do expoente de Lyapunov i (x).
Quando f e invertvel, supondo tambem que log+ k1 k L1 (), e possvel
obter uma conclusao mais forte: no lugar da filtracao (3.3.15) obtemos uma
decomposicao
Rd = Ex1 Exk
(3.3.16)
tal que, para todo i = 1, . . . , k,
(a2) (x) Exi = Efi (x) e Vxi = Vxi+1 Exi ;
(b2)

lim

1
log kn (x)vk = i (x) para todo v Exi diferente de zero;
n
k

(c2)

X
1
di (x)i (x), onde di (x) = dim Exi .
log | det n (x)| =
n+ n
i=1
lim

As expressoes (3.3.15) e (3.3.16) est


ao relacionadas por Vxi = Exi Vxi+1 . Em
i
i
particular, dim Ex = dim Vx dim Vxi+1 .

3.3.6

Exerccios

1
3.3.1. Dada uma sequencia subaditiva (n )n com +
1 L (), mostre que as
funcoes
n
n
= lim inf
e + = lim sup
n
n
n
n

sao invariantes, isto e, (x) = f (x) e + (x) = + f (x) para -quase


todo x M .
3.3.2. Enuncie e prove o teorema erg
odico subaditivo para fluxos.
3.3.3. Seja f : M M um difeomorfismo de classe C 1 numa variedade compacta, preservando a medida de Lebesgue. Verifique que
k(x)

X
i=1

di (x)i (x) = 0 em -quase todo ponto x M

3.4. TEMPO DISCRETO E TEMPO CONTINUO

87

onde i (x), i = 1, . . . , k(x) sao os expoentes de Lyapunov de Df no ponto x e


di (x), i = 1, . . . , k(x) sao as respectivas multiplicidades.
3.3.4. Chamamos constante temporal de uma sequencia subaditiva de funcoes
(n )n ao limite
Z
1
n d.
lim
n n
Supondo que o limite existe e e finito, mostre que podemos escrever n = n +n
para cada n, de tal forma que (n )n e uma sequencia aditiva e (n )n e uma
sequencia subaditiva com constante temporal igual a zero.

3.3.5. Nas condicoes do teorema de Furstenberg-Kesten, mostre que a sequencia n = (1/n) log kn k e uniformemente integr
avel, no seguinte sentido: para
todo > 0 existe > 0 tal que
Z
n+ d < para todo n.
(E) <
E

3.3.6. Nas condicoes do teorema de Furstenberg-Kesten, para cada k 1, seja


k a media temporal de k relativamente a f k . Mostre que max (x) k (x)
para todo k e -quase todo x. Usando o Exerccio 3.3.5, mostre que para todo
> 0 e -quase todo x existe k tal que k (x) max (x) + .

3.4

Tempo discreto e tempo contnuo

A maior parte do tempo focamos a nossa apresentacao no contexto dos sistemas


dinamicos com tempo discreto. No entanto, quase tudo que foi dito ate aqui se
estende, de forma mais ou menos direta, para sistemas com tempo contnuo. A
raz
ao das duas teorias serem t
ao semelhantes e que e possvel relacionar sistemas
de um tipo com sistemas do outro tipo, por meio de certas construcoes que
vamos apresentar a seguir. Por simplicidade, nos ateremos ao caso de sistemas
invertveis.

3.4.1

Fluxos suspens
ao

A nossa primeira construcao associa a cada transformacao invertvel f : M M


e cada funcao mensuravel : M (0, ) um fluxo g t : N N , t R chamado
suspens
ao de f com tempo de retorno , cujas propriedades de recorrencia est
ao
diretamente ligadas `
as propriedades da transformacao f . Em particular, a cada
medida invariante por f vamos associar uma medida invariante pelo fluxo.
Na construcao suporemos que a funcao e tal que, para todo x M ,

X
j=1

(f j (x)) =

(f j (x)) = +.

j=1

Esse e o caso, por exemplo, se estiver afastada de zero.

(3.4.1)


CAPITULO 3. TEOREMAS ERGODICOS

88

O primeiro passo e construir o domnio N do fluxo suspens


ao. Consideremos
a transformacao F : M R M R dada por F (x, s) = (f (x), s (x)).
Observe que F e invertvel. Seja a relacao de equivalencia definida em M R
por
(x, s) (
x, s) existe n Z tal que F n (x, s) = (
x, s).
Denotamos por N o conjunto das classes de equivalencia desta relacao e por
: M R N a projecao canonica que associa a cada (x, s) M R a sua
classe de equivalencia.
Agora considere o fluxo Gt : M R M R dado por Gt (x, s) = (x, s + t).
imediato que Gt F = F Gt para todo t R. Isto garante que Gt , t R
E
induz um fluxo g t , t R no espaco quociente N , dado por
g t ((x, s)) = (Gt (x, s))

para todo x M e s, t R.

(3.4.2)

De fato, se (x, s) = (
x, s) ent
ao existe n Z tal que F n (x, s) = (
x, s). Logo,
Gt (
x, s) = Gt F n (x, s) = F n Gt (x, s)
e, portanto, (Gt (x, s)) = (Gt (
x, s)). Isto mostra que o fluxo g t , t R est
a
realmente bem definido.
Para compreender melhor como este fluxo se relaciona com a transformacao
f , precisamos apresentar a construcao de um ponto de vista mais concreto.
Consideremos o domnio D = {(x, s) M R : 0 s < (x)}. Afirmamos
que D e um domnio fundamental para a relacao de equivalencia , ou seja,
ele contem exatamente um representante de cada classe de equivalencia. A
unicidade do representante e imediata: basta observar que se (x, s) D ent
ao
F n (x, s) = (xn , sn ) com sn < 0 para todo n 1. Para provar a existencia,
precisamos da condicao (3.4.2): ela garante que os iterados (xn , sn ) = F n (x, s)
de qualquer (x, s) satisfazem
lim sn = e

n+

lim sn = +;

tomando n maximo tal que sn 0, temos que (xn , sn ) D. Desta forma, fica
provada a nossa afirmacao, a qual significa que a restricao da projecao ao
domnio D e uma bijecao sobre N . Portanto, podemos identificar N com D e,
em particular, podemos considerar g t , t R como um fluxo em D.
Da mesma forma, podemos identificar M com o subconjunto = (M {0})
de N . Observando que
g (x) ((x, 0)) = (x, (x)) = (f (x), 0)

(3.4.3)

vemos que, com esta identificacao, a transformacao f : M M corresponde


a transformacao de primeiro retorno (ou transformac
`
ao de Poincare ) do fluxo
suspens
ao a . Veja a Figura 3.2.
Agora seja uma medida em M invariante por f . Denotemos por ds a
claro que a medida (infinita) ds e invariante
medida de Lebesgue na reta R. E
pelo fluxo Gt , t R. Alem disso, ela e invariante pela transformacao F , uma

3.4. TEMPO DISCRETO E TEMPO CONTINUO

89

x
M
f (x)
R

(x)

Figura 3.2: Fluxo suspens


ao
vez que e invariante por f . Chamamos suspens
ao de com tempo de retorno
a medida definida em N por
= ( ds | D).

(3.4.4)

Em outras palavras, e a medida dada por


Z
Z
Z (x)
((x, s)) ds
d = d(x)
0

para cada funcao mensuravel limitada : N (0, ). Em particular,


Z
Z
(N ) = 1 d = (x) d(x)
(3.4.5)

e finito se, e somente se, a funcao e integravel para .

Proposi
c
ao 3.4.1. O fluxo g t , t R preserva a medida .

Demonstrac
ao. Fixemos t R. Dado qualquer conjunto mensuravel B N ,
= 1 (B) D. Pela definicao de , temos que (B) = ( ds)(B).
Para
seja B
n o conjunto dos (x, s) B
tais que Gt (x, s) F n (D) e seja
cada n Z seja B
n ). Como D e um domnio fundamental, {B
n : n Z} e uma particao
Bn = (B
e {Bn : n Z} e uma particao de B. Alem disso, B
n = 1 (Bn ) D e,
de B
n ) para todo n. A definicao do fluxo suspens
portanto, (Bn ) = ( ds)(B
ao
d
a que
[
[




n ) =
n ) .
1 g t (Bn ) = Gt 1 (Bn ) = Gt
F k (B
F k Gt (B
kZ

kZ

n )) D, conclumos que
Observando que F n (Gt (B



n )) .
g t (Bn ) = ( ds) 1 (g t (Bn )) D = ( ds) F n (Gt (B

Como a medida ds e invariante por F e por Gt , a u


ltima expressao e igual
n ). Portanto,
a ( ds)(B
X
X
n ) = ( ds)(B)
= (B).
(g t (B)) =
(g t (Bn )) =
( ds)(B
nZ

nZ


CAPITULO 3. TEOREMAS ERGODICOS

90

Isto prova que e invariante pelo fluxo g t , t R.


No Exerccio 3.4.2 convidamos o leitor a relacionar as propriedades de recorrencia dos sistemas (f, ) e (g t , ).

3.4.2

Transformac
oes de Poincar
e

A seguir, apresentamos uma especie de inversa da construcao descrita na secao


anterior. Seja g t : N N , t R um fluxo mensuravel e seja uma medida
invariante. Seja M uma sec
ao transversal do fluxo, ou seja, um subconjunto
de N tal que para todo x existe (x) (0, ] tal que g t (x)
/ para todo
t (0, (x)) e g (x)(x) sempre que (x) for finito. Chamamos (x) de
tempo de primeiro retorno de x a . O nosso objetivo e construir, a partir
de , uma medida invariante para a transformac
ao de primeiro retorno (ou
transformac
ao de Poincare )
f : {x : (x) < } ,

f (x) = g (x) (x).

Observe que esta transformacao e injetiva.


Para cada > 0, denotamos = {x : (x) }. Dados A
e (0, ], denotamos A = {g t (x) : x A e 0 t < }. Observe que a
aplicacao (x, t) 7 g t (x) e uma bijecao de A [0, ) em A . Suporemos que
est
a munida de uma -algebra de subconjuntos mensuraveis para a qual:
1. a funcao e as transformacoes f e f 1 sao mensuraveis;
2. se A e mensuravel ent
ao A N e mensuravel, para todo (0, ].
Lema 3.4.2. Seja A um subconjunto mensur
avel de para algum > 0.
Ent
ao, a func
ao 7 (A )/ e constante no intervalo (0, ].
claro que
Demonstrac
ao. Considere qualquer (0, ] e qualquer l 1. E
A =

l1
[

g i/l (A/l )

i=0

e esta uni
ao e disjunta. Usando que e invariante pelo fluxo g t , t R,
conclumos que (A ) = l(A/l ) para todo (0, ] e todo l 1. Ent
ao,
(Ar ) = r(A ) para todo (0, ] e todo n
umero racional r (0, 1). Usando
que os dois lados desta relacao variam monotonamente com r, conclumos que
a igualdade permanece valida para todo n
umero real r (0, 1). Isso implica a
conclusao do lema.
Dado qualquer subconjunto mensuravel A de , > 0, definimos
(A) =

(A )

para qualquer (0, ].

(3.4.6)

3.4. TEMPO DISCRETO E TEMPO CONTINUO

91

Em seguida, dado qualquer subconjunto mensuravel A de , definimos


(A) = sup (A ).

(3.4.7)

Veja a Figura 3.3. Deixamos ao cuidado do leitor verificar que e uma medida
em . N
os a chamaremos de transporte de pelo fluxo atraves de .

f (A)
f (A)

A
A

Figura 3.3: Medida transporte atraves de uma secao transversal


Proposi
c
ao 3.4.3. Suponhamos que a medida e finita. Ent
ao a medida
em e invariante pela transformac
ao de Poincare f .
Demonstrac
ao. Comecamos por observar que a transformacao f e essencialmente sobrejetiva: o complementar da imagem f () tem medida nula. De fato,
suponha que existe um conjunto E com (E) > 0 contido em \ f (). N
ao e
restricao supor que E para algum > 0. Ent
ao, (E ) > 0. Como e
finita, por hip
otese, podemos aplicar o teorema de recorrencia de Poincare ao
fluxo g t , t R. Obtemos que existe z E tal que g s (z) E para valores
de s > 0 arbitrariamente grandes. Por definicao, z = g t (y) para algum y E
e algum t (0, ]. Por construcao, a trajetoria passada de y intersecta e,
portanto, existe x tal que f (x) = y. Isto contradiz a escolha de E. Logo a
nossa afirmacao est
a provada.
Dado um conjunto mensuravel B , denotemos A = f 1 (B). Alem disso,
dado > 0, consideremos uma particao enumeravel de B em subconjuntos
mensuraveis B i satisfazendo as seguintes condicoes: para cada i existe i > 0
tal que
1. B i e Ai = f 1 (B i ) est
ao contidos em i ;
2. sup( | Ai ) inf( | Ai ) < i .
Em seguida, escolha ti < inf( | Ai ) sup( | Ai ) < si tais que si ti < i .
Fixe i = i /2. Ent
ao, usando o fato de que f e essencialmente sobrejetiva,
g ti (Aii ) Bi i (si ti )

g si (Aii ) Bi i +(si ti ) .


CAPITULO 3. TEOREMAS ERGODICOS

92

Logo, usando a hip


otese de que e invariante,
(Aii ) = (g ti (Aii )) (Bi i (si ti ) )

(Aii ) = (g si (Aii )) (Bi i +(si ti ) ).


Dividindo por i obtemos que
(si ti )
(B i ) > (1 2)(B i )

(si ti )
(B i ) < (1 + 2)(B i ).
(Ai ) 1 +

(Ai ) 1

Finalmente, somando sobre todos os valores de i, conclumos que


(1 2)(A) (B) (1 + 2)(A).
Como e arbitrario, isto prova que a medida e invariante por f .

3.4.3

Exerccios

3.4.1. Verifique que a funcao definida em (3.4.6)-(3.4.7) e de fato uma medida.


3.4.2. No contexto da Secao 3.4.1, suponha que M e um espaco topologico e
que f : M M e : M (0, ) sao contnuas. Seja g t : N N o fluxo
suspens
ao e seja a suspens
ao de uma medida boreliana invariante por f .
(a) Mostre que se x M e recorrente para a transformacao f ent
ao (x, s)
N e recorrente para o fluxo g t , qualquer que seja s R.
(b) Mostre que (x, s) N e recorrente para o fluxo g t , para algum s R,
ent
ao x M e recorrente para f .
(c) Conclua que o conjunto dos pontos recorrentes de f tem medida total para
se, e somente se, o conjunto dos pontos recorrentes de g t , t R tem
medida total para . Em particular, isto acontece se pelo menos uma das
medidas ou e finita.
3.4.3. Seja g t : N N , t R o fluxo definido por um campo de vetores
X de classe C 1 numa variedade riemanniana compacta N . Suponha que este
fluxo preserva a medida de volume associada `a metrica riemanniana. Seja
uma hipersuperfcie de N transversal a X e seja a medida de volume em
associada `
a restricao da metrica riemanniana. Defina : (0, ) por
(y) = |X(y) n(y)|, onde n() e um campo de vetores unit
ario ortogonal a
. Mostre que a medida = e invariante pela transformacao de Poincare
f : do fluxo. De fato, coincide com o transporte de pelo fluxo atraves
de .

3.4. TEMPO DISCRETO E TEMPO CONTINUO

93

3.4.4. A seguinte construcao tem um papel relevante na teoria de intercambios


R4+ o conjunto das 4-uplas (1 , 2 , h1 , h2 ) de n
de intervalos. Seja N
umeros
reais positivos, munido da medida de volume usual = d1 d2 dh1 dh2 . Defina

(1 2 , 2 , h1 , h1 + h2 ) se 1 > 2

F : N N , F (1 , 2 , h1 , h2 ) =
(1 , 2 1 , h1 + h2 , h2 ) se 1 < 2
pela relacao de
(F n
ao est
a definida quando 1 = 2 .) Seja N o quociente de N
N a projecao
equivalencia z z F n (z) = z para algum n Z e seja : N
canonica. Defina
N
, t R,
Gt : N

Gt (1 , 2 , h1 , h2 ) = (et 1 , et 2 , et h1 , et h2 ).

(0, ) o funcional dado por a


Seja a
:N
(1 , 2 , h1 , h2 ) = 1 h1 + 2 h2 . Para
c o subconjunto dos x N
tais que a
cada c > 0, seja N
(x) = c, seja c a medida
c pela restricao da metrica Riemanniana de R4 e seja
de volume definida em N
+
c = c /k grad a
k.
(a) Mostre que F preserva o funcional a
e, portanto, existe um funcional
a : N (0, ) tal que a = a
. Mostre que Gt comuta com F e preserva
a
. Logo, (Gt )t induz um fluxo (g t )t no espaco quociente N , o qual preserva
o funcional a. Justifique que F e (Gt )t preservam e c para todo c.
(b) Verifique que D = {(1 , 2 , h1 , h2 ) : 1 + 2 1 > max{1 , 2 } e um
domnio fundamental para . Considere a medida = (
| D) em N .
Justifique que a definicao n
ao depende da escolha do domnio fundamental
e mostre que e invariante pelo fluxo (g t )t . A medida e finita?
(c) Verifique que = ({(1 , 2 , h1 , h2 ) : 1 + 2 = 1}) e uma secao transversal para (g t )t . Calcule a transformacao de Poincare f : e a
respectiva funcao tempo de primeiro retorno . Calcule a medida transporte de pelo fluxo (g t )t atraves de . A medida e finita?
c ) e c = (
(d) Para cada c > 0, seja Nc = (N
c D). Mostre que Nc e c
sao invariantes por (g t )t , para todo c > 0. Verifique que c (Nc ) < para
todo c. Conclua que -quase todo ponto e recorrente pelo fluxo (g t )t .

94

CAPITULO 3. TEOREMAS ERGODICOS

Captulo 4

Ergodicidade
Os teoremas apresentados no captulo anterior d
ao plena justificativa `a primeira
parte da hip
otese erg
odica de Boltzmann: o tempo medio de visita (E, x) a
um dado conjunto mensuravel E est
a bem definido para quase todo ponto x.
A segunda parte da hip
otese erg
odica, isto e, que o tempo medio de visita seja
igual `
a medida de E para quase todo ponto x, e um enunciado de natureza
diferente e sera o tema do presente captulo.
Ao longo do captulo sempre suporemos que e uma medida de probabilidade invariante por uma transformacao mensuravel f : M M . Diremos
que o sistema (f, ) e erg
odico se, dado qualquer conjunto mensuravel E, temos
(E, x) = (E) para -quase todo ponto x M . Vamos ver que isto equivale
a dizer que o sistema e dinamicamente indivsivel, no sentido de que qualquer
conjunto invariante tem medida nula ou medida total. Outras formulacoes equivalentes da propriedade de ergodicidade serao discutidas na Secao 4.1. Uma delas e que medias temporais coincidem com medias espaciais: para toda funcao
integravel ,
Z
n1
1X
j
lim
(f (x)) = d em quase todo ponto.
n n
j=0
Nas Secao 4.2 apresentaremos, por meio de exemplos, diversas tecnicas para
provar ou desprovar ergodicidade. A maioria sera reutilizada posteriormente,
em situacoes mais complexas. Em seguida adotaremos o seguinte ponto de vista:
fixamos o sistema din
amico e analisamos as propriedades das medidas erg
odicas
dentro do espaco de todas as medidas invariantes desse sistema dinamico. Como
veremos na Secao 4.3, as medidas erg
odicas sao precisamente os elementos extremais desse espaco.
Na Secao 4.4 daremos um beve esboco do desenvolvimento historico da teoria, no
ambito dos sistemas conservativos. Os principais marcos sao a teoria
KAM, assim denominada em homenagem a Andrey Kolmogorov, Vladimir Arnold e J
urgen Moser, e a din
amica hiperb
olica, iniciada por Steven Smale, Dmitry Anosov, Yakov Sinai e seus colaboradores. As duas teorias lidam com tipos
95

CAPITULO 4. ERGODICIDADE

96

distintos de comportamento dinamico, eltico e hiperb


olico, e obtem conclusoes
opostas: em linhas gerais, sistemas hiperb
olicos sao erg
odicos mas sistemas
elticos n
ao sao.

4.1

Sistemas erg
odicos

Conforme dissemos, a medida diz-se erg


odica para f (ou f diz-se erg
odica
relativamente a ) se o tempo medio de visita a qualquer conjunto mensuravel
coincide, em -quase todo ponto, com a medida desse conjunto. Nas duas
subsecoes a seguir estudaremos diversas propriedades equivalentes a esta.

4.1.1

Conjuntos e fun
c
oes invariantes

Dizemos que uma funcao mensuravel : M R e invariante se = f


em -quase todo ponto. Ou seja, a menos de um conjunto com medida nula,
a funcao e constante em toda trajetoria de f . Alem disso, dizemos que um
conjunto mensuravel B M e invariante se a sua funcao caracterstica XB e
uma funcao invariante. Em outras palavras, B e invariante se ele difere da sua
pre-imagem f 1 (B) por um conjunto de medida nula:
(Bf 1 (B)) = 0.
facil
Veja no Exerccio 1.1.4 formulacoes equivalentes desta propriedade. E
verificar que a famlia de todos os conjuntos invariantes e uma -algebra, isto
e, ela e fechada para o complementar e para unioes e intersecoes enumeraveis.
Exemplo 4.1.1. Seja f a expansao decimal, introduzida na Secao 1.3.1, e seja
a medida de Lebesgue. Claramente, o conjunto A = Q [0, 1] dos n
umeros
racionais e invariante. Outro exemplo interessante e o conjunto dos pontos
x = 0, a0 a1 . . . em [0, 1] tais que a proporcao de dgitos ai com cada valor
k {0, . . . , 9} e prescrita.
P Ou seja, dado qualquer vetor p = (p0 , . . . , p9 ) tal que
pi 0 para todo i e i pi = 1, defina
1
#{0 i n 1 : ai = k} = pk para k = 0, . . . , 9}.
n
Para ver que Ap e invariante, observe que se x = 0, a0 a1 . . . ent
ao todo ponto

y f 1 (x) se escreve na forma y = 0, ba0 a1 . . . para algum b {0, . . . , 9}. E


claro que o dgito extra b n
ao muda a frequencia dos diversos valores 0, . . . , 9
na expansao decimal. Portanto y Ap se, e somente se, x Ap .
Ap = {x : lim
n

Exemplo 4.1.2. Seja : [0, 1] R uma funcao em L1 (). De acordo com o


teorema erg
odico de Birkhoff (Teorema 3.2.3), a sua media temporal e uma
funcao invariante. Ent
ao, todo conjunto de nvel
Bc = {x [0, 1]; (x)

= c},

e invariante. Observe tambem que toda funcao invariante e desta forma: e facil
ver que se e invariante ent
ao ela coincide em -quase todo ponto com a sua
media temporal .


4.1. SISTEMAS ERGODICOS

97

A seguinte proposicao coleta diversas maneiras equivalentes de definir ergodicidade. Dizemos que uma funcao e constante em -quase todo ponto se
existe c R tal que (x) = c para -quase todo x M .
Proposi
c
ao 4.1.3. Seja uma probabilidade invariante de uma transformac
ao
mensur
avel f : M M . As seguintes condic
oes s
ao equivalentes:
(a) Para todo conjunto mensur
avel B M tem-se (B, x) = (B) para quase todo ponto.
(b) Para todo conjunto mensur
avel B M a func
ao (B, ) e constante em
-quase todo ponto.
R
(c) Para toda func
ao integr
avel : M R tem-se (x)

= d para quase todo ponto.


(d) Para toda func
ao integr
avel : M R a media temporal : M R e
constante em -quase todo ponto.
R
(e) Para toda func
ao integr
avel invariante : M R tem-se (x) = d
para -quase todo ponto.
(f ) Toda func
ao integr
avel invariante : M R e constante em -quase
todo ponto.
(g) Para todo subconjunto invariante A tem-se (A) = 0 ou (A) = 1.
imediato que (a) implica (b), que (c) implica (d) e que (e)
Demonstrac
ao. E
implica (f). Tambem e claro que (e) implica (c) e (f) implica (d), porque a media
temporal e uma funcao invariante (lembre da Proposicao 3.2.4). Analogamente,
(c) implica (a) e (d) implica (b), porque o tempo medio de visita e uma media
temporal (da funcao caracterstica de B). Agora basta provar as seguintes
implicacoes:
(b) implica (g): Seja A um conjunto invariante. Ent
ao (A, x) = 1 para
-quase todo x A e (A, x) = 0 para -quase todo x Ac . Como (A, ) e
constante em -quase todo ponto, por hipotese, segue que (A) = 0 ou (A) = 1.
(g) implica (e): Seja uma funcao integravel invariante. Ent
ao todo conjunto
Bc = {x M : (x) c}

e invariante. Logo, a hip


otese implica que (Bc ) {0, 1} para todo c R.
Como c 7 (Bc ) e n
ao -decrescente, segue que existe c R tal que (Bc ) = 0
para todo c <R c e (Bc ) = 1 para todo cR c. Ent
ao = c em -quase todo
ponto. Logo, d = c e, portanto, = d em -quase todo ponto.

4.1.2

Caracterizac
ao espectral

A proxima proposicao caracteriza a propriedade de ergodicidade por meio do


operador de Koopman Uf () = f :

CAPITULO 4. ERGODICIDADE

98

Proposi
c
ao 4.1.4. Seja uma probabilidade invariante de uma transformac
ao
mensur
avel f : M M . As seguintes condic
oes s
ao equivalentes:
(a) (f, ) e erg
odico.
(b) Para qualquer par de conjuntos mensur
aveis A e B vale
lim
n

n1
1X
(f j (A) B) = (A)(B).
n j=0

(4.1.1)

(c) Para quaisquer func


oes Lp () e Lq (), com 1/p + 1/q = 1, vale
lim
n

Z
Z
n1 Z
1X
(Ufj ) d = d d.
n j=0

(4.1.2)

claro que (c) implica (b): basta tomar = XA e = XB .


Demonstrac
ao. E
Para mostrar que (b) implica (a), suponha que A e um conjunto invariante.
Tomando A = B na hipotese (b), obtemos que
(A) = lim
n

n1
1X
(f j (A) A) = (A)2 .
n j=0

Isto implica que (A) = 0 ou (A) = 1.


Agora resta provar que (a) implica (c). Considere Lp () e Lq ().
Por ergodicidade e pelo teorema erg
odico de Birkhoff (Teorema 3.2.3) temos que
Z
n1
1X j
U d
n j=0 f

(4.1.3)

em -quase todo ponto. Inicialmente, suponha que || k para algum k 1.


Ent
ao, para todo n N,
X j 
1 n1

U k||.
n j=0 f

Logo, como k|| L1 (), podemos usar o teorema da convergencia dominada


(Teorema A.2.11) para concluir que
Z

Z
Z
n1
1X j
Uf ) d d d.
n j=0

Isto prova a afirmcao (4.1.2) quando e limitada. Falta remover esta u


ltima
condicao. Dado qualquer Lp () e dado k 1, defina

se (x) > k
k
(x) se (x) [k, k]
k (x) =

k
se (x) < k.


4.1. SISTEMAS ERGODICOS

99

Fixemos > 0. Pelo argumento anterior, para todo k 1 vale que



Z
Z
n1

1X j
Uf k ) d k d d <
(
n j=0

(4.1.4)

se n e suficientemente grande (dependendo de k). Em seguida, observe que


kk kp 0 quando k . Logo, usando a desigualdade de H
older (Teorema A.5.5), temos que
Z
Z
Z




(k ) d d kk kp d < ,
(4.1.5)

para todo k suficientemente grande. De modo semelhante,



n1
n1 Z


1 X
1X j
Uf (k ) d
Ufj (k ) d
n j=0
n j=0

n1
1X
kU j (k )kp kkq d
n j=0 f

(4.1.6)

= kk kp kkq < ,

para todo n e todo k suficientemente grande, independente de n. Fixe k tal


que (4.1.5) e (4.1.6) sejam validas e, em seguida, tome n suficientemente grande
para que (4.1.4) valha igualmente. Somando as tres relacoes (4.1.4) a (4.1.6),
obtemos que
Z
Z
Z
n1
X j


(1
Uf ) d d d < 3
n j=0

para todo n suficientemente grande. Isto conclui a prova da condicao (c).

No caso p = q = 2, a condicao (4.1.2) pode ser expressa em termos do


produto interno no espaco L2 (). Desta forma obtemos que (f, ) e erg
odico
se, e somente se:
lim
n

n1

1 X n
(Uf ) ( 1) = 0
n j=0

para todo , L2 ().

(4.1.7)

Usaremos algumas vezes o seguinte fato elementar: dados quaisquer conjuntos mensuraveis A e B,
|(A) (B)| = |(A \ B) (B \ A)|

|(A \ B)| + |(B \ A)| = (AB).

(4.1.8)

Corol
ario 4.1.5. Suponha que a condic
ao (4.1.1) na Proposic
ao 4.1.4 e satisfeita para todo A e B em alguma a
lgebra A que gera a -
algebra dos conjuntos
mensur
aveis. Ent
ao (f, ) e erg
odico.

CAPITULO 4. ERGODICIDADE

100

Demonstrac
ao. S
o precisamos mostrar que a condicao (4.1.1) se estende a todo
par de borelianos. Sejam A e B conjuntos mensuraveis quaisquer. Pelo teorema
de aproximacao (Teorema A.1.19), dado qualquer > 0 existem A0 e B0 em A
tais que (AA0 ) < e (BB0 ) < . Observe que


(f j (A) B) (f j (A0 ) B0 ) (AA0 ) + (BB0 ) < 2

para todo j e |(A)(B) (A0 )(B0 )| (AA0 ) + (BB0 ) < 2. Ent


ao,
a hip
otese
n1
1X
(f j (A0 ) B0 ) = (A0 )(B0 )
lim
n n
j=0
implica que
4 lim inf
n

n1
1X
(f j (A) B) (A)(B)
n j=0

lim sup
n

n1
1X
(f j (A) B) (A)(B) 4.
n j=0

Como e arbitrario, isto prova a nossa afirmacao.


De modo semelhante, basta verificar o item (c) da Proposicao 4.1.4 em
subconjuntos densos. A prova deste fato fica a cargo do leitor (veja o Exerccio 4.1.3):
Corol
ario 4.1.6. Suponha que a condic
ao (4.1.2) na Proposic
ao 4.1.4 e satisfeita para todo e em subconjuntos densos de Lp () e Lq (), respectivamente.
Ent
ao (f, ) e erg
odico.

4.1.3

Exerccios

4.1.1. Sejam (M, A) um espaco mensuravel e f : M M uma transformacao


mensuravel. Prove que se p M e um ponto periodico de perodo k, ent
ao a
odica.
medida p = k1 (p + f (p) + + f k1 (p) ) e erg
4.1.2. Seja uma probabilidade invariante, n
ao necessariamente erg
odica, de
uma transformacao mensuravel f : M M . Mostre que dados quaisquer
conjuntos mensuraveis A e B existe o limite
lim
n

n1
1X
(f i (A) B).
n i=0

4.1.3. Mostre que uma probabilidade invariante e erg


odica para uma transformacao f se, e somente se, ocorre qualquer uma das seguintes condicoes:
S
(a) ( n0 f n (A)) = 1 para todo A mensuravel com (A) > 0;

101

4.2. EXEMPLOS

(b) dados quaisquer conjuntos mensur


aveis A, B com (A)(B) > 0, existe

n 1 tal que f n (A) B > 0;

(c) a convergencia na condicao (c) da Proposicao 4.1.4 vale para alguma escolha de p, q e algum subconjunto denso de funcoes Lp () e Lq ();

(d) existe p [1, ] tal que toda funcao invariante Lp () e constante em


-quase todo ponto;
(e) toda funcao integravel com f em -quase todo ponto (ou
f em -quase todo ponto) e constante em -quase todo ponto.
4.1.4. Suponha que M e um espaco metrico. Prove que e erg
odica para
f : M M se, e somente se, a media temporal de toda funcao uniformemente
contnua limitada : M R e constante em -quase todo ponto.
4.1.5. Dada uma probabilidade invariante , chamamos bacia de o conjunto
B() dos pontos x M tais que
Z
n1
1X
j
(f (x)) = d
lim
n n
j=0
para toda funcao contnua : M R. Justifique que a bacia e um conjunto
invariante. Alem disso, se e erg
odica ent
ao B() tem -medida total.
4.1.6. Mostre que se e sao probabilidades erg
odicas distintas de uma transformacao f : M M , ent
ao e sao mutuamente singulares.
4.1.7. Seja uma probabilidade invariante de uma transformacao f : M M .
Mostre que a medida produto 2 = e invariante pela transformacao
f2 : M M M M definida por f2 (x, y) = (f (x), f (y)). Alem disso, se
(f2 , 2 ) e erg
odico ent
ao (f, ) e erg
odico. A recproca e verdadeira?
4.1.8. Seja f : M M uma transformacao preservando uma probabilidade
. Suponha que (f n , ) e erg
odico para todo n 1. Mostre que se e uma
autofuncao n
ao constante do operador de Koopman Uf ent
ao o autovalor n
ao
e raiz da unidade e qualquer conjunto onde e constante tem medida nula.

4.2

Exemplos

Nesta secao apresentamos, por meio de exemplos, diversos metodos para verificar se um dado sistema e ou n
ao erg
odico.

4.2.1

Rotac
oes em toros

Consideremos inicialmente o caso de uma rotacao R : S 1 S 1 no crculo


S 1 = R/Z. Conforme observamos na Secao 1.3.3, a medida de Lebesgue m e

CAPITULO 4. ERGODICIDADE

102

invariante por R . Queremos analisar o comportamento erg


odico do sistema
(R , m) para os diferentes valores de .
Se e racional, digamos = p/q em forma irredutvel, ent
ao Rq (x) = x para
1
1
todo x S . Ent
ao, dado qualquer segmento I S com comprimento menor
que 1/q, o conjunto
A = I R (I) Rq1 (I)
e invariante e a sua medida de Lebesgue satisfaz 0 < m(A) < 1. Assim, se
e racional a medida de Lebesgue n
ao e erg
odica. A recproca e muito mais
interessante:
Proposi
c
ao 4.2.1. Se e irracional, ent
ao R e erg
odica para a medida de
Lebesgue.
Vamos mencionar duas demonstracoes diferentes deste fato. A primeira,
que detalharemos a seguir, usa fatos simples de Analise de Fourier. A segunda,
que deixaremos como exerccio (Exerccio 4.2.6), e baseada num argumento de
ponto de densidade semelhante ao que usaremos na Secao 4.2.2 para provar a
ergodicidade da expansao decimal.
Como anteriormente, denotamos por L2 (m) o espaco de Hilbert das funcoes
mensuraveis cujo quadrado e integravel, ou seja, tais que:
Z
||2 dm < .
conveniente considerarmos funcoes com valores em C, e assim sera feito ao
E
longo da secao. Usaremos o fato bem conhecido de que a famlia de funcoes
k : S 1 C, x 7 e2ikx ,

kZ

e uma base de Hilbert deste espaco: dado qualquer L2 (m) existe uma u
nica
sequencia (ak )kZ de n
umeros complexos tais que
X
(x) =
ak e2ikx para quase todo x S 1 .
(4.2.1)
kZ

Considere a expansao em serie de Fourier (4.2.1) de uma funcao qualquer


L2 (m). Ent
ao
 X
R (x) =
ak e2ik e2ikx .
(4.2.2)
kZ

Suponha que e invariante. Ent


ao (4.2.1) e (4.2.2) coincidem. Pela unicidade
dos coeficientes da expansao de Fourier, isto acontece se, e somente se,
ak e2ik = ak

para todo k Z.

A hip
otese de que e irracional significa que e2ik 6= 1 para todo k 6= 0. Ent
ao
a relacao que acabamos de obter implica que ak = 0 para todo k 6= 0. Em
outras palavras, (z) = a0 para m-quase todo z S 1 . Em particular, a funcao

103

4.2. EXEMPLOS

caracterstica = XA de qualquer conjunto invariante A S 1 e constante em


m-quase todo ponto. Isto e o mesmo que dizer que A tem medida zero ou um.
Logo, pela Proposicao 4.1.3, temos que m e erg
odica.
Estas observacoes estendem-se naturalmente `as rotacoes no d-toro Td , para
qualquer d 1:
Proposi
c
ao 4.2.2. Se = (1 , . . . , d ) e racionalmente independente ent
ao a
rotac
ao R : Td Td e erg
odica para a medida de Lebesgue.
Isto pode ser provado por um argumento analogo ao do caso d = 1, usando
o fato de que a famlia de funcoes
k1 ,...,kd : Td C, (x1 , . . . , xd ) 7 e2i(k1 x1 ++kd xd ) ,

(k1 , . . . , kd ) Zd

e uma base de Hilbert do espaco L2 (m) das funcoes : Td C com quadrado


somavel. Deixamos esta tarefa ao cuidado do leitor (Exerccio 4.2.1).
Corol
ario 4.2.3. Se = (1 , . . . , d ) e racionalmente independente ent
ao a
rotac
ao R : Td Td e minimal, ou seja, toda
orbita O(x) = {Rn (x) : n N}
e densa em Td .
Demonstrac
ao. Consideremos em Td a distancia plana, que e definida por
d([], []) = inf{d( , ) : , Rd , , }.
Observe que esta distancia e preservada por toda rotacao. Seja {Uk : k N}
uma base enumer
avel de abertos de Td e seja m a medida de Lebesgue em
d
T . Por ergodicidade, existe W Td , com medida de Lebesgue total, tal que
(Uk , x) = m(Uk ) > 0 para todo k e todo x W . Em particular, a orbita
de x e densa em Td para todo x W . Agora considere um ponto arbitrario
x M e seja y W qualquer. Ent
ao, para todo > 0 existe k 1 tal que
d(f k (y), x) < . Segue ent
ao que d(f n+k (y), f n (x)) < para todo n 1. Como
a orbita de y e densa, isto implica que a orbita de x e -densa, ou seja, ela
intersecta a -vizinhanca de todo ponto. Como e arbitrario, isto implica que
a orbita de x e densa no toro ambiente.
De fato as rotacoes irracionais no crculo ou, mais geralmente, nos toros
satisfazem uma propriedade muito mais forte do que ergodicidade: elas sao
unicamente erg
odicas, o que quer dizer que elas tem uma u
nica probabilidade
invariante (que e a medida de Lebesgue, claro). Sistemas unicamente erg
odicos
serao estudados no Captulo 6.

4.2.2

Expans
ao decimal

Considere a transformacao f : [0, 1] [0, 1], f (x) = 10x [10x] que gera
a expansao decimal. Na Secao 1.3.1 verificamos que f preserva a medida de
Lebesgue m. Afirmamos:
Proposi
c
ao 4.2.4. A transformac
ao f e erg
odica para a medida de Lebesgue
m.

CAPITULO 4. ERGODICIDADE

104

Demonstrac
ao. De acordo com a Proposicao 4.1.3, basta provar que todo conjunto invariante A tem medida total. O principal ingrediente e o teorema de
derivacao de Lebesgue (Teorema A.2.15), segundo o qual quase todo ponto de A
e ponto de densidade de A. Mais precisamente (veja tambem o Exerccio A.2.9),
m-quase todo ponto a A satisfaz
lim inf


 m(I A)
: I intervalo tal que a I B(a, ) = 1 .
m(I)

(4.2.3)

Fixemos um ponto de densidade a A. Como o conjunto dos pontos da forma


m/10k , k N, 0 m 10k tem medida nula, podemos supor, sem qualquer restricao, que a n
ao e desta forma. Consideremos a sequencia famlia de
intervalos
I(k, m) =

m1 m 
,
,
10k 10k

k N,

m = 1, . . . , 10k .

claro que para cada k N existe um u


E
nico m = mk tal que I(k, mk ) contem
o ponto a. Denotaremos Ik = I(k, mk ). A propriedade (4.2.3) implica que
m(Ik A)
1
m(Ik )

quando k .

Observe tambem que cada f k e uma bijecao afim de Ik sobre o intervalo (0, 1).
Isso tem a seguinte consequencia, que e crucial para o nosso argumento:
Lema 4.2.5 (Distorcao limitada). Para todo k N, vale
m(E1 )
m(f k (E1 ))
=
k
m(f (E2 ))
m(E2 )

(4.2.4)

para quaisquer subconjuntos mensur


aveis E1 e E2 de Ik .
Aplicando este fato a E1 = Ik A e E2 = Ik obtemos que

m f k (Ik A)
m(Ik A)

=
.
m(Ik )
m (0, 1)


Claro que m (0, 1) = 1. Alem disso, como estamos supondo que A e invariante,
f k (Ik A) est
a contido em A. Deste modo obtemos que
m(A)

m(Ik A)
m(Ik )

para todo k.

Como a sequencia do lado direito converge para 1 quando k , segue que


m(A) = 1, como queramos demonstrar.
O Lema 4.2.5 depende do
 fato de que a transformacao f e afim em cada
intervalo (m 1)/10, m/10 e isso pode dar a impressao de que o metodo de

4.2. EXEMPLOS

105

demonstracao que acabamos de apresentar est


a restrito a uma classe muito particular de exemplos. De fato, n
ao e assim, muito pelo contrario. A raz
ao e que
existem muitas situacoes interessantes nas quais e possvel obter uma versao
apenas um pouco mais fraca do enunciado do Lema, mas que ainda e suficiente
para concluir a demonstracao da ergodicidade. Em poucas palavras, no lugar de
afirmar que os dois lados de (4.2.4) sao iguais, mostra-se, em muitos casos, que a
raz
ao entre os dois termos e limitada por alguma constante uniforme. Isso e chamado de propriedade de distorc
ao limitada. Como exemplo de aplicacao destas
ideias, na Secao 4.2.4 provaremos que a transformacao de Gauss e erg
odica.
Em seguida vamos dar uma aplicacao da Proposicao 4.2.4 no contexto da
Teoria dos N
umeros. Dizemos que um n
umero x R e balanceado (ou normal )
se todo dgito aparece com a mesma freq
uencia, 1/10, na sua expansao decimal.
facil dar exemplos de n
E
umeros balanceados ou n
ao-balanceados mas, em geral,
e muito difcil decidir se um dado n
umero irracional e balanceado ou n
ao. Por
exemplo, n
ao e sabido ate hoje se o n
umero e balanceado.
Por outro lado, a proposicao anterior nos permite mostrar, facilmente, que
quase todo n
umero e balanceado. Este resultado e conhecido como teorema
normal de Borel:
Proposi
c
ao 4.2.6. O conjunto dos n
umeros x R n
ao balanceados tem medida
de Lebesgue nula.
Demonstrac
ao. Como o fato de ser balanceado e independente da parte inteira
do n
umero, so precisamos mostrar que quase todo x [0, 1] e balanceado.
Considere f : [0, 1] [0, 1] definida por f (x) = 10x [10x]. Para cada dgito
j {0, . . . , 9} considere o intervalo Ij = [j/10, (j + 1)/10). Recorde que se x =
0, a0 a1 ak ak+1 ent
ao f k (x) = 0, ak ak+1 para cada k 1. Portanto,
k
f (x) Ij se, e somente se, o j-esimo dgito da expansao decimal de x e igual a j.
Consequentemente, o tempo medio de visita (Ij , x) e exatamente a frequencia
do dgito j na expansao decimal de x. Usando o teorema erg
odico de Birkhoff,
e o fato de que a transformacao f e erg
odica para a medida de Lebesgue m,
conclumos que para cada j {0, . . . , 9} existe um subconjunto Bj de [0, 1] com
m(Bj ) = 1 tal que
1
para todo x Bj .
10
Ent
ao B = B0 B1 B9 tambem tem m(B) = 1, e todo n
umero x B e
balanceado.
(Ij , x) = m(Ij ) =

4.2.3

Deslocamentos de Bernoulli

Seja (X, C, ) um espaco de probabilidade qualquer. Nesta secao consideramos


o espaco produto = X N , munido da -algebra produto B = C N e da medida
produto = N , que foram definidas na Secao A.2.3. Isto quer dizer que M
e o conjunto de todas as sequencias (xn )nN com xn X para todo n. Por
definicao, B e a -algebra gerada pelos cilindros
[m; Am , . . . , An ] = {(xi )iI : xi Ai para m i n}

CAPITULO 4. ERGODICIDADE

106

onde m n e cada Ai e um elemento de C. Alem disso, e caracterizada por


([m; Am , . . . , An ]) =

n
Y

(Ai ).

(4.2.5)

i=m

Podemos pensar nos elementos de como representando os resultados de


sequencias de experimentos regidos por uma mesma distribuicao de probabilidade : dado qualquer conjunto mensuravel A X, a probabilidade de obtermos xi A e igual a (A), qualquer que seja i. Alem disso, os resultados dos
sucessivos experimentos sao independentes: de fato a relacao (4.2.5) signfica que
a probabilidade de xi Ai para todo m i n e o produto das probabilidades
de cada um dos eventos xi Ai separadamente.
Nesta secao introduzimos uma dinamica : no espaco , chamada
deslocamento (ou shift) de Bernoulli, que preserva a medida . O principal
resultado e que o sistema obtido deste modo e erg
odico. Vale a pena observar que
e possvel substituir N por Z em toda a construcao, ou seja, podemos considerar
como sendo o espaco das sequencias bilaterais (. . . , xn , . . . , x0 , . . . , xn , . . . ).
A menos de pequenos ajustes, que deixamos a cargo do leitor, tudo o que vai
ser dito em seguida permanece valido nesse caso. Alem disso, no caso bilateral
o deslocamento de Bernoulli e uma aplicacao invertvel.
O deslocamento de Bernoulli e a dupla (, ) onde : e a aplicacao
definida por
(xn )n ) = (xn+1 ))n .
Ou seja, envia a sequencia (x0 , x1 , . . . , xn , . . . ) na sequencia (x1 , . . . , xn , . . . ).
Observe que a pre-imagem de qualquer cilindro ainda e um cilindro:
1 ([m; Am , . . . , An ]) = [m + 1; Am , . . . , An ].

(4.2.6)

Segue que e mensuravel relativamente `a -algebra B. Alem disso,



1 ([m; Am , . . . , An ]) = (Am ) (An ) = [m; Am , . . . , An ]

e (usando o Lema 1.3.1) isso assegura que a medida e invariante por .


Proposi
c
ao 4.2.7. Todo deslocamento de Bernoulli (, ) e erg
odico.
Demonstrac
ao. Seja A um conjunto mensuravel invariante qualquer. Queremos
mostrar que (A) = 0 ou (A) = 1. Vamos usar o seguinte fato:
Lema 4.2.8. Se B e C s
ao uni
oes finitas de cilindros disjuntos dois-a-dois,
ent
ao tem-se
(B j (C)) = (B)( j (C)) = (B)(C),
para todo j suficientemente grande.

107

4.2. EXEMPLOS

Demonstrac
ao. Para comecar, suponhamos que B e C sao ambos cilindros:
B = [k; Bk , . . . , Bl ] e C = [m; Cm , . . . , Cn ]. Ent
ao,
j (C) = [m + j; Cm , . . . , Cn ] para cada j.
Consider qualquer j suficientemente grande para que m + j > l. Ent
ao,
B j (C) = {(xn )n : xk Bk , . . . , xl Bl , xm+j Cm , . . . , xn+j Cn }
= [k; Bk , . . . , Bl , X, . . . , X, Cm , . . . , Cn ],

onde X aparece exatamente m + j l 1 vezes. Pela definicao (4.2.5), isto d


a
que
l
n
Y
Y
(Ci ) = (B)(C).
(Bi ) 1m+jl1
(B j (C)) =
i=k

i=m

Isto prova a conclusao do lema quando os conjuntos envolvidos sao cilindros. O


caso geral segue imediatamente, pelo fato de ser finitamente aditiva.
Suponhamos, inicialmente, que o conjunto invariante A pertence `a algebra
B0 das uni
oes finitas de cilindros disjuntos. Nesse caso podemos aplicar o lema
anterior com B = C = A. Conclumos que (A j (A)) = (A)2 sempre que
tomemos j suficientemente grande. Mas, como A e invariante, o lado esquerdo
desta igualdade e (A). Desta forma obtemos que (A) = (A)2 , o que so pode
acontecer se (A) = 0 ou (A) = 1.
Agora vamos fazer a prova quando A e um conjunto invariante mensuravel
qualquer. A ideia e aproximar o conjunto invariante por elementos da algebra
B0 , usando o teorema de aproximacao (Teorema A.1.19): dado qualquer > 0
existe B B0 tal que (AB) < . Fixemos j tal que
(B j (B)) = (B)( m (B)) = (B)2 .

(4.2.7)

Observe que a diferenca simetrica (A j (A))(B j (B)) est


a contida em
(AB) ( j (A) j (B)) = (AB) j (AB).
Isto, juntamente com o fato de que e invariante por f , implica que


(A j (A)) (B j (B)) 2(AB) < 2

(lembre da relacao (4.1.8)). Alem disso,






(A)2 (B)2 2 (A) (B) < 2.

(4.2.8)

(4.2.9)

Juntando as relacoes (4.2.7), (4.2.8), (4.2.9), conclumos que |(A)(A)2 | < 4.


Como e arbitrario, deduzimos que (A) = (A)2 e, portanto, ou (A) = 0 ou
(A) = 1.

CAPITULO 4. ERGODICIDADE

108

Quando X e um espaco topologico, e C e a sua -algebra de Borel, podemos


munir com a topologia produto que e, por definicao, a topologia gerada pelos
cilindros [m; Am , . . . , An ] onde os conjuntos Am , . . . , An sao abertos de X. A
propriedade (4.2.6) implica que o deslocamento : e contnuo para esta
topologia. O teorema de Tychonoff (veja [Dug66]) afirma que e compacto se
X for compacto.
Um caso particular importante ocorre quando X e um conjunto finito munido
da topologia discreta, na qual todo subconjunto e aberto. Dizemos que uma
transformacao f : M M e transitiva se existe x M cuja trajetoria f n (x),
n 1 e densa em . Deixamos a demonstracao do proximo resultado a cargo
do leitor (Exerccio 4.2.2):
Proposi
c
ao 4.2.9. Seja X um conjunto finito e = X N ou = X Z . Ent
ao o
deslocamento : e uma aplicac
ao contnua e transitiva. Alem disso, o
conjunto dos pontos peri
odicos de e denso em .
A seguinte afirmacao, que e uma das variantes do paradoxo do macaco, ilustra
o significado da ergodicidade da medida : Se colocarmos um macaco para digitar texto durante um tempo infinito ent
ao, com probabilidade total, ele acabar
a
digitando Os Lusadas 1 e, de fato, o far
a infinitas vezes.
Para demonstrar esta afirmacao precisamos formular a situacao de modo
um pouco mais preciso. Consideramos que o macaco se encontra perante o
teclado, apertando uma tecla apos outra, ao acaso. O texto digitado e, portanto,
uma sequencia (xn )nN onde xn pertence ao conjunto (finito) X dos caracteres
no teclado: letras, espaco, hfen, sinais de pontuacao, etc. Supomos que cada
caracter i no teclado tem uma probabilidade positiva pi de ser digitado, a cada
vez. Isto corresponde a uma medida de probabilidade
X
=
p i i
iX

no conjunto X dos caracteres. Tambem supomos que a escolha de cada tecla


e independente das teclas digitadas anteriormente (o macaco n
ao sabe o que
est
a escrevendo, ele apenas aperta teclas ao acaso). Isto quer dizer que as
possveis sequencias (xn )n sao regidas pela probabilidade de Bernoulli = N .
Denotamos por : a aplicacao deslocamento no espaco = X N .
O texto de Os Lusadas corresponde a uma certa sequencia finita (mas
longa) de caracteres (l0 , . . . , lN ). Consideremos o cilindro L = [0; l0 , . . . , lN ].
Ent
ao
N
Y
plj > 0.
(L) =
j=1

Uma sequencia (xn )n contem o texto


 de Os Lusadas, comecando no k-esimo
odico de Birkhoff
caracter, precisamente se k (xn )n L. Pelo teorema erg
1 Poema
epico monumental, em 10 cantos, de autoria do poeta portugu
es Luis de Cam
oes,
falecido em Lisboa em 1580.

109

4.2. EXEMPLOS

e pela ergodicidade de (, ), com probabilidade total isso acontece para um


conjunto K de valores de k satisfazendo
lim
n

1
#(K [0, n 1]) = (L) > 0.
n

(4.2.10)

Em particular, o conjunto K e infinito. Ou seja, a sequencia digitada contem


infinitas c
opias de Os Lusadas, conforme afirmamos. Na verdade, (4.2.10)
prova ainda mais: sempre com probabilidade total, as c
opias do nosso poema
ocupam uma fracao positiva de todos os caracteres digitados. Em outras palavras, em media, o macaco digita uma nova c
opia de Os Lusadas a cada
tantos anos.

4.2.4

Transformac
ao de Gauss

Como vimos na Secao 1.3.2, a transformacao de Gauss G(x) = 1/x [1/x]


admite uma probabilidade invariante que e equivalente `a medida de Lebesgue,
a saber:
Z
dx
1
.
(4.2.11)
(E) =
log 2 E 1 + x
Proposi
c
ao 4.2.10. O sistema (G, ) e erg
odico.
Este fato pode ser demonstrado por uma versao mais elaborada do metodo
que usamos na Secao 4.2.2. Vamos esbocar o argumento da demonstracao,
focando na principal dificuldade adicional.
Seja A um conjunto invariante com medida positiva. Queremos mostrar que
(A) = 1. Em primeiro lugar, continua sendo verdade que para quase todo
ponto a [0, 1] existe uma sequencia de intervalos Ik contendo a e tais que Gk
envia Ik bijetivamente e diferenciavelmente sobre (0, 1). Tais intervalos podem
ser encontrados da seguinte forma. Primeiramente, considere
I(1, m) =

1
1
,
,
m+1 m

para cada m 1. Em seguida defina, por recorrencia,


I(k, m1 , . . . , mk ) = I(1, m1 ) Gk+1 I(k 1, m2 , . . . , mk )

para m1 , . . . , mk 1. Ent
ao, basta tomar para Ik o intervalo I(k, m1 , . . . , mk )
que contem a. Isto est
a bem definido para todo k 1 e todo ponto a no
k
complementar de um conjunto enumeravel, a saber, o conjunto
({0, 1}).
k=0 G
k
Por outro lado, embora a restricao de G a cada Ik seja uma bijecao diferenci
avel, ela n
ao e afim. Por essa raz
ao, n
ao temos o analogo da relacao (4.2.4)
neste caso. Esta dificuldade e contornada por meio do seguinte resultado, que
e um exemplo de controle da distorc
ao: e importante notar que a constante K
no enunciado e independente de Ik , E1 , E2 e, sobretudo, k.

CAPITULO 4. ERGODICIDADE

110

Proposi
c
ao 4.2.11 (Distorcao limitada). Existe uma constante K > 1 tal que
para todo k 1 e todo intervalo Ik tal que Gk restrita a Ik e uma bijec
ao
diferenci
avel, tem-se
(E1 )
(Gk (E1 ))
K
(Gk (E2 ))
(E2 )
para quaisquer subconjuntos mensur
aveis E1 e E2 de Ik .
Para a prova desta proposicao precisamos de dois resultados auxiliares:
Lema 4.2.12. Para todo x (0, 1] vale que
|G (x)| 1

|(G2 ) (x)| 2

|G (x)/G (x)2 | 2.

Demonstrac
ao. Lembre que G(x) = 1/xm em cada intervalo (1/(m+1), 1/m].
Portanto
2
1
G (x) = 2 e G (x) = 3 .
x
x
A primeira igualdade implica |G (x)| 1 para todo x (0, 1]. Alem disso
|G (x)| 2 sempre que x 2/3. Por outro lado, x 2/3 implica que
G(x) = 1/x1 < 2/3 e, por consequencia, G (G(x)) 2. Combinando estas observacoes obtemos que |(G2 ) (x)| = |G (x)| |G (G(x))| 2 para todo x (0, 1].
Finalmente, |G (x)/G (x)2 | = 2|x| 2 tambem para todo x (0, 1].
Lema 4.2.13. Existe uma constante C > 1 tal que para todo k 1 e todo
intervalo Ik tal que Gk restrita a Ik e uma bijec
ao diferenci
avel, tem-se
|(Gk ) (x)|
C
|(Gk ) (y)|

para quaisquer x e y em Ik .

Consequentemente, diam Ik C.
Demonstrac
ao. Seja g um inversa local de G, isto e, uma funcao diferenci
avel
definida em algum intervalo e tal que G(g(z)) = z para todo z no domnio de
definicao. Note que


 G (g(z)) g (z)
G (g(z))
log |G g(z)| =
.
=
G (g(z))
G (g(z))2

Portanto, a u
ltima estimativa no Lema 4.2.12 implica que


log |G g(z)| 2 para todo g e todo z.

(4.2.12)

Em outras palavras, toda funcao da forma log |G g| admite 2 como constante


de Lipschitz. Observe tambem que se x, y Ik ent
ao
k1

log

|(Gk ) (x)| X
log |G (Gj (x))| log |G (Gj (y))|
=
|(Gk ) (y)|
j=0
=

k
X
j=1

log |G gj (Gj (x))| log |G gj (Gj (y))|

111

4.2. EXEMPLOS

onde gj representa uma inversa local de G definida no intervalo [Gj (x), Gj (y)].
Usando a estimativa (4.2.12), obtemos que
k1
k
X
X
|(Gk ) (x)|
j
j
|Gki (x) Gki (y)|.
|G (x) G (y)| = 2
2
log
|(Gk ) (y)|
i=0
j=1

(4.2.13)

Agora, as duas primeiras estimativas no Lema 4.2.12 implicam que


|Gk (x) Gk (y)| 2[i/2] |Gki (x) Gki (y)|
para todo i = 0, . . . , k. Substituindo em (4.2.13), conclumos que
log

k1
X
|(Gk ) (x)|
2[i/2] |Gk (x) Gk (y)| 8|Gk (x) Gk (y)| 8.

2
k

|(G ) (y)|
i=0

Agora basta tomar C = e8 .


Demonstrac
ao da Proposic
ao 4.2.11. Seja m a medida de Lebesgue em [0, 1]. O
Lema 4.2.13 implica que
R
|(Gk ) | dm
m(Gk (E1 ))
m(E1 )
RE1
C
=
.
k ) | dm
m(Gk (E2 ))
m(E
|(G
2)
E2

Por outro lado, a definicao (4.2.11) implica que

1
1
m(E) (E)
m(E),
2 log 2
log 2
para todo conjunto mensuravel E [0, 1]. Combinando estas duas relacoes,
obtemos que
(Gk (E1 ))
m(Gk (E1 ))
m(E1 )
(E1 )

2
2C
4C
.
k
k
(G (E2 ))
m(G (E2 ))
m(E2 )
(E2 )
Assim, basta tomar K = 4C.
Estamos prontos para concluir que (G, ) e erg
odica. Seja A um conjunto
invariante por G com (A) > 0. Ent
ao A tambem tem medida de Lebesgue positiva, uma vez que e absolutamente contnua com relacao `a medida
de Lebesgue. Seja a um ponto de densidade de A cuja trajetoria futura est
a
contida no intervalo aberto (0, 1). Considere a sequencia (Ik )k dos intervalos
I(k, m1 , . . . , mk ) que contem a. Segue do Lema 4.2.12 que
diam Ik sup


1
: x Ik 2[k/2]
|(Gk ) (x)|

para todo k 1. Em particular, o diametro de Ik converge para zero e, portanto,


(Ik A)
1
(Ik )

quando k .

(4.2.14)

CAPITULO 4. ERGODICIDADE

112

Tomemos E1 = Ik Ac e E2 = Ik . Pela Proposicao 4.2.11,


(Ik Ac )
(Gk (Ik Ac ))

K
.
(Gk (Ik ))
(Ik )
Observe que Gk (Ik Ac ) = Ac , a menos de um conjunto com medida nula,
porque o conjunto A e invariante. Lembre tambem que Gk (Ik ) = (0, 1), o qual
tem medida total. Portanto, a desigualdade anterior pode ser escrita como
(Ac ) K

(Ik Ac )
.
(Ik )

De acordo com (4.2.14), a expressao do lado direito converge para zero quando
k . Logo (Ac ) = 0, como queramos demonstrar.

4.2.5

Endomorfismos lineares do toro

Lembre que chamamos toro de dimensao d ao quociente Td = Rd /Zd , ou seja, o


espaco das classes de equivalencia da relacao de equivalencia definida em Rd por
x y x y Zd . Este quociente herda de Rd uma estrutura de variedade
diferenci
avel de dimensao d. No que segue suporemos que Td tambem est
a
munido da metrica riemanniana plana, que o torna localmente isometrico ao
espaco euclideano Rd . Seja m a medida de Lebesgue associada a esta metrica
riemanniana.
Seja A uma matriz d-por-d com coeficientes inteiros e determinante diferente
de zero. Ent
ao A(Zd ) Zd e, por consequencia, A induz uma transformacao
fA : Td Td ,

fA ([x]) = [A(x)]

onde [x] denota a classe de equivalencia que contem x Rd . Chamamos tais


transformacoes de endomorfismos lineares do toro. Note que fA e diferenci
avel
e a derivada DfA (x) em cada ponto est
a canonicamente identificada com A.
Em particular, o jacobiano det DfA ([x]) e constante igual a det A. Isso tambem
implica que o grau de f e igual a | det A|. Portanto, fA e invertvel se, e somente
se, | det A| = 1. Neste caso, a sua inversa e a transformacao fA1 induzida pela
matriz inversa A1 ; observe que A1 tambem e uma matriz com coeficientes
inteiros.
Em qualquer caso, fA preserva a medida de Lebesgue em Td . Isto pode ser
visto da seguinte forma. Como fA e um difeomorfismo local, a pre-imagem de
qualquer conjunto mensuravel D com diametro suficientemente pequeno est
a
formada por | det A| (= grau de fA ) partes disjuntas Di , cada uma das quais
e enviada difeomorficamente sobre D. Pela formula de mudanca de variavel,
m(D) = | det A| m(Di ) para todo i. Isto prova que m(D) = m(f 1 (D)) para
todo domnio D suficientemente pequeno. Logo f preserva a medida m. Agora
vamos provar o seguinte fato:
Teorema 4.2.14. O sistema (fA , m) e erg
odico se, e somente se, nenhum
autovalor da matriz A e raiz da unidade.

113

4.2. EXEMPLOS
Demonstrac
ao. Considere qualquer funcao L2 (m) e seja
X
([x]) =
ck e2i(kx)
kZd

a sua expansao em serie de Fourier. Observe que k x = k1 x1 + + kd xd . Os


coeficientes ck C satisfazem
X
|ck |2 = kk22 < .
(4.2.15)
kZd

Ent
ao, a expansao em serie de Fourier de fA e:
X
X

(fA ([x])) =
ck e2i(kA(x)) =
ck e2i(A (k)x) ,
kZd

kZd

onde A representa a adjunta de A. Suponha que e funcao invariante, isto


e, fA = em -quase todo ponto. Ent
ao, por unicidade da expansao de
Fourier, devemos ter
cA (k) = ck

para todo k Z.

(4.2.16)

Afirmamos que a trajetoria de todo k 6= 0 pela transformacao A e infinita. De


fato, se a trajetoria de algum k 6= 0 fosse finita ent
ao deveriam existir l, m Z
com m > 0 tais que A(l+m) (k) = Al (k). Isto so poderia acontecer se A tivesse
algum autovalor tal que m = 1. Mas essa possibilidade est
a excluda, por
hipotese, uma vez que A e A tem os mesmos autovalores. Logo, a trajetoria de
todo k 6= 0 e infinita, como afirmamos. Ent
ao a igualdade (4.2.16) juntamente
com (4.2.15) implica que ck = 0 para todo k 6= 0. Portanto, = c0 em m-quase
todo ponto. Isto prova a ergodicidade.
Para provar a recproca, suponha que A admite algum autovalor que e uma
raz da unidade. Ent
ao o mesmo vale para A e, portanto, existe m 1 tal
que 1 e autovalor de Am . Como Am tem coeficientes inteiros, segue (veja o
Exerccio 4.2.8) que existe algum k Zd \ {0} tal que Am (k) = k. Fixe k e
considere a funcao L2 (m) definida por
([x]) =

m1
X

e2i(xA

i=0

(k))

m1
X

e2i(A

(x)k)

i=0

Ent
ao e uma funcao invariante por fA mas n
ao e constante. Logo, fA n
ao e
erg
odica.

4.2.6

Argumento de Hopf

Nesta secao vamos apresentar outro metodo, mais geometrico, para demonstrar
a ergodicidade de certos endomorfismos lineares do toro. Ele se aplica sempre
que | det A| = 1 e a matriz A e hiperb
olica, ou seja, ela n
ao tem autovalores de
modulo 1. Mas a sua grande vantagem e que ele pode ser estendido a sistemas

CAPITULO 4. ERGODICIDADE

114

diferenci
aveis muito mais gerais, n
ao necessariamente lineares. Algumas dessas
extensoes serao mencionadas na Secao 4.4.
A hip
otese de que a matriz A e hiperb
olica significa que o espaco Rd pode
d
s
ser escrito como uma soma direta R = E E u tal que:
1. A(E s ) = E s e todos os autovalores de A | E s tem modulo menor que 1;
2. A(E u ) = E u e todos os autovalores de A | E u tem modulo maior que 1.
Ent
ao existem constantes C > 0 e < 1 tais que
kAn (v s )k Cn kv s k

kAn (v u )k Cn kv u k

para todo v s E s e todo n 0,

para todo v u E u e todo n 0.




2 1
Exemplo 4.2.15. Considere A =
. Os seus autovalores sao
1 1

(4.2.17)

3 5
3+ 5
> 1 > s =
>0
u =
2
2

e os respectivos autoespacos sao:

51
u
2
E = {(x, y) R : y =
x}
2

5+1
E = {(x, y) R : y =
x}.
2
s

A famlia de todos os subespacos afins de Rd da forma v + E s , com v Rd ,


define uma particao F s de Rd , que chamamos folheac
ao est
avel e cujos elementos
chamamos folhas est
aveis de A. Ela e invariante por A, ou, seja, a imagem de
qualquer folha est
avel e tambem uma folha est
avel. Alem disso, pela propriedade
(4.2.17), a transformacao A contrai distancias, uniformemente, dentro de cada
folha. Analogamente, a famlia de todos os subespacos afins de R da forma
v + E u com v Rd define uma particao F u de Rd , chamada folheac
ao inst
avel.
Esta folheacao tambem e invariante e a transformacao A expande distancias ao
longo das suas folhas.
W u (x)

W s (x)
x

Figura 4.1: Folheacao est


avel e folheacao instavel no toro

115

4.2. EXEMPLOS

Projetando F s e F u pela projecao canonica : Rd Td obtemos folheacoes


W e W u do toro que chamamos folheac
ao est
avel e folheac
ao inst
avel da transformacao fA . Veja a Figura 4.1. As observacoes anteriores mostram que estas
folheacoes sao invariantes por fA . Alem disso:
s

(a) dados dois pontos quaisquer x e y na mesma folha est


avel, tem-se que
d(fAj (x), fAj (y)) 0 quando n +;
(b) dados dois pontos quaisquer y e z na mesma folha instavel, tem-se que
d(fAj (y), fAj (z)) 0 quando n .
Vamos usar esta informacao geometrica para provar que (fA , m) e erg
odica.
Para isso, considere qualquer funcao contnua : Td R e considere as medias
temporais
+ (x) = lim
n

n1
1X
(fAj (x))
n j=0

(x) = lim
n

n1
1X
(fAj (x)),
n j=0

definidas para m-quase todo x Td . Pelo Corolario 3.2.8, existe um conjunto


X Td com medida total tal que
+ (x) = (x)

para todo x X.

(4.2.18)

Denotaremos por W s (x) e W u (x), respectivamente, a folha est


avel e a folha
instavel de fA passando por cada ponto x Td .
Lema 4.2.16. A func
ao + e constante em toda folha de W s : se + (x) existe e
s
+
y W (x) ent
ao (y) existe e e igual a + (x). Analogamente, e constante
em toda folha de W u .

Demonstrac
ao. De acordo com a propriedade (a) acima, d(fAj (x), fAj (y)) converge para zero quando j . Como e contnua (logo uniformemente
contnua, uma vez que o domnio e compacto) isso implica que
(fAj (x)) (fAj (y)) 0

quando j .

Por maioria de raz


ao, o limite Ces`aro
n1
1X
(fAj (x)) (fAj (y))
lim
n n
j=0

tambem e zero. Isso implica + (y) existe e e igual a + (x). O argumento para
e inteiramente analogo.
Dado um subconjunto aberto R do toro e dado x R, denotamos por
W s (x, R) a componente conexa de W s (x) R que contem x e por W u (x, R) a
componente conexa de W u (x) R que contem x. Chamamos R de ret
angulo se
W s (x, R) intersecta W u (y, R) num u
nico ponto, para todo x e y em R. Veja a
Figura 4.2.

CAPITULO 4. ERGODICIDADE

116

Lema 4.2.17. Dado qualquer ret


angulo R Td , existe um conjunto mensur
avel
YR X R tal que m(R \ YR ) = 0 e, dados quaisquer x e y em YR , existem
pontos x e y em X R tais que x W s (x, R) e y W s (y, R) e y W u (x ).
R
x

W s (x)

W s (y)

Figura 4.2: Retangulo em Td

Demonstrac
ao. Representemos por msx a medida de Lebesgue na folha est
avel
s
W (x) de cada ponto x Td . Note que m(R \ X) = 0, uma vez que X tem
medida total em Td . Ent
ao, usando o teorema de Fubini,

msx W s (x, R) \ X = 0 para m-quase todo x R.




ao YR tem medida total
Defina YR = x X R : msx W s (x, R) \ X = 0 . Ent
em R. Dados x, y R considere a aplicacao
: W s (x, R) W s (y, R),

(x ) = intersecao entre W u (x , R) e W s (y, R).

Esta aplicacao e afim e, portanto, tem a seguinte propriedade, que chamamos


continuidade absoluta:
msx (E) = 0

msy ((E)) = 0.

Em particular, a imagem de W s (x, R) X tem medida total em W s (y, R) e,


consequentemente, ela intersecta W s (y, R) X. Em outras palavras, existe
x W s (x, R) X cuja imagem y = (x ) est
a em W s (y, R) X. Observando

que x e y est
ao na mesma folha instavel, pela definicao da , vemos que estes
pontos satisfazem as condicoes na conclusao do lema.
Considere um ret
angulo R qualquer. Dados quaisquer x, y em YR , considere
os pontos x , y em X dados pelo Lema 4.2.17. Usando tambem o Lema 4.2.16,
obtemos:
(x) = + (x) = + (x ) = (x ) = (y ) = + (y ) = + (y) = (y).

117

4.2. EXEMPLOS

Isto mostra que as funcoes + e coincidem uma com a outra e sao constantes
em YR . Agora seja R1 , . . . , RN uma cobertura finita do toro por ret
angulos.
Considere o conjunto
Y =

N
[

Yj ,

onde Yj = YRj .

j=1

Observe que m(Y ) = 1, uma vez que Y Rj Yj tem medida total em Ri


para todo j. Afirmamos que + = e constante em todo o Y . De fato, dados
quaisquer k, l {1, . . . , N } podemos encontrar j0 = k, j1 , . . . , jn1 , jn = l tais
que cada Rji intersecta Rji1 (isto e uma simples consequencia da conexidade
por arcos do toro). Lembrando que Rj e aberto e Xj e um subconjunto de meao, + = e constante
dida total, obtemos que cada Xji intersecta Xji1 . Ent
na uni
ao de todos os Xji . Isto prova a nossa afirmacao.
Desta forma, mostramos que as medias temporais de qualquer funcao
contnua sao constantes em m-quase todo ponto. Consequentemente (veja o
Exerccio 4.1.4), o sistema (fA , m) e erg
odico.

4.2.7

Exerccios

4.2.1. Prove a Proposicao 4.2.2.


4.2.2. Prove a Proposicao 4.2.9.
4.2.3. Seja I = [0, 1] e f : I I a funcao definida por

2x
se 0 x < 1/3

2x 2/3 se 1/3 x < 1/2


f (x) =
2x 1/3 se 1/2 x < 2/3

2x 1
se 2/3 x 1.

Mostre que f e erg


odica relativamente `a medida de Lebesgue m.
4.2.4. Seja = {1, 2, . . . , k}N . Prove que todo subconjunto X infinito, compacto, invariante pelo deslocamento : contem algum ponto n
aoperiodico.
4.2.5. Seja X um espaco topol
ogico, munido da sua -algebra de Borel C, e seja
= X N . Mostre que se X tem base enumeravel de abertos ent
ao a -algebra
de Borel de (para a topologia produto) coincide com a -algebra produto
B = C N . O mesmo vale para = X Z e B = C Z .
4.2.6. Neste exerccio propomos outra demonstracao para a Proposicao 4.2.1.
Suponha que e irracional. Seja A um conjunto invariante com medida positiva.
Lembrando que a
orbita {Rn (a) : n Z} de todo a S 1 e densa em S 1 , mostre
que nenhum ponto de S 1 e ponto de densidade de Ac . Conclua que (A) = 1.

CAPITULO 4. ERGODICIDADE

118

4.2.7. Suponha que e irracional. Seja : S 1 R uma funcao contnua


qualquer. Mostre que
n1
1X
(Rj (x))
n n
j=0

(x)

= lim

(4.2.19)

existe em todo ponto e, de fato, o limite e uniforme. Justifique o fato que


e constante em todo ponto. Deduza que R tem uma u
nica probabilidade
invariante.
4.2.8. Seja A uma matriz quadrada de dimensao d com coeficientes racionais e
seja um autovalor racional. Mostre que existe algum autovetor com coeficientes inteiros, ou seja, algum k Zd \ {0} tal que Ak = k.
4.2.9. Um n
umero x (0, 1) tem expansao em fracao contnua de tipo limitado
se a sequencia (an )n construda na Secao 1.3.2 e limitada. Prove que o conjunto
L (0, 1) dos pontos com expansao em fracao contnua de tipo limitado tem
medida de Lebesgue zero.
4.2.10. Seja f : M M uma transformacao mensuravel,R seja uma medida
invariante erg
odica e seja : M R uma funcao tal que d = +. Prove
Pn1
que limn (1/n) j=0
(f j (x)) = + para -quase todo x M .

4.2.11. Observe que o n


umero b no Exerccio 3.2.4 e independente de x num
conjunto com medida de Lebesgue total. Prove que a media aritmetica dos
n
umeros a1 , . . . , an , . . . vai para infinito: limn (1/n)(a1 + + an ) = +.

4.3

Propriedades das medidas erg


odicas

Nesta secao consideramos que a transformacao f : M M est


a fixada e analisamos o espaco M1 (f ) das probabilidades invariantes por f , especialmente o
subconjunto Me (f ) das probabilidades erg
odicas.
Lembre que uma medida diz-se absolutamente contnua com relacao a
outra medida se (E) = 0 implica (E) = 0. Nesse caso escrevemos .
Esta relacao e transitiva: se e ent
ao . O primeiro resultado
afirma que probabilidades erg
odicas sao minimais para esta relacao de ordem:
Lema 4.3.1. Se e s
ao probabilidades invariantes tais que e erg
odica e
e absolutamente contnua com relac
ao a , ent
ao = .
Demonstrac
ao. Seja : M R uma funcao mensuravel limitada qualquer.
Como e invariante e erg
odica, a media temporal
n1
1X
(f j (x))
n n
j=0

(x)

= lim


4.3. PROPRIEDADES DAS MEDIDAS ERGODICAS

119

R
e constante: (x)

= d em -quase todo ponto. Segue que esta igualdade


tambem vale em -quase todo ponto, ja que . Em particular,
Z
Z
Z
d = d = d
(a primeira igualdade e parte do teorema erg
odico de Birkhoff). Portanto, as
integrais de com relacao a e em relacao a coincidem, qualquer que seja
a funcao mensuravel limitada . Em particular, considerando funcoes caractersticas, conclumos que = .
claro que se 1 e 2 sao probabilidades invariantes com respeito `a transE
formacao f ent
ao (1 t)1 + t2 tambem e probabilidade invariante, qualquer
que seja t (0, 1). Isto significa que o espaco M1 (f ) das probabilidades invariantes e convexo. A proposicao que apresentamos a seguir afirma que as medidas
erg
odicas sao os elementos extremais deste convexo:
Proposi
c
ao 4.3.2. Uma probabilidade invariante e erg
odica se, e somente
se, n
ao e possvel escreve-la na forma = (1 t)1 + t2 com t (0, 1) e 1 ,
2 probabilidades invariantes distintas.
Demonstrac
ao. Para provar a parte se, suponha que n
ao e erg
odica. Ent
ao
existe algum conjunto invariante A com 0 < (A) < 1. Defina 1 e 2 como
sendo as restricoes normalizadas de a A e ao seu complementar, respectivamente:
(E A)
(E Ac )
1 (E) =
e
2 (E) =
.
(A)
(Ac )
Como A e Ac sao conjuntos invariantes e e medida invariante, 1 e 2 sao
tambem probabilidades invariantes. Alem disso,
= (A)1 + (Ac )2
e portanto n
ao e extremal. Para provar a recproca, suponha que e erg
odica
claro que (E) = 0 implica
e temos = (1 t)1 + t2 com t (0, 1). E
1 (E) = 2 (E) = 0, ou seja, 1 e 2 sao absolutamente contnuas com relacao
a . Logo, pelo Lema 4.3.1, 1 = = 2 . Isto prova que e extremal.
Tambem observamos que medidas erg
odicas distintas vivemem subconjuntos disjuntos do espaco M (veja tambem o Exerccio 4.3.6):
Lema 4.3.3. Suponha que a -
algebra de M admite um gerador enumer
avel.
Seja {i : i I} uma famlia qualquer de probabilidades invariantes e erg
odicas, todas distintas. Ent
ao as medidas i s
ao mutuamente singulares: existem
subconjuntos mensur
aveis invariantes {Pi : i I} disjuntos dois-a-dois e tais
que i (Pi ) = 1 para todo i I.
Demonstrac
ao. Seja um gerador enumeravel da -algebra de M e seja A a
algebra gerada por . Note que A e enumeravel, ja que ela coincide com a uniao
das algebras geradas pelos subconjuntos finitos de . Para cada i I, defina
Pi = {x M : (A, x) = i (A) para todo A A}.

CAPITULO 4. ERGODICIDADE

120

Por ergodicidade, i (Pi ) = 1 para todo i I. Alem disso, se existe x Pi Pj


ent
ao i (A) = (A, x) = j (A) para todo A A; em outras palavras, i = i .
Isto prova que os Pi sao disjuntos dois-a-dois.
Agora suponha que f : M M e uma aplicacao contnua num espaco
topol
ogico. Dizemos que a aplicacao f e transitiva se existe algum x M tal
que {f n (x) : n N} e denso em M
O lema a seguir d
a uma caracterizacao u
til da transitividade. Lembre que um
espaco topol
ogico M e chamado de espaco de Baire se a intersecao de qualquer
famlia enumer
avel de abertos densos e densa em M . Todo espaco metrico
completo e um espaco de Baire e o mesmo vale para todo espaco topologico
localmente compacto (veja [Dug66]).
Lema 4.3.4. Suponha que M e um espaco de Baire com base enumer
avel de
abertos. Ent
ao f : M M e transitiva se, e somente se, para todo par de
abertos U e V existe k 1 tal que f k (U ) intersecta V .
Demonstrac
ao. Suponha que f e transitiva e seja x M um ponto cuja orbita
{f n (x) : n N} e densa em M . Ent
ao existe m 1 tal que f m (x) V e
(usando que {f n (x) : n > m} tambem e denso) existe n > m tal que f n (x) U .
Tome k = n m. Ent
ao f m (x) f k (U ) V . Isto prova a parte somente se
do enunciado.
Para provar a recproca, seja {Uj : j N} uma base enumeravel de abertos
k
(Uj ) e denso em M para todo
de M . A hip
otese garante que o aberto
k=1 f
j N. Ent
ao a intersecao
X=

f k (Uj )

j=1 k=1

e um subconjunto denso de M . Em particular, ele e n


ao vazio. Por outro
lado, por definicao, se x X ent
ao para todo j N existe algum k 1 tal
que f k (x) Uj . Como os Uj constituem uma base de vizinhancas de M , isto
significa que {f k (x) : k N} e densa em M .
Proposi
c
ao 4.3.5. Suponha que M e um espaco de Baire com base enumer
avel
de abertos. Ent
ao a restric
ao de f ao suporte de e transitiva.
Demonstrac
ao. Comece por notar que supp tem base enumeravel de abertos,
por ser um subespaco de M , e e um espaco de Baire, uma vez que e fechado
em M . Sejam U e V abertos de supp . Pela definicao do suporte, (U ) > 0
k
e (V ) > 0. Defina B =
(U ). Ent
ao (B) > 0, porque B U ,
k=1 f
1
e f (B) B. Por ergodicidade (veja o Exerccio 1.1.4) segue que (B) =
1. Ent
ao B deve intersectar V . Isto prova que existe k 1 tal que f k (U )
intersecta V . Pelo Lema 4.3.4, segue que a transformacao f : supp supp
e transitiva.


4.3. PROPRIEDADES DAS MEDIDAS ERGODICAS

4.3.1

121

Exerccios

4.3.1. Seja f : M M uma aplicacao mensuravel num espaco topologico M


com base enumer
avel de abertos e seja uma medida de probabilidade erg
odica
para f . Mostre que a
orbita {f n (x) : n 0} de -quase todo ponto x M e
densa no suporte de .
4.3.2. Seja f : M M uma transformacao contnua em um espaco metrico
compacto. Fixada uma funcao : M R, prove que existe uma probabilidade
invariante tal que
Z
Z
d =

sup

d.

M1 (f )

4.3.3. Seja g : E E uma transformacao induzida por f : M M , ou


seja uma transformacao da forma g(x) = f (x) (x) com : E N (veja a
Secao 1.4.2). Seja uma probabilidade invariante de g e seja g a medida
invariante de f definida por (1.4.5). Suponha que (M ) < e denote =
/ (M ). Mostre que (f, ) e erg
odico se, e somente se, (g, ) e erg
odico.
4.3.4. Seja f : M M uma transformacao contnua num espaco metrico completo separ
avel. Dada uma probabilidade invariante , seja
o seu levantamento
M
(veja a Secao 2.4.2). Mostre que (f,
para a extensao natural f : M
) e
erg
odico se, e somente se, (f, ) e erg
odico.
4.3.5. Seja f : M M uma transformacao e seja uma medida invariante.
Seja g t : N N , t R um fluxo suspens
ao de f e seja a suspens
ao correspondente da medida (veja a Secao 3.4.1). Suponha que (N ) < e denote
= /(N ). Mostre que e erg
odica para o fluxo (g t )t se, e somente se, e
erg
odica para f .
4.3.6. Mostre que no caso de famlias finitas ou enumeraveis de medidas erg
odicas a conclusao do Lema 4.3.3 vale mesmo que a -algebra n
ao seja enumeravelmente gerada.
4.3.7. De exemplo de um espaco metrico M e uma transformacao f : M M ,
tais que existe uma sequencia de medidas borelianas n erg
odicas para f que
convergem, na topologia fraca , para uma medida que n
ao e erg
odica.
4.3.8. Seja M um espaco metrico, f : M M uma transformacao contnua e
uma probabilidade invariante e erg
odica. Mostre que, dada qualquer probabilidade em M absolutamente contnua com respeito a , mas n
ao necessariamente invariante,
n1
1X j
f converge para na topologia fraca .
n j=0

4.3.9. Considere X = {1, . . . , d} e seja : o deslocamento em = X N


ou = X Z .

CAPITULO 4. ERGODICIDADE

122

(1) Mostre que para todo > 0 existe k 1 tal que, dados x1 , . . . , xs
e m1 , . . . , ms 1, existe um ponto periodico y com perodo ns e
satisfazendo d(f j+ni (y), f j (xi )) < para todo 0 j < mi , onde n1 = 0
e ni = (m1 + k) + + (mi1 + k) para 1 < i s.
(2) Sejam : R uma funcao contnua e a sua media de Birkhoff.
Mostre, que dados > 0, x1 , . . . , xsP
tais que a media de Birkhoff est
a
i

=
1,
existe
um
ponto
peri
o
dico
definida e 1 , . . . , s > 0 tais
que
i
P
i )| < .
y satisfazendo |(y)

i i (x
(3) Conclua que o conjunto Me () das medidas invariantes erg
odicas e denso
no espaco de todas as probabilidades invariantes M1 ().

4.4

Coment
arios sobre sistemas conservativos

O teorema erg
odico de Birkhoff, provado nos anos trinta do seculo 20, deu
solida fundamentacao matematica para o enunciado da hipotese erg
odica de
Boltzmann, mas deixou totalmente em aberto a quest
ao da sua veracidade.
Nesta secao vamos dar um breve panorama dos principais resultados obtidos
desde ent
ao nesta direcao, no contexto de sistemas conservativos, isto e, sistemas
din
amicos que preservam uma medida de volume numa variedade.
Comecamos por observar que, num certo sentido topologico abstrato, a maioria dos sistemas conservativos sao erg
odicos. Esse e o sentido do teorema que
vamos enunciar a seguir, provado no incio dos anos 1940 por John Oxtoby and
Stanislav Ulam [OU41]. Lembre que um subconjunto de um espaco de Baire
e chamado residual se ele pode ser escrito como uma intersecao enumeravel de
subconjuntos abertos e densos. Por definicao de espaco de Baire, todo subconjunto residual e denso.
Teorema 4.4.1 (Oxtoby, Ulam). Para toda variedade riemanniana compacta
M , existe um subconjunto residual R do espaco Homeovol (M ) dos homeomorfismos conservativos de M tal que todo elemento de R e erg
odico.
Os resultados que apresentaremos a seguir implicam que a conclusao deste
teorema torna-se falsa quando substitumos Homeo(M ) pelo espaco Difeokvol (M )
dos difeomorfismos conservativos de classe C k , pelo menos para k > 3. Praticamente nada e sabido a este respeito nos casos k = 2 e k = 3. Por outro lado,
Artur Avila, Sylvain Crovisier e Amie Wilkinson anunciaram recentemente uma
versao C 1 do teorema anterior: para toda variedade riemanniana compacta M ,
existe um subconjunto residual R do espaco Difeo1vol (M ) dos difeomorfismos
conservativos de classe C 1 tal que todo f R com entropia hvol (f ) positiva e
erg
odico. A nocao de entropia sera estudada no Captulo 9.

4.4.1

Sistemas hamiltonianos

Os sistemas em que Boltzmann estava interessado, relativos ao movimento das


moleculas de gases podem, em princpio, ser descritos pelas leis da mecanica


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

123

classica newtoniana. No chamado formalismo hamiltoniano da mecanica classica, os estados do sistema sao representados por meio das coordenadas generalizadas q1 , . . . , qd e dos momentos generalizados p1 , . . . , pd e a sua evolucao
e descrita pelas solucoes das equacoes de Hamilton-Jacobi:
H
dqj
=
dt
pj

dpj
H
,
=
dt
qj

j = 1, . . . , d,

(4.4.1)

onde H (a energia total do sistema) e uma funcao de classe C 2 das variaveis


q = (q1 , . . . , qd ) e p = (p1 , . . . , pd ); o inteiro d 1 e o n
umero de graus de
liberdade do sistema.
Exemplo 4.4.2 (Pendulo). Tome d = 1 e H(q, p) = p2 /2 g cos q, onde g e
uma constante positiva e (q, p) R2 . As equacoes de Hamilton-Jacobi
dq
=p
dt

dp
= g sin q
dt

descrevem o movimento de um pendulo sujeito ao um campo gravitacional constante: a coordenada q mede o


angulo relativo `a posicao de equilbrio (estavel) e
p mede o momento angular. O hamiltoniano H corresponde `a energia total do
sistema: H = energia cinetica + energia potencial.
Note que H sempre e uma integral primeira do sistema, ou seja, ela e constante ao longo das trajetorias do fluxo:
d

X dqj
dH
dpj
=
+
0.
dt
q
dt
p
j
j dt
j=1
Ent
ao, podemos considerar a restricao do fluxo a cada hipersuperfcie de energia Hc = {(q, p) : H(q, p) = c}. A medida de volume dq1 dqd dp1 dpd e
chamada medida de Liouville. Observando que o campo de vetores
F =

H
H H
H 
,...,
,
,...,
p1
pd q1
qd

tem divergente nulo (lembre a Secao 1.3.6), conclumos que o fluxo preserva a
medida de Liouville. Em consequencia (veja o Exerccio 1.3.12), a restricao do
fluxo a cada hipersuperfcie de energia Hc tambem tem uma medida invariante
c , que e dada por
Z
ds
para todo conjunto mensuravel E Hc
c (E) =
E k grad Hk
onde ds representa o elemento de volume na hipersuperfcie. Ent
ao e natural
perguntar se, em geral, sistemas hamiltonianos sao erg
odicos relativamente `a
medida invariante em (quase) toda hipersuperfcie de energia.
O primeiro resultado importante nesta direcao foi anunciado por Andrey
Kolmogorov em 1954 e foi, logo em seguida, substanciado pelos trabalhos de

CAPITULO 4. ERGODICIDADE

124

Vladimir Arnold e J
urgen Moser. Isto conduziu a uma teoria muito profunda,
que e conhecida como Teoria KAM em homenagem aos seus fundadores, e para
qual contriburam de maneira decisiva diversos outros matematicos, tais como
Helmut R
ussmann, Michael Herman, Eduard Zehnder, Jean-Christophe Yoccoz,
J
urgen P
oschel, entre outros. Inicialmente, a teoria lida com sistemas quase
integraveis.
Um sistema hamiltoniano diz-se integr
avel (no sentido de Liouville) se ele
admite d integrais primeiras I1 , . . . , Id :
independentes: ou seja, tais que os gradientes


Ij Ij
Ij Ij
,
,
,...,
,
grad Ij =
q1 p1
qd pd

1 j d,

sao linearmente independentes em todo ponto num subconjunto aberto e


denso do domnio;
em involuc
ao: ou seja, tais que os colchetes de Poisson
{Ij , Ik } =


d 
X
Ij Ik
Ij Ik
.

qi pi
pi qi
i=1

sao todos identicamente nulos.


Segue dos coment
arios anteriores que todo sistema com d = 1 grau de liberdade
e integravel: o proprio hamiltoniano H e uma integral primeira. Outro exemplo
importante:
Exemplo 4.4.3. Para qualquer n
umero d 1 de graus de liberdade, suponha
que o hamiltoniano H depende apenas das variaveis p = (p1 , . . . , pd ). Ent
ao as
equacoes de Hamilton-Jacobi (4.4.1) se reduzem a
H
dqj
(p)
=
dt
pj

dpj
H
(p) = 0.
=
dt
qj

A segunda equacao significa, precisamente, que cada pj e uma integral primeira;


e f
acil ver que estas integrais primeiras sao independentes e est
ao em involucao.
Observe tambem que na primeira equacao o termo da direita e independente do
tempo. Logo, a solucao da equacao e
qj (t) = qj (0) +

H
(p(0)) t.
pi

Como vamos comentar a seguir, este exemplo e totalmente tpico de sistemas


integraveis.
Um teorema cl
assico de Liouville afirma que se o sistema e integravel ent
ao
as equacoes de Hamilton-Jacobi podem ser resolvidas completamente por quadraturas. Na demonstracao (veja o livro de Arnold [Arn78]) sao construdas


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

125

funcoes = (1 , . . . , d ) Td as quais, juntamente com as integrais primeiras


I = (I1 , . . . , Id ) Rd , constituem coordenadas can
onicas do sistema (chamadas
na literatura de coordenadas ac
ao-
angulo). Com isto, queremos dizer que
: (q, p) 7 (, I)
e um mudanca de coordenadas (ou seja, um difeomorfismo) que preserva a forma
das equacoes de Hamilton-Jacobi: (4.4.1) traduz-se para
H
dj
=
dt
Ij

dIj
H
,
=
dt
j

(4.4.2)

onde H = H 1 e a expressao do hamiltoniano nas novas coordenadas. Como


as Ij sao integrais primeiras, a segunda equacao d
a que
0=

H
dIj
.
=
dt
j

Isto quer dizer que H n


ao depende das variaveis e, portanto, estamos numa
situacao similar ao Exemplo 4.4.3. Cada trajetoria do fluxo hamiltoniano est
a
restrita a um toro {I = const} e, de acordo com a primeira equacao em (4.4.2),
e linear na coordenada :
j (t) = j (0) + tj (I)t,

onde j (I) =

H
(I).
Ij

Em termos das coordenadas originais (q, p), conclumos que as trajetorias do


fluxo hamiltoniano sao dadas por
t 7 1 ((0) + (I)t, I) = (0),I ((I)t)

(4.4.3)

onde (0),I : Rd M e uma funcao Zd -periodica e (I) = (1 (I), . . . , d (I))


e chamado vetor de frequencias. Dizemos que a trajetoria e quase peri
odica.

4.4.2

Teoria de Kolmogorov-Arnold-Moser

claro que sistemas integraveis nunca sao erg


E
odicos. Mas isso, por si so,
n
ao seria impedimento para que a maioria dos sistemas hamiltonianos fossem
erg
odicos, j
a que integrabilidade e uma propriedade muito rara. No entanto,
o resultado fundamental que vamos enunciar em seguida afirma que sistemas
integraveis genericos sao robustamente n
ao erg
odicos: todo fluxo hamiltoniano
proximo tambem e n
ao erg
odico.
Seja H0 um hamiltoniano integravel, escrito em coordenadas de acao-
angulo
(, I). Mais precisamente, seja B d uma bola em Rd e suponha que H0 (, I)
est
a definido para todo (, I) Td B d mas depende apenas da coordenada I.
Dizemos que H0 e n
ao-degenerado se a sua matriz hesseana e invertvel:

 2
H0
6= 0 em todo ponto.
(4.4.4)
det
Ii Ij i,j

CAPITULO 4. ERGODICIDADE

126

Observe que a matriz hesseana de H0 coincide com a matriz jacobiana de (I).


Portanto, a condic
ao de torc
ao (4.4.4) significa que a aplicacao que associa a
cada valor de I o respectivo vetor de frequencias (I) e um difeomorfismo local.
Teorema 4.4.4. Seja H0 (I) um hamiltoniano integr
avel, n
ao degenerado, de
classe C . Ent
ao existe uma vizinhanca V de H0 no espaco C (Td B d , R) tal
que para todo H V existe um conjunto compacto K Td B d satisfazendo:
(a) K e uma uni
ao de toros diferenci
aveis da forma {(, u()) : Td } cada
um dos quais e invariante pelo fluxo hamiltoniano de H;
(b) a restric
ao do fluxo hamiltoniano a cada um destes toros e conjugada a
um fluxo linear em Td ;
(c) o conjunto K tem volume positivo e, de fato, o volume do complementar
converge para zero quando H H0 .
Claramente, a existencia um conjunto K como no enunciado implica que o
fluxo hamiltoniano de H n
ao e erg
odico. Podemos resumir o conte
udo do teorema dizendo que a maioria dos toros invariantes persiste quando perturbamos
um sistema integravel n
ao degenerado. A prova mostra a persistencia ou n
ao de
um dado toro est
a intimamente ligada `as propriedades aritmeticas do respectivo
vetor de frequencias, da seguinte forma.
Dados c > 0 e > 0, dizemos que um vetor Rd e (c, )-diofantino se
|k |

c
kkk

para todo k Zd ,

(4.4.5)

onde kkk = |k1 | + |kd |. Vetores diofantinos sao racionalmente independentes;


de fato a condicao (4.4.5) significa que, num certo sentido, e mal aproximado
por vetores racionalmente dependentes. Dizemos que e -diofantino se ele e
(c, )-diofantino para algum c > 0. O conjunto dos vetores -diofantinos e n
ao
vazio se, e somente se, d 1; alem disso, ele tem medida total em Rd sempre
que e estritamente maior que d 1 (veja o Exerccio 4.4.1).
Na prova do Teorema 4.4.4 mostra-se que, dados c > 0 e d 1 e dado
qualquer compacto (B d ), podemos encontrar uma vizinhanca V de H0
tal que, para todo H V e todo vetor (c, )-diofantino , o fluxo de H admite
um toro invariante diferenci
avel, restrito ao qual o fluxo hamiltoniano de H e
conjugado ao fluxo linear t 7 (t) = (0) + t.
A seguir discutimos uma versao do Teorema 4.4.4 para sistemas com tempo
discreto, mais precisamente, para transformacoes simpleticas. Lembre que uma
forma simpletica numa variedade M e uma 2-forma diferencial n
ao degenerada:
para todo x M e todo u 6= 0, existe v tal que x (u, v) 6= 0. Existencia de
uma forma simpletica implica que a dimensao de M e par: dim M = 2d; alem
disso, a d-esima potencia d = e uma forma de volume em M . Uma
transformacao diferenci
avel f : M M diz-se simpletica se ela preserva a forma
simpletica: x (u, v) = f (x) (Df (x)u, Df (x)v) para todo x M e quaisquer
u, v Tx M . Ent
ao, em particular, f preserva a forma de volume d .


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

127

Exemplo 4.4.5. Seja M = R2d , com coordenadas (q1 , . . . , qd , p1 , . . . , pd ), e seja


a forma diferencial definida por
x = dq1 dp1 + + dqd dpd

(4.4.6)

para todo x. Ent


ao e uma forma simpletica em M . De fato, um teorema
classico de Darboux afirma que para toda forma simpletica numa variedade
existe uma atlas da variedade tal que a expressao da forma simpletica em qualquer carta local desse atlas coincide com (4.4.6). Qualquer transformacao da
forma
f (q1 , . . . , qd , p1 , . . . , pd ) = (q1 + 1 (p), . . . , qd + d (p), p1 , . . . , pd )
e simpletica relativamente a . Usando
Df

=
qj
qj

e Df

j
=
+
,
pj
pj
qj qj

vemos que f e simpletica relativamente `a forma .


Por analogia com o caso de fluxos, dizemos que uma transformacao f0 e
integr
avel se existem coordenadas (q, p) Td B d tais que f0 (q, p) = (q+(p), p)
para todo (q, p). Alem disso, dizemos que f0 e n
ao degenerada se a aplicacao
p 7 (p) e um difeomorfismo local.
Teorema 4.4.6. Seja f0 uma transformac
ao integr
avel n
ao degenerada de classe C . Ent
ao existe uma vizinhanca V de f0 no espaco C (Td B d , Rd ) tal
que para toda transformac
ao simpletica2 f V existe um conjunto compacto
d
d
K T B satisfazendo:
(a) K e uma uni
ao de toros diferenci
aveis da forma {(q, u(q)) : q Td }, cada
um dos quais e invariante for f ;
(b) a restric
ao de f a cada um destes toros e conjugada a uma translac
ao em
Td ;
(c) o conjunto K tem volume positivo e, de fato, o volume do complementar
converge para zero quando f f0 .
Analogamente ao caso anterior, a presenca de tal conjunto K implica que
f n
ao e erg
odica. Outra analogia e que o conjunto K est
a formado por toros
restritos aos quais a din
amica e conjugada a uma rotacao diofantina.
Os Teoremas 4.4.4 e 4.4.6 se estendem para sistemas de classe C r com r finito
mas suficientemente grande (dependendo da dimensao). Por exemplo, a versao
do Teorema 4.4.6 para d = 1 e verdadeira para r > 3 e falsa para r < 3; no caso
de transformacoes de classe C 3 , as conclusoes (a) e (b) do teorema permanecem
verdadeiras, mas n
ao a conclusao (c).
2 Relativamente

a forma simpl
`
etica can
onica (4.4.6).

CAPITULO 4. ERGODICIDADE

128

4.4.3

Pontos peri
odicos elticos

Os resultados enunciados acima podem ser aplicados, em particular, para descrever o comportamento de sistemas conservativos na vizinhanca de pontos
periodicos elticos. Vamos explicar isto sucintamente, comecando pelo caso
simpletico em dimensao 2.
Quando M e uma superfcie, as nocoes de forma simpletica e de forma de
area coincidem. Portanto, uma transformacao f : M M e simpletica se, e

somente se, ela preserva area. Seja M um ponto fixo eltico, ou seja, tal que
os autovalores.
os autovalores de Df () est
ao no crculo unit
ario. Sejam e
k
Dizemos que o ponto fixo e n
ao degenerado se 6= 1 para todo 1 k 4.
Ent
ao, pelo teorema da forma normal de Birkhoff (veja o Apendice 7 no livro
de Arnold [Arn78]), existem coordenadas canonicas (x, y) R2 na vizinhanca
do ponto fixo, com = (0, 0) e tais que, relativamente `as coordenadas polares
(, ) S 1 R definidas por
x=

cos

y=

sin

a transformacao f se escreve na seguinte forma:


f (, ) = ( + 0 + 1 , ) + R(, ) com |R(, )| C||2 .

(4.4.7)

Observe que a forma normal (, ) 7 ( + 0 + 1 , ) e integravel. Alem disso,


ela satisfaz a condicao de torcao (4.4.4), desde que 1 6= 0 (esta u
ltima condicao
n
ao depende da escolha das coordenadas canonicas, apenas da transformacao
f ). Ent
ao podemos aplicar os metodos do Teorema 4.4.6 para concluir que
existe um conjunto K com area positiva formado por crculos invariantes com
n
umeros de rotac
ao diofantinos, isto e, tais que a restricao de f a cada um
destes crculos e conjugada a uma rotacao diofantina. Mais ainda, o ponto fixo
e ponto de densidade deste conjunto:
lim

r0

m(B(, r) \ K)
= 0,
m(B(, r))

onde B(, r) representa a bola de raio r > 0 em torno de .


Vamos nos referir a pontos nas condicoes do par
agrafo anterior como pontos
fixos elticos genericos. Uma consequencia importante do que acabamos de dizer
e que pontos fixos elticos genericos de transformac
oes que preservam
area s
ao
est
aveis: a trajetoria de qualquer ponto proximo de permanece proxima de
para sempre, uma vez que est
a presa dentro de algum crculo invariante
pequeno. Este fato n
ao se estende para dimensao maior, como comentaremos
mais tarde.
Ainda em dimensao dois, queremos mencionar outros fenomenos dinamicos
importantes que ocorrem na vizinhanca de pontos fixos elticos genericos. Comecamos por apresentar uma ferramenta muito u
til, o chamado u
ltimo teorema
de Poincare ou teorema do ponto fixo de Poincare-Birkhoff. O enunciado e
certos casos particulares da demonstracao foram propostos por Poincare alguns


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

129

meses antes da sua morte; o caso geral foi demonstrado por Birkhoff [Bir13] no
ano seguinte.
Seja A = S 1 [a, b], com 0 < a < b, e seja f : A A um homeomorfismo que
preserva cada uma das componentes conexas do bordo do anel A. Dizemos que f
e um homeomorfismo de tors
ao se ele gira as componentes conexas do bordo em
sentidos opostos, ou seja, se existe algum levantamento F : R[a, b] R[a, b],
F (, ) = ((, ), R(, )) da transformacao f ao recobrimento universal do
anel, tal que



(, a) (, b) < 0 para todo R.

(4.4.8)

Teorema 4.4.7 (Ponto fixo de Poincare-Birkhoff). Se f : A A e um homeomorfismo de tors


ao que preserva a
rea ent
ao f admite, pelo menos, dois pontos
fixos no interior de A.
Conforme comentado anteriormente, todo ponto fixo eltico generico e acumulado por crculos invariantes com n
umeros de rotacao irracionais diofantinos.
Dois quaisquer dessas crculos delimitam um anel em torno de . Aplicando o
Teorema 4.4.7 (ou, mais precisamente, o corol
ario no Exerccio 4.4.6) conclui-se
que cada um desses aneis contem, pelo menos, um par de orbitas periodicas com
o mesmo perodo.
Em certo sentido, estes pares de orbitas periodicas sao o que resta dos crculos
invariantes da forma normal com n
umeros de rotacao racionais, destrudos pela
adicao do termo R em (4.4.7). Os seus perodos convergem para infinito quando
nos aproximamos de . Genericamente, uma das orbitas periodicas e hiperb
olica
(pontos de sela) e a outra eltica. Um exemplo est
a esbocado na Figura 4.3: o
ponto fixo eltico est
a rodeado por uma orbita periodica hiperb
olica e uma
orbita periodica eltica, assinaladas com as letras p e q, respectivamente, ambas
com perodo 4. Na figura tambem est
ao representadas dois crculos invariantes
em torno de .
O matematico suico Eduard Zehnder mostrou que, genericamente, as orbitas
periodicas hiperb
olicas apresentam pontos homoclnicos transversais, ou seja,
as respectivas variedades est
aveis e instaveis se intersectam transversalmente,
tal como est
a representado na Figura 4.3. Isto implica que a geometria das
variedades est
aveis e instaveis e extremamente complexa. As orbitas periodicas
elticas podem ser obtidas satisfazendo as condicoes de genericidade referidas
anteriormente. Isto quer dizer que toda a complexidade dinamica que estamos
descrevendo na vizinhanca de se reproduz na vizinhanca de cada uma dessas
orbitas elticas satelites.
Alem disso, a teoria desenvolvida pelo fsico frances Serge Aubry e pelo matematico americano John Mather mostra que tambem e acumulado por certos
conjuntos invariantes totalmente desconexos, restrita a cada um dos quais a
transformacao f e minimal (todas as orbitas sao densas). Em certo sentido, estes conjuntos de Aubry-Mather correspondem aos crculos invariantes da forma
normal con n
umeros de rotacao irracionais n
ao diofantinos, igualmente destrudos pela adicao do termo R em (4.4.7).

CAPITULO 4. ERGODICIDADE

130

Figura 4.3: Crculos invariantes, orbitas periodicas e intersecoes homoclnicas


na vizinhanca de um ponto fixo eltico generico

Figura 4.4: Evidencia computacional da presenca de crculos invariantes, ilhas


elticas e intersecoes homoclnicas transversais
A Figura 4.4 resume e ilustra boa parte do que acabamos de dizer. As trajetorias calculadas por computador representadas na figura permitem intuir a
presenca de crculos invariantes, de satelites elticos, com seus proprios crculos
invariantes, e ate mesmo de orbitas hiperb
olicas com as respectivas intersecoes
homoclnicas transversais. Tambem observamos na figura a presenca de trajetorias com comportamento ca
otico, aparentemente relacionadas com essas
intersecoes transversais.
Mais geralmente, seja f : M M um difeomorfismo simpletico numa variedade simpletica M de dimensao 2d 2 qualquer. Dizemos que um ponto fixo
M de f e eltico se todos os autovalores da derivada Df () est
ao no crculo
1 , . . . , d ,
d esses autovalores. Dizemos que e n
unit
ario. Sejam 1 ,
ao degenerado se k11 . . . kdd 6= 1 para todo (k1 , . . . , kd ) Zd com |k1 | + + |kd | 4
(em particular, os autovalores sao todos distintos). Ent
ao, pelo teorema da
forma normal de Birkhoff (Apendice 7 no livro de Arnold [Arn78]), existem co-


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

131

ordenadas can
onicas (x1 , . . . , xd , y1 , . . . , yd ) R2d na vizinhanca de tais que,
relativamente `
as coordenadas polares (, ) Td Rd definidas por
xj =

j cos j

yj =

j sin j ,

j = 1, . . . , d,

a transformacao f se escreve:
f (, ) = ( + 0 + 1 (), ) + R(, ) onde kR(, )k const kk2 ,
0 Rd e 1 e uma aplicacao linear em Rd . Supondo que 1 seja um isomorfismo
(mais uma condicao generica sobre a transformacao f ), temos que a forma
normal
(, ) = ( + 0 + 1 (), )
e integravel e satisfaz a condicao de torcao 4.4.4. Aplicando as ideias do Teorema 4.4.6, conclumos que e ponto de densidade de um conjunto K formado
por toros invariantes de dimensao d, restritos aos quais a transformacao f e
conjugada a uma rotacao diofantina.
Em particular, transformacoes simpleticas com pontos fixos (ou periodicos)
elticos genericos nunca sao erg
odicas. Observe, por outro lado que quando d > 1
um toro de dimensao d n
ao separa o espaco ambiente M em duas componentes
conexas. Portanto, o argumento que usamos atr
as para mostrar que pontos
fixos elticos genericos em superfcies sao est
aveis n
ao se estende para dimensao
superior. De fato, e sabido que quando d > 1 certas trajetorias comecando
perto do ponto fixo podem escapar para longe dele. Isto est
a relacionado com
o fenomeno chamado de difus
ao de Arnold, que constitui um tema muito ativo
de pesquisa nesta
area.
Finalmente, vamos observar que a teoria descrita anteriormente tambem se
aplica a sistemas conservativos com tempo contnuo. Dizemos que um ponto
estacion
ario de um fluxo hamiltoniano e eltico se todos os autovalores da
derivada do campo de vetores no ponto sao n
umeros imaginarios puros. Argumentos semelhantes ao do caso de tempo discreto mostram que, sob hipoteses
genericas, o ponto estacion
ario eltico e ponto de densidade de um conjunto formado por toros invariantes de dimensao d restritos a cada um dos quais o fluxo
hamiltoniano e conjugado a um fluxo linear.
Alem disso, valem resultados analogos para trajetorias periodicas de fluxos
hamiltonianos. Um modo de obter tais resultados e considerando uma secao
transversal ao fluxo cortando a trajetoria periodica, e aplicando as ideias anteriores `
a transformacao de Poincare correspondente. Conclumos que, sob certas
condicoes genericas, trajetorias periodicas elticas de fluxos hamiltonianos sao
acumuladas por conjuntos com medida positiva formados por toros invariantes
do fluxo.
A teoria de Kolmogorov, Arnold, Moser tem muitas outras aplicacoes, numa
grande diversidade de situacoes em Matem
atica, que fogem ao escopo deste
texto. O leitor interessado poder
a obter informacao mais completa nas seguintes
referencias: Arnold [Arn78], Bost [Bos86], Yoccoz [Yoc92], de la Llave [dlL93] e
Arnold, Kozlov, Neishtadt [AKN06], entre outras.

CAPITULO 4. ERGODICIDADE

132

4.4.4

Fluxos geod
esicos

Seja M uma variedade riemanniana compacta. O fibrado tangente T M e o


espaco das duplas (x, v) em que x M e v e um vetor tangente `a variedade
no ponto x. Denotamos por T 1 M o fibrado tangente unit
ario, formado pelas
duplas (x, v) T M com kvk = 1. Segue da teoria das equacoes diferenciais que
para cada (x, v) T M existe uma u
nica geodesica x,v : R M na variedade
tal que x,v (0) = x e x,v (0) = v. Alem disso, a famlia de transformacoes
definida por
f t : (x, v) 7 (x,v (t), x,v (t))
e um fluxo no fibrado tangente T M , que e chamado fluxo geodesico de M .
Equivalentemente, o fluxo geodesico pode ser definido como o fluxo hamiltoniano em T M correspondente `a funcao hamiltoniana H(x, v) = kvk2 . Portanto,
(f t )t preserva a medida de Liouville do fibrado tangente, a qual pode ser descrita da seguinte forma. A metrica riemanniana induz uma medida de volume
dx na variedade M e tambem induz um volume dv em cada espaco tangente
Tx M . A medida de Liouville de T M e dada, localmente, pelo produto dxdv.
Alem disso, a restricao m da medida de Liouville ao fibrado tangente unit
ario
e dada, localmente, pelo produto dxd, onde d e a medida de angulo na esfera unit
aria de Tx M . O fato de que H e uma integral primeira significa que
a norma kvk e constante ao longo de trajetorias do fluxo. Em particular, (f t )t
deixa invariante o fibrado tangente unit
ario. Alem disso, ele preserva a medida
de Liouville m restrita a T 1 M .
No entanto, o comportamento dos fluxos geodesicos e, geralmente, muito distinto da din
amica dos sistemas quase integraveis que descrevemos na Secao 4.4.2.
Por exemplo, o matematico austraco Eberhard Hopf [Hop39] mostrou em 1939
que se M e uma superfcie compacta com curvatura gaussiana negativa em todo
ponto ent
ao o fluxo geodesico e erg
odico. Este teorema foi estendido para variedades de qualquer dimensao quase tres decadas depois, por meio do seguinte
resultado not
avel do matematico sovietico Dmitry Anosov [Ano67]:
Teorema 4.4.8 (Anosov). Seja M uma variedade compacta com curvatura seccional negativa. Ent
ao o fluxo geodesico no fibrado tangente unit
ario e erg
odico
para a medida de Liouville em T 1 M .
Desta forma, os fluxos geodesicos em variedades de curvatura negativa constituiram a primeira classe importante de sistemas hamiltonianos para os quais
a hip
otese erg
odica pode ser comprovada rigorosamente.

4.4.5

Sistemas de Anosov

O primeiro ingrediente fundamental na demonstracao do Teorema 4.4.8 e mostrar que todo fluxo geodesico de uma variedade com curvatura negativa e uniformemente hiperb
olico. Isto quer dizer que toda trajetoria do fluxo est
a contida
em subvariedades invariantes W s () e W u () que se intersectam transversalmente ao longo de e tais que


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

133

toda trajetoria em W s () e exponencialmente assint


otica a no futuro
toda trajetoria em W u () e exponencialmente assint
otica a no passado
(veja a Figura 4.5), com taxas exponenciais de convergencia uniformes para
toda trajetoria . Alem disso, o fluxo geodesico e transitivo. A segunda parte
da demonstracao do Teorema 4.4.8 consiste ent
ao em mostrar que todo fluxo
uniformemente hiperb
olico (fluxo de Anosov ), transitivo, de classe C 2 que preserva volume e erg
odico. Comentaremos essa quest
ao num instante.
W s ()

W u ()

Figura 4.5: Comportamento hiperb


olico
Existe uma nocao correspondente para sistemas com tempo discreto: dizemos que um difeomorfismo f : N N numa variedade riemanniana compacta
e uniformemente hiperb
olico (difeomorfismo de Anosov ) se o espaco tangente
`a variedade em todo ponto z N admite uma decomposicao em soma direta
Tz N = Ezs Ezu tal que a decomposicao e invariante pela derivada do difeomorfismo:
Df (z)Ezs = Efs (z)

e Df (z)Ezu = Efu(z)

para todo z N ,

(4.4.9)

e a derivada contrai Ezs e expande Ezu , uniformemente:


sup kDf (z) | Ezs k < 1 e

zN

sup kDf (z)1 | Ezu k < 1

(4.4.10)

zN

(para alguma escolha da norma compatvel com a metrica riemanniana de M ).


Prova-se que para cada z N o conjunto W s (z) dos pontos cuja trajetoria
futura e assint
otica `
a trajetoria de z forma uma subvariedade diferenci
avel de N
tangente a Ezs no ponto z; analogamente, o conjunto W s (z) dos pontos cuja trajetoria passada e assint
otica `
a trajetoria de z e uma subvariedade diferenci
avel
tangente a Ezu no ponto z. Estas subvariedades formam laminacoes (ou seja,
decomposicoes de N em subvariedades diferenci
aveis) que sao invariantes pelo
difeomorfismo:
f (W s (z)) = W s (f (z)) e

f (W u (z)) = W u (f (z)) para todo z N .

Anosov tambem provou que todo difeomorfismo uniformemente hiperb


olico,
transitivo, de classe C 2 que preserva o volume e erg
odico. A ferramenta tecnica
crucial e o seguinte teorema provado por Anosov, Sinai [AS67]:

CAPITULO 4. ERGODICIDADE

134

Teorema 4.4.9 (Continuidade absoluta). As laminac


oes est
avel e inst
avel de
qualquer difeomorfismo (ou fluxo) de Anosov de classe C 2 s
ao absolutamente
contnuas:
1. se X N tem volume zero ent
ao X W s (x) tem volume zero dentro de
s
W (x) para quase todo x N ;
2. se Y e um subconjunto com volume zero de uma subvariedade
transversal `
a laminac
ao est
avel, ent
ao a uni
ao das variedades est
aveis dos
pontos de Y tem volume zero em N ;
e analogamente para a laminac
ao inst
avel.
A ergodicidade pode ent
ao ser deduzida por meio do argumento de Hopf,
que j
a ilustramos na Secao 4.2.6 num caso particular. Dada qualquer funcao
contnua : N R, seja E o conjunto dos pontos z N onde as medias
orbitais no futuro e no passado, + (z) e (z) est
ao definidas e coincidem.
E tem volume total, como vimos no Corolario 3.2.8, Observe tambem que
+ e constante em cada variedade est
avel e e constante em cada variedade
instavel. Logo pela primeira parte do Teorema 4.4.9, a intersecao Yz = W u (z)
E tem volume total em W u (z) para quase todo z N . Alem disso, = +
e constante em cada Yz . Fixe qualquer z nestas condicoes. A hipotese de
transitividade implica que a uniao das variedades est
aveis dos pontos de W u (z)
e toda a variedade N . Logo, usando a segunda parte do Teorema 4.4.9, a uniao
das variedades est
aveis dos pontos de Yz tem volume total en N . Alem disso,
+ e constante nessa uniao. Isto mostra que a media orbital de e constante
em quase todo ponto, para toda funcao contnua. Portanto, f e erg
odico.
Terminamos esta secao observando que todos os exemplos conhecidos de
difeomorfismos de Anosov sao transitivos mas isso n
ao e verdade no caso de
fluxos de Anosov (veja Verjovsky [Ver99]). Outro problema em aberto e se a
ergodicidade ainda vale quando o difeomorfismo ou fluxo de Anosov e apenas
sabido que neste caso o teorema de continuidade absoluta
de classe C 1 . E
(Teorema 4.4.9) e falso, em geral (veja [Bow75b, RY80]).

4.4.6

Bilhares

Como vimos nas Secoes 4.4.2 e 4.4.3, sistemas n


ao erg
odicos sao bastante comuns no mundo dos fluxos hamiltonianos e das transformacoes simpleticas. No
entanto, por si so isto n
ao basta para invalidar a hipotese ergodica de Boltzmann
no contexto em que ela foi formulada. De fato, gases ideais sao sistemas de um
tipo especial: e concebvel que ergodicidade possa ser tpico nesse ambito mais
restrito, mesmo n
ao o sendo para sistemas hamiltonianos gerais.
Na decada de 1960, o matematico e fsico teorico sovietico Yakov Sinai [Sin63]
conjecturou que os sistemas hamiltonianos formados por esferas que chocam
elasticamente entre si sao erg
odicos. Esse modelo para o comportamento de
gases ideais havia sido proposto originalmente pelo cientista americano Josiah
Willard Gibbs que, juntamente com Boltzmann e com o matematico e fsico


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

135

teorico escoces James Clark Maxwell, criou a area da Mecanica Estatstica. Ele
sera apresentado de forma precisa no Exemplo 4.4.11. A hip
otese erg
odica de
Boltzmann-Sinai, como e conhecida a conjectura de Sinai, e o tema principal da
presente secao.
De fato, discutiremos a quest
ao da ergodicidade para sistemas um pouco
mais gerais, chamados bilhares, cuja definicao formal foi dada pela primeira vez
por Birkhoff, nos anos 1930.
Na sua forma mais simples, um bilhar e dado por um domnio conexo limitado R2 , a mesa do bilhar, cujo bordo est
a formado por um n
umero
finito de curvas diferenci
aveis. Chamamos cantos aos pontos onde o bordo n
ao e
diferenci
avel; por hip
otese eles formam um conjunto finito C . Consideramos uma partcula pontual em movimento retilneo uniforme dentro de , com
choques el
asticos com o bordo. Isto e, a cada encontro com \ C a partcula e
refletida, de tal forma que o
angulo de incidencia e igual ao angulo de reflex
ao.
Quando a partcula acerta um dos cantos ela e absorvida: a trajetoria n
ao est
a
definida a partir da.
Denotamos por n o campo de vetores unit
ario normal ao bordo e apontando para dentro de . Ele define uma orientacao em \ C: um vetor t
claro que o
tangente ao bordo e positivo se a base {t, n} de R2 e positiva. E
movimento da partcula fica totalmente caracterizado pela sequencia de choques
com o bordo. Alem disso, cada choque pode ser descrito pela posicao s e
pelo angulo de reflex
ao (/2, /2). Portanto, a evolucao do bilhar e regida
pela transformacao
f : ( \ C) (/2, /2) (/2, /2),

(4.4.11)

que a cada choque (s, ) associa o choque subsequente (s , ). Veja a Figura 4.6.

Figura 4.6: Din


amica de bilhares
No exemplo na esquerda da Figura 4.6 a mesa e poligonal, ou seja, o seu
bordo e conexo e est
a formado por um n
umero finito de segmentos de reta.
A trajetoria que est
a representada na figura acerta um dos cantos do bilhar.
Trajetorias proximas dela que colidem com o bordo em lados distintos do canto
apresentam
angulos de incidencia muito diferentes. Em particular, a transformacao do bilhar (4.4.11) n
ao e contnua. No exemplo na direita da Figura 4.6
o bordo tem quatro componentes conexas, cada umas das quais e uma curva
diferenci
avel. Logo, n
ao existem cantos. Considere a trajetoria representada

CAPITULO 4. ERGODICIDADE

136

na figura, tangenciando uma das componentes conexas do bordo. Trajetorias


proximas dela colidem com componentes conexas distintas do bordo. Portanto,
a transformacao do bilhar apresenta descontinuidades tambem neste caso.
Exemplo 4.4.10. (Mesa circular) No lado esquerdo da Figura 4.7 representamos o bilhar na bola unit
aria R2 . A respectiva transformacao est
a dada
por
f : (s, ) 7 (s ( 2), );

no lado direito da Figura 4.7 descrevemos geometricamente o comportamento


desta transformacao. Observe que f preserva a medida de area ds d. Note
que f e integravel (no sentido da Secao 4.4.2) e, em particular, a medida de
area n

ao e erg
odica. Note tambem que f satisfaz a condicao de torcao (4.4.4).
Veremos daqui a pouco, no Teorema 4.4.12, que todo bilhar plano preserva uma
medida natural, equivalente `a medida de area em (/2, /2). A partir das
observacoes anteriores, a teoria KAM permite mostrar que muitos bilhares com
mesas quase circulares n
ao sao erg
odicos relativamente a essa medida invariante.
s

= /2

= /2

Figura 4.7: Bilhar em mesa circular


A definicao de bilhar se estende imediatamente para domnios conexos limitados em qualquer espaco euclideano Rd , d 1, cujo bordo est
a formado por
um n
umero finito de hipersuperfcies diferenci
aveis que se intersectam ao longo
de subvariedades de codimensao maior que 1. Denotamos por C a uniao destas
subvariedades. Tal como antes, munimos com a orientacao induzida pelo
vetor unit
ario normal n que aponta para dentro. Reflexoes elasticas no bordo
sao definidas pela condicao de que a trajetoria incidente, a trajetoria refletida
e o vetor normal n sao coplanares e o angulo de incidencia e igual ao angulo de
reflex
ao. A transformacao do bilhar e definida como em (4.4.11), tendo como
domnio
{(s, v) ( \ C) S d1 : v n(s) > 0}.

Mais geralmente ainda, podemos tomar como mesa de bilhar qualquer domnio
conexo limitado numa variedade riemanniana, cujo bordo est
a formado por um
n
umero finito de hipersuperfcies diferenci
aveis. As definicoes sao analogas,
exceto que as trajetorias entre choques consecutivos com o bordo sao dadas por
geodesicas da variedade.


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

137

Exemplo 4.4.11 (Gases ideais e bilhares). Idealmente, um g


as est
a formado
por um grande n
umero N de moleculas (N 1027 ) que se deslocam em movimento retilneo e uniforme e se chocam de forma elastica. Veja o lado direito
da Figura 4.8. Por simplicidade, vamos supor que as moleculas sao esferas
identicas, contidas no toro 3 de dimensao d 2. Suponhamos, igualmente, que
todas as moleculas se deslocam com velocidade escalar igual a 1. Este sistema
pode ser descrito por meio de um bilhar, da seguinte forma.
Td

Rij
vj

vj

vi

vj

vi
vi

Figura 4.8: Modelo de um g


as ideal
Para 1 i N , represente por pi Td a posicao do centro da i-esima
molecula Mi . Seja > 0 o raio de cada molecula. Ent
ao, cada estado do
sistema fica inteiramente descrito por um valor de p = (p1 , . . . , pN ) no conjunto
= {p = (p1 , . . . , pN ) TN d : kpi pj k 2 para todo i 6= j}
(este conjunto e conexo, desde que seja suficientemente pequeno). Na ausencia
de choques, o ponto p se desloca ao longo de uma reta, com velocidade com
norma constante igual a 1. Quando duas moleculas Mi e Mj se chocam temos
que kpi pj k = 2 e os vetores de velocidade das duas moleculas mudam da
seguinte forma. Sejam vi e vj os vetores de velocidade imediatamente antes do
choque e seja Rij a reta que passa por pi e pj . A hipotese de que o choque e
elastico quer dizer que os vetores de velocidade vi e vj logo apos o choque sao
tais que: (veja o lado direito da Figura 4.8):
(i) as componentes dos vetores vi e vi na direcao da reta Rij sao simetricas e
o mesmo vale para vj e vj ;
(ii) as componentes dos vetores vi e vi na direcao ortogonal `a reta Rij sao
iguais e o mesmo vale para vj e vj .
Isto significa (Exerccio 4.4.4) que o ponto p tem uma reflex
ao elastica na hipersuperfcie {p : kpi pj k = 2} do bordo de . Portanto, o movimento
do ponto p corresponde exatamente `a evolucao do bilhar na mesa .
3 Podemos substituir Td por recipientes fisicamente mais plaus
veis, como o cubo [0, 1]d de
dimens
ao d, por exemplo. Mas a an
alise que segue fica um pouco mais complicada nesse caso,
porque precisamos levar em conta tamb
em os choques das bolas com as paredes do recipiente.

CAPITULO 4. ERGODICIDADE

138

O fato que vamos enunciar em seguida coloca os bilhares dentro do domnio


de interesse da Teoria Erg
odica. Seja ds a medida de volume induzida em
pela metrica riemanniana ambiente; no caso bidimensional, ds e, simplesmente,
o comprimento de arco. Denotemos por d a medida de angulo em cada hemisferio {v S d1 : v n(s) > 0}.
Teorema 4.4.12. A transformac
ao f preserva a medida = cos ds d no
domnio {(s, v) S d1 : v n(s) > 0}.
Vamos esbocar a demonstracao no caso de bilhares planos (ou seja, quando
R2 ), deixando a cargo do leitor verificar que os argumentos se estendem de
maneira natural para dimensao arbitraria.
dh
s

dt

d
s

Figura 4.9: Calculo da derivada da transformacao do bilhar


Considere uma famlia de trajetorias saindo de um u
nico ponto do bordo
(ou seja, com s fixado), parametrizada pelo angulo de reflex
ao , conforme
representado no lado esquerdo da Figura 4.9. Designe por (s, s ) o comprimento
do segmento ligando s a s . Ent
ao (s, s )d = dh = cos ds e, portanto,
(s, s )
s
.
=

cos
Para calcular a derivada de em relacao a , observe que a variacao de e a
soma de duas componentes: a primeira corresponde `a variacao de enquanto
que a segunda provem da variacao do vetor normal n(s ) `a medida que o ponto
de incidencia varia. Pela definicao de curvatura, esta segunda componente e
igual a (s )ds . Portanto, d = d + (s )ds e, consequentemente,
s
(s, s )

.
= 1 + (s )
= 1 + (s )

cos
Resumindo, temos que
Df (s, )

(s, s ) 
(s, s )
+ 1 + (s )
=

cos s
cos

(4.4.12)

Em seguida, considere uma famlia de trajetorias paralelas, parametrizada


pelo comprimento de arco t na direcao ortogonal, conforme representado no lado
direito da Figura 4.9. As variacoes de s e s ao longo desta famlia sao dadas


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

139

por cos ds = dt = cos ds . Como as trajetorias tem direcao constante, as


variacoes de e provem apenas das variacoes dos vetores normais n(s) e n(s )
quando s e s variam. Ou seja, d = (s)ds e d = (s )ds . Portanto,
Df (s, )

(s )
(s) 
1
=
+
.

cos s cos
cos s
cos

(4.4.13)

Seja J(s, ) a matriz da derivada Df (s, ) relativamente `as bases {/s, /}


e {/s , / }. As relacoes (4.4.13) e (4.4.13) d
ao que




(s,s )
1


cos

cos



1 + (s ) (s,s ) (s )
cos
cos
cos


det J(s, ) =
=
.
(4.4.14)
0 1
cos
cos

1 (s)
cos

Ent
ao, pela f
ormula de mudanca de variaveis na integral,
Z
Z
Z
cos
ds d
d = (s , ) cos ds d = (f (s, )) cos
cos
Z
Z
= (f (s, )) cos ds d = ( f ) d.

Isto mostra que f preserva a medida = cos dsd, conforme afirmamos.


Dizemos que um bilhar e dispersivo se o seu bordo e estritamente convexo
em todo ponto, quando observado do interior. No caso plano, com as convencoes
sobre orientacao que fizemos anteriormente, isto significa que a curvatura e
negativa em todo ponto. A Figura 4.10 apresenta dois exemplos. No primeiro
R2 e o bordo e uma curva conexa formada por cinco segmentos de curva
diferenci
aveis. No segundo exemplo T2 e o bordo tem tres componentes
conexas, todas diferenci
aveis e convexas.

T2

Figura 4.10: Bilhares dispersivos


A classe dos bilhares dispersivos foi introduzida por Sinai em artigo [Sin70]
publicado em 1970. A raz
ao de ser da denominacao e que para tais bilhares feixes

140

CAPITULO 4. ERGODICIDADE

de trajetorias paralelas se tornam divergentes apos reflex


ao no bordo do bilhar,
conforme ilustrado na Figura 4.10. Sinai observou que bilhares dispersivos sao
sistemas hiperb
olicos, num sentido n
ao uniforme: fibrados invariantes Ezs e Ezu
como em (4.4.9) existem em quase todo ponto; no lugar de (4.4.10) temos que a
derivada e assintoticamente contrativa ao longo de Ezs e expansiva ao longo de
Ezu , ou seja, para iterados suficientemente grandes (dependendo do ponto z).
Os bilhares associados a gases ideais com N = 2 moleculas (Exemplo 4.4.11)
sao dispersivos: e f
acil ver que {(p1 , p2 ) R2d : kp1 p2 k = 2} e uma hipersuperfcie convexa. Consequentemente, esses bilhares sao hiperb
olicos, no sentido
do par
agrafo anterior. Usando uma versao sutil do argumento de Hopf, Sinai
mostrou em [Sin70] que tais bilhares sao erg
odicos, pelo menos no caso d = 2.
Esta conclusao foi estendida para qualquer d 2 por Sinai e seu estudante
Nikolai Chernov [SC87], ainda no caso N = 2. Esta foi a primeira classe de
bilhares para os quais ergodicidade foi provada rigorosamente.
O caso N 3 da hipotese erg
odica de Boltzmann-Sinai e bem mais difcil,
porque os bilhares correspondentes n
ao sao dispersivos: a hipersuperfcie
{(p1 , p2 , . . . , pN ) RN d : kp1 p2 k = 2}
tem geometria cilndrica, com curvatura nula na direcao das variaveis pi , i > 2.
Tais bilhares sao chamados semi-dispersivos. A maior parte dos resultados nesse
caso e devida aos matematicos h
ungaros Andr
as Kramli, N
andor Simanyi y
Domoko Szasz. Nos artigos [KSS91, KSS92] eles provaram hiperbolicidade e
ergodicidade para N = 3 e tambem para N = 4 supondo d 3. Posteriormente,
Simanyi [Sim02] provou hiperbolicidade para o caso geral: qualquer n
umero de
esferas em qualquer dimensao. A prova da ergodicidade continua em aberto,
em geral, embora existam muitos outros resultados parciais.

Figura 4.11: Est


adio e cogumelo de Bunimovich
Atualmente sao conhecidos diversos bilhares erg
odicos que n
ao sao dispersivos, inclusive tais que a curvatura e maior ou igual que zero em todo ponto.
O exemplo mais conhecido e o est
adio de Bunimovich, cujo bordo est
a formado
por dois semicrculos e dois segmentos de reta. Este bilhar e hiperb
olico, mas
esta propriedade resulta de um mecanismo diferente, chamado desfocalizac
ao:
um feixe de trajetorias paralelas que se reflete num segmento c
oncavo da parede da mesa comeca por se concentrar (focar), mas depois se dispersa. Veja a
Figura 4.11. Outro exemplo interessante e o cogumelo de Bunimovich, no qual
os comportamentos hiperb
olico e eltico coexistem, em conjuntos invariantes
disjuntos com medida positiva.


4.4. COMENTARIOS
SOBRE SISTEMAS CONSERVATIVOS

4.4.7

141

Exerccios

4.4.1. Dizemos que Rd e -diofantino se ele e (c, )-diofantino, ou seja,


se ele satisfaz (4.4.5), para algum c > 0. Prove que o conjunto dos vetores
-diofantinos e n
ao vazio se, e somente se, d 1. Alem disso, esse conjunto
tem medida total em Rd sempre que e estritamente maior que d 1.
4.4.2. Considere um bilhar em uma mesa retangular. Verifique que toda trajetoria (que nunca acerta um dos vertices) ou e periodica ou e densa na mesa
do bilhar.
4.4.3. Mostre que todo bilhar em uma mesa triangular acut
angula tem alguma
trajetoria periodica. [Observacao: O mesmo vale para triangulos ret
angulos mas
este problema est
a em aberto, em geral, no caso de triangulos obtusangulos.]
4.4.4. Considere o modelo de g
as ideal descrito no Exemplo 4.4.11. Verifique que os choques el
asticos entre duas moleculas quaisquer correspondem a
reflex
oes el
asticas do bilhar no bordo de .
4.4.5. Demonstre o Teorema 4.4.7, sob a hipotese adicional de que a funcao
7 (, ) e mon
otona (crescente ou descrescente) para todo R.
4.4.6. Considere o contexto do Teorema 4.4.7 mas, no lugar de (4.4.8), suponha
que f gira as componentes conexas do bordo de A com velocidades distintas:
existe um levantamento F : R [a, b] R [a, b] e existem p, q Z com q 1,
tais que, escrevendo F q = (q , Rq ),
 q


(, a) p q (, b) p < 0 para todo R.
(4.4.15)
Mostre que f tem pelo menos duas orbitas de perodo q no interior de A.

4.4.7. Seja um domnio convexo no plano cujo bordo e uma curva diferenci
avel. Mostre que o bilhar em tem infinitas orbitas periodicas.

142

CAPITULO 4. ERGODICIDADE

Captulo 5

Decomposic
ao Erg
odica
No caso de subconjuntos convexos de espacos vetoriais com dimensao finita temse que todo elemento do convexo pode ser escrito como combinacao convexa dos
elementos extremais. Por exemplo, todo ponto num triangulo no plano pode
ser escrito como combinacao convexa dos vertices do triangulo. Na sequencia
dos resultados da Secao 4.3, e natural perguntar se a mesma propriedade vale
no espaco das probabilidades invariantes, ou seja, se toda medida invariante e
uma combinacao linear de medidas erg
odicas.
O teorema da decomposicao erg
odica que vamos provar neste captulo (Teorema 5.1.3) mostra que a resposta e afirmativa, exceto que o n
umero de parcelas nesta combinacao n
ao e necessariamente finito, nem mesmo enumeravel.
Este teorema tem diversas importantes aplicacoes; em particular, ele permite reduzir a demonstracao de muitos resultados ao caso em que o sistema e erg
odico.
Provaremos o teorema da decomposicao erg
odica a partir de outro resultado
importante da Teoria da Medida, chamado teorema da desintegracao de Rokhlin.
A instancia mais simples deste teorema ocorre quando temos uma particao finita
de um espaco de medida (M, ) num n
umero finito de subconjuntos mensuraveis
P1 , . . . , PN com medida positiva. Ent
ao, evidentemente, podemos escrever
como combinacao linear
= (P1 )1 + + (PN )N
das suas restricoes normalizadas i (E) = (E Pi )/(Pi ) a cada um dos elementos da particao. O teorema da desintegracao de Rokhlin (Teorema 5.1.11)
afirma que este tipo de desintegracao da probabilidade e possvel para qualquer
particao P (possivelmente n
ao enumeravel!) que possa ser obtida como limite
de uma sequencia crescente de particoes finitas.

5.1

Teorema da decomposi
c
ao erg
odica

Antes de enunciarmos o teorema da decomposicao erg


odica vamos analisar um
par de exemplos que ajudam a motivar e delimitar o seu enunciado:
143

144

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

Exemplo 5.1.1. Considere f : [0, 1] [0, 1] dada por f (x) = x2 . As medidas


de Dirac 0 e 1 sao invariantes e erg
odicas para f . Tambem e claro que x = 0
e x = 1 sao os u
nicos pontos recorrentes por f e portanto toda probabilidade
invariante satisfaz ({0, 1}) = 1. Em particular, = ({0})0 + ({1})1 e
uma combinacao convexa (finita) de medidas erg
odicas.
Exemplo 5.1.2. Considere f : T2 T2 dada por f (x, y) = (x + y, y). A
medida de Lebesgue m no toro e preservada por f . Observe que todo crculo
horizontal Hy = S 1 {y} e invariante por f e a restricao f : Hy Hy e a
rotacao Ry . Seja my a medida de Lebesgue em Hy . Observe que my tambem
e invariante por f . Alem disso, my e erg
odica sempre que y e irracional. Por
outro lado, pelo teorema de Fubini,
Z
m(E) = my (E) dy para todo conjunto mensuravel E.
(5.1.1)
A igualdade n
ao e afetada se considerarmos a integral restrita ao subconjunto
dos valores irracionais de y. Ent
ao (5.1.1) apresenta como uma combinacao
convexa (nao-enumer
avel) de medidas erg
odicas.

5.1.1

Enunciado do teorema

Antes de enunciar o teorema da decomposicao erg


odica, precisamos introduzir
alguma terminologia. No que segue (M, B, ) sera um espaco de probabilidade e P sera uma particao de M em conjuntos mensuraveis. Denotaremos por
: M P a projecao natural que associa a cada ponto x M o elemento P(x)
da particao que o contem. Esta projecao permite munir P de uma estrutura de
espaco de probabilidade, da seguinte forma. Primeiramente, dizemos que um
subconjunto Q de P e mensuravel se, e somente se, a pre-imagem
1 (Q) = uniao dos elementos P de P que pertencem a Q
facil ver que esta definicao est
e um subconjunto mensuravel de M . E
a correta:

a famlia B dos subconjuntos mensuraveis e uma -algebra em P. Em seguida,


definimos a medida quociente
por

(Q) = ( 1 (Q))

para cada Q B.

Teorema 5.1.3 (Decomposicao erg


odica). Seja M um espaco completo separ
avel, f : M M uma transformac
ao mensur
avel e uma probabilidade invariante. Ent
ao existe um conjunto mensur
avel M0 M com (M0 ) = 1, uma
partic
ao P de M0 em subconjuntos mensur
aveis e uma famlia de probabilidades
{P : P P} em M , satisfazendo
(a) P (P ) = 1 para
-quase todo P P;
(b) P 7 P (E) e mensur
avel, para todo conjunto mensur
avel E M ;
(c) P e invariante e erg
odica para
-quase todo P P;

ERGODICA

5.1. TEOREMA DA DECOMPOSIC


AO
(d) (E) =

145

P (E) d
(P ), para todo conjunto mensur
avel E M .

A relacao (d) significa que e uma combinacao convexa das varias probabilidades erg
odicas P , em que cada P entra com peso igual a
(P ). O item
(b) assegura que a integral em (d) est
a bem definida. Observe tambem que a
afirmacao em (b) implica que a aplicacao P M1 (M ) dada por P 7 P e
mensuravel (veja o Exerccio 5.1.3).

5.1.2

Desintegrac
ao de uma medida

Vamos deduzir o Teorema 5.1.3 de um resultado de Teoria da Probabilidade, o


teorema da desintegracao de Rokhlin, que tem muitas outras aplicacoes. Para
enunciar este teorema precisamos da seguinte nocao.
Defini
c
ao 5.1.4. Uma desintegrac
ao de relativamente a uma particao P e
uma famlia {P : P P} de probabilidades em M tal que, para todo conjunto
mensuravel E M :
(a) P (P ) = 1 para
-quase todo P P;
(b) a aplicacao P R, P 7 P (E) e mensuravel;
R
(c) (E) = P (E) d
(P ).

Lembre que a particao P tem uma estrutura natural de espaco de probabilidade, com uma -algebra B e uma probabilidade
. As P sao chamadas
probabilidades condicionais de relativamente a P.
Exemplo 5.1.5. Seja P = {P1 , . . . , Pn } uma particao finita de M em subconjuntos mensuraveis com (Pi ) > 0 para todo i. A medida quociente
e dada
por
({Pi }) = (Pi ). Considere a restricao normalizada i de a cada Pi :
i (E) =

(E Pi )
(Pi )

para cada conjunto mensuravel E M.

Ent
ao {
e uma desintegracao da medida relativamente a P, ja que
1 , . . . , n }
P
n
(E) = i=1
({Pi })i (E) para todo conjunto mensuravel E M .

Esta construcao se estende imediatamente ao caso de particoes enumeraveis.


No proximo exemplo tratamos um caso n
ao enumeravel:
Exemplo 5.1.6. Seja M = T2 e seja P a particao de M em crculos horizontais
S 1 {y}, y S 1 . Seja m a medida de Lebesgue em T2 , seja m
a medida de Lebesgue em S 1 , e denote por my a medida de Lebesgue (medida de comprimento)
em cada crculo horizontal S 1 {y}. Pelo teorema de Fubini,
Z
m(E) = my (E) dm(y)

para todo conjunto mensuravel E T2 .


Logo {my : y S 1 } e uma desintegracao de m relativamente a P.

146

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

A proxima proposicao mostra que desintegracoes sao essencialmente u


nicas,
quando existem. A hipotese da proposicao e muito geral: ela e satisfeita, por
exemplo, sempre que M e um espaco topologico com base enumeravel de abertos
e B e a sua -agebra de Borel:
Proposi
c
ao 5.1.7. Suponha que a -
algebra B admite algum gerador enumer
avel. Se {P : P P} e {P : P P} s
ao desintegrac
oes de com respeito a
P, ent
ao P = P para
-quase todo P P.
Demonstrac
ao. Seja um gerador enumeravel de B e seja A a algebra gerada
por . Note que A e enumeravel, uma vez que ela coincide com a uniao das
algebras (finitas) geradas pelos subconjuntos finitos de . Para cada A A

considere os conjuntos
QA = {P P : P (A) > P (A)}

RA = {P P : P (A) < P (A)}.

Se P QA ent
ao P est
a contido em 1 (QA ) e, usando a propriedade (a) na
definicao de desintegracao, P (A 1 (QA )) = P (A). Caso contrario, P e
disjunto de 1 (QA ) e, portanto, P (A 1 (QA )) = 0. Alem disso, valem
enunciados analogos com P no lugar de P . Logo, usando a propriedade (c)
na definicao de desintegracao,
R
R
1
(P )
(P ) = QA P (A) d
P P (A (QA )) d
(A 1 (QA )) =
R
R
1
(P ).
(QA )) d
(P ) = QA P (A) d
P P (A

Como P (A) > P (A) para todo P QA , isto implica que


(QA ) = 0 para
todo A A. Um argumento analogo mostra que
(RA ) = 0 para todo A A.
Ent
ao
[
QA RA
AA

tambem e um subconjunto de P com medida nula. Para todo P no complementar deste subconjunto, as medidas P e P coincidem na algebra geradora A e,
portanto, coincidem em toda a -algebra B.
Por outro lado, desintegracoes podem n
ao existir:
Exemplo 5.1.8. Seja f : S 1 S 1 uma rotacao irracional e seja P a particao
de S 1 cujos elementos sao as orbitas {f n (x) : n Z} de f . Suponha que existe
uma desintegracao {P : P P} da medida de Lebesgue com relacao a P.
Considere os iterados {f P : P P} das probabilidades condicionais. Como
os elementos da particao sao conjuntos invariantes, f P (P ) = P (P ) = 1 para
claro que, dado qualquer conjunto mensuravel E M ,

-quase todo P . E
P 7 f P (E) = P (f 1 (E))
e uma funcao mensuravel. Alem disso, como e uma medida invariante,
Z
Z
1
1
(E) = (f (E)) = P (f (E)) d
(P ) = f P (E) d
(P ).

ERGODICA

5.1. TEOREMA DA DECOMPOSIC


AO

147

Estas observacoes mostram que {f P : P P} e uma desintegracao de


relativamente a P. Por unicidade (Proposicao 5.1.7), segue que f P = P para

-quase todo P . Ou seja, quase toda probabilidade condicional P e invariante.


Isto e uma contradicao, uma vez que P = {f n (x) : n Z} e um conjunto infinito
enumer
avel e, portanto, n
ao pode existir nenhuma probabilidade invariante que
de peso positivo a P .
O teorema de Rokhlin afirma que desintegracoes sempre existem se a particao
P for o limite de uma sequencia crescente de particoes enumeraveis e se o espaco
M for razoavel. O enunciado preciso sera dado na proxima secao.

5.1.3

Partic
oes mensur
aveis

Dizemos que P e uma partic


ao mensur
avel se, restrita a algum subconjunto de
M com medida total, ela e o limite de uma sequencia crescente de particoes enumeraveis. Mais precisamente, a particao e mensuravel se existe algum conjunto
mensuravel M0 M com medida total tal que, restrito a M0 ,
P=

n=1

Pn

para alguma sequencia crescente P1 P2 Pn de particoes


enumer
aveis. Lembre que Pi Pi+1 significa que todo elemento de Pi+1 est
a
contido em algum elemento de Pi . Ent
ao dizemos que Pi e menos fina do que
Pi+1 . Alem disso,
e a particao menos fina tal que
n=1 Pn
Pn

n=1

Pn

para todo n.

Os seus elementos sao as intersecoes n


ao vazias da forma
n=1 Pn com Pn Pn
para todo n. Veja tambem o Exerccio 5.1.1.
imediato da definicao que toda particao finita ou enumeravel e mensuravel.
E

E facil dar exemplos de particoes mensuraveis n


ao enumeraveis:
Exemplo 5.1.9. Seja M = T2 , munido da medida de Lebesgue m, e seja P
a particao de M nos crculos horizontais S 1 {y}. Ent
ao P e uma particao
mensuravel. Para ver isso, considere
Pn = {S 1 I(i, n) : i = 1, . . . , 2n },
onde I(i, n), 1 i 2n e o segmento de S = R/Z correspondente ao intervalo
[(i 1)/2n , i/2n ) R. A sequencia (Pn )n e crescente e P =
n=1 Pn .
Por outro lado, nem todas as particoes sao mensuraveis:
Exemplo 5.1.10. Seja f : M M uma transformacao mensuravel tal que
(f, ) e erg
odica. Seja P a particao de M cujos elementos sao as orbitas de f .
Ent
ao P n
ao e mensuravel, a menos que f possua alguma orbita com medida

148

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

total. De fato, suponha que existe uma sequencia P1 P2 Pn


de particoes enumer
aveis tal que P =
n=1 Pn restrito a algum conjunto com
medida total. Esta u
ltima condicao implica que quase toda orbita de f est
a
contida em algum elemento Pn da particao Pn . Em outras palavras, a menos
de um conjunto com medida nula, todo elemento de Pn e invariante por f .
Por ergodicidade, segue que para cada n existe exatamente um Pn Pn tal
que m(Pn ) = 1. Denote P =
ao P e um elemento da particao
n=1 Pn . Ent

e uma orbita de f e tem m(P ) = 1.


n=1 Pn = P, ou seja,
Teorema 5.1.11 (Desintegracao de Rokhlin). Suponha que o espaco metrico
M e completo separ
avel e que P e partic
ao mensur
avel. Ent
ao a probabilidade
admite alguma desintegrac
ao relativamente a P.
O Teorema 5.1.11 sera provado na Secao 5.2. Pode mostrar-se que a hipotese
de que P e mensuravel e tambem necessaria para a conclusao do teorema (veja
o Exerccio 5.2.2).

5.1.4

Prova do teorema da decomposic


ao erg
odica

Neste momento vamos usar o Teorema 5.1.11 para provar o teorema da decomposicao erg
odica. Seja U uma base enumeravel de abertos de M e seja A a
algebra gerada por U. Note que A e enumeravel e que ela gera a -algebra de

Borel de M . Pelo teorema erg


odico de Birkhoff, para cada A A existe um
conjunto MA M com (MA ) = 1 tal o tempo medio de visita (A, x) est
a bem
definido para todo x MA . Considere M0 = AA MA . Note que (M0 ) = 1,
uma vez que a intersecao e enumeravel.
Agora considere a particao P de M0 definida da seguinte forma: dois pontos
x, y M0 est
ao no mesmo elemento de P se, e somente se, (A, x) = (A, y)
para todo A A. Afirmamos que esta particao e mensuravel. Para mostrar
esse fato, considere uma enumeracao qualquer {Ak : k N} dos elementos da
algebra A e seja {qk : k N} uma enumeracao dos n

umeros racionais. Para


cada n N, considere a particao Pn de M0 definida da seguinte forma: dois
pontos x, y M0 est
ao no mesmo elemento de Pn se, e somente se, para todo
i, j {1, . . . , n},
ou (Ai , x) qj e (Ai , y) qj
ou (Ai , x) > qj e (Ai , y) > qj .

2
claro que cada Pn e uma particao finita (com n
E
ao mais de 2n elementos).
Segue imediatamente da definicao que x e y est
ao no mesmo elemento de
n=1 Pn
se, e somente se, (Ai , x) = (Ai , y) para todo i. Em outras palavras,

P=

n=1

Pn .

Observe tambem que os elementos de P sao conjuntos invariantes por f , ja que


os tempos medios de visita sao constantes ao longo de orbitas.

ERGODICA

5.1. TEOREMA DA DECOMPOSIC


AO

149

Ent
ao, pelo Teorema 5.1.11, existe alguma desintegracao {P : P P} de
relativamente a P. Os itens (a), (b) e (d) do Teorema 5.1.3 est
ao contidos
na definicao de desintegracao. Para provar o item (c) basta mostrar que P e
invariante e erg
odica para
-quase todo P , que e o que faremos a seguir.
Considere a famlia de probabilidades {f P : P P}. Note que
f P (P ) = P (f 1 (P )) = P (P ) = 1
uma vez que todo P P e um conjunto invariante. Alem disso, dado qualquer
conjunto mensuravel E M , a funcao
P 7 f P (E) = P (f 1 (E))
e mensuravel e, usando o fato de que e invariante por f ,
Z
Z
(E) = (f 1 (E)) = P (f 1 (E)) d
(P ) = f P (E) d
(P ).
Isto mostra que {f P : P P} e uma desintegracao de relativamente a P.
Por unicidade (Proposicao 5.1.7), segue que f P = P para quase todo P .
Resta provar que P e erg
odica para quase todo P . Como (M0 ) = 1, temos
que P (M0 P ) = 1 para quase todo P . Logo, basta provar que, dado qualquer
P P e qualquer conjunto mensuravel E M , o tempo medio de visita (E, x)
est
a bem definido para todo x M0 P e e constante nesse conjunto. Fixado
P , denotemos por C a classe dos conjuntos mensuraveis E para os quais valem
estas propriedades. Por construcao, C contem a algebra geradora A. Observe
que se E1 , E2 C com E1 E2 ent
ao E1 \ E2 C:
(E1 \ E2 , x) = (E1 , x) (E2 , x)
est
a definido e e constante em M0 P . Em particular, C e fechada por passagem
ao complementar. Analogamente, C e fechada por unioes enumeraveis disjuntas:
se Ej C sao disjuntos dois-a-dois ent
ao
j Ej , x) =

(Ej , x)

facil deduzir que C e uma classe


est
a definido e e constante em M0 P . E
mon
otona: sejam An , Bn C com An An+1 e Bn Bn+1 para todo n; pelas
duas observacoes anteriores,

n=1

An = A1

(An+1 \ An ) C

n=1

n=1

Bn =

n=1

Bnc

c

C.

Pelo Teorema A.1.18, segue que C contem a -algebra de Borel de M .


Isto conclui a demonstracao do Teorema 5.1.3 a partir do Teorema 5.1.11.

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

150

5.1.5

Exerccios

5.1.1. Mostre que uma particao P e mensuravel se, e somente se, existem
subconjuntos mensuraveis M0 , E1 , E2 , . . . , En , . . . tais que (M0 ) = 1 e, restrito
a M0 ,

_
{En , M \ En }.
P=
n=1

5.1.2. Seja uma probabilidade erg


odica para uma transformacao f e seja
k 2. Como e a decomposicao erg
odica de para o iterado f k ?
5.1.3. Seja M um espaco metrico e seja X um espaco mensuravel. Mostre que
as seguintes condicoes sao equivalentes:

(a) a aplicacao : X M1 (M ), x 7 x e mensuravel;


R
(b) a aplicacao X R, x 7 dx e mensuravel, para toda funcao contnua
limitada : M R;
R
(c) a aplicacao X R, x 7 dx e mensuravel, para toda funcao mensur
avel limitada : M R;

(d) a aplicacao X R, x 7 x (E) e mensuravel, para todo conjunto mensur


avel E M .

5.1.4. Mostre que se {P : P P} e uma desintegracao de ent


ao
Z
Z Z

(P )
d =
dP d
para toda funcao mensuravel limitada : M R.

5.1.5. Seja uma probabilidade invariante para uma transformacao mensuravel


M
a extensao natural de f e seja
f : M M . Seja f : M
o levantamento
de (Secao 2.4.2). Qual e a relacao entre a decomposicao ergodica de e a
decomposicao erg
odica de
?
5.1.6. Quando M e um espaco metrico compacto, podemos obter a decomposicao erg
odica tomando para M0 o conjunto dos pontos x M tais que
x = lim
n

n1
1X
j
n j=0 f (x)

existe na topologia fraca e tomando para P a particao de M0 definida por


P(x) = P(y) x = y . Verifique os detalhes desta demonstracao alternativa
do Teorema 5.1.3 para espacos metricos compactos.
5.1.7. Seja : o deslocamento em = {1, . . . , d}Z . Considere a particao
W s de em conjuntos est
aveis
W s ((an )n ) = {(xn )n : xn = an para todo n 0}.

Dada qualquer probabilidade invariante por , seja {P : P P} uma decomposicao erg


odica de . Mostre que W s P a menos de medida nula.

DE ROKHLIN
5.2. TEOREMA DA DESINTEGRAC
AO

5.2

151

Teorema da desintegrac
ao de Rokhlin

Agora vamos demonstrar o Teorema 5.1.11. Fixe uma sequencia crescente qualquer P1 P2 Pn de particoes enumeraveis tal que P =
n=1 Pn
restrito a algum conjunto M0 M com medida total. Usaremos Pn (x) para
denotar o elemento de Pn que contem um dado ponto x M .

5.2.1

Esperancas condicionais

Seja : M R uma funcao mensuravel limitada qualquer. Para cada n 1,


defina en () : M R da seguinte forma:
Z

d se (Pn (x)) > 0


(Pn (x)) Pn (x)
(5.2.1)
en (, x) =

0
caso contrario.

Como as particoes Pn sao enumeraveis, o segundo caso da definicao se aplica


somente num conjunto de pontos com medida igual a zero. Observe tambem
que en () e constante em cada Pn Pn ; denotamos por En (, Pn ) o valor desta
constante. Ent
ao,
Z
Z
XZ
X
d =
d =
(Pn )En (, Pn ) = en () d
(5.2.2)
Pn

Pn

Pn

para todo n N (as somas envolvem somente os Pn Pn com medida positiva).

Lema 5.2.1. Dada qualquer func


ao mensur
avel limitada : M R, existe
um subconjunto M de M com (M ) = 1 tal que
(a) e(, x) = limn en (, x) existe para todo x M .
(b) e() : M R e mensur
avel e e constante em cada P P.
R
R
(c) d = e() d.

Demonstrac
ao. Inicialmente, suponha que 0. Para cada < , seja S(, )
o conjunto dos pontos x M tais que
lim inf en (, x) < < < lim sup en (, x).
n

claro que a sequencia en (, x) diverge se, e somente se, x S(, ) para


E
algum par de n
umeros racionais < . Em outras palavras, o limite e(, x)
existe se, e somente se, x pertence `a intersecao M de todos os S(, )c com
< racionais. Como se trata de uma intersecao enumeravel, para provar que
(M ) = 1 basta mostrar que (S(, )) = 0 para todo < . Isso e o que
faremos a seguir.
Como e est
ao fixados, podemos escrever S = S(, ). Dado x S, fixe
uma sequencia de inteiros 1 ax1 < bx1 < < axi < bxi < tais que
eaxi (, x) <

ebxi (, x) >

para todo i 1.

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

152

Defina Ai como sendo a uniao dos elementos Ai (x) = Paxi (x) e Bi como sendo a
uni
ao dos elementos Bi (x) = Pbxi (x) obtidos deste modo, para todos os pontos
x S. Por construcao, S Ai+1 Bi Ai para todo i 1. Em particular, S
est
a contido no conjunto

\
\
Ai .
Bi =
Se =
i=1

i=1

Como a sequencia Pn , n 1, e crescente, dados dois quaisquer dos conjuntos


a contido no
Ai (x) = Paxi (x) que formam Ai , ou eles sao disjuntos ou um deles est
outro. Ent
ao os conjuntos Ai (x) maximais sao disjuntos dois-a-dois e, portanto,
constituem uma particao de Ai . Logo, somando apenas sobre estes conjuntos
maximais com medida positiva,
Z
X Z
X
(Ai (x)) = (Ai ),
d
d =
Ai

Ai (x)

Ai (x)

Ai (x)

para qualquer i 1. Analogamente,


Z
X Z
X
(Bi (x)) = (Bi ).
d =
d
Bi

Bi (x)

Bi (x)

Bi (x)

Como Ai Bi e n
os estamos supondo que 0, segue que
Z
Z
d (Bi ),
d
(Ai )
Bi

Ai

e (S).
e
para todo i 1. Tomando o limite quando i , obtemos que (S)
e
Isto implica que (S) = 0 e, portanto, (S) = 0. Isto prova a afirmacao quando
e n
ao-negativa. O caso geral segue imediatamente, uma vez que sempre
podemos escrever = + , onde sao mensuraveis, n
ao-negativas e
limitadas. Note que en () = en ( + ) en ( ) para todo n 1 e, portanto, a
conclusao do lema e verdadeira para se ela vale para + e . Isto conclui a
prova da afirmacao (a).
As demais afirmacoes sao consequencias simples da definicao. A mensurabilidade de e() segue diretamente da Proposicao A.1.31. Dado que Pn e menos
fina que P, e claro que en () e constante em cada P P, restrito a um subconjunto de M com medida total. Logo o mesmo vale para e(). Isto prova (b).
Observe tambem que |en ()| sup || para todo n 1. Logo, podemos usar
o teorema da convergencia dominada para passar ao limite em (5.2.2). Desta
forma obtemos a afirmacao (c).
Aqui estamos especialmente interessados no caso em que e uma funcao
caracterstica: = XA para algum conjunto mensuravel A M . Neste caso a
definicao significa que
e(, x) = lim
n

(Pn (x) A)
.
(Pn (x))

(5.2.3)

DE ROKHLIN
5.2. TEOREMA DA DESINTEGRAC
AO

153

Denotamos por PA o conjunto dos elementos P da particao P que intersectam


M . Observe que
(PA ) = 1. Alem disso, definimos E(A) : PA R colocando
E(A, P ) = e(, x) para qualquer x M P . Observe que e() = E(A) .
Logo, a funcao E(A) e mensuravel e satisfaz:
Z
Z
Z
d = e() d = E(A) d
.
(5.2.4)

5.2.2

Crit
erio de -aditividade

A hip
otese de que o ambiente M e um espaco metrico completo separ
avel intervem na prova por meio do importante criterio de -aditividade que vamos
enunciar e provar a seguir:
Proposi
c
ao 5.2.2. Seja M um espaco metrico completo separ
avel e seja A a
algebra gerada por uma base enumer

avel U = {Uk : k N} de abertos de M .


Seja : A [0, 1] uma func
ao aditiva com () = 0. Ent
ao se estende a
uma medida de probabilidade na -
algebra de Borel de M .
A ideia da prova e a seguinte. Consideraremos o espaco produto = {0, 1}N,
munido da topologia gerada pelos cilindros
[a1 , . . . , as ] = {(ik )kN : i1 = a1 , . . . , is = as },

s 1.

Note que e um compacto (Exerccio A.1.11). Usando o fato de que M e um


espaco metrico completo, mostraremos que a aplicacao

: M , (x) = XUk (x) kN

e um mergulho mensuravel de M em . Alem disso, a funcao d


a origem a
uma funcao aditiva definida na
algebra A gerada pelos cilindros de . Esta
algebra e compacta (Definicao A.1.15), uma vez que todo elemento e compacto.
Logo, se estende a uma medida de probabilidade na -algebra de Borel de ,
que ainda representaremos por . Mostraremos que a imagem (M ) tem medida
total para . Ent
ao a imagem 1 e uma probabilidade na -algebra de Borel
de M . Finalmente, verificaremos que esta probabilidade e uma extensao da
funcao .
Passemos a detalhar estes argumentos. No que segue, dado qualquer conjunto A M , denotaremos A1 = A e A0 = Ac .
Lema 5.2.3. A imagem (M ) e um subconjunto boreliano de .
claro que
Demonstrac
ao. Seja x M e (ik )k = (x). E
Tk
i
(A) j=1 Uj j 6= para todo k N,

pois x pertence `
a intersecao. Alem disso, como U e uma base de abertos de M ,
(B) existe algum k tal que ik = 1 e diam Uk 1 e

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

154

l Uk e
(C) para todo k tal que ik = 1 existe l > k tal que il = 1 e U
diam Ul diam Uk /2.
Reciprocamente, suponha que (ik )k satisfaz as condicoes (A), (B) e (C).
Vamos mostrar que existe x M tal que (x) = (ik )k . Para isso, defina
Fn =

n
\

Vk ,

k=1

l(k) se ik = 1. Ent
onde Vk = Ukc se ik = 0 e Vk = U
ao (Fn )n e uma sequencia
decrescente de conjuntos fechados. A condicao (A) garante que Fn 6= para
todo n 1. As condicoes (B) e (C) implicam que o diametro de Fn converge
para zero. Ent
ao, como M e um espaco completo, a intersecao n Fn contem
algum ponto x. Por construcao, Fn est
a contido em nk=1 Ukik para todo n. Segue
que

\
x
Ukik ou seja (x) = (ik )k .
k=1

Desta forma, mostramos que a imagem de e caracterizada perfeitamente pelas


condicoes (A), (B) e (C).
Para concluir a demonstracao basta mostrar que o subconjunto descrito por
cada uma destas condicoes pode ser construdo a partir dos cilindros por meio
de uni
oes e intersecoes enumeraveis. Dado k N, seja N (k) o conjunto das
k-uplas (a1 , . . . , ak ) em {0, 1} tais que U1a1 Ukak 6= . A condicao (A)
corresponde ao subconjunto

[a1 , . . . , ak ].

k=1 (a1 ,...,ak )N (k)

Seja D = {k N : diam Uk 1}. Ent


ao a condicao (B) corresponde a
[
[
[a1 , . . . , ak1 , 1].
kD (a1 ,...,ak1 )

l Uk e
Finalmente, dado k N, seja L(k) o conjunto dos l > k tais que U
diam Ul diam Uk /2. A condicao (C) corresponde ao subconjunto

k=1 a1 ,...,ak1

[a1 , . . . , ak1 , 0]

lL(k) ak+1 ,...,al1


[a1 , . . . , ak1 , 1, ak+1 , . . . , al1 , 1] .

Isto completa a demonstracao do lema.


Corol
ario 5.2.4. A aplicac
ao : M (M ) e uma bijec
ao mensur
avel com
inversa mensur
avel.

DE ROKHLIN
5.2. TEOREMA DA DESINTEGRAC
AO

155

Demonstrac
ao. Dados quaisquer pontos x 6= y em M , existe algum k N tal
que Uk contem um dos pontos mas n
ao o outro. Isto mostra que e injetiva.
Para todo s 1 e a1 , . . . , as {0, 1},
1 ([a1 , . . . , as ]) = U1a1 Usas .

(5.2.5)

Isto garante que a aplicacao e mensuravel, ja que os cilindros geram a -algebra


de Borel de . Em seguida, observe que
(U1a1 Usas ) = [a1 , . . . , as ] (M ) para todo s, a1 , . . . , as .

(5.2.6)

Usando o Lema 5.2.3, segue que (U1a1 Usas ) e um boreliano de para


todo s, a1 , . . . , as . Isto mostra que a transformacao 1 e mensuravel.
Usando este fato, vamos agora provar que se estende a uma medida de
probabilidade na -algebra de Borel de M . Para isso, consideremos a algebra
A gerada pelos cilindros de . Note que os seus elementos sao as unioes
finitas de cilindros. Em particular, todos os elementos de A sao compactos e,
consequentemente, A e uma
algebra compacta (Definicao A.1.15). Defina
([a1 , . . . , as ]) = (U1a1 Usas ),

(5.2.7)

para cada s 1 e a1 , . . . , as {0, 1}. Ent


ao e uma funcao aditiva no conjunto
dos cilindros, tomando valores em [0, 1]. Ela se estende de modo natural a uma
funcao aditiva na
algebra A , que ainda denotaremos por .
claro que () = 1. Alem disso, como a algebra A e compacta, podemos
E
usar o Teorema A.1.14 para concluir que a funcao : A [0, 1] e -aditiva.
Logo, pelo Teorema A.1.13, se estende a uma medida de probabilidade definida
na -algebra de Borel de . Dada qualquer cobertura C de (M ) por cilindros,
segue da definicao (5.2.7) que
[ 
[


C = (
1 (C) = (M ) = 1.
CC

CC

Tomando o nfimo sobre todas as coberturas, conclumos que ((M )) = 1.


Ent
ao, pelo Corol
ario 5.2.4, a imagem 1 e uma probabilidade boreliana
em M . Por definicao e pela relacao (5.2.6)
1 (U1a1 Usas ) = ((U1a1 Usas )) = ([a1 , . . . , as ] (M ))
= ([a1 , . . . , as ]) = (U1a1 Usas )

para quaisquer s, a1 , . . . , as . Isto implica que 1 e uma extensao da funcao


: A [0, 1]. Portanto, a prova da Proposicao 5.2.2 est
a completa.

5.2.3

Constru
c
ao das medidas condicionais

Seja U = {Uk : k N} uma base de abertos de M e seja A a algebra gerada


claro que A gera a -algebra de Borel de M . Observe tambem que
por U. E

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

156

A e enumer
avel: ela coincide com a uniao das algebras (finitas) geradas pelos
subconjuntos {Uk : 1 k n}, para cada n 1. Defina:
P =

AA

PA

Ent
ao
(P ) = 1, j
a que a intersecao e enumeravel. Para cada P P , defina:
P : A [0, 1],

P (A) = E(A, P ).

(5.2.8)

claro que P e uma funcao aditiva:


Em particular, P (M ) = E(M, P ) = 1. E
a definicao (5.2.3) d
a que
AB =

E(A B, P ) = E(A, P ) + E(B, P ) para todo P P .

Pela Proposicao 5.2.2, segue que esta funcao se estende a uma medida de probabilidade (que ainda denotaremos por P ) definida na -algebra de Borel de M .
Resta verificar que esta famlia de medidas {P : P P } satisfaz as condicoes
na definicao de desintegracao (Definicao 5.1.4).
Comecemos pela condicao (a). Seja P P e, para cada n N, seja Pn
o elemento da particao Pn que contem P . Observe que se A A e tal que
A Pn = para algum n, ent
ao,
P (A) = E(A, P ) = lim
m

(A Pm )
= 0,
(Pm )

j
a que Pm Pn para todo m n. Fixe n. Para cada s 1, seja Pns a uniao de
todos os conjuntos da forma U1a1 Usas que intersectam Pn . Pela observacao
que acabamos de fazer, os cilindros de comprimento s que n
ao est
ao em Pns tem
s
medida nula para P . Portanto, P (Pn ) = 1 para todo s 1. Passando ao
limite quando s , conclumos que P (U ) = 1 para todo conjunto aberto
U que contem Pn . Como a medida P e regular (Proposicao A.3.2), segue que
P (Pn ) = 1. Passando ao limite quando n , obtemos que P (P ) = 1 para
todo P P .
Agora tratamos das duas condicoes (b) e (c). Por construcao (lembre o
Lema 5.2.1), dado qualquer A A, a funcao P 7 P (A) = E(A, P ) e mensur
avel e satisfaz
Z
Z
(A) = E(A, P ) d
(P ) = P (A) d
(P ).
Afirmamos que a famlia dos subconjuntos de M para os quais valem estas duas
propriedades e uma classe mon
otona. De fato, suponha que B e a uniao de uma
sequencia crescente (Bj )j de conjuntos para os quais estas sao propriedades sao
validas. Ent
ao, pela Proposicao A.1.31
P 7 P (B) = sup P (Bj ) e uma funcao mensuravel
j

DE ROKHLIN
5.2. TEOREMA DA DESINTEGRAC
AO

157

e, usando o teorema da convergencia mon


otona,
Z
Z
Z
(B) = lim (Bn ) = lim P (Bn ) d
= lim P (Bn ) d
= P (B) d
.
n

Analogamente, se B e a intersecao de uma sequencia decrescente (Bj )j de conjuntos para os quais as Rpropriedades (b) e (c) sao validas ent
ao P 7 P (B)
e mensuravel e (B) = P (B) d
(P ). Isto implica que as duas propriedades
permanecem validas em toda a classe mon
otona gerada por A, ou seja (Teorema A.1.18), em toda a -algebra de Borel de M .
A prova do Teorema 5.1.11 est
a completa.

5.2.4

Exerccios

5.2.1. Sejam P e Q particoes mensuraveis de (M, B, ) tais que P Q a menos


de medida nula. Seja {P : P P} uma desintegracao de relativamente a
P e, para cada P P, seja {P,Q : Q Q, Q P } uma desintegracao de P
relativamente a Q. Seja : Q P a projecao canonica, tal que Q (Q) para
quase todo Q Q. Mostre que {(Q),Q : Q Q} e uma desintegracao de
relativamente a Q.
5.2.2. (Recproca do teorema de Rokhlin) Seja M um espaco metrico completo
separ
avel. Mostre que se P satisfaz a conclusao do Teorema 5.1.11, isto e, se
admite uma desintegracao relativamente a P, ent
ao a particao P e mensuravel.
5.2.3. Seja P1 Pn uma sequencia crescente de particoes enumeraveis tais que a uni
ao n Pn gera a -algebra B dos conjuntos mensuraveis a
menos de medida nula. Mostre que a esperanca condicional e() = limn en ()
coincide com em quase todo ponto, para toda funcao mensuravel limitada.
5.2.4. Prove a Proposicao 2.4.4, usando a Proposicao 5.2.2.

158

ERGODICA

CAPITULO 5. DECOMPOSIC
AO

Captulo 6

Unicidade Erg
odica
Este captulo e dedicado a uma classe especial de sistemas dinamicos, caracterizados pela propriedade de possuirem exatamente uma probabilidade invariante.
Inicialmente, na Secao 6.1, daremos algumas formulacoes equivalentes desta
propriedade e analisaremos as propriedades da u
nica medida invariante.
A relacao entre unicidade erg
odica e minimalidade e outro tema importante
deste captulo. Um sistema din
amico diz-se minimal se toda orbita e densa no
espaco ambiente. Veremos na Secao 6.2 que todo sistema unicamente erg
odico
e minimal restrito ao suporte da medida invariante, mas a recproca n
ao e verdadeira em geral.
A principal construcao de transformacoes unicamente ergodicos e de natureza algebrica. Na Secao 6.3 introduziremos a nocao de medida de Haar de um
grupo topol
ogico. Veremos que toda translacao transitiva num grupo topologico
compacto metriz
avel e minimal e mesmo unicamente erg
odica: a medida de Haar
e a u
nica probabilidade invariante.
Na Secao 6.4 apresentaremos uma aplicacao notavel da ideia de unicidade
erg
odica no domnio da Aritmetica: o teorema de Hermann Weyl sobre equidistribuicao dos valores de funcoes polinomiais definidas nos n
umeros inteiros.
Ao longo do captulo, a menos de mencao em contrario, suporemos que M
e um espaco metrico compacto e f : M M e uma transformacao contnua.

6.1

Unicidade erg
odica

Dizemos que uma transformacao f : M M e unicamente erg


odica se admite
exatamente uma medida de probabilidade invariante. Vale uma nocao inteiramente analoga para fluxos. A raz
ao de ser da denominacao e que a probabilidade
invariante e necessariamente erg
odica. De fato, suponha que existisse A M
invariante com 0 < (A) < 1. Ent
ao a restricao normalizada de a A, definida
por
(E A)
para cada conjunto mensuravel E A
A (E) =
(A)
159


CAPITULO 6. UNICIDADE ERGODICA

160

seria uma probabilidade invariante, distinta de , o que estaria em contradicao


com a unicidade de .
Proposi
c
ao 6.1.1. As seguintes condic
oes s
ao equivalentes:
(a) f admite uma u
nica probabilidade invariante;
(b) f admite uma u
nica probabilidade erg
odica;
(c) para toda func
ao contnua : M R, a sequencia das medias orbitais
Pn1
n1 j=0
(f j (x)) converge em todo ponto para uma constante.

(d) para toda func


ao contnua : M R, a sequencia das medias orbitais
Pn1
n1 j=0 f j converge uniformemente para uma constante;

f
Demonstrac
ao. E
acil ver que (b) implica (a). De fato, como toda medida
invariante e uma combinacao convexa de medidas erg
odicas (Teorema 5.1.3),
se existe uma u
nica probabilidade erg
odica ent
ao a probabilidade invariante
claro que (d) implica (c), uma vez que convergencia
e, igualmente, u
nica. E
uniforme implica convergencia pontual. Para ver que (c) implica (b), suponha
que e sao probabilidades invariantes erg
odicas de f . Ent
ao, dada qualquer
funcao contnua : M R,
R
n1
d em -quase todo ponto
1X
(f j (x)) =
lim
n n
R
j=0
d em -quase todo ponto.
Como, por hip
otese, o limite n
ao depende do ponto x, segue que
Z
Z
d = d

para toda funcao contnua . Usando a Proposicao A.3.3, obtemos que = .


Resta mostrar que (a) implica (d). Comece por lembrar que f admite alguma
probabilidade invariante (pelo Teorema 2.1). A ideia e mostrar que se (d) n
ao
vale ent
ao existe outra probabilidade diferente de e, portanto, (a) tambem
n
ao vale. Suponha ent
ao que (d) n
ao vale, isto e, que existe alguma funcao
Pn1
contnua : M R tal que n1 j=0
f j n
ao converge uniformemente para
R
nenhuma constante; em particular, n
ao converge uniformemente para d.
Por definicao, isto significa que existe > 0 tal que para todo k 1 existe
nk k e existe xk M tal que
Z
k 1
1 nX


(f j (xk )) d .
nk j=0

Consideremos a sequencia de probabilidades


k =

nk 1
1 X
j
.
nk j=0 f (xk )

(6.1.1)

6.2. MINIMALIDADE

161

Como o espaco M1 (M ) das probabilidades em M e compacto para a topologia fraca (Teorema 2.1.5), a menos de substituir esta sequencia por uma
subsequencia, podemos supor que ela converge para alguma probabilidade em
M . Pelo Lema 2.2.4 aplicado `
a medida de Dirac x , temos que a probabilidade
e invariante por f . Por outro lado, o fato de que (k )k converge para na
topologia fraca implica que
Z
Z
nk 1
1 X
(f j (xk )).
d = lim dk = lim
k
k nk
j=0
Ent
ao, lembrando (6.1.1), temos que
Z
Z


d d .
Em particular, 6= . Isto conclui o argumento.

6.1.1

Exerccios

6.1.1. De exemplo de P
uma transformacao f : M M num espaco metrico
n1
compacto tal que (1/n) j=0 f j converge uniformemente, qualquer que seja
: M R contnua, mas f n
ao e unicamente erg
odica.
Pn1
6.1.2. Prove que se f : M M e transitiva e (1/n) j=0
f j converge
uniformemente, qualquer que seja : M R contnua, ent
ao f e unicamente
erg
odica.
6.1.3. Seja f : M M um homeomorfismo isometrico num espaco metrico
compacto M . Mostre que se e uma medida invariante erg
odica para f ent
ao,
para cada n N, a funcao (x) = d(x, f n (x)) e constante em -quase todo
ponto x M .

6.2

Minimalidade

Seja M um conjunto invariante fechado de f : M M . Dizemos que e


minimal se ele coincide com o fecho da orbita {f n (x) : n 0} de todo ponto
x . Dizemos que a transformacao f e minimal se o ambiente M for um
conjunto minimal.
Lembre que o suporte de uma medida e o conjunto dos pontos x M tais
que (V ) > 0 para toda vizinhanca V de x. Segue imediatamente da definicao
que o complementar do suporte e um conjunto aberto: se x
/ supp ent
ao
existe uma vizinhanca aberta V tal que (V ) = 0; ent
ao V est
a toda contida
no complementar do suporte. Portanto supp e um conjunto fechado.
Tambem e f
acil ver que o suporte de qualquer medida invariante e um
conjunto invariante, no seguinte sentido: f (supp ) supp . De fato, seja
x supp e seja V uma vizinhanca qualquer de y = f (x). Como f e contnua,
f 1 (V ) e uma vizinhanca de x. Ent
ao (f 1 (V )) > 0 uma vez que x supp .
Logo, usando que e invariante, (V ) > 0. Isto prova que y supp .


CAPITULO 6. UNICIDADE ERGODICA

162

Proposi
c
ao 6.2.1. Se f : M M e unicamente erg
odica ent
ao o suporte da
u
nica probabilidade invariante e um conjunto minimal.
Demonstrac
ao. Suponha que existe x supp cuja orbita {f j (x) : j 0} n
ao
e densa no suporte de . Isto significa que existe algum subconjunto aberto U
de M tal que U supp e n
ao vazio e
f j (x)
/ U supp

para todo j 0.

(6.2.1)

Seja um ponto de acumulacao qualquer da sequencia de probabilidades


n = n1

n1
X
j=0

f j (x) ,

n1

relativamente `
a topologia fraca . Tais pontos de acumulacao existem, pelo Teorema 2.1.5, e e uma probabilidade invariante, pelo Lema 2.2.4. A condicao
(6.2.1) significa que n (U ) = 0 para todo n 1. Logo, usando o Teorema 2.1.2
(veja tambem o item 3 do Exerccio 2.1.1) temos que (U ) = 0. Isto implica que
nenhum ponto de U est
a no suporte de , contradizendo o fato de que U supp
e n
ao vazio.
A recproca da Proposicao 6.2.1 e falsa em geral:
Teorema 6.2.2 (Furstenberg). Existe um difeomorfismo analtico f : T2 T2
que e minimal, preserva a medida de Lebesgue m no toro, mas n
ao e erg
odico
para m. Em particular, f n
ao e unicamente erg
odico.
No que resta desta secao daremos um esboco sucinto da demonstracao deste
resultado. A demonstracao detalhada pode ser encontrada no artigo original
de Furstenberg [Fur61] ou no livro de Ma
ne [Ma
n87]. Na Secao 7.3.1 mencionaremos outros exemplos de transformacoes minimais que n
ao sao unicamente
erg
odicas.
Para provar o Teorema 6.2.2, buscaremos uma transformacao f da forma
f (x, y) = (x + , y + (x))
umero irracional e : S 1 R e
R onde e um n
uma funcao analtica com (x) dx = 0. Observe que f preserva a medida de
Lebesgue de T2 . Consideremos tambem a transformacao f0 : T2 T2 dada por
f0 (x, y) = (x + , y). Note que que f0 n
ao possui orbitas densas em T2 e que o
sistema (f0 , m) n
ao e erg
odico.
Consideremos a equac
ao cohomol
ogica
u(x + ) u(x) (x).

(6.2.2)

Se e sao tais que (6.2.2) admite alguma solucao mensuravel u : S 1 R


ent
ao (f0 , m) e (f, m) sao ergodicamente equivalentes (veja o Exerccio 6.2.1) e,
consequentemente, (f, m) n
ao e erg
odico. Por outro lado, pode mostrar-se que
se (6.2.2) n
ao admite solucao contnua ent
ao f e minimal (a recproca deste fato
e o Exerccio 6.2.2). Portanto, basta que encontremos e tais que a equacao
cohomol
ogica admita solucao mensuravel mas n
ao solucao contnua.

163

6.2. MINIMALIDADE

conveniente expressar estas condicoes em termos da expansao de Fourier


E
P
(x) = nZ an e2inx . Para garantir que e analtica e suficiente exigir que:

existe < 1 tal que |an | n para n suficientemente grande.


(6.2.3)
P
De fato, nesse caso a serie nZ an z n converge uniformemente em toda coroa
circular {z C : r |z| r1 } com r > . Em particular, a sua soma no crculo
unit
ario (a qual coincide com ) e uma funcao analtica. Como queremos que
tenha media nula e tome valores na reta real, tambem devemos exigir:
a0 = 0

an = a
n para todo n 1.

(6.2.4)

De acordo com o Exerccio 6.2.3, a equacao cohomol


ogica admite uma solucao no espaco L2 (m) se, e somente se,

X

n=1

an
e2ni 1

2

< .

Alem disso, essa solucao est


a unicamente determinada: u =
bn =

an
e2in 1

para todo n Z.

(6.2.5)
P

nZ bn e

2inx

com

(6.2.6)

O teorema de Fejers (veja [Zyg68]) afirma que se uma funcao u e contnua


ent
ao a sequencia das somas parciais da sua expansao de Fourier converge Ces`aro
uniformemente para u:
n
k

1 X X
bj e2ijx converge uniformemente para u(x).
n
k=1

(6.2.7)

j=k

Logo, para garantir que u n


ao e contnua e suficiente exigir:
k
 X

j=k

bj

n
ao e Ces`aro convergente.

(6.2.8)

Desta forma, o problema fica reduzido a encontrar e (an )n satisfazendo


(6.2.3), (6.2.4), (6.2.5) e (6.2.8). O Exerccio 6.2.4 d
a uma ideia das quest
oes
envolvidas na escolha destes objetos.

6.2.1

Exerccios

6.2.1. Mostre que se u e solucao mensuravel da equacao cohomol


ogica (6.2.2)
ent
ao h : T2 T2 , h(x, y) = (x, y + u(x)) e uma equivalencia erg
odica entre
(f0 , m) e (f, m). Em particular, (f, m) n
ao pode ser erg
odico.
6.2.2. Mostre que se u e solucao contnua da equacao cohomol
ogica (6.2.2)
ent
ao h : T2 T2 , h(x, y) = (x, y + u(x)) e uma conjugacao topologica entre
f0 e f . Em particular, f n
ao pode ser transitivo.


CAPITULO 6. UNICIDADE ERGODICA

164
6.2.3. Verifique que se u(x) =
bn =

nZ bn e

an
e2in 1

Alem disso, u L2 (m) se, e somente se,

2inx

e solucao de (6.2.2) ent


ao

para todo n Z.
P

n=1

(6.2.9)

|bn |2 < .

6.2.4. Dizemos que um n


umero irracional e diofantino se existem c > 0 e
> 0 tais que |q p| c|q| para quaisquer p, q Z com q 6= 0. Mostre que
a condicao (6.2.5) e satisfeita sempre que e diofantino e satisfaz (6.2.3).
6.2.5. (Teorema de Gottschalk) Seja f : M M uma aplicacao contnua em
um espaco metrico compacto M . Mostre que o fecho da orbita de um ponto
x M e um conjunto minimal se, e somente se, R = {n Z : d(x, f n (x)) < }
e um conjunto sindetico para todo > 0.
6.2.6. Seja f : M M uma aplicacao contnua em um espaco metrico compacto M . Dizemos que x, y M est
ao pr
oximos se inf n d(f n (x), f n (y)) = 0.
Mostre que para todo x M tal que o fecho da sua orbita e um conjunto
minimal, toda vizinhanca U de x e todo ponto y proximo de x, existe uma
sequencia crescente (ni )i tal que f ni1 ++nik (x) e f ni1 ++nik (y) est
ao em U
para quaisquer i1 < < ik e k 1.
6.2.7. Um teorema de Auslander e Ellis (veja [Fur81, Teorema 8.7]) afirma que
nas condicoes do Exerccio 6.2.6 o fecho da orbita de todo y M contem algum
ponto x que est
a proximo de y e cujo fecho da orbita e um conjunto minimal.
Deduza o seguinte refinamento do teorema de van der Waerden (Teorema de
Hindman): dada qualquer decomposicao N = S1 Sq do conjunto dos
n
umeros naturais em conjuntos disjuntos dois-a-dois, existe j tal que Sj contem
uma sequencia n1 < < ni < tal que ni1 + + nik Sj para todo k 1
e quaisquer i1 < < ik .

6.3

Medida de Haar

Nesta secao veremos que grupos topologicos ou diferenci


aveis compactos possuem uma probabilidade notavel, chamada medida de Haar, que e invariante
pelas translacoes e pelos endomorfismos sobrejetivos do grupo. Supondo que
o grupo e metriz
avel, toda translacao transitiva e unicamente erg
odica, com a
medida de Haar como u
nica probabilidade invariante.

6.3.1

Rotac
oes em toros

Fixe d 1 e um vetor racionalmente independente = (1 , . . . , d ). Conforme


vimos na Secao 4.2.1, a rotacao R : Td Td e erg
odica para a medida de
Lebesgue m no toro. Agora o nosso objetivo e mostrar que, na verdade, R e
unicamente erg
odica.

165

6.3. MEDIDA DE HAAR

De acordo com a Proposicao 6.1.1, basta mostrar que para toda funcao
contnua : Td R existe c R tal que
n =

n1
1X
Rj converge para c em todo ponto.
n j=0

(6.3.1)

R
Tomemos c = d. Por ergodicidade, a sequencia (n )n das medias orbitais
converge para c em m-quase todo ponto. Em particular, n (x) c para um
conjunto denso de valores de x Td .
Seja d a distancia induzida no toro Td = Rd /Zd pela norma usual em Rd : a
distancia entre dois pontos quaisquer do toro e o mnimo das distancias entre
claro que a rotacao R preserva esta distancia:
os seus representantes em Rd . E
d(R (x), R (y)) = d(x, y)

para todo x, y Td .

Ent
ao, usando que e contnua, dado qualquer > 0 podemos encontrar > 0
tal que
d(x, y) <

d(Rj (x), Rj (y)) <

|(Rj (x)) (Rj (y))| <

para todo j 0. Mas ent


ao,
d(x, y) <

|n (x) n (y)| < para todo n 1.

Como n
ao depende de n, isto mostra que a sequencia (n )n e equicontnua.
Isto nos permite usar o Teorema de Ascoli para provar a afirmacao (6.3.1), do
seguinte modo. Suponha que existe x
Td tal que (n (
x))n n
ao converge para
c . Ent
ao existe c 6= c e alguma subsequencia (nk )k tal que nk (
x) converge
para c quando k . Pelo teorema de Ascoli, a menos de tomarmos uma
subsequencia, podemos supor que (nk )k e uniformemente convergente. Seja
o seu limite. Ent
ao e uma funcao contnua tal que (x) = c para um
claro
conjunto denso de valores de x Td mas (
x) = c e diferente de c . E
que tal funcao n
ao existe. Esta contradicao prova a nossa afirmacao de que R
e unicamente erg
odica.

6.3.2

Grupos topol
ogicos e grupos de Lie

Lembre que um grupo topol


ogico e um grupo (G, ) munido de uma topologia
relativamente `
a qual as operacoes
G G G, (g, h) 7 gh

G G, g 7 g 1

(6.3.2)

sao contnuas. Em tudo o que segue suporemos que a topologia e tal que todo
conjunto pontual e um conjunto fechado. Quando G e uma variedade e as
operacoes em (6.3.2) sao diferenci
aveis, dizemos que (G, ) e um grupo de Lie.
Veja o Exerccio 6.3.1.
O espaco euclideano Rd e um grupo topologico, e ate um grupo de Lie, para
a adicao e o mesmo vale para o toro Td . Lembre que Td e o quociente de Rd pelo
seu subgrupo Zd . Esta construcao pode ser generalizada da seguinte forma:

166

CAPITULO 6. UNICIDADE ERGODICA

Exemplo 6.3.1. Dado qualquer subgrupo normal fechado H de um grupo topol


ogico G, seja G/H o conjunto das classes de equivalencia para a relacao de
equivalencia definida em G por x y x1 y H. Represente por xH a
classe de equivalencia que contem cada x G. Considere a seguinte operacao
de grupo em G/H:
xH yH = (x y)H.
A hip
otese de que H e subgrupo normal assegura que esta operacao est
a bem
definida. Seja : G 7 G/H a projecao canonica, dada por (x) = xH.
Considere em G/H a topologia quociente, definida da seguinte forma: uma
funcao : G/H X e contnua se, e somente se, : G X e contnua.
A hip
otese de que H e fechada assegura que todo subconjunto pontual e um
subconjunto fechado de G/H. Segue facilmente das definicoes que G/H e um
grupo topol
ogico. Lembre tambem que se G e abeliano ent
ao todos os seus
subgrupos sao normais.
Exemplo 6.3.2. O conjunto G = GL(d, R) das matrizes reais invertveis de
dimensao d e um grupo de Lie para a operacao de multiplicacao de matrizes,
chamado grupo linear real de dimensao d. De fato, G pode ser identificado com
2
um aberto do espaco euclideano R(d ) e portanto tem uma estrutura natural
de variedade. Alem disso, segue diretamente das definicoes que a multiplicacao
de matrizes e a aplicacao A 7 A1 sao diferenci
aveis para esta estrutura diferenci
avel. G contem diversos subgrupos de Lie importantes, tais como o grupo
especial linear SL(d, R) das matrizes com determinante igual a 1, e o grupo
ortogonal O(d, R) formado pelas matrizes ortogonais.
Dado qualquer g G, chamamos g-translac
ao `
a esquerda e g-translac
ao `
a
direita, respectivamente, as aplicacoes
Eg : G G, Eg (h) = gh

Dg : G G, Dg (h) = hg.

Um endomorfismo de G e uma aplicacao contnua : G G que tambem


preserva a operacao de grupo, isto e, tal que (gh) = (g)(h). Quando
e invertvel, ou seja, uma bijecao cuja inversa tambem e um endomorfismo,
dizemos que se trata de um automorfismo.
Exemplo 6.3.3. Seja A GL(d, Z), isto e, uma matriz invertvel de dimensao
d com coeficientes inteiros. Ent
ao, como vimos na Secao 4.2.5, A induz um
endomorfismo fA : Td Td . Pode mostrar-se que todo endomorfismo do toro
e desta forma.
Um grupo topol
ogico e localmente compacto se todo g G possui alguma
vizinhanca compacta. Por exemplo, todo grupo de Lie e localmente compacto.
Por outro lado, o grupo aditivo dos racionais, considerado com a topologia
induzida pela reta, n
ao e localmente compacto.
O seguinte teorema e o ponto de partida da teoria erg
odica dos grupos topol
ogicos localmente compactos:
Teorema 6.3.4 (Haar). Seja G um grupo localmente compacto.

167

6.3. MEDIDA DE HAAR

(a) Existe uma medida boreliana G em G que e invariante pelas translac


oes `
a
esquerda, finita em conjuntos compactos e positiva em conjuntos abertos;
(b) Se e uma medida invariante pelas translac
oes `
a esquerda e finita em
conjuntos compactos ent
ao = cG para algum c > 0.
(c) G (G) < se, e somente se, G e compacto.
Vamos esbocar a demonstracao dos itens (a) e (b) no caso particular em que
G e um grupo de Lie. Neste caso, como veremos G e uma medida de volume
em G. A demonstracao do item (c), no caso geral, e proposta no Exerccio 6.3.4.
Comecando pelo item (a), seja e o elemento neutro e seja d 1 a dimensao
do grupo de Lie. Considere um produto interno qualquer no espaco tangente
Te G. Para cada g G, representemos por Eg : Te G Tg G a derivada da
translacao `
a esquerda Eg no ponto e. Em seguida, consideremos o produto
interno definido em Tg G do seguinte modo:
u v = Eg1 (u) Eg1 (v)

para todo u, v Tg G.

claro que este produto interno depende diferenciavelmente de g. Portanto, ele


E
define uma metrica riemanniana em G. Tambem e claro da construcao que esta
metrica e invariante por translacoes `a esquerda: notando que Ehg = DEh (g)Eg ,
vemos que
1
1
DEh (g)(u) DEh (g)(v) = Ehg
DEh (g)(u) Ehg
DEh (g)(v)

= Eg1 (u) Eg1 (v) = u v

para quaisquer g, h G e u, v Tg G. Seja G a medida de volume associada


a esta metrica riemanniana. Esta medida pode ser caracterizada do seguinte
modo. Dadas coordenadas locais x = (x1 , . . . , xd ) em G, considere

g1,1 (x) g1,d (x)

onde gi,j =

.
(x) = det
xi xj
gd,1 (x) gd,d (x)
R
Ent
ao G (B) = B |(x)| dx1 dxd , para qualquer conjunto mensuravel B
contido no domnio das coordenadas locais. Notando que a funcao e contnua
e n
ao nula, para toda carta local, segue que G e positiva em abertos e finita em
compactos. Alem disso, como a metrica riemanniana e invariante por translacoes
`a esquerda, a medida G tambem e invariante por translacoes `a esquerda.
Agora passamos ao item (b) do Teorema 6.3.4. Seja qualquer medida nas
condicoes do enunciado. Representamos por B(g, r) a bola aberta de centro g e
raio r, para a distancia associada `a metrica riemanniana. Em outras palavras,
B(g, r) e o conjunto dos pontos em G que podem ser ligados a g por alguma
curva de comprimento menor que r. Fixe > 0 tal que (B(e, )) e finita (tal
existe porque G e localmente compacto e e finita em compactos). Afirmamos
que
(B(e, ))
(B(g, r))

(6.3.3)
lim sup
G (B(e, ))
r0 G (B(g, r))


CAPITULO 6. UNICIDADE ERGODICA

168

para todo g G. Isto pode ser visto da seguinte forma. Observe que o lado
esquerdo da desigualdade n
ao depende de g, uma vez que tanto as duas medidas
quanto a distancia sao invariantes por translacoes `a esquerda. Portanto, basta
considerar o caso g = e. Seja (rn )n qualquer sequencia convergindo para zero e
tal que:
(B(e, r))
(B(e, rn ))
= lim sup
.
(6.3.4)
lim
n G (B(e, rn ))
r0 G (B(e, r))
Pelo lema de Vitali (Teorema A.2.16), podemos encontrar (gj )j em B(e, ) e
(nj )j em N tais que
ao contidas em B(e, ) e sao disjuntas dois-a-dois;
1. as bolas B(gj , rnj ) est
2. a uni
ao dessas bolas tem G -medida total em B(e, ).
Alem disso, dado qualquer a R menor que o limite em (6.3.4), podemos supor
que os nj sao suficientemente grandes para que (B(gj , rnj )) aG (B(gj , rnj ))
para todo j. Segue que
X
X
aG (B(gj , rnj )) = aG (B(e, )).
(B(gj , rnj ))
(B(e, ))
j

Como a pode ser tomado arbitrariamente proximo de (6.3.4), isto prova a


afirmacao (6.3.3).
Em seguida, afirmamos que e absolutamente contnua com relacao a G .
De fato, seja b qualquer n
umero maior que o quociente no lado direito de (6.3.3).
Dado qualquer conjunto mensuravel B G com G (B) = 0, e dado qualquer
> 0, seja {B(gj , rj ) : j} uma cobertura
de B por bolas de raio pequeno, tal
P
ao,
que (B(gj , rj )) b(B(gj , rj )) e j G (B(gj , rj )) . Ent
(B)

X
j

(B(gj , rj )) b

X
j

(B(gj , rj )) b.

Como > 0 e arbitrario, segue que (B) = 0. Portanto, G , conforme foi


afirmado. Agora, pelo teorema de derivacao de Lebesgue (Teorema A.2.15)
Z
d
1
(B(g, r))
d
(g) = lim
dG = lim
r0 (B(g, r)) B(g,r) G
r0 (B(g, r))
G
para -quase todo g G. O limite no lado esquerdo n
ao depende de g e, pela
afirmacao (6.3.3), ele e finito. Seja c R esse limite. Ent
ao = cG , conforme
afirmado no item (b) do Teorema 6.3.4.
No caso em que o grupo G e compacto, segue do Teorema 6.3.4 que existe
uma u
nica probabilidade que e invariante pelas translacoes `a esquerda, positiva
em abertos e finita em compactos. Esta probabilidade G e chamada medida de
Haar. Ela disfruta de algumas propriedades adicionais: Por exemplo, a medida
de Lebesgue normalizada e a medida de Haar no toro Td . Veja tambem os
Exerccios 6.3.5 e 6.3.6.

169

6.3. MEDIDA DE HAAR

Corol
ario 6.3.5. Suponha que G e compacto. Ent
ao a medida de Haar G e
invariante pelas translac
oes `
a direita e por todo endomorfismo sobrejetivo de G.
Demonstrac
ao. Dado qualquer g G, considere a probabilidade (Dg ) G . Observe que Eh Dg = Dg Eh para todo h G. Logo,
(Eh ) (Dg ) G = (Dg ) (Eh ) G = (Dg ) G .
Em outras palavras, (Dg ) G e invariante por toda a translacao `a esquerda.
Por unicidade, segue que (Dg ) G = G para todo g G, tal como afirmado.
Dado qualquer homomorfismo sobrejetivo : G G, considere a probabilidade G . Dado qualquer h G, escolha algum g 1 (h). Observe que
Eh = Eg . Logo,
(Eh ) G = (Eg ) G = G .
Em outras palavras, G e invariante por toda a translacao `a esquerda. Por
unicidade, segue que G = G , tal como afirmado.
Mais geralmente, se n
ao suposermos, que G e compacto, o argumento do
Corol
ario 6.3.5 mostra que para cada g G existe (g) > 0 tal que
(Eg ) G = (g)G .
A aplicacao G (0, ), g 7 (g) e um homomorfismo de grupo.

6.3.3

Translac
oes em grupos compactos metriz
aveis

Nesta secao sempre suporemos que o grupo topologico e compacto e metriz


avel.
Comecamos por observar que e sempre possvel escolher a distancia de tal forma
que ela seja invariante por toda translacao:
Lema 6.3.6. Se G e um grupo topol
ogico compacto metriz
avel ent
ao existe
alguma dist
ancia compatvel com a topologia de G relativamente `
a qual todas as
translac
oes, tanto `
a esquerda quanto `
a direita, s
ao isometrias.
Demonstrac
ao. Seja (Un )n uma base de vizinhancas do elemento neutro 1 de
G. Pelo Lema A.3.4, para cada n existe uma funcao contnua n : G [0, 1]
tal que n (1) = 0 e (z) = 1 para todo z G \ Un . Defina
: G [0, 1],

(z) =

2n n (z).

n=1

Ent
ao, e contnua e (1) = 0 < (z) para todo z 6= 1. Agora defina
d(x, y) = sup{|(gxh) (gyh)| : g, h G}
facil ver que d
para cada x, y G. O supremo e finito, por compacidade de G. E
e uma distancia em G. De fato, note que se d(x, y) = 0 ent
ao (gxh) = (gyh)


CAPITULO 6. UNICIDADE ERGODICA

170

para todo g, h G. Em particular, tomando g = 1 e h = y 1 , vem que


(xy 1 ) = (1). Pela construcao de , isto implica que x = y. Os demais axiomas da nocao de distancia seguem diretamente da definicao de d. Finalmente,
tambem e claro da definicao que d e invariante por translacoes `a esquerda e `a
direita.
Exemplo 6.3.7. Dada uma matriz A GL(d, R), represente por kAk a sua
norma como operador, ou seja, kAk = sup{kAvk : kvk = 1}. Observe que
kOAk = kAk = kAOk
para todo O no grupo ortogonal O(d, R). Defina
d(A, B) = log(1 + kA1 B id k + kB 1 A id k).
Ent
ao d e uma distancia em GL(d, R), invariante por translacoes `a esquerda:
d(CA, CB) = log(1 + kA1 C 1 CB id k + kB 1 C 1 CA id k) = d(A, B)
para todo C GL(d, R). Esta distancia n
ao e invariante `a direita em GL(d, R)
(Exercicio 6.3.3). No entanto, ela e invariante `a direita (e `a esquerda) se restringirmos ao grupo ortogonal O(d, R):
d(AO, CO) = log(1 + kO1 A1 BO id k + kO1 B 1 AO id k)

= log(1 + kO1 (A1 B id )Ok + kO1 (B 1 A id )Ok)

= d(A, B)
para todo O O(d, R).

Teorema 6.3.8. Seja G um grupo topol


ogico compacto metriz
avel e seja g G.
Ent
ao s
ao equivalentes:
(a) Eg e unicamente erg
odica;
(b) Eg e erg
odica com respeito a G ;
(c) o subgrupo {g n : n Z} gerado por g e denso em G;
claro que (a) implica (b). Para provar que (b) implica (c),
Demonstrac
ao. E
considere a distancia invariante d dada pelo Lema 6.3.6. Seja H o fecho do
{g n : n Z} e e considere a funcao contnua
(x) = min{d(x, y); y H}.
Observe que esta funcao e invariante para Eg : usando que gH = H, obtemos:
(x) = min{d(x, y) : y H} = min{d(gx, gy) : y H}
= min{d(gx, z) : z H} = (gx) para todo x G.

171

6.3. MEDIDA DE HAAR

Como H e fechado, (x) = 0 se, e somente se, x H. Se H 6= G ent


ao
G (H 6= G) > 0, j
a que a medida de Haar e positiva em abertos. Nesse caso,
a funcao n
ao e constante em G -quase todo ponto e, portanto, Eg n
ao pode
ser erg
odica para G .
Finalmente, para mostrar que (c) implica (a), vamos mostrar que se e uma
probabilidade invariante por Eg , ent
ao = G . Para ver isso, basta verificar
que e invariante para toda translacao `a esquerda em G. Fixe h G. Pela
invariancia de , temos
Z
Z
(x) d(x) = (g n x) d(x)

para todo n N e toda funcao contnua : G R. Por outro lado, a hipotese


garante que existe uma sequencia de n
umeros naturais nj tal que g nj h.
Dada qualquer funcao contnua (logo, uniformemente contnua) : G R e
dado > 0, fixe > 0 tal que |(x) (y)| < semrpe que d(x, y) < . Se j e
suficientemente grande,
d(g nj x, hx) = d(g nj , h) <

para todo x G.

Logo, |(g nj x) (hx)| < para todo x e, portanto,


Z
Z


(g nj x) (hx) d| < .
(x) (hx) d| = |
|

R
R
Como e arbitrario, segue que d = Eh d para toda funcao contnua
e todo h G. Isto implica que e invariante por Eh para todo h G,
conforme afirmado.

6.3.4

Od
ometros

Os od
ometros, ou maquinas de somar, modelam sistemas tais como o contador
de quil
ometros percorridos de um autom
ovel. ou o registro de consumo de
eletricidade de um predio: a sua dinamica consiste em fazer avancar o contador
de uma unidade. A principal diferenca com relacao `a realidade e que estes
contadores idealizados comportam um n
umero ilimitado de dgitos.
Fixe d 2, que representa a base de numeracao (por exemplo, d = 10). Seja
X = {0, 1, . . . , d 1}, munido com a topologia discreta. Considere o conjunto
M = X N de todas as seq
uencias = (n )n com valores em X, munido com a
topologia produto. Esta topologia e metriz
avel: ela e compatvel, por exemplo,
com distancia definida em M por

d(, ) = 2N (, )

onde N (, ) = min{j 0 : j 6= j }

(6.3.5)

Observe tambem que M e compacto, pois e um produto de compactos (teorema


de Tychonoff).
Introduzimos em M a seguinte operacao de soma com transporte: dados
= (n )n e = (n )n em M , definimos + = (n )n da seguinte forma.
Primeiramente,


CAPITULO 6. UNICIDADE ERGODICA

172

se 0 + 0 < d ent
ao 0 = 0 + 0 e 1 = 0;
se 0 + 0 d ent
ao 0 = 0 + 0 d e 1 = 1.
Em seguida, para cada n 1,
se n + n + n < d ent
ao n = n + n + n e n+1 = 0;
se n + n + n d ent
ao n = n + n + n d e n+1 = 1.
A sequencia auxiliar (n )n corresponde, precisamente, aos transportes. A aplicacao + : M M M definida deste modo torna M um grupo topologico
abeliano e a distancia (6.3.5) e invariante por translacoes (Exerccio 6.3.8).
Agora considere a translacao de 1 f : M M definida por

f (n )n = (n )n + (1, 0, . . . , 0, . . . ) = (0, . . . , 0, k + 1, k+1 , . . . , n , . . . )

onde k 0 e o menor valor de n tal que n < d 1; se n


ao existe tal k, ou
seja, se (n )n e a sequencia constante igual a d 1, ent
ao a imagem f ((n )n )
e a sequencia constante igual a 0. Deixamos ao cuidado do leitor verificar que
esta transformacao f : M M e unicamente erg
odica (Exerccio 6.3.9).
possvel generalizar esta construcao um pouco mais, da seguinte forma.
E
Q
Tome M = n=0 {0, 1, . . . , dn 1}, onde (dn )n e uma sequencia qualquer de
n
umeros inteiros maiores que 1. Tal como no caso particular acima, este conjunto tem uma estrutura de grupo compacto abeliano metriz
avel e a translacao
de 1 e unicamente erg
odica.
Exemplo 6.3.9. Uma pilha (simples) num intervalo 1 I e uma famlia ordenada
S de subintervalos I0 , . . . , Ik1 , com o mesmo comprimento, disjuntos dois-adois e cuja uni
ao e I. Escrevemos Ik = I0 . Associamos a S a transformacao f :
I I cuja restricao a cada Ij e a translacao que envia Ij em Ij+1 . Graficamente,
representamos os subintervalos empilhados uns sobre os outros, com a base
I0 em baixo e o topo Ik1 em cima. Ent
ao f n
ao e mais que a translacao para
cima, exceto no topo da pilha. Veja a Figura 6.1.
Consideremos uma sequencia (Sn )n de pilhas num mesmo intervalo I, construda da seguinte forma. Fixe um inteiro d 2. Tome S0 = {I}. Para cada
n 1, tome para Sn a pilha obtida dividindo Sn1 em d colunas, todas com a
mesma largura, e empilhando essas colunas umas sobre as outras. Este procedimento est
a descrito na Figura 6.1 para d = 3. Seja fn : I I a transformacao
associada a cada Sn . Propomos ao leitor mostrar (Exerccio 6.3.10) que a
sequencia (fn )n converge em todo ponto para uma transformacao f : I I, a
qual preserva a medida de Lebesgue. Alem disso, f e unicamente erg
odica.
Esta e apenas uma aplicacao simples do chamado metodo de empilhamento,
que constitui uma ferramenta muito eficaz para produzir exemplos com propriedades interessantes. O leitor pode encontrar uma discuss
ao detalhada deste
metodo na Secao 6 do livro de Friedman [Fri69]. Outra aplicacao, um pouco
mais elaborada, sera dada no Exemplo 8.2.3.
1 Aqui

consideramos todos os intervalos fechados `


a esquerda e abertos `
a direita.

173

6.3. MEDIDA DE HAAR

Ik1
.
.
.

.
.
.

.
.
.

.
.
.

I0

Figura 6.1: Exemplo do metodo de empilhamento

Exemplo 6.3.10 (Substituicoes). Vamos mencionar brevemente uma construcao de natureza combinatoria que generaliza a definicao do od
ometro, proporcionando muitos outros exemplos interessantes de sistemas minimais e unicamente erg
odicos. Para maior informacao, inclusive sobre as relacoes entres estes
sistemas e o od
ometro, recomendamos ao leitor o livro de Queffelec [Que87] e o
artigo de Ferenczi, Fisher, Talet [FFT09].
Chamaremos substituic
ao em um alfabeto finito A a qualquer aplicacao que
associa a cada letra do alfabeto uma palavra s() formada por um n
umero
finito de letras de A. Alguns exemplos, no caso A = {0, 1}: substituic
ao de
Thue-Morse s(0) = 01 e s(1) = 10; substituic
ao de Fibonacci s(0) = 01 e
s(1) = 0; substituic
ao de Feigenbaum s(0) = 11 e s(1) = 10; substituic
ao de
Cantor s(0) = 010 e s(1) = 111; e substituic
ao de Chacon s(0) = 0010 e
s(1) = 1. Podemos iterar uma substituicao, definindo s1 () = s() e
sk+1 () = s(1 ) s(n ) se

sk () = 1 n .

Diremos que a substituicao s e primitiva (ou aperi


odica) se existe k 1 tal que
para quaisquer , A a palavra sk () contem a letra .
Considere A munido da topologia discreta e seja = AN o espaco das
sequencias em A, munido da topologia produto. Representemos por S :
a aplicacao induzida nesse espaco por uma dada substituicao s: a imagem de
cada (a0 , . . . , an , . . . ) e a sequencia das letras da palavra obtida quando
concatenamos as palavras finitas s(an ). Suponha que existe alguma letra 0 A
tal que a palavra s(0 ) tem comprimento maior que um e comeca com a letra
0 . Esse e o caso de todos os exemplos listados acima. Ent
ao (Exerccio 6.3.11),
S admite um u
nico ponto fixo x = (xn )n com x0 = 0 .
Considere a restricao : X X do deslocamento : ao fecho
X da
orbita { n (x) : n 0} do ponto x. Se a substituicao s e primitiva
ent
ao : X X e minimal e unicamente erg
odico (veja a Secao 5 em [Que87]).
Isso vale, por exemplo, no caso das sequencias de Thue-Morse, Fibonacci e
Feigenbaum.


CAPITULO 6. UNICIDADE ERGODICA

174

6.3.5

Exerccios

6.3.1. Seja G uma variedade e seja uma operacao de grupo em G tal que
(g, h) 7 g h e de classe C 1 . Mostre que g 7 g 1 tambem e de classe C 1 .
6.3.2. Seja G um espaco topologico compacto e seja uma operacao de grupo
em G tal que a aplicacao (g, h) 7 g h e contnua. Mostre que g 7 g 1 tambem
e contnua.
6.3.3. Mostre que a distancia d no Exemplo 6.3.7 n
ao e invariante `a direita.
6.3.4. Prove o item (c) do Teorema 6.3.4: um grupo localmente compacto G e
compacto se, e somente se, a sua medida de Haar e finita.
6.3.5. Identifique GL(1, R) com o grupo multiplicativo R \ {0}. Verifique que
a medida definida por
Z
Z
(x)
dx
d =
R\{0} |x|
GL(1,R)
e invariante pelas translacoes de GL(1, R). Encontre uma medida invariante
pelas translacoes de GL(1, C).
6.3.6. Identifique GL(2, R) com {(a11 , a12 , a21 , a22 ) R4 : a11 a22 a12 a21 6= 0},
de tal modo que det(a11 , a12 , a21 , a22 ) = a11 a22 a12 a21 . Mostre que a medida
definida por
Z
Z
(x11 , x12 , x21 , x22 )
dx11 dx12 dx21 dx22
d =
| det(x11 , x12 , x21 , x22 )|2
GL(2,R)
e invariante pelas translacoes `a esquerda e `a direita de GL(2, R). Encontre uma
medida invariante pelas translacoes de GL(2, C).
6.3.7. Seja G um grupo compacto metriz
avel e seja g G. Verifique que sao
equivalentes:
(1) Eg e unicamente erg
odica;
(2) Eg e transitiva: existe x G tal que {g n x : n Z} e densa em G;
(3) Eg e minimal: {g n y : n Z} e densa em G para todo y G.
6.3.8. Mostre que a operacao + : M M M definida na Secao 6.3.4 e
contnua e mune M com uma estrutura de grupo abeliano. Alem disso, toda
translacao neste grupo preserva a distancia definida em (6.3.5).
6.3.9. Seja f : M M um od
ometro, tal como foi definido na Secao 6.3.4.
Dados b0 , . . . , bk1 em {0, . . . , 9}, represente por [b0 , . . . , bk1 ] o conjunto das
sequencias M com 0 = b0 , . . . , k1 = bk1 . Mostre que
lim
n


1 
1
# 0 j < n : f j (x) [b0 , . . . , bk1 ] = k
n
10

para todo x M . Alem disso, este limite e uniforme. Conclua que f admite
uma u
nica probabilidade invariante e calcule essa probabilidade explicitamente.

175

6.4. TEOREMA DE WEYL


6.3.10. Verifique as afirmacoes no Exemplo 6.3.9.

6.3.11. Prove que se s e uma substituicao num alfabeto finito A e A e


tal que s() tem comprimento maior que um e comeca com a letra , ent
ao a
transformacao S : definida no Exemplo 6.3.10 admite um u
nico ponto
fixo que comeca com a letra A.

6.4

Teorema de Weyl

Nesta secao vamos utilizar ideias discutidas anteriormente para provar um belo
teorema de Hermann Weyl [Wey16] sobre a distribuicao dos valores de funcoes
polinomiais restritas aos n
umeros inteiros.
Considere qualquer funcao polinomial P : R R com coeficientes reais e
grau d 1:
P (x) = a0 + a1 x + a2 x2 + + ad xd .

Compondo P com a projecao can


onica R S 1 , obtemos uma funcao polinomial
1
P : R S com valores no crculo S 1 = R/Z. Defina:
zn = P (n),

para cada n 1.

Podemos pensar em zn como sendo a parte fracionaria do n


umero real P (n).
Estamos interessados em entender como a sequencia (zn )n se distribui no crculo.
Defini
c
ao 6.4.1. Dizemos que uma sequencia (xn )n em S 1 e equidistribuda se
para qualquer funcao contnua : S 1 R tem-se
Z
n
1X
(xj ) = (x) dx.
lim
n n
j=1
De acordo com o Exerccio 6.4.1, isto equivale a dizer que, para todo segmento I S 1 , a fracao dos termos da sequencia que est
ao em I e igual ao
comprimento m(I) do segmento.
Teorema 6.4.2 (Weyl). Se algum dos coeficientes a1 , a2 , . . . , ad e irracional
ent
ao a sequencia zn = P (n), n N e equidistribuda.
Para desenvolvermos a nossa intuicao sobre este teorema, comecemos por
considerar o caso especial d = 1. Neste caso a funcao polinomial resume-se a
P (x) = a0 + a1 x. Consideremos a transformacao
f : S1 S1,

f () = + a1 .

Por hip
otese, o coeficiente a1 e irracional. Portanto, como vimos na Secao 6.3.1,
esta transformacao admite uma u
nica probabilidade invariante, que e a medida
de Lebesgue m. Consequentemente, dada qualquer funcao contnua : S 1 R
e dado qualquer ponto S 1 ,
Z
n
1X
(f j ()) = dm.
lim
n n
j=1


CAPITULO 6. UNICIDADE ERGODICA

176

Considere = a0 . Ent
ao, f j () = a0 + a1 j = zj . Logo, a relacao anterior d
a
n

1X
(zj ) =
n n
j=1
lim

dm.

Isto e precisamente o que significa dizer que zj e equidistribuda.

6.4.1

Ergodicidade

Agora vamos estender os argumentos acima para qualquer grau d 1. Para


isso introduzimos a transformacao f : Td Td definida no toro d-dimensional
Td pela seguinte expressao:
f (1 , 2 , . . . , d ) = (1 + , 2 + 1 , . . . , d + d1 ),

(6.4.1)

onde e um n
umero irracional que sera escolhido mais tarde. Note que f e
invertvel: a inversa est
a dada por
f 1 (1 , 2 , . . . , d ) = (1 , 2 1 +, . . . , d d1 + +(1)d1 1 +(1)d ).
Note tambem que a derivada

1
1

de f em cada ponto e dada pela matriz

0
0
0
0
1
0
0
0

1
1
0
0


0
0
1
1

cujo determinante e 1. Isto garante que f preserva a medida de Lebesgue no


toro (lembre do Lema 1.3.5).
Proposi
c
ao 6.4.3. A medida de Lebesgue em Td e erg
odica para f .
Demonstrac
ao. Vamos usar um argumento de expansao em serie de Fourier,
analogo ao da Proposicao 4.2.1. Seja : Td R uma funcao em L2 (m).
Escrevemos
X
an e2in
() =
nZd

onde = (1 , . . . , d ) e n = (n1 , . . . , nd ) e n = n1 1 + + nd d e
Z
X
|an |2 = |()|2 d1 dd < .
nZd

Observe que
(f ()) =

an e2i(n1 (1 +)+n2 (2 +1 )+nd (d +d1 ))

nZd

nZd

an e2in1 e2iL(n)

(6.4.2)

177

6.4. TEOREMA DE WEYL

onde L(n) = (n1 + n2 , n2 + n3 , . . . , nd1 + nd , nd ). Suponhamos que a funcao


e invariante, isto e, f = em quase todo ponto. Ent
ao,
an e2in1 = aL(n)

para todo n Zd .

(6.4.3)

Isto implica que an e aL(n) tem o mesmo valor absoluto. Por outro lado, a
relacao de integrabilidade (6.4.2) implica que existe no maximo um n
umero
finito de termos com um dado valor absoluto n
ao-nulo. Conclumos que an = 0
para todo n Zd cuja
orbita Lj (n), j Z seja infinita. Observando a expressao
de L deduzimos que an = 0 exceto, possivelmente, se n2 = = nd = 0. Alem
disso, para os valores de n restantes, ou seja, para n = (n1 , 0, . . . , 0), tem-se que
L(n) = n e portanto a relacao (6.4.3) torna-se
an = an e2in1 .
Como e irracional, o u
ltimo fator e diferente de 1 sempre que n1 e n
ao-nulo.
Portanto esta relacao d
a que an = 0 tambem para n = (n1 , 0, . . . , 0) com n1 6= 0.
Deste modo, mostramos que se e uma funcao invariante ent
ao todos os termos
da sua expansao em serie de Fourier se anulam exceto, possivelmente, o termo
constante. Isto mostra que e constante em quase todo ponto, e isso prova que
a medida de Lebesgue e erg
odica para f .

6.4.2

Unicidade erg
odica

O proximo passo da demonstracao do Teorema 6.4.2 e o seguinte resultado:


Proposi
c
ao 6.4.4. A transformac
ao f e unicamente erg
odica: a medida de
Lebesgue no toro e a sua u
nica probabilidade invariante.
Demonstrac
ao. A demonstracao sera por inducao no grau d do polinomio P . O
caso de grau 1 foi tratado anteriormente. Portanto, so precisamos explicar como
o caso de grau d pode ser deduzido do caso de grau d 1. Para isso, escrevemos
Td = Td1 S 1 e
f : Td1 S 1 Td1 S 1 ,

f (0 , ) = (f0 (0 ), + d1 ),

(6.4.4)

onde 0 = (1 , . . . , d1 ) e f0 (0 ) = (1 + , 2 + 1 , . . . , d1 + d2 ). Por
inducao, a transformacao
f0 : Td1 Td1
e unicamente erg
odica. Representamos por : Td Td1 a projecao () = 0 .
Lema 6.4.5. Se e uma probabilidade invariante por f ent
ao a projec
ao
coincide com a medida de Lebesgue m0 em Td1 .
Demonstrac
ao. Dado qualquer conjunto mensuravel E Td1 ,
( )(f01 (E)) = ( 1 f01 (E)).


CAPITULO 6. UNICIDADE ERGODICA

178

Usando f = f0 e o fato de que e f -invariante, se verifica que a expressao


do lado direito e igual a
(f 1 1 (E)) = ( 1 (E)) = ( )(E).
Portanto ( )(f01 (E)) = ( )(E) para todo subconjunto mensuravel E, ou
seja, e probabilidade f0 -invariante. Como f0 e unicamente erg
odico, segue
que coincide com a medida de Lebesgue m0 em Td1 .
Agora suponhamos que , alem de invariante, tambem e erg
odica para f .
Pelo Teorema 3.2.6, e por ergodicidade, o conjunto G() M dos pontos
Td tais que
Z
n1
1X
j
(f ()) = d
lim
n n
j=0

para toda funcao contnua : Td R (6.4.5)

tem medida total. Seja G0 () o conjunto dos 0 Td1 tais que G() intersecta
claro que 1 (G0 ())
{0 } S 1 . Em outras palavras, G0 () = (G()). E
contem G() e, portanto, tem medida total. Logo, usando o Lema 6.4.5,
m0 (G0 ()) = ( 1 (G0 ())) = 1.

(6.4.6)

Pelas mesmas raz


oes, esta relacao tambem vale para a medida de Lebesgue:
m0 (G0 (m)) = m( 1 (G0 (m))) = 1.

(6.4.7)

Uma consequencia direta das igualdades (6.4.6) e (6.4.7) e que a interseccao de


G0 () e G0 (m) tem medida m0 total. Logo, em particular, estes conjuntos n
ao
podem ser disjuntos. Seja 0 um ponto qualquer na interseccao. Por definicao,
G() intersecta {0 } S 1 . Mas o proximo resultado afirma que G(m) contem
{0 } S 1 :
Lema 6.4.6. Se 0 G0 (m) ent
ao {0 } S 1 est
a contido em G(m).

Demonstrac
ao. A observacao crucial e que a medida m e invariante por toda a
transformacao da forma
R : Td1 S 1 Td1 S 1 ,

(, ) 7 (, + ).

A hip
otese 0 G0 (m) significa que existe algum S 1 tal que (0 , ) G(m),
ou seja,
Z
n1
1X
(f j (0 , )) = dm
lim
n n
j=0

para toda funcao contnua : Td R. Qualquer outro ponto de {0 } S 1


pode ser escrito como (0 , + ) = R (0 , ) para algum S 1 . Recordando
(6.4.1), vemos que


f R (0 , ) = (1 + , 2 + 1 , . . . , d1 + d2 , + + d1 ) = R f (0 , )

179

6.4. TEOREMA DE WEYL


para todo (0 , ) Td1 S 1 . Logo, por inducao,


f j (0 , + ) = f j R (0 , ) = R f j (0 , )

para todo j 1. Portanto, dada qualquer funcao contnua : Td R,


lim
n

n1
n1
1X
1X
(f j (0 , + )) = lim
( R )(f j (0 , ))
n j=0
n j=0
Z
Z
= ( R ) dm = dm.

Isto prova que (0 , + ) est


a no conjunto G(m) para todo S 1 , conforme
foi afirmado.
Segue do que dissemos ate agora que G() e G(m) se intersectam em algum
ponto de {0 } S 1. Tendo em vista a definicao (6.4.5), isto implica que as duas
medidas tem a mesma integral para cada funcao contnua. De acordo com a
Proposicao A.3.3, isto implica que = m, como queramos demonstrar.
Corol
ario 6.4.7. A
orbita de todo ponto Td e equidistribuda no toro Td ,
ou seja, para toda func
ao contnua : Td R tem-se
Z
n1
1X
j
(f ()) = dm.
lim
n n
j=0

Demonstrac
ao. Isto segue imediatamente das Proposicoes 6.1.1 e 6.4.4.

6.4.3

Demonstrac
ao do teorema de Weyl

Para completarmos a demonstracao do Teorema 6.4.2, introduzimos as funcoes


polinomiais p1 , . . . , pd definidas por
pd (x) = P (x) e
pj1 (x) = pj (x + 1) pj (x)

para j = 2, . . . , d.

(6.4.8)

Lema 6.4.8. O polin


omio pj (x) tem grau j, para todo 1 j d. Alem disso,
p1 (x) = x + com = d!ad .
Demonstrac
ao. Por definicao, pd (x) = P (x) tem grau d. Logo, para mostrar a
primeira afirmacao basta mostrar que se pj (x) tem grau j ent
ao pj1 (x) tem
grau j 1. Para isso, escreva
pj (x) = bj xj + bj1 xj1 + + b0 ,
onde bj 6= 0. Ent
ao
pj (x + 1) = bj (x + 1)j + bj1 (x + 1)j1 + + b0
= bj xj + (jbj + bj1 )xj1 + + b0 .


CAPITULO 6. UNICIDADE ERGODICA

180

Subtraindo uma expressao da outra, obtemos que


pj1 (x) = (jbj )xj1 + bj2 xj2 + + b0
tem grau j 1. Isto prova a primeira afirmacao no lema. Este c
alculo tambem
mostra que o coeficiente guia de cada pj1 (x) se obtem multiplicando por j o
coeficiente guia de pj (x). Consequentemente, o coeficiente guia de p1 deve ser
igual a d!aq . Isto prova a segunda afirmacao.
Lema 6.4.9. Para todo n 0,



f n p1 (0), p2 (0), . . . , pd (0) = p1 (n), p2 (n), . . . , pd (n) .

Demonstrac
ao. A demonstracao sera por inducao em n. Como o caso n = 0 e
obvio, so precisamos tratar do passo indutivo. Lembre que f foi definida em

(6.4.1). Se
f n1 (p1 (0), p2 (0), . . . , pd (0)) = (p1 (n 1), p2 (n 1), . . . , pd (n 1))
ent
ao f n (p1 (0), p2 (0), . . . , pd (0)) e igual a
(p1 (n 1) + , p2 (n 1) + p1 (n 1), . . . , pd (n 1) + pd1 (n 1)).
Usando a definicao (6.4.8) e o Lema 6.4.8, obtemos que esta expressao e igual a
(p1 (n), p2 (n), . . . , pd (n)),
e isto prova o lema.
Finalmente, estamos prontos para provar que a sequencia zn = P (n), n N
e equidistribuda. Vamos tratar dois casos separadamente.
Em primeiro lugar, suponha que o coeficiente guia ad de P (x) e irracional.
Ent
ao o n
umero no Lema 6.4.8 e irracional e, portanto, os resultados da
Secao 6.4.2 sao validos para a transformacao f : Td Td . Seja : S 1 R
uma funcao contnua qualquer. Considere : Td R definida por
(1 , 2 , . . . , d ) = (d ).
Fixemos = (p1 (0), p2 (0), . . . , pd (0)). Usando o Lema 6.4.9 e o Corolario 6.4.7,
obtemos que
lim
n

Z
Z
n1
n1
1X
1X
(zn ) = lim
(f n ()) = dm = dx.
n n
n j=0
j=0

Isto termina a demonstracao do Teorema 6.4.2 no caso em que ad e irracional.

Agora suponha que ad e racional, digamos ad = p/q com p Z e q N. E


claro que podemos escrever zn como uma soma
zn = xn + yn ,

xn = ad nd

yn = Q (n)

181

6.4. TEOREMA DE WEYL

onde Q(x) = a0 + a1 x + + ad1 xd1 e Q : R S 1 e dada por Q = Q.


Observe, em primeiro lugar, que
xn+q xn =

p
p
(n + q)d nd
q
q

e um n
umero inteiro, para todo n N. Isto significa que a sequencia xn , n N
e periodica de perodo q no crculo R/Z. Em particular, ela toma no maximo
q valores distintos. Observe tambem que, como ad e racional, a hipotese do
teorema implica que algum dos coeficientes a1 , . . . , ad1 de Q e irracional.
Logo, por inducao no grau, temos que yn , n N e equidistribuda. Mais do que
isso, as subsequencias
yqn+r = Q (qn + r),

nZ

sao equidistribudas para todo r {0, 1, . . . , q1}. Na verdade, estas sequencias


(r)
podem ser escritas como ynq+r = Q (n) para algum polinomio Q(r) que
tambem tem grau d 1 (verifique) e, portanto, a hipotese de inducao se aplica a
elas tambem. Destas duas observacoes segue que toda subsequencia zqn+r , n Z
e equidistribuda. Consequentemente, zn , n N tambem e equidistribuda. Isto
completa a prova do Teorema 6.4.2.

6.4.4

Exerccios

6.4.1. Mostre que uma sequencia (zj )j e equidistribuda no crculo se, e somente
se, para todo segmento I S 1 tem-se
lim
n

1
#{1 j n : zj I} = m(I)
n

onde m(I) representa o comprimento de I.

6.4.2. Mostre que a sequencia ( n mod Z)n e equidistribuda no crculo. O


mesmo vale para a sequencia (log n mod Z)n ?
6.4.3. Koksma [Kok35] mostrou que a sequencia (an mod Z)n e equidistribuda
no crculo, para Lebesgue quase todo a > 1. Isso
ao e verdade para todo a > 1.
n
De fato, considere a raz
ao
aurea a = (1 + 5)/2. Verifique que a sequencia
(an mod Z)n converge para 0 S 1 quando n ; em particular, ela n
ao e
equidistribuda no crculo.

182

CAPITULO 6. UNICIDADE ERGODICA

Captulo 7

Correlac
oes
Os modelos de sistemas din
amicos em que estamos interessados mais diretamente, transformacoes e fluxos, sao determinsticos: o estado do sistema em
qualquer momento determina toda a trajetoria futura; quando o sistema e invertvel, a trajetoria passada fica igualmente determinada. No entanto, estes
sistemas podem apresentar tambem comportamento de tipo estoc
astico (ou seja,
parcialmente aleat
orio): num nvel mais grosseiro que o das trajetorias individuais, informacao sobre o passado vai sendo esquecida `a medida que o sistema
e iterado. Este e o tema do presente captulo.
Em Teoria da Probabilidade, chamamos correlac
ao de duas variaveis aleat
orias, X e Y , ao n
umero


C(X, Y ) = E (X E[X])(Y E[Y ]) = E[XY ] E[X]E[Y ].

Note que a expressao (X E[X])(Y E[Y ]) e positiva se X e Y est


ao do
mesmo lado (maior ou menor) das respectivas medias, E[X] e E[Y ], e e negativa
no caso contr
ario. Portanto, o sinal de C(X, Y ) indica se as duas variaveis
apresentam, predominantemente, o mesmo comportamento ou comportamentos
opostos, relativamente `
as suas medias; correlacao proxima de zero sinaliza que
os dois comportamentos est
ao pouco ou nada relacionados um com o outro.
Dada uma probabilidade invariante de um sistema dinamico f : M M
e dadas funcoes mensuraveis , : M R, queremos analisar a evolucao das
correlacoes
Cn (, ) = C( f n , )
quando o tempo n vai para infinito. Podemos pensar em e como grandezas
que medimos no sistema, tais como a temperatura, o pH, a energia cinetica etc.
Ent
ao Cn (, ) mede como o valor de em tempo n se correlaciona com o valor
de em tempo zero, ate que ponto um valor influencia o outro. Por exemplo,
se = XA e = XB sao funcoes caractersticas, ent
ao (x) d
a informacao
sobre a posicao do ponto inicial x, enquanto que (f n (x)) informa sobre a
posicao do seu n-esimo iterado f n (x). Se a correlacao Cn (, ) for pequena
ent
ao a primeira informacao sera de pouca utilidade para fazer previs
oes quanto
183


CAPITULO 7. CORRELAC
OES

184

ao segundo evento. Como veremos, esse tipo de comportamento, em que as


correlacoes se aproximam de zero `a medida que n aumenta, e bastante comum
em modelos importantes.
Comecaremos por introduzir as nocoes de sistema (fortemente) misturador
e fracamente misturador e por estudar as suas propriedades b
asicas (Secao 7.1).
Nas Secoes 7.2 e 7.3 discutiremos estas nocoes no contexto dos deslocamentos
de Markov, que generalizam os deslocamentos de Bernoulli, e dos intercambios
de intervalos, uma extensao da classe das rotacoes no crculo. Na Secao 7.4 analizaremos, em termos quantitativos, a velocidade de decaimento das correlacoes
para certas classes de funcoes.

7.1

Sistemas misturadores

Seja f : M M uma transformacao mensuravel e seja uma probabilidade invariante. A sequencia de correlac
oes de duas funcoes mensuraveis , : M R
e definida por
Z
Z
Z
Cn (, ) = ( f n ) d d d,
n N.
(7.1.1)
Dizemos que o sistema (f, ) e misturador se
lim Cn (XA , XB ) = lim (f n (A) B) (A)(B) = 0,
n

(7.1.2)

para quaisquer conjuntos mensuraveis A, B M . Em outras palavras, quando


n cresce, a probabilidade do evento {x B e f n (x) A} converge para o
produto das probabilidades dos eventos {x B} e {f n (x) A}.
Analogamente, dado um fluxo f t : M M , t R e uma probabilidade
invariante , definimos
Z
Z
Z
t
Ct (, ) = ( f ) d d d,
tR
(7.1.3)
e dizemos que o sistema (f t , ) e misturador se
lim Ct (XA , XB ) = lim (f t (A) B) (A)(B) = 0,

t+

t+

(7.1.4)

para quaisquer conjuntos mensuraveis A, B M .

7.1.1

Propriedades

Um sistema misturador e necessariamente erg


odico. De fato, suponha que existe
algum conjunto invariante A M com 0 < (A) < 1. Tomando B = Ac
vem que f n (A) B = para todo n. Logo, (f n (A) B) = 0 para todo
n, enquanto que (A)(B) 6= 0. Em particular, (f, ) n
ao e misturador. O
exemplo a seguir mostra que ergodicidade e uma propriedade estritamente mais
fraca:

185

7.1. SISTEMAS MISTURADORES

Exemplo 7.1.1. Considere R irracional. Como vimos anteriormente, a


rotacao R no crculo S 1 e erg
odica para a medida de Lebesgue m. No entanto,
(R , m) n
ao e misturador. De fato, se A, B S 1 sao dois intervalos pequenos
n
(com comprimento menor que 1/10, digamos) ent
ao R
(A) B e vazio e,
n
portanto, m(R (A)B) = 0 para infinitos valores de n. Como m(A)m(B) 6= 0,
segue que o limite em (7.1.2) n
ao se verifica.
claro da definicao (7.1.2) que se (f, ) e misturador ent
E
ao (f k , ) e misturador, para todo k N. A afirmacao correspondente para ergodicidade e falsa:
a aplicacao f (x) = 1 x no conjunto {0, 1} e erg
odica para a medida (0 + 1 )/2
mas o segundo iterado f 2 n
ao e.
Lema 7.1.2. Suponha que limn (f n (A) B) = (A)(B) para todo par de
conjuntos A e B em alguma
algebra A geradora da -
algebra dos conjuntos
mensur
aveis. Ent
ao (f, ) e misturador.
Demonstrac
ao. Seja C a famlia de todos os conjuntos mensuraveis A tais que
(f n (A) B) (A)(B) para todo B A. Por hipotese, C contem A.
Afirmamos que C e uma classe mon
otona. De fato, sejam A1 Ak
elementos de C e seja A = k Ak . Dado > 0, existe k0 1 tal que
(A) (Ak ) = (A \ Ak ) <
para todo k k0 . Alem disso, para todo n 1,
(f n (A) B) (f n (Ak ) B) = (f n (A \ Ak ) B)

(f n (A \ Ak )) = (A \ Ak ) < .

Para k k0 fixado, o fato de que Ak C garante que existe n(k) tal que
|(f n (Ak ) B) (Ak )(B)| < para todo n n(k).
Somando estas tres desigualdades conclumos que
|(f n (A) B) (A)(B)| < 3 para todo n n(k0 ).
Como > 0 e arbitrario, isto mostra que A C. Da mesma forma se mostra que
a intersecao de qualquer sequencia decrescente de elementos de C ainda e um
elemento de C. Portanto C e uma classe mon
otona, tal como afirmamos. Pelo
teorema das classes mon
otonas (Teorema A.1.18), segue que C contem todo o
conjunto mensuravel: para todo conjunto mensuravel A tem-se
lim (f n (A) B) = (A)(B)
n

para todo B A.

Resta deduzir que esta propriedade vale para todo conjunto mensuravel B. Isto
e inteiramente analogo aos argumentos que acabamos de detalhar, pelo que
deixaremos a verificacao a cargo do leitor.


CAPITULO 7. CORRELAC
OES

186

Exemplo 7.1.3. Todo deslocamento de Bernoulli (lembre da Secao 4.2.3) e misturador. De fato, dados dois cilindros A = [p; Ap , . . . , Aq ] e B = [r; Br , . . . , Bs ]
quaisquer, tem-se
(f n (A) B) = ([r; Br , . . . , Bs , X, . . . , X, Ap , . . . , Aq ])
= ([r; Br , . . . , Bs ])([p; Ap , . . . , Aq ]) = (A)(B)
para todo n > s p. Seja A a algebra gerada pelos cilindros: os seus elementos
sao as uni
oes finitas disjuntas de cilindros. Segue do que acabamos de dizer que
(f n (A) B) = (A)(B) para todo par de conjuntos A, B A e todo n
suficientemente grande. Como A gera a -algebra dos conjuntos mensuraveis,
podemos usar o Lema 7.1.2 para concluir que o sistema e misturador, tal como
foi afirmado.
Exemplo 7.1.4. Seja f : S 1 S 1 a transformacao definida por g(x) = kx,
onde k 2 e um n
umero inteiro, e seja m a medida de Lebesgue m no crculo.
O sistema (g, m) e equivalente a um deslocamento de Bernoulli, no seguinte
sentido. Considere X = {0, 1, . . . , k 1} e seja f : M M a aplicacao deslocamento em M = X N . Considere a medida produto = N em M , onde e a
probabilidade definida por (A) = #A/k para todo A X. A aplicacao
h : M S1,

 X
an1
h (an )n =
kn
n=1

e uma bijecao, restrita a um subconjunto com medida total, e tanto ela quanto
a sua inversa sao mensuraveis. Alem disso, h = m e h f = g h em quase
todo ponto. Dizemos que h e uma equivalencia erg
odica entre (g, m) e (f, ).
Por meio dela, propriedades podem ser traduzidas de um sistema para o outro.
Em particular, lembrando do Exemplo 7.1.3, obtemos que (g, m) e misturador:
dados quaisquer conjuntos mensuraveis A, B S 1 ,



m g n (A) B = h1 (g n (A) B) = f n (h1 (A)) h1 (B)
(h1 (A))(h1 (B)) = m(A)m(B)

quando n .

Exemplo 7.1.5. Para endomorfismos sobrejetivos do toro (Secao 4.2.5) as propriedades de mistura e ergodicidade sao equivalentes: o sistema (fA , m) e misturador se, e somente se, nenhum autovalor da matriz A e raiz da unidade
(compare com o Teorema 4.2.14). Este fato est
a proposto no Exerccio 7.1.4
e um resultado ainda mais forte sera proposto no Exerccio 8.4.2. Mais geralmente, um endomorfismo sobrejetivo de um grupo compacto e misturador para
a medida de Haar se, e somente se, ele e erg
odico.De fato valem resultados bem
mais fortes, como comentaremos na Secao 9.5.3.
Vamos tambem discutir uma versao topologica da nocao de sistema misturador. Para isso, suponha que o ambiente M e um espaco topologico. Uma
transformacao f : M M e dita topologicamente misturadora se dados quaisquer abertos n
ao-vazios U, V M , existe n0 N tal que f n (U ) V e n
ao

187

7.1. SISTEMAS MISTURADORES

vazio para todo n n0 . Isto e parecido, mas estritamente mais forte do que
a hip
otese do Lema 4.3.4: la pedimos que f n (U ) intersecte V para algum n,
enquanto que agora queremos que isso aconteca para todo n suficientemente
grande.
Proposi
c
ao 7.1.6. Se (f, ) e misturadora ent
ao a restric
ao de f ao suporte
de e topologicamente misturadora.
Demonstrac
ao. Denote por X = supp(). Sejam A, B X conjuntos abertos. Temos que (A), (B) > 0, por definicao de supp(). Assim, como e
misturadora, temos que existe n0 tal que n n0 vale que (f n (A) B) >
(A)(B)/2 > 0. Em particular, (f n (A) B) 6= , como queramos demonstrar.
Segue diretamente desta proposicao que se f possui uma medida misturadora positiva em abertos, ent
ao f e topologicamente misturadora. Por exemplo,
dado qualquer conjunto finito X = {1, . . . , d}, o deslocamento
f : XZ XZ

(ou f : X N X N )

e topologicamente misturador. De fato, para qualquer probabilidade suportada em todo o X, a medida de Bernoulli = N (ou = Z ) e positiva
em abertos e misturadora, como vimos no Exemplo 7.1.3. Analogamente, pelo
Exemplo 7.1.4, toda transformacao f : S 1 S 1 da forma f (x) = kx com k 2
e topologicamente misturadora.
Exemplo 7.1.7. Translacoes num grupo metriz
avel G nunca sao topologicamente misturadoras. De fato considere qualquer translacao `a esquerda Eg (o
caso de translacoes `
a direita e analogo). Podemos supor que g 6= e, pois caso
contr
ario e evidente que Eg n
ao e topologicamente misturadora. Fixemos uma
distancia d invariante pelas translacoes do grupo G (lembre do Lema 6.3.6) e
seja = d(e, g 1 ). Considere U = V = bola de centro e e raio /4. Todo
Egn (U ) e uma bola de raio /4. Suponha que Egn (U ) intersecta V . Ent
ao
Egn (U ) est
a contida na bola de raio 3/4 e, portanto, Egn1 (U ) est
a contida
na bola de raio 3/4 em torno de g 1 . Consequentemente, Egn1 (U ) n
ao intersecta V . Como n e arbitrario, isto mostra que Eg n
ao e topologicamente
misturadora.

7.1.2

Mistura fraca

Dizemos que o sistema (f, ) e fracamente misturador, se dados quaisquer conjuntos mensuraveis A, B M ent
ao:
lim
n

n1
n1
1X
1X
|Cj (XA , XB )| = lim
|(f j (A) B) (A)(B)| = 0. (7.1.5)
n n
n j=0
j=0

claro da definicao que todo sistema misturador e tambem fracamente mistuE


rador. Por outro lado, todo sistema fracamente misturador e erg
odico. De fato,


CAPITULO 7. CORRELAC
OES

188
se A M e conjunto invariante ent
ao

n1
1X
|Cj (XA , XAc )| = (A)(Ac )
lim
n n
j=0

e, portanto, a hip
otese implica que (A) = 0 ou (Ac ) = 0.
Exemplo 7.1.8. Translacoes em grupos compactos metriz
aveis nunca sao fracamente misturadoras, relativamente `a medida de Haar (ou qualquer outra
medida invariante positiva em abertos). De fato, conforme observado no Exemplo 7.1.7, e sempre possvel escolher abertos U e V tais que f n (U ) V e vazio
para um em cada dois valores consecutivos de n. Ent
ao,
lim inf
n

n1
1X
1
|(f j (U ) V ) (U )(V )| (U )(V ) > 0.
n j=0
2

Desta forma obtemos diversos exemplos de sistemas erg


odicos, e ate unicamente
erg
odicos, que n
ao sao fracamente misturadores.
Conforme veremos na Secao 7.3.2, a famlia dos intercambios de intervalos
contem diversos sistemas fracamente misturadores (e unicamente erg
odicos) que
n
ao sao misturadores.
A demonstracao do resultado a seguir e analoga `a do Lemma 7.1.2 e fica a
cargo do leitor:
Pn1
Lema 7.1.9. Suponha que limn n1 j=0 |(f j (A)B)(A)(B)| = 0 para
todo par de conjuntos A e B em alguma
algebra A geradora da -
algebra dos
conjuntos mensur
aveis. Ent
ao (f, ) e fracamente misturador.
Exemplo 7.1.10. Dado um sistema (f, ), consideremos a transformacao pro facil ver
duto f2 : M M M M dado por f2 (x, y) = (f (x), f (y)). E
que f2 preserva a medida produto 2 = . Se (f2 , 2 ) e erg
odico ent
ao
(f, ) e erg
odico: basta notar que se A M e conjunto invariante para f com
(A) (0, 1) ent
ao A A e conjunto invariante para f2 com 2 (A A) (0, 1).
A recproca n
ao e verdadeira em geral, ou seja, (f2 , 2 ) pode n
ao ser erg
odico
mesmo que (f, ) seja erg
odico. Por exemplo, se f e uma rotacao irracional
em S 1 e d e uma distancia invariante por rotacoes, ent
ao qualquer vizinhanca
{(x, y) : d(x, y) < r} da diagonal e um conjunto invariante para f f .
O proximo resultado mostra que este tipo de fenomeno n
ao ocorre na categoria dos sistemas fracamente misturadores:
Proposi
c
ao 7.1.11. As seguintes condic
oes s
ao equivalentes:
(a) (f, ) e fracamente misturador;
(b) (f2 , 2 ) e fracamente misturador;
(c) (f2 , 2 ) e erg
odico.

189

7.1. SISTEMAS MISTURADORES

Demonstrac
ao. Para provar que (a) implica (b), considere quaisquer conjuntos
mensuraveis A, B, C, D M . Ent
ao:


2 (f j (A B) (C D)) 2 (A B)2 (C D)
2


= (f j (A) C)(f j (B) D) (A)(B)(C)(D)



(f j (A) C) (A)(C) + (f j (B) D) (B)(D) .

Portanto, a hip
otese (a) implica que
lim
n

n1

1 X
2 (f2j (A B) (C D)) 2 (A B)2 (C D) = 0.
n j=0

Segue que

lim
n

n1

1 X
2 (f2j (X) Y ) 2 (X)2 (Y ) = 0
n j=0

para quaisquer X, Y na
algebra gerada pelos produtos E F de subconjuntos
mensuraveis de M , ou seja, a
algebra das unioes finitas disjuntas de tais produtos. Como esta
algebra gera a -algebra dos subconjuntos mensuraveis de
M M , podemos usar o Lema 7.1.9 para concluir que (f2 , 2 ) e fracamente
misturador.
imediato que (b) implica (c). Para provar que (c) implica (a), observe que
E
n1
X
j=0

2
(f j (A) B) (A)(B)
=

n1
X
j=0

(f j (A) B)2 2(A)(B)(f j (A) B) + (A)(B)2

Pode ser reescrito como


n1
X
j=0




2 f2j (A A) (B B) 2 (A A)2 (B B)
2(A)(B)

n1
X
j=0



(f j (A) B) (A)(B) .

Como que (f2 , 2 ) e erg


odico e, consequentemente, (f, ) tambem e, conclumos
que
n1
2
1 X
lim
(f j (A) B) (A)(B) = 0
n n
j=0

para quaisquer conjuntos mensuraveis A, B M . Usando o Exerccio 7.1.2,


obtemos que (f, ) e fracamente misturador.


CAPITULO 7. CORRELAC
OES

190

7.1.3

Caracterizac
ao espectral

Nesta secao discutiremos formulacoes equivalentes das nocoes de sistema misturador e fracamente misturador, em termos do operador de Koopman.
Proposi
c
ao 7.1.12. As seguintes condic
oes s
ao equivalentes:
(a) (f, ) e misturador.
(b) Existem p, q [1, ] com 1/p + 1/q = 1 tais que Cn (, ) 0 para
quaisquer Lp () e Lq ().
(c) A condic
ao do item (b) vale para em algum subconjunto denso de Lp ()
e em algum subconjunto denso de Lq ().
Demonstrac
ao. A condicao (a) e o caso particular de (b) para funcoes caractersticas. Como as correlacoes (, ) 7 Cn (, ) sao funcoes bilineares, a
condicao (a) implica que Cn (, ) 0 para quaisquer funcoes simples e .
Isto implica (c), uma vez que as funcoes simples formam um subconjunto denso
de Lr (), para qualquer r 1.
Para mostrar que (c) implica (b), comecemos por observar que as correlacoes
Cn (, ) sao funcoes equicontnuas de e . De fato, dadas 1 , 2 Lp () e
1 , 2 Lq (), as desigualdade de H
older (Teorema A.5.5) d
a que
Z
Z


(1 f n )1 d (2 f n )2 d k1 2 kp k1 kq + k2 kp k1 2 kq .
Alem disso,
Z
Z
Z
Z


1 d 1 d 2 d 2 d k1 2 k1 k1 k1 + k2 k1 k1 2 k1 .

Somando estas desigualdades, e notando que k k1 k kr para todo r 1,


obtemos que:


Cn (1 , 1 ) Cn (2 , 2 ) 2k1 2 kp k1 kq + 2k2 kp k1 2 kq (7.1.6)

para todo n 1. Ent


ao, dado > 0 e dados quaisquer Lp () e Lq (),

podemos tomar e nos subconjuntos densos da mencionados na hipotese


tais que
k kp < e k kq < .

Em particular, k kp < kkp + e k kq < kkq + . Ent


ao, (7.1.6) d
a que
|Cn (, )| |Cn ( , )| + 2(kkp + kkq + 2) para todo n.

Alem disso, por hip


otese, temos |Cn ( , )| < para todo n suficientemente
grande. Como e arbitrario, estas duas desigualdades implicam que Cn (, )
converge para zero quando n . Isto prova a propriedade (b).
O mesmo argumento prova a seguinte versao da Proposicao 7.1.12 para a
propriedade de mistura fraca:

191

7.1. SISTEMAS MISTURADORES


Proposi
c
ao 7.1.13. As seguintes condic
oes s
ao equivalentes:
(a) (f, ) e fracamente misturador.
(b) Existem p, q [1, ] com 1/p + 1/q = 1 tais que (1/n)
converge para 0 para quaisquer Lp () e Lq ().

Pn

j=1

|Cj (, )|

(c) A condic
ao do item (b) vale em algum subconjunto denso de Lp () e algum
subconjunto denso de Lq ().
No caso p = q = 2, podemos expressar as correlacoes em termos do produto
interno no espaco de Hilbert L2 ():


Cn (, ) = Ufn ( 1)

para todo , L2 ().

Portanto, a Proposicao 7.1.12 d


a que (f, ) e misturador se, e somente se,


lim Ufn ( 1) = 0 para todo , L2 ()

(7.1.7)

e a Proposicao 7.1.13 d
a que (f, ) e fracamente misturador se, e somente se,
lim
n

n

1 X  j
Uf ( 1) = 0 para todo , L2 ().
n j=1

(7.1.8)

R
A condicao (7.1.7) significa que Ufn converge fracamente para 1 = d,
enquanto que (7.1.8) e uma versao Cesaro dessa afirmacao. Compare as duas
condicoes com a caracterizacao da ergodicidade em (4.1.7).
Corol
ario 7.1.14. Seja f : M M uma transformac
ao misturadora para
uma probabilidade invariante . Seja uma probabilidade qualquer em M ,
absolutamente contnua em relac
ao a . Ent
ao fn converge pontualmente para
n
, ou seja, (f (B)) (B) para todo conjunto mensur
avel B M .
Demonstrac
ao. Considere = XB e = d/d. Note que L () e
1
L (). Logo, pela Proposicao 7.1.12,
Z

(XB f n )

d
d =
d

(Ufn ) d

d =

XB d

d
d.
d

R
A sequencia do lado esquerdo
coincide com (XB f n ) d = (f n (B)). O lado
R
direito e igual a (B) 1 d = (B).

7.1.4

Exerccios

7.1.1. Mostre que (f, ) e misturador se, e somente se, (f n (A) A) (A)2
para todo conjunto mensuravel A.

192

CAPITULO 7. CORRELAC
OES

7.1.2. Seja
encia limitada de n
umeros reais. Demonstre que
n )n uma sequ
P(a
n
limn (1/n) j=1 |aj | = 0 se, e somente se, existe E N com densidade zero no
infinito (ou seja, satisfazendo limn (1/n)#(E {0, . . . , n 1}) = 0) tal que a
restricao de (an )n ao complementar de E converge para zero quando n .
Deduza que
n
n
1X
1X
|aj | = 0 lim
(aj )2 = 0.
lim
n n
n n
j=1
j=1
7.1.3. Prove que se e fracamente misturadora para f ent
ao e fracamente
misturadora para todo iterado f k , k 1.

7.1.4. Mostre que se nenhum autovalor de A SL(d, R) e uma raiz da unidade


ent
ao o endomorfismo linear fA : Td Td induzido por A e misturador, com
respeito `
a medida de Haar.
7.1.5. Seja f : M M uma transformacao mensuravel num espaco metrico.
Verifique que uma probabilidade invariante e misturadora se, e somente se,
(fn )n converge para na topologia fraca para toda probabilidade absolutamente contnua com respeito a .
7.1.6 (Teorema de Von Neumman m
ultiplo). Mostre que se (f, ) e fracamente
misturador ent
ao
Z
Z
N 1
1 X
(1 f n ) (k f kn ) 1 d k d em L2 (),
N n=0
para quaisquer funcoes mensuraveis limitadas 1 , . . . , k .

7.2

Deslocamentos de Markov

Nesta secao introduzimos uma importante classe de sistemas, que generaliza


a classe de deslocamentos de Bernoulli. Como vimos anteriormente, deslocamentos de Bernoulli modelam sequencias de experimentos identicos em que o
resultado de cada experimento e independente dos demais. Na definicao dos
deslocamentos de Markov abandonamos essa condicao de independencia, mas
supomos que cada resultado depende apenas do resultado imediatamente anterior. Mais geralmente, deslocamentos de Markov podem ser usados para modelar
processos, ditos com mem
oria finita, isto e, tais que existe k 1 tal que cada
resultado depende apenas dos k resultados imediatamente anteriores. A este
respeito, veja o Exerccio 7.2.4.
Para definir um deslocamento de Markov, consideremos um espaco mensur
avel (X, A) e seja = X N (ou = X Z ) o espaco das sequencias em X,
munido da -algebra produto. Consideraremos o deslocamento

: , (xn )n = (xn+1 )n .
Suponha que e dada uma famlia {P (x, ) : x X} de probabilidades em X,
chamadas probabilidades de transic
ao, dependendo mensuravelmente do ponto

193

7.2. DESLOCAMENTOS DE MARKOV

x. Heuristicamente, dado um conjunto mensuravel E X, o n


umero P (x, E)
representa a probabilidade de xn+1 E sabendo que xn = x. Uma probabilidade p em X e chamada medida estacion
aria, relativamente `a famlia de
probabilidades de transicao, se ela satisfaz
Z
P (x, E) dp(x) = p(E), para todo conjunto mensuravel E X. (7.2.1)

Heuristicamente, isto significa que, relativamente a p, a probabilidade do evento


xn+1 E e igual `
a probabilidade do evento xn E.
Fixe uma medida estacion
aria p qualquer (supondo que exista) e ent
ao defina

[m; Am , . . . , An ] =
Z
Z
Z
(7.2.2)
dP (xn1 , xn )
dP (xm , xm+1 )
dp(xm )
=
An

Am+1

Am

para todo cilindro [m; Am , . . . , An ] de . Pode mostrar-se que esta funcao se


estende a uma probabilidade na -algebra gerado pelos cilindros (confira o Exerccio 7.2.1). Esta probabilidade e invariante pelo deslocamento , uma vez que
o lado direito de (7.2.2) n
ao depende de m. Toda probabilidade obtida desta
forma e chamada medida de Markov ; alem disso, o sistema (, ) e chamado
deslocamento de Markov.
Exemplo 7.2.1. (Medida de Bernoulli) Suponha que P (x, ) n
ao depende de x,
ou seja, existe uma probabilidade em X tal que P (x, ) = para todo x X.
Ent
ao
Z
Z
P (x, E) dp(x) = (E) dp(x) = (E)
para toda probabilidade p e todo conjunto mensuravel E X. Portanto, existe
exatamente uma medida estacion
aria, a saber p = . A definicao (7.2.2) d
a
Z
Z
Z

d(xn )
d(xm+1 )
d(xm )
[m; Am , . . . , An ] =
Am+1

Am

An

= (Am )(Am+1 ) (An ).

Exemplo 7.2.2. Suponha que o conjunto X e finito, digamos X = {1, . . . , d}


para algum d 2. Qualquer famlia de probabilidades de transicao P (x, ) em
X fica completamente caracterizada pelos valores
Pi,j = P (i, {j}),

1 i, j d.

(7.2.3)

Alem disso, uma medida p em X fica completamente caracterizada pelos valores


pi = p({i}), 1 i d. Com esta notacao, a definicao (7.2.1) traduz-se por
d
X
i=1

pi Pi,j = pj ,

para todo 1 j d.

Alem disso, a medida de Markov fica dada por



[m; am , . . . , an ] = pam Pam ,am+1 Pan1 ,an .

(7.2.4)

(7.2.5)


CAPITULO 7. CORRELAC
OES

194

Na sequencia iremos nos restringir a deslocamentos de Markov finitos, ou


seja, ao contexto do Exemplo 7.2.2. Consideramos o conjunto X munido da
topologia discreta e da respectiva -algebra de Borel. Observe que a matriz
P = (Pi,j )1i,jd
definida por (7.2.3) satisfaz as seguintes condicoes:
(i) Pi,j 0 para todo 1 i j;
Pd
(ii)
j=1 Pi,j = 1 para todo 1 i d.

Dizemos que P e uma matriz estoc


astica. Reciprocamente, qualquer matriz
satisfazendo (i) e (ii) define uma famlia de probabilidades de transicao no conjunto X. Observe tambem que, denotando p = (p1 , . . . , pd ), a relacao (7.2.4)
corresponde a
P p = p,
(7.2.6)
onde P representa a transposta da matriz P . Em outras palavras, as medidas
estacion
arias correspondem precisamente aos autovetores da matriz transposta
para o autovalor 1. O seguinte resultado classico permite mostrar que tais
autovalores sempre existem:
Teorema 7.2.3 (Perron-Frobenius). Seja A uma matriz d d com entradas
n
ao-negativas. Ent
ao existe 0 e existe algum vetor v 6= 0 com entradas
n
ao-negativas tal que Av = v e || para todo autovalor de A.
Se A admite alguma potencia cujas entradas s
ao positivas ent
ao > 0 e
existe algum autovetor v com entradas postivas. De fato, > || para qualquer
outro autovalor de A. Alem disso, o autovalor tem multiplicidade 1 e e o
u
nico autovalor de A que admite algum autovetor com entradas n
ao-negativas.
Uma demonstracao do teorema de Perron-Frobenius pode ser encontrada no
livro de Meyers [Mey00], por exemplo. Aplicando este teorema `a matriz A = P ,
conclumos que existem 0 e p 6= 0 com pi 0 para todo i, tais que
d
X

pi Pi,j = pj ,

i=1

para todo 1 j d.

Somando sobre i = 1, . . . , d obtemos que


d X
d
X

pi Pi,j =

j=1 i=1

d
X

pj .

j=1

Usando a propriedade (ii) da matriz estoc


astica, o lado esquerdo desta igualdade
pode ser escrito como
d
d
d
X
X
X
pi .
Pi,j =
pi
i=1

j=1

i=1

7.2. DESLOCAMENTOS DE MARKOV

195

Comparando as duas u
ltimas igualdades, e lembrando que a soma das entradas
de p e um n
umero postivo, conclumos que = 1. Isto prova a nossa afirmacao
de que sempre existem vetores p 6= 0 satisfazendo (7.2.6).
Quando P n tem entradas positivas para algum n 1, segue do Teorema 7.2.3
que o autovetor e u
nico, a menos de produto por um escalar, e pode ser escolhido
com entradas positivas.
Exemplo 7.2.4. Em geral, p n
ao e u
nico e tambem pode n
ao existir nenhum
autovalor com entradas positivas. Por exemplo, considere:

1a
a
0
0
0
b
1b
0
0
0

0
0
1

c
c
0
P =

0
0
d
1d
0
e
0
0
0
1e
onde a, b, c, d, e (0, 1). Um vetor p = (p1 , p2 , p3 , p4 , p5 ) satisfaz P p = p se,
e somente se, ap1 = bp2 e cp3 = dp4 e p5 = 0. Portanto, o autoespaco tem
dimensao 2 e nenhum autovetor tem entradas positivas.

Por outro lado, suponha que p e tal que pi = 0 para algum i e seja a
respectiva medida de Markov. Seja i = (X \ {i})N (ou i = (X \ {i})Z). Ent
ao
(i ) = 1, uma vez que ([n; i]) = pi = 0 para todo n. Isto significa que podemos eliminar o smbolo i, obtendo um sistema equivalente ao original. Portanto,
a menos de remover um certo n
umero de smbolos superfluos do conjunto X,
sempre podemos considerar que o autovetor p tem entradas positivas.
Denotemos por P o conjunto de todas as sequencias (xn )n que satisfazem
(7.2.7)
Pxn ,xn+1 > 0 para todo n,
claro da definicao
ou seja, tais que todas as transicoes sao permitidas por P . E
que P e invariante pelo deslocamento . As transformacoes : P P construdas desta forma sao chamadas deslocamentos de tipo finito e serao estudadas
em mais detalhe na Secao 10.2.2.
Lema 7.2.5. O conjunto P e fechado em e, dada qualquer soluc
ao p de
P p = p com entradas positivas, o suporte da respectiva medida de Markov
coincide com P .
Demonstrac
ao. Seja xk = (xkn )n , k N uma sequencia qualquer em P e
suponha que ela converge em para algum x = (xn )n . pela definicao da
topologia em , isto quer dizer que para todo n existe kn 1 tal que xkn = xn
para todo k kn . Ent
ao, dado qualquer n, tomando k max{kn , kn+1 }
conclumos que Pxn ,xn+1 = Pxkn ,xkn+1 > 0. Isto mostra que x P .
Para provar a segunda parte do lema, lembre que os cilindros [m; xm , . . . , xn ]
formam uma base de vizinhancas de qualquer x = (xn )n em . Se x P ent
ao
([m; xm , . . . , xn ]) = pxm Pxm ,xm+1 Pxn1 ,xn > 0


CAPITULO 7. CORRELAC
OES

196

para todo cilindro e, portanto, x supp . Se x


/ P ent
ao existe n tal que
/ supp .
Pxn ,xn+1 = 0. Nesse caso, ([n; xn , xn+1 ]) = 0 e, portanto, x
Exemplo 7.2.6. Na situacao do Exemplo 7.2.4 h
a tres possibilidades para o
suporte de uma medida de Markov. Se p = (p1 , p2 , 0, 0, 0) com p1 , p2 > 0 ent
ao
podemos eliminar os smbolos 3, 4, 5. Todas as sequencias nos smbolos 1, 2 sao
admissveis. Logo supp = {1, 2}N . Analogamente, se p = (0, 0, p3 , p4 , 0) com
p3 , p4 > 0 ent
ao supp = {3, 4}N. Nos demais casos, p = (p1 , p2 , p3 , p4 , 0) com
p1 , p2 , p3 , p4 > 0. Eliminando o smbolo 5, temos que o conjunto das sequencias
admissveis e
P = {1, 2}N {3, 4}N.

Ambos os conjuntos nesta uniao tem medida positiva. Portanto, neste caso
o deslocamento de Markov (, ) n
ao e erg
odico. Mas segue da teoria que
apresentaremos na proxima secao que nos dois primeiros casos o sistema (, )
e erg
odico.

No proximo lema colecionamos algumas propriedades simples de matrizes


estoc
asticas que serao u
teis a seguir:
Lema 7.2.7. Seja P uma matriz estoc
astica e seja p = (p1 , . . . , pd ) uma soluc
ao
n
de P p = p. Para cada n 0, denote por Pi,j
, 1 i, j d as entradas da matriz
P n . Ent
ao:
Pd
n
(a)
j=1 Pi,j = 1 para todo 1 i d e todo n 1;
Pd
n
(b)
i=1 pi Pi,j = pj para todo 1 j d e todo n 1;
(c) o hiperplano H = {(h1 , . . . , hd ) : h1 + + hd = 0} e invariante por P .

Demonstrac
ao. A condicao (ii) na definicao de matriz estoc
astica pode ser escrita como P u = u, onde u = (1, . . . , 1). Ent
ao P n u = u para todo n 1. Isto
e apenas outra maneira de escrever o item (a). Analogamente, P p = p implica
que (P )n p = p para todo n 1, o que e outra maneira de escrever o item (b).
Observe que H e o complemento ortogonal do vetor u. Como u e invariante por
P , segue que H e invariante pela matriz transposta P .

7.2.1

Ergodicidade

Nesta secao sempre suporemos que p = (p1 , . . . , pd ) e uma P


solucao de P p = p
com pi > 0 para todo i, normalizada de tal forma que
i pi = 1. Seja
a respectiva medida de Markov. Queremos entender que condicoes a matriz
estoc
astica P deve satisfazer para que (, ) seja erg
odico.
Dizemos que a matriz estoc
astica P e irredutvel se para todo 1 i, j d
n
existe n 0 tal que Pi,j
> 0. Em outras palavras, P e irredutvel se for possvel
passar de qualquer resultado i a qualquer resultado j num certo n
umero n de
passos (que depende de i e j).
Teorema 7.2.8. O deslocamento de Markov (, ) e erg
odico se, e somente se,
a matriz P e irredutvel.

197

7.2. DESLOCAMENTOS DE MARKOV

O restante da presente secao e dedicado `a prova deste teorema. Comecamos


por provar a seguinte estimativa u
til:
Lema 7.2.9. Sejam A = [m; am , . . . , aq ] e B = [r; br , . . . , bs ] cilindros de com
r > q. Ent
ao:
Parq
,b
(A B) = (A)(B) q r .
pbr
Demonstrac
ao. Podemos escrever A B como uma uniao disjunta
[
AB =
[m; am , . . . , aq , xn+1 , . . . , xr1 , br , . . . , bs ],
x

sobre todos os x = (xn+1 , . . . , xr1 ) X rn1 . Ent


ao,
X
(A B) =
pam Pam ,am+1 Paq1 ,aq Paq ,xn+1 . . . Pxr1 ,br Pbr ,br+1 Pbs1 ,bs
x

= (A)

Paq ,xn+1 . . . Pxr1 ,br

1
(B).
pbr

. Portanto,
A soma nesta u
ltima expressao e igual a Parq
q ,br
/pbr ,
(A B) = (A)(B)Parq
q ,br
tal como afirmado.
Lema 7.2.10. Uma matriz estoc
astica P e irredutvel se, e somente se,
lim
n

n1
1X l
Pi,j = pj
n

para todo 1 i, j d.

l=0

(7.2.8)

Demonstrac
ao. Suponha que vale (7.2.8). Lembre que pj > 0 para todo j.
l
Ent
ao, dados quaisquer 1 i, j d, tem-se Pi,j
> 0 para infinitos valores de l.
Em particular, P e irredutvel.
Para provar a recproca, considere A = [0; i] e B = [1; j]. Pelo Lema 7.2.9:
n1
n1
1X l
1
1X
l
(A (B)) = (A)(B)
Pi,j .
n
pj
n
l=0

l=0

De acordo com o Exerccio 4.1.2, o lado esquerdo desta igualdade converge


quando n . Portanto,
Qi,j = lim
n

n1
1X l
Pi,j
n
l=0

existe para todo 1 i, j d. Considere a matriz Q = (Qi,j )i,j , ou seja,


Q = lim
n

n1
1X l
P .
n
l=0

(7.2.9)


CAPITULO 7. CORRELAC
OES

198

Usando o Lema 7.2.7(b) e passando ao limite quando n , obtemos que


d
X

pi Qi,j = pj

i=1

para todo 1 j d.

(7.2.10)

Observe tambem que, dado qualquer k 1,


P k Q = lim
n

n1
n1
1X l
1 X k+l
P
= lim
P = Q.
n n
n
l=0

(7.2.11)

l=0

Segue que Qi,j n


ao depende de i. De fato, suponha que existem r e s tais que
Qr,j < Qs,j . Claro que podemos escolher s de modo que o lado direito desta
desigualdade tenha o valor maximo possvel. Como P e irredutvel, existe k tal
k
que Ps,r
> 0. Logo, usando (7.2.11) seguido do Lema 7.2.7(a),
Qs,j =

d
X
i=1

d
X
k
k
Ps,i
)Qs,j = Qs,j ,
Ps,i
Qi,j < (
i=1

o que e uma contradicao. Portanto Qi,j n


ao depende de i. Seja Qj = Qi,j para
qualquer i. A propriedade (7.2.10) d
a que
pj =

d
X
i=1

d
X
pi ) = Q j ,
Qi,j pi = Qj (
i=1

para todo j. Isto termina a prova do lema.


Demonstrac
ao do Teorema 7.2.8. Suponhamos que e erg
odica. Seja A = [0; i]
e B = [1; j]. Pela Proposicao 4.1.4,
lim
n

n1
1X
(A l (B)) = (A)(B) = pi pj .
n

(7.2.12)

l=0

l
Por outro lado, pelo Lema 7.2.9, temos que (A l (B)) = pi Pi,j
. Substituindo
em (7.2.12) e cancelando pi em ambos os lados,

lim
n

n1
1X l
Pi,j = pj .
n
l=0

Note que j e arbitrario. Portanto, pelo Lema 7.2.10, isto prova que P e irredutvel.
Agora suponhamos que a matriz P e irredutvel. Queremos concluir que
e erg
odica. De acordo com o Corolario 4.1.5, basta provar que
lim
n

n1
1X
(A l (B)) = (A)(B)
n
l=0

(7.2.13)

199

7.2. DESLOCAMENTOS DE MARKOV

para quaisquer A e B na
algebra gerada pelos cilindros. Como os elementos desta
algebra sao as uni
oes finitas disjuntas de cilindros, e suficiente considerar o caso
em que A e B sao cilindros, digamos A = [m; am , . . . , aq ] e B = [r; br , . . . , bs ].
Observe tambem que a validade de (7.2.13) n
ao muda se substituirmos B por
alguma pre-imagem j (B). Portanto, n
ao e restricao supormos que r > q.
Ent
ao, pelo Lema 7.2.9,
n1
n1
1 1 X rq+l
1X
l
(A (B)) = (A)(B)
Paq ,br
n
pbr n
l=0

l=0

para todo n. Pelo Lema 7.2.10,


lim
n

n1
n1
1X l
1 X rq+l
Paq ,br = lim
Paq ,br = pbr .
n n
n
l=0

l=0

Isto prova a propriedade (7.2.13) para os cilindros A e B.

7.2.2

Mistura

Nesta secao caracterizamos os deslocamentos de Markov misturadores, em termos da respectiva matriz estoc
astica P . Continuamos supondo que p e uma
solucao normalizada de P p = p com entradas positivas e que e a respectiva
medida de Markov.
n
Dizemos que a matriz estoc
astica P e aperi
odica se existe n 1 tal que Pi,j
>
0 para todo 1 i, j d. Em outras palavras, P e aperiodica se tem alguma
potencia P n com entradas positivas. A relacao entre as nocoes de aperiodicidade
e irreducibilidade e analisada no Exerccio 7.2.6.
Teorema 7.2.11. O deslocamento de Markov (, ) e misturador se, e somente
se, a matriz P e aperi
odica.
Para a demonstracao do Teorema 7.2.11 precisamos do seguinte fato:
Lema 7.2.12. Uma matriz estoc
astica P e aperi
odica se, e somente se,
l
lim Pi,j
= pj
l

para todo 1 i, j d.

(7.2.14)

Demonstrac
ao. Como pj > 0 para todo j, por hipotese, e claro que (7.2.14)
l
implica que Pi,j
> 0 para todo i, j e todo l suficientemente grande.
Agora suponha que P e aperiodica. Ent
ao podemos aplicar o teorema de
Perron-Frobenius (Teorema 7.2.3) `a matriz A = P . Como p e autovetor de A
com entradas positivas, obtemos que = 1 e todos os demais autovalores de A
sao menores que 1 em valor absoluto. Pelo Lema 7.2.7(c), o hiperplano H dos
claro que
vetores (h1 , . . . , hd ) tais que h1 + + hd = 0 e invariante por A. E
H e transversal `
a direcao de p. Ent
ao a decomposicao
Rd = Rp H

(7.2.15)


CAPITULO 7. CORRELAC
OES

200

e invariante por A e a restricao de A ao hiperplano H e uma contracao, no


sentido de que o seu raio espectral e menor que 1. Segue deste fato que a
sequencia (Al )l converge para a projecao na primeira coordenada de (7.2.15),
ou seja, para a matriz B caracterizada por Bp = p e Bh = 0 para todo h H.
Em outras palavras, (P l )l converge para B . Observe que
Bi,j = pi

para todo 1 i, j d.

l
Portanto, limn Pi,j
= Bj,i = pj para todo i, j.

Demonstrac
ao do Teorema 7.2.11. Suponhamos que a medida e misturadora.
l
Seja A = [0; i] e B = [1; j]. Pelo Lema 7.2.9, temos que (A l (B)) = pi Pi,j
para todo l. Portanto,
l
pi lim Pi,j
= lim (A l (B)) = (A)(B) = pi pj .
l

l
Cancelando pi em ambos os lados, obtemos que liml Pi,j
= pj . De acordo com
o Lema 7.2.12, isto prova que P e aperiodica.
Agora suponhamos que a matriz P e aperiodica. Queremos concluir que
e misturadora. De acordo com o Lema 7.1.2, basta provar que

lim (A l (B)) = (A)(B)


l

(7.2.16)

para quaisquer A e B na algebra gerada pelos cilindros. Uma vez que os elementos desta
algebra sao as unioes finitas disjuntas de cilindros, bastar tratar o caso
em que A e B sao cilindros, digamos A = [m; am , . . . , aq ] e B = [r; br , . . . , bs ].
Pelo Lema 7.2.9,
(A l (B)) = (A)(B)

1 rq+l
P
pbr aq ,br

para todo l > q r. Ent


ao, usando o Lema 7.2.12,
1
lim P rq+l
pbr l aq ,br
1
= (A)(B)
lim P l
= (A)(B)
pbr l aq ,br

lim (A l (B)) = (A)(B)


l

Isto prova a propriedade (7.2.16) para os cilindros A e B.


Exemplo 7.2.13. No Exemplo 7.2.4 obtivemos diversos tipos de medidas de
Markov, dependendo da escolha do autovetor p. No primeiro, p = (p1 , p2 , 0, 0, 0)
e a medida est
a suportada em {1, 2}N. Uma vez removidos os smbolos
superfluos 3, 4, 5, a matriz estoc
astica se reduz a


1a
a
P =
.
b
1b

7.2. DESLOCAMENTOS DE MARKOV

201

Como esta matriz e irredutvel, a medida de Markov e misturadora. O segundo


tipo e inteiramente analogo. No terceiro caso p = (p1 , p2 , p3 , p4 , 0) e, removido
o smbolo superfluo 5, a matriz estoc
astica se reduz a

1a
a
0
0
b
1b
0
0
.
P =
0
0
1c
c
0
0
d
1d
Esta matriz n
ao e irredutvel e, portanto, as medidas de Markov que se obtem
neste caso n
ao sao erg
odicas (lembre tambem do Exemplo 7.2.6).
Exemplo 7.2.14. N
ao e difcil dar
sao aperiodicas:

0
1/2
P =
0
1/2

exemplos de matrizes irredutveis que n


ao

1/2 0 1/2
0
1/2 0
.
1/2 0 1/2
0
1/2 0

n
De fato, vemos que Pi,j
> 0 se, e somente se, n tem a mesma paridade que i j.
Note que

1/2 0 1/2 0
0 1/2 0 1/2

P2 =
1/2 0 1/2 0 .
0 1/2 0 1/2

O Exerccio 7.2.6 mostra que toda matriz irredutvel tem uma forma deste tipo.

7.2.3

Exerccios

7.2.1. Seja X = {1, . . . , d}, seja P = (Pi,j )i,j uma matriz estoc
astica e seja
p = (pi )i um vetor tal que P p = p. Mostre que a definicao

[m; am , . . . , an ] = pam Pam ,am+1 Pan1 ,an

se estende a uma medida na -algebra boreliana de = X N (ou = X Z ),


invariante pelo deslocamento : .

7.2.2. Prove que um deslocamento de Markov fracamente misturador e, de fato,


misturador.
7.2.3. Seja uma medida de Markov para deslocamento : X Z X Z , com
X = {1, . . . , d}. Isso garante que tambem e uma medida de Markov para a
inversa 1 : ?
7.2.4. Seja X um conjunto finito e = X Z (ou = X N ). Seja uma probabilidade em , invariante pelo deslocamento : . Dado k 0, dizemos
que tem mem
oria k se
([m k; amk , . . . , am1 , am ])
([m l; aml , . . . , am1 , am ])
=
([m l; aml , . . . , am1 ])
([m k; amk , . . . , am1 ])

202

CAPITULO 7. CORRELAC
OES

para todo l k, todo m e todo (an )n (por convencao, a igualdade vale


sempre que um dos denominadores for zero). Verifique que as medidas com
mem
oria zero sao as medidas de Bernoulli e as medidas com memoria um sao as
medidas de Markov. Mostre que toda medida com memoria k 2 e equivalente
=X
Z (ou
=X
N ), onde X
= Xk.
a uma medida de Markov no espaco
7.2.5. O objetivo e mostrar que o conjunto das medidas com memoria finita e
denso no espaco M1 () das medidas invariantes pelo deslocamento : .
Dada qualquer medida invariante e dado k 1, considere a funcao k definida
no conjunto de todos os cilindros por
k = para cilindros com comprimento menor ou igual a k;
para todo l k, todo m e todo (an )n ,
k ([m l; aml , . . . , am1 , am ])
([m k; amk , . . . , am1 , am ])
=
k ([m l; aml , . . . , am1 ])
([m k; amk , . . . , am1 ])
Mostre que k se estende a uma medida de probabilidade na -algebra de Borel
de , invariante pelo deslocamento e com memoria k. Mostre tambem que
limk k = na topologia fraca .
7.2.6. Seja P uma matriz estoc
astica irredutvel. O objetivo e mostrar que
existem 1 e uma particao de X em subconjuntos, tais que a restricao de
P a cada um destes subconjuntos e aperiodica. Para isso:
n
(1) Para cada i X, defina R(i) = {n 1 : Pi,i
> 0}. Mostre que R(i) e
fechado por adicao: se n1 , n2 R(i) ent
ao n1 + n2 R(i).

(2) Seja R N um conjunto fechado por adicao e seja 1 o maximo


divisor comum dos seus elementos. Mostre que existe m 1 tal que
R [m, ) = N [m, ).
(3) Mostre que o maximo divisor comum dos elementos de R(i) n
ao depende
de i X e que P e aperiodica se, e somente se, = 1.
(4) Suponha que 2. Encontre uma particao {Xr : 0 r < } de X tal
que a restricao de P a cada Xr e aperiodica.

7.3

Interc
ambios de intervalos

Por definicao, um interc


ambio de intervalos e uma bijecao do intervalo [0, 1) com
um n
umero finito de descontinuidades e cuja restricao a cada subintervalo de
continuidade e uma translacao. Veja na Figura 7.1 um exemplo com 4 subintervalos de continuidade. Para fixar ideias, sempre suporemos que a transformacao
e contnua `
a direita, ou seja, que os subintervalos de continuidade sao fechados
a esquerda e abertos `
`
a direita.
Como consequencia direta da definicao, todo intercambio de intervalo preserva a medida de Lebesgue em [0, 1). Estas transformacoes exibem uma dinamica


7.3. INTERCAMBIOS
DE INTERVALOS

203

f (T )
f (C)
f (A)
f (G)
T

Figura 7.1: Intercambio de intervalos


muito rica e tem conex
oes importantes com diversos outros sistemas, tais como
os bilhares em mesas poligonais, os fluxos conservativos em superfcies e os fluxos
de Teichm
uller. Por exemplo, a construcao que esbocamos a seguir mostra que
os intercambios de intervalos aparecem naturalmente como transformacoes de
Poincare de campos de vetores conservativos em superfcies.
Exemplo 7.3.1. Seja S uma superfcie orient
avel e seja uma forma de area
em S, ou seja, uma 2-forma diferencial que nunca se anula. Podemos associar a
todo campo de vetores X uma 1-forma diferencial , definida por
x (v) = x (X(x), v)

para cada vetor v Tx S.

Observe que X e tem os mesmos zeros e que nos demais pontos o n


ucleo
de coincide a direcao do campo de vetores. A 1-forma permite definir um
comprimento transversal de curvas c : [a, b] S, da seguinte forma:
(c) =

c(t) (c(t))

dt.

Note que as trajetorias do fluxo tem comprimento transversal nulo mas para
curvas transversais ao fluxo, e equivalente `a medida de Lebesgue na curva.
Pode mostrar-se que a 1-forma e fechada se, e somente se, X preserva area
(veja o Exerccio 7.3.1). Ent
ao, usando o teorema de Green, as transformacoes
de Poincare do fluxo preservam o comprimento transversal. Com uma hipotese
adicional sobre os zeros de X, a transformacao f : de primeiro retorno
a uma secao transversal qualquer est
a definida e e contnua exceto num n
umero
finito de pontos da secao . Ent
ao, parametrizando pelo comprimento transversal de arco, f e um intercambio de intervalos.
Cada intercambio de intervalos fica determinado por dois ingredientes. O
primeiro deles, de natureza combinatoria, diz respeito ao n
umero de subintervalos de continuidade e `
a ordem destes subintervalos e de suas imagens dentro do
intervalo [0, 1). Isso pode ser informado da seguinte forma: atribumos a cada
subintervalo um rotulo (uma letra, por exemplo), atribumos `a sua imagem o


CAPITULO 7. CORRELAC
OES

204

mesmo rotulo e listamos esses rotulos em duas linhas horizontais, na ordem


respectiva. Por exemplo, no caso da Figura 7.1, obtemos


T C A G
=
.
G A C T
Note que a escolha dos rotulos e arbitraria. Denotamos por A, e chamamos de
alfabeto, o conjunto dos rotulos escolhidos.
O segundo ingrediente, de natureza metrica, diz respeito aos comprimentos
dos subintervalos. Ele pode ser informado por meio de um vetor de coordenadas
positivas, indexadas pelos rotulos escolhidos e que determinam o comprimento
do intervalo respectivo (e tambem da sua imagem). No caso da Figura 7.1 este
vetor de comprimentos tem a forma
= (T , C , A , G ).
A soma das coordenadas do vetor de comprimentos e sempre igual a 1.
Ent
ao, o intercambio de intervalos f : [0, 1) [0, 1) associada a cada par
(, ) fica definida do seguinte modo. Para cada rotulo A, represente
por I o respectivo subintervalo e defina w = v1 v0 , onde v0 e a soma
dos comprimentos correspondentes aos rotulos `a esquerda de na linha
superior de e v1 e a soma dos comprimentos correspondentes aos rotulos
`
a esquerda de na linha inferior de . Ent
ao
f (x) = x + w

para todo x I .

O vetor w = (w )A e chamado vetor de translac


oes. Observe que, para cada
fixado, o vetor de translacoes e uma funcao linear do vetor de comprimentos
= ( )A .

f (A)

f (B)
A

Figura 7.2: Rotacao vista como intercambio de dois intervalos


Exemplo 7.3.2. O caso mais simples de intercambio de intervalos ocorre quando temos apenas dois subintervalos de continuidade. Veja a Figura 7.2. Escolhendo o alfabeto A = {A, B}, temos



A B
x + B
para x IA
=
e f (x) =
B A
x A = x + B 1 para x IB .


7.3. INTERCAMBIOS
DE INTERVALOS

205

Esta transformacao corresponde precisamente `a rotacao RA , se identificarmos


[0, 1) com o crculo S 1 do modo natural. Neste sentido, os intercambios de
intervalos sao uma generalizacao das rotacoes do crculo.

7.3.1

Minimalidade e ergodicidade

Como vimos anteriormente, uma rotacao R do crculo e minimal se, e somente


se, e irracional. Alem disso, nesse caso R tambem e unicamente erg
odica.
Dado que quase todo n
umero e irracional, isto significa que minimalidade e
unicidade erg
odica sao tpicas na famlia das rotacoes. Nesta secao vamos discutir como estes fatos se estendem ao contexto mais amplo dos intercambios de
intervalos.
Comecamos por uma observacao que n
ao tem analogo no caso das rotacoes.
Dizemos que uma combinatoria e redutvel se existe alguma posicao tal que
os rotulos `
a esquerda dessa posicao nas duas linhas de sao exatamente os
mesmos. Por exemplo,


B X O L F D
=
X O B F D L
e redutvel, pois os rotulos `
a esquerda da quarta posicao sao os mesmos nas duas
linhas: B, O e X. Como consequencia, qualquer que seja o vetor de comprimentos , o intercambio de intervalos f definido por (, ) deixa o subintervalo
IB IO IX invariante. Em particular, f n
ao pode ser minimal e nem sequer
transitivo. No que segue sempre suporemos que a combinatoria e irredutvel.
Uma conjectura natural e que o intercambio de intervalos seja minimal sempre que o vetor de comprimentos = ( )A e racionalmente independente,
ou seja, se
X
n 6= 0
A

para todo vetor (n )A n


ao nulo com coordenadas inteiras. Isto e verdade
mas, de fato, a hip
otese de independencia racional e demasiado forte: vamos
apresentar uma condicao um pouco mais geral que ainda implica minimalidade.
Denotemos por I o extremo inferior de cada subintervalo I . Dizemos que
um par (, ) satisfaz a condic
ao de Keane se as trajetorias destes pontos sao
disjuntas:
f m (I ) 6= I

para todo m 1 e quaisquer , A com I 6= 0 (7.3.1)

(note que sempre existem


e tais que f (I ) = 0 = I ). Deixamos a
demonstracao do seguinte lema ao cuidado do leitor (Exerccio 7.3.2).
Lema 7.3.3.

(1) Se (, ) satisfaz a condic


ao de Keane ent
ao e irredutvel.

(2) Se e irredutvel e e racionalmente independente ent


ao (, ) satisfaz
a condic
ao de Keane.


CAPITULO 7. CORRELAC
OES

206

Como o subconjunto dos vetores racionalmente independentes tem medida


de Lebesgue total, obtemos que a condicao de Keane e satisfeita para quase
todo vetor de comprimentos , sempre que e irredutvel.
Exemplo 7.3.4. No caso de dois subintervalos (lembre o Exemplo 7.3.2), o
intercambio de intervalos tem a forma f m (x) = x + mB modulo n
umeros
inteiros. Ent
ao, a condicao de Keane significa que
mB 6= A + n

A + mB 6= A + n

claro que isto acontece se, e somente se, o


para todo m N e todo n Z. E
vetor (A , B ) e racionalmente independente.
Exemplo 7.3.5. Para intercambios de 3 ou mais intervalos a condicao de Keane
e estritamente mais fraca do que a independencia racional do vetor de comprimentos. Considere, por exemplo,


A B C
=
.
C A B
Ent
ao f m (x) = x + mC modulo n
umeros inteiros e, portanto, a condicao de
Keane significa que os n
umeros
{mC , A + mC , A + B + mC } e disjunto de

para todo m N e n Z. De modo equivalente,


pC
/ {q, A + q}

{A + n, A + B + n}

para todo p Z e q Z.

Isto pode valer mesmo quando (A , B , C ) e racionalmente dependente.


O seguinte resultado foi obtido por Michael Keane [Kea75]:
Teorema 7.3.6 (Keane). Se (, ) satisfaz a condic
ao de Keane ent
ao o interc
ambio de intervalos f e minimal.
Exemplo 7.3.7. A condicao de Keane n
ao e necessaria para a minimalidade.
Por exemplo, considere o intercambio de intervalos definido por (, ), onde


A B C D
=
D C B A
A = C , B = D e A /B = C /D e irracional. Ent
ao (, ) n
ao satisfaz a
condicao de Keane e, no entanto, f e minimal.
Conforme observamos anteriormente, toda rotacao minimal e tambem unicamente erg
odica. Isto ainda e valido para intercambios de 3 intervalos, mas
n
ao no caso geral. De fato, Keane deu um exemplo de um intercambio de 4
intervalos onde e irredutvel, e racionalmente independente e, no entanto,
f tem duas probabilidades erg
odicas.
Keane conjecturou que, assim mesmo, deveria ser verdade que quase todo
intercambio de intervalos e unicamente erg
odico. Um resultado fundamental,
obtido independentemente por Howard Masur [Mas82] e William Veech [Vee82],
prova que esta conjectura e verdadeira:


7.3. INTERCAMBIOS
DE INTERVALOS

207

Teorema 7.3.8 (Masur, Veech). Suponha que e irredutvel. Ent


ao, para
Lebesgue quase todo vetor de comprimentos , o interc
ambio de intervalos definido por (, ) e unicamente erg
odico.
Um pouco antes, Michael Keane and Gerard Rauzy [KR80] haviam provado
que unicidade erg
odica vale para um conjunto residual (segunda categoria de
Baire) de vetores de comprimento sempre que a combinatoria e irredutvel.

7.3.2

Mistura

Os intercambios de intervalos fornecem muitos exemplos de sistemas unicamente


erg
odicos e fracamente misturadores que n
ao sao (fortemente) misturadores.
De fato, como acabamos de comentar, pelo teorema de Masur-Veech (Teorema 7.3.8) quase todo intercambio de intervalos e unicamente erg
odico. Outro
teorema profundo, devido a Artur Avila e Giovanni Forni [AF07], afirma que,
se excetuarmos as rotacoes (mais precisamente: os intercambios de intervalos
com uma u
nica descontinuidade), quase todo o intercambio de intervalos e fracamente misturador. A versao topologica deste fato havia sido provada por
Arnaldo Nogueira e Donald Rudolph [NR97].
Por outro lado, um resultado de Anatole Katok [Kat80] que discutiremos a
seguir afirma que intercambios de intervalo nunca sao misturadores:
Teorema 7.3.9. Seja f : [0, 1) [0, 1) um interc
ambio de intervalos e seja
uma probabilidade invariante. Ent
ao (f, ) n
ao e misturador.
claro que podemos supor que e erg
Demonstrac
ao. E
odica, pois caso contrario
a conclusao e
obvia. Se tem algum atomo ent
ao ela est
a suportada numa
orbita periodica e, portanto, n
ao e misturadora. Logo, podemos supor que e
n
ao atomica. Denote por m a medida de Lebesgue no intervalo e considere a
aplicacao
h : [0, 1) [0, 1), h(x) = ([0, x]).
Ent
ao h e um homeomorfismo tal que h = m. Consequentemente, a aplicacao
g = h f h1 : [0, 1) [0, 1) tem um n
umero finito de pontos de descontinuidade e preserva a medida de Lebesgue. Em particular, a restricao de g a
cada intervalo de continuidade e uma translacao. Portanto, g tambem e um in claro que (f, ) e misturador se, e somente se, (g, m)
tercambio de intervalos. E
e misturador. Portanto, para provar o Teorema 7.3.9 n
ao e restricao supor que
e a medida de Lebesgue m. Faremos isso de ora em diante.
Nosso objetivo e achar um conjunto mensuravel X tal que m(X f n (X))
n
ao converge para m(X)2 quando n . Seja d = #A.
Lema 7.3.10. Todo intervalo J = [a, b) contido em algum I admite uma
partic
ao {J1 , . . . , Js } em n
ao mais que d + 2 subintervalos da forma Ji = [ai , bi )
e admite n
umeros naturais t1 , . . . , ts 1 tais que
(a) f n (Ji ) J = para todo 0 < n < ti e 1 i s;
ao para todo 1 i s;
(b) f ti | Ji e uma translac


CAPITULO 7. CORRELAC
OES

208

ao de J;
(c) {f t1 (J1 ), . . . , f ts (Js )} e uma partic
(d) os intervalos f n (Ji ), 1 i s, 0 n < ti s
ao disjuntos dois-a-dois;
S
S
S
ti 1 n
s
f (Ji ).
(e) n=0 f n (J) = i=1 n=0

Demonstrac
ao. Seja B o conjunto formado pelos pontos extremos a, b de J
juntamente com os pontos I , A excetuada a origem. Ent
ao #B d + 1.
Seja BJ J o conjunto dos pontos x J para os quais existe m 1 tal que
f m (x) B e f n (x)
/ J para todo 0 < n < m. O fato de que f e injetiva,
juntamente com a definicao de m, implica que a aplicacao
BJ B,

x 7 f m (x)

e injetiva. Em particular, #BJ #B. Considere a particao de J em subintervalos Ji = [ai , bi ) com extremos ai , bi no conjunto BJ {a, b}. Esta particao
tem no maximo d + 2 elementos. Pelo teorema de recorrencia de Poincare, para
cada i existe ti 1 tal que f ti (Ji ) intersecta J. Tome ti mnimo com esta
propriedade. O item (a) do lema e uma consequencia imediata. Pela definicao
de BJ , a restricao de f ti ao itervalo Ji e uma translacao, tal como afirmado no
item (b), e a sua imagem est
a contida em J. Alem disso, as imagens f ti (Ji ),
1 i s sao disjuntas duas-a-duas, uma vez que f e injetiva e os ti sao os
tempos de primeiro retorno a J. Em particular,
s
X

ti

m(f (Ji )) =

i=1

s
X

m(Ji ) = m(J)

i=1

e portanto si=1 f ti (Ji ) = J. Isto prova o item (c). O item (d) tambem segue
diretamente do fato de que f e injetiva e os ti sao os tempos de primeiro retorno
a J. Finalmente, o item (e) e uma consequencia direta do item (c).
Considere um intervalo J qualquer contido em algum I . Por ergodicidade, o
n
conjunto invariante
n=0 f (J) tem medida total. Pelo item (e) do Lema 7.3.10,
este conjunto e uma uniao finita de intervalos fechados `a esquerda e abertos `a
direita. Portanto,

s t[
i 1
[
[
f n (J) =
f n (Ji ) = I
n=0

i=1 n=0

Logo, pelo item (d) do lema, a famlia PJ = {f n (Ji ) : 1 i s e 0 n < ti } e


uma particao de I.
Lema 7.3.11. Dados > 0 e N 1 podemos escolher o intervalo J de tal
forma que diam PJ < e ti N para todo i.
claro que diam f n (Ji ) = diam Ji diam J para todo i e todo
Demonstrac
ao. E
n. Logo, diam PJ < desde que escolhamos J com diametro menor que . Para
obter a segunda propriedade no enunciado, tome qualquer ponto x I tal que
f n (x) 6= I para todo 0 n < N e todo A. Afirmamos que f n (x) 6= x


7.3. INTERCAMBIOS
DE INTERVALOS

209

para todo 0 < n < N . Caso contr


ario, como f n e uma translacao na vizinhanca
n
de x, teramos f (y) = y para todo ponto y nessa vizinhanca, contradizendo a
hipotese de que (f, m) e erg
odica. Isto prova a nossa afirmacao. Agora basta
tomar J = [x, x + ) com < min0<n<N d(x, f n (x)) para garantir que ti N
para todo i.
Lema 7.3.12. Para cada 1 i s existe si d + 2 e existem n
umeros
algebra
naturais {ti,1 , . . . , ti,si } tais que ti,j ti e, dado qualquer conjunto A na
AJ gerada por PJ , existe ti,j tal que
m(A f ti,j (A))

1
m(A).
(d + 2)2

(7.3.2)

Demonstrac
ao. Aplicando o Lema 7.3.10 a cada um dos intervalos Ji , 1 i s
obtemos si d + 2, uma particao {Ji,j : 1 j si } do intervalo Ji e n
umeros
naturais ti,j tais que cada ti,j e o tempo de primeiro retorno dos pontos de Ji,j
claro que ti,j ti , j
a Ji . E
a que ti e o tempo de primeiro retorno de qualquer
ponto de Ji ao intervalo J. O fato de que Ji,j f ti,j (Ji ) implica que
f n (Ji ) =

si
[

j=1

f n (Ji,j )

si
[

j=1

f ti,j (f n (Ji )) para todo n 0.

Como a
algebra AJ est
a formada pelas unioes disjuntas finitas dos intervalos
f n (Ji ), 0 n < ti , segue que
A

si
s [
[

f ti,j (A)

i=1 j=1

para todo A AJ .

Ps Psi
Em particular, m(A) i=1 j=1
m(A f ti,j (A)). Lembrando que s d + 2
e si d + 2 para todo i, isto implica (7.3.2).
Estamos prontos para concluir a prova do Teorema 7.3.9. Para isso, fixemos
um conjunto mensuravel X [0, 1) com
0 < m(X) <

1
.
4(d + 2)2

Pelo Lema 7.3.11, dado qualquer N 1 podemos encontrar um intervalo J


[0, 1) tal que todos os tempos de retorno ti N e existe algum A AJ tal que
m(XA) <

1
m(X)2 .
4

Aplicando o Lema 7.3.12, obtemos que existe ti,j ti N tal que:


m(X f tij (X)) m(A f tij (A)) 2m(XA)
1
1
m(A) m(X)2

(d + 2)2
2

(7.3.3)


CAPITULO 7. CORRELAC
OES

210

A relacao (7.3.3) implica que m(A) (3/4)m(X). Portanto,


1
1
3
m(X) m(X)2
4 (d + 2)2
2
1
3m(X)2 m(X)2 2m(X)2
2
Isto prova que lim supn m(X f n (X)) 2m(X)2 e, portanto, o sistema (f, m)
n
ao e misturador.
m(X f tij (X))

7.3.3

Exerccios

7.3.1. Seja uma forma de area numa superfcie. Seja X um campo de


vetores diferenci
avel em S e seja a 1-forma diferencial definida em S por
x = x (X(x), ). Mostre que e fechada se, e somente se, X preserva area.
7.3.2. Prove o Lema 7.3.3.

7.3.3. Mostre que se (, ) satisfaz a condicao de Keane ent


ao f n
ao tem pontos
periodicos. [Observacao: Este e um passo na demonstracao do Teorema 7.3.6.]
7.3.4. Seja f : [0, 1) [0, 1) uma transformacao de intercambio de intervalos
irredutvel e seja a (0, 1) o maior dos pontos de descontinuidade de f ou
f 1 . A renormalizac
ao de Rauzy-Veech R(f ) : [0, 1) [0, 1) e definida por
R(f )(x) = g(ax)/a, onde g e a transformacao de primeiro retorno de f ao
intervalo [0, a). Verifique que R(f ) e transformacao de intercambio de intervalos,
com o mesmo n
umero de subintervalos de descontinuidade que f , ou menor. Se
f e descrita pelos dados (, ), como podemos descrever R(f )?
7.3.5. Dado d 2 e dada uma bijecao : N N sem pontos periodicos,
considere a transformacao f : [0, 1] [0, 1] tal que cada f (x) e obtido permutando os dgitos da expansaoP
de x na base d, conforme determinado por

n
. MaisPprecisamente, se x =
com an {0, . . . , d 1} ent
ao
n=1 an d

n
f (x) = n=1 a(n) d . Mostre que f preserva a medida de Lebesgue m no
intervalo e que (f, m) e misturador.

7.4

Decaimento de correlac
oes

Nesta secao discutimos a velocidade de decaimento das sequencias de correlacoes


Cn (, ), num sistema misturador. Relacionado com o fato de que estamos lidando com sistemas determinsticos, n
ao seria realista esperar estimativas interessantes que valham para funcoes arbitrarias. Mas, como veremos, tais estimativas existem em muitos casos importantes, se restringirmos , a subconjuntos
adequados de funcoes. Dado que as correlacoes (, ) 7 Cn (, ) sao funcoes
bilineares, e natural considerar subconjuntos que sao subespacos vetoriais.
Dizemos que (f, ) tem decaimento exponencial de correlac
oes num dado
espaco vetorial V se existe < 1 e para todo , V existe A(, ) > 0 tal
que
|Cn (, )| A(, )n para todo n 1.
(7.4.1)


7.4. DECAIMENTO DE CORRELAC
OES

211

Temos nocoes similares em que a exponencial n e substituda por qualquer


outra sequencia convergindo para zero.
Para ilustrar a teoria vamos analisar a quest
ao do decaimento de correlacoes
no contexto dos deslocamentos de Markov unilaterais. Isso nos permitira introduzir diversas ideias que serao u
teis posteriormente em situacoes mais gerais.
Seja f : M M o deslocamento em M = X N , onde X = {1, . . . , d} e
um conjunto finito. Seja P = (Pi,j )i,j uma matriz estoc
astica aperiodica e seja
p = (pi )i o autovetor positivo de P , normalizado por p1 + + pd = 1. Seja
a medida de Markov definida em M por (7.2.2).
Considere L = G1 P G, onde G e a matriz diagonal cujas entradas sao
p1 , . . . , pd . As entradas de L sao dadas por:
Li,j =

pj
Pj,i
pi

para cada 1 i, j d.

Lembre que denotamos u = (1, . . . , 1) e H = {(h1 , . . . , hd ) : h1 + + hd = 0}.


Seja
V = {(v1 , . . . , vd ) : p1 v1 + + pd vd = 0}.
Ent
ao G(u) = p e G(V ) = H. Lembrando (7.2.15), segue que a decomposicao
Rd = Ru V

(7.4.2)

e invariante por L e todos os autovalores da restricao de L a V sao menores que


1 em valor absoluto. Dizemos que o opeador L tem lacuna espectral : o maior
autovalor e simples e o restante do espectro est
a contido num disco fechado com
raio estritamente menor.
Chamamos operador de transferencia `a aplicacao linear L que a cada funcao
: M R associa a funcao L : M R definida por
L(x1 , . . . , xn , . . . , ) =

d
X

Lx1 ,x0 (x0 , x1 , . . . , xn , . . . ).

(7.4.3)

x0 =1

Este operador e dual do operador de Koopman Uf , no seguinte sentido:


Z
Z
(L) d = (Uf ) d
(7.4.4)
para quaisquer funcoes mensuraveis limitadas , . Para provar este fato basta
considerar o caso em que e sao funcoes localmente constantes, isto e, funcoes
que dependem apenas de um n
umero finito de coordenadas. Isto e porque toda
funcao mensuravel limitada e limite uniforme de alguma sequencia de funcoes
localmente constantes. Ent
ao, considere funcoes e que dependem apenas
das primeiras n coordenadas. Pela definicao da medida de Markov,
Z
X
pa1 Pa1 ,a2 Pan1 ,an (a1 , . . . , an )L(a1 , . . . , an ).
(L) d =
a1 ,...,an


CAPITULO 7. CORRELAC
OES

212

Usando a definicao do operador de transferencia, o lado direito desta expressao


e igual a
X
pa0 Pa0 ,a1 Pa1 ,a2 Pan1 ,an (a1 , . . . , an )(a0 , a1 , . . . , an ).
a0 ,a1 ,...,an

Observe que (a1 , . . . , an ) = Uf (a0 , a1 , . . . , an ). Portanto, usando


R mais uma
vez a definicao da medida de Markov, esta u
tima expressao e igual a (Uf ) d.
Isto prova a propriedade de dualidade (7.4.4).
Como consequencia, podemos escrever a sequencia de correlacoes em termos
dos iterados do operador de transferencia:
Z
Z
Z
Z
Z

n
n
Cn (, ) = (Uf ) d d = L d d. (7.4.5)

P
A propriedade Lu = u significa que j Li,j = 1 para todo j. Isto tem a seguinte
consequencia u
til:
sup |L| sup || para todo .
(7.4.6)
Tomando 1 em (7.4.4) obtemos o seguinte caso particular, que tambem sera
u
til a seguir:
Z
Z
L d =

d para todo .

(7.4.7)

Agora denotemos por E0 o conjunto das funcoes que dependem apenas da


primeira coordenada. A aplicacao 7 ((1), . . . , (d)) e um isomorfismo entre
E0 e o espaco euclideano Rd . Alem disso, a definicao
L(x1 ) =

d
X

Lx1 ,x0 (x0 )

x0 =1

mostra que a restricao do operador de transferencia a E0 corresponde precid


samente ao operador L : Rd Rd . Note ainda
R que o hiperplano V R
corresponde ao subconjunto dos E0 tais que d = 0. Considere em E0 a
norma definida por kk0 = sup ||.
Fixe qualquer n
umero entre 1 e o raio espectral de L restrito a V . Toda
funcao E0 pode ser escrita:
Z
Z
= c + v com c = d Ru e v = d V.
Ent
ao a propriedade de lacuna espectral implica que existe B > 1 tal que
Z


sup Ln d Bkk0 n para todo n 1.
(7.4.8)

Usando (7.4.5), segue que

|Cn (, )| Bkk0 kk0 n

para todo n 1.


7.4. DECAIMENTO DE CORRELAC
OES

213

Desta forma, provamos que o deslocamento de Markov tem decaimento exponencial de correlac
oes em E0 .
Com um pouco mais de esforco, e possvel melhorar este resultado, estendendo a conclusao a um espaco muito maior de funcoes. Considere em M a
distancia definida por

d (xn )n , (yn )n = 2N (x,y) onde N (x, y) = min{n 0 : xn 6= yn }.

Fixe > 0 qualquer e denote por E o conjunto das funcoes que sao -Holder,
isto e, tais que
K () = sup


 |(x) (y)|
: x 6= y
e finito.

d(x, y)

claro que E contem todas as funcoes localmente constantes. Afirmamos:


E
Teorema 7.4.1. O deslocamento de Markov (f, ) tem decaimento exponencial
de correlac
oes no espaco E das func
oes -H
older, qualquer que seja > 0.
Observe que L(E) E. A funcao kk = sup || + K () e uma norma
completa em E (Exerccio 7.4.1) e o operador linear L : E E e contnuo
relativamente a esta norma. Um modo de provar o teorema e mostrando que
este operador tem lacuna espectral, com decomposicao invariante
Z
E = Ru { E : d = 0}.
Feito isso, exatamente o mesmo argumento que utilizamos anteriormente para
E0 prova o decaimento exponencial de correlacoes em E. N
ao apresentaremos os
detalhes aqui (mas voltaremos a este tema, num contexo muito mais geral, ao
final da Secao 12.3). Em vez disso, vamos dar uma prova direta de que (7.4.8)
pode ser estendida ao espaco E.
Dado E e dado x = (x1 , . . . , xn , . . . ) M , temos
Lk (x) =

d
X

a1 ,...,ak =1

Lx1 ,ak La2 ,a1 (a1 , . . . , ak , x1 , . . . , xn , . . . )

para todo k 1. Ent


ao, dado y = (y1 , . . . , yn , . . . ) com x1 = y1 = j,
|Lk (x) Lk (y)|
Usando a propriedade

Pd

i=1

d
X

a1 ,...,ak =1

Lj,ak La2 ,a1 K ()2k d(x, y) .

Lj,i = 1, conclumos que

|Lk (x) Lk (y)| K ()2k d(x, y) K ()2k .

(7.4.9)

Dada qualquer funcao , denotamos por a funcao que depende apenas da


primeira coordenada e coincide com a media de em cada cilindro [0; i]:
Z
1
(i) =
d.
pi [0;i]


CAPITULO 7. CORRELAC
OES

214
claro que sup || sup || e
E
implica que

d =

sup |Lk (Lk )| K ()2k

d. A desigualdade (7.4.9)
para todo k 1.

Ent
ao, usando a propriedade (7.4.6),
sup |Lk+l Ll (Lk )| K ()2k

para todo k, l 1.

(7.4.10)

Alem disso, as propriedades (7.4.6) e (7.4.7) implicam que


Z
Z
sup |(Lk )| sup || e
(Lk ) d = d.
Portanto a propriedade (7.4.8) d
a que
Z


sup Ll (Lk ) d B sup ||l

para todo l 1.

Somando (7.4.10) e (7.4.11), obtemos que


Z
k+l


sup L d K ()2k + B sup ||l

(7.4.11)

para todo k, l 1.

Fixe < 1 tal que 2 max{2 , }. Ent


ao a desigualdade anterior d
a
Z


sup Ln d Bkk n1 para todo n.
(7.4.12)

Agora o Teorema 7.4.1 segue do mesmo argumento que usamos anteriormente


para E0 , com (7.4.12) no lugar de (7.4.8).

7.4.1

Exerccios

7.4.1. Mostre que kk = sup ||+ K () define uma norma completa no espaco
E das funcoes -H
older e o operador de transferencia L e contnuo relativamente
a esta norma.
7.4.2. Seja f : M M um difeomorfismo local numa variedade compacta M
e seja d 2 o seu grau. Suponha que existe > 1 tal que kDf (x)vk kvk
para todo x M e todo vector v tangente a M no ponto x. Fixe > 0 e seja
E o espaco das funcoes -Holder : M R. Para cada E, defina
L : M R,

L(y) =

1
d

(x).

xf 1 (y)

(1) Mostre que sup L sup e inf L inf e K (L) K () para


toda E.
(2) Conclua que L : E E e um operador linear contnuo (relativamente `a
norma definida no Exerccio 7.4.1) com kLk = 1.


7.4. DECAIMENTO DE CORRELAC
OES

215

(3) Mostre que, para toda E, a sequencia (Ln )n converge para uma
constante R quando n . Mais ainda, existe C > 0 tal que
kLn k C n kk para todo n e todo E.
(4) Conclua que o operador L : E E tem a propriedade da lacuna espectral.
(5) Mostre que a aplicacao 7 se estende a uma medida de probabilidade
boreliana em M (lembre do Teorema A.3.12).

216

CAPITULO 7. CORRELAC
OES

Captulo 8

Sistemas Equivalentes
Neste captulo discutimos o problema da isomorfismo em Teoria Erg
odica: quando e que dois sistemas (f, ) e (g, ) devem ser considerados o mesmo e como
decidir, para sistemas dados, se eles est
ao nessas condicoes?
A nocao fundamental e chamada equivalencia erg
odica: dois sistemas sao
ergodicamente equivalentes se, restritas a subconjuntos com medida total, as
respectivas transformacoes sao conjugadas por uma aplicacao invertvel que preserva as medidas invariantes. Tal aplicacao permite traduzir as propriedades de
qualquer dos sistemas para o outro sistema.
Embora esta seja uma nocao natural de isomorfismo no contexto da Teoria
Erg
odica, ela n
ao e f
acil de manejar. Em geral, dados dois sistemas equivalentes,
au
nica forma de provar esse fato e exibindo a equivalencia de forma mais ou
menos explcita. Por outro lado, o modo mais usual de mostrar que dois sistemas
n
ao sao equivalentes e encontrando alguma propriedade que est
a presente num
deles mas n
ao no outro.
Neste contexto, e muito u
til considerar uma nocao mais fraca, chamada de
equivalencia espectral : dois sistemas sao espectralmente equivalentes se os seus
operadores de Koopman sao conjugados por algum operador unit
ario. Dois
sistemas ergodicamente equivalentes sao, necessariamente, espectralmente equivalentes, mas a recproca n
ao e verdadeira.
A ideia de equivalencia espectral conduz a uma famlia rica de invariantes,
ligados ao espectro do operador de Koopman, que precisam ser iguais nos dois
sistemas para que eles possam ser equivalentes e que, portanto, podem ser usados
para excluir essa possibilidade. Outros invariantes, de natureza nao espectral,
tem igualmente um papel fundamental. O mais importante de todos, a entropia,
sera tratado no Captulo 9.
As nocoes de equivalencia erg
odica e equivalencia espectral, e as relacoes
entre elas, serao estudadas nas Secoes 8.1 e 8.2, respectivamente. Nas Secoes 8.3
e 8.4 estudaremos duas classes de sistemas com caractersticas dinamicas opostas: as transformacoes com espectro discreto, que incluem as translacoes erg
odicas em grupos abelianos compactos, e as transformacoes com espectro de
Lebesgue, que tem os deslocamentos de Bernoulli como principal exemplo.
217

218

CAPITULO 8. SISTEMAS EQUIVALENTES

Estas duas classes de sistemas, bem como outras que introduzimos anteriormente (sistemas erg
odicos, fortemente misturadores, fracamente misturadores)
sao invariantes de equivalencia espectral e, portanto, tambem de equivalencia
erg
odica. Finalmente, na Secao 8.5 discutiremos uma terceira nocao de equivalencia, que chamamos isomorfismo erg
odico, especialmente no contexto dos
espacos de Lebesgue.

8.1

Equival
encia erg
odica

Sejam e probabilidades invariantes por transformacoes f : M M e


g : N N , respectivamente. Dizemos que os sistemas (f, ) e (g, ) sao
ergodicamente equivalentes se podemos escolher conjuntos mensuraveis X M
e Y N com (M \X) = 0 e (N \Y ) = 0, e uma bijecao mensuravel : X Y
com inversa mensuravel, de tal forma que
=

f = g .

Deixamos a cargo do leitor verificar que esta e, de fato, uma relacao de equivalencia, ou seja, uma relacao reflexiva, simetrica e transitiva.
Observe tambem que os conjuntos X e Y na definicao podem ser escolhidos
n
invariantes por f e g, respectivamente. De fato, considere X0 = +
(X).
n=0 f
claro da definicao que X0 X e f (X0 ) X0 . Como (X) = 1 e a intersecao
E
n
e enumer
avel, temos que (X0 ) = 1. Analogamente, Y0 = +
(Y ) e subn=0 g
conjunto mensuravel de Y tal que (Y0 ) = 1 e g(Y0 ) Y0 . Alem disso, por
construcao, Y0 = (X0 ). Portanto, a restricao de a X0 ainda e uma bijecao
sobre Y0 .
Exemplo 8.1.1. Considere f : [0, 1] [0, 1] definida por f (x) = 10x [10x].
Como vimos anteriormente (Secao 1.3.1) esta transformacao preserva a medida
de Lebesgue m em [0, 1]. Escrevendo um n
umero x [0, 1] em sua expansao decimal x = 0, a0 a1 a2 . . . , a transformacao f corresponde simplesmente a deslocar
os dgitos de x uma unidade para a esquerda. Isso nos motiva a considerar:
: {0, 1, . . . , 9}N [0, 1],

 X
(an )n =

an
= 0, a0 a1 a2 . . . .
n+1
10
n=0

claro que e sobrejetiva. Por outro lado, ela n


E
ao e injetiva, uma vez
que certos n
umeros reais possuem mais que uma expansao decimal: por exemplo, 0, 1000000 = 0, 099999 . . . . De fato, isso acontece somente se o n
umero
admite uma expansao decimal finita, ou seja, tal que todos os dgitos a partir de certa ordem sao nulos. Esses n
umeros formam um conjunto enumeravel
e, portanto, sao irrelevantes do ponto de vista da medida de Lebesgue. Mais
precisamente, consideremos o conjunto X {0, 1, . . . , 9}N das sequencias com
um n
umero infinito de smbolos diferentes de zero e o conjunto Y [0, 1] dos
n
umeros cuja expansao decimal e infinita (logo, u
nica). Ent
ao a restricao de
a X e uma bijecao sobre Y .

8.1. EQUIVALENCIA
ERGODICA

219

f
E
acil verificar que tanto quanto a sua inversa sao mensuraveis: use o
fato de que a imagem da intersecao de X com cada cilindro [0; a0 , . . . , am1 ]
e a intersecao de Y com um intervalo de comprimento 10m . Esta observacao
tambem mostra que m = , onde representa a medida de Bernoulli em
{0, 1, . . . , 9}N que d
a igual peso a todos os dgitos. Alem disso, se denotarmos
por o deslocamento em {0, 1, . . . , 9}N , temos que


(an )n = 0, a1 a2 . . . an = f (an )n
para todo (an )n X. Isto prova que (f, m) e ergodicamente equivalente ao
deslocamento de Bernoulli (, ).

Suponha que (f, ) e (g, ) sao ergodicamente equivalentes. Um conjunto


mensuravel A M e invariante para f : M M se, e somente se, (A) e
invariante para g : N N . Alem disso, ((A)) = (A). Portanto, (f, )
e erg
odico se, e somente se, (g, ) e erg
odico. As conclusoes correspondentes
para as propriedades de mistura e mistura fraca sao igualmente faceis de obter.
De fato, praticamente todas as propriedades que estudamos neste curso sao
invariantes de equivalencia erg
odica, isto e, se elas valem para um sistema ent
ao
tambem valem para qualquer outro que seja ergodicamente equivalente a esse.
Uma excecao e a unicidade erg
odica, que tem uma natureza diferente, ja que e
uma propriedade apenas da transformacao.
Isto tambem quer dizer que essas propriedades podem ser utilizadas para
tentar distinguir sistemas que n
ao sejam ergodicamente equivalentes. Ainda
assim, essa e usualmente uma tarefa difcil. Por exemplo, nada do que vimos
ate agora permitir responder `
a seguinte quest
ao: os deslocamentos
: {1, 2}Z {1, 2}Z

: {1, 2, 3}Z {1, 2, 3}Z,

(8.1.1)

munidos das medidas de Bernoulli que d


ao pesos iguais a todos os smbolos,
facil ver que e n
sao ergodicamente equivalentes? E
ao sao topologicamente
conjugadas (por exemplo: tem tres pontos fixos, enquanto que tem apenas
dois) mas a existencia de uma equivalencia erg
odica e uma quest
ao muito mais
delicada. De fato, este tipo de pergunta motiva a maior parte do conte
udo do
presente captulo e acabar
a conduzindo `a nocao de entropia, que estudaremos
no Captulo 9.
Exemplo 8.1.2. Seja : M M o deslocamento em M = X N e seja = N
M
a extensao natural de e seja
uma medida de Bernoulli. Seja
:M
o
M
o deslocamento
levantamento de
(Secao 2.4.2). Alem disso, seja
:M
= X Z e seja
em M
= Z a medida de Bernoulli correspondente. Ent
ao, (
,
)
e ergodicamente equivalente a (
,
). A equivalencia pode ser construda da
seguinte forma.
e o espaco das pre-orbitas de , ou seja, das sequencias
Por definicao, M
x
= (. . . , xn , . . . , x0 ) em M tais que (xj ) = xj+1 para todo j 1. Alem
disso, cada xj e uma sequencia (xj,i )iN em X. Ent
ao, a relacao anterior
quer dizer que
xj,i+1 = xj+1,i para todo i, j N.
(8.1.2)

CAPITULO 8. SISTEMAS EQUIVALENTES

220

M
, x
Considere a aplicacao : M
7 x
dada por
xn = x0,n = x1,n+1 =

x
n = xn,0 = xn1,1 = .

Deixamos ao cuidado do leitor verificar que e realmente uma equivalencia


erg
odica entre a extensao natural (
,
) e o deslocamento bilateral (
,
).

8.1.1

Exerccios

8.1.1. Seja f : [0, 1] [0, 1] a transformacao definida por f (x) = 2x[2x] e seja
m a medida de Lebesgue em [0, 1]. Exiba uma transformacao g : [0, 1] [0, 1] e
uma probabilidade invariante por g, tais que (g, ) e ergodicamente equivalente
a (f, ) e o suporte de tem interior vazio.
8.1.2. Considere os deslocamentos unilaterais f : {1, . . . , k}N {1, . . . , k}N e
g : {1, . . . , l}N {1, . . . , l}N munidos de medidas de Bernoulli e , respectivamente. Mostre que, para todo conjunto X {1, . . . , k}N com f 1 (X) = X e
(X) = 1, existe x X tal que #(X f 1 (x)) = k. Conclua que se k 6= l ent
ao
(f, ) e (g, ) n
ao podem ser ergodicamente equivalentes.
8.1.3. Seja X = {1, . . . , d} e considere o deslocamento : X N X N munido
de uma medida de Markov . Dado qualquer cilindro C = [0; c0 , . . . , cl ] em X N ,
seja C a restricao normalizada de a C. Mostre que existe transformacao
induzida C : C C (veja a Secao 1.4.2) que preserva C e tal que (C , C ) e
ergodicamente equivalente a um deslocamento de Bernoulli (N , ) em NN .

8.2

Equival
encia espectral

Sejam f : M M e g : N N transformacoes preservando probabilidades e


, respectivamente. Sejam Uf : L2 () L2 () e Ug : L2 () L2 () os respectivos operadores de Koopman. Dizemos que (f, ) e (g, ) sao espectralmente
equivalentes se existe algum operador unit
ario L : L2 () L2 () tal que
Ug L = L Uf .

(8.2.1)

Deixamos para o leitor verificar que a relacao definida desta forma e, de fato,
uma relacao de equivalencia.
f
E
acil ver que se dois sistemas sao ergodicamente equivalentes ent
ao eles
sao espectralmente equivalentes. De fato, suponha que existe uma aplicacao
invertvel h : M N tal que = e f = g . Ent
ao, o operador de
Koopman
U : L2 () L2 (), U () =
e uma isometria e e invertvel: a inversa e o operador de Koopman associado a
1 . Em outras palavras, U e um operador unit
ario. Alem disso,
Uf U = Uf = Ug = U Ug .


8.2. EQUIVALENCIA
ESPECTRAL

221

Portanto, L = U e uma equivalencia espectral entre os dois sistemas.


A recproca e falsa, como veremos. Por exemplo, todos os deslocamentos
de Bernoulli invertveis enumeravelmente gerados sao espectralmente equivalentes (Corol
ario 8.4.12); no entanto, nem todos tem a mesma entropia (Exemplo 9.1.10) e, portanto, nem todos sao ergodicamente equivalentes.

8.2.1

Invariantes de equival
encia espectral

Lembre que o espectro esp(A) de um operador linear A : E E num espaco de


Banach complexo E e constitudo pelos n
umeros complexos tais que A id
n
ao e invertvel. Dizemos que esp(A) e um autovalor se A id n
ao e
injetiva, isto e, se existe v 6= 0 tal que Av = v. Nesse caso a dimensao do
n
ucleo de A id e chamada multiplicidade do autovalor.
Por definicao, o espectro de um sistema (f, ) e o espectro do operador de
Koopman associado Uf : L2 () L2 (). Se (f, ) e espectralmente equivalente
a (g, ) ent
ao os dois sistemas tem o mesmo espectro: a relacao (8.2.1) implica
que
(Ug id ) = L (Uf id ) L1
(8.2.2)
e, portanto, Ug id e invertvel se, e somente se, Uf id e invertvel. De
fato, o espectro em si mesmo e um invariante muito grosseiro: em particular, todos os sistemas erg
odicos invertveis sem atomos tem o mesmo espectro
(Exerccio 8.2.1). No entanto, a respectiva medida espectral fornece invariantes
muito u
teis, como veremos a seguir. O mais simples deles e o conjunto dos
atomos da medida espectral, ou seja, o conjunto dos autovalores do operador
de Koopman. Note que (8.2.2) tambem mostra que e autovalor de Uf se, e
somente se, ele e autovalor de Ug ; alem disso, nesse caso as duas multiplicidades
sao iguais.
Observe que 1 e sempre um autovalor do operador de Koopman, uma vez
que Uf = para toda funcao constante . Pela Proposicao 4.1.3(e), o sistema (f, ) e erg
odico se, e somente se, os u
nicos autovetores sao as funcoes
constantes, ou seja, se este autovalor tem multiplicidade 1. Ent
ao, por (8.2.2) o
autovalor 1 tem multiplicidade 1 tambem para Ug , qualquer que seja o sistema
(g, ) espectralmente equivalente a (f, ). Isto mostra que a ergodicidade e um
invariante de equivalencia espectral.
Analogamente, suponha que o sistema (f, ) e misturador. Ent
ao, pela Proposicao 7.1.12,
Z
Z
lim Ufn =
n

para todo , L2 (). Agora suponha que (g, ) e espectralmente equivalente


a (f, ). O operador L em (8.2.1) envia autovetores do autovalor 1 de Uf em
autovetores do autovalor 1 de Ug . Como os dois sistemas sao erg
odicos, isto
quer dizer que L envia funcoes constantes em funcoes constantes. Como L e um
operador unit
ario,
Ugn = L(Ugn ) L = Ufn (L) L

CAPITULO 8. SISTEMAS EQUIVALENTES

222

R
R
e, portanto, limn Ugn = L d L d. Alem disso,
Z
Z
L d = L 1 = L L1 = 1 = d
e, analogamente,

L d =

d. Deste modo, provamos que


Z
Z
n
lim Ug = d d,
n

ou seja, (g, ) tambem e misturador. Isto mostra que a propriedade de mistura


tambem e um invariante de equivalencia espectral.
O mesmo argumento pode ser usado para a propriedade de mistura fraca.
Mas o teorema que provaremos na Secao 8.2.2 d
a uma demonstracao mais interessante do fato de que esta propriedade e um invariante de equivalencia espectral.

8.2.2

Autovetores e mistura fraca

Como vimos anteriormente, o operador de Koopman Uf : L2 () L2 () de um


sistema (f, ) e uma isometria, ou seja, ele satisfaz Uf Uf = id . Se f e invertvel
ent
ao o operador de Koopman e unit
ario, ou seja, temos Uf Uf = Uf Uf = id .
Em particular, nesse caso Uf e normal. Ent
ao, a propriedade de mistura fraca
admite a seguinte caracterizacao interessante:
Teorema 8.2.1. Um sistema invertvel (f, ) e fracamente misturador se, e
somente se, as func
oes constantes s
ao os u
nicos autovetores do operador de
Koopman.
Em particular, o sistema (f, ) e fracamente misturador se, e somente se, ele
e erg
odico e 1 e o u
nico autovalor de Uf .
Demonstrac
ao. Suponha que (f, ) e fracamente misturador. Seja L2 ()
qualquer autofuncao (nao nula) de Uf e seja o respectivo autovalor. Ent
ao,
Z
Z
Z
d = Uf d = d
e isto implica que

d = 0 ou = 1. No primeiro caso,
Z
Z
Z
Cj (, )
= | (Ufj ) d| = |j d| = ||2 d

para todo j 1 (lembrando que || = 1) . Mas ent


ao,

Z
n1
1X
Cj (, )
= ||2 d > 0,
lim
n n
j=0

contradizendo a hip
otese de que o sistema e fracamente misturador. No segundo
caso, usando que o sistema e erg
odico, obtemos que e constante em -quase


8.2. EQUIVALENCIA
ESPECTRAL

223

todo ponto. Isto mostra que se o sistema e fracamente misturador ent


ao os
u
nicos autovetores sao as funcoes constantes.
Agora suponha que os u
nicos autovetores de Uf sao as funcoes constantes.
Para concluir que (f, ) e fracamente misturador, devemos mostrar que
n1
1X
Cj (, )2 0
n j=0

para quaisquer , L2 ()

imediato da definicao que


(lembre do Exerccio 7.1.2). E
Z
Cj (, ) = Cj ( , ) onde = d

R
e a integral de e nula. Logo, n
ao constitui restricao supor que d = 0.
Ent
ao, usando a relacao (A.7.6) para o operador unit
ario L = Uf , obtemos:
Z
Z

2
2
Cj (, )2 = (Ufj ) d = z j d(z) ,
C

onde = E . A expressao `
a direita pode ser reescrita na seguinte forma:
Z Z
Z
Z
j
j

zj w
j d(z) d(w).
z d(z) z d(z) =
C

Portanto, dado qualquer n 1,

Z Z
n1
n1
1X
1X

Cj (, )2 =
(z w)
j d(z) d(w).
n j=0
C C n j=0

(8.2.3)

Afirmamos que a medida = E e n


ao atomica. De fato, suponha que
existe C tal que ({}) 6= 0. Ent
ao, E({}) 6= 0 e ent
ao podemos usar a
Proposicao A.7.8 para concluir que a funcao E({}) e um autovetor de Uf .
Pela hip
otese sobre o operador Uf , isto implica que E({}) e constante em
-quase todo ponto. Logo,
Z
E({}) = E({}) d = 0.
O Lema A.7.3 tambem d
a que
E({}) = E({})2 = E({}) E({}).
Juntando estas duas igualdades, conclumos que E({}) = 0, o qual contradiz
a hip
otese. Desta forma,
a nossa afirmacao.
Pn1fica provada
j em (8.2.3) e limitada e (veja o Exerccio 8.2.6)
A sequencia n1 j=0 (z w)
converge para zero no complementar da diagonal = {(z, w) : z = w}. Alem
disso, a diagonal tem medida nula:
Z

= 0.
( )() = ({y}) d(y)

CAPITULO 8. SISTEMAS EQUIVALENTES

224

porque e n
ao atomica. Ent
ao, podemos usar o teorema da convergencia dominada para concluir que (8.2.3) converge para zero quando n . Isto prova que
(f, ) e fracamente misturador se Uf n
ao tem autovetores n
ao constantes.
Suponha que M e um espaco topologico. Dizemos que uma aplicacao contnua f : M M e topologicamente fracamente misturadora se o operador de
Koopman Uf n
ao possui autofuncoes contnuas n
ao constantes. O seguinte fato
e uma consequencia direta do Teorema 8.2.1:
Corol
ario 8.2.2. Se (f, ) e fracamente misturadora ent
ao a restric
ao de f ao
suporte de e topologicamente fracamente misturadora.
Demonstrac
ao. Seja uma autofuncao contnua de Uf . Pelo Teorema 8.2.1,
a funcao e constante em -quase todo ponto. Logo, por continuidade, e
constante (em todo ponto) no suporte de .
Vimos na Secao 7.3 que quase todo intercambio de intervalos e fracamente
misturador mas n
ao e misturador. A seguir descreveremos uma construcao
explcita, baseada numa extensao das ideias que vislumbramos no Exemplo 6.3.9.
O leitor interessado pode encontrar esta e outras variacoes dessas ideias na
Secao 7.4 do livro de Kalikow e McCutcheon [KM10]
Exemplo 8.2.3 (R. V. Chacon). Considere a sequencia (Sn )n de pilhas definida da seguinte forma. Primeiramente, S1 = {[0, 2/3)}. Em seguida, para
cada n 1, seja Sn a pilha obtida dividindo Sn1 em 3 colunas, com a mesma
largura, e empilhando essas colunas umas sobre as outras, apenas com um intervalo adicional inserido entre a segunda e a terceira colunas, tal como est
a
representado na Figura 8.1.

Ik1
.
.
.

.
.
.

.
.
.

.
.
.

I0

Figura 8.1: Distinguindo mistura fraca e mistura


Por exemplo, S2 = {[0, 2/9), [2/9, 4/9), [6/9, 8/9), [4/9, 6/9)} e
S3 = {[0, 2/27), [6/27, 8/27), [18/27, 20/27), [12/27, 14/27), [2/27, 4/27),
[8/27, 10/27), [20/27, 22/27), [14/27, 16/27), [24/27, 26/27),
[4/27, 6/27), [10/27, 12/27), [22/27, 24/27), [16/27, 18/27)}.


8.2. EQUIVALENCIA
ESPECTRAL

225

Note que cada Sn e uma pilha no intervalo Jn = [0, 1 3n ). A sequencia (fn )n


de transformacoes associadas a tais pilhas converge em todo ponto para uma
transformacao f : [0, 1) [0, 1), a qual preserva a medida de Lebesgue m. Este
sistema (f, m) e fracamente misturador mas n
ao e misturador (Exerccio 8.2.7).

8.2.3

Exerccios

8.2.1. Seja (f, ) um sistema erg


odico invertvel sem atomos. Mostre que todo
no crculo unit
ario {z C : |z| = 1} e autovalor aproximado do operador de
Koopman Uf : L2 () L2 (): existe alguma sequencia (n )n tal que kn k 1
e kUf n n k 0. Em particular, o espectro de Uf coincide com o crculo
unit
ario.
8.2.2. Seja m a medida de Lebesgue no crculo e seja U : L2 (m) L2 (m) o
operador de Koopman da rotacao R : S 1 S 1 . Calcule os autovalores de U e
deduza que (R , m) e (R , m) sao espectralmente equivalentes se, e somente se,
= . [Observacao: O Corol
ario 8.3.6 fornece um enunciado mais completo.]
8.2.3. Seja m a medida de Lebesgue no crculo e, para cada inteiro k 2, seja
Uk : L2 (m) L2 (m) o operador de Koopman da transformacao fk : S 1 S 1
dada por fk (x) = kx mod Z. Verifique que se p 6= q ent
ao (fp , m) e (fq , m) n
ao
sao ergodicamente equivalentes. Mostre que, para qualquer k 2,
2

L (m) = {constantes}
P

Ukj (Hk )

j=0

onde Hk = { nZ an e2inx : an = 0 se k | n} e os termos da soma direta


sao ortogonais dois-a-dois. Conclua que (fp , m) e (fq , m) sao espectralmente
equivalentes para quaisquer p e q.
8.2.4. Seja f : S 1 S 1 a transformacao dada por f (x) = kx mod Z e seja a
medida de Lebesgue. Mostre que (f, ) e fracamente misturador se, e somente
se, |k| 2.
8.2.5. Prove que dada f invertvel, se e erg
odico para todo iterado f n e existe
C > 0 tal que
lim sup (f n (A) B) C(A)(B),
n

para quaisquer conjuntos mensuraveis A e B, ent


ao e fracamente misturadora.
[Observacao: Este enunciado e devido a Ornstein [Orn72]. De fato, ele mostrou
que nas hip
oteses do exerccio, o sistema e (fortemente) misturador.].
8.2.6. Sejam z e w dois n
umeros complexos com modulo 1. Verifique que
1. lim
n

n1
1X j
|z 1| = 0 se, e somente se, z = 1;
n j=0

CAPITULO 8. SISTEMAS EQUIVALENTES

226

2. lim
n

n1
1X
(z w)
j = 0 se z 6= w.
n j=0

8.2.7. Considere o sistema (f, m) no Exemplo 8.2.3. Mostre que


(a) o sistema (f, m) e erg
odico;
(b) os u
nicos autovetores do operador de Koopman Uf : L1 (m) L1 (m) sao
as funcoes constantes; logo (f, m) e fracamente misturador;
(b) lim supn m(f n (A) A) 2/27 se tomarmos A = [0, 2/9); portanto (f, m)
n
ao e misturador.

8.3

Espectro discreto

Nesta secao e na proxima estudaremos os dois casos extremos, no que se refere


ao tipo da medida espectral do operador de Koopman: sistemas com espectro
discreto, cuja medida espectral e puramente atomica, e sistemas com espectro de
Lebesgue, cuja medida espectral e equivalente `a medida de Lebesgue no crculo
unit
ario.
Comecamos por descrever algumas propriedades dos autovalores e autove claro que todo autovalor pertence ao crculo
tores do operador de Koopman. E
unit
ario, uma vez que Uf e uma isometria.
Proposi
c
ao 8.3.1. Se 1 , 2 L2 () satisfazem Uf 1 = 1 1 e Uf 2 = 2 2
com 1 6= 2 , ent
ao 1 2 = 0. Alem disso, os autovalores de Uf constituem
um subgrupo do crculo unit
ario.
Se o sistema (f, ) e erg
odico ent
ao todo o autovalor de Uf e simples e o
m
odulo de toda autofunc
ao e constante em -quase todo ponto.
Demonstrac
ao. A primeira afirmacao segue da igualdade
2 (1 2 ) = 1 1 (1 2 ),
1 2 = Uf 1 Uf 2 = 1 1 2 2 = 1
2
uma vez que 1 1
6= 1. Essa igualdade tambem mostra que o conjunto dos
2
autovalores e fechado para a operacao (1 , 2 ) 7 1 21 . Lembrando que 1
sempre e um autovalor, segue que esse conjunto e um grupo.
Agora suponha que (f, ) e erg
odico. Suponha que Uf = . Ent
ao,
Uf (||) = |Uf | = || = || em -quase todo ponto. Por ergodicidade, isto
implica que || e constante em -quase todo ponto. Em seguida, suponha que
Uf 1 = 1 e Uf 2 = 2 e as funcoes 1 e 2 n
ao sao identicamente nulas.
Como |2 | e constante em -quase todo ponto, temos 2 (x) 6= 0 para -quase
todo x. Ent
ao 1 /2 est
a bem definida. Alem disso,
Uf

1  Uf (1 )
1
1
=
.
=
=
2
Uf (2 )
2
2

Por ergodicidade, segue que o quociente e constante em -quase todo ponto.


Ou seja, 1 = c2 para algum c C.

8.3. ESPECTRO DISCRETO

227

Dizemos que um sistema (f, ) tem espectro discreto se os autovetores do


operador de Koopman Uf : L2 () L2 () geram o espaco L2 (). Observe
que isto implica que Uf e invertvel e, portanto, e um operador unit
ario. A
terminologia e justificada pela observacao a seguir (lembre do Teorema A.7.9):
Proposi
c
ao 8.3.2. Um sistema (f, ) tem espectro discreto se, e somente se,
o seu operador de Koopman Uf admite representac
ao espectral
M
M

(8.3.1)
L2 (j )j , (j,l )j,l 7 z 7 zj,l (z) j,l
L2 (j )j
T :
j

onde cada j e uma medida de Dirac num ponto do crculo unit


ario.
Demonstrac
ao. Suponhamos que Uf admite uma representacao espectral (8.3.1)
ario. Cada L2 (j )j pode
onde cada j = j para algum j no crculo unit
ser identificado, de maneira can
onica, com um subespaco da soma direta. A
restricao de T a esse subespaco coincide com j id , uma vez que
z j,l (z) = j j,l (z) em j -quase todo ponto.

(8.3.2)

ao, a famlia (vj,l )j,l e uma


Seja (vj,l )l uma base de Hilbert de L2 (j )j . Ent
base de Hilbert da soma direta, constituda por autovetores de T . Como T e
unitariamente conjugado a Uf , segue que L2 () admite uma base de Hilbert
formada por autovetores do operador de Koopman.
Agora suponha que (f, ) tem espectro discreto. Sejam (j )j os autovalores
de Uf e, para cada j, seja j = j e seja j a dimensao de Hilbert do autoespaco
ker(Uf j id ). Note que o espaco L2 (j ) e uni-dimensional, pois toda funcao e
constante em j -quase todo ponto. Portanto, a dimensao de L2 (j )j tambem
e igual a j . Logo, existe isomorfismo unit
ario
Lj : ker(Uf j id ) L2 (j )j .
claro que Lj Uf L1 = j id . Ou seja, recordando a observacao (8.3.2),
E
j


Lj Uf L1
j : (j,l )l 7 z 7 j j,l (z) l = z 7 zj,l (z) l .

(8.3.3)

Os autoespacos ker(Uf j id ) geram L2 (), por hipotese, e sao ortogonais


dois-a-dois, pela Proposicao 8.3.1. Logo, podemos combinar os operadores Lj
para obter um isomorfismo unit
ario L : L2 () j L2 (j )j . A relacao (8.3.3)
d
a que

L Uf L1 : (j,l )j,l 7 z 7 zj,l (z) l .

e representacao espectral de Uf da forma pretendida.

Exemplo 8.3.3. Seja m a medida de Lebesgue no toro Td . Como sabemos, o


espaco L2 (m) e gerado pela famlia de Fourier {k (x) = e2ikx : k Zd }. Seja
f = R : Td Td a rotacao correspondente a um dado vetor = (1 , . . . , d ).
Ent
ao,
Uf k (x) = k (x + ) = e2ik k (x) para todo x .

228

CAPITULO 8. SISTEMAS EQUIVALENTES

Isto mostra que todo k e autovetor de Uf e, portanto, (f, m) tem espectro


discreto. Note que o grupo dos autovalores e
G = {e2ik : k Zd },

(8.3.4)

ou seja, o subgrupo do crculo unit


ario gerado por {e2ij : j = 1, . . . , d}.
Mais geralmente, toda translacao erg
odica num grupo abeliano compacto
tem espectro discreto. Reciprocamente, todo sistema erg
odico com espectro
discreto e ergodicamente isomorfo a uma translacao num grupo abeliano compacto. Outro resultado interessante e que todo subgrupo do crculo unit
ario e
o grupo de autovalores de algum sistema erg
odico com espectro discreto. Estes
fatos sao provados na Secao 3.3 do livro de Peter Walters [Wal82].
Proposi
c
ao 8.3.4. Suponha que (f, ) e (g, ) s
ao erg
odicos e tem espectro
discreto. Ent
ao (f, ) e (g, ) s
ao espectralmente equivalentes se, e somente se,
os seus operadores de Koopman Uf : L2 () L2 () e Ug : L2 () L2 () tem
os mesmos autovalores.
claro que se os operadores de Koopman sao conjugados ent
Demonstrac
ao. E
ao
eles tem os mesmos autovalores. Para provar a recproca, sejam (j )j os autovalores dos dois operadores. Pela Proposicao 8.3.2, os autovalores sao simples.
Para cada j, sejam uj e vj vetores unit
arios nos n
ucleos ker(Uf j id ) e
ker(Ug j id ), respectivamente. Ent
ao (uj )j e (vj )j sao bases de Hilbert de
L2 () e de L2 (), respectivamente. Considere o isomorfismo L : L2 () L2 ()
definido por L(uj ) = vj . Este operador e unit
ario, uma vez que envia uma base
de Hilbert numa base de Hilbert, e satisfaz
L Uf (uj ) = L(j uj ) = j vj = Ug (vj ) = Ug L(uj )
para todo j. Por linearidade, segue que L Uf = Ug L. Portanto, (f, ) e
(g, ) sao espectralmente equivalentes.
Corol
ario 8.3.5. Se (f, ) e erg
odico, invertvel e tem espectro discreto ent
ao
(f, ) e espectralmente equivalente a (f 1 , ).
claro que e autovalor de Uf se, e somente se, 1 e autovalor
Demonstrac
ao. E
de Uf 1 ; alem disso, os autovetores sao os mesmos. Como os conjuntos de
autovalores sao grupos, segue que os dois operadores tem os mesmos autovalores
e os mesmos autovetores. Aplique a Proposicao 8.3.4.
Seja m a medida de Lebesgue no toro Td . A Proposicao 8.3.4 tambem
nos permite classificar as rotacoes irracionais do toro a menos de equivalencia
erg
odica ou espectral:
Corol
ario 8.3.6. Sejam = (1 , . . . , d ) and = (1 , . . . , d ) vetores racionalmente independentes e sejam R e R as respectivas as rotac
oes no toro Td . As
seguintes condic
oes s
ao equivalentes:
(a) (R , m) e (R , m) s
ao ergodicamente equivalentes;

8.4. ESPECTRO DE LEBESGUE

229

(b) (R , m) e (R , m) s
ao espectralmente equivalentes;
(c) existe L SL(d, Z) tal que = L m
odulo Zd .
A demonstracao fica a cargo do leitor (Exerccio 8.3.2). No caso particular
do crculo, obtemos que duas rotacoes irracionais R e R sao equivalentes se,
e somente se, R = R ou ent
ao R = R1 . Veja tambem o Exerccio 8.3.3.

8.3.1

Exerccios

8.3.1. Suponha que (f, ) tem espectro discreto e que o espaco de Hilbert L2 ()
e separ
avel (isto vale, por exemplo, se a -algebra dos conjuntos mensuraveis
admite um gerador enumer
avel). Mostre que existe uma sequencia (nk )k convergindo para infinito tal que kUfnk k2 converge para zero quando k ,
para toda L2 ().
8.3.2. Prove o Corol
ario 8.3.6.
8.3.3. Seja m a medida de Lebesgue em S 1 e sejam = p/q e = r/s dois
n
umeros racionais, onde mdc(p, q) = 1 = mdc(r, s). Mostre que as rotacoes
(R , m) e (R , m) sao ergodicamente equivalentes se, e somente se, os denominadores q e s sao iguais.

8.4

Espectro de Lebesgue

Defini
c
ao 8.4.1. Seja U : H H uma isometria num espaco de Hilbert.
Dizemos que U tem espectro de Lebesgue se existe algum subespaco fechado
E H tal que
(a) U (E) E;
(b)
(c)

nN

U n (E) = {0};

nN

U n (E) = H.

A raz
ao de ser desta denominacao sera explicada na Proposicao 8.4.10.
Dado uma probabilidade , representemos por L20 () = L20 (M, B, ) o complemento ortogonal, no espaco L2 () = L2 (M, B, ), do subespaco das funcoes
constantes. Em outras palavras:
Z
L20 () = { L2 () : d = 0}.
Note que L20 () e invariante pelo operador de Koopman: L20 () se, e somente
se, Uf L20 (). Dizemos que o sistema (f, ) tem espectro de Lebesgue se a
restricao do operador de Koopman a L20 () tem espectro de Lebesgue.

230

8.4.1

CAPITULO 8. SISTEMAS EQUIVALENTES

Exemplos e propriedades

Comecamos por observar que todo deslocamento de Bernoulli tem espectro de


Lebesgue. Tratamos separadamente o caso unilateral e o caso bilateral.
Exemplo 8.4.2. Considere um deslocamento unilateral : X N X N , munido
de uma medida de Bernoulli = N . Tome E = L20 (). As condicoes (a) e (c) na
definicao sao evidentes. Para provar a condicao (b), considere qualquer funcao
L20 () na intersecao, ou seja, tal que para todo n N existe uma funcao
n L20 () satisfazendo = n n . Queremos mostrar que e constante em
-quase todo ponto. Para cada c R, considere
Ac = {x M : (x) > c}.
Para cada n N, podemos escrever Ac = n ({x M : n (x) > c}). Ent
ao
Ac pertence `
a -algebra gerada pelos cilindros da forma [n; Cn , , Cm ] com
m n. Consequentemente, (Ac C) = (Ac )(C) para todo cilindro C da
forma C = [0; C0 , . . . , Cn1 ]. Como n e arbitrario e os cilindros constituem
uma famlia geradora, segue que (Ac B) = (Ac )(B) para todo conjunto
mensuravel B M . Tomando B = Ac conclumos que (Ac ) = (Ac )2 , ou
seja, (Ac ) {0, 1} para todo c R. Isto prova que e constante em -quase
todo ponto, tal como afirmamos.
Exemplo 8.4.3. Agora considere um deslocamento bilateral : X Z X Z ,
munido de uma medida de Bernoulli = Z . Seja A a -algebra gerada pelos
cilindros da forma [0; C0 , . . . , Cm ] com m 0. Denotamos por L20 (M, A, ) o
espaco das funcoes L20 () que sao mensuraveis relativamente `a -algebra A
(em outras palavras, (x) depende apenas das coordenadas xn , n 0 do ponto).
Tome E = L20 (M, A, ). A condicao (a) da definicao e imediata. A condicao
(b) segue dos mesmos argumentos que usamos no Exemplo 8.4.2. Para provar
a condicao (c), note que n Un (E) contem as funcoes caractersticas de todos
os cilindros. Portanto, ela contem todas as combinacoes lineares de funcoes
caractersticas dos conjuntos na algebra gerada pelos cilindros. Isto implica que
a uni
ao e densa em L20 (), conforme queramos provar.
Lema 8.4.4. Se (f, ) tem espectro de Lebesgue ent
ao limn Ufn = 0 para
todo L20 () e todo L2 ().
Demonstrac
ao. Observe que a sequencia Ufn e limitada. De fato, pela
desigualdade de Cauchy-Schwartz (Teorema A.5.4):
|Ufn | kUfn k2 kk2 = kk2 kk2

para todo n.
n

Ent
ao, basta provar que toda subsequencia convergente Uf j converge para
zero. Analogamente, o conjunto {Ufn : n N} e limitado em L2 (), porque
Uf e uma isometria. Pelo teorema de Banach-Alaoglu (Teoremas A.6.1 e 2.3.1),
toda sequencia nesse conjunto admite subsequencia que converge fracamente.
n
Logo, n
ao e restricao supor que Uf j converge fracamente para algum
L2 ().

231

8.4. ESPECTRO DE LEBESGUE

Seja E um subespaco satisfazendo as condicoes na Definicao 8.4.1. Inicin k


n
almente, suponha que Ufk (E) para algum k. Ent
ao Uf j Uf j (E).
nj
Logo, dado qualquer l N, temos que Uf Ufl (E) para todo j suficientemente grande. Segue (veja o Exerccio A.6.8) que Ufl (E), para todo l N.
Pela condicao (b) na definicao, isto implica que = 0 em -quase todo ponto.
n
Em particular, limj Uf j = = 0.
Agora considere L20 () qualquer. Pela condicao (c) na definicao, para
todo > 0 existem k N e k Ufk (E) tais que k k k2 . Usando a
desigualdade de Cauchy-Schwarz uma vez mais:
|Ufn Ufn k | k k k2 kk2 kk2
para todo n. Lembrando que limn Ufn k = 0 (pelo par
agrafo anterior),
obtemos que
kk2 lim inf Ufn lim sup Ufn kk2 .
n

Fazendo 0, segue que limn Ufn = 0, como queramos demonstrar.


Corol
ario 8.4.5. Se (f, ) tem espectro de Lebesgue ent
ao ele e misturador.
Demonstrac
ao. Basta observar que
Z
Z
Cn (, ) = |Ufn ( d) | = |Ufn ( d) |
e a funcao =

d est
a em L20 ().

No Exemplo 8.4.13 descreveremos exemplos de sistemas misturadores que


n
ao tem espectro de Lebesgue. Portanto, a recproca do Corolario 8.4.5 e falsa,
em geral.
A classe dos sistemas com espectro de Lebesgue e invariante por equivalencia
espectral. De fato, suponha que (f, ) tem espectro de Lebesgue e que (g, ) e
um sistema espectralmente equivalente. Seja L : L2 () L2 () um operador
unit
ario conjugando os operadores de Koopman Uf e Ug . Segue da hipotese e do
Corol
ario 8.4.5 que (f, ) e fracamente misturador. Logo, pelo Teorema 8.2.1,
as constantes sao os u
nicos autovetores de Uf . Ent
ao o mesmo vale para Ug
e a conjugacao L envia constantes em constantes. Ent
ao, como L e unit
ario,
a sua restricao ao complemento ortogonal L20 () e um operador unit
ario sobre
L20 (). Agora, dado qualquer subespaco E L20 () satisfazendo as condicoes
(a), (b), (c) da definicao para Uf , e claro que o subespaco L(E) L20 () satisfaz
as condicoes correspondentes para Ug . Logo (g, ) tem espectro de Lebesgue.
Dados subespacos fechados V W de um espaco de Hilbert H, denotamos
por W V o complemento ortogonal de V em W , ou seja,
W V = W V = {w W : v w = 0 para todo v V }.
A demonstracao do seguinte fato sera discutida na proxima secao:

CAPITULO 8. SISTEMAS EQUIVALENTES

232

Proposi
c
ao 8.4.6. Se U : H H e uma isometria e E1 e E2 s
ao subespacos de
H satisfazendo as condic
oes da Definic
ao 8.4.1, ent
ao E1 U (E1 ) e E2 U (E2 )
tem a mesma dimens
ao de Hilbert (que e chamada posto do operador U ).
Ent
ao, chamamos posto de um sistema (f, ) com espectro de Lebesgue ao
claro que o posto
posto do respectivo operador de Koopman restrito a L20 (). E
2
e menor ou igual que a dimensao do espaco L (). Em particular, se L2 () e
separ
avel ent
ao o posto e finito ou enumeravel. A maior parte dos exemplos
interessantes cai nesta categoria:
Exemplo 8.4.7. Suponha que o espaco de probabilidade (M, B, ) e enumeravelmente gerado, ou seja, que existe uma famlia enumeravel G de subconjuntos
mensuraveis tais que todo elemento de B coincide, a menos de medida nula,
com um elemento da -algebra gerada por G. Ent
ao L2 () e separ
avel: a
algebra A gerada por G e enumeravel e as combinacoes lineares com coeficientes

racionais das funcoes caractersticas dos elementos de A formam um subconjunto


enumer
avel denso de L2 ().
interessante observar que n
E
ao sao conhecidos sistemas com espectro de
Lebesgue com posto finito. No caso dos deslocamentos de Bernoulli, o posto
coincide com a dimensao do respectivo L2 ():
Exemplo 8.4.8. Seja (, ) um deslocamento de Bernoulli unilateral (no caso
bilateral valem consideracoes analogas). Como vimos no Exemplo 8.4.2, podeao, denotando x = (x1 , . . . , xn , . . . ) e lembrando que
mos tomar E = L20 (). Ent
= N,
Z
E U (E) (x0 , x)(x) d(x0 , x) = 0
L20 ()
Z Z


(x0 , x) d(x0 ) (x) d(x) = 0 L20 ().



R
Logo, E U (E) = L2 () : (x0 , x) d(x0 ) = 0 para -quase todo x .
Afirmamos que dim(E U (E)) = dim L2 (). A desigualdade e imediata.
Para Rprovar a outra
R desigualdade, fixe qualquer funcao mensuravel : X R
com d = 0 e 2 d = 1. Considere a aplicacao linear I : L2 () L2 ()
que a cada L2 () associa a funcao I(x0 , x) = (x0 )(x). As hipoteses
sobre implicam que:
I E U (E)

kIk2 = kk2

para todo L2 ().

Isto mostra que E U (E) contem um subespaco isometrico a L2 () e, portanto,


dim E U (E) dim L2 (). Isto conclui o argumento.
Dizemos que o deslocamento e de tipo enumer
avel se o espaco de probabilidade X e enumeravelmente gerado. Isto e autom
atico, por exemplo, se X for
finito ou enumer
avel. Nesse caso, o espaco = X N (ou = X Z ) tambem e
enumeravelmente gerado: se G e um gerador enumeravel de X ent
ao os cilindros

233

8.4. ESPECTRO DE LEBESGUE

[m; Cm , . . . , Cn ] com Cj G constituem um gerador enumeravel de M . Ent


ao,
como comentamos no Exemplo 8.4.7, o espaco L2 () e separ
avel. Portanto,
segue do Exemplo 8.4.8 que todo deslocamento de Bernoulli de tipo enumer
avel
tem espectro de Lebesgue com posto enumer
avel.

8.4.2

O caso invertvel

Nesta secao suporemos que o sistema (f, ) e invertvel. Neste contexto, a nocao
de espectro de Lebesgue pode ser formulada de maneira mais transparente.
Proposi
c
ao 8.4.9. Seja U : H H um operador unit
ario num espaco de
Hilbert H. Ent
ao U tem espectro de Lebesgue se, e somente se, existe um
subespaco fechado F H tal que os iterados U k (F ), k Z s
ao ortogonais
dois-a-dois e satisfazem
M
H=
U k (F ).
kZ

Demonstrac
ao. Suponha que existe algum subespaco F como no enunciado.
k
Tome E =
cao (a) na Definicao 8.4.1 e imediata:
k=0 U (F ). A condi
U (E) =

M
k=1

U k (F ) E.

k
n

Quanto `
a condicao (b), note que
n=0 U (E) significa que k=n U (F )
k
para todo n 0. Isto implica que e ortogonal a U (F ) para todo k Z. Logo
= 0. Finalmente,
otese, podemos escrever qualquer H como soma
P por hip
ao
ortogonal = kZ k com k U k (F ) para todo k. Ent

k=n

U k (F ) = U n (E)

k=n

para todo n e a sequencia do lado esquerdo converge para quando n .


Isto d
a a condicao (c) na definicao.
Agora provaremos a recproca. Dado E satisfazendo as condicoes (a), (b)
facil ver que os iterados de F sao
e (c) na definicao, tome F = E U (E). E
ortogonais dois-a-dois. Afirmamos que

U k (F ) = E.

(8.4.1)

k=0

imediato da definicao de F que, existem


De fato, considere qualquer v E. E
sequencias vn U n (F ) e wn U n (E) tais que v = v0 + + vn1 + wn para
cada n P
1. Queremos mostrar que (wn )n converge para zero, para concluirmos

que v = j=0 vn . Para isso, observe que


kvk2 =

n1
X
j=0

kvj k2 + kwn k2

para todo n

CAPITULO 8. SISTEMAS EQUIVALENTES

234

P
2
e, portanto, a serie
e somavel. Dado > 0, fixe m 1 tal que a
j=0 kvj k
soma dos termos com j m e menor que . Para todo n m,
kwm wn k2 = kvm + + vn1 k2 = kvm k2 + + kvn1 k2 < .
Isto prova que (wn )n e sequencia de Cauchy em H. Seja w o seu limite. Como
wn U n (E) U m (E) para todo m n, passando ao limite obtemos que
w U m (E) para todo m. Pela condicao (b) na hipotese, isto implica que
w = 0. Portanto, a prova da afirmacao (8.4.1) est
a completa. Para concluir a
demonstracao da proposicao basta observar que

M
kZ

U k (F ) =

U k (F ) =

n=0 k=n

U n (E).

n=0

A condicao (c) na hip


otese implica que este subespaco coincide com H.
Em particular, um sistema invertvel (f, ) tem espectro de Lebesgue se, e
somente se, existe um subespaco fechado F L20 () tal que
M
L20 () =
Ufk (F ).
(8.4.2)
kZ

O proximo resultado e a raz


ao pela qual sistemas com espectro de Lebesgue
sao denominados desse modo e tambem conduz naturalmente `a nocao de posto:
Proposi
c
ao 8.4.10. Seja U : H H um operador unit
ario num espaco de
Hilbert. Seja a medida de Lebesgue no crculo unit
ario. Ent
ao U tem espectro
de Lebesgue se, e somente se, ele admite a representac
ao espectral
T : L2 () L2 ()

( ) 7 (z 7 z (z))

para algum cardinal . Alem disso, est


a unicamente determinado por U .
Demonstrac
ao. Comecemos provar a afirmacao se. Como sabemos, a famlia
{z n : n Z} e uma base de Hilbert (base de Fourier) do espaco L2 (). Seja Vn
o subespaco unidimensional gerado por (z) = z n . Ent
ao, L2 () = nZ Vn e,
portanto,
M  M
L2 () =
Vn =
Vn
(8.4.3)
nZ

nZ

(W representa a soma direta ortogonal de c


opias do espaco W ). Alem disso,

a restricao de T a cada Vn e um operador unit


ario sobre Vn+1
. Tome F = V0 .
A relacao (8.4.3) significa que os iterados T n (F ) = Vn sao ortogonais dois-adois e a sua soma direta ortogonal e o espaco L2 () . Usando a conjugacao de
T ao operador de Koopman em L20 (), conclumos que existe um subespaco F
nas condicoes da Proposicao 8.4.9.
Reciprocamente, suponha que existe F nas condicoes da Proposicao 8.4.9.
Seja {vq : q Q} uma base de Hilbert de F . Ent
ao {U n (vq ) : n Z, q Q} e
uma base de Hilbert de H. Dado q Q, represente por q o elemento do espaco

235

8.4. ESPECTRO DE LEBESGUE

L2 ()Q que e igual a 1 na coordenada q e igual a zero nas demais coordenadas.


Defina
L : H L2 ()Q ,

L(U n (vq )) = z n q

para cada n Z e q Q.

Observe que L e um operador unit


ario, uma vez que {z n q } e uma base de
2
Q
Hilbert de L () . Observe tambem que LU = T L. Isto fornece a representacao
espectral no enunciado da proposicao, com igual ao cardinal do conjunto Q,
ou seja, igual `
a dimensao de Hilbert do subespaco F .
Seja E H qualquer subespaco satisfazendo as condicoes na Definicao 8.4.1.
Ent
ao, a diferenca ortogonal F = E U (E) satisfaz a conclusao da Proposicao 8.4.9, conforme vimos na demonstracao dessa proposicao. Alem disso, de
acordo com a demonstracao da Proposicao 8.4.10, podemos tomar o cardinal
igual `
a dimensao de Hilbert de F . Como est
a unicamente determinado,
o mesmo vale para a dimensao de Hilbert de E U (E). Isto prova a Proposicao 8.4.6 no caso invertvel. A demonstracao do caso geral est
a proposta no
Exerccio 8.4.3.
Acabamos de mostrar que o posto de um sistema com espectro de Lebesgue
est
a bem definido. Vamos ver em seguida que, para sistemas invertveis, o posto
e um invariante completo de equivalencia espectral:
Corol
ario 8.4.11. Dois sistemas invertveis com espectro de Lebesgue s
ao espectralmente equivalentes se, e somente se, eles tem o mesmo posto.
Demonstrac
ao. Claro que dois sistemas invertveis sao espectralmente equivalentes se, e somente se, eles admitem a mesma representacao espectral. Pela
Proposicao 8.4.10 isto acontece se, e somente se, o valor do cardinal e o
mesmo para os dois sistemas, ou seja, se o posto e o mesmo.
Corol
ario 8.4.12. Todos os deslocamentos de Bernoulli bilaterais de tipo enumer
avel s
ao espectralmente equivalentes.
Demonstrac
ao. Todos os deslocamentos de Bernoulli de tipo enumeravel tem
posto enumer
avel, como vimos na secao anterior.
Demonstracoes dos fatos citados a seguir podem ser encontradas no livro de
Ricardo Ma
ne [Ma
n87, Secao II.10]:
Exemplo 8.4.13 (Deslocamentos gaussianos). Dizemos que uma matriz infinita
A = (ai,j )i,jZ e positiva definida se a restricao Am,n = (ai,j )mi,j<n e positiva
definida para quaisquer m < n. Dizemos que A e simetrica se ai,j = aj,i para
quaisquer i, j Z. Seja uma probabilidade boreliana em = RZ (valem consideracoes analogas para = RN ). Dizemos que e uma medida gaussiana se
existe alguma matriz simetrica positiva definida A tal que ([m; Bm , . . . , Bn1 ])
e igual a


Z
1
1 1
1
exp (Am,n z z) dz
2
(det Am,n )1/2 (2)(nm)/2 Bm Bn1

CAPITULO 8. SISTEMAS EQUIVALENTES

236

para quaisquer m < n e quaisquer conjuntos mensuraveis Bm , . . . , Bn1 R. A


raz
ao de ser do fator do lado esquerdo da integral e explicada no Exerccio 8.4.4.
A e chamada matriz de covari
ancias de . Ela est
a unicamente determinada,
via
ai,j =

xi xj d(x)

para cada i, j Z.

Para cada matriz simetrica positiva definida A existe uma u


nica probabilidade gaussiana que tem A como matriz de covariancias. Alem disso,
e invariante pelo deslocamento : se, e somente se, ai,j = ai+1,j+1
para quaisquer i, j Z. Nesse caso, as propriedades do sistema (, ) est
ao
diretamente ligadas ao comportamento da sequencia de covari
ancias
n = an,0 = Un x0 x0

para cada n 0.

Em particular, (f, ) e misturador se, e somente se, a sequencia de covariancias


converge para zero.
Agora, o Exerccio 8.4.5 mostra que se (f, ) tem espectro de Lebesgue ent
ao
a sequencia de covariancias e gerada por alguma medida absolutamente contnua
no crculo unit
ario, no seguinte sentido:
Z
n = z n d(z) para cada n 0.
(O lema de Riemman-Lebesgue afirma que se e uma probabilidade absolutamente contnua
ario ent
ao
R relativamente `a medida de Lebesgue no crculo unit
a sequencia z n d(z) converge para zero quando n .) Mas o Exerccio 8.4.6 mostra que nem toda sequencia que converge para zero e desta forma.
Portanto, existem deslocamentos gaussianos (, ) que sao misturadores mas
n
ao tem espectro de Lebesgue.

8.4.3

Exerccios

8.4.1. Mostre que todo deslocamento de Markov misturador tem espectro de


Lebesgue com posto enumeravel. [Observacao: Na Secao 9.5.3 mencionaremos
resultados mais fortes.]
8.4.2. Seja a medida de Haar em Td e seja fA : Td Td um endomorfismo
sobrejetivo. Suponha que nenhum autovalor da matriz A e raiz da unidade.
Verifique que toda
orbita de At no conjunto Zd \ {0} e infinita e use esse fato
para concluir que (fA , ) tem espectro de Lebesgue. Reciprocamente, se (fA , )
tem espectro de Lebesgue ent
ao nenhum autovalor de A e raiz da unidade.
8.4.3. Complete a demonstracao da Proposicao 8.4.6, usando o Exerccio 2.3.6
para reduzir o caso geral ao caso invertvel.


8.5. ESPAC
OS DE LEBESGUE E ISOMORFISMO ERGODICO

237

R
2
8.4.4. Verifique que R ex /2 dx = 2. Use esse fato para mostrar que se A
e matriz simetrica positiva definida de dimensao d 1 ent
ao
Z

exp (A1 z z)/2 dz = (det A)1/2 (2)d/2
Rd

8.4.5. Seja (f, ) um sistema invertvel com espectro de Lebesgue. Mostre


que para toda L20 () existe uma probabilidade absolutamente contnua
relativamente `
a medida de Lebesgue no crculo unit
ario tal que Ufn =
R n
z d(z) para todo n Z.
8.4.6. Seja a medida de Lebesgue no crculo unit
ario. Considere o operador
linear F : L1 () c0 definido por
Z

n
F () =
z (z) d(z) .
n

Mostre que F e contnuo e injetivo mas n


ao a sobrejetivo. Portanto, nem toda
sequencia deR n
umeros complexos (n )n convergindo para zero pode ser escrita
como n = z n d(z) para n 0, para alguma probabilidade absolutamente
contnua relativamente a .

8.5

Espa
cos de Lebesgue e isomorfismo erg
odico

O principal tema desta secao sao os espacos de Lebesgue (tambem chamados


espacos de probabilidade padr
ao), uma classe de espacos de probabilidade introduzida pelo matematico sovietico Vladimir A. Rokhlin [Rok62]. Estes espacos
tem um papel de destaque na Teoria da Medida por duas raz
oes: por um lado,
eles apresentam propriedades muito melhores do que os espacos de probabilidade
gerais; por outro lado, eles incluem a grande maioria dos exemplos interessantes. Em particular, todo espaco metrico completo separ
avel, munido de uma
probabilidade boreliana, e um espaco de Lebesgue.
Inicialmente, discutiremos uma terceira nocao de equivalencia, situada entre
a equivalencia erg
odica e a equivalencia espectral, que chamamos isomorfismo
erg
odico. Um dos que para transformacoes em espacos de Lebesgue as nocoes
de equivalencia erg
odica e de isomorfismo erg
odico coincidem.

8.5.1

Isomorfismo erg
odico

Seja (M, B, ) um espaco de probabilidade. Denotamos por B o quociente da


-algebra pela relacao de equivalencia A B (AB) = 0. Observe que se
Ak Bk para todo k N ent
ao k Ak k Bk e k Ak k Bk e Ack Bkc para
todo k N. Portanto, as operacoes usuais da teoria de conjuntos est
ao bem
Alem disso, a medida induz uma medida

definidas no quociente B.
em B.

A dupla (B,
) e chamada de
algebra de medida do espaco de probabilidade.

CAPITULO 8. SISTEMAS EQUIVALENTES

238

Agora sejam (M, B, ) e (N, C, ) dois espacos de probabilidade e sejam



) as respectivas algebras de medida. Um homomorfismo de algebras
(B,
) e (C,
de medida e uma aplicacao H : B C que preserva as operacoes de uniao,
intersecao e complementar e tambem preserva as medidas: (B) = (H(B))
Se H e uma bijecao, dizemos que se trata de um isomorfismo
para todo B B.
de
algebras de medida. Nesse caso a inversa H 1 tambem e um isomorfismo de
algebras de medida.

Toda aplicacao mensuravel h : M N satisfazendo h = define um


: C B,
via B 7 h1 (B). Alem disso, se h e invertvel
homomorfismo h

ent
ao h e um isomorfismo. Do mesmo modo, transformacoes f : M M e
g : N N preservando as medidas dos respectivos espacos de probabilidade
respectivamente. Dizemos que
definem homomorfismos f : B B e g : C C,
os sistemas (f, ) e (g, ) sao ergodicamente isomorfos se estes homomorfismos

sao conjugados, ou seja, se f H = H g para algum isomorfismo H : C B.


Sistemas ergodicamente equivalentes sao sempre ergodicamente isomorfos:
Tambem temos a
dada qualquer equivalencia erg
odica h, basta tomar H = h.
seguinte relacao entre isomorfismo erg
odico e equivalencia espectral:
Proposi
c
ao 8.5.1. Se dois sistemas (f, ) e (g, ) s
ao ergodicamente isomorfos
ent
ao eles s
ao espectralmente equivalentes.
Demonstrac
ao. Seja H : C B um isomorfismo tal que fH = H
g. Considere
o operador linear L : L2 () L2 () construdo da seguinte forma. Inicialmente,
Note que kL(XC )k = kXC k. Estenda a
L(XC ) = XH(C) para todo B C.
definicao ao conjunto das funcoes simples, preservando a linearidade:
k
k
X
X
cj XH(Cj )
cj XCj ) =
L(
j=1

j=1

para quaisquer k 1, cj R e Cj C.

A definicao n
ao depende da representacao da funcao simples como combinacao
linear de funcoes caractersticas (Exerccio 8.5.1). Alem disso, kL()k = kk
para toda funcao simples. Lembre que o conjunto das funcoes simples e denso em
L2 (). Ent
ao, por continuidade, L se estende de modo u
nico a uma isometria
linear definida em todo o L2 (). Observe que esta isometria e invertvel: a
inversa e construda do mesmo modo, a partir da inversa de H. Finalmente,
Uf L(XC ) = Uf (XH(C) ) = Xf(H(C)) = XH(g (C)) = L(Xg(C) ) = L Ug (XC )
Por linearidade, segue que Uf L() = L Ug () para toda
para todo C C.
funcao simples; ent
ao, por continuidade, o mesmo vale para todo L2 ().
Em resumo, temos a seguinte relacao entre as tres relacoes de equivalencia:
equivalencia erg
odica isomorfismo erg
odico equivalencia espectral.
No que segue vamos discutir algumas recprocas parciais, comecando pela relacao entre isomorfismo erg
odico e equivalencia espectral.


8.5. ESPAC
OS DE LEBESGUE E ISOMORFISMO ERGODICO

239

O seguinte resultado de Paul Halmos e John von Neumann [HvN42] amplia


a Proposicao 8.3.4 e mostra que para sistemas com espectro discreto as nocoes
de isomorfismo erg
odico e de equivalencia espectral coincidem. O leitor pode
encontrar a demonstracao na Secao 3.2 do livro de Peter Walters [Wal75].
Teorema 8.5.2 (Espectro discreto). Se (f, ) e (g, ) s
ao sistemas erg
odicos
com espectro discreto ent
ao as seguintes condic
oes s
ao equivalentes:
1. (f, ) e (g, ) s
ao espectralmente equivalentes;
2. os operadores de Koopman de (f, ) e (g, ) tem os mesmos autovalores;
3. (f, ) e (g, ) s
ao erg
odicamente isomorfos.
Em particular, todo sistema erg
odico invertvel com espectro discreto e ergodicamente isomorfo ao seu inverso.

8.5.2

Espacos de Lebesgue

Seja (M, B, ) um espaco de probabilidade qualquer. Inicialmente, suponha que


a medida e n
ao atomica, ou seja que ({x}) = 0 para todo x M . Suponha
que e dada uma sequencia crescente P1 Pn de particoes finitas de
M em conjuntos mensuraveis. Dizemos que a sequencia e separadora se dados
pontos distintos x, y M existe n 1 tal que Pn (x) 6= Pn (y). Em outras
palavras, os elementos n
ao vazios da particao
em um u
nico ponto.
n=1 Pn cont
Seja MP o subconjunto obtido quando removemos de M todos os P n Pn
com medida nula. Observe que MP tem medida total. Representamos por
BP e P as restricoes de B e , respectivamente, a MP . Seja m a medida de
Lebesgue em R. A proxima proposicao significa que a sequencia separadora nos
permite representar o espaco de probabilidade (MP , BP , P ) como uma especie
de subespaco da reta. Dizemos especie porque, em geral, a imagem (MP )
n
ao e um subconjunto mensuravel de R.
Proposi
c
ao 8.5.3. Dada qualquer sequencia separadora (Pn )n , existe um compacto totalmente desconexo K R e existe uma aplicac
ao injetiva mensur
avel
: MP K tal que para todo P n Pn o fecho da imagem (P ) e um aberto
fechado de K com m((P )) = (P ). Em particular, coincide com a restric
ao
da medida de Lebesgue m ao conjunto K.
Demonstrac
ao. Escreva n = 1 + 1/n para n 1. Vamos construir uma
sequencia de aplicacoes bijetivas n : Pn In , n 1 satisfazendo:
(a) cada In e uma famlia finita de intervalos compactos, disjuntos dois-a-dois;
(b) cada elemento de In , n > 1 est
a contido em algum elemento de In1 ;
(c) m(n (P )) = n (P ) para todo P Pn e todo n 1.

CAPITULO 8. SISTEMAS EQUIVALENTES

240

Para isso, comecemos por escrever P1 = {P1 , . . . , PN }. Consideremos qualquer


famlia I1 = {I1 , . . . , IN } de intervalos compactos, disjuntos dois-a-dois tais
que m(Ij ) = 1 (Pj ) para todo j. Seja 1 : P1 I1 a aplicacao que a cada
Pj associa o respectivo Ij . Agora suponhamos que, para um dado n 1,
foram construdas aplicacoes 1 , . . . , n satisfazendo (a), (b), (c). Para cada
P Pn , seja I = n (P ) e sejam P1 , . . . , PN os elementos de Pn+1 contidos
em P . Tomemos intervalos I1 , . . . , IN I compactos, disjuntos dois-a-dois e
satisfazendo m(Ij ) = n+1 (Pj ) para cada j = 1, . . . , N . Isto e possvel porque,
por hip
otese de inducao,
m(I) = n (P ) = n

N
X

(Pj ) > n+1

N
X

(Pj ).

j=1

j=1

Ent
ao, defina n+1 (Pj ) = Ij para cada j = 1, . . . , N . Repetindo este procedi claro
mento para cada P Pn completamos a definicao de n+1 e de In+1 . E
que as condicoes (a), (b), (c) sao preservadas. Isto encerra a construcao.
claro que K e compacto e que a sua intersecao
Agora, seja K = n IIn I. E
com qualquer I In e um aberto fechado de K. Alem disso,
max{m(I) : I In } = n max{(P ) : P Pn } 0

quando n (8.5.1)

porque a sequencia (Pn )n e separadora e a medida e n


ao atomica. Logo K
e totalmente desconexo. Para cada x MP , os intervalos n (Pn (x)) formam
uma sequencia decrescente de compactos cujos comprimentos decrescem para
zero. Definimos (x) como sendo o u
nico ponto em n n (Pn (x)). A hipotese
de que a sequencia e separadora garante que e injetiva: se x 6= y ent
ao existe
n 1 tal que Pn (x) Pn (y) = e, portanto, (x) 6= (y). Por construcao, a
pre-imagem de K I est
a em n Pn para todo I n In . Considere a algebra
A das uni
oes finitas disjuntas de conjuntos K I desta forma. Esta algebra
e geradora e acabamos de verificar que 1 (A) e um conjunto mensuravel para
todo A A. Portanto, a transformacao e mensuravel.
Para verificar as propriedades no enunciado da proposicao, comecemos por
notar que, para todo n 1 e P Pn ,
(P ) =

[
\

k (Q),

(8.5.2)

k=n Q

onde a uni
ao e sobre todos os Q PkSque est
ao contidos em P . Para obter
a inclusao basta notar que (P ) = Q (Q) e que (Q) (Q) para todo
Q Pk e todo k. A recproca segue do fato de que (P ) intersecta todo k (Q)
(a intersecao contem (Q)) e de que o comprimento dos k (Q) converge para
zero quando k . Deste modo, fica provada a igualdade (8.5.2). Segue que
X
[

m((P )) = lim m
k (Q) = lim k (P ) = (P ).
k (Q) = lim
k

ao e sobre todos os
Alem disso, (8.5.2) significa que (P ) =
k=n I I, onde a uni
I Ik que est
ao contidos em n (P ). O lado direito desta igualdade coincide com


8.5. ESPAC
OS DE LEBESGUE E ISOMORFISMO ERGODICO

241

K n (P ) e, portanto, e um aberto fechado de K. Tambem segue da construcao


que 1 ((P )) = P . Consequentemente, ((P )) = (P ) = m((P )) para todo
P n Pn . Como a
algebra das unioes finitas disjuntas de conjuntos (P ) gera
a estrutura mensuravel de K, conclumos que = m | K.
Dizemos que um espaco de probablidade sem atomos (M, B, ) e um espaco
de Lebesgue se, para alguma sequencia separadora, (MP ) e um conjunto mensur
avel de Lebesgue. De fato, esta propriedade n
ao depende da escolha da
sequencia geradora (nem das famlias In na demonstracao da Proposicao 8.5.3),
mas n
ao demonstraremos esse fato; o leitor interessado podera encontrar uma
demonstracao em [Rok62, 2.2]. O Exerccio 8.5.6 mostra que e possvel definir
espaco de Lebesgue de forma um pouco mais direta, sem usar a Proposicao 8.5.3.
Note que se (MP ) e mensuravel ent
ao (P ) = (MP ) n (P ) e mensuravel
para todo P Pn e todo n. Logo, a inversa 1 tambem e uma transformacao
mensuravel. Alem disso, m((MP )) = (MP ) = 1 = m(K). Portanto, todo
espaco de Lebesgue (M, B, ) e equivalente, como espaco de medida, a um subconjunto mensuravel de um compacto totalmente desconexo da reta.
Observe que se M tem cardinalidade estritamente maior que a cardinalidade do contnuo ent
ao (M, B, ) n
ao admite nenhuma sequencia separadora e,
portanto, n
ao pode ser um espaco de Lebesgue. No Exerccio 8.5.8 propomos
outra construcao de espacos de probabilidade que n
ao sao espacos de Lebesgue.
Apesar de exemplos como estes, praticamente todos os espacos de probabilidade
com que lidamos sao espacos de Lebesgue:
Teorema 8.5.4. Se M e um espaco metrico completo separ
avel e e uma
probabilidade boreliana sem
atomos ent
ao (M, B, ) e um espaco de Lebesgue.
Demonstrac
ao. Seja X M subconjunto enumeravel denso e seja {Bn : n N}
uma enumeracao do conjunto das bolas B(x, 1/k) com x X e k 1. Vamos
construir uma sequencia crescente (Pn )n de particoes finitas tal que:
(i) Pn e mais fina do que {B1 , B1c } {Bn , Bnc } e
(ii) En = {x M : Pn (x) n
ao e compacto} satisfaz (En ) 2n .
Para isso, comece por considerar Q1 = {B1 , B1c }. Pela Proposicao A.3.7, existem
conjuntos compactos K1 B1 e K2 B1c tais que (B1 \ K1 ) 21 (B1 )
ao tome P1 = {K1 , B1 \ K1 , K2 , B1c \ K2 }.
e (B1c \ K2 ) 21 (B1c ). Ent
Agora, para cada n 1, suponha que ja construmos particoes P1 Pn
c
satisfazendo (i) e (ii). Considere a particao Qn+1 = Pn {Bn+1 , Bn+1
} e
sejam Q1 , . . . , Qm os seus elementos. Pela Proposicao A.3.7, existem compactos
Kj Qj tais que (Qj \ Kj ) 2(n+1) (Qj ) para todo j = 1, . . . , m. Tome
Pn+1 = {K1 , Q1 \ K1 , . . . , Km , Qm \ Km }.
claro que Pn+1 satisfaz (i) e (ii). Portanto, a nossa construcao est
E
a completa.
Resta mostrar que a existencia de tal sequencia (Pn )n implica a conclusao
do teorema. A propriedade (i) garante que a sequencia e separadora. Seja

242

CAPITULO 8. SISTEMAS EQUIVALENTES

: MP K uma aplicacao como na Proposicao 8.5.3. Fixe N 1 qualquer.


Considere qualquer ponto y K \ (MP ). Para cada n > N , seja In o intervalo
da famlia In que contem y e seja Pn o elemento de Pn tal que n (Pn ) = In . Note
que os Pn formam uma sequencia decrescente. Se eles fossem todos compactos,
existiria x n>N Pn e, por definicao, (x) seria igual a y. Como estamos
supondo que y n
ao est
a na imagem de , isto prova que existe algum l > N tal
que Pl n
ao e compacto. Tome l > N mnimo nestas condicoes e seja Il = l (Pl ).
Lembre que m(Il ) = l (Pl ) 2(Pl ). Sejam IN e PN as unioes de todos estes
Il e Pl , respectivamente, quando fazemos variar y em K \ (MP ). Por um lado,
IN contem K \ (MP ); por outro lado, PN est
a contido em l>N El . Alem disso,
os Il sao disjuntos dois-a-dois (porque tomamos l mnimo) e o mesmo vale para
os Pl . Logo,
[



m IN 2 PN 2
En 2N +1 .
l>N

Ent
ao, a intersecao N IN tem medida de Lebesgue nula e contem K \ (MP ).
Como K e um boreliano, isto mostra que (MP ) e um conjunto mensuravel de
Lebesgue.

O proximo resultado mostra que todos os espacos de Lebesgue sem atomos


sao isomorfos.
Proposi
c
ao 8.5.5. Se (M, B, ) e um espaco de Lebesgue sem
atomos, existe
uma aplicac
ao mensur
avel invertvel h : M [0, 1] (definida entre subconjuntos
de medida total) tal que h coincide com a medida de Lebesgue em [0, 1].
Demonstrac
ao. Seja : MP K uma aplicacao como na Proposicao 8.5.3.
Considere a aplicacao g : K [0, 1] definida por g(x) = m([a, x] K), onde
imediato da definicao que g e n
a = min K. E
ao descrescente e Lischitz:
g(x2 ) g(x1 ) = m([x1 , x2 ] K) x2 x1 ,
para quaisquer x1 < x2 em K. Em particular, g e mensuravel. Por monotonia,
a pre-imagem de qualquer intervalo [y1 , y2 ] [0, 1] e um conjunto [x1 , x2 ] K
com x1 , x2 K e g(x1 ) = y1 e g(x2 ) = y2 . Em particular,
m([x1 , x2 ] K) = g(x2 ) g(x1 ) = y2 y1 = m([y1 , y2 ]).
Isto mostra que g (m | K) = m | [0, 1]. Seja Y o conjunto dos y [0, 1] tais
que g 1 ({y}) = [x1 , x2 ] K com x1 , x2 K e x1 < x2 . Seja X = g 1 (Y ).
Ent
ao, m(X) = m(Y ) = 0 porque Y e enumeravel. Alem disso, a restricao
g : K \ X [0, 1] \ Y e bijetiva. A sua inversa e n
ao decrescente e, portanto,
mensuravel. Agora, tome h = g . Segue das observacoes anteriores que
h : MP \ 1 (X) g((MP )) \ Y
e uma bijecao mensuravel com inversa mensuravel tal que h = m | [0, 1].


8.5. ESPAC
OS DE LEBESGUE E ISOMORFISMO ERGODICO

243

Agora considere um espaco de probabilidade (M, B, ) qualquer, possivelmente com


atomos. Seja A M o conjunto de todos os atomos; note que A e
finito ou, no maximo, enumer
avel. Se o espaco e puramente atomico, ou seja, se
(A) = 1 ent
ao, por definicao, ele e um espaco de Lebesgue. Mais geralmente,
seja M = M \ A, seja B a restricao de B a M e seja a restricao normalizada
de a B . Por definicao, (M, B, ) e um espaco de Lebesgue se (M , B , ) e
um espaco de Lebesgue.
O Teorema 8.5.4 continua valido no caso geral: todo espaco metrico completo
separ
avel munido de uma probabilidade boreliana, possivelmente com atomos, e
um espaco de Lebesgue. Alem disso, a Proposicao 8.5.5 admite a seguinte generalizacao para o caso atomico: se (M, B, ) e um espaco de Lebesgue e A M
representa o conjunto dos
atomos da medida , ent
ao existe uma aplicacao
mensuravel invertvel h : M [0, 1 (A)] A tal que h coincide com m no
intervalo [0, 1 (A)] e coincide com em A.

Proposi
c
ao 8.5.6. Sejam (M, B, ) e (N, C, ) dois espacos de Lebesgue e seja
H : C B um isomorfismo entre as respectivas
algebras de medida. Ent
ao
existe uma aplicac
ao mensur
avel invertvel h : M N tal que h = e
para todo C C.
Alem disso, h e essencialmente u
H=h
nica: duas quaisquer
aplicac
oes satisfazendo estas propriedades coincidem em -quase todo ponto

Vamos esbocar a demonstracao desta proposicao no caso n


ao atomico. Os argumentos se baseiam nas ideias e notacoes da demonstracao da Proposicao 8.5.3.
Comecemos pela unicidade. Sejam h1 , h2 : M N duas aplicacoes tais que
(h1 ) = (h2 ) = . Suponha que h1 (x) 6= h2 (x) para todo x num conjunto
E M com (E) > 0. Seja (Qn )n uma sequencia separadora em (N, C, ).
Ent
ao, Qn (h1 (x)) 6= Qn (h2 (x)) para todo x E e todo n suficientemente
grande. Logo, podemos fixar n (grande) e E E com (E ) > 0 tal que
Qn (h1 (x)) 6= Qn (h2 (x)) para todo x E . Consequentemente, existe Q Qn
e E E com (E ) > 0 tal que Qn (h1 (x)) = Q e Qn (h2 (x)) 6= Q para todo
1

x E . Portanto, E h1
1 (Q) \ h2 (Q). Isto implica que h1 (Q) 6= h2 (Q) e,
1 6= h
2.
logo, h
Passemos agora a comentar a existencia. Sejam (Pn )n e (Qn )n sequencias
separadoras em (M, B, ) e (N, C, ), respectivamente. Defina Pn = Pn H(Qn )
e Qn = Qn H 1 (Pn ). Ent
ao (Pn )n e (Qn )n tambem sao sequencias separadoras e Pn = H(Qn ) para cada n. Seja : MP K uma aplicacao como na
Proposicao 8.5.3 e seja n : Pn In , n 1 a famlia de bijecoes utilizada na
sua construcao. Sejam : NQ L e n : Qn Jn objetos correspondentes
para (N, C, ). Como estamos supondo que (M, B, ) e (N, C, ) sao espacos de
Lebesgue, e sao aplicacoes invertveis sobre subconjuntos de medida total.
Recorde tambem que m(n (P )) = n (P ) para cada P Pn e, analogamente,
m(n (Q)) = n (Q) para cada Q Qn . Logo, m(n (P )) = m(n (Q)) se
P = H(Q). Ent
ao, para cada n,
n H 1
n : Jn In

(8.5.3)

e uma bijecao que preserva o comprimento. Dados z K e n 1, seja In o


elemento de In que contem z e seja Jn o elemento de Jn que lhe corresponde,

CAPITULO 8. SISTEMAS EQUIVALENTES

244

via (8.5.3). Por construcao, (Jn )n e uma sequencia encaixada de intervalos


compactos cujo comprimento converge para zero. Seja (z) o u
nico ponto na
sua intersecao. Desta forma fica definida uma aplicacao mensuravel : K L
claro da construcao que e invertvel e
que preserva a medida de Lebesgue. E
a inversa tambem e mensuravel. Agora basta tomar h = 1 .
Resta verificar que h e invertvel. Aplicando a construcao do par
agrafo
.
anterior `
a inversa H 1 encontramos h : N M tal que h = e H 1 = h
h = h
h
= id e h
h
= id Por unicidade, segue que
^
^
Ent
ao, h
h = h

h h = id e h h = id em quase todo ponto.


Corol
ario 8.5.7. Sejam (M, B, ) e (N, C, ) dois espacos de Lebesgue e sejam
f : M M e g : N N transformac
oes mensur
aveis preservando as medidas
nos respectivos espacos. Ent
ao (f, ) e (g, ) s
ao ergodicamente equivalentes se,
e somente se, s
ao ergodicamente isomorfos.
Demonstrac
ao. S
o precisamos mostrar que se os sistemas sao ergodicamente
erg
odicos ent
ao eles sao ergodicamente equivalentes. Seja H : C B um isomorfismo erg
odico. Pela Proposicao 8.5.6, existe uma aplicacao mensuravel
Ent
invertvel h : M N tal que h = e H = h.
ao
= f H = H g = h
g = g]
h]
f = f h
h.
Pela unicidade na Proposicao 8.5.6, segue que h f = g h em -quase todo
ponto. Isto mostra que h e uma equivalencia erg
odica.

8.5.3

Exerccios

8.5.1. Seja H : C B um homomorfismo de algebras de medida. Mostre que


l
X
i=1

bi XBi =

k
X
j=1

cj XCj

l
X
i=1

bi XH(Bi ) =

k
X
j=1

cj XH(Cj ) .

8.5.2. Verifique que o homomorfismo de algebra de medida g : C B induzido por uma aplicacao mensuravel g : M N que preserva medida e injetivo.
Suponha que N e espaco de Lebesgue. Mostre que, dada outra aplicacao men
sur
avel h : M N que preserva medida, os respectivos homomorfismos g e h
coincidem se, e somente se, g = h em quase todo ponto.
8.5.3. Seja f : M M transformacao mensuravel num espaco de Lebesgue
(M, B, ), preservando a medida . Mostre que (f, ) e invertvel em quase
todo ponto (ou seja, existe um subconjunto invariante de medida total restrito
ao qual f e uma bijecao mensuravel com inversa mensuravel) se, e somente se,
o respectivo homomorfismo de algebras de medida f : B B e sobrejetivo.
8.5.4. Mostre que o operador de Koopman de um sistema (f, ) e sobrejetivo
se, e somente se, o respectivo homomorfismo de algebras de medida f : B B
e sobrejetivo. Em espacos de Lebesgue isso acontece se, e somente se, o sistema
e invertvel em quase todo ponto.


8.5. ESPAC
OS DE LEBESGUE E ISOMORFISMO ERGODICO

245

8.5.5. Mostre que todo sistema (f, ) com espectro discreto num espaco de
Lebesgue e invertvel em quase todo ponto.
8.5.6. Dada uma sequencia separadora P1 Pn , chamamos cadeia
a qualquer sequencia (Pn )n com Pn Pn e Pn+1 Pn para todo n. Dizemos
que a cadeia e vazia se n Pn = . Considere a aplicacao : MP K construda
na Proposicao 8.5.3. Mostre que (MP ) e conjunto mensuravel de Lebesgue e
m(K \ (MP )) = 0 se, e somente se, as cadeias vazias tem medida nula, no
seguinte sentido: para todo > 0 existe B M tal que B e uma uniao de
elementos de n Pn com (B) < e se (Pn )n e uma cadeia vazia ent
ao Pn B
para todo n suficientemente grande.
8.5.7. Prove a seguinte extensao da Proposicao 2.4.4: Se f : M M preserva
uma probabilidade e (M, ) e um espaco de Lebesgue, ent
ao admite um
M
.
(
unico) levantamento
para a extensao natural f : M
8.5.8. Seja M um subconjunto de [0, 1] com medida exterior m (M ) = 1 mas
que n
ao e conjunto mensuravel de Lebesgue. Considere a -algebra M dos
conjuntos da forma M B, onde B e subconjunto mensuravel de Lebesgue R.
Verifique que (M B) = m(B) define uma probabilidade em (M, M) tal que
(M, M, ) n
ao e um espaco de Lebesgue.

246

CAPITULO 8. SISTEMAS EQUIVALENTES

Captulo 9

Entropia
A palavra entropia foi inventada em 1865 pelo fsico e matematico alem
ao Rudolf Clausius, um dos pioneiros fundadores da Termodinamica. Na teoria dos
sistemas termodin
amicos em equilbrio, a entropia e uma medida do grau de desordem do sistema. A segunda lei da Termodinamica afirma que, quando um
sistema isolado passa de um equilbrio a outro, a entropia do estado final e necessariamente maior do que a entropia do estado inicial. Por exemplo, quando juntamos dois recipientes contendo gases distintos, digamos oxigenio e nitrogenio,
os dois gases se misturam ate alcancar um novo equilbrio macroscopico no qual
ambos se encontram uniformemente distribudos no conjunto dos dois recipientes. A entropia deste novo estado e superior `a entropia do equilbrio inicial, no
qual os dois gases estavam separados.
Esta nocao desempenha um papel de destaque em diversas outras areas do
conhecimento. Um exemplo importante, que iremos explorar na nossa apresentacao, e a Teoria da Informacao, desenvolvida a partir dos trabalhos do
engenheiro americano Claude Shannon em meados do seculo 20. Mais ou menos
ao mesmo tempo, os matematicos sovieticos Andrey Kolmogorov e Yakov Sinai
estavam propondo uma definicao de entropia de um sistema em Teoria Erg
odica.
O principal objetivo era fornecer um invariante de equivalencia erg
odica que, em
particular, permitisse distinguir dois deslocamentos de Bernoulli. Esta nocao e
o tema do presente captulo.
Na Secao 9.1 definiremos a entropia de uma transformacao relativamente
a uma probabilidade invariante, a partir de uma analogia com a Teoria da
Informacao. O teorema de Kolmogorov-Sinai, que discutiremos na Secao 9.2,
constitui uma ferramenta fundamental para o c
alculo da entropia de sistemas
especficos. Na Secao 9.3 analisaremos a entropia de um ponto de vista mais
local, que se relaciona diretamente com a formulacao de Shannon. Em seguida,
na Secao 9.4, ilustraremos alguns metodos de c
alculo da entropia por meio de
exemplos concretos.
Na Secao 9.5 discutiremos o papel da entropia como invariante de equivalencia erg
odica. O grande destaque e o teorema de Ornstein (Teorema 9.5.2)
segundo o qual dois deslocamentos de Bernoulli bilaterais sao ergodicamente
247

CAPITULO 9. ENTROPIA

248

equivalentes se, e somente se, eles tem a mesma entropia. Nessa secao tambem
introduzimos a classe dos sistemas de Kolmogorov, a qual inclui (estritamente)
os deslocamentos de Bernoulli e est
a contida (tambem estritamente) na classe
dos sistemas com espectro de Lebesgue.
Nas duas u
ltimas secoes apresentaremos dois t
opicos complementares que
serao u
teis posteriormente. O primeiro (Secao 9.6) e o teorema de Jacobs, segundo o qual a entropia se comporta de modo afim relativamente `a decomposicao
erg
odica. O outro (Secao 9.7) diz respeito `a nocao de jacobiano e suas relacoes
com a entropia.

9.1

Defini
c
ao de entropia

Para motivar a definicao de entropia de Kolmogorov-Sinai, vamos considerar a


seguinte situacao b
asica da Teoria da Informacao. Consideremos um canal de
comunicacao que transmite, sucessivamente, certos smbolos. Esse canal pode
ser um telegrafo transmitindo pontos e tracos, segundo o antigo c
odigo Morse,
uma fibra
otima, transmitindo zeros e uns, segundo o c
odigo binario ASCII, ou
qualquer outro sistema de transmissao sequencial de informacao. O objetivo e
medir a entropia do canal, ou seja, a quantidade de informacao transmitida, em
media, a cada unidade de tempo.

9.1.1

Entropia em Teoria da Informac


ao

Para formalizar esta ideia, suponhamos que os smbolos transmitidos pelo canal
pertencem a um certo alfabeto A previamente definido. Nem todos os caracteres deste alfabeto tem a mesma frequencia, ou seja, a mesma probabilidade
de serem utilizados. Por exemplo, se o canal est
a transmitindo mensagens na
lngua portuguesa a letra A sera utilizada com muito maior probabilidade que
a letra Z. Portanto, nem todos os caracteres carregam a mesma quantidade de
informacao: quanto mais improvavel e um caracter, menor e o n
umero de palavras que o contem e, portanto, mais informacao est
a associada a esse caracter.
Analogamente, quanto mais improvavel for uma palavra, menor e o n
umero
de frases em que ela participa e, portanto, maior e a quantidade informacao
associada a essa palavra.
Convem observar que quantidade de informacao associada a cada caracter,
ou a cada palavra, depende dos demais caracteres ou palavras. Por exemplo,
se o canal est
a transmitindo em lngua portuguesa e gera, sucessivamente, os
caracteres I, N, V, A, R, I, A, N e T ent
ao o caracter seguinte devera ser um
E; neste caso, em vista dos caracteres transmitidos anteriormente, esta letra E
n
ao carrega informacao adicional.1
1 Um dos autores deste livro participou uma vez num jogo que consistia em seguir pistas
para adivinhar, sucessivamente, certas letras que formariam o nome de um objeto matem
atico.
Aconteceu que as tr
es primeiras letras obtidas foram Z, Z e Z. Essa circunst
ancia arruinou a
continuaca
o do jogo, pois as demais letras n
ao acrescentariam qualquer informaca
o: o u
nico
objeto matem
atico cuja nome inclui tr
es vezes a letra Z
e o Puzzle de Yoccoz.

DE ENTROPIA
9.1. DEFINIC
AO

249

Por outro lado, quando os caracteres transmitidos sucessivamente sao independentes uns dos outros, ent
ao a informacao de cada um se soma `a informacao
anterior. Por exemplo, se a transmissao reflete os resultados de lancamentos sucessivos de uma moeda justa, a informacao correspondente ao resultado (Cara,
Coroa, Coroa) deve ser igual `
a soma das informacoes correspondentes a cada
um dos caracteres Cara, Coroa e Coroa. Ora, por independencia, a probabilidade do evento (Cara, Coroa, Coroa) e o produto das probabilidades dos eventos
Cara, Coroa e Coroa. Isto sugere que a informacao deve ser definida em termos
do logaritmo da probabilidade.
Em Teoria da Informacao e usual considerar logaritmos na base 2, porque
essencialmente todos os canais de informacao que encontramos na pratica sao
binarios. No entanto, em Teoria Erg
odica e mais comum considerar logaritmos naturais (base e), e n
os faremos o mesmo. Por definicao, a quantidade de
informac
ao associada a um caracter a A est
a dada por
I(a) = log pa

(9.1.1)

onde pa e a probabilidade (frequencia) do caracter a. A informac


ao media
associada ao alfabeto A e dada por
X
X
I(A) =
pa I(a) =
pa log pa .
(9.1.2)
a

Mais geralmente, a informacao associada a uma palavra a1 . . . an e


I(a1 . . . an ) = log pa1 ...an

(9.1.3)

onde a probabilidade pa1 ...an da palavra e, usualmente, maior que o produto


pa1 . . . pan das probabilidades das suas letras (vale a igualdade no caso independente). Denotando por An o conjunto de todas as palavras de comprimento n,
definimos
X
X
pa1 ...an log pa1 ...an . (9.1.4)
pa1 ...an I(a1 , . . . , an ) =
I(An ) =
a1 ,...,an

a1 ,...,an

Finalmente, a entropia do canal de comunicacao e definida por:


I = lim
n

9.1.2

1
I(An ).
n

(9.1.5)

Entropia de uma partic


ao

Queremos adaptar estas ideias ao nosso contexto em Teoria Erg


odica. A principal diferenca e que, enquanto em Teoria da Informacao o alfabeto A e discreto
(finito), em geral, esse n
ao e necessariamente o caso para o espaco de estados
da maioria dos sistemas din
amicos interessantes. Esse ponto e resolvido fazendo
uso de particoes, finitas ou enumeraveis, do espaco de estados.
Seja (M, B, ) um espaco de probabilidade. Neste captulo, por partic
ao
sempre entenderemos uma famlia finita ou enumeravel P de subconjuntos mensur
aveis de M disjuntos dois-a-dois e cuja uniao tem medida total. Denotamos

CAPITULO 9. ENTROPIA

250

por P(x) o elemento da particao que contem um ponto x. A soma P Q de


duas particoes P e Q e a particao cujos elementos sao as intersecoes P Q
com P P e Q Q. Mais geralmente, dada qualquer famlia enumeravel de
particoes Pn , definimos
_
\

Pn =
Pn : Pn Pn para cada n
n

A cada particao P associamos a respectiva func


ao de informac
ao
IP : M R,

IP (x) = log (P(x)).

(9.1.6)

claro que a funcao IP e mensuravel. Ent


E
ao chamamos entropia, ou informac
ao
media, da particao P ao n
umero
Z
X
H (P) = IP d =
(P ) log (P ).
(9.1.7)
P P

Como e usual na teoria da integral de Lebesgue, fazemos a convencao de que


0 log 0 = limx0 x log x = 0. Veja a Figura 9.1.

Figura 9.1: Grafico da funcao (x) = x log x


Relacionado com isto, a seguinte observacao sera u
til em diversas ocasioes.
Considere a funcao : (0, ) R dada por (x) = x log x. Derivando duas
vezes vemos que < 0. Portanto e c
oncava:
t1 (x1 ) + + tk (xk ) (t1 x1 + + tk xk )

(9.1.8)

para todo x1 , . . . , xk > 0 e t1 , . . . , tk > 0 com t1 + + tk = 1. Alem disso, a


concavidade e estrita: vale a igualdade em (9.1.8) se, e somente se, x1 = =
xk .
Dizemos que duas particoes P e Q sao independentes se (P Q) = (P )(Q)
para todo P P e todo Q Q. Nesse caso, IPQ = IP + IQ e, portanto,
H (P Q) = H (P) + H (Q). Em geral, vale a desigualdade como veremos
daqui a pouco.

DE ENTROPIA
9.1. DEFINIC
AO

251

Exemplo 9.1.1. Considere M = [0, 1] munido da medida de Lebesgue.  Para


cada n 1 considere a particao P n nos subintervalos (i 1)/10n , i/10n com
1 i 10n . Ent
ao
n

H (P ) =

10
X
i=1

10n log 10n = n log 10.

Exemplo 9.1.2. Seja M = {1, . . . , d}N munido de uma medida produto = N .


Denotamos pi = ({i}) para cada i {1, . . . , d}. Para cada n 1, seja P n a
particao de M em cilindros [0; a1 , . . . , an ] de comprimento n. A entropia de P n
e
X

pa1 . . . pan log(pa1 . . . pan
H (P n ) =
a1 ,...,an

X X
j

a1 ,...,an

XX
j

aj

pa1 . . . paj . . . pan log paj

paj log paj

Au
ltima soma e igual a 1, uma vez que
H (P n ) =

n X
d
X

j=1 aj =1

paj log paj =

pa1 . . . paj1 paj+1 . . . pan .

ai ,i6=j

pi = 1. Portanto,

n X
d
X
j=1 i=1

pi log pi = n

d
X

pi log pi .

i=1

Lema 9.1.3. Toda partic


ao finita tem entropia finita. De fato, H (P) log #P
e vale a igualdade se, e somente se, (P ) = 1/#P para todo P P.
Demonstrac
ao. Seja P = {P1 , P2 , . . . , Pn } e considere os n
umeros ti = 1/n e
xi = (Pi ). Pela desigualdade de Jensen (Teorema A.5.8):
n
n
X
X

1  log n
1
ti xi =
ti (xi )
H (P) =
=
.
n
n
n
i=1
i=1

Portanto, H (P) log n. Alem disso, a igualdade ocorre se, e somente se,
(Pi ) = 1/n para todo i = 1, . . . , n.
O exemplo a seguir mostra que particoes enumeraveis podem ter entropia
infinita. A partir daqui, ao longo de todo o captulo, sempre consideraremos
particoes (finitas ou enumer
aveis) com entropia finita. Alguns enunciados serao
restritos ao caso de particoes finitas.
Exemplo 9.1.4. Considere
M = [0, 1] munido da medida de Lebesgue . ObP
serve que a serie k=1 1/(k(log k)2 ) e convergente. Seja c o valor da soma.
Ent
ao podemos decompor [0, 1] em intervalos Pk com (Pk ) = 1/(ck(log k)2 )
para todo k. Seja P a particao formada por estes intervalos. Ent
ao,
H (P) =

X
log c + log k + 2 log log k
k=1

ck(log k)2

CAPITULO 9. ENTROPIA

252

Pelo criterio
raz
ao, a serie do lado direito tem o mesmo comportamento
Pda

que a serie k=1 1/(k log k) que, como sabemos, e divergente (use o criterio da
integral). Portanto, H (P) = .
Chamamos entropia condicional de uma particao P com relacao a uma
particao Q ao n
umero
X X
(P Q)
.
(9.1.9)
H (P/Q) =
(P Q) log
(Q)
P P QQ

Intuitivamente, ele mede a informacao adicional fornecida pela particao P uma


claro que H (P/M) = H (P)
vez conhecida a informacao da particao Q. E
para todo P, onde M denota a particao trivial M = {M }. Alem disso, se P e
Q sao independentes ent
ao H (P/Q) = H (P). Em geral, vale a desigualdade
como veremos num instante.
Dadas duas particoes, P e Q dizemos que P e menos fina que Q, e escrevemos
P Q, se todo elemento de Q est
a contido em algum elemento de P, a menos de
medida nula. A soma P Q e, precisamente, a menos fina de todas as particoes
R tais que P R e Q R.
Lema 9.1.5. Sejam P, Q e R partic
oes com entropia finita. Ent
ao,
(a) H (P Q/R) = H (P/R) + H (Q/P R);

(b) se P Q ent
ao H (P/R) H (Q/R) e H (R/P) H (R/Q).
(c) P Q se, e somente se, H (P/Q) = 0.

Demonstrac
ao. Por definicao,
X
(P Q R)
H (P Q/R) =
(P Q R) log
(R)
P,Q,R

P,Q,R

(P Q R) log
+

P,Q,R

(P Q R)
(P R)

(P Q R) log

A soma do lado direito pode ser reescrita como


X
X
(C Q)
(S Q) log
+
(S)
SPR,QQ

P P,RR

(P R)
.
(R)

(P R) log

(P R)
(R)

= H (Q/P R) + H (P/R).

Isto demonstra o item (a). Agora observe que se P Q ent


ao
XX X
(P R)
H (P/R) =
(Q R) log
(R)
P

R QP

XX X
P

R QP

(Q R) log

(Q R)
= H (Q/R).
(R)

DE ENTROPIA
9.1. DEFINIC
AO

253

Isto prova a primeira parte do item (b). Para provar a segunda parte, note que
para quaisquer P P e R R, tem-se
X (Q) (R Q)
(R P )
=
.
(P )
(P ) (Q)
QP

Claro que
rema A.5.8),

QP

(Q)/(P ) = 1. Ent
ao, pela desigualdade de Jensen (Teo

X (Q) (R Q) 
(R P ) 

(P )
(P )
(Q)
QP

para todo P P e R R. Consequentemente,


H (R/P) =

(P )

P,R

Q,R

X (Q) (R Q) 
(R P )  X

(P )

(P )
(P )
(Q)
P,R

QP

(R Q) 
= H (R/Q).
(Q)
(Q)

Finalmente, segue da definicao (9.1.9) que H (P/Q) = 0 se, e somente se, para
todo P P e todo Q Q,
(P Q) = 0

ou ent
ao

(P Q)
= 1.
(Q)

Em outras palavras, ou Q e disjunto de P (a menos de medida nula) ou Q est


a
contido em P (a menos de medida nula). Isto quer dizer que H (P/Q) = 0 se,
e somente se, P Q.
Em particular, tomando Q = M no item (b) do lema obtemos que
H (R/P) H (R)

para quaisquer particoes R e P.

(9.1.10)

Alem disso, tomando R = M no item (a), vem que


H (P Q) = H (P) + H (Q/P) H (P) + H (Q).

(9.1.11)

Seja f : M N uma transformacao mensuravel e seja uma probabilidade


em M . Ent
ao f e uma probabilidade em N . Alem disso, se P e uma particao
de N ent
ao f 1 (P) = {f 1 (P ) : P P} e uma particao de M . Por definicao:
X
H (f 1 (P)) =
(f 1 (P )) log (f 1 (P ))
P P

P P

f (P ) log f (P ) = Hf (P).

(9.1.12)

Em particular, se M = N e a medida e invariante por f ent


ao
H (f 1 (P)) = H (P) para toda particao P.
Tambem precisaremos da seguinte propriedade de continuidade:

(9.1.13)

CAPITULO 9. ENTROPIA

254

Lema 9.1.6. Dado k 1 e > 0 existe > 0 tal que, para quaisquer partic
oes
finitas P = {P1 , . . . , Pk } e Q = {Q1 , . . . , Qk },
(Pi Qi ) < para todo i = 1, . . . , k

H (Q/P) < .

Demonstrac
ao. Fixe > 0 e k 1. Pela continuidade da funcao : [0, 1] R,
(x) = x log x, existe > 0 tal que (x) < /k 2 para todo x [0, )(1, 1].
Tome = /k. Dadas particoes P e Q como no enunciado, denote por R a
particao cujos elementos sao as intersecoes Pi Qj com i 6= j e tambem o
conjunto ki=1 Pi Qi . Note que (Pi Qj ) (Pi Qi ) < para todo i 6= j e

k
[

i=1

k
k

 X
 X
(Pi ) = 1
(Pi ) (Pi Qi ) >
Pi Qi
i=1

i=1

Portanto,
H (R) =

((R)) < #R

RR

.
k2

claro da definicao que P Q = P R. Ent


E
ao, usando (9.1.11) e (9.1.10),
H (Q/P) = H (P Q) H (P) = H (P R) H (P)
= H (R/P) H (R) < .

Isto prova o lema.

9.1.3

Entropia de um sistema din


amico

Seja f : M M uma transformacao mensuravel preservando uma medida de


probabilidade . A nocao de entropia do sistema (f, ), apresentada a seguir,
e inspirada pela ideia de entropia de um canal de comunicacao definida por
(9.1.5).
Dada uma particao P de M com entropia finita, denotamos
Pn =

n1
_
i=0

f i (P) para cada n 1.

Observe que o elemento P n (x) que contem x M est


a dado por:
P n (x) = P(x) f 1 (P(f (x))) f n+1 (P(f n1 (x))).
claro que a sequencia P n e n
E
ao-decrescente, ou seja, P n P n+1 para todo n.
Portanto, a sequencia das entropias H (P n ) tambem e n
ao-decrescente. Outro
fato importante e que esta sequencia e subaditiva:
Lema 9.1.7. H (P m+n ) H (P m ) + H (P n ) para todo m, n 1.

DE ENTROPIA
9.1. DEFINIC
AO

255

m+n1 i
Demonstrac
ao. Por definicao, P m+n = i=0
f (P) = P m f m (P n ). Portanto, usando (9.1.11),

H (P m+n ) H (P m ) + H (f m (P n )).

(9.1.14)

Por outro lado, como e invariante por f , a propriedade (9.1.13) implica que
H (f m (P n )) = H (P n ) para todo m, n. Substituindo este fato em (9.1.14)
obtemos a conclusao do lema.
Chamamos entropia de f com respeito `
a medida e `
a partic
ao P o limite
h (f, P) = lim
n

1
1
H (P n ) = inf H (P n ).
n
n
n

(9.1.15)

Observe que esta entropia e tanto maior quanto mais fina for a particao. De
fato, se P Q ent
ao P n Qn para todo o n. Usando o Lema 9.1.5, segue que
n
n
H (P ) H (Q ) para todo n. Consequentemente,
PQ

h (f, P) h (f, Q)

(9.1.16)

Finalmente, a entropia do sistema (f, ) e definida por


h (f ) = sup h (f, P),

(9.1.17)

onde o supremo e tomado sobre todas as particoes com entropia finita. Uma
observacao u
til e que a definicao n
ao e afetada se considerarmos o supremo
apenas sobre as particoes finitas (veja o Exerccio 9.1.1).
Exemplo 9.1.8. Suponhamos que a medida invariante est
a suportada numa
orbita periodica. Em outras palavras, existe x em M e k 1 tal que f k (x) = x
e a medida e dada por
=


1
x + f (x) + + f k1 (x) .
k

Neste caso a medida so toma um n


umero finito de valores. Consequentemente,
a entropia H (P) tambem so toma um n
umero finito de valores quando consideramos todas as particoes enumer
aveis P. Em particular, limn n1 H (P n ) = 0
para toda particao P. Isto prova que neste caso h (f ) = 0.
Exemplo 9.1.9. Considere a transformacao expansao decimal f : [0, 1] [0, 1],
dada por f (x) = 10x [10x]. Como observamos anteriromente, f preserva a
medida de Lebesgue no intervalo . Seja P a particao de [0, 1] nos intervalos
da forma (i 1)/10, i/10] com i = 1, . . . , 10. Ent
ao P n e a particao nos
n
n
intervalos da forma (i 1)/10 , i/10 ] com i = 1, . . . , 10n . Usando o c
alculo
do Exemplo 9.1.1, obtemos que
h (f, P) = lim
n

1
H (P n ) = log 10.
n

Usando a teoria que sera desenvolvida na Secao 9.2, veremos que este e tambem
o valor da entropia h (f ), ou seja, P realiza o supremo na definicao (9.1.17).

CAPITULO 9. ENTROPIA

256

Exemplo 9.1.10. Considere o deslocamento : em = {1, . . . , d}N (ou


= {1, . . . , d}Z ), munido de uma medida de Bernoulli = N (respectivamente,
= N ). Seja P a particao de em cilindros [0; a] com a = 1, . . . , d. Ent
ao P n
e a particao em cilindros [0; a1 , . . . , an ] de comprimento n. Usando o c
alculo do
Exemplo 9.1.2 conclumos que
d

h (, P) = lim
n

X
1
pi log pi .
H (P n ) =
n
i=1

(9.1.18)

A teoria que apresentaremos na Secao 9.2 permitira concluir que este e tambem
o valor da entropia h ().
Segue da expressao (9.1.18) que para todo x > 0 existe algum deslocamento
de Bernoulli (, ) tal que h () = x. Usaremos esta observacao um certo
n
umero de vezes ao longo do texto.
Lema 9.1.11. h (f, Q) h (f, P) + H (Q/P) para quaisquer partic
oes P e
Q com entropia finita.
Demonstrac
ao. Pelo Lema 9.1.5, para todo n 1 vale que


H Qn+1 /P n+1 = H Qn f n (Q)/P n f n (P)


H Qn /P n + H f n (Q)/f n (P)

O u
ltimo termo e igual a H(Q/P), porque a medida e invariante por f .
Portanto, a relacao anterior prova que


H Qn /P n nH Q/P
para todo n 1.
(9.1.19)
Usando o Lema 9.1.5 uma vez mais, segue que

H (Qn ) H (P n Qn ) = H (P n ) + H (cQn /P n ) H (P n ) + nH (Q/P).


Dividindo por n e passando ao limite quando n obtemos a conclusao do
lema.
Lema 9.1.12. h (f, P) = limn H (P/
com entropia finita.

Wn

j=1

f j (P)) para qualquer partic


ao P

Demonstrac
ao. Usando o Lema 9.1.5(a) e o fato de que a medida e invariante:
H

n1
_
j=0

n1
n1
_
_



f j (P)
f j (P) + H P/
f j (P) = H

= H

j=1

j=1

n2
_

n1
_

j=0


f j (P) + H P/

j=1


f j (P)

DE ENTROPIA
9.1. DEFINIC
AO

257

para todo n. Por recorrencia, segue que


H

n1
_
j=0

k
n1
_
X


f j (P) .
f j (P) = H (P) +
H P/
j=1

k=1

Portanto, h (f, P) e dada pelo limite Cesaro


k
n1
n1
_
_


1X
1
j
f (P) = lim
f j (P) .
H P/
h (f, P) = lim H
n n
n n
j=0
j=1
k=1

Por outro lado, o Lema 9.1.5(b) garante que a sequencia H (P/ nj=1 f j (P)) e
decrescente. Em particular, limn nj=1 f j (P) existe e, consequentemente, coincide com o limite Cesaro na igualdade anterior.
n1 j
Recorde que P n = j=0
f (P). Quando f : M M e invertvel, tambem
n1
n
consideramos P
= j=n f j (P).

Lema 9.1.13. Se P e partic


ao com entropia finita ent
ao h (f, P) = h (f, P k )
para todo k 1. Se f e invertvel, tambem temos h (f, P) = h (f, P k ) para
todo k 1.
Demonstrac
ao. Observe que, dado qualquer n 1,
n1
_

f j (P k ) =

j=0

n1
_

f j

j=0

k1
_
i=0

_
 n+k2
f i (P) =
f l (P) = P n+k1 .
l=0

Portanto,




1
1
h f, P k = lim H P n+k1 = lim H P n = h f, P .
n n
n n

Isto prova a primeira parte do lema. Para provar a segunda parte, note que:
n1
_
j=0

f j (P k ) =

n1
_
j=0

f j

k1
_

i=k

_

 n+k2
f i (P) =
f l (P) = f k P n+2k1
l=k

para todo n e todo k. Portanto,






1
1
h f, P k = lim H f k (P n+2k1 ) = lim H P n+2k1 = h f, P .
n n
n n

(a segunda igualdade usa o fato de que e invariante por f ).

Proposi
c
ao 9.1.14. Tem-se h (f k ) = kh (f ) para todo k N. Se f e invertvel ent
ao h (f k ) = |k|h (f ) para todo k Z.

CAPITULO 9. ENTROPIA

258

Demonstrac
ao. Considere g = f k e seja P uma particao qualquer de M com
entropia finita. Lembrando que P k = P f 1 (P) f k+1 (P), vemos que
P km =

km1
_

f j (P) =

i=0

m1
_
i=0

f ki

k1
_
j=0

_
 m1
g i (P k ).
f j (P) =
i=0

Portanto,




1
kh f, P = lim H P km = h g, P k .
(9.1.20)
m m
Como P P k , esta igualdade implica que h (g, P) kh (f, P) h (g)
qualquer que seja P. Tomando o supremo sobre as particoes P, segue que
h (g) kh (f ) h (g). Ist prova que kh (f ) = h (g), conforme afirmado.
Agora suponha que f e invertvel. Seja P uma particao qualquer de M com
entropia finita. Para qualquer n 1,



n1 i
n1 i
n1 j
f (P) ,
f (P) = H i=0
f (P) = H f n+1 i=0
H j=0
uma vez que a medida e invariante. Dividindo por n e passando ao limite
quando n , obtemos que
h (f, P) = h (f 1 , P).

(9.1.21)

Tomando o supremo sobre estas particoes P, vem que h (f ) = h (f 1 ). Substituindo f for f k e usando o item (a), segue que h (f k ) = h (f k ) = kh (f )
para todo k N.

9.1.4

Exerccios

9.1.1. Mostre que o supremo de h (f, P) sobre todas as particoes finitas coincide com o supremo sobre todas as particoes com entropia finita.
k1 i
9.1.2. Verifique que limn H (i=0
f (P)/ nj=k f j (P)) = kh(f, P) para toda
particao P com entropia finita e todo k 1.

9.1.3. Seja f : M M uma transformacao preservando uma medida de probabilidade .


(a) Suponha que existe um conjunto invariante A M com (A) (0, 1).
Sejam A e B as restricoes normalizadas de aos conjuntos A e B = Ac ,
respectivamente. Mostre que h (f ) = (A)hA (f ) + (B)hB (f ).
Pn
(b) Suponha que e uma combinacao convexa =
i=1
Pai i de medidas
invariantes erg
odicas 1 , . . . , n . Mostre que h (f ) = ni=1 ai hi (f ).

[Observacao: Na Secao 9.6 obteremos resultados mais fortes.]

9.1.4. Considere transformacoes f : M M e g : N N preservando medidas


de probabilidade e , respectivamente. Considere f g : M M N N ,
dada por (f g)(x, y) = (f (x), g(y)). Mostre que f g preserva a medida
produto e que h (f g) = h (f ) + h (g).

9.2. TEOREMA DE KOLMOGOROV-SINAI

259

9.1.5. Sejam (M, B, ) e (N, C, ) espacos de probabilidade e f : M M e


g : N N transformacoes mensuraveis preservando as medidas e , respectivamente. Dizemos que (g, ) e um fator de (f, ) se existe uma aplicacao
mensuravel, n
ao necessariamente invertvel, : (M, B) (N, C) tal que =
e f = g em quase todo ponto. Mostre que nesse caso h (g) h (f ).

9.2

Teorema de Kolmogorov-Sinai

Em geral, a principal dificuldade no c


alculo da entropia reside no c
alculo do
supremo na definicao (9.1.17). Os metodos que vamos desenvolver nesta secao
permitem simplicar a tarefa em muitos casos de interesse, identificando certas
particoes P que realizam o supremo, isto e, tais que h (f, P) = h (f ). O
resultado principal e o seguinte:
Teorema 9.2.1 (Kolmogorov-Sinai). Seja P1 Pn uma sequencia
n
ao-decrescente de partic
oes com entropia finita tais que
n=1 Pn gera a algebra dos conjuntos mensur

aveis a menos de medida nula. Ent


ao
h (f ) = lim h (f, Pn ).
n

Demonstrac
ao. O limite sempre existe, pois a propriedade (9.1.16) implica que
a sequencia h (f, Pn ) e n
ao decrescente. Vamos usar o seguinte fato:
Lema 9.2.2. limn H (Q/Pn ) = 0 para qualquer partic
ao finita Q.
Demonstrac
ao. Escreva Q = {Q1 , . . . , Qk }. Dado qualquer > 0, fixe > 0
como no Lema 9.1.6. Seja A a
algebra formada pelas unioes finitas de elementos
de n P n . Por hip
otese, A gera a -algebra de todos os conjuntos mensuraveis.
Logo, pelo teorema de aproximacao (Teorema A.1.19), para cada i = 1, . . . , s
existe Ai A tal que
(Qi Ai ) < /(4k).
(9.2.1)
O fato de que os Qi sao uma cobertura de M garante que os Ai est
ao perto de
o serem tambem:


Ai (j6=i Aj ) nj=1 (Aj \ Qj ) < /4 para todo i
(9.2.2)
e

A seguir, defina



M \ ki=1 Ai ki=1 (Qi \ Ai ) < /4.

A1
Ai \ i1
Qi =
j=1 Aj

k1
Aj
M \ j=1

(9.2.3)

para i = 1
para 1 < i < k
para i = k

Ent
ao Q = {Q1 , . . . , Qk } e uma particao de M . Afirmamos que
(Ai Qi ) < /2 para todo i = 1, . . . , k.

(9.2.4)

CAPITULO 9. ENTROPIA

260

Isto e trivial para i = 1. Para i > 1 temos que Ai \ Qi est


a contido em
Ai (j<i Aj ). Logo, usando (9.2.2), obtemos que (Ai \ Qi ) < /4. Isto
prova a afirmacao para todo 1 < i < k, uma vez que nesse caso Qi \ Ai = .
Finalmente, para i = k, temos que Qk \ Ak est
a contido no complementar de
ki=1 Ai . Logo, usando (9.2.3), vemos que (Qk \ Ak ) < /4. Somando esta
estimativa com a anterior, vem que (Ak Qk ) < /2. Isto completa a prova da
afirmacao (9.2.4).
Combinando as desigualdades (9.2.1) e (9.2.4), obtemos que (Qi Qi ) <
para todo i = 1, . . . , k. Agora, e claro que Qi A para todo i. Ent
ao, como se
trata de uma famlia finita, podemos encontrar m 1 tal que todo Qi e uma
uni
ao de elementos de Pm . Em outras palavras, a particao Q = {Q1 , . . . , Qk }
e menos fina do que Pm . Ent
ao, pelos Lemas 9.1.5 e 9.1.6,
H (Q/Pn ) H (Q/Pm ) H (Q/Q ) <

para todo n m.

Isto completa a demonstracao do lema.


Pelo Lema 9.1.11, tambem temos que
h (f, Q) h (f, Pn ) + H (Q/Pn ) para todo n.
Passando ao limite quando n e, ent
ao, tomando o supremo sobre todas as
particoes finitas Q, obtemos a conclusao do teorema.

9.2.1

Partic
oes geradoras

Nesta secao, e nas seguintes, vamos deduzir diversas consequencias u


teis do
Teorema 9.2.1.
Corol
ario 9.2.3. Seja P uma partic
ao com entropia finita tal que a uni
ao
n1 j
dos seus iterados P n = j=0
f (P), n 1 gera a -
algebra dos conjuntos
mensur
aveis. Ent
ao h (f ) = h (f, P).
Demonstrac
ao. Basta aplicar o Teorema 9.2.1 `a sequencia P n , lembrando que
n
h (f, P ) = h (f, P) para todo n, de acordo com o Lema 9.1.13.
Corol
ario 9.2.4. Suponha que o sistema (f, ) e invertvel. Seja P uma
n1
partic
ao com entropia finita tal que a uni
ao dos iterados P n = j=n
f j (P),
n 1 gera a -
algebra dos conjuntos mensur
aveis. Ent
ao h (f ) = h (f, P).
Demonstrac
ao. Basta aplicar o Teorema 9.2.1 `a sequencia P n , lembrando que
n
h (f, P ) = h (f, P) para todo n, de acordo com o Lema 9.1.13.
Em particular, os Corolarios 9.2.3 e 9.2.4 completam o c
alculo da entropia da transformacao expansao decimal e dos deslocamentos de Bernoulli, que
iniciamos nos Exemplos 9.1.9 e 9.1.10, respectivamente.
Em qualquer dos casos nos Corolarios 9.2.3 e 9.2.4 dizemos que P e uma
partic
ao geradora, ou um gerador do sistema. Note, no entanto, que isto contem
um certo abuso de linguagem, ja que as condicoes nos dois corolarios n
ao sao

9.2. TEOREMA DE KOLMOGOROV-SINAI

261

equivalentes. Por exemplo, se tomarmos M = {1, . . . , d}Z ent


ao a particao P
em cilindros {[0; a] : a = 1, . . . , d} e tal que a uniao dos iterados bilaterais P n
gera a -algebra mas a a uni
ao dos iterados unilaterais P n n
ao gera. Quando
for necessario distinguir entre as dois conceitos, falaremos de gerador unilateral
e gerador bilateral, respectivamente.
A este respeito tambem observamos que certos sistemas invertveis admitem
geradores unilaterais, ou seja, tais que a uniao dos iterados P n , n 1 gera
a -algebra dos conjuntos mensuraveis. Por exemplo, se f : S 1 S 1 e uma
rotacao irracional e P = {I, S 1 \ I} e uma particao do crculo em dois intervalos
complementares, ent
ao P e gerador unilateral (e tambem bilateral, evidentemente). No entanto, este tipo de comportamento so e possvel para sistemas
com entropia nula:
Corol
ario 9.2.5. Suponha que f : M M e invertvel e existe alguma partic
ao
n
P com entropia finita tal que
P
gera
a
-
a
lgebra
dos
conjuntos
menn=1
sur
aveis de M a menos de medida nula. Ent
ao h (f ) = 0.
Demonstrac
ao. Combinando o Lema 9.1.12 e o Corolario 9.2.3:
h (f ) = h (f, P) = lim H (P/f 1 (P n )).
n

Como n P n gera a -algebra B dos conjuntos mensuraveis, n f 1 (P n ) gera


a -algebra f 1 (B). Mas f 1 (B) = B, uma vez que f e invertvel. Logo, o
Teorema 9.2.1 implica que H (P/f 1 (P n )) converge para zero quando n .
Segue que h (f ) = 0.
Suponha que M e um espaco metrico, munido da sua -algebra de Borel.
Corol
ario 9.2.6. Seja P1 Pn uma sequencia n
ao decrescente de
partic
oes com entropia finita tais que diam Pn (x) 0 para -quase todo x M .
Ent
ao
h (f ) = lim h (f, Pn ).
n

Demonstrac
ao. Seja U um aberto qualquer de M . A hipotese garante que para

cada x existe n(x) tal que o conjunto Px = Pn(x) (x) est


a contido em U . E
claro que Px pertence `
a
algebra A gerada por n Pn . Observe tambem que esta
algebra e enumer
avel, j
a que ela est
a formada pelas unioes finitas de elementos
das particoes Pn . Em particular, o conjunto dos valores tomados por Px e
enumer
avel. Segue que U = xU Px tambem est
a na algebra A. Isto prova que
a -agebra gerada por A contem todos os abertos e, portanto, contem todos
os conjuntos borelianos. Agora, a conclusao segue de uma aplicacao direta do
Teorema 9.2.1.
Exemplo 9.2.7. Seja f : S 1 S 1 um homeomorfismo e seja uma probabilidade invariante qualquer. Dada uma particao finita P de S 1 em subintervalos,
denotemos por x1 , . . . , xm os seus pontos extremos. Para qualquer j 1, a

CAPITULO 9. ENTROPIA

262

particao f j (P) est


a formada pelo subintervalos de S 1 determinados pelos ponj
tos f (xi ). Isto implica que, para cada n 1, os elementos de P n tem os seus
pontos extremos no conjunto
{f j (xi ) : j = 0, . . . , n 1 e i = 1, . . . , m}.
Em particular, #P n mn. Ent
ao, usando o Lema 9.1.3,
h (f, P) = lim
n

1
1
1
H (P n ) lim #P n = lim log kn = 0.
n n
n n
n

Segue que h (f ) = 0: para isso basta considerar qualquer sequencia de particoes


finitas em intervalos com diametro indo para zero e aplicar o Corolario 9.2.6.
Corol
ario 9.2.8. Seja P uma partic
ao com entropia finita tal que, para -quase
todo x M , tem-se diam P n (x) 0. Ent
ao h (f ) = h (f, P).
Demonstrac
ao. Basta aplicar o Corolario 9.2.6 `a sequencia P n , lembrando que
h (f, P n ) = h (f, P) para todo n.
Analogamente, se f e invertvel e P e uma particao com entropia finita tal
que diam P n (x) 0 para -quase todo x M , ent
ao h (f ) = h (f, P).
Sabemos que geradores existem na maioria dos casos interessantes, embora possa ser difcil exibir um gerador explicitamente. De fato, suponha que
o ambiente e um espaco de Lebesgue. Rokhlin [Rok67a, 10] mostrou que se
um sistema e aperiodico (isto e, o conjunto dos pontos periodicos tem medida
nula) e quase todo ponto tem um n
umero finito ou enumeravel de pre-imagens,
ent
ao existe algum gerador finito ou enumeravel. Em particular, todo sistema
invertvel aperiodico admite algum gerador finito ou enumeravel. Em geral, este
gerador pode ter entropia infinita. Mas Rokhlin [Rok67a, 10] tambem mostrou
que todo sistema invertvel aperiodico com entropia finita admite algum gerador
bilateral com entropia finita. Alem disso (Krieger [Kri70]), este gerador pode
ser escolhido finito se o sistema for erg
odico.

9.2.2

Semicontinuidade da entropia

A seguir vamos examinar a func


ao entropia, que associa a cada medida invariante de uma transformacao f dada o valor da respectiva entropia h (f ).
Vamos ver que esta funcao n
ao e contnua, em geral. No entanto, sob hipoteses
bastante amplas ela e semicontnua superiormente: dado qualquer > 0, tem-se
que h (f ) h (f ) + para todo suficientemente proximo de . Isso vale,
em particular, para a classe de transformacoes que chamamos de expansivas.
Estes fatos tem consequencias importantes, que serao exploradas na Secao 9.2.3
e, mais tarde, nas Secoes 9.6 e 10.5.
Comecamos por mostrar, por meio de um exemplo, que a funcao entropia
pode ser descontnua:
Exemplo 9.2.9. Seja f : [0, 1] [0, 1] a transformacao expansao decimal.
Como vimos no Exemplo 9.1.9, a entropia de f relativamente `a medida de

9.2. TEOREMA DE KOLMOGOROV-SINAI

263

Lebesgue m e hm (f ) = log 10. Para cada k 1, denote por Fk o conjunto


dos pontos fixos do iterado f k . Observe que Fk e um conjunto invariante com
#Fk = 10k , e que estes conjuntos est
ao equidistribudos no seguinte sentido:
cada intervalo [(i1)/10k , i/10k ] contem exatamente um ponto de Fk . Considere
a sequencia de medidas
1 X
x .
k = k
10
xFk

As observacoes anteriores implicam que cada k e uma probabilidade invariante


e que a sequencia (k )k converge para a medida de Lebesgue m na topologia fraca (verifique). Como k est
a suportada num conjunto finito, o mesmo
argumento que usamos no Exemplo 9.1.8 prova que hk (f ) = 0 para todo k.
Portanto, a entropia n
ao varia continuamente com a medida invariante.
Por outro lado, considere qualquer particao finita P de M cujo bordo
[
P =
P
P P

satisfaz (P) = 0. Pelo Teorema 2.1.2 ou, mais precisamente, pelo fato de
que a topologia (2.1.5) e equivalente `a topologia fraca , a funcao 7 (P ) e
contnua no ponto , para todo P P. Consequentemente, a funcao
X
7 H (P) =
(P ) log (P ),
P P

tambem e contnua em . A hip


otese sobre P tambem implica que (P n ) = 0
para todo n 1, uma vez que
P n P f 1 (P) f n+1 (P).
Assim, a funcao 7 H (P n ) e contnua para todo n.
Proposi
c
ao 9.2.10. Seja P uma partic
ao finita tal que (P) = 0. Ent
ao, a
func
ao 7 h (f, P) e semicontnua superiormente em .
Demonstrac
ao. Basta lembrar que, por definicao,
h (f, P) = inf
n

1
H (f, P)
n

e que o nfimo de qualquer famlia de funcoes contnuas e uma funcao semicontnua superiormente.
Corol
ario 9.2.11. Suponha que existe uma partic
ao finita P tal que (P) = 0
e n P n gera a -
algebra dos subconjuntos mensur
aveis de M a menos de medida
nula. Ent
ao a func
ao 7 h (f ) e semicontnua superiormente no ponto .
Demonstrac
ao. Pela Proposicao 9.2.10, dado > 0 existe uma vizinhanca U de
tal que h (f, P) h (f, P) + para todo V . Temos h (f, P) h (f ),
por definicao. Pelo Corol
ario 9.2.3, a hipotese implica que h (f, P) = h (f )
para todo . Portanto, h (f ) h (f ) + para todo V .

CAPITULO 9. ENTROPIA

264

Agora suponhamos que M e um espaco metrico compacto e e uma probabilidade boreliana em M . Nesse caso temos a seguinte versao mais especializada
do corol
ario anterior:
Corol
ario 9.2.12. Suponha que existe 0 > 0 tal que toda partic
ao finita P
com diam P < 0 satisfaz limn diam P n = 0. Ent
ao, a func
ao 7 h (f ) e
semi-contnua superiormente. Consequentemente, essa func
ao e limitada e o
seu supremo e atingido para alguma medida .
Demonstrac
ao. Como vimos no Corolario 9.2.8, a propriedade limn diam P n = 0
implica que n P n gera a -algebra dos conjuntos mensuraveis. Por outro lado,
dada qualquer probabilidade invariante e facil escolher uma particao P com
diametro menor que 0 e tal que (P) = 0. Por exemplo: para cada x escolha
rx (0, 0 ) tal que o bordo da bola de centro x e raio rx tenha medida nula; seja
U uma cobertura finita de M por tais bolas; tome para P a particao associada
a U, ou seja, a particao cujos elementos sao os conjuntos maximais que, para
cada U U, est
ao contidos em U ou no complementar U c . Segue do corol
ario
anterior que a funcao entropia e semicontnua superiormente em e, como e
arbitraria, isso d
a a primeira afirmacao do enunciado.
As demais afirmacoes sao consequencias gerais da semicontinuidade, lembrando que o domnio da funcao entropia, ou seja, o espaco M1 das probabilidades invariantes, e um espaco compacto.
n1
Quando f e invertvel podemos substituir P n por P n = j=n
f j (P) no
enunciado dos Corol
arios 9.2.11 e 9.2.12. A demonstracao e analoga, usando as
versoes dos Corol
arios 9.2.3 e 9.2.8 para transformacoes invertves.

9.2.3

Transformac
oes expansivas

Agora vamos discutir uma classe bastante ampla de transformacoes que satisfazem as condicoes do Corolario 9.2.12.
Uma transformacao contnua f : M M num espaco metrico e dita expansiva se existe 0 (chamada constante de expansividade) tal que, dados x, y M
com x 6= y existe n N tal que d(f n (x), f n (y)) 0 . Ou seja, quaisquer duas
orbitas distintas podem ser distinguidas, de forma macroscopica, em algum mo
mento da iteracao.
Quando a transformacao f e invertvel tambem temos uma versao bilateral
da nocao de expansividade, definida do seguinte modo: existe 0 tal que, dados
x, y M com x 6= y existe n Z tal que d(f n (x), f n (y)) 0 . Esta propriedade
sempre vale se a transformacao for expansiva (no sentido anterior), ja que N Z.
Exemplo 9.2.13. Seja : o deslocamento em = {1, . . . , d}N . Consideramos em a distancia d((xn )n , (yn )n ) = 2N onde N e o menor valor
de n tal que xn 6= yn . x = (xn )n e y = (yn )n sao pontos distintos ent
ao
d(f N (x), f N (y)) = 20 = 1. Isto prova que f e uma transformacao expansiva,
com 0 = 1 como constante de expansividade.
Analogamente, o deslocamento bilateral : em = {1, . . . , d}Z e
expansivo no sentido bilateral (mas n
ao no sentido unilateral).

9.2. TEOREMA DE KOLMOGOROV-SINAI

265

Deixamos ao cuidado do leitor verificar (Exerccio 9.2.1) que a expansao


decimal f (x) = 10x [10x] tambem e expansiva. Por outro lado, isometrias de
qualquer espaco metrico nunca sao expansivas.
Proposi
c
ao 9.2.14. Seja f : M M uma transformac
ao expansiva num
espaco metrico compacto e seja 0 > 0 uma constante de expansividade. Ent
ao
tem-se limn diam P n = 0 para toda partic
ao finita P com diam P < 0 .

claro que a sequencia diam P n e n


Demonstrac
ao. E
ao crescente. Seja o seu
nfimo e suponhamos que > 0. Ent
ao, para todo n 1 existem pontos xn e
yn tais que d(xn , yn ) > /2 mas xn e yn pertencem ao mesmo elemento de P n
e, portanto, satisfazem
d(f j (xn ), f j (yn )) diam P < 0

para todo 0 j < n.

Por compacidade, existe (nj )j tal que (xnj )j e (ynj )j convergem para
pontos x e y, respectivamente. Ent
ao x 6= y mas d(f j (x), f j (y)) diam P < 0
para todo j 0. Isto contradiz a hipotese de que 0 e constante de expansividade. Deste modo, fica provada a primeira parte da proposicao. A prova da
segunda parte e analoga.
Corol
ario 9.2.15. Se f : M M e uma transformac
ao expansiva num espaco
metrico compacto ent
ao a func
ao entropia e semicontnua superiormente e existem probabilidades invariantes cuja entropia h (f ) e m
axima entre todas as
probabilidades invariantes de f .
Se a transformacao f e invertvel e expansiva no sentido bilateral, podemos
substituir P n por P n na Proposicao 9.2.14 e a conclusao do Corolario 9.2.15
tambem permanece valida tal como est
a enunciada.

9.2.4

Exerccios

9.2.1. Mostre que a expansao decimal f : [0, 1] [0, 1], f (x) = 10x [10x] e
expansiva e exiba uma constante de expansividade.
9.2.2. Verifique que para todo s > 0 existe algum deslocamento de Bernoulli
(, ) cuja entropia e igual a s.
9.2.3. Seja X = {0} {1/n : n 1} e considere o espaco = X N munido com
a distancia d((xn )n , (yn )n ) = 2N |xN yN |, onde N = min{n N : xn 6= yn }.
(a) Certifique-se de que o deslocamento : n
ao e expansivo.
(b) Para cada k 1, seja k a probabilidade em X que d
a peso 1/2 a cada
um dos pontos 1/k e 1/(k + 1). Use as medidas de Bernoulli k = kN
para concluir que a funcao entropia do deslocamento n
ao e semicontnua
superiormente.
(c) Seja a medidaPde Bernoulli associada a um vetor de probabilidade
(px )xX tal que xX px log px = . Mostre que h () e infinita.

CAPITULO 9. ENTROPIA

266

9.2.4. Seja f : S 1 S 1 uma aplicacao de recobrimento de grau d 2 e seja


uma probabilidade invariante por f . Mostre que h (f ) log d.
j
9.2.5. Sejam P e Q particoes finitas. Mostre que se P
(Q) ent
ao
j=0 f
h (f, P) h (f, Q).

9.3

Entropia local

O teorema de Shannon-McMillan-Breiman, que vamos discutir nesta secao, fornece uma vis
ao complementar do conceito de entropia, mais detalhada e de natureza mais local. Tambem mencionaremos uma versao topologica dessa ideia,
que e devida a Brin-Katok.
Teorema 9.3.1 (Shannon-McMillan-Breiman). Dada qualquer partic
ao P com
entropia finita, o limite
h (f, P, x) = lim
n

1
log (P n (x))
n

existe em -quase todo ponto.

(9.3.1)

A func
ao x 7 h (f, P, x) e -integr
avel, e o limite tambem vale em L1 ().
Alem disso,
Z
h (f, P, x) d(x) = h (f, P).

Se (f, ) e erg
odico ent
ao h (f, P, x) = h (f, P) em -quase todo ponto.

Lembre que P n (x) = P(x)f 1 (P(f (x))) f n+1 (P(f n1 (x))), ou seja,
este conjunto est
a formado pelos pontos cuja trajetoria se mantem pr
oxima
da trajetoria de x durante n iterados, no sentido de que as duas visitam os
mesmos elementos de P. O Teorema 9.3.1 afirma que a medida deste conjunto
tem uma taxa exponencial de decaimento bem definida: em -quase todo ponto,
(P n (x)) enh(f,P,x)

para todo n grande.

A demonstracao do teorema sera apresentada na Secao 9.3.1.


O teorema de Brin-Katok, que enunciamos a seguir, pertence `a mesma
famlia de resultados, mas usa uma nocao distinta de proximidade.
Defini
c
ao 9.3.2. Suponhamos que f : M M e uma aplicacao contnua num
espaco metrico compacto. Dado x M , n 1 e > 0, chamamos bola din
amica
de comprimento n e raio em torno de x ao conjunto:
B(x, n, ) = {y M : d(f j (x), f j (y)) < para todo j = 0, 1, . . . , n 1}.
n1 j
Em outras palavras, B(x, n, ) = j=0
f (B(f j (x), )). Defina:

1
log (B(x, n, ))
n
1
h
(f, , x) = limninf log (B(x, n, )).
n
h+
(f, , x) = lim sup
n

267

9.3. ENTROPIA LOCAL

Teorema 9.3.3 (Brin-Katok). Seja uma medida invariante por f . Os limites


lim h+
(f, , x)

lim h
(f, , x)

existem e s
ao iguais para -quase todo ponto. Denotando por h (f, x) o seu
valor comum, a func
ao h (f, ) e integr
avel e tem-se
Z
h (f ) = h (f, x)d(x).
A prova deste resultado pode ser encontrada no artigo original de Brin,
Katok [BK83] e n
ao sera apresentada aqui.
Exemplo 9.3.4 (Translacoes em grupos compactos). Seja G um grupo compacto metriz
avel e seja a respectiva medida de Haar. Toda translacao de G, `a
esquerda ou `
a direita, tem entropia nula relativamente a . De fato, considere
em G uma distancia d invariante por translacoes (lembre do Lema 6.3.6). Ent
ao,
Egj (B(x, )) = B(Eg (x), )
para todo g G, x G e > 0. Consequentemente, B(x, n, ) = B(x, ) para
todo n 1. Ent
ao,
h
(Eg , , x) = lim
n

1
log (B(x, )) = 0
n

para todo > 0 e x G. Pelo teorema de Brin-Katok, segue que h (Eg ) = 0.


O mesmo argumento se aplica para translacoes Dg `a direita.

9.3.1

Prova do teorema de Shannon-McMillan-Breiman

Considere a sequencia de funcoes n : M R definida por


n (x) = log

(P n (x))
.
(P n1 (f (x)))

Pela propriedade de cancelamento telescopico,

n2
1
1X
1
nj (f j (x))
log (P n (x)) = log (P(f n1 (x))) +
n
n
n j=0

(9.3.2)

para todo n e todo x.


Lema 9.3.5. A sequencia (1/n) log (P(f n1 (x))) converge para zero em quase todo ponto e em L1 ().
Demonstrac
ao. Comece por observar que a funcao x 7 log (P(x)) e integravel:
Z
Z
| log (P(x))| d(x) = log (P(x)) d(x) = H (P) < .

CAPITULO 9. ENTROPIA

268

Usando o Lema 3.2.5, segue que 1/(n1) log (P(f n1 (x))) converge para zero
em -quase todo ponto. Alem disso, e claro que esta conclusao n
ao e afetada
quando substituimos n 1 por n no denominador. Isto prova a convergencia
em -quase todo ponto no enunciado do lema. Em seguida, usando o fato de
que a medida e invariante,
Z
1
1
1
n1
(x)))k1 =
k log (P(f
log (P(f n1 (x))) d(x) = H (P).
n
n
n
converge para zero quando n , uma vez que H (P) < . Isto prova a
convergencia em L1 ().
A seguir, vamos mostrar que o u
ltimo termo de (9.3.2) tambem converge em
-quase todo ponto e em L1 ().
Lema 9.3.6. O limite (x) = limn n (x) existe em -quase todo ponto.
Demonstrac
ao. Para cada n > 1, denote por Qn a particao de M definida por
Qn (x) = f 1 (P n1 (f (x))) = f 1 (P(f (x))) f n+1 (P(f n1 (x))).
Note que (P n1 (f (x)) = (Qn (x)) e que P n (x) = P(x) Qn (x). Portanto,
(P(x) Qn (x))
(P n (x))
=
.
n1
(P
(f (x)))
(Qn (x))

(9.3.3)

Para cada P P e cada n > 1, considere a esperanca condicional (lembre da


Secao 5.2.1)
en (XP , x) =

1
(Qn (x))

Qn (x)

XP d =

(P Qn (x))
.
(Qn (x))

Comparando com (9.3.3) vemos que


en (XP , x) =

(P n (x))
(P n1 (f (x)))

para todo x P.

Pelo Lema 5.2.1, o limite e(XP , x) = limn en (XP , x) existe para -quase todo
x M e, em particular, para -quase todo x P . Como P P e arbitrario,
isto prova que
(P n (x))
lim
n (P n1 (f (x)))
existe para -quase todo ponto. Tomando logaritmos, obtemos que limn n (x)
existe para -quase todo ponto, conforme afirmado.
Lema 9.3.7. A func
ao = supn n e integr
avel.

269

9.3. ENTROPIA LOCAL

Demonstrac
ao. Tal como no lema anterior, vamos usar as particoes Qn definidas
por Qn (x) = f 1 (P n1 (f (x))). Fixe qualquer P P. Dados x P e t > 0, e
claro que (x) > t se, e somente se, n (x) > t para algum n. Alem disso,
(P Qn (x)) < et (Qn (x))

n (x) > t

e, nesse caso, n (y) > t para todo y P Qn (x). Portanto, podemos escrever
o conjunto {x P : (x) > t} como uma uniao disjunta j (P Qj ), onde cada
Qj pertence a alguma particao Qn(j) e
(P Qj ) < et (Qj ) para todo j.
Consequentemente, para todo t > 0 e todo P P,
X
X
(Qj ) et .
(P Qj ) < et
({x P : (x) > t}) =
Ent
ao (veja o Exerccio 9.3.1):
Z
XZ
XZ
d =
d =
P P

(9.3.4)

P P

XZ

P P

({x P : (x) > t}) dt

min{et , (P )} dt.

Au
ltima integral pode ser reescrita do seguinte modo:
Z

log (P )

(P ) dt +

log (P )

et dt = (P ) log (P ) + (P ).

Combinando estas duas relacoes:


Z
X
d
(P ) log (P ) + (P ) = H (P) + 1 < .
P P

Isto prova o lema, uma vez que e n


ao negativa.
Lema 9.3.8. A func
ao e integr
avel e (n )n converge para em L1 ().
Demonstrac
ao. Vimos no Lema 9.3.6 que (n )n converge para em -quase
todo ponto. Como 0 n para todo n, tambem temos 0 .
Em particular, e integravel. Alem disso, | n | para todo n e, portanto, podemos usar o teorema da convergencia dominada (Teorema A.2.11)
para concluir que
Z
Z
lim | n | d = lim | n | d = 0.
n

Isto prova a convergencia em L1 ().

CAPITULO 9. ENTROPIA

270

Lema 9.3.9. Em -quase todo ponto e em L1 (),


lim
n

n2
n2
1X
1X
nj (f j (x)) = lim
(f j (x)).
n n
n j=0
j=0

Demonstrac
ao. Pelo teorema erg
odico de Birkhoff (Teorema 3.2.3), o limite do
lado direito existe em -quase todo ponto e em L1 (), de fato, ele e igual `a
media temporal da funcao . Portanto, basta mostrar que a diferenca
n2
1X
(nj ) f j
n j=0

(9.3.5)

converge para zero em -quase todo ponto e em L1 (). Como a medida e


invariante, k(nj ) f j k1 = knj k1 para todo j. Logo,
n2
n2
1X
1X
j
k
(nj ) f k1
knj k1 .
n j=0
n j=0

Pelo Lema 9.3.8 a sequencia do lado direito converge para zero. Isto implica que
(9.3.5) converge para zero em L1 (). Resta provar a convergencia em -quase
todo ponto.
Para cada k 2 fixado, considere k = supi>k |i |. Note que k
e, portanto, k L1 (). Alem disso:
n2
nk1
n2
1 X
1 X
1X
|nj | f j =
|nj | f j +
|nj | f j
n j=0
n j=0
n
j=nk

1
n

nk1
X
j=0

k f j +

1
n

n2
X

j=nk

f j.

Pelo teorema erg


odico de Birkhoff, o primeiro termo do lado direito converge
k em -quase todo ponto. Pelo Lema 3.2.5, o u
para a media temporal
ltimo
termo converge para zero em -quase todo ponto: o lema implica que n1 f ni
converge para zero para qualquer i fixado. Logo,
lim sup
n

n2
1X
k (x)
|nj |(f j (x))
n j=0

em -quase todo ponto.

(9.3.6)

k (x) = 0 em -quase todo ponto. De fato, a sequencia


Afirmamos que limk
(k )k e n
ao-crescente e, pelo Lema 9.3.6, ela converge para zero em -quase
todoRponto. Pelo teorema da convergencia mon
otona (Teorema A.2.9), segue
k )k e n
que k d 0 quando k . Outra consequencia e que (
aocrescente. Logo, usando o teorema da convergencia mon
otona juntamente com
o teorema erg
odico de Birkhoff:
Z
Z
Z

lim k d = lim k d = lim k d = 0.


k

271

9.4. EXEMPLOS

k = 0 em -quase todo ponto, tal


k e n
Como
ao negativa, segue que limk
como foi afirmado. Portanto, (9.3.6) implica que
lim
n

n2
1X
|nj | f j = 0
n j=0

em -quase todo ponto. Isto completa a demonstracao do lema.


Segue da igualdade (9.3.2) e dos Lemas 9.3.5 e 9.3.9 que
h (f, P, x) = lim
n

1
log (P n (x))
n

existe em -quase todo ponto e em L1 (); de fato, ele coincide com a media
temporal (x)

da funcao . Ent
ao, em particular,
Z
Z
1
log (P n (x)) d(x)
h (f, P, x) d(x) = lim
n n
1
= lim H (P n ) = h (f, P).
n n
Alem disso, se (f, ) e erg
odico ent
ao h(f, P, x) = (x)

e constante em -quase
todo ponto. Ou seja, nesse caso h (f, P, x) = h (f, P) para -quase todo ponto.
Isto encerra a demonstracao do Teorema 9.3.1.

9.3.2

Exerccios

9.3.1. Verifique que, para qualquer funcao integravel : M (0, ),


Z
Z
d =
({x M : (x) > t}) dt.
0

9.3.2. Use o Teorema 9.3.1 para calcular a entropia de um deslocamento de


Bernoulli em = {1, . . . , d}N .
9.3.3. Mostre que a funcao h (f, x) no Teorema 9.3.3 e f -invariante. Conclua
que se (f, ) e erg
odico, ent
ao h (f ) = h (f, x) para -quase todo ponto x.
9.3.4. Suponha que (f, ) e erg
odico e seja P uma particao com entropia finita.
Mostre que dado > 0 existe k 1 tal que para todo n k existe Bn P n tal
que a uni
ao dos elementos de Bn tem medida maior que 1 e
en(h (f,P)+) < (B) < en(h (f,P))

9.4

para todo B Bn .

Exemplos

Vamos agora ilustrar os resultados anteriores por meio de alguns exemplos.

CAPITULO 9. ENTROPIA

272

9.4.1

Deslocamentos de Markov

Seja = {1, . . . , d}N e seja : a transformacao deslocamento. Seja


uma medida de Markov associada a uma matriz estoc
astica P = (Pi,j )i,j e um
vetor de probabilidade p = (pi )i . Vamos provar:
Pd
Pd
Proposi
c
ao 9.4.1. h () = a=1 pa b=1 Pa,b log Pa,b .

Demonstrac
ao. Considere a particao P de em cilindros [0; a], a = 1, . . . , d.
Para cada n, o iterado P n e a particao em cilindros [0; a1 , . . . , an ] de comprimento n. Lembrando que ([0; a1 , . . . , an ]) = pa1 Pa1 ,a2 Pan1 ,an , vemos que
X

pa1 Pa1 ,a2 Pan1 ,an log pa1 Pa1 ,a2 Pan1 ,an
H (P n ) =
a1 ,...,an

X
a1

pa1 log pa1


+

a2 ,...,an

n
X
X

j=1 aj ,aj+1

Pa1 ,a2 Pan1 ,an

log Paj ,aj+1

(9.4.1)

pa1 Pa1 ,a2 Pan1 ,an .

onde a u
ltima soma e sobre todos os valores de a1 , . . . , aj1 , aj+2 , . . . , an . Por
um lado,
X
X
Pan1 ,an = 1
Pa1 ,a2 Pan1 ,an =
an

a2 ,...,an

uma vez que P e uma matriz estoc


astica. De modo semelhante, lembrando
tambem que P p = p,
X
X
pa1 Paj1 ,aj Paj ,aj+1 Panj1
pa1 Pa1 ,a2 Pan1 ,an =
j+1 ,an
a1 ,an

pa1 Paj1 ,aj Paj ,aj+1 = paj Paj ,aj+1 .

a1

Lembrando que P p = p = p, vemos que a u


ltima expressao e igual a paj .
Substituindo estas observacoes em (9.4.1), obtemos que
H (P n ) =

X
a1

pa1 log pa1 +

= 1 + n

X
a,b

n
X
X

j=1 aj ,aj+1

paj Paj ,aj+1 log Paj ,aj+1

pa Pa,b log Pa,b .

P
Ent
ao h (, P) = a,b pa Pa,b log Pa,b . Como a famlia de todos os cilindros
[0; a1 , . . . , an ] gera a -algebra de , segue do Corolario 9.2.3 que h () =
h (, P). Isto completa a prova do teorema.
Esta conclusao permanece valida no caso de deslocamentos de Markov bilaterais, ou seja, em = {1, . . . , d}Z . O argumento e analogo, usando o Corolario 9.2.4.

273

9.4. EXEMPLOS

9.4.2

Transformac
ao de Gauss

Vamos calcular a entropia da transformacao de Gauss G(x) = (1/x) [1/x]


relativamente `
a probabilidade invariante
Z
dx
1
(9.4.2)
(E) =
log 2 E 1 + x
estudada nas Secoes 1.3.2 e 4.2.4. O metodo que vamos apresentar se estende a
uma classe bastante ampla de sistemas, incluindo as transformacoes expansoras
do intervalo, que serao definidas e discutidas no Exemplo 11.1.16.
Seja P a particao nos intervalos (1/(m + 1), 1/m) para m 1. Como antes,
n1 j
denotamos P n = j=0
G (P). Os seguintes fatos serao usados a seguir:
(A) Gn envia cada Pn P n difeomorficamente sobre (0, 1), para cada n 1.
(B) diam P n 0 quando n .
(C) Existe C > 1 tal que |(Gn ) (y)|/|(Gn ) (x)| C para todo n 1 e quaisquer x e y num mesmo elemento da particao P n .
(D) Existem c1 , c2 > 0 tal que c1 m(Pn ) (Pn ) c2 m(Pn ) para todo n 1
e todo Pn Pn , onde m representa a medida de Lebesgue.
imediato da definicao que cada P P e enviado por G difeomorficamente
E
sobre (0, 1). A propriedade (A) e uma consequencia, por inducao em n. Usando
(A) e o Lema 4.2.12, obtemos que
diam Pn sup

xPn

1
|(Gn ) (x)|

2[n/2]

para todo n 1 e todo Pn P n . Isto implica (B). A propriedade (C) est


a dada
pelo Lema 4.2.13. Finalmente, (D) segue diretamente de (9.4.2).
R
Proposi
c
ao 9.4.2. h (G) = log |G | d.
Demonstrac
ao. Consideremos a funcao n (x) = log (P n (x)), para cada n
1. Observe que:
Z
X
n
H (P ) =
(Pn ) log (Pn ) = n (x) d(x).
Pn P n

A propriedade (D) d
a que
log c1 n (x) + log m(P n (x)) log c2 .
Pela propriedade (A), temos que log m(P n (x)) = log |(Gn ) (y)| para algum
y P n (x). Usando a propriedade (C), segue que
log c1 log C n (x) log |(Gn ) (x)| log c2 + log C

CAPITULO 9. ENTROPIA

274

para todo x e todo n. Por consequencia,


Z
n
log(Cc1 ) H (P ) log |(Gn ) | d log(C/c2 )

(9.4.3)

para todo n. Uma vez que a medida e invariante por G,


Z

log |(G ) | d =

n1
XZ
j=0

log |G | G d = n

|G | d.

Ent
ao dividindo (9.4.3) por n e passando ao limite quando n ,
Z
1
n
h (f, P) = lim H (P ) = log |G | d.
n n
Agora a propriedade (C) garante que podemos aplicar o Corolario 9.2.8 para
concluir que
Z
h (G) = h (G, P) = log |G | d.

Isto completa a demonstracao da proposicao.

A integral no enunciado da proposicao pode ser calculada explicitamente:


deixamos
P a cargo do leitor verificar que (use integracao por partes e o fato de
que j=1 1/j 2 = 2 /6)
h (G) =

log |G | d =

2
2 log x dx
=
5, 46 . . . .
(1 + x) log 2
6 log 2

Ent
ao, lembrando que (G, ) e erg
odico (Secao 4.2.4), segue do teorema de
Shannon-McMillan-Breiman (Teorema 9.3.1) que
lim
n

2
1
log (P n (x)) =
n
6 log 2

para -quase todo x.

Como a medida e comparavel com a medida de Lebesgue, a menos de um


fator constante, isto quer dizer que
diam P n (x) exp

2 n
6 log 2

para -quase todo x e para n suficientemente grande. Observe que P n (x) est
a
formada pelos pontos y cuja expansao em fracao contnua coincide com a expans
ao de x ate a ordem n.

9.4.3

Endomorfismos lineares do toro

Dado um n
umero real x > 0, denotamos log+ x = max{log x, 0}. Nesta secao
provamos o seguinte resultado:

275

9.4. EXEMPLOS

Proposi
c
ao 9.4.3. Seja fA : Td Td o endomorfismo induzido no toro Td
por alguma matriz invertvel A com coeficientes inteiros. Seja a medida de
Haar em Td . Ent
ao
d
X
log+ |i |.
h (fA ) =
i=1

onde 1 , . . . , d s
ao os autovalores de A, contados com multiplicidade.

Inicialmente, suponhamos que a matriz A e diagonaliz


avel. Seja v1 , . . . , vd
uma base normada de Rd tal que Avi = i vi para cada i. Seja u o n
umero de
autovalores de A com valor absoluto estritamente maior que 1. Podemos supor
que os autovalores est
ao numerados de tal form aque |i | > 1 se, e somente se,
i u. Dado x Td , todo ponto y numa vizinhanca de x pode ser escrito na
forma
d
X
y =x+
ti vi
i=1

como t1 , . . . , td proximos de zero. Dado > 0, denotamos por D(x, ) o conjunto


dos pontos y desta forma com |ti | < para todo i = 1, . . . , d. Alem disso, para
cada n 1, consideramos
D(x, n, ) = {y Td : fAj (y) D(fAj (x), ) para todo j = 0, . . . , n 1}.
P
Observe que fAj (y) = fAj (x) + di=1 ti ni vi para todo n 1. Portanto,
d
X


ti vi : |ni ti | < para i u e |ti | < para i > u .
D(x, n, ) = x +
i=1

Logo, existe uma constante C1 > 1 que depende apenas de A, tal que
C11 d

u
Y

i=1

|i |n (D(x, n, )) C1 d

u
Y

i=1

|i |n

para todo x Td , n 1 e > 0. Tambem e claro que C2 > 1 que depende


apenas de A, tal que
B(x, C21 ) D(x, ) B(x, C2 )
para todo x Td e todo > 0 pequeno. Ent
ao, B(x, n, /C2 ) D(x, n, )
B(x, n, C2 ) para todo n 1. Combinando estas duas observacoes, e tomando
C = C1 C2d , obtemos que:
C 1 d

u
Y

i=1

d
|n
i | (B(x, n, )) C

para todo x Td , n 1 e > 0. Ent


ao,
h+
(f, , x)

h
(f, , x)

u
Y

i=1

|n
i |

u
 X
1
= lim log B(x, n, ) =
log |i |
n n
i=1

CAPITULO 9. ENTROPIA

276

para todo x T e todo > 0 pequeno. Logo, usando o teorema de Brin-Katok


(Teorema 9.3.3)
u
X
log |i |
h (f ) = h (f, x) =
i=1

para -quase todo ponto x. Isto prova a Proposicao 9.4.3 no caso diagonaliz
avel.
O caso geral pode ser tratado de forma semelhante, escrevendo a matriz A na
forma can
onica de Jordan. Deixamos essa tarefa para o leitor (Exerccio 9.4.2).

9.4.4

Exerccios

9.4.1. Mostre que toda rotacao R : Td Td tem entropia nula relativamente `


a medida de Haar no toro Td . [Observacao: Isto e um caso particular do
Exemplo 9.3.4 mas para o enunciado presente n
ao precisamos usar o teorema
de Brin-Katok.]
9.4.2. Complete a demonstracao da Proposicao 9.4.3.
9.4.3. Seja f : M M uma transformacao mensuravel e seja uma probabilidade invariante erg
odica em M . Seja B M um conjunto mensuravel com
(B) > 0, seja g : B B a transformacao de primeiro retorno a B e seja a
restricao normalizada de ao conjunto B (lembre das Secao 1.4.1). Mostre que
h (f ) = (B)h (g).
9.4.4. Seja f : M M uma transformacao preservando medida num espaco
M
a extensao natural de f e seja
de Lebesgue (M, ). Seja f : M
o

levantamento de (Exerccio 8.5.7). Mostre que h (f ) = h (f ).

9.5

Entropia e equival
encia

A entropia foi entroduzida em Teoria Erg


odica com o objetivo principal de
distinguir sistemas que n
ao sao ergodicamente equivalentes, especialmente no
caso de sistemas que sao espectralmente equivalentes e que, portanto, n
ao podem
facil que a entropia e, de
ser distinguidos por meio de invariantes espectrais. E
fato, um invariante de equivalencia erg
odica:
Proposi
c
ao 9.5.1. Sejam f : M M e g : N N transformac
oes preservando probabilidades em M e em N . Se (f, ) e ergodicamente equivalente
a (g, ), ent
ao h (f ) = h (g).
Demonstrac
ao. Seja : M N uma equivalencia erg
odica entre os dois sistemas. Isto significa que = e existem conjuntos X M e Y N com
medida total nos respectivos espacos, tais que e uma bijecao mensuravel de
X em Y , com inversa mensuravel. Alem disso, como observamos na Secao 8.1,
os conjuntos X e Y podem ser escolhidos invariantes. Seja P uma particao de
M com entropia finita para . A sua restricao a X1 e uma particao de (X, ).


9.5. ENTROPIA E EQUIVALENCIA

277

A respectiva imagem Q = (P) e uma particao de (Y, ) que, naturalmente,


tambem podemos ver como uma particao de (N, ). Note que
H (Q) =

QQ

(Q) log (Q) =

P P

(P ) log (P ) = H (P).

n1 j
n1 j
Como Qn = j=0
g (Q) = (j=0
f (P)) = (P n ) para todo n, tambem
segue que

h (g, Q) = lim
n

1
1
H (Qn ) = lim H (P n ) = h (f, P).
n n
n

Tomando o supremo sobre todos os P, conclumos que h (g) h (P n ). A


desigualdade recproca e inteiramente analoga.
Usando esta obervacao, Kolmogorov e Sinai concluram que nem todos os
deslocamentos de Bernoulli bilaterais sao ergodicamente equivalentes apesar de
que, como vimos no Corol
ario 8.4.12, todos sao espectralmente equivalentes.
Isto tambem mostra que a equivalencia espectral e estritamente mais fraca que
a equivalencia erg
odica. De fato, conforme observamos no Exemplo 9.1.10, para
todo x > 0 existe algum deslocamento de Bernoulli bilateral (, ) tal que
h () = x. Portanto, uma u
nica classe de equivalencia espectral contem todo
um contnuo de classes de equivalencia erg
odica.

9.5.1

Automorfismos de Bernoulli

A recproca da Proposicao 9.5.1 e falsa, em geral. Por exemplo, vimos no Exemplo 9.2.7 (e no Corol
ario 9.2.5) que todas as rotacoes do crculo tem entropia
nula. Mas e claro que uma rotacao irracional nunca e ergodicamente equivalente
a uma rotacao racional, uma vez que a primeira e erg
odica e a segunda n
ao e.
Alias, o Corol
ario 8.3.6 mostra que as rotacoes irracionais tambem n
ao sao
ergodicamente equivalentes entre si, em geral. O caso das rotacoes racionais
sera tratado no Exerccio 8.3.3.
No entanto, um resultado not
avel devido a Donald Ornstein [Orn70] afirma
que a entropia e um invariante completo para os deslocamentos de Bernoulli
bilaterais:
Teorema 9.5.2 (Ornstein). Dois deslocamentos de Bernoulli bilaterais em
espacos de Lebesgue s
ao ergodicamente equivalentes se, e somente se, as suas
entropias s
ao iguais.
Chamaremos automorfismo de Bernoulli todo sistema ergodicamente equivalente a um deslocamento de Bernoulli bilateral. Na sequencia encontraremos
diversos exemplos de sistemas nesta classe. O teorema de Ornstein pode ser
reformulado na seguinte forma: dois automorfismos de Bernoulli em espacos de
Lebesgue sao ergodicamente equivalentes se, e somente se, as suas entropias sao
iguais.

CAPITULO 9. ENTROPIA

278

Vale a pena observar que o teorema de Ornstein n


ao se estende para deslocamentos de Bernoulli unilaterais. De fato, o Exerccio 8.1.2 mostra que no
caso n
ao invertvel existem outros invariantes de equivalencia, tais como o grau
da transformacao (o n
umero de pre-imagens).
William Parry e Peter Walters [PW72b, PW72a, Wal73] mostraram, entre
outros resultados, que dois deslocamentos de Bernoulli unilaterais correspondentes a vetores de probabilidade p = (p1 , . . . , pk ) e q = (q1 , . . . , ql ) sao ergodicamente equivalentes se, e somente se, k = l e o vetor p e uma permutacao do
vetor q. A demonstracao deste fato sera proposta ao leitor no Exerccio 9.7.8,
depois que tenhamos introduzido a nocao de jacobiano.

9.5.2

Sistemas com entropia nula

Nesta secao vamos estudar algumas propriedades de sistemas com entropia igual
a zero. O principal resultado e que tais sistemas sao invertveis em quase todo
ponto, se o ambiente e um espaco de Lebesgue. Vale a pena comparar este
enunciado com o Corolario 9.2.5. Ao final da secao discutiremos brevemente os
tipos espectrais dos sistemas com entropia nula.
No que segue (M, B, ) e um espaco de probabilidade e f : M M e uma
transformacao mensuravel preservando a medida . Ao final da secao suporemos
que (M B, ) e um espaco de Lebesgue.
Lema 9.5.3. Para todo > 0 existe > 0 tal que se P e Q s
ao partic
oes com
entropia finita e H (P/Q) < , ent
ao para todo P P existe uma uni
ao P de
elementos de Q satisfazendo (P P ) < .
Demonstrac
ao. Seja s = 1 /2 e = log s/2. Para cada P P considere
S = {Q Q : (P Q) s(Q)}.
Seja P a uni
ao dos elementos de S. Por um lado,
X
X

(P \ P ) =
(Q \ P )
(1 s)(Q) .
2
QS

(9.5.1)

QS

Por outro lado,


H (P/Q) =

X X

RP QQ

QS
/

(R Q) log

(R Q)
(Q)

(P Q) log s (P \ P ) log s.

Isto implica que


(P \ P )

H (P/Q)
<
= .
log s
log s
2

Juntando (9.5.1) e (9.5.2) obtemos a conclusao do lema.

(9.5.2)


9.5. ENTROPIA E EQUIVALENCIA

279

O proximo lema significa que a taxa media h (f, P) de informacao (relativamente `


a particao P) gerada pelo sistema a cada iteracao e nula se, e somente se,
o futuro determina o presente, no sentido de que a informacao relativa ao iterado zero pode ser deduzida do conjunto das informacoes relativas aos iterados
futuros.
Lema 9.5.4.
ao finita. Ent
ao h (f, P) = 0 se, e somente
W Seja P uma partic
se, P j=1 f j (P).

Demonstrac
ao. Suponha que h (f, P) = 0. Usando o Lema 9.1.12, vemos que
H (P/nj=1 f j (P)) converge para zero quando n . Ent
ao, pelo Lema 9.5.3,
para cada k 1 existe nk 1 e para todo P P existe uma uniao Pk de
k
claro que cada Pk e uma
f j (P) tal que (P Pk ) < 2k . E
elementos de nj=1
j
uniao de elementos de
f
(P)
e,
portanto,
o
mesmo
vale para cada
j=1
k=n Pk

e tambem para P =

P
.
Al
e
m
disso,
n=1 k=n k
(P \
k=n Pk ) = 0

n
(
k=n Pk \ P ) 2

para todo n e, consequentemente, (P P ) = 0. Isto mostra que todo elemento de P coincide, a menos de medida nula, com uma uniao de elementos de
j

(P), tal como afirmado na parte somente se do enunciado.


j=1 f
j
Agora suponha que P
(P). Sejam P1 , . . . , P os elementos de
j=1 f
P (podemos supor que (Pi ) > 0 para todo i, claro). Dado qualquer > 0,
tomemos > 0 como no Lema 9.1.6. Para cada n 1 e cada i = 1, . . . , , seja
Qi,n a uni
ao dos elementos de nj=1 f j (P) que intersectam Pi . Cada (Qi,n )n e
uma sequencia n
ao crescente; por hipotese, a sua intersecao coincide com Pi a
menos de medida nula. Ent
ao,
d
X
i=1

(Qi,n \ Pi ) <

para todo n suficientemente grande.

(9.5.3)

Defina R1,n = Q1,n e Ri,n = Qi,n \ Q1,n Qi1,n ) para i = 2, . . . , . E


claro da construcao que Rn = {R1,n , . . . , R,n } e uma particao de M menos
fina do que nj=1 f j (P). Afirmamos que (Pi Ri,n ) < para todo i e todo n
suficientemente grande. De fato, e claro que (Ri,n \ Pi ) (Qi,n \ Pi ) < /2
para todo i. Por outro lado,
[
\[
Qj,n \ Pj .
Qj,n
Pi \ Ri,n Pi
j<i

j<i

Pela relacao (9.5.3), segue que (Pi \ Ri,n ) < /2. Isto prova a nossa afirmacao
a qual, juntamente com os Lemas 9.1.5 e 9.1.6, implica que
H P/

n
_

j=1


f j (P) H (P/Rn ) <

se n e suficientemente grande. Agora, como > 0 e arbitrario, o Lema 9.1.12


d
a que h (f, P) = 0.

280

CAPITULO 9. ENTROPIA

Como consequencia, obtemos que todo sistema com entropia nula e invertvel
em quase todo ponto:
Proposi
c
ao 9.5.5. Seja (M, B, ) um espaco de Lebesgue e seja f : M M
uma transformac
ao mensur
avel preservando a medida . Se h (f ) = 0 ent
ao
(f, ) e invertvel: existe uma transformac
ao mensur
avel g : M M que
preserva a medida e satisfaz f g = g f = id em -quase todo ponto.
Demonstrac
ao. Considere o homomorfismo f : B B induzido por f na algebra
de medida de B (estas nocoes foram introduzidas na Secao 8.5). Lembre que
f e sempre injetivo (Exerccio 8.5.2). Dado qualquer B B, considere a
particao P = {B, B c }. A hipotese h (f ) = 0 implica que h (f, P) = 0 e
j
ent
ao, pelo Lema 9.5.4, P
(P). Isto implica que P f 1 (B), ja
j=1 f
j
1
que f (P) f (B) para todo j 1. Fazendo variar B, conclumos que
B f 1 (B). Em outras palavras, o homomorfismo f e sobrejetivo. Ent
ao f
e um isomorfismo de
algebras de medida. Ent
ao, pela Proposicao 8.5.6, existe
alguma aplicacao mensuravel g : M M , preservando a medida , tal que o
respectivo homomorfismo de algebra de medida g : B B e o inverso de f. Em
outras palavras, f g = g f = id . Ent
ao (Exerccio 8.5.2) f g = g f = id ,
tal como afirmamos.
Estes argumentos tambem provam o seguinte fato que sera u
til a seguir:
Corol
ario 9.5.6. Nas condic
oes da Proposic
ao 9.5.5, toda -
algebra A B
que satisfaz f 1 (A) A a menos de medida nula tambem satisfaz f 1 (A) = A
a menos de medida nula.
Outra consequencia imediata da proposicao (lembre do Exerccio 9.1.5):
Corol
ario 9.5.7. Nas condic
oes da Proposic
ao 9.5.5, todo fator de (f, ) e
invertvel.
Ainda n
ao est
a totalmente compreendido como a entropia se relaciona com
o tipo de espectro num sistema, mas existem diversos resultados parciais, especialmente no que se refere a sistemas com entropia nula.
Rokhlin [Rok67a, 14] mostrou que todo sistema erg
odico com espectro discreto definido num espaco de Lebesgue tem entropia nula. Isto tambem pode
ser deduzido do fato de que, conforme mencionamos na Secao 8.3, todo sistema
erg
odico com espectro discreto e ergodicamente isomorfo a uma translacao num
grupo abeliano compacto. Como vimos no Corolario 8.5.7, em espacos de Lebesgue isomorfismo erg
odico implica equivalencia erg
odica. Lembre tambem que
sistemas com espectro discreto em espacos de Lebesgue sao sempre invertveis
(Exerccio 8.5.5).
No mesmo trabalho de Rokhlin tambem e provado que sistemas invertveis
com espectro singular definidos em espacos de Lebesgue tem entropia nula e
o mesmo vale para sistemas com espectro de Lebesgue com posto finito (caso
existam). O caso de posto infinito sera o foco da proxima secao. Mencionaremos
que existem sistemas com espectro de Lebesgue com posto infinito e entropia


9.5. ENTROPIA E EQUIVALENCIA

281

nula. Por outro lado introduziremos a subclasse importante dos sistemas ditos
de Kolmogorov, para os quais a entropia e necessariamente positiva, num sentido
forte.

9.5.3

Sistemas de Kolmogorov

Seja (M, B, ) um espaco de probabilidade n


ao trivial, ou seja, tal que nem todo
conjunto mensuravel tem medida 0 ou 1. Representamos por U a -algebra
gerada por uma famlia qualquer de subconjuntos U de B. Seja f : M M
uma transformacao preservando a medida .
Defini
c
ao 9.5.8. Dizemos que (f, ) e um sistema de Kolmogorov se existe
alguma -algebra A B tal que
(a) f 1 (A) A a menos de medida nula;
T
n
(b)
(A) = {, M } a menos de medida nula;
n=0 f
W
(c) n=0 {B B : f n (B) A)} = B a menos de medida nula.

Deixamos ao cuidado do leitor verificar que esta propriedade e um invariante


de equivalencia erg
odica (o mesmo n
ao vale para equivalencia espectral, como
observaremos daqui a pouco).
Observe que se (f, ) e sistema de Kolmogorov ent
ao (f k , ) e sistema de
Kolmogorov, para todo k 1. De fato, se A satisfaz a condicao (a) ent
ao
f k (A) A. Alem disso, a condicao (a) juntamente com (b) e (c) implica que

f kn (A) =

n=0

n=0

f n (A) = {, M } e

{B B : f kn (B) A)} =

n=0

{B B : f n (B) A)} = B

n=0

a menos de medida nula. Dizemos que (f, ) e um automorfismo de Kolmogorov


se e um sistema de Kolmogorov invertvel. Veremos daqui a pouco que nesse
caso o inverso (f 1 , ) tambem e um sistema de Kolmogorov.
Proposi
c
ao 9.5.9. Todo sistema de Kolmogorov tem espectro de Lebesgue com
posto infinito. Em particular, se a -
algebra B e enumeravelmente gerada ent
ao
o posto e enumer
avel.
Demonstrac
ao. Seja A B uma -algebra satisfazendo as condicoes na Definicao 9.5.8. Seja E = L20 (M, A, ) o subespaco das funcoes L20 (M, B, )
que sao A-mensur
aveis, ou seja, tais que a pre-imagem 1 (B) de qualquer
boreliano B R est
a em A a menos de medida nula.
Comecemos por observar que Uf (L20 (M, A, )) = L20 (M, f 1 (A), ). De fato,
e claro que se e A-mensur
avel ent
ao Uf = f e f 1 (A)-mensuravel. A
inclusao segue imediatamente. Reciprocamente, dado qualquer B f 1 (A),
tome A A tal que B = f 1 (A) e seja c = (A) = (B). Ent
ao XB c =

CAPITULO 9. ENTROPIA

282

Uf (XA c) est
a em Uf (L20 (M, A, )). Isto implica a outra inclusao. Ent
ao, a
hip
otese de que f 1 (A) A a menos de medida nula garante que Uf (E) E.
Segue do par
agrafo anterior que Ufn (L20 (M, A, )) = L20 (M, f n (A), ) para
todo n 0. Logo,

n=0



n
Ufn L20 (M, A, ) = L20 M,
(A), .
n=0 f

n
Ent
ao, a hip
otese de que
(A) = {0, M } a menos de medida nula implica
n=0 f

n
que n=0 Uf (E) = {0}.
Agora considere An = {B B : f n (B) A)}. A sequencia (An )n e n
ao
decrescente, porque f 1 (A) A. Alem disso, cada e An -mensur
avel se, e
somente se, Ufn = f n e A-mensur
avel. Isto mostra que Ufn (L20 (M, A, )) =
2
L0 (M, An , ) para cada n. Observe igualmente que

n=0



L20 M, An , = L20 M,
n=0 An , .

(9.5.4)

De fato, e claro que L20 (M, Ak , ) L20 (M,


n=0 An , ) para todo k, uma vez
que Ak est
a contida em
A
.
A
inclus
a
o e uma consequencia imedin
n=0
e um espaco de Baata desta observacao, uma vez que L20 (M,
n=0 An , )
nach. Agora considere qualquer A
A
.
O
teorema
de aproximacao
n
n=0
(Teorema A.1.19) d
a que para cada > 0 existe n e existe An An tal que
(AA
) < . Ent
ao (XAn )n converge para XA na norma L2 , e isso implica que
Pn
2
XA n=0 L0 (M, An , ). A inclusao e uma consequencia desta observacao.
Em vista da igualdade
a hipotese de que
n=0 An = B a menos de
P(9.5.4),
n
medida nula d
a que n=0 Uf (E) = L20 (M, B, ).
Isto conclui a demonstracao de que E satisfaz as condicoes na Definicao 8.4.1.
Resta mostrar que F = E Uf (E) tem dimensao infinita. Quando B e enumeravelmente gerado L20 (M, B, ) e separ
avel (Exemplo 8.4.7) e, por consequencia,
a dimensao de Hilbert de F sera necessariamente enumeravel.
Inicialmente, observe que F 6= {0}. Caso contrario, teramos Uf (E) = E
e, portanto, Ufn (E) = E para todo n 1. Pela condicao (b), isso daria que
ao, pela condicao (c), teramos L20 (M, B, ) = {0} e
E = n Ufn (E) = {0}. Ent
isso estaria em contradicao com a hipotese de que o espaco de probabilidade e
n
ao trivial.
Seja um elemento n
ao nulo de F , fixado de uma vez por todas. Seja
N o conjunto dos x M tais que (x) 6= 0. Ent
ao N A e (N ) > 0. Ser
a
conveniente considerar o espaco E = L2 (M, A, ) = E {constantes}. Observe
que F coincide com E Uf (E ), pois o operador de Koopman preserva a reta

das funcoes constantes. Seja EN


o subespaco das funcoes E que se anulam

fora de N , ou seja, tais que (x) = 0 para todo x N c . Afirmamos que EN


tem dimensao infinita. Para a prova precisamos do seguinte fato:
Lema 9.5.10. Seja A qualquer -
algebra satisfazendo as condic
oes na Definic
ao 9.5.8. Ent
ao para todo A A com (A) > 0 existe B A tal que
0 < (B) < (A).


9.5. ENTROPIA E EQUIVALENCIA

283

Demonstrac
ao. Suponha que A admite algum elemento A com medida positiva
e que n
ao satisfaz a conclusao do lema. Afirmamos que A f k (A) tem medida
nula para todo k 1. Ent
ao
(f i (A) f j (A)) = (A f j+i (A)) = 0 para todo 0 i < j.
Como (f j (A)) = (A) para todo j 0, isto implica que a medida e infinita,
o que e uma contradicao. Portanto, para terminar a demonstracao do lema basta
provar a nossa afirmacao.
Para isso, note que a condicao (a) implica que f k (A) f k (A) A.
Ent
ao, f k (A) precisa ter medida nula ou medida total em A:
(A f k (A)) = 0 ou (A \ f k (A)) = 0.
Logo, para provar a afirmacao basta excluir a segunda possibilidade. Suponha que (A \ f k (A)) = 0. Ent
ao (Exerccio 1.1.4), existe B A tal que
(AB) = 0 e f k (B) = B. Ent
ao B = f nk (B) para todo n 1 e, portanto,
\
\
B
f nk (A) =
f n (A).
nN

nN

Pela condicao (b), isto quer dizer que B tem medida 0 ou 1. Como (B) = (A)
e positivo, segue que (A) = (B) = 1. Ent
ao, a hipotese que fizemos a
respeito de A implica que a -algebra A so contem conjuntos com medida 0 ou
1. Pela condicao (c), segue que B so contem conjuntos com medida 0 ou 1, o
que contradiz a suposicao de que o espaco de probabilidade n
ao e trivial.
Usando o Lema 9.5.10 podemos encontrar conjuntos Aj A, j 1 com

a em EN
medida positiva, contidos em N e disjuntos dois-a-dois. Ent
ao XAj est
para todo j. Alem disso, Ai Aj = acarreta XAi XAj = 0 para todo i 6= j.

Segue que EN
tem dimensao infinita, tal como afirmamos.
Agora represente por Uf (E )N o subespaco das funcoes Uf (E ) que se

anulam fora de N . Seja FN = EN


Uf (E )N . O fato de que dim EN
=

assegura que dim FN = ou dim Uf (E )N = (ou ambos). Vamos mostrar


que qualquer destas alternativas implica que dim F = .
Para tratar a primeira alternativa, basta provar que FN F . Mais ainda,
como e claro que FN E , basta verificar que FN e ortogonal a Uf (E ). Sejam
FN e E quaisquer. A funcao (Uf )XN = Uf (Xf 1 (N ) ) est
a em Uf (E )

e se anula fora de N ; em outras palavras, ela est


a em Uf (E )N . Como se anula
fora de N e e ortogonal a Uf (E )N , conclumos que Uf = (Uf )XN = 0.
Isto termina o argumento neste caso.
Resta tratar a segunda alternativa. Se dim Uf (E )N = , podemos tomar
{k : k 1} E tal que {Uf k : k 1} e um subconjunto linearmente independente de Uf (E )N . N
ao constitui restricao supor que as funcoes k sao limitadas: se necessario, substitua k por k Xk , onde Xk e a funcao caracterstica de
k1 ({z : |z| Rk }); a independencia linear e preservada desde que a sequencia
(Rk )k convirja rapidamente para infinito. Ent
ao as funcoes Uf k tambem sao

284

CAPITULO 9. ENTROPIA

limitadas e {(Uf k ) : k 1} e um subconjunto linearmente independente de


E . Alem disso, dado qualquer E ,
Z
Z
(Uf k ) (Uf ) = (k f )(
f ) d = (k ) f d = Uf (k ).
Au
ltima expressao e igual a zero, pois k E e a funcao F e ortogonal a
Uf (E ). Fazendo variar E , conclumos que (Uf k ) e ortogonal a Uf (E )
para todo k. Isto mostra que {(Uf k ) : k 1} est
a contido em F e, portanto,
dim F = tambem neste caso.
Dizemos que uma particao finita ou enumeravel de (M, B, ) e trivial se
todos os seus elementos tem medida 0 ou 1.
Proposi
c
ao 9.5.11. Um sistema (f, ) num espaco de Lebesgue e sistema de
Kolmogorov se, e somente se, h (f, P) > 0 para toda partic
ao n
ao trivial com
entropia finita. Em particular, todo sistema de Kolmogorov tem entropia positiva.
Este resultado e devido a Pinsker [Pin60] e a Rokhlin, Sinai [RS61]. A demonstracao tambem pode ser encontrada no artigo de Rokhlin [Rok67a, 13].
Mas assinalamos que a u
ltima parte do enunciado e uma consequencia imediata
das ideias na Secao 9.5.2. De fato, suponha que (f, ) e um sistema de Kolmogorov com entropia nula. Pelo Corolario 9.5.6, qualquer -algebra A satisfazendo
a condicao (a) da Definicao 9.5.8 tambem satisfaz f 1 (A) = A a menos de
medida nula. Ent
ao a condicao (b) implica que A e trivial e, pela condicao (c),
a propria -algebra B e trivial (contradizendo a hipotese que fizemos no incio
desta secao).
Segue da Proposicao 9.5.11 e da relacao (9.1.21) que o inverso de um automorfismo de Kolmogorov tambem e um automorfismo de Kolmogorov. Ao
contr
ario do que acontece para automorfismos de Bernoulli (Exerccio 9.5.1),
no caso Kolmogorov os dois sistemas (f, ) e (f 1 , ) n
ao sao ergodicamente
equivalentes, em geral.
Exemplo 9.5.12. O primeiro exemplo de sistema invertvel com espectro de
Lebesgue enumer
avel mas que n
ao e um sistema de Kolmogorov foi construdo
por Girsanov em 1959, mas nunca foi publicado. Outro exemplo foi exibido por
Newton, Parry [NP66] alguns anos depois. Trata-se de um fator de um certo
deslocamento gaussiano (lembre do Exemplo 8.4.13) com espectro de Lebesgue
enumer
avel mas cuja entropia e nula. Uma construcao diferente foi dada por
Gurevic [Gur61]: ele provou que o fluxo horocclico em superfcies de curvatura
negativa constante tem entropia nula; alguns anos antes, Parasyuk [Par53] havia
mostrado que tais fluxos tem espectro de Lebesgue enumeravel.
Como vimos no Teorema 8.4.11, todos os sistemas com espectro de Lebesgue
enumer
avel sao espectralmente equivalentes. Portanto, uma consequencia interessante da existencia de sistemas como no Exemplo 9.5.12 e que a propriedade
de ser um sistema de Kolmogorov n
ao e um invariante de equivalencia espectral.


9.5. ENTROPIA E EQUIVALENCIA

285

Exemplo 9.5.13. Verificamos nos Exemplos 8.4.2 e 8.4.3 que os deslocamentos


de Bernoulli tem espectro de Lebesgue. Nos dois casos, unilateral e bilateral,
exibimos subespacos de L20 (M, B, ) da forma E = L20 (M, A, ) para alguma
-algebra A B. Portanto, o mesmo argumento prova que todo deslocamento
de Bernoulli e um sistema de Kolmogorov. Em particular, todo automorfismo
de Bernoulli e um automorfismo de Kolmogorov.
Existem sistemas de Komogorov invertveis que n
ao sao automorfismos de
Bernoulli. O primeiro exemplo, descoberto por Ornstein, e muito elaborado. A
seguinte construcao simples e devida a Kalikow [Kal82]:
Exemplo 9.5.14. Seja : o deslocamento em = {1, 2}Z e seja
a medida de Bernoulli associada ao vetor de probabilidade p = (1/2, 1/2).
Considere a aplicacao f : definida da seguinte forma:


f (xn )n , (yn )n = ((xn )n ), 1 ((yn )n )

onde o sinal e se x0 = 1 e e + se x0 = 2. Esta transformacao preserva a


medida . O sistema (f, ) e um automorfismo de Kolmogorov mas n
ao e
um automorfismo de Bernoulli.
Considere qualquer automorfismo de Kolmogorov que n
ao e um automorfismo de Bernoulli e seja s > 0 a sua entropia. Considere qualquer automorfismo
de Bernoulli cuja entropia e igual a s (veja Exerccio 9.2.2). Os dois sistemas tem
a mesma entropia mas eles n
ao sao ergodicamente equivalentes, uma vez que
ser automorfismo de Bernoulli e um invariante de equivalencia erg
odica. Portanto, a entropia n
ao e um invariante completo de equivalencia erg
odica para
automorfismos de Kolmogorov. Mais ainda, existe uma famlia n
ao enumeravel
de automorfismos de Kolmogorov que n
ao sao ergodicamente conjugados e, no
entanto, tem a mesma entropia (veja Ornstein, Shields [OS73]).
As propriedades dos automorfismos de Bernoulli descritas no Exerccio 9.5.1
tambem n
ao se estendem ao caso Kolmogorov: existe automorfismo de Kolmogorov que n
ao e equivalente ao seu inverso (veja Ornstein, Shields [OS73]) e
tambem existe automorfismo de Kolmogorov que n
ao admite raiz k-esima para
nenhum valor de k 1 (Clark [Cla72]).
Para encerrar esta secao, vamos discutir a propriedade de Kolmogorov para
duas classes especficas de sistemas: deslocamentos de Markov e automorfismos
de grupos compactos.
Relativamente `
a primeira delas, Friedman e Ornstein [FO70] provaram que
todo deslocamento de Markov bilateral misturador e um automorfismo de Bernoulli. Lembre (Teorema 7.2.11) que um deslocamento de Markov e misturador
se, e somente se, a respectiva matriz estoc
astica e aperiodica. Segue do teorema de Friedman, Ornstein que a entropia ainda e um invariante completo de
equivalencia erg
odica no contexto mais amplo dos deslocamentos de Markov bilaterais misturadores. Outra consequencia interessante e que todo deslocamento
de Markov bilateral misturador e um automorfismo de Kolmogorov. Observamos, no entanto, que esta consequencia admite uma prova direta relativamente
facil (veja o Exerccio 9.5.4).

CAPITULO 9. ENTROPIA

286

Quanto `
a segunda classe de sistemas, temos que todo automorfismo erg
odico
de um grupo compacto e um automorfismo de Kolmogorov. Este fato foi provado por Rokhlin [Rok67b] para grupos abelianos e por Yuzvinskii [Yuz68] no
caso geral. De fato, automorfismos erg
odicos de grupos compactos metriz
aveis
sao automorfismos de Bernoulli (Lind [Lin77] e Miles, Thomas [MT78]). Em
particular, todo automorfismo linear erg
odico do toro Td e um automorfismo
de Bernoulli; isto havia sido provado por Katznelson [Kat71]. Lembre (Teorema 4.2.14) que fA e erg
odico se, e somente se, nenhum autovalor da matriz A
e raiz da unidade.
h = 0

n
ao invert
vel

h > 0, invert
vel

B2

RT

aut. Bernoulli

B1
sist. exatos

sist. Kolmogorov
espec. discreto

espec. de Lebesgue
sist. misturadores
sist. erg
odicos

Figura 9.2: Relacoes entre diversas classes de sistemas (B1 = deslocamentos


unilaterais, B2 = deslocamentos bilaterais, RT = rotacoes em Td )

9.5.4

Sistemas exatos

Dizemos que um sistema de Kolmogorov e exato se podemos tomar para A a lgebra B de todos os conjuntos mensuraveis. Note que neste caso as condicoes
a
(a) e (c) da Definicao 9.5.8 sao automaticamente satisfeitas. Portanto, um
n
sistema (f, ) e exato se, e somente se, a -algebra B e tal que
(B) e
n=0 f
trivial, ou seja, contem apenas conjuntos com medida 0 ou 1. Equivalentemente,
(f, ) e exato se, e somente se

n=0


Ufn L20 (M, B, ) = {0}.

Esta observacao tambem mostra que, ao contrario do que acontece com a propriedade de Kolmogorov, a exatidao e um invariante de equivalencia espectral.
Verificamos no Exemplo 8.4.2 que os deslocamentos de Bernoulli unilaterais
tem espectro de Lebesgue. Lembre que, para isso, consideramos o subespaco
E = L20 (M, B, ). Portanto, o mesmo argumento prova que todo deslocamento

ERGODICA

9.6. ENTROPIA E DECOMPOSIC


AO

287

de Bernoulli unilateral e um sistema exato. Uma classe mais geral de exemplos,


transformacoes expansoras munidas de seus estados de equilbrio, sera estudada
no Captulo 12.
imediato que sistemas invertveis nunca sao exatos. De fato, no caso inE
vertvel f n (B) = B a menos de medida nula, para todo n; portanto, a condicao
de exatidao corresponde a dizer que a -algebra B e trivial (o que est
a excludo,
por hip
otese).

9.5.5

Exerccios

9.5.1. Mostre que se (f, ) e um automorfismo de Bernoulli ent


ao ele e ergodicamente equivalente ao seu inverso (f 1 , ). Alem disso, para todo k 1 existe
um automorfismo de Bernoulli (g, ) tal que (g k , ) e ergodicamente equivalente
a (f, ) (em outras palavras, g e raiz k-esima de f ). [Observacao: Ornstein provou que, reciprocamente, toda raiz k-esima de um automorfismo de Bernoulli e
um automorfismo de Bernoulli; veja [Orn74] ]
9.5.2. Use a ideia de ponto de densidade para mostrar que a transformacao
expansao decimal f (x) = 10x [10x], munida da medida de Lebesgue, e exata.
9.5.3. Mostre que a transformacao de Gauss e exata, relativamente `a sua medida invariante absolutamente contnua .
9.5.4. Mostre que o deslocamento de Markov bilateral associado a qualquer
matriz estoc
astica aperiodica P e um automorfismo de Kolmogorov.
9.5.5. Mostre que o deslocamento de Markov unilateral associado a qualquer
matriz estoc
astica aperiodica P e um sistema exato.
9.5.6. Prove que se (f, ) e exato ent
ao h (f, P) > 0 para toda particao finita
P n
ao trivial.

9.6

Entropia e decomposi
c
ao erg
odica

N
ao e difcil mostrar que a entropia h (f ) e sempre uma funcao afim da medida
invariante :
Proposi
c
ao 9.6.1. Sejam e probabilidades invariantes por uma transformac
ao f : M M . Ent
ao ht+(1t) (f ) = th (f ) + (1 t)h (f ) para
todo 0 < t < 1.
Demonstrac
ao. Defina (x) = x log x, para x > 0. Por um lado, como a
funcao e c
oncava,
(t(B) + (1 t)(B)) t((B)) + (1 t)((B))

CAPITULO 9. ENTROPIA

288

para todo conjunto mensuravel B M . Por outro lado, dado qualquer conjunto
mensuravel B M ,



t(B) + (1 t)(B) t (B) (1 t) (B)
t(B) + (1 t)(B)
t(B) + (1 t)(B)
(1 t)(B) log
(B)
(B)
t(B) log t (1 t)(B) log(1 t).
= t(B) log

porque a funcao log e decrescente. Portanto, dada qualquer particao finita ou


enumer
avel P, com entropia finita,
Ht+(1t) (P) tH (P) + (1 t)H (P) e
Ht+(1t) (P) tH (P) + (1 t)H (P) t log t (1 t) log(1 t).
Consequentemente,
ht+(1t) (f, P) = th (f, P) + (1 t)h (f, P).

(9.6.1)

Segue, imediatamente, que ht+(1t) (f ) th (f ) + (1 t)h (f ). Alem disso,


(9.1.16) e (9.6.1) implicam que
ht+(1t) (f, P1 P2 ) th (f, P1 ) + (1 t)h (f, P2 )
para quaisquer particoes P1 e P2 . Tomando o supremo em P1 e P2 obtemos
que ht+(1t) (f ) th (f ) + (1 t)h (f ).
Em particular, dado qualquer conjunto invariante A M , temos
h (f ) = (A)hA (f ) + (Ac )hAc (f ),

(9.6.2)

onde A e Ac denotam as restricoes normalizadas de ao conjunto A e ao


seu complementar, respectivamente (este fato ja foi obtido no Exerccio 9.1.3).
Outra consequencia imediata e a seguinte versao da Proposicao 9.6.1 para combinacoes convexas finitas:
=

n
X
i=1

t i i

h (f ) =

n
X

ti hi (f ),

(9.6.3)

i=1

quaisquer que sejam as probabilidades


invariantes 1 , . . . , n e os n
umeros poPn
sitivos t1 , . . . , tn satisfazendo i=1 ti = 1.
Um fato muito mais profundo, devido a Konrad Jacobs [Jac60, Jac63], e que
a propriedade de afinidade se estende para a decomposicao ergodica dada pelo
Teorema 5.1.3:
Teorema 9.6.2 (Jacobs). Suponha que M e um espaco metrico separ
avel. Dada
qualquer probabilidade invariante
,
seja
{
:
P

P}
a
sua
decomposi
c
ao
P
R
(P ) (quando um dos lados da igualdade e
erg
odica. Ent
ao h (f ) = hP (f ) d
infinito o outro tambem e).
Vamos deduzir este resultado de um teorema geral sobre funcionais afins no
espaco das probabilidades, que enunciaremos na Secao 9.6.1 e cuja demonstracao
sera dada na Secao 9.6.2.

ERGODICA

9.6. ENTROPIA E DECOMPOSIC


AO

9.6.1

289

Afinidade da decomposic
ao erg
odica

Seja M um espaco metrico separ


avel completo. Vimos no Lema 2.1.3 que a
topologia fraca no espaco das probabilidade M1 (M ) e metriz
avel. Alem disso
(Exerccio 2.1.3), o espaco metrico M1 (M ) e separ
avel.
Seja W uma probabilidade na -algebra de Borel de M1 (M ). Chamamos
baricentro de W `
a probabilidade bar(W ) M1 (M ) dada por
Z
Z Z

d bar(W ) =
d dW ()
(9.6.4)

para toda funcao mensuravel limitada : M R. Fica a cuidado do leitor


(Exerccio 9.6.1) verificar que esta relacao determina bar(W ) univocamente e
que o baricentro e uma funcao afim da medida (Exerccio 9.6.2).

Exemplo 9.6.3. Se W e uma medida de Dirac, ou seja, se W = para algum


M1 (M ), ent
ao bar(W
cio 9.6.2 obtemos a seguinte
P
P) = . Usando o Exerc
com
t

0
e
t

generalizacao: se W = P
i
i=1 ti = 1 e i M1 (M ) para
i=1 i i
todo i, ent
ao bar(W ) =
t

.
i=1 i i

Exemplo 9.6.4. Seja {P : P P} a decomposicao erg


odica de uma medida
invariante por uma transformacao mensuravel f : M M , com medida
quociente
. Seja W a imagem da probabilidade
pela aplicacao P M que
associa a cada P P a probabilidade condicional P . Ent
ao (Exerccio 5.1.4),
Z Z
Z
Z Z


(P ) =
d dW ()
d =
dP d

para toda funcao : M R mensuravel limitada. Isto significa que e o


baricentro de W .
P
Diremos que M M1 (M ) e fortemente
convexo se
i=1 ti i M quaisP
quer que sejam i M e ti 0 com i=1 ti = 1.
Teorema 9.6.5. Seja M um subconjunto fortemente convexo de M1 (M ) e seja
H : M R um funcional afim, n
ao negativo e semicontnuo superiormente.
Ent
ao,
Z
H(bar(W )) =

H() dW ().

para toda probabilidade W em M1 (M ) tal que W (M) = 1 e bar(W ) M.

Antes de provarmos este resultado, vamos explicar como o Teorema 9.6.2


pode ser obtido a partir dele. O passo essencial e o seguinte lema:
R
(P ) para toda partic
ao finita Q de M .
Lema 9.6.6. h (f, Q) = hP (f, Q) d

Demonstrac
ao. Consideremos M = M1 (f ), o subespaco das probabilidades
invariantes, e H : M R definido por H() = h (f, Q). Seja W a imagem
da medida quociente
pela aplicacao P M que associa a cada P P a
claro que M e fortemente convexo, W (M) = 1
probabilidade condicional P . E

CAPITULO 9. ENTROPIA

290

e (lembre do Exemplo 9.6.4) bar(W ) = est


a em M. A Proposicao 9.6.1 d
a que
H e afim e e claro que ele e n
ao negativo. Para podermos aplicar o Teorema 9.6.5,
resta verificar que H tambem e semicontnuo superiormente.
Inicialmente, suponha que f e o deslocamento num espaco = X N , onde X e
um conjunto finito, e que Q e a particao em cilindros [0; a], a X. A propriedade
desta particao que nos interessa e que os seus elementos sao abertos e fechados
de . Em outras palavras, Q = para todo Q Q. Pela Proposicao 9.2.10,
segue que a aplicacao 7 H() = h (f, Q) e semicontnua superiormente em
todo ponto de M. Ent
ao, estamos em condicoes de aplicar o Teorema 9.6.5 ao
funcional H. Desta forma obtemos que
Z
h (f, Q) = H() = H(bar(W )) = H() dW ()
Z
Z
(P ).
= H(P ) d
(P ) = hP (f, Q) d
Agora tratamos o caso geral, por reducao ao caso do par
agrafo anterior.
Dada a particao finita Q, considere = QN e

h : M ,
h(x) = Q(f n (x)) nN .

Observe que h f = h, onde : representa o deslocamento. A cada


medida em M podemos associar a medida = h em . A relacao anterior
garante que se e invariante por f ent
ao e invariante por . Alem disso, se

e erg
odica ent
ao e erg
odica. De fato, se B e um conjunto invariante
1

por ent
ao B = h (B ) e um conjunto invariante por . Supondo que e
erg
odica, segue que (B ) = (B) e igual a 0 ou 1; logo, e erg
odica.
Por construcao, Q = h1 (Q ), onde Q representa a particao de nos cin1 j
n1 j
lindros [0; Q], Q Q. Mais geralmente, j=0
f (Q) = h1 (j=0
(Q )) e,
portanto,
n1
n1
_
_


j (Q )
f j (Q) = H
H
j=0

j=0

para todo n N. Dividindo por n e passando ao limite,

h (f, Q) = h (, Q ) para todo M.

(9.6.5)

Denotamos = h e P = h (P ) para cada P . Para toda funcao mensuravel


limitada : R,
Z
Z
Z Z

(P )
d = ( h) d =
( h) dP d
Z Z
(9.6.6)


(P ).
=
dP d

Como as medida P sao erg


odicas, a relacao (9.6.6) significa que {P : P P}
e a decomposicao erg
odica de . Ent
ao, de acordo com o par
agrafo anterior,

ERGODICA

9.6. ENTROPIA E DECOMPOSIC


AO

291

R
(P ). Pela relacao (9.6.5) aplicada a = e a
h (, Q ) = hP (, Q ) d
= P , isto pode ser reescrito na seguinte forma:
Z
(P ).
h (, Q) = hP (, Q) d
Esta u
ltima igualdade e, precisamente, o que pretendamos provar.
Prosseguindo com a demonstracao do Teorema 9.6.2, considere qualquer sequencia crescente Q1 Qn de particoes finitas de M tais que
diam Qn (x) converge para zero em todo x M (tal sequencia pode ser construda a partir de uma famlia de bolas centradas nos pontos de um subconjunto
enumer
avel denso, com raios convergindo para zero). Pelo Lema 9.6.6,
Z
(P )
(9.6.7)
h (f, Qn ) = hP (f, Qn ) d
para todo n. De acordo com (9.1.16), a sequencia h (f, Qn ) e n
ao decrescente,
qualquer que seja a medida invariante . Alem disso, pelo Corolario 9.2.3, o seu
limite e igual a h (f ). Logo, podemos passar ao limite em (9.6.7) com a ajuda
do teorema da convergencia mon
otona. Deste modo obtemos que
Z
(P ),
h (f ) = hP (f ) d
como queramos demonstrar. Note que o argumento permanece valido mesmo
que algum dos lados da igualdade seja infinito (ent
ao o outro tambem e).
Desta forma, conseguimos reduzir a demonstracao do Teorema 9.6.2 a provar
o Teorema 9.6.5.

9.6.2

Demonstrac
ao do teorema de Jacobs

Agora vamos demonstrar o Teorema 9.6.5. Comecemos por provar que a funcao
baricentro e contnua, no sentido de que se W est
a concentrada em uma vizinhanca V de uma dada medida ent
ao o baricentro de W tambem est
a proximo
de . Mais precisamente:
Lema 9.6.7. Seja W uma probabilidade em M1 (M ) e seja M1 (M ). Dado
qualquer conjunto finito = {1 , . . . , N } de func
oes contnuas limitadas e
dado qualquer > 0, considere a vizinhanca V = V (, , ) definida em (2.1.1).
Se W (V ) = 1, ent
ao bar(W ) V .
Demonstrac
ao. Considere qualquer i = 1, . . . , N . Pela definicao de baricentro,
e a hip
otese de que o complementar de V tem medida nula,
Z
Z
Z Z
Z Z





i d bar(W ) i d =
i d dW ()
i d dW ()
Z
Z
Z



i d i d dW ().
V

CAPITULO 9. ENTROPIA

292

Pela definicao de V , a u
ltima expressao e menor que . Portanto,
Z
Z
| i d bar(W ) i d| <
para todo i = 1, . . . , N . Em outras palavras, bar(W ) V .
Tambem usaremos a seguinte propriedade simples de funcionais afins n
ao
negativos:
Lema 9.6.8. Considere
probabilidades i M, i 1 e n
umeros n
ao negativos
P
ti , i 1 com
t
=
1.
Ent
a
o,
para
qualquer
funcional
afim
n
ao negativo
i=1 i
H : M R,

X
X
H(
ti i )
ti H(i ).
i=1

i=1

Pn

Demonstrac
ao. Para n 1, seja sn = i=1 ti . Tome Rn = (1sn )1
se sn < 1; caso contr
ario, escolha Rn arbitrariamente. Ent
ao,

ti i =

i=1

n
X
i=1

i>n ti i

ti i + (1 sn )Rn .

Como H e afim, e a expressao do lado direito e uma combinacao convexa (finita),


segue que
n
n

X
X
X
ti H(i )
ti H(i ) + (1 sn )H(Rn )
ti i ) =
H(
i=1

i=1

i=1

para todo n. Agora basta fazer n tender para infinito.


Corol
ario 9.6.9. Se H : M R e um funcional afim n
ao negativo ent
ao H e
limitado.
Demonstrac
ao. Suponha que H n
ao e limitado.
ao existem i M tais que
P Ent
H(i ) 2i para todo i 1. Considere = i=1 2i i . Pelo Lema 9.6.8,
H()

X
i=1

2i H(i ) = .

Isto contradiz o fato de que H() e finito.


Agora estamos prontos para demonstrar o Teorema 9.6.5. Comecemos pela
desigualdade . Escreva = bar(W ) e considere qualquer > 0. Pela hipotese
de semicontinuidade, existe > 0 e uma famlia finita = {1 , . . . , N } de
funcoes contnuas limitadas tais que
H() < H() +

para todo M V (, , ).

(9.6.8)

Como M1 (M ) e espaco metrico separ


avel, o mesmo vale para o subespaco M.
Ent
ao podemos considerar uma base enumeravel de abertos {V1 , . . . , Vn , . . . } de
M, com as seguintes propriedades:

ERGODICA

9.6. ENTROPIA E DECOMPOSIC


AO

293

(i) cada Vn est


a contido em M V (n , , ) para algum n M;
(ii) e H() < H(n ) + para todo Vn .
Considere a particao enumer
avel {P1 , . . . , Pn , . . . } definida por P1 = M V1 e
claro que as propriedades
Pn = M Vn \ (V1 Vn1 ) para todo n > 1. E
(i) e (ii) permanecem validas se substituirmos Vn por Pn . Afirmamos que
X
W (Pn )n V (, , )
(9.6.9)
n

De fato, observe que


Z
Z
X


i d
W (Pn ) i dn
n

X
=
n

Pn

i d

para todo i. Portanto, a propriedade (i) garante que


Z
Z
X

X
i d
W (Pn ) i dn <
W (Pn ) =
n


i dn ) dW ()

para todo i,

que e o que significa (9.6.9). Ent


ao, combinando (9.6.8), (9.6.9) e o Lema 9.6.8,
X
X
W (Pn )H(n ) H(
W (Pn )n ) < H() + .
n

Por outro lado, a propriedade (ii) implica que


Z
X
XZ
H() dW ()
W (Pn )H(n ) =
n

<

Pn


H() H(n ) dW ()

W (Pn ) = .

R
Somando as duas u
ltimas desigualdades, RH() dW () < H() + 2. Como
> 0 e arbitrario, isto implica que H() H() dW ().
Falta provar a desigualdade no Teorema 9.6.2. Considere qualquer sequencia (Pn )n de particoes finitas de M tal que o diametro de Pn () converge
para zero quando n vai para infinito, qualquer que seja M. Por exemplo,
Pn = ni=1 {Vi , Vic }, onde {Vn : n 1} e qualquer base enumeravel de abertos de
M. Para cada n fixado, considere a restricao normalizada WP da medida W a
cada conjunto P Pn (consideraremos apenas conjuntos com medida positiva;
a uni
ao de todos os elementos de n Pn com W (P ) = 0 pode ser negligenciada,
pois tem medida nula):
W (A P )
para cada conjunto mensuravel A M.
W (P )
claro que W = P
e uma funcao afim
E
P Pn W (P )WP . Como o baricentro
(Exerccio 9.6.2), segue que
X
bar(W ) =
W (P ) bar(WP )
WP (A) =

P Pn

CAPITULO 9. ENTROPIA

294
e, portanto,
H(bar(W )) =

W (P )H(bar(WP )).

P Pn

Defina Hn () = H(bar(WPn () )), para cada M. Ent


ao a u
ltima igualdade
acima pode ser reescrita na seguinte forma:
Z
H(bar(W )) = Hn () dW () para todo n.
(9.6.10)
Segue imediatamente da definicao que 0 Hn () sup H para todo n e
todo . Lembre que sup H < (Corol
ario 9.6.9). Afirmamos que
lim sup Hn () H()
n

para todo M.

(9.6.11)

Isto pode ser visto da seguinte forma. Dada qualquer vizinhanca V = V (, , )


de , temos que Pn () V para todo n suficientemente grande, uma vez que o
diametro de Pn () converge para zero. Ent
ao (sempre supondo que W (Pn ())
e positiva), WPn () (V ) WPn () (Pn ()) = 1. Pelo Lema 9.6.7, segue que
bar(WPn () ) V para todo n suficientemente grande. Agora basta usar a
hip
otese de que H e semicontnuo superiormente para obter (9.6.11). Consequentemente (aplique o lema de Fatou `a sequencia Hn + sup H),
Z
Z
Z
lim sup Hn () dW () lim sup Hn () dW () H() dW (). (9.6.12)
n

Combinando as relacoes (9.6.10) e (9.6.12), obtemos que


Z
H(bar(W )) H() dW (),
tal como queramos demonstrar.
A demonstracao dos Teoremas 9.6.2 e 9.6.5 est
a completa.

9.6.3

Exerccios

9.6.1. Verifique que, dada qualquer probabilidade W no espaco M1 (M ), existe


uma u
nica probabilidade bar(W ) M1 (M ) em M satisfazendo (9.6.4).
9.6.2. Mostre que a funcao baricentro e afim, no seguinte forte: se Wi , i 1
s
ao probabilidades em M1 (M ) e ti , i 1 sao n
umeros n
ao negativos com
P

ao
i=1 ti = 1, ent

X
X
ti bar(Wi ).
ti Wi ) =
bar(
i=1

i=1

9.6.3. Mostre que se M M1 (M ) e conjunto convexo fechado ent


ao M e
fortemente convexo. Alem disso, nesse caso W (M) = 1 implica bar(W ) M.
9.6.4. A desigualdade no Teorema 9.6.2 pode ser obtida por um argumento
mais direto:


9.7. JACOBIANOS E FORMULA
DE ROKHLIN

295

1. Lembrando
oncava, mostre que vale
R que a funcao (x) = x log x e c
(P ) para toda particao finita Q.
H (Q) HP (Q) d
R
(P ) para toda particao finita Q.
2. Deduza que h (f, Q) hP (f, Q) d
R
(P ).
3. Conclua que h (f ) hP (f ) d

9.6.5. A desigualdade
no Teorema 9.6.2 est
a baseada na propriedade de que
R
(P ) para toda particao finita Q, a qual e parte do
h (f, Q) hP (f, Q) d
Lema 9.6.6. Aponte o que est
a errado na demonstracao alternativa a seguir.
Seja Q uma particRao finita. O teorema de Shannon-McMillan-Breimen garante que h (f, Q) = h (f, Q, x) d(x), onde
Z
1
1
(P ).
h (f, Q, x) = lim log (Qn (x)) = lim log P (Qn (x)) d
n
n
n
n
Pela desigualdade de Jensen aplicada `a funcao convexa (x) = log x,
Z
Z
1
1
(P ) lim log P (Qn (x)) d
(P ).
lim log P (Qn (x)) d
n
n
n
n
Usando o fato de que hP (f, Q) = hP (f, Q, x) em quase todo ponto (porque
toda P e erg
odica),
Z
Z
1
1
(P ) = lim log P (Qn (x)) d
(P )
lim log P (Qn (x)) d
n
n
n
n
Z
(P ).
= hP (f, Q) d

R
(P ) para toda
particao finita Q e
Isto mostra que h (f, Q, x) hP (f, Q) d
R
(P ) para
para -quase todo x. Consequentemente, h (f, Q) hP (f, Q) d
toda particao finita Q.

9.7

Jacobianos e f
ormula de Rokhlin

Seja U um aberto do Rd , seja m a medida de Lebesgue e seja f : U U um


difeomorfismo local. Pela f
ormula de mudanca de variaveis,
Z
| det Df (x)| dx
(9.7.1)
m(f (A)) =
A

para todo A contido numa bola restrita `a qual f e injetivo. A nocao de jacobiano,
que vamos apresentar a seguir, estende este tipo de relacao para transformacoes e
medidas muito mais gerais. Alem de introduzirmos este conceito, mostraremos
que jacobianos existem sob hip
oteses bastante gerais. Mais ainda, e possvel
exprimir a entropia do sistema explicitamente em termos do jacobiano. Ja
encontramos uma manifestacao interessante desse fato, na Proposicao 9.4.2.
Seja f : M M uma transformacao mensuravel. Diremos que f e localmente invertvel se existe algum cobertura enumeravel {Uk : Uk 1} de M

CAPITULO 9. ENTROPIA

296

por conjuntos mensuraveis tais que a restricao de f a cada Uk e uma bijecao


sobre a sua imagem, a qual e um conjunto mensuravel, e a inversa dessa bijecao
tambem e mensuravel. Os subconjuntos mensuraveis destes conjuntos Uk serao
chamados domnios de injetividade. Note que se A e domnio de invertibilidade
ent
ao f (A) e um conjunto mensuravel. Observe, igualmente, que se f e localmente invertvel ent
ao a pre-imagem f 1 (y) de qualquer y M e enumeravel:
ela contem no maximo um ponto em cada Uk .
Seja uma probabilidade em M , n
ao necessariamente invariante por f . Uma
funcao mensuravel : M [0, ) e um jacobiano de f relativamente a se a
restricao de a qualquer domnio de invertibilidade A e integravel com relacao
a e satisfaz
Z
(f (A)) =

(9.7.2)

Note (Exerccio 9.7.1) que a definicao n


ao depende da escolha de {Uk : k 1}.
Exemplo 9.7.1. Seja : o deslocamento em = {1, 2, . . . , d}N e seja
a medida de Bernoulli associada a um vetor de probabilidade p = (p1 , . . . , pd ).
Consideramos munido da distancia (A.2.7) para algum valor (arbitrario) de
. A restricao de a cada cilindro [0; a] e uma transformacao invertvel. Alem
disso, dado qualquer cilindro [0; a, a1 , . . . , an ] [0; a],


1
([0; a, a1 , . . . , an ]) = pa1 pan = [0; a, a1 , . . . , an ] .
pa

Deixamos ao cuidado do leitor deduzir que (A) = (1/pa )(A) para todo
conjunto mensuravel A [0; a]. Portanto, a funcao ((xn )n ) = 1/px0 e um
jacobiano de relativamente a .
Dizemos que uma medida e n
ao singular com relacao `a transformacao f
se a imagem de qualquer domnio de invertibilidade com medida nula tambem
tem medida nula: se (A) = 0 ent
ao (f (A)) = 0. Por exemplo, se f : U U
e um difeomorfismo local num aberto de Rd e e a medida de Lebesgue, ent
ao
e n
ao singular. Tambem e facil ver que toda probabilidade invariante e n
ao
singular.
Segue imediatamente da definicao (9.7.2) que se f admite jacobiano com
relacao a uma medida ent
ao essa medida e n
ao singular. Vamos mostrar que
a recproca tambem e verdadeira:
Proposi
c
ao 9.7.2. Seja f : M M uma transformac
ao localmente invertvel
e seja uma medida boreliana em M , n
ao singular com relac
ao a f . Ent
ao,
existe algum jacobiano de f com relac
ao a e ele e essencialmente u
nico: dois
jacobianos quaisquer coincidem em -quase todo ponto.
Demonstrac
ao. Comecemos por provar a existencia. Dada uma cobertura enumeravel {Uk : k 1} de M por domnios de invertibilidade de f , defina P1 = U1
e Pk = Uk \ (U1 Uk1 ) para cada k > 1. Ent
ao, P = {Pk : k 1} e uma
particao de M formada por domnios de invertibilidade. Para cada Pk P,


9.7. JACOBIANOS E FORMULA
DE ROKHLIN

297

represente por k a medida em definida em Pk por k (A) = (f (A)). Em outras palavras, k e a imagem por (f | Pk )1 da medida restrita a f (Pk ). A
hipotese de que e n
ao singular implica que cada k e absolutamente contnua
com relacao a restrita a Pk :

(A) = 0

k (A) = (f (A)) = 0

para todo conjunto mensuravel A Pk . Seja k = dk /d( | Pk ) a derivada


de Radon-Nykodim (Teorema A.2.18). Ent
ao k e uma funcao definida em Pk ,
integravel com relacao a e satisfazendo
Z
k d
(9.7.3)
(f (A)) = k (A) =
A

para todo conjunto mensuravel A Pk . Considere a funcao : M [0, )


cuja restricao a cada Pk P est
a dada por k . Todo subconjunto de Uk pode ser
escrito como uni
ao disjunta de subconjuntos de P1 , . . . , Pk . Aplicando (9.7.3) a
cada um desses subconjuntos e somando as respectivas igualdades, obtemos que
Z
d para todo conjunto mensuravel A Uk e k 1.
(f (A)) =
A

Isto prova que e um jacobiano de f relativamente a .


Agora suponha que e sao jacobianos de f relativamente a e que existe
B M com (B) > 0 tal que (x) 6= (x) para todo x B. A menos de
substituir B por um subconjunto adequado, e permutar os papeis de e e
necessario, podemos supor que (x) < (x) para todo x B. De modo similar,
podemos supor que B est
a contido em algum Uk . Ent
ao,
Z
Z
d = (f (B)).
d <
(f (B)) =
B

Esta contradicao prova que o jacobiano e essencialmente u


nico.
A partir desta proposicao, usaremos a notacao J f para representar o (essencialmente u
nico) jacobiano de f com relacao a , quando exista. Por definicao,
J f e integravel em cada domnio de invertibilidade. Se f e tal que o n
umero
de pre-imagens de qualquer y M e limitado ent
ao o jacobiano e (globalmente)
integravel: representando por o n
umero maximo de pre-imagens,
Z
XZ
X
J f d =
J f d =
(f (Pk )) ,
k

Pk

ja que cada ponto y M pertence a n


ao mais que imagens f (Pk ).
O principal resultado desta secao e a seguinte formula para a entropia de
uma medida invariante:
Teorema 9.7.3 (f
ormula de Rokhlin). Seja f : M M uma transformac
ao
localmente invertvel e seja uma probabilidade invariante por f . Suponha que
existe alguma partic
ao finita ou enumer
avel P tal que n P n gera aR-
algebra de
M e todo P P e domnio de invertibilidade de f . Ent
ao h (f ) = log J f d.

CAPITULO 9. ENTROPIA

298

Demonstrac
ao. Consideremos a sequencia de particoes Qn = nj=1 f j (P). Pelo
Corol
ario 9.2.3 e pelo Lema 9.1.12,
h (f ) = h (f, P) = lim H (P/Qn ).

(9.7.4)

Por definicao (como anteriormente, (x) = x log x)


H (P/Qn ) =

P P Qn Qn

(P Qn ) log
(Qn )

P P Qn Qn

(P Qn )
(Qn )
(9.7.5)

(P Qn ) 
(Qn )

Seja en (, x) a esperanca condicional de uma funcao relativamente `a particao


Qn e seja e(, x) o seu limite quando n vai para infinito (estas nocoes foram
claro da definicao
introduzidas na Secao 5.2.1: veja (5.2.1) e o Lema 5.2.1). E
que
(P Qn )
= en (XP , x) para todo x Qn e todo Qn Qn .
(Qn )
Portanto,
X

P P Qn Qn

(Qn )

Z
(P Qn )  X
=
(en (XP , x)) d(x).
(Qn )

(9.7.6)

P P

Pelo Lema 5.2.1, o limite e(XP , x) = limn en (XP , x) existe para -quase todo
x. Ent
ao, observando que a funcao e limitada, podemos usar o teorema da
convergencia dominada para deduzir das relacoes (9.7.4) (9.7.6) que
XZ
h (f ) =
(e(XP , x)) d(x).
(9.7.7)
P P

Resta relacionar o integrando do lado direito com o jacobiano. Isso sera feito
por meio do seguinte lema:
Lema 9.7.4. Para toda func
ao mensur
avel limitada : M R e toda probabilidade boreliana invariante por f ,
(x)) para -quase todo x,
e(, x) = (f

onde (y)
=

zf 1 (y)

(z).
J f

Demonstrac
ao. Lembre que Qn = nj=1 f j (P). Tambem usaremos a sequencia
n1 j
de particoes P n = j=0
f (P). Observe que Qn (x) = f 1 (P n1 (f (x))) e
P n (x) = P(x) Qn (x) para todo n e todo x. Ent
ao,
Z
XZ

d =
(f | P )1 d.
J
f
n1
n1

P
(f (x))
f (P )P
(f (x))
P P


9.7. JACOBIANOS E FORMULA
DE ROKHLIN

299

Usando a f
ormula de mudanca de variaveis dada no Exerccio 9.7.3(b), a express
ao do lado direito pode ser reescrita como
Z
XZ
d.
(z) d(z) =
Portanto,

Qn (x)

P Qn (x)

P P

d =

P n1 (f (x))

d.

(9.7.8)

Qn (x)



A hip
otese de que e invariante d
a que P n1 (f (x)) = Qn (x) . Dividindo
ambos os lados de (9.7.8) por este n
umero, obtemos que
f (x)) para todo x e todo n > 1.
en (, x) = en1 (,

(9.7.9)

f (x)) para -quase x. Por outro lado,


Ent
ao, passando ao limite, e(, x) = e (,
y) = (y)

de acordo com o Exerccio 5.2.3, a hipotese implica que e (,


para
-quase todo y M .
Vamos aplicar este resultado a = XP e = . Como f e injetiva em todo
elemento de P, cada intersecao P f 1 (y) ou e vazia ou contem exatamente
um ponto. Portanto, segue do Lema 9.7.4 que e(XP , x) = XP (f (x)), com


1/J f (f | P )1 (y) se y f (P )
XP (y) =
0
se y
/ f (P ).
Ent
ao, lembrando que a medida e invariante,
Z
Z
(e(XP , x)) d(x) = (XP (y)) d(y)
Z
Z

1
1
log J f d
log J f (f | P ) d =
=
P
f (P ) J f

(a u
ltima igualdade usa a igualdade (b) no Exerccio 9.7.3). Substituindo esta
expressao em (9.7.7), vem que
Z
XZ
h (f ) =
log J f d = log J f d,
P P

tal como afirmado no teorema.

9.7.1

Exerccios

9.7.1. Verifique que a definicao de jacobiano n


ao depende da escolha da cobertura {Uk : k 1} por domnios de invertibilidade.
9.7.2. Seja : a transformacao deslocamento em = {1, 2, . . . , d}N e
seja a medida de Markov associada a uma matriz aperiodica P . Encontre o
jacobiano de f com relacao a .

CAPITULO 9. ENTROPIA

300

9.7.3. Seja f : M M uma transformacao localmente invertvel e uma


probabilidade boreliana em M n
ao singular com relacao a f . Mostre que valem
as seguintes f
ormulas de mudanca de vari
aveis:
R
R
(a) f (A) d = A ( f )J f d para todo domnio de invertibilidade A M
e toda funcao mensuravel : f (A) R tal que as integrais est
ao definidas
(podendo ser ).
R
R
(b) A d = f (A) (/J f ) (f | A)1 d para qualquer funcao mensuravel
: A R tal que as integrais est
ao definidas (podendo ser ).
9.7.4. Seja f : M M uma transformacao localmente invertvel e seja uma
probabilidade boreliana em M n
ao singular com relacao a f . Mostre que para
toda funcao mensuravel limitada : M R,
Z
Z
X

(z)d(x).
d =
J
f
1
zf

(x)

9.7.5. Seja f : M M uma transformacao localmente invertvel e seja uma


probabilidade boreliana em M n
ao singular com relacao a f . Mostre que e
invariante por f se, e somente se,
X

zf 1 (x)

1
=1
J f (z)

para -quase todo x M .

Alem disso se e invariante ent


ao J f 1 em -quase todo ponto.
9.7.6. Seja f : M M uma transformacao localmente invertvel e seja uma
probabilidade boreliana em M n
ao singular com relacao a f . Mostre que, para
todo k 1, existe jacobiano de f k com relacao a e ele e dado por
J f j (x) =

k1
Y

J f (f j (x))

para -quase todo x.

j=0

Supondo que f e invertvel, o que pode ser dito a respeito do jacobiano de f 1


relativamente a ?
9.7.7. Sejam f : M M e g : N N transformacoes localmente invertveis
em espacos metricos e sejam e medidas invariantes por f e g, respectivamente. Suponha que existe uma equivalencia erg
odica : M N entre os
sistemas (f, ) e (g, ). Mostre que J f = J g em -quase todo ponto.
9.7.8. Sejam k : k k e l : l l as transformacoes deslocamento em
k = {1, . . . , k}N e l = {1, . . . , l}N . Sejam k e l medidas de Bernoulli em k
e l , respectivamente, associadas a vetores de probabilidade p = (p1 , . . . , pk ) e
q = (q1 , . . . , ql ). Mostre que se os sistemas (k , k ) e (l , l ) sao ergodicamente
equivalentes se, e somente se, k = l e os vetores p e q se obtem um do outro por
permutacao das componentes.

Captulo 10

Princpio variacional
Em 1965, os pesquisadores R. Adler, A. Konheim e M. McAndrew da IBM
propuseram [AKM65] uma nocao de entropia topol
ogica, inspirada na entropia
de Kolmogorov-Sinai que estudamos no captulo anterior, mas cuja definicao
n
ao envolve qualquer medida invariante. Esta nocao se aplica a qualquer transformacao contnua num espaco topologico compacto.
Posteriormente, Efim Dinaburg [Din70] e Rufus Bowen [Bow71, Bow75a]
deram uma definicao diferente, mas equivalente, para transformacoes contnuas
em espacos metricos compactos. Apesar de ser um pouco mais restrita, ela tem
a vantagem de tornar mais transparente o significado deste conceito: a entropia
topol
ogica e a taxa de crescimento exponencial do n
umero de orbitas que sao
distinguveis dentro de um certo grau de precisao, arbitrariamente pequeno.
Alem disso, Bowen estendeu a definicao para espacos n
ao compactos, o que
tambem e muito u
til em aplicacoes.
Estas definicoes da entropia topologica e suas propriedades serao estudadas
na Secao 10.1 onde, em particular, tambem veremos que a entropia topologica
e um invariante de equivalencia (conjugacao) topologica. Na Secao 10.2 analisaremos diversos exemplos concretos.
A principal dessas propriedades e a seguinte relacao notavel entre a entropia topol
ogica e as entropias da transformacao relativamente `as suas medidas
invariantes:
Teorema 10.1 (Princpio Variacional). Se f : M M uma transformac
ao
contnua num espaco metrico compacto ent
ao a sua entropia topol
ogica h(f )
coincide com o supremo das entropias h (f ) da transformac
ao f relativamente
a todas as probabilidades invariantes.
Este fato foi demonstrado originalmente por Dinaburg [Din70, Din71], Goodman [Goo71a] e Goodwin [Goo71b]. Adiamos a apresentacao da demonstracao
para o proximo captulo, no qual iremos obter um resultado mais abrangente, o
princpio variacional para a press
ao, que e devido a Walters [Wal75].
A press
ao P (f, ) e uma versao ponderada da entropia topologica h(f ), onde
os pesos sao determinados por uma funcao contnua : M R, que e cha301

CAPITULO 10. PRINCIPIO VARIACIONAL

302

mada de potencial. Estudaremos estas nocoes e suas propriedades na Secao 10.3.


A entropia topol
ogica, que foi introduzida no captulo anterior, corresponde ao
caso particular em que o potencial e identicamente nulo. A ideia de press
ao
foi trazida da Mec
anica Estatstica para a Teoria Erg
odica pelo matematico e
fsico teorico David Ruelle, um dos criadores da teoria erg
odica diferenci
avel, e
foi depois estendida pelo matematico britanico Peter Walters.
O princpio variacional (Teorema 10.1) se generaliza para o contexto da
press
ao, como veremos na Secao 10.4: para toda funcao contnua ,
Z


P (f, ) = sup h (f ) + d : e invariante por f .
(10.0.1)

Uma probabilidade invariante e chamada estado de equilbrio para


R o potencial se ela realiza o supremo em (10.0.1), ou seja, se h (f ) + d =
P (f, ). As propriedades do conjunto dos estados de equilbrio serao estudadas
na Secao 10.5.

10.1

Entropia topol
ogica

Inicialmente, apresentaremos as definicoes de Adler-Konheim-McAndrew e de


Bowen-Dinaburg e provaremos que elas sao equivalentes quando o ambiente e
um espaco metrico compacto.

10.1.1

Definic
ao via coberturas abertas

A definicao original da entropia topologica e muito semelhante `a definicao da


entropia de Kolmogorov-Sinai, com coberturas abertas no lugar de particoes em
conjunto mensuraveis.
Seja M um espaco topologico compacto. Chamamos cobertura aberta de M
qualquer famlia de abertos cuja uniao e todo o M . Por compacidade, toda
cobertura aberta admite uma subcobertura (isto e, uma subfamlia que ainda e
uma cobertura) com um n
umero finito de elementos. Chamamos entropia da
cobertura ao n
umero
H() = log N (),
(10.1.1)
onde N () e o menor n
umero tal que admite alguma subcobertura finita com
esse n
umero de elementos.
Dadas duas coberturas abertas e , dizemos que e menos fina que , e
escrevemos , se todo elemento de est
a contido em algum elemento de .
Por exemplo, se e subcobertura de ent
ao . Pelo Exerccio 10.1.1,

H() H().

(10.1.2)

Dadas coberturas 1 , . . . , n , denotamos por 1 n a sua soma, isto e,


a cobertura cujos elementos sao as intersecoes A1 An com Aj j para
cada j. Note que j 1 n para todo j.


10.1. ENTROPIA TOPOLOGICA

303

Seja f : M M uma transformacao contnua. Se e uma cobertura aberta


de M ent
ao f j () = {f j (A) : A } tambem e uma cobertura aberta. Para
cada n 1, denotamos
n = f 1 () f n+1 ().
Usando o Exerccio 10.1.2, vemos que
H(m+n ) = H(m f m (n )) H(m ) + H(f m (n )) H(m ) + H(n )
para todo m, n 1. Em outras palavras, a sequencia H(n ) e subaditiva.
Consequentemente (Lema 3.3.4),
h(f, ) = lim
n

1
1
H(n ) = inf H(n )
n n
n

(10.1.3)

sempre existe. Ele e chamado entropia de f com respeito `a cobertura . A


relacao (10.1.2) implica que

h(f, ) h(f, ).

(10.1.4)

Finalmente, definimos a entropia topol


ogica de f como sendo
h(f ) = sup{h(f, ) : e cobertura aberta de M }.

(10.1.5)

Em particular, se e subcobertura de ent


ao h(f, ) h(f, ). Portanto, a
definicao (10.1.5) n
ao muda se restringirmos o supremo `as coberturas abertas
finitas.
Observe que a entropia h(f ) e um n
umero n
ao negativo, podendo ser infinito
(veja o Exerccio 10.1.5).
Exemplo 10.1.1. Seja f : S 1 S 1 um homeomorfismo qualquer (por exemplo,
uma rotacao R ) e seja uma cobertura do crculo formada por um n
umero
finito de intervalos abertos. Seja o conjunto formado pelos pontos extremos
desses intervalos. Para cada n 1, a cobertura n est
a formada por intervalos,
cujos pontos extremos est
ao em
n = f 1 () f n+1 ().
Note que #n #n n#. Portanto,
h(f, ) = lim
n

1
1
1
H(n ) lim inf log #n lim inf log n = 0.
n
n
n
n
n

Veremos na Proposicao 10.1.9 que h(f ) = limk h(f, k ) para qualquer sequencia
de coberturas abertas k com diam k 0. Ent
ao, considerando coberturas
abertas por intervalos de comprimento menor que 1/k, conclumos do c
alculo
anterior que h(f ) = 0 para todo homeomorfismo do crculo.

CAPITULO 10. PRINCIPIO VARIACIONAL

304

Exemplo 10.1.2. Seja = {1, . . . , d}N e seja a cobertura de pelos cilindros


[0; a], a = 1, . . . , d. Considere o deslocamento : . Para cada n, a
cobertura n est
a formada pelos cilindros de comprimento n:
n = {[0; a0 , . . . , an1 ] : aj = 1, . . . , d}.
Portanto, H(n ) = log #n = log dn e, consequentemente, h(f, ) = log d.
Observe tambem que diam n converge para zero quando n (relativamente
a distancia definida em (A.2.7)). Segue do Corolario 10.1.10, que provaremos
`
daqui a pouco, que h(f ) = h(f, ) = log d. O mesmo vale para o deslocamento
bilateral : em = {1, . . . , d}Z .
Agora vamos mostrar que a entropia topologica e um invariante de equivalencia topol
ogica. Sejam f : M M e g : N N transformacoes contnuas
em espaco topol
ogicos compactos M e N . Dizemos que g e um fator topol
ogico
de f se existe uma aplicacao contnua sobrejetiva h : M N satisfazendo
h f = g h. Se h pode ser escolhida invertvel (homeomorfismo), dizemos que
as duas transformacoes sao topologicamente equivalentes, ou topologicamente
conjugadas, e chamamos h de conjugac
ao topol
ogica entre f e g.
Proposi
c
ao 10.1.3. Se g e um fator topol
ogico de f ent
ao h(g) h(f ). Em
particular, se f e g s
ao topologicamente equivalentes ent
ao h(f ) = h(g).
Demonstrac
ao. Seja : M N uma aplicacao contnua sobrejetiva tal que
f = g . Dada uma cobertura de N , a famlia
1 () = {1 (A) : A }
e cobertura aberta de M . Dados quaisquer conjuntos A0 , A1 , . . . , An1 ,
temos que:
1

n1
\
j=0

\
\

 n1
 n1
f j 1 (Aj ) .
1 g j (Aj ) =
g j (Aj ) =
j=0

j=0

Por definicao, 1 (n ) est


a formada pelos conjuntos no lado esquerdo desta
igualdade, enquanto que os conjuntos no lado direito constituem 1 ()n . Portanto, 1 (n ) = 1 ()n . Como e sobrejetivo, uma famlia n cobre N
se, e somente se, 1 () cobre M . Portanto, (1 ()n ) = (1 (n )) = (n ).
Como n e arbitrario, segue (f, 1 ()) = (g, ). Ent
ao, tomando o supremo
sobre todas as coberturas de N :
h(g) = sup h(g, ) = sup h(f, 1 ()) h(f ).

Isto prova a primeira parte da proposicao. A segunda parte e uma consequencia


imediata, uma vez que nesse caso f tambem e um fator de g.
A recproca da Proposicao 10.1.3 e falsa, em geral. Por exemplo, todos
os homeomorfismos do crculo tem entropia topologica igual a zero (lembre do
Exemplo 10.1.1) mas eles n
ao sao necessariamente topologicamente equivalentes
(por exemplo, a identidade e a rotacao R com diferente de zero).


10.1. ENTROPIA TOPOLOGICA

10.1.2

305

Conjuntos geradores e conjuntos separados

A seguir apresentamos a definicao de entropia topologica de Bowen-Dinaburg.


Seja f : M M uma transformacao contnua num espaco metrico M , n
ao
necessariamente compacto, e seja K M um subconjunto compacto qualquer.
Quando M e compacto basta considerar K = M , como veremos em (10.1.12).
Dados > 0 e n N, dizemos que um conjunto E M e um (n, )-gerador
de K, se para todo x K existe a E tal que d(f i (x), f i (y)) < para todo
i {0, . . . , n 1}. Em outras palavras,
K

B(a, n, ),

aE

onde B(a, n, ) = {x M : d(f i (x), f i (y)) < para i = 0, . . . , n 1} e a bola


din
amica de centro a, comprimento n e raio . Note que {B(x, n, ) : x K} e
uma cobertura aberta de K. Logo, por compacidade, sempre existem conjuntos
(n, )-geradores finitos. Denotamos por gn (f, , K) a menor cardinalidade de
um conjunto (n, )-gerador de K. Definimos
g(f, , K) = lim sup
n

1
log gn (f, , K).
n

(10.1.6)

Observe que a funcao 7 g(f, , K) e mon


otona n
ao crescente. De fato, e
claro da definicao que se 1 < 2 ent
ao todo conjunto (n, 1 )-gerador tambem
e (n, 2 )-gerador. Portanto, gn (f, 1 , K) gn (f, 2 , K) para todo n 1 e,
passando ao limite, g(f, 1 , K) g(f, 2 , K). Isto garante, em particular, que
g(f, K) = lim g(f, , K)
0

(10.1.7)

existe. Finalmente, definimos


g(f ) = sup{g(f, K) : K M compacto}.

(10.1.8)

Tambem introduzimos a seguinte nocao dual. Dados > 0 e n N, dizemos que um conjunto E K e (n, )-separado se dados x, y E, existe j
{0, . . . , n 1} tal que d(f j (x), f j (y)) . Em outras palavras, se x E ent
ao
B(x, n, ) n
ao contem nenhum outro ponto de E. Denotamos por sn (f, , K) a
maxima cardinalidade de um conjunto (n, )-separado. Definimos
s(f, , K) = lim sup
n

1
log sn (f, , K).
n

(10.1.9)

claro que se 0 < 1 < 2 , ent


E
ao todo conjunto (n, 2 )-separado tambem
e (n, 1 )-separado. Portanto, sn (f, 1 , K) sn (f, 2 , K) para todo n 1 e,
passando ao limite, s(f, 1 , K) s(f, 2 , K). Em particular,
s(f, K) = lim s(f, , K)
0

(10.1.10)

CAPITULO 10. PRINCIPIO VARIACIONAL

306

sempre existe. Finalmente, definimos


s(f ) = sup{s(f, K) : K M compacto}.

(10.1.11)

claro que g(f, K1 ) g(f, K2 ) e s(f, K1 ) s(f, K2 ) se K1 K2 . Em


E
particular:
g(f ) = g(f, M ) e s(f ) = s(f, M ) se M e compacto.

(10.1.12)

Outra observacao interessante e que (Exerccio 10.1.7) as definicoes (10.1.8) e


(10.1.11) n
ao sao afetadas quando restringimos os supremos a conjuntos compactos com diametro pequeno.
Proposi
c
ao 10.1.4. Tem-se g(f, K) = s(f, K) para todo compacto K M .
Consequentemente, g(f ) = s(f ).
Demonstrac
ao. Precisamos do seguinte lema:
Lema 10.1.5. gn (f, , K) sn (f, , K) gn (f, /2, K) para todo n 1, todo
> 0 e todo compacto K M .
Demonstrac
ao. Inicialmente, seja E K um conjunto (n, )-separado com cardinalidade maxima. Ent
ao, dado qualquer y K \ E, temos que E {y} n
ao
e (n, )-separado. Portanto, existe x E e existe i {0, . . . , n 1} tal que
d(f i (x), f i (y)) < . Isto prova que E e um conjunto (n, )-gerador de K e, por
sua vez, isso implica que gn (f, , K) #E = sn (f, , K).
Para provar a outra desigualdade, seja E K um conjunto (n, )-separado
e seja F M um conjunto (n, /2)-gerador de K. A hipotese garante que, dado
qualquer x E existe algum ponto y F tal que d(f i (x), f i (y)) < /2 para
todo i {0, . . . , n 1}. Defina uma aplicacao : E F considerando (x)
como sendo qualquer ponto y nessas condicoes. Afirmamos que a aplicacao e
injetiva. De fato, suponha que x, z E sao tais que (x) = y = (z). Ent
ao,
d(f i (x), f i (z)) d(f i (x), f i (y)) + d(f i (y), f i (z)) < /vep/2 + /2
para todo i {0, . . . , n 1}. Como E e (n, )-separado, isso implica que x = z.
Portanto, e injetiva, tal como afirmamos. Segue que #E #F . Como E e
F sao arbitrarios, isto prova que sn (f, , K) gn (f, /2, K).
Ent
ao, dado qualquer > 0 e qualquer compact K M ,

1
1
log gn (f, , K) lim sup log sn (f, , K)
n
n
n
n
1
lim sup log gn (f, /2, K) = g(f, /2, K).
n
n

g(f, , K) = lim sup

Tomando o limite quando 0, obtemos


g(f, K) = lim g(f, , K) lim s(f, , K) = s(f ) lim g(f, /2, K) = g(f, K).
0

Isto prova a primeira parte da proposicao. A segunda parte e uma consequencia


imediata.


10.1. ENTROPIA TOPOLOGICA

307

Proposi
c
ao 10.1.6. Se M e espaco metrico compacto, h(f ) = g(f ) = s(f ).
Demonstrac
ao. Pela Proposicao 10.1.4, basta mostrar que s(f ) h(f ) g(f ).
Comece por fixar > 0 e n 1. Seja E M um subconjunto (n, )separado e seja qualquer cobertura aberta de M com diametro menor que .
Se x e y est
ao no mesmo elemento de n ent
ao
d(f i (x), f i (y)) diam <

para todo i = 0, . . . , n 1.

Em particular, cada elemento de n contem no maximo um elemento de E e,


portanto, #E N (n ). Tomando E com cardinalidade maximal, conclumos
que sn (f, , M ) N (n ) para todo n 1. Consequentemente,
s(f, , M ) = lim sup
n

1
1
log sn (f, , M ) lim log N (n ) = h(f, ) h(f ).
n n
n

Fazendo 0 obtemos que s(f ) = s(f, M ) h(f ).


Em seguida, dada qualquer cobertura aberta de M , seja > 0 um n
umero
de Lebesgue para , ou seja, um n
umero positivo tal que toda bola de raio
est
a contida em algum elemento de . Seja E M um conjunto (n, )-gerador
de M com cardinalidade minimal. Para cada x E e i = 0, . . . , n 1, existe
Ax,i tal que B(f i (x), ) est
a contida em Ax,i . Ent
ao
B(x, n, )

n1
\

f i (Ax,i ).

i=0

n1 i
Ent
ao, a hip
otese de que E e gerador implica que = {i=0
f (Ax,i ) : x E}
e uma cobertura de M . Como n , segue que N (n ) #E = gn (f, , M )
para todo n. Portanto,

h(f, ) = lim
n

1
1
log N (n ) lim inf log gn (f, , M )
n
n
n
(10.1.13)
1
lim sup log gn (f, , M ) = g(f, , M ).
n
n

Fazendo 0, vem que h(f, ) g(f, M ) = g(f ). Como a cobertura e


arbitraria, segue que h(f ) g(f ).
Definimos a entropia topol
ogica de uma transformacao contnua f : M M
num espaco metrico M como sendo g(f ) = s(f ). A Proposicao 10.1.6 mostra
que esta definicao e compatvel com aquela que demos na Secao 10.1.1 para
transformacoes em espacos topol
ogicos compactos. Uma diferenca relevante
e que, enquanto no caso compacto a entropia topologica depende apenas da
topologia (porque h(f ) e definida apenas em termos dos abertos), no caso n
ao
compacto a entropia topol
ogica pode depender tambem da funcao distancia em
M . A este respeito, veja os Exerccios 10.1.3 e 10.1.4. Eles tambem mostram
que, no caso n
ao compacto, a entropia topologica e um invariante de conjugacao
uniformemente contnua mas n
ao necessariamente de conjugacao topologica.

CAPITULO 10. PRINCIPIO VARIACIONAL

308

Exemplo 10.1.7. Suponha que f : M M n


ao expande distancias, ou seja,
que d(f (x), f (y)) d(x, y) para todo x, y M . Ent
ao a entropia topologica
de f e igual a zero. De fato, a hipotese implica que B(x, n, ) = B(x, ) para
todo n 1. Logo, um conjunto E e (n, )-gerador se, e somente se, ele e (1, )gerador. Em particular, a sequencia gn (f, , K) n
ao depende de n e, portanto,
g(f, , K) = 0 para todo > 0 e todo compacto K. Fazendo 0 e tomando
o supremo sobre K, obtemos que g(f ) = 0. Analogamente, s(f ) = 0.
Destacam-se dois casos particulares importantes: contrac
oes, tais que existe
< 1 satisfazendo d(f (x), f (y)) d(x, y) para todo x, y M ; e isometrias,
tais que d(f (x), f (y)) = d(x, y) para todo x, y M . Vimos no Lema 6.3.6 que
todo grupo compacto metriz
avel admite uma distancia relativamente `a qual toda
translacao e uma isometria. Portanto, tambem segue das observacoes anteriores
que toda translacao num grupo topologico metriz
avel tem entropia topologica
igual a zero.
Lembrando que g(f ) = g(f, M ) e s(f ) = s(f, M ), vemos que a conclusao da
Proposicao 10.1.6 pode ser reescrita do seguinte modo:
h(f ) = lim lim sup
0

1
1
log gn (f, , M ) = lim lim sup log sn (f, , M ).
0
n
n
n

Mas a partir da demonstracao da proposicao tambem podemos obter a seguinte


igualdade relacionada:
Corol
ario 10.1.8. Se f : M M e uma transformac
ao contnua num espaco
metrico compacto ent
ao
h(f ) = lim lim inf
0

1
1
log gn (f, , M ) = lim lim inf log sn (f, , M ).
n
0
n
n

Demonstrac
ao. A relacao (10.1.13) d
a que
h(f, ) lim inf
n

1
log gn (f, , M )
n

sempre que > 0 e um n


umero de Lebesgue para a cobertura . Fazendo 0,
conclumos que
1
(10.1.14)
h(f ) lim lim inf log gn (f, , M ).
n
0
n
A primeira desigualdade no Lema 10.1.5 implica que
lim lim inf

1
1
log gn (f, , M ) lim lim inf log sn (f, , M ).
n
0
n
n

(10.1.15)

1
1
log sn (f, , M ) lim lim sup log sn (f, , M ).
0
n
n
n

(10.1.16)

claro que
E
lim lim inf

Como acabamos de observar, a expressao do lado direito e igual a h(f ). Portanto, as desigualdades (10.1.14)-(10.1.16) implicam a conclusao.


10.1. ENTROPIA TOPOLOGICA

10.1.3

309

C
alculo e propriedades

A proxima proposicao e o seu corol


ario simplificam substancialmente o c
alculo
da entropia topol
ogica em exemplos concretos. Quando M e um espaco metrico,
chamamos di
ametro de uma cobertura aberta ao supremo dos diametros dos seus
elementos.
Proposi
c
ao 10.1.9. Suponha que M e um espaco metrico compacto. Seja
(k )k qualquer sequencia de coberturas abertas de M tal que diam k converge
para zero. Ent
ao,
h(f ) = sup h(f, k ) = lim h(f, k ).
k

Demonstrac
ao. Dada qualquer cobertura aberta , seja > 0 um n
umero de
Lebesgue de . Tome n 1 tal que diam k < para todo k n. Pela definicao
de n
umero de Lebesgue, segue que todo elemento de k est
a contido em algum
elemento de . Em outras palavras, k e, portanto, h(f, k ) h(f, ).
Lembrando a definicao (10.1.5), isto prova que
lim inf h(f, k ) h(f ).
k

Tambem e claro das definicoes que h(f ) supk h(f, k ) lim supk h(f, k ).
Combinando estas duas observacoes obtemos a conclusao do lema.
Corol
ario 10.1.10. Suponha M e um espaco metrico compacto. Se e cobertura aberta tal que
Wk1
(1) o di
ametro de k = j=0 f j () converge para zero quando k , ou
(2) f : M M e um homeomorfismo e o di
ametro de k =
converge para zero quando k ,

Wk1

j=k

f j ()

ent
ao h(f ) = h(f, ).
Demonstrac
ao. No caso (1), a Proposicao 10.1.9 e o Exerccio 10.1.6 d
ao:
h(f ) = lim h(f, k ) = h(f, ).
k

A prova no caso (2) e analoga.


A seguir vamos verificar que a entropia topologica se comporta como seria
de se esperar relativamente a iterados positivos, pelo menos quando a transformacao e uniformemente contnua:
Proposi
c
ao 10.1.11. Se f : M M e uma transformac
ao uniformemente
contnua num espaco metrico, ent
ao h(f k ) = kh(f ) para todo k N.
Demonstrac
ao. Fixe k 1 e seja K M um conjunto compacto qualquer.
claro que se E M e (nk, )-gerador
Considere quaisquer n 1 e > 0. E

CAPITULO 10. PRINCIPIO VARIACIONAL

310

de K para a transformacao f ent


ao ele tambem e (n, )-gerador de K para o
iterado f k . Portanto, gn (f k , , K) gnk (f, , K). Logo,
g(f k , , K) = lim
n

1
1
gn (f k , , K) lim gnk (f, , K) = kg(f, , K).
n n
n

Fazendo 0 e tomando o supremo sobre K, vemos que h(f k ) kh(f ).


A prova da outra desigualdade usa a hipotese de que f e uniformemente
contnua. Tome > 0 tal que d(x, y) < implica d(f j (x), f j (y)) < para
todo j {0, . . . , k 1}. Se E M e (n, )-gerador de K para f k ent
ao E
e (nk, )-gerador de K para f . Portanto, gnk (f, , K) gn (f k , , K). Isto
implica que kg(f, , K) g(f, , K). Fazendo e ir para zero, obtemos que
kg(f, K) g(f k , K) para todo compacto K. Logo kh(f ) h(f k ).
Em particular, a Proposicao 10.1.11 vale para toda transformacao contnua
num espaco metrico compacto. Por outro lado, no caso de homeomorfismos em
espacos compactos a conclusao se estende aos iterados negativos:
Proposi
c
ao 10.1.12. Se M e um espaco metrico compacto e f : M M e
um homeomorfismo ent
ao h(f 1 ) = h(f ). Consequentemente, h(f n ) = |n|h(f )
para todo n Z.
Demonstrac
ao. Seja uma cobertura aberta de M . Para todo n 1, denotemos
n+ = f 1 () f n+1 ()

n = f () f n1 ()

Observe que n = f n1 (n+ ). Mais ainda, e uma subcobertura finita de n+


se, e somente se, f n1 () e uma subcobertura finita de n . Como as duas subcoberturas tem a mesma cardinalidade, segue que H(n+ ) = H(n ). Portanto,
h(f, ) = lim
n

1
1
H(n+ ) = lim H(n ) = h(f 1 , ).
n n
n

Como e arbitraria, isto prova que h(f ) = h(f 1 ). A segunda parte do enunciado segue desse fato e da Proposicao 10.1.11.
A afirmacao da Proposicao 10.1.12 e falsa, em geral, no caso nao compacto:
Exemplo 10.1.13. Considere M = R munido da distancia usual e f : R R
dada por f (x) = 2x. Vamos verificar que h(f ) 6= h(f 1 ). Para isso, seja
K = [0, 1] e, dados n 1 e > 0, suponha que E R e conjunto (n, )-gerador
para K. Em particular, todo ponto de f n1 (K) = [0, 2n1 ] est
a a distancia
menor que de algum ponto de f n1 (E). Logo,
2#E = 2#f n1 (E) 2n1 .
Isto prova que gn (f, , K) 2n2 / para todo n e, portanto, g(f, , K) log 2.
Segue que h(f ) g(f, K) log 2. Por outro lado, f 1 e uma contracao e,
portanto, segue do Exemplo 10.1.7 a sua entropia h(f 1 ) e nula.


10.1. ENTROPIA TOPOLOGICA

10.1.4

311

Exerccios

10.1.1. Seja M um espaco topol


ogico compacto. Se e sao coberturas abertas
de M tais que , ent
ao H() H().
10.1.2. Seja M um espaco topol
ogico compacto. Se e sao coberturas abertas
de M e f : M M e transformacao contnua ent
ao H( ) H() + H()
e H(f 1 ()) H(). Se f e sobrejetiva, vale a igualdade H(f 1 ()) = H().
10.1.3. Considere M = (0, ) e f : M M dada por f (x) = 2x. Calcule a
entropia de f quando consideramos em M :
1. a distancia usual d(x, y) = |x y|;
2. a distancia d(x, y) = | log x log y|.
[Observacao: Logo, em espacos n
ao compactos a entropia topologica pode depender da funcao distancia, e n
ao apenas da topologia.]
10.1.4. Considere em M duas distancias d1 e d2 que sao uniformemente equivalentes: para todo > 0 existe > 0 tal que
d1 (x, y) < d2 (x, y) <

d2 (x, y) < d1 (x, y) < .

Mostre que se f : M M e contnua relativamente a qualquer das duas


distancias ent
ao o valor da entropia e o mesmo para as duas distancias.
10.1.5. Sejam f : M M e g : N N transformacoes contnuas. Mostre
que se existe uma aplicacao injetiva contnua : N M tal que g = f
ent
ao h(f ) h(g). Use esse fato para mostrar que a entropia topologica do
deslocamento : [0, 1]Z [0, 1]Z , munido com a distancia entre x = (xn ) e
y = (yn ) definida por
X
d(x, y) =
2|n| |xn yn |,
nZ

e infinita (apesar de que ser um homeomorfismo num compacto).


10.1.6. Seja M um espaco metrico compacto e f : M M uma funcao
contnua. Mostre que h(f, ) = h(f, k ) para toda cobertura aberta e para
todo k 1. Alem disso, se f : M M e um homeomorfismo ent
ao h(f, ) =
k1
h(f, k ) para todo k 1, onde k = j=k
f j ().
10.1.7. Mostre que se K, K1 , . . . , Kl sao conjuntos compactos tais que K est
a
contido em K1 Kl ent
ao g(f, K) maxj g(f, Kj ). Conclua que, dado
qualquer > 0,
g(f ) = sup{g(f, K) : K compacto com diam K < }
e analogamente para s(f ).

CAPITULO 10. PRINCIPIO VARIACIONAL

312

10.1.8. Prove que a transformacao logstica f : [0, 1] [0, 1], f (x) = 4x(1 x)
e topologicamente conjugada `a transformacao g : [0, 1] [0, 1] definida por
g(x) = 1 |2x 1|. Use esse fato para calcular h(f ).
10.1.9. Seja A um alfabeto finito e seja : o deslocamento em = AN .
A complexidade de um elemento x e definida por c(x) = limn n1 log cn (x),
onde cn (x) e o n
umero de palavras distintas com comprimento n que aparecem
em x. Mostre que este limite existe e que ele coincide com a entropia topologica
da restricao : X X do deslocamento ao fecho X da orbita de x. [Observacao:
Uma aplicacao importante e no contexto do Exemplo 6.3.10, onde x e o ponto
fixo de uma substituicao.]
10.1.10. Verifique que se e o ponto fixo da substituicao de Fibonacci em
A = {0, 1} ent
ao cn () = n + 1 para todo n e, portanto, a complexidade c()
e igual a zero. Logo, a entropia do deslocamento : X X associado `a
substituicao de Fibonacci e nula.

10.2

Exemplos

Vamos ilustrar as ideias discutidas anteriormente por meio de alguns exemplos.

10.2.1

Transformac
oes expansivas

Lembre (Secao 9.2.3) que uma transformacao contnua f : M M num espaco


metrico compacto e dita expansiva se existe 0 > 0 tal que d(f j (x), f j (y)) < 0
para todo j N implica que x = y. Quando f : M M e invertvel, dizemos
que ela e expansiva no sentido bilateral, se existe 0 > 0 tal que d(f j (x), f j (y)) <
0 para todo j Z implica que x = y. Nos dois casos, 0 e chamado constante
de expansividade de f .
Proposi
c
ao 10.2.1. Se 0 > 0 e uma constante de expansividade para f ent
ao
(a) h(f ) = h(f, ) para toda cobertura aberta com di
ametro menor que 0 ;
(b) h(f ) = g(f, , M ) = s(f, , M ) para todo < 0 /2.
Em particular, h(f ) < .
Demonstrac
ao. Seja qualquer cobertura aberta de M com diam < 0 . Afir
mamos que limk diam k = 0. De fato, suponha que isso n
ao e verdade. E
claro que a sequencia dos diametros e n
ao crescente. Ent
ao existe > 0 e
para cada k 1 existem pontos xk e yk num mesmo elemento de k tais que
d(xk , yk ) . Por compacidade, podemos escolher uma subsequencia (kj )j tal
que existem x = limj xkj e y = limj ykj . Observe que x 6= y, de fato d(x, y) .
Por outro lado, a escolha de xk e yk num mesmo elemento de k implica que
d(f i (xk ), f i (yk )) diam para todo 0 i < k.

313

10.2. EXEMPLOS

Passando ao limite, vem que d(f i (x), f i (y)) diam < 0 para todo i 0.
Isto contradiz a hip
otese de que 0 e uma constante de expansividade para f .
Esta contradicao prova a nossa afirmacao. Usando a Proposicao 10.1.9, segue
que h(f ) = h(f, ), tal como afirma o item (a).
Para provar o item (b), seja a cobertura de M formada pelas bolas de raio
. Note que n contem toda bola dinamica B(x, n, ):
B(x, n, ) =

n1
\
j=0


f j B(f j (x), )

e cada B(f j (x), ) .

Se E e um conjunto (n, )-gerador de M ent


ao {B(a, n, ) : a E} e cobertura
aberta de M ; pelo que acabamos de dizer, trata-se de uma subcobertura de .
Portanto (lembre tambem do Lema 10.1.5),
N (n ) gn (f, , M ) sn (f, , M ) para todo n.
Passando ao limite, obtemos que h(f, ) g(f, , M ) s(f, , M ). Lembre
que s(f, , M ) s(f, M ) = h(f ). Como diam < 0 , a primeira parte da
proposicao d
a que h(f ) = h(f, ). Estas relacoes implicam o item (b).
A u
ltima afirmacao na proposicao e uma consequencia imediata, uma vez
que g(f, , K), s(f, , K) e h(f, ) sao sempre finitos.
Veja no Exerccio 10.2.7 uma extensao deste resultado para transformacoes hexpansivas, devida a Rufus Bowen [Bow72].
Em seguida, vamos provar que para transformacoes expansivas a entropia
topol
ogica e uma cota superior para a taxa de crescimento do n
umero de pontos
periodicos. Denotaremos por Fix(f n ) o conjunto dos pontos x M tais que
f n (x) = x.
Proposi
c
ao 10.2.2. Se M e um espaco metrico compacto e f : M M e
expansiva ent
ao
1
lim sup log # Fix(f n ) h(f ).
n
n
Demonstrac
ao. Seja uma cobertura de M com diam < 0 , onde 0 e uma
constante de expansividade de f . Afirmamos que cada elemento de n contem
no maximo um ponto de Fix(f n ). De fato, se x, y Fix(f n ) est
ao no mesmo
elemento de n , ent
ao d(f i (x), f i (y) < diam < 0 para todo i = 0, . . . , n 1.
Como f n (x) = x e f n (y) = y, segue que d(f i (x), f i (y) < 0 para todo i 0.
Por expansividade, isso implica que x = y, o que prova a nossa afirmacao. Segue
que
1
1
lim sup log # Fix(f n ) lim sup log #N (n ) = h(f, ).
n
n
n
n
Tomando o limite quando o diametro de vai para zero, obtemos a conclusao
da proposicao.

CAPITULO 10. PRINCIPIO VARIACIONAL

314

Em algumas situacoes interessantes, pode mostrar-se que a entropia e igual


a taxa de crescimento do n
`
umero de pontos periodicos:
lim
n

1
log # Fix(f n ) = h(f ).
n

(10.2.1)

Esse e o caso, por exemplo, dos deslocamentos de tipo finito que estudamos
na Secao 10.2.2. Lembre da Proposicao 10.2.5. Mais geralmente, a igualdade
(10.2.1) vale sempre que a f : M M e uma transformacao expansora num
espaco compacto, conforme veremos na Secao 11.3.

10.2.2

Deslocamentos de tipo finito

Seja X = {1, . . . , d} um conjunto finito e seja A = (Ai,j )i,j uma matriz quadrada
de dimensao d cujos coeficientes tomam apenas os valores 0 ou 1 e tal que
nenhuma linha e identicamente nula: para todo i existe j tal que Ai,j = 1. A
este tipo de matriz, chamamos matriz de transic
ao. Considere o subconjunto
A de = X N das sequencias (xn )n que sao A-admissveis, ou seja, tais que
Axn ,xn+1 = 1

para todo n N.

(10.2.2)

claro que A e invariante pelo deslocamento : , no sentido de que


E
(A ) A . Note tambem que A e fechado em e, portanto, e um espaco
metrico compacto (um fato analogo foi provado no Lema 7.2.5).
Denotaremos por A : A A a restricao do deslocamento a este
compacto invariante. Ela e chamada de deslocamento unilateral de tipo finito
associado a A. O deslocamento bilateral de tipo finito associado a uma matriz
de transicao A e definido de maneira analoga, considerando = X Z e exigindo
(10.2.2) para todo n Z. Neste caso tambem exigimos, como parte da definicao
de matriz de transicao, que as colunas (nao apenas as linhas) de A sejam n
ao
nulas.
A restricao do deslocamento : ao suporte de qualquer medida de
Markov e um deslocamento de tipo finito:
Exemplo 10.2.3. Dada uma matriz estoc
astica P = (Pi,j )i,j defina A =
(Ai,j )i,j por

1 se Pi,j > 0
Ai,j =
0 se Pi,j = 0.
Note que A e uma matriz de transicao: a definicao de matriz estoc
astica implica
que nenhuma linha de P e identicamente nula (no caso bilateral precisamos
supor que nenhuma coluna de P e identicamente nula; isso e autom
atico, por
exemplo, se a matriz P e aperiodica). Comparando (7.2.7) e (10.2.2) vemos
que uma sequencia e A-admissvel se, e somente se, ela e P -admissvel. Seja
a medida de Markov determinada por um vetor de probabilidade p = (pj )j
com entradas positivas e tal que P p = p (Exemplo 7.2.2). Pelo Lema 7.2.5, o
suporte de coincide com o conjunto A = P das sequencias admissveis.

315

10.2. EXEMPLOS

Figura 10.1: Grafo associado a uma matriz de transicao

u
E
til associar a uma matriz de transicao A o grafo orientado
GA = {(a, b) X X : Aa,b = 1}.
Em outras palavras, GA e o grafo cujos vertices sao os pontos de X = {1, . . . , d}
e tal que existe uma aresta do vertice a para o vertice b se, e somente se, Aa,b = 1.
Por exemplo, a Figura 10.1 descreve o grafo associado `a matriz

0 1 1 0
1 1 0 1

A=
1 0 1 0 .
1 0 0 1

Chamamos caminho de comprimento l 1 no grafo GA a qualquer sequencia


a0 , . . . , al em X tal que Aai1 ,ai = 1 para todo i, isto e, tal que sempre existe
uma aresta ligando ai1 a ai . Dados a, b X e l 1, qual e o n
umero Ala,b de
caminhos de comprimento l comecando em a e terminando em b (isto e, com
a0 = a e al = b)? Para responder a esta pergunta, observe que
1. A1a,b = 1 se existe aresta ligando a a b e A1a,b = 0 caso contrario. Em
outras palavras, A1a,b = Aa,b para todo a, b.
2. Os caminhos de comprimento l + m comecando em a e terminando em b
sao as concatenacoes dos caminhos de comprimento l comecando em a e
terminando em algum ponto z X com os caminhos de comprimento m
comecando nesse ponto z e terminando em b. Portanto,
Al+m
a,b

d
X
z=1

Ala,z Am
z,b

para todo a, b X e todo l, m 1.

Destas duas observacoes segue, imediatamente, que Ala,b e, precisamente, o coeficiente na linha a e coluna b da matriz Al .

CAPITULO 10. PRINCIPIO VARIACIONAL

316

As propriedades topologicas b
asicas dos deslocamentos de tipo finito serao
analisadas no Exerccio 10.2.2. Na proxima proposicao calcularemos a entropia topol
ogica destas transformacoes. Para o enunciado precisamos de alguns
coment
arios previos sobre matrizes de transicao.
Lembre que o raio espectral (B) de uma aplicacao linear B : Rd Rd (isto
e, o maximo dos valores absolutos dos autovalores de B) e dado por
(B) = lim kB n k1/n = lim | trc B n |1/n ,
n

(10.2.3)

onde k k representa uma norma qualquer no espaco vetorial das aplicacoes


lineares e trc designa o traco da matriz. Todas as normas sao equivalentes, ja
que estamos em dimensao finita. Em geral, consideramos a norma de operador
kBk = sup{kBvk/kvk : v 6= 0} mas tambem sera u
til considerar a norma
definida por
d
X
|Bi,j |.
kBks =
i,j=1

Agora suponha que A e uma matriz de transicao. Como os coeficientes


de A sao n
ao negativos, podemos usar o teorema de Perron-Frobenius (Teorema 7.2.3), para concluir que A admite um autovalor n
ao negativo A que e
igual ao raio espectral. Pela definicao de matriz de transicao, tambem temos
que as linhas da matriz A sao n
ao nulas. Ent
ao o mesmo vale para An , qualquer
que seja n 1 (Exerccio 10.2.4). Isto implica que todos os coeficientes do vetor
An (1, . . . , 1) sao (inteiros) positivos e, portanto,
kAn k

kAn (1, . . . , 1)k


1
k(1, . . . , 1)k

para todo n 1.

Usando (10.2.3), obtemos que A = (A) 1 para toda matriz de transicao A.


Proposi
c
ao 10.2.4. A entropia topol
ogica de um deslocamento de tipo finito
A : A A e dada por h(fA ) = log A onde A e o maior autovalor da
matriz de transic
ao A.
Demonstrac
ao. Tratamos o caso de deslocamentos unilaterais. O caso bilateral
e analogo e fica a cargo do leitor. Consideremos a cobertura aberta de A
formada pelas restricoes
[0; a]A = {(xj )j A : x0 = a}
dos cilindros [0; a] de M . Para cada n 1, a cobertura aberta n est
a formada
pelas restricoes
[0; a0 , . . . , an1 ]A = {(xj )j A : xj = aj para j = 0, . . . , n 1}.
dos cilindros de comprimento n. Observe que este conjunto e n
ao vazio se, e
somente se, a0 , . . . , an1 e um caminho (de comprimento n 1) no grafo GA :
e evidente que esta condicao e necessaria; para ver que e suficiente, lembre

317

10.2. EXEMPLOS

que por definicao para todo i existe j tal que Ai,j = 1. Como os cilindros sao
disjuntos dois-a-dois, esta observacao mostra que N (n ) e igual ao n
umero total
de caminhos de comprimento n 1 no grafo GA , ou seja,
N (n ) =

d
X

i,j=1

n1
Ai,j
= kAn1 ks .

Pela f
ormula do raio espectral (10.2.3), segue que
h(f, ) = lim
n

1
1
log N (n ) = lim log kAn1 ks = log (A) = log A .
n n
n

Finalmente, como diam n 0, o Corolario 10.1.10 d


a que h(A ) = h(A , ).
Proposi
c
ao 10.2.5. Se A : A A e um deslocamento de tipo finito ent
ao
h(A ) = lim
n

1
n
log # Fix(A
).
n

Demonstrac
ao. Tratamos o caso de deslocamentos unilaterais, deixando o caso
n
bilateral a cargo do leitor. Note que (xk )k A e ponto fixo de A
se, e somente
se, xk = xkn para todo k n. Em particular, cada cilindro [0; a0 , . . . , an1 ]A
n
contem no maximo um elemento de Fix(A
). Alem disso, existe um ponto fixo
no cilindro se, e somente se, a0 , . . . , an1 , a0 e um caminho (de comprimento n)
no grafo GA . Isto prova que
n
# Fix(A
)=

d
X

Ani,i = trc An

i=1

para todo n. Consequentemente,


lim
n

1
1
n
log # Fix(A
) = lim log trc An = log (A).
n n
n

Agora, a conclusao segue diretamente da proposicao anterior.

10.2.3

Entropia topol
ogica de fluxos

A definicao da entropia topol


ogica se estende facilmente para o contexto de
fluxos contnuos = {t : M M : t R} num espaco metrico M . Dados
x M , T > 0 e > 0, chamamos bola din
amica de centro x, comprimento T e
raio > 0 ao conjunto
B(x, T, ) = {y M : d(t (x), t (y)) < para todo 0 t T }.
Seja K um subconjunto compacto de M . Dizemos que E M e conjunto
(T, )-gerador para K se
[
K
B(x, T, )
xE

CAPITULO 10. PRINCIPIO VARIACIONAL

318

e dizemos que E K e (T, )-separado se a bola dinamica B(x, T, ) de cada


x E n
ao contem nenhum outro elemento de E.
Denotamos por gT (, , K) a menor cardinalidade de um conjunto (T, )gerador para K e por sT (, , K) a maior cardinalidade de um conjunto (T, )separado E K. Ent
ao tomamos
1
log gT (, , K) e
T
1
s(, K) = lim lim sup log sT (, , K)
0 T T

g(, K) = lim lim sup


0 T

e definimos g() = supK g(, K) e s() = supK s(, K), onde os supremos sao
tomados sobre todos compactos K M . Tal como no caso de tempo discreto
(Proposicao 10.1.4), estes dois u
ltimos n
umeros coincidem.
Por definicao, a entropia topol
ogica do fluxo e h() = g() = s(). No
enunciado a seguir supomos que o fluxo e uniformemente contnuo, ou seja, que
para todo T > 0 e todo > 0 existe > 0 tal que
d(x, y) <

d(t (x), t (y)) <

para todo t [T, T ].

Observe que isto e autom


atico para fluxos contnuos quando o espaco M e
compacto.
Proposi
c
ao 10.2.6. Se o fluxo e uniformemente contnuo ent
ao a entropia
topol
ogica h() do fluxo coincide com a entropia topol
ogica h(1 ) da sua aplicac
ao tempo 1.
Demonstrac
ao. Vamos mostrar que g(, K) = g(1 , K) para todo compacto
K M . Isso implica a conclusao da proposicao.
Se E M e (T, )-gerador para K relativamente ao fluxo ent
ao E e (n, )gerador para K relativamente ao tempo 1, qualquer que seja n T + 1. Em
particular, gn (1 , , K) gn (, , K). Segue que
lim sup
n

1
1
log gn (1 , , K) lim sup log gT (, , K)
n
T T

e portanto g(1 , K) g(, K).


Na prova da desigualdade contraria usamos a hipotese de continuidade uniforme. Dado > 0, fixe (0, ) tal que se d(x, y) < ent
ao d(t (x), t (y)) <
para todo t [0, 1]. Se E M e conjunto (n, )-gerador para K relativamente a
1 ent
ao E e conjunto (T, )-gerador para K relativamente ao fluxo , qualquer
que seja T n. Em particular, gT (, , K) gn (1 , , K). Segue que
lim sup
T

1
1
log gT (, , K) lim sup log gn (1 , , K)
T
n
n

(dada uma sequencia (Tj )j que realiza o supremo do lado esquerdo, considere
nj = [Tj ] + 1). Fazendo , 0, obtemos que g(, K) g(1 , K).

319

10.2. EXEMPLOS

10.2.4

Transformac
oes diferenci
aveis

Nesta secao supomos que M e uma variedade Riemanniana, ou seja, uma variedade diferenci
avel de dimensao finita munida de um produto interno no
espaco tangente Tx M em cada ponto x, tal que o produto interno depende
diferenci
avelmente de x M .
Se f : M M e uma aplicacao diferenci
avel, a sua derivada em cada ponto
x e uma aplicacao linear Df (x) : Tx M Tf (x) M entre dois espacos de Hilbert
(de dimensao finita). Denotamos por kDf (x)k a sua norma de operador:
kDf (x)k = sup

 kDf (x)vk
kv||


: v Tx M e v 6= 0 .

O nosso objetivo e mostrar que esta norma determina uma cota superior para
a entropia topol
ogica. Dado um n
umero real x > 0, denotamos log+ x =
max{log x, 0}.
Proposi
c
ao 10.2.7. Seja f : M M uma aplicac
ao diferenci
avel numa variedade Riemanniana de dimens
ao d tal que kDf k e limitado. Ent
ao
h(f ) d log+ sup kDf k < .
Demonstrac
ao. Seja L = sup{kDf (x)k : x M }. Pelo teorema do valor medio,
d(f (x), f (y)) Ld(x, y)

para todo x, y M.

Se L 1 ent
ao, como vimos no Exemplo 10.1.7, a entropia de f e nula, tal como
e afirmado na proposicao.
A partir de agora, suponhamos que L > 1. Seja A um atlas da variedade M
formado por cartas diferenci
aveis : (2, 2)d M . Dado qualquer conjunto
compacto K M , podemos encontrar uma famlia finita AK A tal que


((1, 1)d ) : AK

cobre K. Fixe B > 0 tal que d((u), (v)) Bd(u, v)para todo u, v [1, 1]d
e todo AK . Dados n 1 e > 0, fixe = (/B d)Ln . Representamos
por Zd o conjunto dos pontos da forma (k1 , . . . , kd ) com kj Z para todo
j = 1, . . . , d. Seja E M a uni
ao das imagens (Zd (1, 1)d ), com
AK .
Note que todo ponto de (1, 1)d est
a a distancia menor que d de algum
d
ponto de Zd (1, 1)d . Portanto,
dado qualquer dAK , todo xd ((1, 1) )
ao, pela
est
a a distancia menor que B d de algum a (Z (1, 1) ). Ent
escolha de ,

d(f j (x), f j (a)) Lj B d < Ln B d =


para todo j = 0, . . . , n 1. Isto prova que E e (n, )-gerador para K. Por outro
lado, por construcao:


#E #AK # Zd (1, 1)d #AK (2/)d #AK (2B dLn /)d .

CAPITULO 10. PRINCIPIO VARIACIONAL

320

Logo a expressao do lado direito e uma cota superior para gn (f, , K) e, por
consequencia,
g(f, , K) lim sup
n

1
log(2B dLn /)d = d log L.
n

Fazendo 0 e tomando o supremo sobre K, vem que h(f ) d log L.


Um enunciado central na teoria da entropia topologica e a seguinte conjectura proposta por Michael Shub [Shu74]:
Conjectura 10.2.8 (Conjectura da entropia). Se f : M M e um difeomorfismo de classe C 1 numa variedade Riemanniana de dimensao d, ent
ao
h(f ) max log (fk )
1kd

(10.2.4)

onde (fk ) denota o raio espectral da acao fk : Hk (M ) Hk (M ) induzida por


f na homologia real de dimensao k.
Embora sejam conhecidos diversas respostas parciais e resultados relacionados, positivos e negativos, o enunciado completo desta conjectura permanece
em aberto. Vamos resumir alguns dos fatos conhecidos.
sabido que a desigualdade (10.2.4) e verdadeira para um subconjunto
E
aberto e denso do espaco dos homeomorfismos em qualquer variedade com dimens
ao d 6= 4. Alem disso ela e verdadeira para todo homeomorfismo em certas classes de variedades, tais como as esferas e as infranilvariedades [MP77b,
MP77a, MP08]. Por outro lado, Shub [Shu74] apresentou um homeomorfismo
Lipschitz, com entropia nula, que n
ao satisfaz a condicao (10.2.4). Veja o
Exerccio 10.2.6.
Um modo u
til de analisar (10.2.4) e comparando a entropia com cada um
dos raios espectrais (fk ). O caso k = d e relativamente facil. De fato, para
qualquer aplicacao contnua f numa variedade de dimensao d, o raio espectral
(fd ) e igual ao valor absoluto | deg f | do grau da aplicacao. Em particular,
a desigualdade h(f ) log (fd ) e trivial no caso de homeomorfismos. Para
aplicacoes contnuas n
ao invertveis, a entropia topologica pode ser menor que
o logaritmo do valor absoluto do grau. Mas foi mostrado em [MP77b] que para
aplicacoes diferenci
aveis sempre vale h(f ) log | deg f |.
Anthony Manning [Man75] provou que a desigualdade h(f ) log (f1 ) e
verdadeira para todo homeomorfismo numa variedade de qualquer dimensao d.
Segue que h(f ) log (fd1 ), uma vez que o teorema de dualidade de Poincare
implica
(fk ) = (fdk ) para todo 0 < k < d.
Em particular, o teorema de Manning juntamente com as observacoes no par
agrafo anterior prova que a conjectura da entropia e valida para homeomorfismos
em qualquer variedade de dimensao d 3.
Rufus Bowen [Bow78] provou que para qualquer homeomorfismo numa variedade h(f ) e maior ou igual que o logaritmo da taxa de crescimento do grupo

321

10.2. EXEMPLOS

fundamental. Mostra-se que esta taxa de crescimento e maior ou igual que o


raio espectral (f1 ). Portanto, este resultado de Bowen implica o teorema de
Manning que acabamos de mencionar.
O principal resultado relativo `a conjectura da estabilidade e o teorema de
Yosef Yomdin [Yom87], segundo o qual a conjectura e verdadeira para todo
difeomorfismo de classe C . O ingrediente crucial da prova e uma relacao entre
a entropia topol
ogica h(f ) e a taxa de crescimento de volume do difeomorfismo.
Esta u
ltima nocao e definida do seguinte modo. Para cada 1 k < d, seja B k a
bola unit
aria em Rk . Represente por v() o volume (k-dimensional) da imagem
de um mergulho diferenci
avel qualquer : B k M . Ent
ao defina
vk (f ) = sup lim sup

1
log v(f n ),
n

onde o supremo e tomado sobre todos os mergulhos : B k M de classe C .


Defina tambem v(f ) = max{vk (f ) : 1 k < d}. N
ao e difcil verificar que
log (fk ) vk (f ) para todo 1 k < d.

(10.2.5)

Sheldon Newhouse [New88] provou que h(f ) v(f ) para todo diffeomorfismo
C r com r > 1. Por outro lado, Yomdin [Yom87] provou a desigualdade recproca
v(f ) h(f ),

(10.2.6)

para todo difeomorfismo de classe C (esta desigualdade e falsa, em geral, no


caso C r com r < ). Combinando (10.2.5) com (10.2.6) obtemos a conjectura
da entropia (10.2.4) para todo difeomorfismo de classe C .
No que diz respeito a sistemas de classe C 1 , tambem e sabido que a desigualdade (10.2.4) e verdadeira para todo difeomorfismo Axioma A sem ciclos [SW75],
para certos difeomorfismos parcialmente hiperb
olicos [SX10] e, mais geralmente,
para qualquer difeomorfismo longe de tangencias homoclnicas [LVY].

10.2.5

Endomorfismos lineares do toro

Nesta secao provamos o seguinte resultado:


Proposi
c
ao 10.2.9. Seja fA : Td Td o endomorfismo induzido no toro Td
por alguma matriz invertvel A com coeficientes inteiros. Ent
ao
h(fA ) =

d
X
j=1

log+ |j |.

(10.2.7)

onde 1 , . . . , d s
ao os autovalores de A, contados com multiplicidade.
Vimos na Proposicao 9.4.3 que a entropia de fA relativamente `a medida de
Haar e igual `
a expressao no lado direito de (10.2.7). Pelo princpio variacional,
que provaremos na Secao 10.4, a entropia topologica e maior ou igual do que

CAPITULO 10. PRINCIPIO VARIACIONAL

322

a entropia da transformacao relativamente a qualquer probabilidade invariante.


Isto implica que
d
X
log+ |j |.
h(fA ) h (f ) =
j=1

Na presente secao nos concentramos na demonstracao da desigualdade oposta:


h(fA )

d
X
j=1

log+ |j |.

(10.2.8)

Inicialmente, suponha que A e diagonaliz


avel, ou seja, que existe uma base
v1 , . . . , vd de Rd com Avi = i vi para cada i. N
ao constitui restricao supor que
kvi k = 1 para todo i, e faremos isso no que segue. Alem disso, renumerando os
autovalores se necessario, podemos supor que |i | > 1 de 1 i u e |i | 1
para todo i > u. Seja e1 , . . . , ed a base canonica de Rd e seja P : Rd Rd
o isomorfismo linear definido por P (ei ) = vi para cada i. Ent
ao P 1 AP e
uma matriz diagonal. Fixe L > 0 suficientemente grande para que P ((0, L)d )
Q
contenha algum cubo unit
ario di=1 [bi , bi + 1]d . Veja a Figura 10.2. Seja :
Rd Td a projecao canonica. Ent
ao, P ((0, L)d ) contem todo o toro Td .

b2 + 1
b2

b1

b1 + 1

Figura 10.2: Construindo um conjunto (n, )-gerador em Td

Dados n 1 e > 0, fixe > 0 tal que kP k d < . Alem disso, para cada
i = 1, . . . , d, tome

|i |n se i u
i =

se i > u
Considere o conjunto
E = P



(k1 1 , . . . , kd d ) (0, L)d : k1 , . . . , kd Z

Observe tambem que, dado qualquer j 1,




f j (E) P (k1 j1 1 , . . . , kd jd d ) : k1 , . . . , kd Z .

Considere 0 j < n. Por construcao, |ki ji i | para todo


i = 1, . . . , d.
Portanto, todo ponto de Rd est
a a distancia menor ou igual que d de algum

323

10.2. EXEMPLOS

ponto da forma (k1 j1 1 , . . . , kd jd d ). Ent


ao (veja a Figura 10.2),
para cada
x Td podemos encontrar a E tal que d(f j (x), f j (a)) kP k d para todo
0 j < n. Isto mostra que E e um conjunto (n, )-gerador de Td . Por outro
lado,
 d Y
u
d
Y
L
L
|i |n .
=
#E

i
i=1
i=1
Qu
Estas observacoes mostram que gn (fA , , Td ) (L/)d i=1 |i |n para todo
n 1 e todo > 0. Logo,
u

h(f ) = lim lim sup


0

X
X
1
log+ |i |.
log |i | =
gn (fA , , Td )
n
i=1
i=1

Isto prova a Proposicao 10.2.9 no caso em que A e diagonaliz


avel.
O caso geral pode ser tratado de forma semelhante, escrevendo a matriz A
na forma can
onica de Jordan.

10.2.6

Exerccios

10.2.1. Sejam (Mi , di ), i = 1, 2 espacos metricos e sejam fi : Mi Mi transformacoes contnuas. Seja M = M1 M2 e seja d a distancia definida em M
por
d((x1 , x2 ), (y1 , y2 )) = max{d1 (x1 , y1 ), d2 (x2 , y2 )}
e considere f : M M definida por f (x1 , x2 ) = (f1 (x1 ), f2 (x2 )). Mostre que
h(f ) h(f1 ) + h(f2 ) e que vale a igualdade se algum dos espacos for compacto.
10.2.2. Seja A : A A um deslocamento de tipo finito, unilateral ou
bilateral. Dizemos que a matriz de transicao A e irredutvel se para todo i, j X
existe n 1 tal que Ani,j > 0 e dizemos que A e aperi
odica se existe n 1 tal
que Ani,j > 0 para todo i, j X. Mostre que:
(a) Se A e irredutvel, o conjunto dos pontos periodicos de A e denso em A .
(b) A e transitivo se, e somente se, A e irredutvel.
(c) A e topologicamente misturador se, e somente se, A e aperiodico.
[Observacao: A condicao (b) significa que o grafo orientado GA e conexo: dados
a, b X existe algum caminho em GA comecando em a e terminando em b.]
10.2.3. Seja M um espaco metrico compacto. Mostre que, dado qualquer
> 0, a restricao da funcao entropia topologica f 7 h(f ) ao conjunto das
transformacoes contnuas f : M M que sao -expansivas e semicontnua
superiormente (relativamente `
a topologia da convergencia uniforme).
10.2.4. Mostre que se A e matriz de transicao ent
ao, para todo k 1, nenhuma
linha de Ak e identicamente nula. O mesmo vale para as colunas de Ak , k 1,
se suposermos que A e matriz de transicao no sentido bilateral.

CAPITULO 10. PRINCIPIO VARIACIONAL

324

10.2.5. (a) Seja f : M M um homeomorfismo local sobrejetivo num espaco


metrico compacto e seja d = inf y #f 1 (y). Prove que h(f ) log d.
(b) Seja f : S 1 S 1 uma aplicacao contnua no crculo. Mostre que h(f ) e
maior ou igual que o logaritmo do grau topologico de f : h(f ) log | deg f |.
[Observacao: Misiurewicz, Przytycki [MP77b] provaram que a desigualdade
h(f ) log | deg f | vale para toda aplicacao f : M M de classe C 1 numa
variedade compacta.]
10.2.6. Considere a aplicacao f : C C definida por f (z) = z d /(2|z|d1), com
d 2. Prove que a entropia topologica de f e zero, mas o grau de f e d. Porque
isso n
ao contradiz o Exerccio 10.2.5?
10.2.7. Seja f : M M uma aplicacao contnua de um espaco metrico compacto M . Dado > 0, defina
g (f, ) = sup{g(f, B(x, , )) : x M }
onde B(x, , ) representa o conjunto dos y M tais que d(f i (x), f i (y))
para todo n 0. Bowen [Bow72] mostrou que, dados b > 0 e > 0, existe
c > 0 tal que log gn (f, , B(x, n, )) < c + (g (f, ) + b)n para todo x M e
todo n 1. Usando este fato, prove que h(f ) g(f, , M ) + g (f, ). Dizemos
que f e h-expansiva se g (f, ) = 0 para algum > 0. Conclua que ent
ao
h(f ) = g(f, , M ). [Observacao: Isto generaliza a Proposicao 10.2.1, pois toda
transformacao expansiva e h-expansiva.]

10.3

Press
ao

Nesta secao introduzimos uma generalizacao importante do conceito de entropia


topol
ogica, que e denominada press
ao (ou press
ao topol
ogica), e estudamos as
suas propriedades principais.

10.3.1

Definic
ao via coberturas abertas

Seja f : M M uma transformacao contnua num espaco metrico compacto.


Chamamos potencial em M a qualquer P
funcao contnua : M R. Para cada
n1
n N, definimos n : M R por n = i=0 f i . Alem disso, dado qualquer
conjunto n
ao vazio C M , denotamos
n (C) = sup{n (x) : x C}.
Dada uma cobertura aberta de M definimos
 X n (U)

Pn (f, , ) = inf
e
: e subcobertura finita de n .

(10.3.1)

(10.3.2)

Esta sequencia e subaditiva (Exerccio 10.3.1) e, portanto, o limite


P (f, , ) = lim
n

1
log Pn (f, , )
n

(10.3.3)


10.3. PRESSAO

325

existe. Finalmente, chamamos press


ao do potencial relativamente a f ao
limite P (f, ) de P (f, , ) quando o diametro de vai para zero. A existencia
deste limite e garantida pelo seguinte lema:
Lema 10.3.1. Existe
que

lim

diam 0

P (f, , ), ou seja, existe P (f, ) [0, ] tal

lim P (f, , k ) = P (f, )


k

para toda sequencia (k )k de coberturas abertas com diam k 0.


Demonstrac
ao. Sejam (k )k e (k )k sequencias quaisquer de coberturas abertas
com diametros convergindo para zero. Dado qualquer > 0 fixe > 0 tal que
|(x) (y)| sempre que d(x, y) . Por hipotese, diam k < para todo
k suficientemente grande. Para k fixado, seja > 0 um n
umero de Lebesgue
para k . Por hip
otese, diam l < para todo l suficientemente grande. Pela
definicao de n
umero de Lebesgue, todo B l est
a contido em algum A k .
Observe que n (A) n + n (B) para todo n 1, uma vez que diam k < .
Isto implica que
Pn (f, , k ) en Pn (f, , l ) para todo n 1
e, portanto, P (f, , k ) + P (f, , l ). Fazendo l e depois k ,
obtemos que
lim sup P (f, , k ) + lim inf P (f, , l ).
l

Como > 0 e arbitrario, segue que lim supk P (f, , k ) lim inf l P (f, , l ).
Permutando os papeis das duas sequencias de coberturas, conclumos que os
limites limk P (f, , k ) e liml P (f, , l ) existem e sao iguais.
Antes de prosseguirmos, vamos mencionar algumas consequencias simples
das definicoes. A primeira delas e que a press
ao do potencial nulo coincide com
a entropia topol
ogica. De fato, e imediato de (10.3.2) que Pn (f, 0, ) = N (n )
para todo n 1 e, portanto, P (f, 0, ) = h(f, ) para toda cobertura aberta .
Portanto,
P (f, 0) = h(f ).
(10.3.4)
Dada qualquer constante c R, temos Pn (f, +c, ) = ecn Pn (f, , ) para todo
n 1 e, portanto, P (f, + c, ) = P (f, , ) + c para toda cobertura aberta .
Logo,
P (f, + c) = P (f, ) + c.
(10.3.5)
Analogamente, se ent
ao Pn (f, , ) Pn (f, , ) para todo n 1 e,
portanto, P (f, , ) = P (f, , ) para toda cobertura aberta . Ou seja,

P (f, ) P (f, ).

(10.3.6)

Em particular, como inf sup , temos


h(f ) + inf P (f, ) h(f ) + sup

(10.3.7)

CAPITULO 10. PRINCIPIO VARIACIONAL

326

para todo potencial . Um corol


ario interessante e que se h(f ) e finita ent
ao
P (f, ) < para todo potencial e caso contrario P (f, ) = para todo
potencial . Um exemplo desta u
ltimo caso est
a dado no Exerccio 10.1.5.
Outra consequencia direta da definicao e que a press
ao e um invariante de
equivalencia topol
ogica:
Proposi
c
ao 10.3.2. Sejam f : M M e g : N N transformac
oes contnuas
em espacos metricos compactos. Se existe um homeomorfismo h : M N tal
que h f = g h ent
ao P (g, ) = P (f, h) para todo potencial em N .

possvel substituir o supremo pelo nfimo em (10.3.1),


Observa
c
ao 10.3.3. E
embora a definicao da press
ao fique um pouco mais complicada. Para ver isso,
considere:

 X (U)
: e subcobertura finita de n
e n
P n (f, , ) = inf
U

onde n (C) = inf{n (x) : x C}. A sequencia P n (f, , ) pode n


ao ser
subaditiva. Por outro lado, como e (uniformemente) contnua, dado qualquer
> 0 existe > 0 tal que n (C) n (C) n+n (C) sempre que diam C .
Ent
ao,
P n (f, , ) Pn (f, , ) en P n (f, , )
para toda cobertura aberta com diam . Consequentemente,
1
log P n (f, , )
n
n
1
= lim lim inf log P n (f, , ).
n
diam 0
n

P (f, ) =

10.3.2

lim

diam 0

lim sup

(10.3.8)

Conjuntos geradores e conjuntos separados

Agora vamos apresentar duas definicoes alternativas da press


ao, em termos de
conjuntos geradores e conjuntos separados. Tal como antes, f : M M e uma
transformacao contnua num espaco metrico compacto e : M R e uma
funcao contnua.
Dados n 1 e > 0, defina
 X n (x)

Gn (f, , ) = inf
e
: E e conjunto (n, )-gerador de M
e
xE

Sn (f, , ) = sup

X

xE

(10.3.9)
en (x) : E e conjunto (n, )-separado em M .

Em seguida, defina
1
log Gn (f, , ) e
n
n
1
S(f, , ) = lim sup log Sn (f, , )
n
n

G(f, , ) = lim sup

(10.3.10)


10.3. PRESSAO

327

e tambem
G(f, ) = lim G(f, , )
0

S(f, ) = lim S(f, , )


0

(10.3.11)

(os limites existem, porque as funcoes sao mon


otonas em ).
Note que Gn (f, 0, ) = gn (f, ) e Sn (f, 0, ) = sn (f, ) para todo n 1 e
todo > 0. Portanto (Proposic
ao 10.1.6), G(f, 0) = g(f ) e S(f, 0) = s(f ) sao
iguais `
a entropia topol
ogica h(f ). Em geral, temos:
Proposi
c
ao 10.3.4. P (f, ) = G(f, ) = S(f, ) para todo potencial em M .
claro das definicoes que todo
Demonstrac
ao. Considere n 1 e > 0. E
conjunto (n, )-separado maximal e (n, )-gerador. Ent
ao,
 X n (x)

Sn (f, , ) = sup
e
: E e conjunto (n, )-separado
xE

= sup

X

xE

inf

X

xE


en (x) : E e (n, )-separado maximal

(10.3.12)


en (x) : E e (n, )-gerador = Gn (f, , ).

Isto implica que G(f, , ) S(f, , ). Passando ao limite quando 0,


obtemos G(f, ) S(f, ).
Em seguida provamos que S(f, ) P (f, ). Sejam e n
umeros positivos
tais que d(x, y) implica |(x) (y)| . Seja qualquer cobertura
aberta de M com diam < . Seja E M qualquer conjunto (n, )-separado.
Dada qualquer subcobertura de n , e claro que todo ponto de E est
a contido
em algum elemento de . Por outro lado, a hipotese de que E e (n, )-separado
implica que cada elemento de contem no maximo um elemento de E. Portanto,
X
X
en (x)
en (U) .
xE

Tomando o supremo em E e o nfimo em , obtemos que


Sn (f, , ) Pn (f, , ).

(10.3.13)

Segue que S(f, , ) P (f, , ). Fazendo 0 (logo diam 0), conclumos


que S(f, ) P (f, ), conforme afirmado.
Finalmente, provamos que P (f, ) G(f, ). Sejam e n
umeros positivos
tais que d(x, y) implica |(x) (y)| . Seja qualquer cobertura aberta
de M com diam < . Seja > 0 um n
umero de Lebesgue de e seja E M
um conjunto (n, )-gerador qualquer de M . Para cada x E e i = 0, . . . , n 1,
existe Ax,i tal que B(f i (x), ) est
a contida em Ax,i . Denotamos,
(x) =

n1
\
i=0

f i (Ax,i ).

CAPITULO 10. PRINCIPIO VARIACIONAL

328

Note que (x) n e que B(x, n, ) (x). Logo, a hipotese de que E e


(n, )-gerador implica que = {(x) : x E} e uma subcobertura de . Note
tambem que
n ((x)) n + n (x) para todo x E,
uma vez que diam Ax,i < para todo i. Segue que
X

en (U) en

en (x) .

xE

Isto prova que Pn (f, , ) en Gn (f, , ) para todo n 1 e, por consequencia,


P (f, , ) + lim inf
n

1
Gn (f, , ) + G(f, , ).
n

(10.3.14)

Fazendo 0 vem que P (f, , ) + G(f, ). Ent


ao, fazendo , e diam
ir para zero, P (f, ) G(f, ).
A conclusao da Proposicao 10.3.4 pode ser reescrita da seguinte forma:
P (f, ) = lim lim sup
s0

1
1
Gn (f, , s) = lim lim sup Sn (f, , s).
s0
n
n
n

(10.3.15)

Mas as relacoes (10.3.14) e (10.3.12) na demonstracao tambem d


ao que
P (f, ) lim lim inf
s0

1
1
Gn (f, , s) lim lim inf Sn (f, , s).
n
s0
n
n

Comparando com (10.3.15), obtemos:


P (f, ) = lim lim inf
s0

10.3.3

1
1
Gn (f, , s) = lim lim inf Sn (f, , s).
n
s0
n
n

(10.3.16)

Propriedades

Comecamos por provar uma versao para a press


ao do Corolario 10.1.10:
Proposi
c
ao 10.3.5. Seja f : M M uma aplicac
ao contnua num espaco
metrico compacto. Seja uma cobertura aberta de M tal que
(1) diam k converge para zero quando k , ou
(2) f : M M e um homeomorfismo e diam k 0 quando k .
Ent
ao P (f, ) = P (f, , ) para todo potencial em M .
Demonstrac
ao. Inicialmente, provamos o seguinte lemma:
Lema 10.3.6. P (f, , k ) = P (f, , ) para toda cobertura aberta e todo
k 1.


10.3. PRESSAO

329

Demonstrac
ao. Por definicao, para todo n 1:
 X n (U)
Pn (f, , k ) = inf
e
: subcobertura finita de (k )n }

Pn+k (f, , ) = inf

X

en+k (U) : subcobertura finita de n+k }.

claro que (k )n = n+k . Ent


E
ao, denotando L = sup ||,
ekL Pn (f, , k ) Pn+k (f, , ) ekL Pn (f, , k )
para todo n 1. Isto implica que P (f, , k ) = P (f, , ).
Os Lemas 10.3.1 e 10.3.6 d
ao que P (f, ) = limk P (f, , k ) = P (f, , ).
Isto prova o item (1) da Proposicao 10.3.5. Para o item (2) tambem precisamos
do seguinte fato:
Lema 10.3.7. Se f e um homeomorfismo ent
ao P (f, , f 1 ()) = P (f, , )
para toda cobertura aberta .
Demonstrac
ao. Por definicao, dado qualquer n 1,
 X n (U)
Pn (f, , ) = inf
e
: subcobertura finita de n } e
U

Pn (f, , f

()) = inf

X

en (V ) : subcobertura finita de (f 1 ())n }.

Seja L = sup ||. Note que (f 1 ())n = f 1 (n ) e toda subcobertura finita de


f 1 (n ) tem a forma f 1 () para alguma cobertura finita de n . Alem disso,
n (U ) 2L n (f 1 (U )) n (U ) + 2L
para qualquer U M . Segue que,
e2L Pn (f, , ) Pn (f, , f 1 ()) e2L Pn (f, , )
para todo n 1. Logo, P (f, , f 1 ()) = P (f, , ).
Corol
ario 10.3.8. Se f e um homeomorfismo ent
ao P (f, , k ) = P (f, , )
para toda cobertura aberta e todo k 1.
claro da definicao que k = f k (2k ). Portanto, a conclusao
Demonstrac
ao. E
do corol
ario e uma consequencia direta dos Lemas 10.3.6 e 10.3.7.
O item (2) da Proposicao 10.3.5 e uma consequencia direta do Lema 10.3.1
e do Corol
ario 10.3.8:
P (f, ) = lim P (f, , k ) = P (f, , ).
k

Isto conclui a prova da proposicao.

CAPITULO 10. PRINCIPIO VARIACIONAL

330

Proposi
c
ao 10.3.9. Seja f : M M uma transformac
ao contnua num espaco
metrico compacto e seja um potencial em M . Ent
ao:
(1) P (f k , k ) = kP (f, ) para todo k 1.
(2) Se f e um homeomorfismo ent
ao P (f 1 , ) = P (f, ).
Demonstrac
ao. Seja uma cobertura aberta qualquer de M e seja = k .
n
kn
Dado um potencial em M , denote
para cada
k . Observe que =
Pn1 =
k
n e que n = kn , onde n = j=0 f . Ent
ao,
Pn (f k , , ) = inf{

= inf{

en (U) : n }

ekn (U) : kn } = Pkn (f, , ).

Consequentemente, P (f k , , ) = kP (f, , ) qualquer que seja . Fazendo


diam 0 (note que diam 0), deduzimos que P (f k , ) = kP (f, ). Isto
prova o item (1).
Para provar o item (2), seja uma cobertura aberta de M . Para todo n 1,
denote
n1
X
f j .
n = f () f n1 () e
=
n
j=0

Observe que n = f n1 (n ) e que e uma subcobertura finita de n se, e


somente se, = f n1 () e uma subcobertura finita de n . Alem disso,
n1
n (U ) =
(U )),
n (f

qualquer que seja U M . Combinando estes fatos, obtemos que


 X n (U)

Pn (f, , ) = inf
e
: subcobertura finita de n
U

= inf

X

en (V ) : subcobertura finita de n = Pn (f 1 , , )

para todo n 1. Ent


ao P (f, , ) = P (f 1 , , ) e, fazendo diam 0, vem
1
que P (f, ) = P (f , ).
A seguir fixamos a transformacao f : M M e consideramos P (f, ) como
funcao no espaco C 0 (M, R) das funcoes contnuas, munido da norma do supremo
kk = sup{|(x)| : x M }.
Vimos em (10.3.7) que se a entropia topologica h(f ) e infinita ent
ao a press
ao
e identicamente igual a . No que segue suporemos que h(f ) e finita. Ent
ao,
P (f, ) e finita para todo potencial .


10.3. PRESSAO

331

Proposi
c
ao 10.3.10. A func
ao press
ao e Lipschitz, com constante de Lipschitz
igual a 1: |P (f, ) P (f, )| k k para quaisquer potenciais e .
Demonstrac
ao. Claro que + k k. Logo, por (10.3.5) e (10.3.6), temos
P (f, ) P (f, ) + k k. Trocando os papeis de e obtemos a outra
desigualdade.
Proposi
c
ao 10.3.11. A func
ao press
ao e convexa:
P (f, (1 t) + t) (1 t)P (f, ) + tP (f, )
para quaisquer potenciais e em M e para todo 0 t 1.
Demonstrac
ao. Escreva = (1 t) + t. Ent
ao n = (1 t)n + tn para todo
n 1 e, portanto, n (U ) (1 t)n (U ) + tn (U ) para todo U M . Logo,
pela desigualdade de H
older (Teorema A.5.5),
X
X
1t X n (U) t
en (U)
en (U)
e
U

para qualquer famlia finita de subconjuntos de M . Isto implica que, dada


qualquer cobertura aberta ,
Pn (f, , ) Pn (f, , )1t Pn (f, , )t
para todo n 1 e, portanto, P (f, , ) (1 t)P (f, , ) + tP (f, , ). Passando ao limite quando diam 0, obtemos a conclusao da proposicao.
Dizemos que dois potenciais , : M R sao cohom
ologos se existe alguma
funcao contnua u : M R tal que = + u f u. Note que esta e uma
relacao de equivalencia no espaco dos potenciais (Exerccio 10.3.2).
Proposi
c
ao 10.3.12. Seja f : M M uma transformac
ao contnua num
espaco topol
ogico compacto. Se , : M R s
ao potenciais cohom
ologos ent
ao
P (, f ) = P (, f ).
Demonstrac
ao. Se = + u f u ent
ao n (x) = n (x) + u(f n (x)) u(x)
para todo n N. Seja K = sup |u|. Ent
ao |n (C) n (C)| 2K para todo
conjunto C M . Logo, para qualquer cobertura aberta ,
X
X
X
e2K
en (U)
en (U) e2K
en (U) .
U

Isto implica que, dada qualquer cobertura aberta de M ,


e2K Pn (f, , ) Pn (f, , ) e2K Pn (f, , )
para todo n. Logo, P (f, , ) = P (f, , ) para todo e, consequentemente,
P (f, ) = P (f, ).

CAPITULO 10. PRINCIPIO VARIACIONAL

332

10.3.4

Coment
arios sobre Mec
anica Estatstica

Facamos uma pausa para explicar a conex


ao entre o conceito matematico de
press
ao e as quest
oes da Fsica que est
ao na origem de boa parte da teoria apresentada neste captulo e no captulo anterior. O leitor interessado em aprofundar
este tema deve consultar o trabalho classico de David Ruelle [Rue04].
A Mec
anica Estatstica (no equilbrio) tem como objetivo descrever as propriedades de sistemas fsicos formados por um grande n
umero de unidades
(ou partculas, ou stios) que interagem entre si. A constante de Avogadro
6, 022 1023 d
a uma ideia do que se entende por grande em exemplos concretos.
O maior desafio e tentar compreender os fenomenos fsicos de transic
ao de
fase (ou seja, de mudanca de estado fsico) como, por exemplo, a passagem da
agua do estado lquido ao estado solido. Os metodos matematicos desenvolvidos

para este fim tem se revelado muito frutferos em outros contextos, tais como
a teoria qu
antica de campos e, mais proximo do ambito deste livro, a teoria
erg
odica do sistemas dinamicos uniformemente hiperb
olicos (Bowen [Bow75a]).
Para efeitos de modelagem matematica, e conveniente supor que o conjunto
M das unidades que formam o sistema e infinito. Os exemplos mais estudados
sao os reticulados M = Zd ; tais modelos costumam ser chamados cristais reticulados. Alem disso, e usual supor que cada unidade x M admite um conjunto
finito x de valores possveis. Por exemplo, x = {1, +1} no caso de sistemas
de spin (1 significa que a partcula x tem spin para baixo, +1 significa que o
spin aponta para cima) e = {0, 1} no caso de gases reticulados (1 siginfica
que o stio x est
a ocupado por uma molecula do g
as, 0 significa que o stio est
a
vazio).
Ent
oes do sistema e um subconjunto do proQao o espaco de configurac
duto xM x e um estado do sistema e uma medida de probabilidade em .
Um estado de equilbrio descreve uma configuracao macroscopica do sistema
que pode ser fisicamente observada, isto e, que de fato ocorre na natureza. E
uma transicao de fases corresponde `a coexistencia de mais que um estado de
equilbrio.
Segundo o princpio variacional da Mecanica Estatstica, que remonta `a lei
do menor esforco de Maupertuis, estados de equilbrio sao caracterizados por
minimizarem uma certa grandeza fundamental, tal como, por exemplo, a energia
livre de Gibbs ou a press
ao. No caso de cristais reticulados, e usual supor que
o espaco de configuracoes e invariante pelos deslocamentos
i
i+1
d
1
i1
i
i+1
d
(x1n , . . . , xi1
n , xn , xn , . . . , xn ) 7 (xn , . . . , xn , xn+1 , xn , . . . , xn ).

Isto permite inserir tais sistemas no ambito da Teoria Erg


odica. Em particular,
prova-se que sob hip
oteses adequadas os estados de equilbrio sao medidas de um
certo tipo, chamadas estados de Gibbs, que sao invariantes pelos deslocamentos.
Vamos descrever o conceito de estado de Gibbs e detalhar um pouco mais
as ideias anteriores no contexto dos cristais reticulados. Antes disso, a ttulo de
motivacao adicional, consideremos um modelo particularmente simples, formado
por uma u
nica unidade com conjunto finito. A entropia de uma probabilidade


10.3. PRESSAO

333

em e o n
umero
S() =

() log ().

A cada estado corresponde um valor E() para a energia. Denotamos por


E() a energia media:
X
E() =
()E().

Supomos que o sistema est


a a uma temperatura absoluta T , que e mantida
constante ao longo do tempo. A energia livre de Gibbs est
a definida por:
G() = E() T S()
onde = 1.380 1023m2 kgs2 K 1 e a chamada constante de Boltzmann. Em
outras palavras, denotando = 1/(T ), temos que
X
G() =
()[E() log ()].
(10.3.17)

f
E
acil mostrar que a expressao (10.3.17) e maxima (e, portanto, a energia
livre de Gibbs G() e mnima) se, e somente se:
() = P

eE()
E()
e

para todo

(10.3.18)

(veja o Lema 10.4.4 abaixo). Portanto, a distribuic


ao de Gibbs dada por
(10.3.18) e o u
nico estado de equilbrio do sistema.

10.3.5

Exerccios

10.3.1. Verifique que a sequencia log Pn (f, , ) e subaditiva.


10.3.2. Verifique que a relacao de cohomologia
= + u f u para alguma funcao contnua u : M R
e uma relacao de equivalencia.
10.3.3. Sejam fi : Mi Mi , i = 1, 2 transformacoes contnuas em espacos
metricos compactos e, para cada i, seja i um potencial em Mi . Defina
f1 f2 : M1 M2 M1 M2 , f1 f2 (x1 , x2 ) = (f1 (x1 ), f2 (x2 ))

1 2 : M1 M2 R, 1 2 (x1 , x2 ) = 1 (x1 ) + 2 (x2 ).

Mostre que P (f1 f2 , 1 2 ) = P (f1 , 1 ) + P (f2 , 2 ).


10.3.4. Enuncie e prove um resultado analogo ao obtido na Proposicao 10.2.1,
para a press
ao de uma funcao com respeito a uma transformacao 0 -expansiva.

334

CAPITULO 10. PRINCIPIO VARIACIONAL

10.3.5. Seja M um espaco metrico compacto. Mostre que, dada qualquer


funcao contnua : M R e dado qualquer 0 > 0, a restricao da funcao
press
ao f 7 P (f, ) ao conjunto das transformacoes contnuas f : M M que
sao 0 -expansivas e semicontnua superiormente (relativamente `a topologia da
convergencia uniforme).
10.3.6. Considere a transformacao f : S 1 S 1 definida por f (x) = 2x mod Z.
Prove que se : S 1 R e uma funcao H
older, ent
ao
X
1
en (p) .
P (f, ) = lim log
n n
n
pFix(f )

[Observacao: Encontraremos um resultado mais geral no Exerccio 11.3.4.]

10.4

Princpio variacional

O princpio variacional para a press


ao, que enunciamos a seguir, foi provado
originalmente por Ruele [Rue73] num contexto mais restrito, sendo estendido
por Walters [Wal75] para o contexto que consideramos aqui:
Teorema 10.4.1 (Princpio Variacional). Seja f : M M uma transformac
ao
contnua num espaco metrico compacto e seja M(f ) o conjunto das medidas de
probabilidade invariantes por f . Ent
ao, para toda func
ao contnua : M R,
Z
P (, f ) = sup{h (f ) + d : M(f )}.
O Teorema 10.1 corresponde ao caso particular 0. Em particular, segue que f tem entropia topologica nula se, e somente se, h (f ) = 0 para toda
probabilidade invariante . Esse e o caso, por exemplo, dos homeomorfismos
do crculo (Exemplo 10.1.1) e das translacoes em grupos compactos metriz
aveis
(Exemplo 10.1.7). A hpotese de compacidade e fundamental, uma vez que existem transformacoes sem medidas invariantes e com entropia topologica positiva.
Veja o Exerccio 10.4.4.
Nas Secoes 10.4.1 e 10.4.2 apresentaremos uma demonstracao do Teorema 10.4.1 devida a Misiurewicz [Mis76]. Antes disso, vamos mencionar um
par de consequencias.
Corol
ario 10.4.2. Seja f : M M uma transformac
ao contnua num espaco
metrico compacto e seja Me (f ) o conjunto das medidas de probabilidade invariantes e erg
odicas. Ent
ao,
Z
P (, f ) = sup{h (f ) + d : Me (f )}.
Demonstrac
ao. Dada qualquer M(f ), seja {P : P P} a sua decomposicao erg
odica. Pelos Teoremas 5.1.3 e 9.6.2,

Z
Z
Z 
(P ).
hP (f ) + dP d
h (f ) + d =

10.4. PRINCIPIO VARIACIONAL

335

Isto implica que


sup{h (f ) +

d : M(f )} sup{h (f ) +

d : Me (f )}.

A desigualdade recproca e trivial, uma vez que Me (f ) M(f ). Agora basta


aplicar o Teorema 10.4.1.
Outra consequencia interessante e que para transformacoes com entropia
topol
ogica finita a funcao press
ao determina o conjunto as medidas de probabilidade invariantes:
Corol
ario 10.4.3 (Walters). Seja f : M M uma transformac
ao contnua
num espaco metrico compacto, com entropia topol
ogica h(f ) < . Seja uma
medida com sinal Rfinita em M . Ent
ao e uma probabilidade invariante por f
se, e somente se, d P (f, ) para toda func
ao contnua : M R.

Demonstrac
ao. A afirmacao somente se e uma consequencia imediata do Teorema 10.4.1: se e uma probabilidade invariante ent
ao
Z
Z
P (f, ) h (f ) + d d
para toda funcao contnua . Em seguida, provamos
a recproca.
R
Seja uma medida com sinal, finita tal que d P (f, ) para toda .
Considere qualquer 0. Para quaisquer c > 0 e > 0,
Z
Z
c ( + ) d = c( + ) d P (f, c( + )).

Pela relacao (10.3.7), temos que



P (f, c( + )) h(f ) + sup c( + ) = h(f ) c inf( + ).
R
Portanto, c ( + ) d h(f ) + inf( + ). Quando cR> 0 e suficientemente
grande o lado direito desta desigualdade
e positivo. Logo (+) d > 0. Como
R
> 0 e arbitrario, isto implica que d 0 para todo potencial 0. Logo,
e uma medida positiva.
O proximo passo e mostrar que e uma probabilidade. Por hipotese,
Z
c d P (f, c) = h(f ) + c
para todo c R. Para c > 0 isto implica (M ) 1 + h(f )/c. Passando ao
limite quando c + obtemos que (M ) 1. Analogamente, considerando
c < 0 e passando ao limite quando c , vem que (M ) 1. Portanto, e
uma probabilidade, conforme afirmado.
Resta provar que e invariante por f . Por hipotese, dado c R e qualquer
potencial ,
Z
c

( f ) d P (f, c( f )).

CAPITULO 10. PRINCIPIO VARIACIONAL

336

Pela Proposicao 10.3.12, a expressao no lado direito e igual a P (f, 0) = h(f ).


Para c > 0, isto implica
Z
h(f )
( f ) d
c
R
e, passando ao limite quando c R+, segue que ( f )Rd 0. O mesmo
R
argumento aplicado a d
a que ( f ) d 0. Logo f d = d
para todo potencial . Isto implica (Proposicao A.3.3) que f = .

10.4.1

Prova da cota superior

Nesta secao provamos que, dada qualquer probabilidade invariante ,


Z
h (f ) + d P (f, ).
(10.4.1)
Para isso, seja P = {P1 , . . . , Ps } uma particao finita qualquer. Vamos mostrar
que se e uma cobertura aberta de M com diametro suficientemente pequeno,
dependendo apenas de P, ent
ao
Z
h (f, P) + d log 4 + P (f, , ).
(10.4.2)

R
Fazendo diam 0, segue que hR (f, P) + d log 4 + P (f, ) para toda
particao finita P. Logo, h (f ) + d R log 4 + P (f,
R ). Agora substitua f
por f k e o potencial por k . Note que k d = k d, uma vez que e
invariante por f . Usando tambem as Proposicoes 9.1.14 e 10.3.9, vem que
Z
kh (f, P) + k d log 4 + kP (f, )
para todo k 1. Dividindo por k e passando ao limite quando k obtemos
a desigualdade (10.4.1).
Agora resta provar (10.4.2). Usaremos o seguinte fato elementar:
Lema 10.4.4. Sejam a1 , . . . , ak n
umeros reais P
e sejam p1 , . . . , pk n
umeros n
ao
k
ao,
negativos tais que p1 + + pk = 1. Seja A = i=1 eai . Ent
k
X
i=1

pi (ai log pi ) log A.

Alem disso, vale a igualdade se, e somente se, pj = eaj /A para todo j.
Pk
Demonstrac
ao. Escreva ti = eai /A e xi = pi /eai . Note que i=1 ti = 1. Pela
propriedade de concavidade (9.1.8),
k
X
i=1

k
X
ti xi ).
ti (xi ) (
i=1

10.4. PRINCIPIO VARIACIONAL

337

Pk
Note que ti (xi ) = (pi /A)(ai log pi ) e que
i=1 ti xi = 1/A. Portanto, a
desigualdade anterior pode ser reescrita na seguinte forma:
k
X
pi
i=1

(ai log pi )

1
log A.
A

Multiplicando por A obtemos a desigualdade no enunciado do lema. Alem disso,


vale a igualdade se, e somente se, os xi sao todos iguais, ou seja se existe c tal
que pi = ceai para todo i. Somando sobre i = 1, . . . , k vemos que nesse caso
c = 1/A, conforme afirmado no enunciado.
Como a medida e regular (Proposicao A.3.2), dado > 0 podemos encontrar compactos Qi Pi tais que (Pi \ Qi ) < para todo i = 1, . . . , s. Seja
Q0 o complementar de si=1 Qi e seja P0 = . Ent
ao Q = {Q0 , Q1 , . . . , Qs } e
uma particao finita de M satisfazendo (Pi Qi ) < s para todo i = 0, 1, . . . , s.
Logo, pelo Lema 9.1.6,
H (P/Q) log 2

desde que > 0 seja suficientemente pequeno (dependendo apenas de s). Fixe
e Q a partir daqui e suponha que a cobertura satisfaz
diam < min{d(Qi , Qj ) : 1 i < j s}.

(10.4.3)

Pelo Lema 9.1.11, temos que h (f, P) h (f, Q)+ H (P/Q) h (f, Q)+ log 2.
Logo, para provar (10.4.2) basta mostrar que
Z
h (f, Q) + d log 2 + P (f, , ).
(10.4.4)
Para esse fim, observe que
Z
X

n
H (Q ) + n d
(Q) log (Q) + n (Q)
QQn

para todo n 1. Ent


ao, pelo Lema 10.4.4,
Z
H (Qn ) + n d log

QQn


en (Q) .

(10.4.5)

Seja uma subcobertura finita qualquer de n . Para cada Q Qn considere


qualquer ponto xQ no fecho de Q tal que n (xQ ) = n (Q) (lembre que n (Q)
denota o supremo de n no conjunto Q). Considere UQ tal que xQ UQ .
Ent
ao, n (Q) n (UQ ) para todo Q Qn . A condicao (10.4.3) implica que
cada elemento de intersecta o fecho de n
ao mais que dois elementos de Q.
Portanto, cada elemento de n intersecta o fecho de, no maximo, 2n elementos
de Qn . Em particular, para cada U existem n
ao mais que 2n elementos Q
n
de Q tais que UQ = U . Portanto:
X
X
en (Q) 2n
en (U) ,
(10.4.6)
QQn

CAPITULO 10. PRINCIPIO VARIACIONAL

338

para qualquer subcobertura finita de n . Combinando (10.4.5) e (10.4.6):


Z
n
H (Q ) + n d n log 2 + log Pn (f, , ).

Dividindo por n e passando ao limite quando n , obtemos (10.4.4). Isto


completa a demonstracao da cota superior (10.4.1).

10.4.2

Aproximando a press
ao

Para terminar a prova do Teorema 10.4.1, mostraremos agora que para todo
> 0 existe uma probabilidade invariante por f e tal que
Z
h (f ) + d S(f, , )
(10.4.7)
R
Claramente, isto implica que o supremo dos valores de h (f ) + d quando
varia em M(f ) e maior ou igual que S(f, ) = P (f, ).
Para cada n 1, seja E um conjunto (n, )-separado tal que
X
1
(10.4.8)
en (y) Sn (f, , ).
2
yE

Denotaremos por A a expressao no lado esquerdo desta desigualdade. Considere


as medidas de probabilidade n e n definidas em M por:
n =

1 X n (x)
e
x
A
xE

n =

n1
X

fj n .

j=0

Como o espaco das probabilidades e compacto (Teorema 2.1.5), e lembrando a


definicao (10.3.10), podemos escolher uma subequencia (nj )j tal que
1
log Snj (f, , ) converge para S(f, , ) e
1.
nj
2. nj converge para alguma probabilidade na topologia fraca .
Vamos mostrar que tal probabilidade e invariante por f e satisfaz (10.4.7).
para facilitar a leitura, dividimos o argumento em quatro passos.
Passo 1: Provamos que e invariante. Seja : M R uma funcao contnua
qualquer. Para cada n 1,
Z
Z
Z
Z
n Z

1X
1
j
n
d(f n ) =
f dn = dn +
f dn dn
n j=1
n
e, por consequencia,


2
dn sup ||.
n
Restringindo
a
n
=
n
e
passando
ao
limite
quando
j , vemos que
j
R
R
df = d para toda funcao contnua : M R. Portanto (lembre
a Proposicao A.3.3), f = tal como foi afirmado.
d(f n )

10.4. PRINCIPIO VARIACIONAL

339

Passo 2: Estimamos a entropia relativamente a n . Seja P qualquer particao


finita de M tal que diam P < e (P) = 0. A primeira condicao implica que
cada elemento de P n contem no maximo um elemento de E. Por outro lado,
todo elemento de E est
a contido em algum elemento de P n , evidentemente.
Logo,


X
X 1
1 n (x)
n (x)
n
log
e
Hn (P ) =
n ({x}) log n ({x}) =
e
A
A
xE
xE
Z
1 X n (x)
= log A
e
n (x) = log A n dn
A
xE

(10.4.9)

(a u
ltima igualdade decorre diretamente da definicao de n ).
Passo 3: Calculamos a entropia relativamente a n . Considere 1 k < n.
Para cada r {0, . . . , k 1}, seja qr 0 o maior n
umero inteiro tal que
r + kqr n. Em outras palavras, qr = [(n r)/k]. Ent
ao,
Pn = Pr

r 1
 q_

j=0


f (kj+r) (P k ) f (kqr +r) (P n(kqr +r) )

(o primeiro termo n
ao existe se r = 0 e o terceiro n
ao existe se n = kqr + r).
Portanto,
Hn (Pn )

qX
r 1

Hn (f (kj+r) (P k )) + Hn (P r ) + Hn (f (kqr +r) (P n(kqr +r) )).

j=0

Claro que #P r (#P)k . Usando o Lema 9.1.3, segue Hn (P r ) k log #P.


Pela mesma raz
ao, o u
ltimo termo na desigualdade anterior tambem e limitado
por k log #P. Ent
ao, usando tambem a propriedade (9.1.12),
Hn (Pn )

qX
r 1

Hf (kj+r) n (P k ) + 2k log #P

j=0

(10.4.10)

para todo r {0, . . . , k 1}. Agora, e claro que todo n


umero i {0, . . . , n 1}
se escreve de maneira u
nica na forma i = kj + r com 0 j qr 1. Ent
ao,
somando (10.4.10) sobre todo os valores de r,
kHn (Pn )

n1
X

Hfi n (P k ) + 2k 2 log #P.

(10.4.11)

i=0

A propriedade (9.1.8) de concavidade da funcao (x) = x log x implica que


n1
1X
Hf i (P k ) Hn (P k ).
n i=0 n

CAPITULO 10. PRINCIPIO VARIACIONAL

340

Combinando esta desigualdade com (10.4.11), vemos que


1
2k
1
Hn (Pn ) Hn (P k ) +
log #P.
n
k
n
Por outro lado, pela definicao de n ,
1
n

n dn =

Z
n1 Z
1X
f j dn = dn .
n j=0

Somando com a relacao anterior, obtemos


Z
Z
1
1
2k
1
Hn (Pn ) +
log #P.
n dn Hn (P k ) + dn +
n
n
k
n

(10.4.12)

Passo 4: Traduzimos as estimativas anteriores para a medida limite . Combinando (10.4.9) e (10.4.12), vem que
Z
1
2k
1
k
H (P ) + dn log A
log #P.
k n
n
n
Pela escolha de E em (10.4.8), segue que
Z
1
1
1
2k
k
H (P ) + dn log Sn (f, , ) log 2
log #P.
k n
n
n
n

(10.4.13)

A escolha da particao P implica que (P k ) = 0 para todo k 1, ja que


P k P f 1 (P) f k+1 (P).
Ent
ao, (P ) = limj nj (P ) para todo P P k e, portanto,
H (P k ) = lim Hnj (P k ).
j

R
R
Como a funcao e contnua, tambem temos d = limj dnj . Portanto,
restringindo (10.4.13) `a subsequencia (nj )j e passando ao limite quando j ,
Z
1
k
H (P ) + d S(f, , ).
k
Passando ao limite quando k , vem que
Z
h (f, P) + d S(f, , ).
Agora, fazendo 0 (e, consequentemente, diam P 0), obtemos (10.4.7).
Isto completa a demonstracao do Princpio Variacional (Teorema 10.4.1).

10.5. ESTADOS DE EQUILIBRIO

10.4.3

341

Exerccios

10.4.1. Seja f : M M uma aplicacao contnua em um espaco metrico compacto M . Verifique que P (f, ) h(f ) + sup para toda funcao contnua
: M R.
10.4.2. Se f : M M e uma transformacao contnua em um espaco metrico
compacto e X M e um conjunto positivamente invariante, ou seja, tal que
f (X) X, ent
ao P (f | X, | X) P (f, ).
10.4.3. De outra demonstracao da Proposicao 10.3.12, usando o princpio variacional.
10.4.4. Exiba um exemplo de transformacao contnua f : M M em um
espaco metrico n
ao compacto M , tal que f n
ao possui medida invariante, mas
a entropia h(f ) e positiva. Conclua que o princpio variacional n
ao vale quando
M n
ao e compacto.
10.4.5. Dados n
umeros , > 0 tais que + < 1, defina

x/
se x [0, ]
g : [0, ] [1 , 1] [0, 1] f (x) =
(x 1)/ + 1 se x [1 , 1].
Seja K [0, 1] o conjunto de Cantor formado pelos pontos x tais que g n (x)
est
a definido para todo n 0 e seja f : K K a restricao de g. Calcule a
funcao : R R dada por (t) = P (f, t log g ). Verifique que e Rconvexa e
decrescente e admite um (
unico) zero em (0, 1). Mostre que h (f ) < log g d
para toda probabilidade invariante por f .

10.5

Estados de equilbrio

Seja f : M M uma transformacao contnua num espaco metrico compacto.


Uma medida invariante de probabilidade e dita um estado de equilbrio para
um potencial : M M se ela realiza o supremo no princpio variacional, ou
seja, se
Z
Z
h (f ) + d = P (, f ) = sup{h (f ) + d : M(f )}.
No caso particular 0 tambem dizemos que e uma medida de m
axima
entropia. Nesta secao estudamos as propriedades fundamentais do conjunto
E(f, ) dos estados de equilbrio. Comecemos por alguns exemplos simples.
Exemplo 10.5.1. Se f : M M tem entropia topologica nula, toda probabilidade invariante e medida de maxima entropia, ja que h (f ) = 0 = h(f ).
Para um potencial qualquer : M R,
Z
P (f, ) = sup{ d : M(f )}.

342

CAPITULO 10. PRINCIPIO VARIACIONAL

Logo, e estado de equil


R brio se, e somente se, maximiza a integral de .
Como a funcao 7 d e contnua e M(f ) e compacto, relativamente `a
topologia fraca , maximos existem para todo potencial .
Exemplo 10.5.2. Seja fA : M M o endomorfismo linear induzido no toro
Td por alguma matriz invertvel A com coeficientes inteiros. Seja a medida
de Haar em Td . Pelas Proposicoes 9.4.3 e 10.2.9,
h (fA ) =

d
X
i=1

log+ |i | = h(f )

onde 1 , . . . , d sao os autovalores de A. Em particular, a medida de Haar e


medida de maxima entropia para f .
Exemplo 10.5.3. Seja : o deslocamento em = {1, . . . , d}N e seja
a medida de Bernoulli dada por um vetor de probabilidade p = (p1 , . . . , pd ).
Como vimos no Exemplo 9.1.10,
d

h (, P) = lim
n

X
1
pi log pi .
H (P n ) =
n
i=1

Deixamos a cargo do leitor (Exerccio 10.5.1) verificar que esta funcao atinge
o seu maximo exatamente quando os pi sao todos iguais a 1/d. Alem disso,
nesse caso h () = log d. Lembre tambem que (Exemplo 10.1.2) h() = log d.
Portanto, a medida de Bernoulli dada pelo vetor p = (1/d, . . . , 1/d) e a u
nica
medida de maxima entropia entre todas as medidas de Bernoulli. De fato,
segue da teoria que desenvolveremos no Captulo 12, que ela e a u
nica medida
de maxima entropia entre todas as medidas invariantes.
Comecamos com a seguinte extensao do Princpio Variacional:
Proposi
c
ao 10.5.4. Para todo potencial : M R,
Z
P (f, ) = sup{h (f ) + d : invariante e erg
odica para f }.
Demonstrac
ao. RConsidere o funcional definido : M1 (f ) R definido por
() = h (f )+ d. Para cada probabilidade invariante , seja {P : P P}
a respectiva decomposicao erg
odica. Segue do Teorema 9.6.2 que
Z
() = (P ) d
(P ).
(10.5.1)
Esta relacao implica que o supremo de sobre todas as probabilidades invariantes e menor ou igual que o supremo de sobre as probabilidades invariantes
e erg
odicas. Como a desigualdade oposta e trivial, segue que os dois supremos
sao iguais. Pelo princpio variacional (Teorema 10.4.1), o supremo de sobre
todas as probabilidades invariantes e igual a P (f, ). A conclusao da proposicao
segue imediatamente destas observacoes.

10.5. ESTADOS DE EQUILIBRIO

343

Proposi
c
ao 10.5.5. Suponha que h(f ) < . Ent
ao o conjunto dos estados
de equilbrio para qualquer potencial : M R e um subconjunto convexo de
M(f ): mais precisamente, dado t (0, 1) e dadas 1 , 2 M(f ),
(1 t)1 + t2 E(f, )

{1 , 2 } E(f, ).

Alem disso, uma probabilidade invariante est


a em E(f, ) se, e somente se,
quase toda componente erg
odica de est
a em E(f, ).
Demonstrac
ao. A hip
otese de que a entropia topologica e finita assegura que
P (f, ) < para todo potencial
, como vimos em (10.3.7). Consideremos o
R
funcional () = h (f ) + d introduzido na prova da proposicao anterior.
Pela Proposicao 9.6.1, este funcional e linear convexo:
((1 t)1 + t2 ) = (1 t)(1 ) + t(2 )
para todo t (0, 1) e quaisquer 1 , 2 M(f ). Ent
ao ((1 t)1 + t2 ) e igual
ao supremo de se, e somente se, (1 ) e (2 ) sao iguais a esse supremo.
Isto prova a primeira parte da proposicao. A prova da segunda parte e analoga:
a relacao (10.5.1) d
a que () = sup se, e somente se, (P ) = sup para

-quase todo P .
Corol
ario 10.5.6. Se E(f, ) e n
ao vazio ent
ao ele contem probabilidades invariantes erg
odicas. Alem disso, os elementos extremais do convexo E(f, ) s
ao
precisamente as medidas erg
odicas contidas nele.
Demonstrac
ao. Para provar a primeira afirmacao basta considerar as componentes erg
odicas de qualquer elemento de E(f, ). Passemos a provar a segunda
afirmacao. Se E(f, ) e erg
odica ent
ao (Proposicao 4.3.2) e um elemento
extremal de M(f ). Com maior raz
ao, e um elemento extremal de E(f, ).
Reciprocamente, se E(f, ) n
ao e erg
odica ent
ao podemos escrever
= (1 t)1 + t2 ,

com 0 < t < 1 e 1 , 2 M(f ).

Pela Proposicao 10.5.5 temos que 1 , 2 E(f, ) e, portanto, n


ao e elemento
extremal do conjunto E(f, ).
Em geral, o conjunto dos estados de equilbrio pode ser vazio. O primeiro
exemplo foi dado por Gurevic. A construcao que apresentamos a seguir est
a no
livro de Walters [Wal82]:
Exemplo 10.5.7. Seja fn : Mn Mn uma sequencia de homeomorfismos em
espacos metricos compactos tal que a sequencia (h(fn ))n e crescente e limitada.
A ideia e construir um espaco metrico M e um homeomorfismo f : M M
com as seguintes caractersticas:
M e a uni
ao de todos os Mn com um ponto adicional, que representamos
por , com uma funcao distancia tal que (Mn )n converge para .
f fixa o ponto e a sua restricao a cada Mn coincide com fn .

CAPITULO 10. PRINCIPIO VARIACIONAL

344

Veremos ent
ao que f : M M n
ao tem nenhuma medida de maxima entropia.
Pela Proposicao 10.5.5, basta mostrar que nenhuma probabilidade invariante e
erg
odica realiza h(f ).
Passemos aos detalhes. Seja dn a distancia em cada espaco metrico Mn . N
ao
e restricao supor que dn 1 para todo n. Defina M = n Mn {} e considere
a distancia d definida em M por:
2
n dn (x, y) se x Xn e y Xn com n 1
P
m
i2
se x Xn e y Xm com n m
d(x, y) =
Pi=n

2
i
se x Xn e y = .
i=n

Deixamos ao cuidado do leitor verificar que d e realmente uma distancia em M


e que (M, d) e um espaco compacto. Seja = supn h(fn ). Como os conjuntos
{} e Mn , n 1 sao invariantes e cobrem todo o M , qualquer probabilidade
erg
odica de f satisfaz ({}) = 1, ou ent
ao (Mn ) = 1 para algum n 1.
No primeiro caso, h (f ) = 0. No segundo, pode ser vista como uma probabilidade invariante de fn e, portanto, h (f ) h(fn ). Em particular, h (f ) <
para toda probabilidade invariante e erg
odica para f . A observacao anterior
tambem mostra que
odica para f }
sup{h (f ) : invariante e erg
= sup sup{h (f ) : invariante e erg
odica para fn }.
n

De acordo com a Proposicao 10.5.4, isto significa que h(f ) = supn h(fn ) = .
Desta forma, fica provado que nenhuma medida invariante e erg
odica de f realiza
a entropia topol
ogica.
Mas existe uma classe ampla de transformacoes para as quais a existencia
de estados de equilbrio est
a garantida para todo potencial:
Lema 10.5.8. Se a func
ao entropia de f e semicontnua superiormente ent
ao
E(f, ) e compacto (na topologia fraca ) e n
ao vazio, para qualquer potencial .
Demonstrac
ao. Seja (n )n uma sequencia em M(f ) tal que
Z
hn (f ) + dn converge para P (f, ).
Por compacidade de M1 (f ) (Teorema 2.1.5), a sequencia admite algum ponto de
acumulacao . A semicontinuidade da entropia, juntamente com a continuidade
da integral, implica que
Z
Z
h (f ) + d lim inf hn (f ) + dn = P (f, ).
n

Portanto, e um estado de equilbrio, tal como afirmado. Analogamente, tomando uma sequencia qualquer (n )n em E(f, ) vemos que qualquer ponto de
acumulacao e um estado de equilbrio. Isto mostra que E(f, )e fechado e,
consequentemente, compacto.

10.5. ESTADOS DE EQUILIBRIO

345

Corol
ario 10.5.9. Suponha que f : M M e uma transformac
ao contnua
expansiva num espaco metrico compacto M . Ent
ao todo potencial : M R
admite algum estado de equilbrio.
Demonstrac
ao. Basta combinar o Corolario 9.2.15 com o Lema 10.5.8.
muito facil exibir transA unicidade e um problema mais complexo. E
formacoes com infinitos estados de equilbrio erg
odicos. Por exemplo, seja
f : S 1 S 1 um homeomorfismo do crculo com infinitos pontos fixos. As medidas de Dirac suportadas nesses pontos sao probabilidades invariantes erg
odicas.
Como a entropia topol
ogica h(f ) e igual a zero, essas medidas sao estados de
equilbrio para todo potencial que atinja o seu maximo nesses pontos (Exemplo 10.5.1).
No entanto este tipo de exemplo e trivial, porque a transformacao n
ao e
natural perguntar se uma propriedade de indivisibilidade, tal como
transitiva. E
transitividade ou mistura topol
ogica, garante unicidade do estado de equilbrio.
Resulta que isso n
ao e verdade. O primeiro contra-exemplo (chamado deslocamento de Dyck) foi exibido por Krieger [Kri75]. A seguir apresentaremos
uma construcao particularmente transparente e flexvel, devida a Haydn [Hay].
Outros exemplos interessantes foram estudados por Hofbauer [Hof77].
Exemplo 10.5.10 (Deslocamento verde e amarelo). Tome X = {0, 1, 2, 3, 4} e
considere os subconjuntos V = {1, 2} (smbolos verdes) e A = {3, 4} (smbolos
amarelos). Vamos exibir um compacto H X Z invariante pelo deslocamento
em X Z e tal que a restricao : H H e topologicamente misturadora e admite
duas medidas invariantes mutuamente singulares, v e a , tais que
hv () = ha () = log 2 = h().
Passemos a descrever o exemplo. Por definicao, H = V Z AZ H0 , onde H0
est
a formado pelas sequencias x X Z que satisfazem a seginte regra: sempre
que um bloco com m smbolos de uma dada cor, verde ou amarela, e seguido
por um bloco com n smbolos da outra cor, amarela ou verde, os dois est
ao
separados por um bloco formado por, pelo menos, m + n zeros. Em outras
palavras, sao admitidas as seguintes configuracoes nas sequencias x H0 :
x =(. . . , 0, v1 , . . . , vm , 0, . . . , 0, a1 , . . . , an , 0 . . . ) ou
| {z }
k

x =(. . . , 0, a1 , . . . , am , 0, . . . , 0, v1 , . . . , vn , 0 . . . )
| {z }
k

com vi V , aj A e k m + n. Observe que uma sequencia x H0 pode


comecar e/ou terminar com um bloco infinito de zeros mas n
ao pode comecar

nem terminar com um bloco infinito de uma dada cor (verde ou amarela). E
claro que H e invariante pelo deslocamento. Haydn [Hay] provou que (veja o
Exerccio 10.5.6):
(a) o deslocamento : H H e topologicamente misturador;

CAPITULO 10. PRINCIPIO VARIACIONAL

346
(b) h() = log 2.

Sabemos que V Z e AZ suportam medidas de Bernoulli v e a com entropia


igual a log 2. Ent
ao v e a sao medidas de maxima entropia para : H H
e sao mutuamente singulares.
Claramente, esta construcao pode ser modificada para obter sistemas com
qualquer n
umero de medidas erg
odicas de maxima entropia. Haydn [Hay]
tambem mostrou como adapta-la para construir exemplos de multiplicidade de
estados de equilbrio para outros potenciais.
Nos Captulos 11 e 12 estudaremos uma classe de transformacoes, chamadas expansoras, para as quais tem-se unicidade do estado de equilbrio para
todo potencial H
older. Em particular, essas transformacoes sao intrinsecamente
erg
odicas, isto e, elas admitem uma u
nica medida de maxima entropia.

10.5.1

Exerccios

10.5.1. Mostre que, entre as medidas de Bernoulli do deslocamento :


no espaco = {1, . . . , d}Z , a de maior entropia e dada pelo vetor de probabilidade (1/d, . . . , 1/d).
10.5.2. Seja : o deslocamento em = {1, . . . , d}Z e seja um
potencial localmente constante em (ou seja, e constante em cada cilindro
[0; i]). Calcule P (f, ) e mostre que existe algum estado de equilbrio que e uma
medida de Bernoulli.
10.5.3. Seja : o deslocamento em = {1, . . . , d}N . Dizemos que
uma probabilidade invariante e um estado de Gibbs para um potencial
relativamente a se existem P R e K > 0 tais que
K 1

(C)
K
exp(n (x) nP )

(10.5.2)

para todo cilindro C = [0; i0 , . . . , in1


R ] e qualquer x C. Prove que se e
um estado de Gibbs ent
ao h () + d e igual `a constante P em (10.5.2).
Portanto, e um estado de equilbrio se, e somente se, P = P (, ). Prove
que para cada escolha da constante P existe no maximo um estado de Gibbs
erg
odico.
10.5.4. Sejam f : M M uma transformacao contnua em um espaco metrico
compacto e : M R uma funcao contnua. Se e um estado de
R equilbrio
para , ent
ao o funcional F : C 0 (M ) R definido por F () = d e tal
que F () P (f, + ) P (f, ) para todo C 0 (M ). Conclua que se a
funcao press
ao P (f, ) : C 0 (M ) R e derivavel em todas as direcoes num ponto
, ent
ao admite no maximo um estado de equilbrio.
10.5.5. Sejam f : M M uma transformacao contnua em um espaco metrico
compacto. Mostre que o subconjunto das funcoes C 0 (M ) para as quais
existe um u
nico estado de equilbrio e residual em C 0 (M ).
10.5.6. Verifique as afirmacoes (a) e (b) do Exemplo 10.5.10.

Captulo 11

Transformac
oes Expansoras
As transformacoes f : M M que estudaremos nos dois captulos finais deste
livro tem como propriedade caracterstica expandirem distancias entre pontos
proximos: elas sao tais que existe uma constante > 1 tal que
d(f (x), f (y)) d(x, y)
sempre que a distancia entre os pontos x e y e pequena (daremos a definicao precisa daqui a pouco). Esta classe de transformacoes tem um papel fundamental
na teoria, por diversas raz
oes.
Por um lado, como veremos, as transformacoes expansoras exibem um comportamento din
amico muito rico, tanto do ponto de vista metrico e topologico
quanto do ponto de vista erg
odico. Desta forma, elas nos fornecem um contexto
natural e interessante para implementar muitas das ideias e metodos que foram
introduzidos ao longo do texto. Por outro lado, as transformacoes expansoras
permitem estabelecer paradigmas que sao u
teis para comprender muitos outros
sistemas, tecnicamente mais complexos.
Um caso particular importante sao as transformacoes diferenci
aveis em variedades, caracterizadas pelo fato de que
kDf (x)vk kvk
para todo x M e todo vetor v tangente a M no ponto x. Focaremos este caso
na Secao 11.1. O principal resultado (Teorema 11.1.2) e que, sob a hipotese de
que o jacobiano det Df e H
older, a transformacao f admite uma u
nica probabilidade invariante absolutamente contnua relativamente `a medida de Lebesgue.
Alem disso, essa probabilidade e erg
odica e positiva nos abertos de M .
Na Secao 11.2 estenderemos a nocao de transformacao expansora para espacos metricos e daremos uma descricao global da dinamica topologica dessas
transformacoes baseada no estudo dos seus pontos periodicos. O principal objetivo e mostrar que a din
amica global sempre pode ser reduzida ao caso topologicamente exato (Teoremas 11.2.15). Na Secao 11.3 complementaremos essa
analise mostrando que a entropia topologica destas transformacoes est
a dada
pela taxa de crescimento do n
umero de pontos periodicos.
347

348

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

No Captulo 12 prosseguiremos este estudo do ponto de vista ergodico, desenvolvendo o chamado formalismo termodin
amico das transformacoes expansoras.

11.1

Transformac
oes expansoras em variedades

Seja M uma variedade compacta e seja f : M M uma transformacao de classe


C 1 . Dizemos que f e expansora se existe > 1 e alguma metrica Riemanniana
em M tal que
kDf (x)vk kvk

para todo x M e todo v Tx M .

(11.1.1)

Em particular, f e um difeomorfismo local: a condicao (11.1.1) implica que


Df (x) e um isomorfismo para todo x M . No que segue chamaremos medida
de Lebesgue em M `
a medida de volume m induzida por tal metrica Riemanniana.
A escolha precisa da metrica n
ao sera muito importante, uma vez que as medidas
de volume associadas a distintas metricas Riemannianas sao todas equivalentes.
Exemplo 11.1.1. Seja fA : Td Td o endomorfismo linear do toro induzido
por uma matriz invertvel A com coeficientes inteiros. Suponha que todos os
autovalores 1 , . . . , d de F tem modulo maior que 1. Ent
ao, dado qualquer
1 < < inf i |i |, existe um produto interno em Rd relativamente ao qual
kAvk kvk. (Suponha que os autovalores sao reais. Considere uma base de
Rd que coloca A em forma canonica de Jordan: A = D+N com D diagonal e N
nilpotente. O produto interno relativamente ao qual essa base e ortonormal tem
a propriedade requerida, se > 0 e suficientemente pequeno. O leitor n
ao ter
a
dificuldade para estender este argumento ao caso em que existem autovalores
complexos.) Isto mostra que a transformacao fA e expansora.
claro da definicao que toda transformacao que esteja suficientemente proE
xima, na topologia C 1 , de uma transformacao expansora ainda e expansora.
Portanto, a observacao no Exemplo 11.1.1 fornece todo um aberto de exemplos
de transformacoes expansoras. Um resultado classico de Michael Shub [Shu69]
afirma que vale uma especie de recproca: toda transformacao expansora no toro
Td e topologicamente conjugada a um endomorfismo linear expansor fA .
Dada uma probabilidade invariante , chamamos bacia de o conjunto B()
dos pontos x M tais que
Z
n1
1X
(f j (x)) = d
n n
j=0
lim

para toda funcao contnua : M R. Note que a bacia sempre e um conjunto


invariante. Se e erg
odica, ent
ao B() tem -medida total (Exerccio 4.1.5).
Teorema 11.1.2. Seja f : M M uma transformac
ao diferenci
avel expansora
numa variedade compacta conexa M . Suponha que o jacobiano x 7 det Df (x)
e H
older. Ent
ao f admite uma u
nica probabilidade invariante absolutamente
contnua com relac
ao `
a medida de Lebesgue m. Alem disso, e erg
odica, o


11.1. TRANSFORMAC
OES
EXPANSORAS EM VARIEDADES

349

seu suporte coincide com M e a sua bacia tem medida de Lebesgue total na
variedade.
facil ver
A estrategia da demonstracao do Teorema 11.1.2 e a seguinte. E
(Exerccio 11.1.1) que a pre-imagem por f de um conjunto com medida de
Lebesgue m nula tambem tem medida de Lebesgue nula. Isto significa que a
imagem f por f de qualquer medida absolutamente contnua com relacao
a m tambem e absolutamente contnua com relacao a m. Em particular, a nesima imagem fn m e sempre absolutamente contnua com relacao `a medida de
Lebesgue m.
Provaremos na Proposicao 11.1.7 que a densidade (ou seja, a derivada de
Radon-Nikodym) de cada fn m com relacao a m e limitada por uma constante
independente de n 1. Deduziremos desse fato que todo ponto de acumulacao,
na topologia fraca , da sequencia
n1
1X j
f m
n j=0

e uma probabilidade invariante absolutamente contnua com relacao `a medida


de Lebesgue, com densidade limitada pela mesma constante.
Um argumento adicional provara que tal ponto de acumulacao e u
nico e que
ele satisfaz todas as propriedades no enunciado do teorema.

11.1.1

Lema de distorc
ao

Dando incio `
a demonstracao do Teorema 11.1.2, provaremos o seguinte fato elementar (note que a condicao (11.1.1) significa que no caso de uma transformacao
expansora podemos tomar > 1):
Lema 11.1.3. Seja f : M M um difeomorfismo local numa variedade Riemanniana compacta e seja > 0 um minorante para a conorma kDf 1 k1 da
derivada de f . Ent
ao existe k 1 tal que todo ponto y M tem exatamente k
pre-imagens por f . Alem disso, existe > 0 tal que, para qualquer pre-imagem
x de um ponto y M , existe uma aplicac
ao h : B(y, ) M de classe C 1 tal
que f h = id , h(y) = x e
d(h(y1 ), h(y2 )) 1 d(y1 , y2 )

para todo y1 , y2 B(y, ).

(11.1.2)

Demonstrac
ao. Como a derivada Df e um isomorfismo em todo ponto, dado
qualquer x M existe > 0 tal que f envia alguma vizinhanca V (x) de x
difeomorficamente sobre a bola de raio em torno de y = f (x). Por compacidade, podemos tomar independente de x (Exerccio 11.2.3). Ent
ao o n
umero
de pre-imagens de qualquer y M deve ser limitado. Logo, existe n 1 tal que
Bn = {y M : #f 1 (y) = n}
e n
ao vazio. Como este conjunto e aberto e fechado e M e conexo, segue que
Bn = M . Em outras palavras, todos os pontos tem exatamente n pre-imagens.

350

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

Finalmente, seja h = (f | V (x))1 . Ent


ao kDh(z)k = kDf (h(z))1 k 1
para todo z no domnio de h. Pelo teorema da media, isto implica que h verifica
a propriedade (11.1.2).
Transformacoes h como neste enunciado sao chamadas ramos inversos de f .
O n
umero k = #f 1 (y) de pre-imagens de um ponto qualquer de M e chamado
grau da aplicacao.
Agora suponha que f e uma transformacao expansora. Conforme ja observamos, neste caso podemos tomar > 1. Ent
ao, a propriedade (11.1.2) significa
que os ramos inversos sao contracoes, com taxa uniforme de contracao. Em
particular, podemos definir ramos inversos hn de qualquer iterado f n , n 1,
da seguinte forma. Dado y M e x f n (y), sejam h1 , . . . , hn ramos inversos
de f com
hj (f nj+1 (x)) = f nj (x)
para todo 1 j n. Como cada hj e uma contracao, a sua imagem est
a contida
numa bola de raio menor que em torno de f nj (x). Ent
a o hn = hn h1
claro que f n hn = id e
est
a bem definida na bola de raio em torno de y. E
hn (y) = x. Alem disso, cada hn e uma contracao:
d(hn (y1 ), hn (y2 )) n d(y1 , y2 ) para todo y1 , y2 B(y, ).

Lema 11.1.4. Se f : M M e uma transformac


ao expansora C 1 numa
variedade compacta ent
ao f e expansiva.
Demonstrac
ao. Pelo Lema 11.1.3, existe > 0 tal que, para qualquer preimagem x de um ponto y M , existe uma aplicacao h : B(y, ) M de classe
C 1 tal que f h = id e h(y) = x e
d(h(y1 ), h(y2 )) 1 d(y1 , y2 ) para todo y1 , y2 B(y, ).

Assim, se d(f n (x), f n (y)) para todo n 0 ent


ao

d(x, y) n d(f n (x), f n (y)) n ,

o que implica imediatamente que x = y.


O proximo resultado fornece um bom controle da distorcao de iterados de
f e seus ramos inversos, que e crucial para a demonstracao do Teorema 11.1.2.
Este e o u
nico lugar da demonstracao onde se usa a hipotese de que o jacobiano
x 7 det Df (x) e H
older. Note que, uma vez que f e um difeomorfismo local e M
e compacta, o jacobiano e limitado de zero e de infinito. Portanto, o logaritmo
log | det Df | tambem e H
older: existem C0 > 0 e > 0 tais que


log | det Df (x)| log | det Df (y)| C0 d(x, y) para quaisquer x, y M .
Proposi
c
ao 11.1.5 (Lema de distorcao). Existe C1 > 0 tal que, dado qualquer
n 1, qualquer y M , e qualquer ramo inverso hn : B(y, ) M de f n ,
tem-se
| det Dhn (y1 )|
log
C1 d(y1 , y2 ) C1 (2)
| det Dhn (y2 )|
para todo y1 , y2 B(y, ).


11.1. TRANSFORMAC
OES
EXPANSORAS EM VARIEDADES

351

Demonstrac
ao. Escrevemos hn como composicao hn = hn h1 de ramos
inversos de f . Tambem escrevemos hi = hi h1 para 1 i < n, bem como
h0 = id . Ent
ao
n

| det Dhn (y1 )| X


log | det Dhi (hi1 (y1 ))| log | det Dhi (hi1 (y2 ))| .
=
log
| det Dhn (y2 )|
i=1
Note que log | det Dhi | = log | det Df | hi e que, pelo Lema 11.1.3, cada hj e
uma 1 -contracao. Logo,
n

log

X
| det Dhn (y1 )| X
C0 i d(y1 , y2 ) .
C0 d(hi (y1 ), hi (y2 ))

n
| det Dh (y2 )|
i=1
i=1

Portanto, para provar o lema basta tomar C1 = C0

i=1

i .

O significado geometrico desta proposicao fica ainda mais transparente no


seguinte corol
ario:
Corol
ario 11.1.6. Existe C2 > 0 tal que, para todo y M e quaisquer conjuntos mensur
aveis B1 , B2 B(y, ),
m(B1 )
m(hn (B1 ))
1 m(B1 )

C2
.
C2 m(B2 )
m(hn (B2 ))
m(B2 )
Demonstrac
ao. Tome C2 = exp(2C1 (2) ). Segue da Proposicao 11.1.5 que
Z
n
| det Dhn | dm exp(C1 (2) )| det Dhn (y)|m(B1 ) e
m(h (B1 )) =
B1
Z
| det Dhn | dm exp(C1 (2) )| det Dhn (y)|m(B2 )
m(hn (B1 )) =
B1

Dividindo as duas desigualdades, vem que


m(hn (B1 ))
m(B1 )
C2
.
n
m(h (B2 ))
m(B2 )
Invertendo os papeis de B1 e B2 obtemos a outra desigualdade.
O proximo resultado, que e uma consequencia do lema de distorcao, mostra
que as imagens fn m tem densidades uniformemente limitadas:
Proposi
c
ao 11.1.7. Existe C2 > 0 tal que (fn m)(B) C2 m(B) para todo
conjunto mensur
avel B M e todo n 1.
Demonstrac
ao. Podemos, sem restricao, supor que B est
a contido em alguma
bola B0 = B(z, ) de raio centrada em algum ponto z M . Usando o
Corol
ario 11.1.6 vemos que
m(B)
m(hn (B))
C2
,
m(hn (B0 ))
m(B0 )

352

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

para todo ramo inverso hn de f n no ponto z. Alem disso, tambem temos que
(fn m)(B) = m(f n (B)) e a soma de m(hn (B)) sobre todos os ramos inversos,
e analogamente para B0 . Deste modo, obtemos que
m(B)
(fn m)(B)
C2
.
(fn m)(B0 )
m(B0 )
Claro que (fn m)(B0 ) (fn m)(M ) = 1. Alem disso, a medida de Lebesgue das
bolas com um raio fixado est
a limitada de zero por alguma constante 0 > 0
que so depende de . Ent
ao, para obter a conclusao da proposicao basta tomar
C2 = exp(C1 (2) )/0 .
Tambem precisamos do resultado auxiliar enunciado a seguir. Lembre que,
dada uma funcaRo e uma medida , representamos por a medida definida
por ()(B) = B d.

Lema 11.1.8. Seja uma probabilidade num espaco metrico compacto X, e


seja : X [0, +) uma func
ao integr
avel com respeito a . Seja i , i 1,
uma sequencia de probabilidades em X convergindo para uma probabilidade
na topologia fraca . Se i para todo i 1 ent
ao .
Demonstrac
ao. Seja B um conjunto mensuravel qualquer. Para cada > 0,
seja K um subconjunto compacto de B tal que (B \ K ) e ()(B \ K )
sao ambos menores que . Ent
ao seja A uma vizinhanca aberta de K da
forma A = {z : d(z, K ) < r}, com r > 0 suficientemente pequeno para
que a medida de A \ K seja menor que , tanto para como para . O
conjunto dos valores de r para os quais o bordo de A tem -medida positiva e
finito ou enumer
avel (Exerccio A.3.2). Logo, a menos de mudar r ligeiramente,
se necessario, podemos supor que o bordo de A tem medida zero. Ent
ao,
= lim i implica (A ) = lim i (A ) ()(A ). Fazendo 0 obtemos
que (B) ()(B).
Aplicando este lema na nossa situacao, obtemos
Pn1
Corol
ario 11.1.9. Todo ponto de acumulac
ao da sequencia n1 j=0 fj m
e uma probabilidade invariante para f absolutamente contnua com relac
ao `
a
medida de Lebesgue.
Demonstra
c
ao. Tomemos constante igual a C2 e = m. Tomemos tambem
P
ni 1 j
i = n1
encia (ni )i tal que (i )i converge
i
j=0 f m, para qualquer subsequ
para uma medida . A Proposicao 11.1.7 garante que i . Ent
ao tambem
temos = C2 m, pelo Lema 11.1.8. Isto implica que m, com
densidade limitada por C2 .

11.1.2

Exist
encia de medidas erg
odicas

Agora vamos mostrar que a medida que acabamos de construir e a u


nica probabilidade invariante absolutamente contnua com relacao `a medida de Lebesgue
e, alem disso, e erg
odica para f .


11.1. TRANSFORMAC
OES
EXPANSORAS EM VARIEDADES

353

Comecamos por fixar uma particao P0 = {U1 , . . . , Us } de M em regioes com


interior n
ao vazio e diametro menor que . Ent
ao, para cada n 1, definimos
Pn como sendo a particao de M que consiste das imagens de cada um dos Ui ,
1 i s, pelos respectivos ramos inversos de f n . O diametro da particao Pn ,
ou seja, o supremo dos diametros dos seus elementos, e menor que n .
Lema 11.1.10. Seja Pn , n 1, uma sequencia de partic
oes num espaco
metrico compacto, com di
ametros convergindo para zero quando n . Seja
uma probabilidade nesse espaco, e seja B qualquer conjunto mensur
avel com
(B) > 0. Ent
ao existem Vn Pn , para n 1, tais que
(Vn ) > 0

(B Vn )
1
(Vn )

quando n .

Demonstrac
ao. Dado qualquer 0 < < (B), seja K um subconjunto compacto de B com (B \ K ) < . Como o diametro das particoes converge para
zero, a medida da uni
ao K,n de todos os elementos de Pn que intersectam K
satisfaz (K,n \ K ) < para todo n suficientemente grande. Suponha que
(K Vn )

(B)
(Vn )
(B) +

para todo Vn Pn que intersecta K . Seguiria que


(K )

X
Vn

(K Vn )

X (B)
Vn

(B) +

(Vn ) =

(B)
(K,n )
(B) +

(B)
((K ) + ) (B) < (K ).

(B) +
Esta contradicao mostra que deve existir algum Vn Pn tal que
(Vn ) (B Vn ) (K Vn ) >

(B)
(Vn )
(B) +

e isto implica (Vn ) > 0. Fazendo 0 obtemos a conclusao do lema.


Nos enunciados a seguir, diremos que um conjunto mensuravel A M e
invariante por f : M M se f 1 (A) = A a menos de conjunto com medida
de Lebesgue nula. Usaremos o fato (Exerccio 11.1.1) de que se A e conjunto
invariante ent
ao f (A) = A a menos de conjunto com medida de Lebesgue nula.
Lema 11.1.11. Se A M e um conjunto invariante para f com medida de
Lebesgue positiva, ent
ao A tem medida de Lebesgue total em algum Ui P0 , ou
seja, existe 1 i s tal que m(Ui \ A) = 0.
Demonstrac
ao. Pelo Lema 11.1.10, podemos escolher Vn Pn de tal forma que
m(Vn \ A)/m(Vn ) converge para zero quando n . Seja Ui(n) = f n (Vn ).

354

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

Pela Proposicao 11.1.5 aplicada ao ramo inverso de f n que envia Ui(n) em Vn ,


conclumos que
 m(Vn \ A)
m(Ui(n) \ A)
m(f n (Vn \ A))

exp C1 (2)
n
m(Ui(n) )
m(f (Vn ))
m(Vn )

tambem converge para zero. Como P0 e finito, deve existir 1 i s tal que
i(n) = i para infinitos valores de n. Ent
ao, m(Ui \ A) = 0.
Corol
ario 11.1.12. A transformac
ao f : M M admite alguma probabilidade
invariante erg
odica e absolutamente contnua com relac
ao `
a medida de Lebesgue.
Demonstrac
ao. Segue do lema anterior que existem no maximo s = #P0 conjuntos invariantes com medida de Lebesgue positiva disjuntos dois-a-dois. Portanto,
M pode ser particionado num n
umero finito de conjuntos invariantes A1 , . . . , Ar ,
r s com medida de Lebesgue positiva e que sao minimais, no sentido de que
n
ao existem subconjuntos invariantes Bi Ai satisfazendo 0 < m(Bi ) < m(Ai ).
Dada qualquer medida invariante absolutamente contnua , existe algum i tal
que (Ai ) > 0. Ent
ao a restricao normalizada
i (B) =

(B Ai )
(Ai )

de a cada Ai e invariante e absolutamente contnua. Alem disso, i e erg


odica,
porque Ai e minimal.

11.1.3

Unicidade e conclus
ao da prova

O argumento anterior tambem mostra que existe apenas um n


umero finito de
probabilidades erg
odicas e absolutamente contnuas. O u
ltimo passo da demonstracao e mostrar que, de fato, tal probabilidade e u
nica. Para isso usamos o
fato de que f e topologicamente exata:
Lema 11.1.13. Dado qualquer aberto n
ao vazio U M , existe N 1 tal que
f N (U ) = M .
Demonstrac
ao. Seja x U e r > 0 tais que a bola de raio r centrada em
x est
a contida em U . Dado qualquer n 1, suponha que f n (U ) n
ao cobre
toda a variedade. Ent
ao existe alguma curva ligando f n (x) a um ponto
y M \ f n (U ), e essa curva pode ser tomada com comprimento menor que
diam M + 1. Levantando pelo difeomorfismo local f n , obtemos uma curva n
ligando x a um ponto yn M \ U . Ent
ao r comp(n ) n (diam M + 1).
Isto d
a uma cota superior para o valor possvel de n. Logo, f n (U ) = M para
todo n suficientemente grande, como afirmamos.
Corol
ario 11.1.14. Se A M e um conjunto invariante com medida de Lebesgue positiva, ent
ao A tem medida de Lebesgue total na variedade M .


11.1. TRANSFORMAC
OES
EXPANSORAS EM VARIEDADES

355

Demonstrac
ao. Seja U o interior de um conjunto Ui como no Lema 11.1.11, e
seja N 1 tal que f N (U ) = M . Ent
ao m(U \ A) = 0, e portanto M \ A =
f N (U ) \ f N (A) f N (U \ A) tambem tem medida de Lebesgue zero, pois f e
difeomorfismo local.
O proximo enunciado completa a demonstracao do Teorema 11.1.2:
Corol
ario 11.1.15. Seja qualquer probabilidade invariante absolutamente
contnua. Ent
ao e erg
odica e a sua bacia B() tem medida de Lebesgue total
em M . Consequentemente, e u
nica. Alem disso, o seu suporte e toda a
variedade M .
Demonstrac
ao. Se A e um subconjunto invariante qualquer ent
ao, pelo Corolario 11.1.14, A tem medida de Lebesgue zero ou Ac tem medida de Lebesgue zero.
Uma vez que e absolutamente contnua, segue que (A) = 0 ou (Ac ) = 0. Isto
prova que e erg
odica, logo (B()) = 1. Ent
ao B() e um conjunto invariante
com medida de Lebesgue positiva e, consequentemente, deve ter medida de
Lebesgue total. Analogamente, como o suporte de e um conjunto compacto
invariante, ele tem que coincidir com M .
Finalmente, sejam e duas probabilidades invariantes absolutamente
contnuas quaisquer. Segue do Corolario 11.1.15 que elas sao erg
odicas e que as
suas bacias se intersectam. Dado qualquer ponto x na intersecao B() B(),
= lim
n

n1
1X
j =
n j=0 f (x)

(o limite e na topologia fraca ). Por unicidade do limite, segue que = .


Em geral, dizemos que uma probabilidade invariante de um difeomorfismo
local f e uma medida fsica se a sua bacia tem medida de Lebesgue positiva.
Segue do Corol
ario 11.1.15 que no presente contexto existe uma u
nica medida
fsica, que e a medida invariante absolutamente contnua , e a sua bacia tem
mesmo medida de Lebesgue total. Este u
ltimo fato pode ser reescrito na seguinte
forma:
n1
1X
j para Lebesgue quase todo x.
n j=0 f (x)
No Captulo 12 reobteremos esta probabilidade invariante absolutamente
contnua por outra via (Proposicao 12.1.20), a qual tambem mostra que a
densidade h = d/dm e H
older e est
a limitada de zero. Em particular,
e equivalente `
a medida de Lebesgue m, n
ao apenas absolutamente contnua.
Veremos na Secao 12.1.7 que o sistema (f, ) e exato, n
ao apenas erg
odico.
Alem disso, (Lema 12.1.12) o seu jacobiano e dado por J f = | det Df |(h f )/h.
Ent
ao, a f
ormula de Rokhlin (Teorema 9.7.3) d
a que
Z
Z
Z
Z
h (f ) = log J f d = log | det Df | d + log(h f ) d log h d,

356

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

R
ou seja (porque e invariante), h (f ) = log | det Df | d.
Na verdade, os fatos que acabamos de anunciar ja podem ser provados com
os metodos de que dispomos neste momento. A ttulo de ilustracao, convidamos
o leitor a fazer isso mesmo (Exerccios 11.1.3 a 11.1.6), no contexto das transformacoes expansoras do intervalo, as quais, tecnicamente, sao um pouco mais
simples do que transformacoes expansoras numa variedade qualquer.
Exemplo 11.1.16. Dizemos que uma transformacao f : [0, 1] [0, 1] e transformac
ao expansora do intervalo se existe uma famlia (finita ou enumeravel)
P de subintervalos abertos disjuntos dois-a-dois, cuja uniao tem medida de Lebesgue total em [0, 1], satisfazendo:
(a) A restricao de f a cada P P e um difeomorfismo sobre (0, 1); denotaremos por fP1 : (0, 1) P a sua inversa.
(b) Existem C > 0 e > 0 tais que, para todo x, y e todo P P


log |D(f 1 )(x)| log |D(f 1 )(y)| C|x y| .
P
P
(c) Existem c > 0 e > 1 tais que, para todo n e todo x:
|Df n (x)| c n

(se a derivada est


a definida.)

Esta classe inclui a expansao decimal e a transformacao de Gauss, entre outras.


As suas propriedades sao analisadas nos Exerccios 11.1.3 a 11.1.5.
O Exerccio 11.1.6 trata de uma classe um pouco mais geral de transformacoes, na qual substituimos a condicao (a) por
(a) Existe > 0 tal que a restricao de f a cada P P e um difeomorfismo
sobre um intervalo f (P ) com comprimento maior que e que contem todos
os elementos de P que ele intersecta.

11.1.4

Exerccios

11.1.1. Seja f : M M um difeomorfismo local numa variedade compacta e


seja m a medida de Lebesgue em M . Verifique as seguintes propriedades:
1. Se m(B) = 0 ent
ao m(f 1 (B)) = 0.
2. Se B e mensuravel ent
ao f (B) e mensuravel.
3. Se m(B) = 0 ent
ao m(f (B)) = 0.
4. Se A = B a menos de medida de Lebesgue nula ent
ao f (A) = f (B) e
f 1 (A) = f 1 (B), a menos de conjuntos com medida de Lebesgue nula.
5. Se A e conjunto invariante ent
ao f (A) = A a menos de conjunto com
medida de Lebesgue nula.

11.2. DINAMICA
DAS TRANSFORMAC
OES
EXPANSORAS

357

11.1.2. Seja f : M M uma transformacao de classe C 1 tal que existem > 1


e k 1 tais que kDf k (x)vk kvk para todo x M e todo v Tp M . Mostre
que existe > 1 e existe uma norma Riemanniana hi equivalente a k k, tal que
hDf (x)vi hvi para todo x M e todo v Tp M .
11.1.3. Mostre que se f : [0, 1] [0, 1] e uma transformacao expansora do
intervalo e m representa a medida de Lebesgue em [0, 1], ent
ao existe uma
funcao : (0, 1) (0, ) tal que log e limitada e H
older e = m e uma
probabilidade invariante por f .
11.1.4. Mostre que a medida no Exerccio 11.1.3 e exata e e a u
nica probabilidade invariante de f absolutamente contnua com relacao `a medida m.
11.1.5. Mostre que transformacoes expansoras do intervalo satifazem a formula
de Rokhlin: se e a u
nica medida absolutamente cont
R nua invariante com respeito a Lebesgue e log |f | L1 (), ent
ao h (f ) = log |f | d.

11.1.6. Prove a seguinte generalizacao dos Exerccios 11.1.3 e 11.1.4: se f


satisfaz as condicoes (a), (b) e (c) no Exemplo 11.1.16 ent
ao existe um n
umero
finito, n
ao nulo, de probabilidades absolutamente contnuas ergodicas e toda
probabilidade invariante absolutamente contnua e combinacao convexa dessas
probabilidades erg
odicas.

11.2

Din
amica das transformac
oes expansoras

Nesta secao estenderemos a nocao de transformacao expansora para espacos


metricos compactos e mencionaremos alguns exemplos interessantes. Neste contexto geral, uma transformacao expansora pode n
ao ser nem sequer transitiva
(compare com o Lema 11.1.13). No entanto, veremos nos Teoremas 11.2.14
e 11.2.15, que a sua din
amica sempre pode ser reduzida ao caso topologicamente exato. Isto e relevante porque nos principais resultados das proximas
secoes precisaremos supor que a transformacao e topologicamente exata (ou,
equivalentemente, topologicamente misturadora; veja o Exerccio 11.2.2).
Uma transformacao contnua f : M M num espaco metrico compacto M
e dita expansora se existem constantes > 1 e > 0 tais que para todo p M ,
a imagem da bola B(p, ) contem uma vizinhanca do fecho de B(f (p), ) e
d(f (x), f (y)) d(x, y)

para todo x, y B(p, ).

(11.2.1)

Toda transformacao diferenci


avel expansora, no sentido da Secao 11.1, tambem
e expansora neste sentido:
Exemplo 11.2.1. Seja f : M M uma aplicacao de classe C 1 numa variedade
riemanniana compacta tal que kDf (x)vk kvk para todo x M e todo
v Tx M , onde e uma constante maior que 1. Denote K = sup kDf k (note
que K > 1). Considere qualquer > 0 suficientemente pequeno para que a
restricao de f a toda bola B(p, 2K) seja um difeomorfismo sobre a imagem.
Considere y B(f (p), ) qualquer e seja : [0, 1] B(f (p), ) uma geodesica

358

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

minimizante (isto e, que realiza a distancia entre os seus pontos) com (0) = f (p)
e (1) = y. Pela escolha de , existe uma curva diferenci
avel : [0, ] B(p, )
tal que (0) = p e f ((t)) = (t) para todo t. Observe que (usamos () para
representar o comprimento de uma curva),


d(p, (t)) | [0, t] 1 | [0, t] = 1 td(f (p), y) < t

para todo t. Isto mostra que podemos tomar = 1. Ent


ao (1) B(p, )
e f ((1)) = (1) = y. Desta forma, fica provado que f (B(p, )) contem
(p), ). Agora
B(f (p), ) a qual, evidentemente, e uma vizinhanca de B(f
considere x, y B(p, ) quaisquer. Note que d(f (x), f (y)) < 2K. Seja
: [0, 1] B(x, 2K) uma geodesica minimizante ligando f (x) a f (y). Argumentando como no par
agrafo anterior, encontramos uma curva diferenci
avel
: [0, 1] B(x, 2K) ligando x a y e tal que f ((t)) = (t) para todo t. Ent
ao,
d(f (x), f (y)) = () () d(x, y).
Isto completa a demonstracao de que f e uma transformacao expansora.
O seguinte fato e u
til para a construcao de exemplos:
Lema 11.2.2. Suponha que f : M M e uma transformac
ao expansora e
que M e um compacto tal que f 1 () = . Ent
ao a restric
ao f :
tambem e uma transformac
ao expansora.
claro que a condicao (11.2.1) permanece valida na restricao.
Demonstrac
ao. E
(p), ) em
Resta verificar que f ( B(p, )) contem uma vizinhanca de B(f

. Por hip
otese, f (B(p, )) contem uma vizinhanca V de B(f (p), ). Ent
ao
(p), ). Alem disso, dado qualquer V
V e uma vizinhanca de B(f
existe x B(p, ) tal que f (x) = y. Como f 1 () = , este ponto est
a
necessariamente em . Isto prova que V est
a contida em f ( B(p, )).
Logo a restricao de f a e uma transformacao expansora, tal como afirmado
N
ao e possvel substituir a hipotese do Lema 11.2.2 por f () = . Veja o
Exerccio 11.2.4.
Exemplo 11.2.3. Seja J [0, 1] uma uniao finita de (dois ou mais) intervalos
compactos disjuntos. Considere uma aplicacao f : J [0, 1] tal que a restricao
de f a cada componente conexa de J e um difeomorfismo sobre [0, 1]. Veja a
Figura 11.1. Suponha que existe > 1 tal que
|f (x)|

para todo x J.

(11.2.2)

n
Denote =
(J). Isto e, o conjunto dos pontos x cujos iterados
n=0 f
n
f (x) est
ao definidos para todo n 0. Segue imediatamente da definicao que
e compacto (pode mostrar-se que e um conjunto de Cantor) e que f 1 () = .
A restricao f : e uma transformacao expansora. De fato, fixe > 0
menor que a distancia mnima entre duas quaisquer componentes conexas de
J. Ent
ao qualquer bola de raio em est
a contida numa u
nica componente
conexa de J; logo, por (11.2.2), ela e dilatada a taxa maior ou igual que .

11.2. DINAMICA
DAS TRANSFORMAC
OES
EXPANSORAS

359

J1

J2

J3 1

Figura 11.1: Tranformacao expansora num conjunto de Cantor


Exemplo 11.2.4. Seja : A A o deslocamento unilateral de tipo finito
associado a uma matriz de transicao A (estas nocoes foram introduzidas na
Secao 10.2.2). Consideramos em A a distancia definida por

(11.2.3)
d (xn )n , (yn )n = 2N , N = inf{n N : xn 6= yn }.
Ent
ao fA e uma transformacao expansora. De fato, fixe (1/2, 1) e = 2. A
bola de raio em torno de qualquer ponto (pn )n A e o cilindro [0; p0 ]A que
contem esse ponto. A definicao (11.2.3) d
a que


d (xn+1 )n , (yn+1 )n = 2d (xn )n , (yn )n

para quaisquer (xn )n e (yn )n no cilindro [0; p0 ]A . Alem disso, fA ([0; p0 ]A ) e a


uniao de todos os cilindros [0; q] tais que Ap0 ,q = 1. Em particular, ela contem
o cilindro [0; p1 ]A . Como os cilindros sao abertos e fechados de A , isto mostra
que a imagem da bola de raio em torno de (pn )n contem uma vizinhanca do
fecho da bola de raio em torno de (pn+1 )n . Isto completa a verificacao de que
todo deslocamento de tipo finito e uma transformacao expansora.

Exemplo 11.2.5. Seja f : S 1 S 1 um difeomorfismo local de classe C 2 com


grau maior que 1 (o grau e o n
umero de pre-imagens de todo ponto). Suponha
que os pontos periodicos de f sao hiperb
olicos, ou seja, |(f n ) (x)| 6= 1 para
n
todo x Fix(f ) e todo n 1. Seja o complementar da uniao das bacias de
atracao dos pontos periodicos atratores de f . Ent
ao a restricao f : e uma
transformacao expansora. Este fato e consequencia de um teorema profundo
devido a Ricardo Ma
ne [Ma
n85].
Para transformacoes expansoras em espacos metricos o n
umero de pre-imagens de um ponto y M pode variar com y (a menos que o espaco metrico seja
conexo; veja o Exerccio 11.2.1 e compare tambem com o Lema 11.1.3). Por
exemplo, para um deslocamento de tipo finito : A A (Exemplo 11.2.4)
o n
umero de pre-imagens de um ponto y = (yn )n A e igual ao n
umero de
umero varia com y0 .
smbolos i tais que Ai,y0 = 1; em geral, este n


CAPITULO 11. TRANSFORMAC
OES
EXPANSORAS

360

Por outro lado, e f


acil ver que o n
umero de pre-imagens e sempre finito e ate
limitado: basta considerar uma cobertura finita do compacto M por bolas de
raio e observar que qualquer ponto tem no maximo uma pre-imagem em cada
uma dessas bolas. Por um pequeno abuso de linguagem, chamaremos grau de
uma transformacao expansora f : M M ao n
umero maximo de pre-imagens
de qualquer ponto, isto e
grau(f ) = max{#f 1 (y) : y M }.

11.2.1

(11.2.4)

Ramos inversos contrativos

Por definicao, toda transformacao expansora f e injetiva em cada bola B(p, ).


Logo, a restricao de f a qualquer compacto K B(p, ) e um homeomorfismo
(p), ) da bola censobre a imagem. Tome para K a pre-imagem do fecho B(f
(p), )
trada em f (p). Chamamos ramo inverso de f em p `a inversa hp : B(f
B(p, ) da restricao de f a K. Claro que hp (f (p)) = p e que f hp = id . A
condicao (11.2.1) implica
d(hp (z), hp (w)) 1 d(z, w)

para todo z, w B(f (p), ).

(11.2.5)

Lema 11.2.6. Se f : M M e expansora ent


ao, para todo y M ,
[
f 1 (B(y, )) =
hx (B(y, )).
xf 1 (y)

Demonstrac
ao. A relacao f hx = id implica que hx (B(y, )) est
a contido
na pre-imagem de B(y, ) para todo x f 1 (y). Para provar a outra inclusao, seja z qualquer ponto tal que f (z) B(y, ). Pela definicao de transformacao expansora, f (B(z, )) contem B(f (z), ) e, portanto, contem y. Seja
hz : B(f (z), ) M o ramo inverso de f que envia f (z) em z e seja x = hz (y).
Tanto z quanto hx (f (z)) est
ao em B(x, ) f 1 (z). Como f e injetiva em cada
bola de raio , segue que z = hx (f (z)). Isto completa a demonstracao.

hp

hf (p)

f (p)

f 2 (p)

Figura 11.2: Ramos inversos de f n


Mais geralmente, dado qualquer n 1, chamamos ramo inverso de f n em
p`
a composicao
n (p), ) B(p, )
hnp = hf n1 (p) hp : B(f

11.2. DINAMICA
DAS TRANSFORMAC
OES
EXPANSORAS

361

dos ramos inversos de f nos iterados de p. Observe que hnp (f n (p)) = p e que
f n hnp = id . Alem disso, f j hnp = hfnj
j (p) para cada 0 j < n. Logo,
d(f j hnp (z), f j hnp (w)) jn d(z, w)

(11.2.6)

para todo z, w B(f n (p), ) e todo 0 j n.


Lema 11.2.7. Se f : M M e expansora, f n (B(p, n + 1, )) = B(f n (p), )
para todo p M , n 0 e (0, ].
Demonstrac
ao. A inclusao f n (B(p, n + 1, )) B(f n (p), ) e uma consequencia
trivial da definicao da bola din
amica. Para provar a recproca, considere o ramo
n (p), ) B(p, ). Dado qualquer y inf B(f n (p), ) considere
inverso hnp : B(f
x = hnp (y). Ent
ao, f n (x) = y e, por (11.2.6),
d(f j (x), f j (p)) jn d(f n (x), f n (p)) d(y, f n (p)) <
para todo 0 j n. Isto mostra que x B(p, n + 1, ).
Corol
ario 11.2.8. Toda transformac
ao expansora e expansiva.
Demonstrac
ao. Suponha que d(f n (z), f n (w)) < para todo n 0. Isso implica
n
que z = hw (f n (z)) para todo n 0. Ent
ao, a propriedade (11.2.6) d
a que
d(z, w) n d(f n (z), f n (w)) < n .
Fazendo n , conclumos que z = w. Portanto, e uma constante de
expansividade para f .

11.2.2

Sombreamento e pontos peri


odicos

Dado > 0, chamamos -pseudo-


orbita da transformacao f : M M qualquer
sequencia (xn )n0 tal que
d(f (xn ), xn+1 ) <

para todo n 0.

Dizemos que a -pseudo-


orbita e peri
odica se existe 1 tal que xn = xn+
para todo n 0. Claro que toda
orbita e uma -pseudo-
orbita, para todo > 0.
Para transformacoes expansoras temos uma especie de recproca: toda pseudoorbita permanece proxima de (dizemos que e sombreada por) alguma orbita da
transformacao:
Proposi
c
ao 11.2.9 (Lema do sombreamento). Suponha que f : M M e
uma transformac
ao expansora. Para todo > 0 existe > 0 tal que para toda
-pseudo-
orbita (xn )n existe x M tal que d(f n (x), xn ) < para todo n 0.
Se e suficientemente pequeno para que 2 seja uma constante de expansividade de f ent
ao o ponto x e u
nico. Se, alem disso, a pseudo-
orbita e peri
odica
ent
ao x e ponto peri
odico.

362

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

Demonstrac
ao. N
ao e restricao considerar menor que . Fixe > 0 de tal
(xn ), ) B(xn , ) o
modo que 1 + < . Para cada n 0, seja hn : B(f
1
ramo contrativo de f
em xn . A propriedade (11.2.5) garante que

(xn ), ) B(xn , 1 ) para todo n 1.
hn B(f

(11.2.7)

Como d(xn , f (xn1 )) < , segue que


(xn ), ) B(f (xn1 ), ) para todo n 1.
hn B(f

(11.2.8)

Ent
ao, podemos considerar a composicao hn = h0 hn1 . Al
em disso,
(xn ), ) e encai(11.2.8) implica que a sequencia de compactos Kn = hn B(f
xada. Tome x na intersecao. Para todo n 0, temos que x Kn+1 e, portanto,
f n (x) pertence a


(xn ), ) .
(xn ), ) = hn B(f
f n hn+1 B(f

Por (11.2.7), isto implica que d(f n (x), xn ) < para todo n 0.
As restantes afirmacoes sao consequencias simples. Se x e outro ponto
satisfazendo a conclusao da proposicao ent
ao
d(f n (x), f n (x )) d(f n (x), xn ) + d(f n (x ), xn ) < 2

para todo n 0.

Por expansividade, segue que x = x . Finalmente, se a pseudo-orbita e periodica,


com perodo 1, tambem temos que
d(f n (f (x)), xn ) = d(f n+ (x), xn+ ) <

para todo n 0.

Por unicidade, obtemos que f (x) = x.


Vale a pena observar que depende linearmente de : a prova da Proposicao 11.2.9 d
a que podemos tomar = c, onde c > 0 so depende de .
Chamamos pre-
orbita de um ponto x M qualquer sequencia (xn )n0 tal
que x0 = x e f (xn ) = xn+1 para todo n 1.
Lema 11.2.10. Se d(x, y) < ent
ao, dada qualquer pre-
orbita (xn )n de
x, existe uma pre-
orbita (yn )n de y assint
otica a (xn )n , isto e, tal que
d(xn , yn ) converge para 0 quando n .
Demonstrac
ao. Para cada n 1, seja hn : B(x, ) M o ramo contrativo
imediato que
de f n satisfazendo hn (x) = xn . Defina yn = hn (y). E
d(xn , yn ) n d(x, y).
Teorema 11.2.11. Seja f : M M uma transformac
ao expansora num espaco
metrico compacto e seja M o fecho do conjunto dos pontos peri
odicos de
f . Ent
ao, f () = e a restric
ao f : e uma transformac
ao expansora.

11.2. DINAMICA
DAS TRANSFORMAC
OES
EXPANSORAS

363

claro que f () est


Demonstrac
ao. E
a contido em : se um ponto x e acumulado
por pontos periodicos pn ent
ao f (x) e acumulado pelas imagens f (pn ), que
tambem sao pontos periodicos. Alem disso, como f () e um compacto que
contem todos os pontos periodicos, ele contem . Isto mostra que f () = .
claro que
A seguir vamos provar que a restricao f : e expansora. E
a propriedade (11.2.1) permanece valida na restricao. Para concluir devemos
mostrar que existe r (tomaremos r = 1 ) tal que, para todo x , a
r). Comecamos pelo
imagem f ( B(x, r)) contem uma vizinhanca de B(x,
seguinte lema:
(p), ) B(p, ) o
Lema 11.2.12. Seja p um ponto peri
odico e seja hp : B(f
1
ramo contrativo de f
em p. Se y B(f (p), ) e um ponto peri
odico ent
ao
hp (y) .
Demonstrac
ao. Escreveremos x = hp (y) e q = f (p). Considere qualquer > 0
tal que 2 e constante de expansividade de f . Tome dado pelo lema de
sombreamento (Proposicao 11.2.9). Pelo Lema 11.2.10, existe uma pre-orbita
(xn )n de x assint
otica `
a pre-
orbita periodica (
pn )n de p. Em particular,
d(xk+1 , q) = d(xk+1 , pk+1 ) <

(11.2.9)

para qualquer m
ultiplo suficientemente grande k do perodo de p. Analogammente, existe uma pre-
orbita (qn )n de x assint
otica `a pre-orbita periodica
(
pn )n de p. Fixe qualquer m
ultiplo l do perodo de y tal que
d(ql , f (x)) = d(ql , y) < .

q1

y
ql
xk+1

Figura 11.3: Construindo orbitas periodicas

(11.2.10)

364

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

Agora considere a sequencia periodica (zn )n , de perodo k + l, dada por


z0 = x, z1 = ql , . . . , zl = q1 , zl+1 = xk+1 , . . . , zl+k1 = x1 , zk+l = x.
Veja a Figura 11.3. Afirmamos que (zn )n e uma -pseudo-
orbita. De fato, se n
e um m
ultiplo de k + l ent
ao, por (11.2.10),
d(f (zn ), zn+1 ) = d(f (x), q1 ) = d(y, q1 ) < .
Se n e congruente com l modulo k + l ent
ao, por (11.2.9),
d(f (zn ), zn+1 ) = d(f (q1 ), xk+1 ) = d(q, xk+1 ) < .
Em todos os outros casos, f (zn ) = zn+1 . Isto prova a nossa afirmacao. Logo,
pela Proposicao 11.2.9, existe um ponto periodico z tal que d(f n (z), zn ) < para
todo n 0. Em particular, d(z, x) < . Como > 0 e arbitrario, isto mostra
que x est
a no fecho do conjunto dos pontos periodicos, conforme afirmado.
(z), ) B(z, ) o ramo
Corol
ario 11.2.13. Seja z e seja hz : B(f
contrativo de f 1 em z. Se w B(f (z), ) ent
ao hz (w) .
Demonstrac
ao. Como z , podemos encontrar algum ponto periodico p suficientemente proximo para que w B(f (p), ) e hp (w) = hz (w). Como w
podemos encontrar pontos periodicos yn B(f (p), ) convergindo para w. Pelo
Lema 11.2.12, temos hp (yn ) para todo n. Passando ao limite, conclumos
que hp (w) .
Estamos prontos para terminar a demonstracao do Teorema 11.2.11. Tome
r = 1 . A propriedade (11.2.6) implica que hz (B(f (z), )) est
a contida em
B(z, r), para todo z . Ent
ao, o Corolario 11.2.13 implica que f ( B(z, r))
(z), r).
contem B(f (z), ). Este u
ltimo conjunto e uma vizinhanca de B(f
Teorema 11.2.14. Seja f : M M uma transformac
ao expansora num espaco
metrico compacto e seja M o fecho do conjunto dos pontos peri
odicos de
f . Ent
ao,

[
M=
f k ().
k=0

Demonstrac
ao. Dado qualquer x M , seja (x) o seu conjunto -limite, ou
seja, o conjunto dos pontos de acumulacao dos iterados f n (x) quando n .
Inicialmente, mostraremos que (x) . Ent
ao deduziremos que f k (x)
para algum k 0.
Seja > 0 tal que 2 e constante de expansividade para f . Tome > 0
dado pelo lema de sombreamento (Proposicao 11.2.9) e tome (0, ) tal que
d(f (z), f (w)) < sempre que d(z, w) < . Seja y um ponto qualquer em (x).
Existem r 0 e s 1 tais que
d(f r (x), y) <

d(f r+s (x), y) < .

11.2. DINAMICA
DAS TRANSFORMAC
OES
EXPANSORAS

365

Considere a sequencia periodica (zn ), de perodo s, dada por


z0 = y, z1 = f r+1 (x), . . . , zs1 = f r+s1 (x), zs = y.
Observe que d(f (z0 ), z1 ) = d(f (y), f r+1 (x)) < (porque d(y, f r (x)) < ) e
d(f (zs1 ), zs ) = d(f r+s (x), y) < < e f (zn ) = zn+1 nos demais casos.
Portanto, (zn )n e uma -pseudo-
orbita. Ent
ao, pela Proposicao 11.2.9, existe
algum ponto periodico z tal que d(y, z) < . Fazendo 0, conclumos que y
e acumulado por pontos periodicos, ou seja, y .
Sejam > 0 e > 0 como antes. N
ao e restricao supor que < . Tome
(0, /2) tal que d(f (z), f (w)) < /2 sempre que d(z, w) < . Como (x)
est
a contido em , existem k 1 e pontos wn tais que d(f n+k (x), wn ) <
para todo n 0. Observe que
d(f (wn ), wn+1 ) d(f (wn ), f n+k+1 (x)) + d(f n+k+1 (x), wn+1 ) < /2 + <
para todo n 0. Portanto, (wn )n e uma -pseudo-
orbita em . Como a
restricao de f a e expansora (Teorema 11.2.11), segue da Proposicao 11.2.9
aplicada `
a restric
ao que existe w tal que d(f n (w), wn ) < para todo n 0.
Ent
ao,
d(f n (f k (x)), f n (w)) d(f n+k (x), wn ) + d(wn , f n (w)) < + < 2
para todo n 0. Ent
ao, por expansividade, f k (x) = w.

11.2.3

Decomposic
ao din
amica

O Teorema 11.2.14 mostra que a dinamica interessante de qualquer transformacao expansora est
a localizada no fecho dos pontos periodicos. Em particular,
supp para toda probabilidade invariante f . Alem disso (Teorema 11.2.11),
a restricao de f a ainda e uma transformacao expansora. Portanto, a menos
de substituir M por , n
ao constitui restricao supor que os pontos periodicos
de f sao densos em M .
Teorema 11.2.15 (Decomposicao dinamica). Seja f : M M uma transformac
ao expansora cujo conjunto dos pontos peri
odicos e denso em M . Ent
ao
existe uma partic
ao de M em conjuntos compactos n
ao-vazios Mi,j , com 1
i k e 1 j m(i), tais que
m(i)

(a) Mi = j=1 Mi,j e invariante for f , para todo i;


(b) f (Mi,j ) = Mi,j+1 se j < m(i) e f (Mi,m(i) ) = Mi,1 , para todo i, j;
(c) cada restric
ao f : Mi Mi e uma transformac
ao expansora transitiva;
(d) cada f m(i) : Mi,j Mi,j e uma transformac
ao expansora topologicamente
exata.
Alem disso, o n
umero k, os n
umeros m(i) e os conjuntos Mi,j s
ao u
nicos a
menos de renumerac
ao.

366

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

Demonstrac
ao. Consideremos a relacao definida da seguinte forma no conjunto dos pontos periodicos de f . Dados dois pontos periodicos p e q, sejam
(
pn )n e (
qn )n , respectivamente, as suas pre-orbitas periodicas. Por definicao,
p q se, e somente se, existem pre-orbitas (pn )n de p e (qn )n de q tais que
d(pn , qn ) 0 e

d(
pn , qn ) 0.

(11.2.11)

claro da definicao que


Afirmamos que e uma relacao de equivalencia. E
a relacao e reflexiva e simetrica. Agora suponha que p q e q r. Ent
ao
existem pre-
orbitas (qn )n de q e (rn )n de r assint
oticas `as pre-orbitas periodicas
(
pn )n de p e (
qn )n de q. Fixe k 1 m
ultiplo dos perodos de p e q tal que
d(rk , qk ) < . Note que qk = q, uma vez que k e m
ultiplo do perodo de q.
Ent
ao, pelo Lema 11.2.10, existe uma pre-orbita (rn )n do ponto r = rk que
d(rn , qn ) 0. Ent
ao d(rn , pn ) 0. Considere a pre-orbita (rn )n de r definida
por

rn
se n < k

rn =

rnk
se n k.
Como k e m
ultiplo do perodo de p, temos d(rn , pn ) = d(rnk , pnk ) para todo
n k. Portanto, (rn )n e assint
otica a (
pn )n . Analogamente se constroi uma
pre-
orbita (pn ) de p assint
otica a (
rn )r . Portanto, p r, o que mostra que a
relacao e transitiva. Deste modo fica provada a nossa afirmacao.
Em seguida, afirmamos que p q se, e somente se, f (p) f (q). Comece por
supor que p q e sejam (pn )n e (qn )n pre-orbitas de p e q satisfazendo (11.2.11).
As pre-
orbitas periodicas de p = f (p) e q = f (q) sao, respectivamente,


f (p) se n = 0
f (q) se n = 0

pn =
e qn =
pn1 se n 1
qn1 se n 1.
Considere as pre-
orbitas de p e q, respectivamente, dadas por


f (p) se n = 0
f (q) se n = 0

pn =
e qn =
pn1 se n 1
qn1 se n 1.
claro que (pn )n e assint
E
otico a (
qn )n e (qn )n e assint
otico a (
pn )n . Logo
f (p) f (q). Agora suponha que f (p) f (q). Pelo que acabamos de provar,
f k (p) f k (q) para todo k 1. Tomando k um m
ultiplo comum dos perodos
de p e q obtemos que p q. Isto prova a nossa afirmacao. Note que ela significa
que a imagem e a pre-imagem de qualquer classe de equivalencia sao classes de
equivalencia.
Observe tambem que se d(p, q) < ent
ao p q. De fato, pelo Lema 11.2.10
podemos encontrar uma pre-orbita de q assint
otica `a pre-orbita periodica de p
e, do mesmo modo, uma pre-orbita de p assint
otica `a pre-orbita periodica de q.
Como M e compacto, segue que as classes de equivalencia sao em n
umero finito.
sao disjuntos e sua
Alem disso, se A e B sao duas classes de equivalencia, A e B
distancia e pelo menos . Como p q se, e somente se, f (p) f (q), a funcao
f permuta os fechos das classes de equivalencia.

11.2. DINAMICA
DAS TRANSFORMAC
OES
EXPANSORAS

367

Deste modo, podemos enumerar os fechos das classes de equivalencia como


Mi,j com 1 i k e 1 j m(i), de tal modo que
f (Mi,j ) = Mi,j+1 para j < m(i) e

f (Mi,m(i) ) = Mi,1 .

(11.2.12)

As propriedade (a) e (b) no enunciado do teorema sao consequencias imediatas.


Passamos a provar a propriedade (c). Como os Mi sao disjuntos dois-a-dois,
segue de (11.2.12) que f 1 (Mi ) = Mi para todo i. Logo, o Lema 11.2.2 d
a que
f : Mi Mi e transformacao expansora. Pelo Lema 4.3.4, para mostrar que
esta transformacao e transitiva basta mostrar que dados quaisquer abertos U e
V de Mi existe n 1 tal que f n (U ) intersecta V . N
ao e restricao supor que U
Mi,j para algum j. Alem disso, a menos de substituir V por alguma pre-imagem
f k (V ), podemos supor que V est
a contido no mesmo Mi,j . Consideremos
pontos periodicos p U e q V . Pela definicao das classes de equivalencia,
existe alguma pre-
orbita (qn )n de q assint
otica `a pre-orbita periodica (
pn )n de
p. Em particular, podemos encontrar n arbitrariamente grande tal que qn U .
Ent
ao, q f n (U ) V . Portanto, f : Mi Mi e transitiva.
Agora provamos a propriedade (d). Como os Mi,j sao disjuntos dois-a-dois,
segue de (11.2.12) que f m(i) (Mi,j ) = Mi,j para todo i. Logo (Lema 11.2.2),
g = f m(i) : Mi,j Mi,j e uma transformacao expansora. Resta provar que g e
topologicamente exata. Seja U um aberto n
ao vazio de Mi,j e seja p um ponto
periodico de f em U . Por (11.2.12), o perodo e um m
ultiplo de m(i), digamos
= sm(i). Seja q um ponto periodico qualquer de f em Mi,j . Pela definicao da
relacao de equivalencia, existe alguma pre-orbita (qn )n de q assint
otica `a preorbita periodica (
pn )n de p. Em particular, d(qn , p) 0 quando n .

Ent
ao, hn
a contido em U para todo n suficientemente grande.
q (B(q, )) est
Isto implica que g sn (U ) = f n (U ) contem B(q, ) para todo n suficientemente
grande. Como Mi,j e compacto, podemos encontrar uma cobertura finita por
bolas de raio centradas em pontos periodicos. Aplicando o argumento anterior
a cada uma desses pontos periodicos, deduzimos que g sn (U ) contem Mi,j para
todo n suficientemente grande. Portanto, g e topologicamente exata.
Resta provar a unicidade. Seja Nr,s , com 1 r l e 1 s n(r), outra
particao nas condicoes do enunciado. Inicialmente, consideremos as particoes
n(r)
M = {Mi : 1 i k} e N = {Nr : 1 r l}, onde Nr = s=1 Nr,s .
Dados quaisquer i e r, os conjuntos Mi e Nr sao abertos, fechados, invariantes
e transitivos. Afirmamos que ou Mi Nr = ou Mi = Nr . De fato, como a
intersecao e aberta, se ela e n
ao vazia ent
ao ela intersecta qualquer orbita densa
em Mi (ou Nr ). Como a intersecao tambem e fechada e invariante, segue que ela
contem Mi (e Nr ). Em outras palavras, Mi = Nr . Isto prova a nossa afirmacao.
Segue que as particoes M e N coincidem, isto e, k = l e Mi = Ni a menos de
renumeracao. Agora fixemos i. A transformacao f permuta os Mi,j e os Ni,s
ciclicamente, com perodos m(i) e n(i). Como cada uma destas famlias de
conjuntos constitui uma particao de Mi , isso so e possvel se m(i) = n(i). Como
f m(i) e transitivo em cada Mi,j e cada Ni,s , o mesmo argumento da primeira
parte deste par
agrafo mostra que, dados quaisque j e s, ou Mi,j Ni,s =
ou Mi,j = Ni,s . Segue que as famlias Mi,j e Ni,s coincidem, a menos de
renumeracao cclica.

368

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

A seguinte consequencia do teorema contem o Lema 11.1.13:


Corol
ario 11.2.16. Se M e conexo e f : M M e transformac
ao expansora
ent
ao o conjunto dos pontos peri
odicos e denso em M e f e topologicamente
exata.
Demonstrac
ao. Afirmamos que e um subconjunto aberto de f 1 (). Para
provar isso, considere (0, ) tal que d(x, y) < implica d(f (x), f (y)) <
. Suponha que x f 1 () e tal que d(x, ) < . Ent
ao existe z tal
d(x, z) < < e portanto d(f (x), f (z)) < . Aplicando o Corolario 11.2.13
com w = f (x), vem que x = hz (w) . Portanto, contem a sua -vizinhanca
dentro de f 1 (). Isso implica a nossa afirmacao.
Ent
ao o conjunto S = f 1 () \ e fechado em f 1 () e, consequentemente,
e fechado em M . Ent
ao, f n (S) e fechado em M para todo k 0. Pelo
Teorema 11.2.14 temos que M e a uniao enumeravel disjunta dos fechados e
f n (S), k 0. Pelo teorema de Baire, algum destes abertos tem interior n
ao
vazio. Como f e uma aplicacao aberta, segue que tem interior n
ao vazio.
Agora considere a restricao f : , que e uma transformacao expansora, e
seja {i,j : 1 i k, 1 j m(i)} a decomposicao do domnio dada pelo
Teorema 11.2.15. Ent
ao algum i,j contem algum aberto V de M . Como f m(i)
e topologicamente exata, f nm(i) (V ) = i,j para algum n 1. Usando mais
uma vez o fato de que a transformacao f e aberta, segue que o compacto Mi,j e
um aberto de M . Por conexidade, segue que M = i,j . Isto implica que = M
e f : M M e topologicamente exata.

11.2.4

Exerccios

11.2.1. Mostre que se f : M M e um homeomorfismo local num espaco


metrico compacto e conexo, ent
ao o n
umero de pre-imagens #f 1 (y) e o mesmo
para todo y M .
11.2.2. Mostre que se uma transformacao expansora e topologicamente misturadora ent
ao ela e topologicamente exata.

11.2.3. Seja f : M M uma transformacao topologicamente exata num


espaco metrico compacto. Mostre que para todo r > 0 existe N 1 tal que
f N (B(x, r)) = M para todo x M .

11.2.4. Considere a transformacao expansora f : S 1 S 1 dada por f (x) = 2x


mod Z. De exemplo de conjunto compacto S 1 tal que f () = mas a
restricao f : n
ao e uma transformacao expansora.

11.2.5. Seja f : M M uma transformacao expansora e seja o fecho do


conjunto dos pontos periodicos de f . Mostre que h(f ) = h(f | ).

11.2.6. Seja f : M M uma transformacao expansora tal que o conjunto dos


pontos periodicos e denso em M e sejam Mi , Mi,j os subconjuntos compactos
dados pelo Teorema 11.2.15. Mostre que, h(f ) = maxi h(f | Mi ) e
h(f | Mi ) =

1
h(f m(i) | Mi,j ) para quaisquer i, j.
m(i)


11.3. ENTROPIA E PONTOS PERIODICOS

369

11.2.7. Seja fA : A A um deslocamento de tipo finito. Interprete a


decomposicao dada pelo Teorema 11.2.15 em termos da matriz A.

11.3

Entropia e pontos peri


odicos

Nesta secao analisaremos de um ponto de vista quantitativo a distribuicao dos


pontos periodicos de uma transformacao expansora f : M M .
Vamos mostrar (Secao 11.3.1) que a taxa de crescimento do n
umero de pontos periodicos e igual `
a entropia topologica; compare este enunciado com a
discuss
ao na Secao 10.2.1. Outra conclusao interessante (Secao 11.3.2) e que
toda medida invariante pode ser aproximada, na topologia fraca , por medidas
invariantes suportadas em
orbitas periodicas. Estes resultados se baseiam na
seguinte propriedade:
Proposi
c
ao 11.3.1. Seja f : M M uma transformac
ao expansora topologicamente exata. Ent
ao, dado qualquer > 0 existe 1 tal que, dados quaisquer
x1 , . . . , xs M , quaisquer n1 , . . . , ns P
1 e quaisquer k1 , . . . , ks , existe um
j
ponto p M tal que, escrevendo mj = i=1 ni + ki para j = 1, . . . , s e m0 = 0,
(i) d(f mj1 +i (p), f i (xj )) < para 0 i < nj e 1 j s

(ii) e f ms (p) = p.
Demonstrac
ao. Dado > 0, considere > 0 como no lema de sombreamento
(Proposicao 11.2.9). Sem perda de generalidade, podemos supor que <
e que 2 e uma constante de expansividade de f (lembre do Lema 11.1.4).
Como f e topologicamente exata, dado qualquer z M existe 1 tal que
f k (B(z, )) = M para todo k . Alem disso, pela compacidade de M (veja
o Exerccio 11.2.3), podemos escolher dependendo apenas de . Considere
xj , nj , kj , j = 1, . . . , s como no enunciado. Em particular, para cada
j = 1, . . . , s1 existe yj B(f nj (xj ), ) tal que f kj (yj ) = xj+1 . Analogamente,
orbita
existe ys B(f ns (xs ), ) tal que f ks (ys ) = x1 . Considere a -pseudo-
periodica (zn )n0 definida por
nm
j1
(xj )
para 0 n mj1 < nj e j = 1, . . . s
f
nmj1 nj
f
zn =
(yj ) para 0 n mj1 nj < kj e j = 1, . . . , s

para n ms .
znms

Pela segunda parte do lema de sombreamento, existe algum ponto periodico


p M , de perodo ms , cuja trajetoria -sombreia esta pseudo-orbita periodica
(zn )n . Em particular, valem as condicoes (i) e (ii) no enunciado.

A propriedade na conclusao da Proposicao 11.3.1 foi introduzida por Rufus


Bowen [Bow71] e e denominada especificac
ao por pontos peri
odicos. Quando
vale somente a propriedade (i), sem exigir que o ponto p seja periodico, dizemos
que f tem a propriedade de especificac
ao.


CAPITULO 11. TRANSFORMAC
OES
EXPANSORAS

370

11.3.1

Taxa de crescimento dos pontos peri


odicos

Seja f : M M uma transformacao expansora. Ent


ao f e expansiva (pelo
Lema 11.1.4) e, portanto, segue da Proposicao 10.2.2 que a taxa de crescimento
do n
umero de pontos periodicos e majorada pela entropia topologica:
lim sup
n

1
log # Fix(f n ) h(f ).
n

(11.3.1)

Nesta secao vamos provar que, de fato, vale a igualdade em (11.3.1). Comecamos
pelo caso topologicamente exato, o qual admite um enunciado ainda mais preciso:
Proposi
c
ao 11.3.2. Para toda transformac
ao expansora topologicamente exata
f : M M,
1
lim log # Fix(f n ) = h(f ).
n n
Demonstrac
ao. Dado > 0, fixe 1 satisfazendo a conclusao da Proposicao 11.3.1 com /2 no lugar de . Para cada n 1, seja E um conjunto (n, )separado maximal. Pela proposicao, para cada x E existe p(x) B(x, n, /2)
com f n+ (p(x)) = p(x). Afirmamos que a aplicacao x 7 p(x) e injetiva. De
fato, considere qualquer y E \ {x}. Como o conjunto E foi tomado maximal,
B(x, n, /2) B(y, n, /2) = . Isso implica que p(x) 6= p(y), o que prova a
nossa afirmacao. Segue, em particular, que
# Fix(f n+ ) #E = sn (f, , M ) para todo n 1
(lembre da definicao (10.1.9) na Secao 10.2.1). Ent
ao,
lim inf
n

1
1
log # Fix(f n+ ) lim inf log sn (f, , M ).
n
n
n

Fazendo 0 e usando o Corolario 10.1.8, obtemos que


lim inf
n

1
1
log # Fix(f n+ ) lim lim inf log sn (f, , M ) = h(f ).
n
0
n
n

(11.3.2)

Juntamente com (11.3.1), isto implica a conclusao da proposicao.


A conclusao da Proposicao 11.3.2 n
ao vale, em geral, se f n
ao e topologicamente exata. Por exemplo, dada uma transformacao expansora g qualquer,
condidere f : M {0, 1} M {0, 1} definida por f (x, i) = (g(x), 1 i). Ent
ao
f e transformacao expansora, mas todos os seus pontos periodicos tem perodo
par. Em particular, neste caso
lim inf
n

1
log # Fix(f n ) = 0.
n

No entanto, a proxima proposicao, incluindo a sua demonstracao, mostra que


este tipo de exemplo e o pior que pode ocorrer.


11.3. ENTROPIA E PONTOS PERIODICOS

371

Proposi
c
ao 11.3.3. Para toda transformac
ao expansora,
lim sup
n

1
log # Fix(f n ) = h(f ).
n

Demonstrac
ao. Pelo Teorema 11.2.11, a restricao f ao conjunto dos pontos
periodicos e uma transformacao expansora. De acordo com o Exerccio 11.2.5
essa restricao tem a mesma entropia que f . Evidentemente, as duas transformacoes tem os mesmos pontos periodicos. Portanto, a menos de substituir f
pela restricao, podemos supor que o conjunto dos pontos periodicos e denso em
M . Ent
ao, pelo teorema de decomposicao dinamica (Teorema 11.2.11) e possvel
escrever M como uni
ao disjunta de conjuntos compactos Mi,j , com 1 i k
e 1 j m(i), tais que cada f m(i) : Mi,j Mi,j e uma transformacao expansora topologicamente exata. De acordo com o Exerccio 11.2.6, existe algum
1 i k tal que
1
h(f ) =
h(f m(i) | Mi,1 ).
(11.3.3)
m(i)
claro que
E
lim sup
n



1
1
log # Fix f n lim sup
log # Fix f nm(i)
n
nm(i)
n
 (11.3.4)
1
1

lim sup log # Fix (f m(i) | Mi,1 )n .


m(i)
n
n

Alem disso, a Proposicao 11.3.2 aplicada a f m(i) : Mi,1 Mi,1 d


a que
lim
n


1
log # Fix (f m(i) | Mi,1 )n = h(f m(i) | Mi,1 ).
n

(11.3.5)

Combinando (11.3.3)(11.3.5) obtemos que


lim sup
n

tal como queramos provar.

11.3.2


1
log # Fix f n h(f ),
n

(11.3.6)

Aproximac
ao por medidas at
omicas

Dado um ponto periodico p de perodo n, considere a medida p definida por


p =


1
p + f (p) + + f n1 (p) .
n

Claramente, a medida p e invariante por f e e erg


odica. Vamos mostrar que
se f e expansora ent
ao o conjunto das medidas desta forma e denso no espaco
M1 (f ) das probabilidades invariantes:
Teorema 11.3.4. Seja f : M M uma transformac
ao expansora. Ent
ao toda
probabilidade invariante por f e aproximada na topologia fraca por probabilidades invariantes suportadas em
orbitas peri
odicas.


CAPITULO 11. TRANSFORMAC
OES
EXPANSORAS

372

Demonstrac
ao. Seja > 0 e seja = {1 , . . . , N } uma famlia finita de funcoes
contnuas em M . Queremos mostrar que a vizinhanca V (, , ) definida em
(2.1.1) contem alguma medida p suportada numa orbita periodica. Pelo teorema de Birkhoff, para -quase todo ponto x M ,
n1
1X
i (f t (x))
i (x) = lim
n n
t=0

existe para todo i.

(11.3.7)

Fixe C > sup |i | sup |i | e tome > 0 tal que

d(x, y) <

|i (x) i (y)| <

para todo i.

(11.3.8)

Fixe = () 1 dado pela propriedade de especificacao (Proposicao 11.3.1).


Escolha pontos xj ,P1 j s satisfazendo (11.3.7) e n
umeros positivos j ,
1 j s tais que j j = 1 e
|

i d

s
X

j i (xj )| <
5
j=1

para todo i

(11.3.9)

(lembre do Exerccio A.2.6). Tome kj e escolha inteiros nj muito maiores


do que , de tal modo que

nj


j <
(11.3.10)
ms
5Cs
P
P
(lembre que ms = j (nj + kj ) = s + j nj ) e, usando (11.3.8),
nj 1

t=0

i (f t (xj )) nj i (xj )| < nj


5

para 1 i N.

Combinando (11.3.9) e (11.3.10) e o fato de que


|

i d

i d =

(11.3.11)

i d.

s
X
nj

s sup |i | < .
i (xj )| < +
ms
5 5Cs
5
j=1

(11.3.12)

Pela Proposicao 11.3.1, existe algum ponto periodico p M com perodo ms


tal que d(f mj1 +t (p), f t (xj )) < para 0 t < nj e 1 j s. Ent
ao, a
propriedade (11.3.8) implica que
nj 1

nj 1

X
t=0

i (f mj1 +t (p))

i (f t (xj ))| <

t=0

nj
5

para 1 j s.

Somando esta relacao com (11.3.11) obtemos


nj 1

X
t=0

2
i (f mj1 +t (p)) nj i (xj )| < nj
5

para 1 j s.

(11.3.13)


11.3. ENTROPIA E PONTOS PERIODICOS
Como

373

j = 1, a condicao (11.3.10) implica que


s = ms

s
X

nj <

j=1

ms .
5C

Ent
ao, (11.3.13) implica que
|

m
s 1
X
t=0

i (f t (p))

s
X

nj i (xj )| <

j=1

2 X
3
nj + s sup |i | < ms .
5 j=1
5

(11.3.14)

Seja p a probabilidade invariante


R suportada na orbita de p. O primeiro termo
em (11.3.14) coincide com ms i dp . Portanto, somando as desigualdades
(11.3.12) e (11.3.14), conclumos que
Z
Z
2 3
+
= para todo 1 i N.
| i dp i d| <
5
5
Isto significa que p V (, , ), como queramos demonstrar.

11.3.3

Exerccios

11.3.1. Seja f : M M uma transformacao contnua num espaco metrico


compacto M . Verifique que se algum iterado f l , l 1 tem a propriedade de
especificacao, ou especificacao por pontos periodicos, ent
ao f tambem tem.
11.3.2. Seja f : M M uma transformacao contnua num espaco metrico com
a propriedade de especificacao. Mostre que f e topologicamente misturadora.
11.3.3. Seja f : M M uma transformacao expansora topologicamente misturadora e seja : M R uma funcao contnua.
Suponha
R
R que existem probabilidades 1 , 2 invariantes por f tais que d1 6= d2 . Mostre que
ent
ao existe x M tal que a media temporal de na orbita de x n
ao converge.
[Observacao: Pode mostrar-se que o conjunto M dos pontos onde a media temporal de n
ao converge e grande: ele tem entropia total e tambem dimensao
de Hausdorff total; veja [BS00].]
11.3.4. Prove a seguinte generalizacao da Proposicao 11.3.2: se f : M M e
uma transformacao expansora topologicamente exata ent
ao
X
1
P (f, ) = lim log
ek (p) para toda funcao H
older : M R.
k k
k
pFix(f )

11.3.5. Seja f : M M uma transformacao expansora diferenci


avel em uma
variedade compacta M . Mostre que f admite:
(a) Uma vizinhanca U0 relativamente `a topologia da convergencia uniforme
tal que f e fator topol
ogico de toda transformacao g U0 . Em particular,
h(g) h(f ) para todo g U0 .

(b) Uma vizinhanca U1 relativamente `a topologia C 1 tal que toda g U1 e


topologicamente conjugada a f . Em particular, a entropia topologica e
constante em U1 .

374

CAPITULO 11. TRANSFORMAC


OES
EXPANSORAS

Captulo 12

Formalismo Termodin
amico
Neste captulo desenvolvemos a teoria erg
odica das transformacoes expansoras
em espacos metricos compactos. Esta teoria teve sua inspiracao na Mecanica
Estatstica e, por isso, e frequentemente chamada Formalismo Termodinamico.
Alertamos, no entanto, que esta u
ltima expressao se aplica num contexto bastante mais amplo que tambem inclui, em particular, os difeomorfismos e fluxos
chamados uniformemente hiperb
olicos (a este respeito, veja a excelente monografia de Rufus Bowen [Bow75a]).
O principal resultado deste captulo e o seguinte teorema de David Ruelle,
que sera provado na Secao 12.1 (a nocao de estado de Gibbs tambem sera definida na Secao 12.1):
Teorema 12.1 (Ruelle). Seja f : M M uma transformac
ao expansora topologicamente exata num espaco metrico compacto e seja : M R uma func
ao
H
older. Ent
ao existe um u
nico estado de equilbrio para . Alem disso, a
medida e exata, est
a suportada em todo o M e e um estado de Gibbs.
Lembre que uma transformacao expansora e topologicamente exata se ela
for topologicamente misturadora (Exerccio 11.2.2).
No caso particular em que M e uma variedade e f e diferenci
avel, o estado de
equilbrio u do potencial u = log | det Df | coincide com a medida invariante
absolutamente contnua dada pelo Teorema 11.1.2. Em particular, ele e a u
nica
medida fsica da transformacao. Estes fatos serao vistos na Secao 12.1.8.
O teorema de Livsic, que sera provado na Secao 12.2, complementa o teorema
de Ruelle de maneira muito elegante: dois potenciais e tem o mesmo estado
de equilbrio se, e somente se, a sua diferenca e cohom
ologa a uma constante.
Em outras palavras, isto acontece se, e somente se, = c + u f u para
algum c R e alguma funcao contnua u. Alem disso, notavelmente, basta
verificar essa condicao nas
orbitas periodicas de f .
Tambem veremos, na Secao 12.3, que o sistema (f, ) no teorema apresenta
decaimento exponencial de correlacoes para todas as funcoes H
older.
Encerraremos o captulo (Secao 12.4) com uma aplicacao destas ideias a
uma classe de objetos geometricos e dinamicos chamados repulsores conformes.
375


CAPITULO 12. FORMALISMO TERMODINAMICO

376

Mostraremos que vale a f


ormula de Bowen-Manning: a dimensao de Hausdorff
do repulsor e dada pelo u
nico zero da funcao t 7 P (f, tu ).

12.1

Teorema de Ruelle

Seja f : M M uma transformacao expansora topologicamente exata e seja


um potencial H
older. No que segue, > 0 e > 1 sao as mesmas constantes
da definicao (11.2.1). Representaremos por Sn as somas orbitais de :
Sn (x) =

n1
X

(f j (x)).

(12.1.1)

j=0

Antes de entrarmos nos detalhes da demonstracao do Teorema 12.1 vamos


esbocar as suas linhas gerais. Os argumentos giram em torno do operador de
transferencia (ou operador de Ruelle-Perron-Frobenius) que e o operador linear
L : C 0 (M ) C 0 (M ) definido no espaco C 0 (M ) das funcoes contnuas complexas por
X
e(x) g(x).
(12.1.2)
Lg(y) =
xf 1 (y)

Observe que L est


a bem definido: Lg C 0 (M ) sempre que g C 0 (M ).
De fato, como vimos no Lema 11.2.6, para cada y M existem ramos inversos
hi : B(y, ) M , i = 1, . . . , k da transformacao f tais que ki=1 hi (B(y, ))
coincide com a pre-imagem da bola B(y, ). Ent
ao
Lg =

k
X
i=1


e g hi

(12.1.3)

restrito a B(y, ) e, claramente, esta expressao define uma funcao contnua.


claro da definicao que L e um operador positivo: se g(x) 0 para todo
E
x M ent
ao Lg(y) 0 para todo y M . Tambem e facil verificar que L e um
operador contnuo: de fato,
kLgk = sup |Lg| grau(f )esup sup |g| = grau(f )esup kgk

(12.1.4)

para todo g C 0 (M ) e isso significa que kLk grau(f )esup .


De acordo com o teorema de Riesz-Markov (Teorema A.3.12), o dual do
espaco de Banach C 0 (M ) se identifica com o espaco vetorial M(M ) das medidas
borelianas complexas. Ent
ao, o dual do operador de transferencia e o operador
linear L : M(M ) M(M ) definido por
Z
Z



Lg d para todo g C 0 (M ) e M(M ).


(12.1.5)
gd L =

Este operador linear e positivo, no sentido de que se e uma medida positiva


ent
ao L tambem e uma medida positiva.

377

12.1. TEOREMA DE RUELLE

O primeiro passo da demonstracao (Secao 12.1.1) sera mostrar que L admite


uma automedida positiva associada a um autovalor positivo . Veremos que
tal medida admite jacobiano positivo e H
older e est
a suportada em todo o espaco
M . Alem disso (Secao 12.1.2), ela e um estado de Gibbs: existem constantes
K 1 e P R tais que
K 1

(B(x, n, ))
 K
exp Sn (x) nP

para todo x M e todo n,

(12.1.6)

onde B(x, n, ) e a bola din


amica definida em (9.3.2). De fato, P = log .
Por tr
as da demonstracao da propriedade de Gibbs est
ao certos resultados sobre controle da distorcao que tambem serao cruciais para mostrar (Secao 12.1.3)
que o proprio operador de transferencia L admite uma autofuncao associada ao
autovalor . Esta funcao e estritamente positiva e H
older. A medida = h
sera o estado de equilbrio que buscamos (Secao 12.1.4). Segue facilmente das
propriedades de h que esta medida e invariante,
suportada em todo o M e
R
um estado de Gibbs. Alem disso, h (f ) + d = P .
Para concluir que e de fato um estado de equilbrio precisamos verificar
que P e igual `
a press
ao P (f, ). Isso sera feito (Secao 12.1.5) com a ajuda
da formula de Rokhlin (Teorema 9.7.3), a qual tambem nos permitira concluir
que se e estado de equilbrio ent
ao /h e automedida de L associada ao
autovalor = log P (f, ). Este u
ltimo resultado sera o ingrediente crucial para
demonstrar que o estado de equilbrio e u
nico (Secao 12.1.6).
Finalmente (Secao 12.1.7), verificaremos que o sistema (f, ) e exato. O
controle de distorcao ter
a, mais uma vez, um papel crucial. Na Secao 12.1.8,
comentaremos o caso especial = log | det f |, quando f e transformacao expansora numa variedade Riemanniana. Neste caso a medida de referencia e
a propria medida de Lebesgue na variedade e, portanto, o estado de equilbrio
e uma medida invariante equivalente `a medida de Lebesgue. Logo, coincide
com a medida invariante que construmos na Secao 11.1.
Antes de passarmos a detalhar estes argumentos e conveniente fazermos dois
coment
arios breves. Primeiramente, note que a existencia de estado de equilbrio
segue imediatamente do Corol
ario 10.5.9, ja que vimos no Lema 11.1.4 que toda
transformacao expansora e expansiva. No entanto este fato n
ao sera usado na
demonstracao: em vez disso, na Secao 12.1.4 apresentaremos uma construcao
muito mais explcita do estado de equilbrio.
O outro coment
ario diz respeito `a formula de Rokhlin. Seja P uma particao
finita qualquer de M com diam P < . Para cada n 1, todo elemento de
n1 j
P n = j=0
f (P) est
a contido na imagem hn1 (P ) de algum P P por
n1
algum ramo inverso h
do iterado f n1 . Em particular, diam P n < n+1
para todo n. Ent
ao P satisfaz as hipoteses do Teorema 9.7.3 em todo ponto.
Logo, a f
ormula de Rokhlin vale para toda probabilidade invariante de f .

12.1.1

Medida de refer
encia

0
Lembre que C+
(M ) representa o cone das funcoes contnuas positivas. Conforme
ja observamos, este cone e preservado pelo operador de transferencia L. O cone

378

CAPITULO 12. FORMALISMO TERMODINAMICO

dual (lembre do Exemplo 2.3.3) e definido por


0
0
C+
(M ) = { C 0 (M ) : () 0 para todo C+
(M )}.

e pode ser visto como o cone das medidas borelianas positivas finitas. Segue
0
diretamente de (12.1.5) que C+
(M ) e preservado pelo operador dual L .

Lema 12.1.1. Considere o raio espectral = r(L ) = r(L). Ent


ao existe
alguma probabilidade em M tal que L = .

0
Demonstrac
ao. Como vimos no Exerccio 2.3.3, o cone C+
(M ) e normal. Logo,
0
estamos em condicoes de aplicar o Teorema 2.3.4 com E = C 0 (M ), C = C+
(M )

e T = L. A conclusao do teorema significa que L admite algum autovetor


0
C+
(M ) correspondente ao autovalor . Conforme acabamos de explicar,
se identifica com uma medida positiva finita. Normalizando , podemos supor
que se trata de uma probabilidade.

No Exerccio 12.1.2 propomos uma prova alternativa para o Lema 12.1.1, a


partir do teorema de Tychonoff-Schauder (Teorema 2.2.3).
Exemplo 12.1.2. Seja f : M M um difeomorfismo local numa variedade
Riemanniana compacta M . Considere o operador de transferencia L associado ao potencial = log | det Df |. A medida de Lebesgue m de M e uma
automedida do operador dual, correspondente ao autovalor = 1:
L m = m.

(12.1.7)

Para verificar esse fato, basta mostrar que L m(E) = m(E) para todo conjunto
mensuravel E contido na imagem de uma bola B(y, ) por algum ramo inverso
hj : B(y, ) M (pois, pela compacidade de M , todo conjunto mensuravel
pode ser escrito como uniao finita disjunta de subconjuntos E deste tipo). Ora,
usando a expressao (12.1.3),
Z
Z
Z X
k
XE

L m(E) = XE d(L m) = (LXE ) dm =


hi dm.
| det Df |
i=1
Ent
ao, pela escolha de E e pela formula de mudanca de variaveis,
Z
Z
XE
hj dm = XE dm = m(E).
L m(E) =
| det Df |

Isto prova que m e, de fato, um ponto fixo de L .


O Exerccio 12.1.3 fornece uma conclusao analoga para medidas de Markov.

A partir daqui sempre suporemos que e uma medida de referencia, ou


seja, uma probabilidade satisfazendo L = para algum > 0. Uma das
nossas conclusoes ao final da demonstracao do teorema de Ruelle sera que
est
a unicamente determinado (em vista do Lema 12.1.1, isso quer dizer que
e necessariamente igual ao raio espectral de L e L ) e que a propria medida
tambem e u
nica.
Inicialmente, vamos mostrar que existe jacobiano de f relativamente a , o
qual pode ser escrito explicitamente em termos do autovalor e do potencial :

379

12.1. TEOREMA DE RUELLE

Lema 12.1.3. A transformac


ao f : M M admite jacobiano relativamente a
, dado por J f = e .
Demonstrac
ao. Seja A um domnio de invertibilidade qualquer de f . Seja
(gn )n uma sequencia de funcoes contnuas convergindo em -quase todo ponto
para a funcao caracterstica de A e tal que sup |gn | 1 para todo n (veja o
Exerccio A.3.5). Observe que
X
gn (y).
L(e gn )(y) =
xf 1 (y)

A expressao do lado direito e limitada pelo grau de f , que foi definido em


(11.2.4), e ela converge para f (A) (y) em -quase todo ponto. Logo, usando o
teorema da convergencia dominada,
Z
Z
Z

e gn d = e gn d(L ) = L(e gn ) d
para (f (A)). Como a expressao do lado esquerdo converge para
Rconverge
e d, concluimos que
A
Z
e d,
(f (A)) =
A

o que prova a afirmacao.


O proximo lema se aplica, em particular, `a medida de referencia :
Lema 12.1.4. Seja f : M M uma transformac
ao expansora topologicamente
exata e seja qualquer probabilidade boreliana tal que existe jacobiano de f
relativamente a . Ent
ao est
a suportada em todo o M .
Demonstrac
ao. Suponha, por absurdo, que existe algum aberto U M tal que
(U ) = 0. Note que f e uma aplicacao aberta, uma vez que e um homeomorfismo
local. Ent
ao, a imagem f (U ) tambem e um aberto. Alem disso, podemos cobrir
U com uma uni
ao finita de domnios de invertibilidade A. Para cada um deles,
Z
(f (A)) =
J f d = 0.
A

Portanto, (f (U )) = 0. Por inducao, segue que (f n (U )) = 0 para todo n 0.


Por outro lado, como supomos que f e topologicamente exata, existe k 1 tal
que f k (U ) = M . Como (M ) = 1, isto gera uma contradicao.

12.1.2

Distorc
ao e propriedade de Gibbs

Nesta secao vamos provar alguns resultados de controle da distorcao limitada


que tem um papel central na nossa construcao. A hipotese de que e H
older e
crtica a esta altura: estes resultados sao falsos, em geral, se o potencial e apenas


CAPITULO 12. FORMALISMO TERMODINAMICO

380

contnuo. Como uma primeira aplicacao do controle de distorcao mostraremos


que e um estado de Gibbs.
Fixe constantes K0 > 0 e > 0 tais que |(z) (w)| K0 d(z, w) para
quaisquer z, w M .
Lema 12.1.5. Existe K1 > 0 tal que para todo n 1, todo x M e todo
y B(x, n + 1, ),
|Sn (x) Sn (y)| K1 d(f n (x), f n (y)) .
Demonstrac
ao. Por hipotese, d(f i (x), f i (y)) < para todo 0 i n. Ent
ao,
para cada j = 1, . . . , n, o ramo contrativo hj : B(f n (x), ) M de f j que envia
f n (x) em f nj (x) tambem envia f n (y) em f nj (y). Logo, lembrando (11.2.6),
temos que d(f nj (x), f nj (y)) j d(f n (x), f n (y)) para todo j = 1, . . . , n.
Ent
ao,
n
X
|(f nj (x)) (f nj (y))|
|Sn (x) Sn (y)|

Portanto, basta tomar K1 K0

j=1
n
X

K0 j d(f n (x), f n (y)) .

j=1

j=0

j .

Como consequencia do Lema 12.1.5, obtemos a seguinte variacao da Proposicao 11.1.5 em que o jacobiano usual com respeito `a medida de Lebesgue e
substitudo pelo jacobiano relativamente `a medida de referencia :
Corol
ario 12.1.6. Existe K2 > 0 tal que para todo n 1, todo x M e todo
y B(x, n + 1, ),
J f n (x)
K2 .
K21
J f n (y)
Demonstrac
ao. Da expressao do jacobiano no Lema 12.1.3 segue que (lembre
do Exerccio 9.7.6)
J f n (z) = n eSn (z)

para todo z M e todo n 1.

(12.1.8)

Ent
ao o Lema 12.1.5 d
a que
n



log J f (x) = Sn (x) Sn (y) K1 d(f n (x), f n (y)) K1 .
n
J f (y)

Assim, basta escolher K2 = exp(K1 ).

Agora podemos mostrar que e um estado de Gibbs:


Lema 12.1.7. Para todo > 0 suficientemente pequeno existe K3 = K3 () > 0
tal que, escrevendo P = log ,
K31

(B(x, n, ))
K3
exp(Sn (x) nP )

para todo x M e todo n 1.

381

12.1. TEOREMA DE RUELLE

Demonstrac
ao. Considere < . Ent
ao f | B(y, ) e injetiva para todo y M
e, consequentemente, f n | B(x, n, ) e injetiva para todo x M e todo n. Ent
ao,
Z
J f n (y)d(y).
(f n (B(x, n, ))) =
B(x,n,)

Pelo Corol
ario 12.1.6, o valor de J f n num ponto qualquer y B(x, n, ) difere
n
de J f (x) por um fator limitado pela constante K2 . Segue que
K21 (f n (B(x, n, ))) J f n (x)(B(x, n, )) K2 (f n (B(x, n, ))). (12.1.9)
Agora, J f n (x) = n eSn (x) = exp(nP Sn (x)), como vimos em (12.1.8).
Pelo Lema 11.2.7 tambem temos que f n (B(x, n, )) = f (B(f n1 (x), )) e, portanto,
Z
(f n (B(x, n, ))) =

J f d

(12.1.10)

B(f n1 (x),)

claro que o lado esquerdo de (12.1.10) e majorado


para todo x M e todo n. E
por 1. Alem disso, J f = e e limitado de zero e {(B(y, )) : y M }
tambem e limitado de zero (pelo Exerccio 12.1.1 e o Lema 12.1.4). Portanto
o lado direito de (12.1.10) e minorado por algum n
umero a > 0. Usando estas
observacoes em (12.1.9), obtemos
K21 a

(B(x, n, ))
K2 .
exp(Sn (x) nP )

Agora basta tomar K3 = max{K2 /a, K2 }.

12.1.3

Densidade invariante

Em seguida vamos mostrar que o operador L admite alguma auto-funcao positiva associada ao autovalor > 0. Ela sera construda como um ponto de
acumulacao Cesaro da sequencia de funcoes n Ln 1. Para mostrar que existe
algum ponto de acumulacao, comecamos por provar que esta sequencia e uniformemente limitada e equicontnua.
Lema 12.1.8. Existe K4 > 0 tal que
K4 d(y1 , y2 ) log

Ln 1(y1 )
K4 d(y1 , y2 )
Ln 1(y2 )

para todo n 1 e quaisquer y1 , y2 M com d(y1 , y2 ) < .


Demonstrac
ao. Segue de (12.1.3) que, dada qualquer funcao contnua g,
X

eSn g hni restrito a cada bola B(y, ),
Ln g =
i

onde a soma e sobre os ramos inversos hni : B(y, ) M do iterado f n . Em


particular,
P Sn (hn (y1 ))
i
e
Ln 1(y1 )
= Pi S (hn (y )) .
n
n
2
i
L 1(y2 )
ie


CAPITULO 12. FORMALISMO TERMODINAMICO

382

Pelo Lema 12.1.5, para cada um desses ramos inversos hni tem-se
|Sn (hni (y1 )) Sn (hni (y2 ))| K1 d(y1 , y2 ) .
Consequentemente,

eK1 d(y1 ,y2 )

Ln 1(y1 )
eK1 d(x1 ,x2 ) .
n
L 1(y2 )

Portanto, basta tomar K4 K1 .


Segue que a sequencia n Ln 1 e limitada de zero e de infinito:

Corol
ario 12.1.9. Existe K5 > 0 tal que K51 n Ln 1(x) K5 para todo
n 1 e quaisquer x, y M .
Demonstrac
ao. Comece por observar que, para todo n 1,
Z
Z
Z
n
n
L 1 d = 1 d(L ) = n d = n .
Em particular, para todo n 1,
min n Ln 1(y) 1 max n Ln 1(y).

yM

yM

(12.1.11)

Como f e topologicamente exata, existe N 1 tal que f N (B(x, )) = M para


todo x M (confira o Exerccio 11.2.3). Agora, dados x, y M quaisquer,
podemos encontrar x B(x, ) tal que f N (x ) = y. Ent
ao, por um lado,
X

Ln+N 1(y) =
eSN (z) Ln 1(z) eSN (x ) Ln 1(x ) ecN Ln 1(x ).
zf N (y)

Por outro lado, o Lema 12.1.8 d


a que Ln 1(x ) Ln 1(x) exp(K4 ). Tome
c = sup || e K exp(K4 )ecN N . Combinando as desigualdades anteriores
vem que
Ln+N 1(y) exp(K4 )ecN Ln 1(x) K 1 N Ln 1(x)
para todo x, y M . Portanto, para todo n 1,
min (n+N ) Ln+N 1 K 1 max n Ln 1.

(12.1.12)

Combinando (12.1.11) e (12.1.12) obtemos,


max n Ln 1 K min (n+N ) Ln+N 1 K
n

min

L 1K

n+N

max

nN

1K

para todo n 1

para todo n > N .

Para terminar a demonstracao, so falta estender esta u


ltima estimativa para os
valores n = 1, . . . , N . Para isso, observe que cada Ln 1 e uma funcao contnua
e positiva. Logo, pela compacidade de M , o mnimo de Ln 1 e positivo para
todo n. Ent
ao, podemos tomar K5 K tal que min n Ln 1 K51 para todo
n = 1, . . . , N .

383

12.1. TEOREMA DE RUELLE

Segue imediatamente do Corol


ario 12.1.9 que o autovalor est
a unicamente
determinado. Pelo Lema 12.1.1, isto implica que = r(L) = r(L ). Tambem
veremos daqui a pouco que = eP (f,) .
Lema 12.1.10. Existe K6 > 0 tal que
|n Ln 1(x) n Ln 1(y)| K6 d(x, y)

para quaisquer n 1 e x, y M .

Em particular, a sequencia n Ln 1 e equicontnua.


Demonstrac
ao. Suponha inicialmente que d(x, y) < . Pelo Lema 12.1.8,
Ln 1(x) Ln 1(y) exp(K4 d(x, y) )
e, portanto,


n Ln 1(x) n Ln 1(y) exp(K4 d(x, y) ) 1 n Ln 1(y).

Tome K > 0 tal que | exp(K4 t) 1| K|t| sempre que |t| . Ent
ao, usando
o Corol
ario 12.1.9,
n Ln 1(x) n Ln 1(y) KK5 d(x, y) .
Invertendo os papeis de x e y conclumos que
|n Ln 1(x) n Ln 1(y)| KK5 d(x, y)

sempre que d(x, y) < .

Quando d(x, y) o Corol


ario 12.1.9 d
a que
|n Ln 1(x) n Ln 1(y)| 2K5 2K5 d(x, y) .
Logo, basta tomar K6 max{KK5, 2K5 } para obter a primeira parte do
enunciado. A segunda parte e consequencia imediata.
Estamos prontos para mostrar que o operador L admite alguma autofuncao
associada ao autovalor . O Corolario 12.1.9 e o Lema 12.1.10 implicam que a
media
n1
1 X i i
hn =
L 1,
n i=0
define uma sequencia limitada e equicontnua. Ent
ao, pelo teorema de AscoliArzel
a, existe alguma subsequencia (hni )i convergindo uniformemente para uma
funcao contnua h.
R
Lema 12.1.11. A func
ao h satisfaz Lh = h. Alem disso, h d = 1 e
K51 h(x) K5

|h(x) h(y)| K6 d(x, y)

para todo x, y M .


CAPITULO 12. FORMALISMO TERMODINAMICO

384

Demonstrac
ao. Considere qualquer subsequencia (hni )i convergindo para h.
Como o operador L e contnuo,
Lh = lim Lhni = lim
i

= lim
i

ni

nX
i 1
k=0

nk
ni 1
X
1 X
k Lk+1 1 = lim
k Lk 1
i ni
ni
k=0

k Lk 1 +

k=1


ni ni
L 11 .
ni

O primeiro termo do lado direito converge para h e o segundo converge para


zero, uma vez que a sequencia n Ln 1 e limitada. Portanto, Lh = h tal como
afirmamos.
R n n
R
R
Pela definicao de , temos
L 1 d = n d(Ln ) = 1 d = 1
R
para todo n N. SegueRque hn d = 1 para todo n e, usando o teorema da
convergencia dominada, h d = 1. As demais afirmacoes no enunciado seguem,
de modo inteiramente analogo, do Corolario 12.1.9 e do Lema 12.1.10.

12.1.4

Construc
ao do estado de equilbrio

Considere a medida definida por = h, ou seja


Z
(A) =
h d para cada conjunto mensuravel A M .
A

Veremos a seguir que e estado de equilbrio para o potencial e verifica todas


as demais condicoes no Teorema 12.1. R
Do Lema 12.1.11 vem que (M ) = h d = 1 e, portanto, e uma medida
de probabilidade. Alem disso,
K51 (A) (A) K5 (A)

(12.1.13)

para todo conjunto mensuravel A M . Em particular, e equivalente `a medida


de referencia . Este fato, juntamente com o Lema 12.1.4 d
a que supp = M .
Tambem segue da relacao (12.1.13), juntamente com o Lema 12.1.7, que e um
estado de Gibbs: tomando L = K5 K obtemos que
L1

(B(x, n, ))
L,
exp(Sn (x) nP )

(12.1.14)

para todo x M , n 1 e > 0. Lembre que P = log .


Lema 12.1.12. A probabilidade e invariante por f . Alem disso, f admite
jacobiano relativamente a , dado por J f = e (h f )/h.

Demonstrac
ao. Comece por notar que L (g1 f )g2 ) = g1 Lg2 , quaisquer que
sejam as funcoes contnuas g1 , g2 : M R: para todo y M ,
X

e(x) g1 (f (x))g2 (x)
L (g1 f )g2 (y) =
xf 1 (y)

= g1 (y)

xf 1 (y)

e(x) g2 (x) = g1 (y)Lg2 (y).

(12.1.15)

385

12.1. TEOREMA DE RUELLE


Ent
ao, para toda funcao contnua g : M R,
Z
Z
Z

1

1
(g f ) d =
(g f )h d(L ) =
L (g f )h d
Z
Z
Z
= 1 gLh d = gh d = g d.

Isto prova que a probabilidade e invariante por f (lembre da Proposicao A.3.3).


Para provar a segunda afirmacao, considere qualquer domnio de invertibilidade A de f . Ent
ao, usando o Exerccio 9.7.3(a),
Z
Z
Z
Z
hf
d.
(f (A)) =
1 d =
h d =
J f (h f ) d =
J f
h
f (A)
f (A)
A
A
Pelo Lema 12.1.3, isto significa que
J f = J f

hf
hf
= e
,
h
h

tal como foi afirmado.


Corol
ario 12.1.13. A medida invariante = h satisfaz h (f ) +

d = P .

Demonstrac
ao. Combinando a f
ormula de Rokhlin (Teorema 9.7.3) com a segunda parte do Lema 12.1.12,
Z
Z
Z
h (f ) = log J f d = log d + (log h f log h) d.
Como e invariante e log h e limitada
ario 12.1.9), a u
ltima parcela e
R (Corol
igual a zero. Portanto, h (f ) = P d conforme enunciado.

Para completar a prova de que = h e um estado de equilbrio resta


verificar que P = log e igual `
a press
ao P (f, ). Isso sera feito abaixo, no
Corol
ario 12.1.15.

12.1.5

Press
ao e autovalores

Seja qualquer probabilidade invariante de f satisfazendo


Z
h (f ) + d P

(12.1.16)

(por exemplo: a medida construda na secao anterior). Seja g = 1/J f e


considere tambem a funcao g = 1 e h/(h f ). Observe que
X

xf 1 (y)

g(x) =

1
h(y)

xf 1 (y)

e(x) h(x) =

Lh(y)
=1
h(y)

(12.1.17)


CAPITULO 12. FORMALISMO TERMODINAMICO

386

para todo y M . Alem disso, como e invariante por f (Exerccio 9.7.5),


X
g (x) = 1 para -quase todo y M .
(12.1.18)
xf 1 (y)

Usando (12.1.16) e a formula de Rokhlin (Teorema 9.7.3),


Z
Z
0 h (f ) + d P = ( log g + log ) d.

(12.1.19)

Pela definicao de g e a hipotese de que e invariante, a integral do lado direito


de (12.1.19) e igual a
Z
Z
g
( log g + log g + log h f log h) d = log
d.
(12.1.20)
g
Lembrando a definicao de g , o Exerccio 9.7.4 d
a que
Z
Z
X

g
g
g (x) log (x) d(y)
d =
log
g
g
1
xf

(12.1.21)

(y)

A esta altura precisamos do seguinte fato elementar:


Lema
12.1.14. Sejam
. , k n
umeros reais positivos tais que
Pk
P pi , bi , i = 1, . . P
ao ki=1 pi log bi log( ki=1 pi bi ) e a igualdade acontece se,
i=1 pi = 1. Ent
Pk
e somente se, os n
umeros bj forem todos iguais a i=1 pi bi .

Demonstrac
ao. Tome ai = log(pi bi ) no Lema 10.4.4. Ent
ao a desigualdade no
Lema 10.4.4 corresponde exatamente `a desigualdade no presente lema. Alem
disso, vale a igualdade se, e somente se,
e aj
p j = P ai
ie

para todo j = 1, . . . , n.

pj b j
pj = P
i pi b i

bj =

pi b i

Para cada y M , tome pi = g (xi ) e bi = log(g(xi )/g


P (xi )), onde os xi sao
as pre-imagens de y. A igualdade (12.1.18) significa que i pi = 1 para -quase
todo y. Ent
ao podemos aplicar o Lema 12.1.14:
X
X
g
g
g (x) log (x) log
g (x) (x)
g
g

xf 1 (y)
xf 1 (y)
(12.1.22)
X
g(x) = 0
= log
xf 1 (y)

para -quase todo y; na u


ltima igualdade usamos (12.1.17). Combinando as
relacoes (12.1.19)(12.1.22) obtemos:
Z
Z
g
d = 0.
(12.1.23)
h (f ) + d P = log
g

387

12.1. TEOREMA DE RUELLE


Corol
ario 12.1.15. P (f, ) = P = log r(L).

R
Demonstrac
ao. Por (12.1.23), temos Rh (f ) + d = P para toda probabilidade invariante tal que h (f ) + d P . Pelo princpio variacional
(Teorema 10.4.1), segue que P (f, ) = P . A segunda igualdade ja havia sido
observada ao final do Corol
ario 12.1.9.
A esta altura completamos a demonstracao de que a medida = h construda na secao anterior e um estado de equilbrio para . O enunciado a seguir
resulta do mesmo tipo de ideias e sera a base para provarmos que esse estado
de equilbrio e u
nico:
Corol
ario 12.1.16. Se e estado de equilbrio para ent
ao supp = M e
J f = e (h f )/h

L (/h) = (/h).

Demonstrac
ao. A primeira afirmacao no enunciado e uma consequencia imediata da segunda e do Lema 12.1.4.
A igualdade (12.1.23) tambem implica que vale a igualdade em (12.1.22)
para quase todo y M . De acordo com o Lema 12.1.14, isso acontece se, e
somente se, os n
umeros bi = log(g(xi )/g (xi )) sao todos iguais. Em outras
palavras, para -quase todo y M existe um n
umero c(y) tal que
g(x)
= c(y) para todo x f 1 (y).
g (x)
Alem disso, lembrando as igualdades (12.1.19) e (12.1.20),
X
X
c(y) =
c(y)g (x) =
g(x) = 1
xf 1 (y)

xf 1 (y)

para -quase todo y. Segue que g = g em quase todo ponto, ou seja, a


funcao 1/g = e (h f )/h e um jacobiano de f relativamente a . Isto prova
a segunda afirmacao.
Para provar a terceira afirmacao, seja : M R uma funcao contnua
qualquer. Por um lado, usando a definicao do operador de transferencia
Z
Z
Z
X


1
1

=
L d =
e(x) (x) d(y). (12.1.24)
dL
h
h
h(y)
1
xf

(y)

Pela definicao da funcao g,


e(x)
g(x)
=
.
h(y)
h(x)
Substituindo esta igualdade em (12.1.24), obtemos
Z
Z
X g



=
(x) d(y).
dL
h
h
1
xf

(y)

(12.1.25)


CAPITULO 12. FORMALISMO TERMODINAMICO

388

Ent
ao, lembrando que g = g = 1/J f , podemos usar o Exerccio 9.7.4 para
concluir que
Z
Z
Z
X g




=
(x) d(y) =
d.
dL
h
h
h
1
xf

(y)

Como a funcao contnua e arbitraria, isto mostra que L (/h) = (/h), tal
como afirmamos.

12.1.6

Unicidade do estado de equilbrio

Comecemos por provar o seguinte controle da distorcao:


Corol
ario 12.1.17. Existe K7 > 0 que para todo estado de equilbrio , todo
n 1, todo x M e todo y B(x, n + 1, ),
J f n (x)
K7 .
J f n (y)

K71

Demonstrac
ao. Pelo Corolario 12.1.16,
J f n = eSn

h fn
h fn
= J f n
h
h

para cada n 1. Ent


ao, usando o Corolario 12.1.6 e o Lema 12.1.11,
K21 K54

J f n (x)
J f n (x) h(f n (x))h(y)
=
K2 K54 .
J f n (y)
J f n (y) f (f n (y))h(x)

Portanto, basta tomar K7 = K2 K54 .


Lema 12.1.18. Todos os estados de equilbrio de s
ao equivalentes.
Demonstrac
ao. Considere uma particao finita P de M tal que todo P P tem
interior n
ao vazio e diametro menor que . Como supp 1 = supp 2 = M (pelo
Corol
ario 12.1.16) temos que {i (P ) : i = 1, 2 e P P} e limitado de zero.
Consequentemente, existe C1 > 0 tal que
1 (P )
1

C1
C1
2 (P )

para todo P P.

(12.1.26)

Vamos mostrar que esta relacao ainda vale para todo subconjunto mensuravel
de M , a menos de substituirmos C1 por uma constante conveniente C2 > C1 .
Para cada n 1, seja Qn a particao de M formada pelas imagens hn (P )
dos elementos de PR pelos ramos inversos hn do iterado f n . Pela definicao de
jacobiano, i (P ) = hn (P ) Ji f n di . Logo, usando o Corolario 12.1.17,
K71 Ji f n (x)

i (P )
K7 Ji f n (x)
i (hn (P ))

389

12.1. TEOREMA DE RUELLE

ario 12.1.16),
para qualquer x hn (P ). Lembrando que J1 f = J2 f (Corol
segue que
2 (P )1 (hn (P ))
K72 .
(12.1.27)
K72
1 (P )2 (hn (P ))
Combinando (12.1.26) e (12.1.27) e tomando C2 = C1 K72 vem que
1
1 (hn (P ))

C2
C2
2 (hn (P ))

(12.1.28)

para todo P P, todo ramo inverso hn de f n e todo n 1. Em outras palavras,


(12.1.26) vale para todo elemento de Qn , com C2 no lugar de C1 .
Agora observe que diam Qn < n para todo n. Dado qualquer conjunto
mensuravel B e dado qualquer > 0, podemos usar a Proposicao A.3.2 para
encontrar um compacto F B e um aberto A B tais que i (A \ F ) < para
i = 1 e para i = 2. Seja Qn a uni
ao de todos os elementos da particao Qn que
claro que Qn F e, supondo que n e suficientemente grande,
intersectam F . E
Qn A. Ent
ao,
1 (B) 1 (A) < 1 (Qn ) +

2 (B) 2 (F ) > 2 (Qn ) .

A relacao (12.1.28) d
a que 1 (Qn ) C2 2 (Qn ), uma vez que Qn e uma uniao
(disjunta) de elementos de Qn . Combinando estas tres desigualdades, obtemos
1 (B) < C2 2 (B) + ) + .
Como e arbitrario, conclumos que 1 (B) C2 2 (B) para todo conjunto
mensuravel B M . Permutando os papeeis das duas medidas tambem obtemos
que 2 (B) C2 2 (B) para todo conjunto mensuravel B M .
Estas desigualdades mostram que quaisquer dois estados de equilbrio sao
equivalentes, com derivadas de Radon-Nikodym afastada de zero e infinito.
Combinando os Lemas 4.3.3 e 12.1.18 obtemos que todos os estados de
equilbrio erg
odicos sao iguais. Por outro lado, como vimos na Proposicao 10.5.5,
as componentes erg
odicas de um estado de equilbrio sao estados de equilbrio
(ergodicos, claro). Segue que existe um u
nico estado de equilbrio, tal como
afirmamos.
Como consequencia, a medida de referencia tambem e u
nica: se existissem
duas medidas de referencia distintas 1 e 2 ent
ao 1 = h1 e 2 = h2 seriam
estados de equilbrio distintos. Analogamente, a autofuncao positiva h e u
nica
a menos de produto por constante positiva.
Podemos dar outra demonstracao da unicidade que dispensa o uso da Proposicao 10.5.5 e, portanto, do teorema de Jacobs. De fato, segue dos resultados
na proxima secao que o estado de equilbrio na Secao 12.1.4 e erg
odico. Pelo
Lema 12.1.18 isso implica que todos os estados de equilbrio sao ergodicos. Em
vista do Lema 4.3.3, segue que eles sao todos iguais.


CAPITULO 12. FORMALISMO TERMODINAMICO

390

12.1.7

Exatid
ao

Finalmente, vamos provar que o sistema (f, ) e exato. Lembre que isto quer
dizer que se B M e tal que existem conjuntos mensuraveis Bn satisfazendo
B = f n (Bn ) para todo n 1, ent
ao B tem medida 0 ou 1.
Seja B um conjunto nessas condicoes e suponha que (B) > 0. Seja P uma
particao finita de M por conjuntos com interior n
ao vazio e diametro menor que
. Para cada n, seja Qn a particao de M cujos elementos sao as imagens hn (P )
dos conjuntos P P pelos ramos inversos hn do iterado f n .
Lema 12.1.19. Para todo > 0 e todo n 1 suficientemente grande existe
algum hn (P ) Qn tal que
(B hn (P )) > (1 )(hn (P )).

(12.1.29)

Demonstrac
ao. Fixe > 0. Como a medida e regular (Propriedade A.3.2),
dado qualquer > 0 existe algum compacto F B e algum aberto A B
satisfazendo (A \ F ) < . Como supomos que (B) > 0, esta desigualdade
implica que (F ) > (1 )(A), desde que seja suficientemente pequeno.
Fixe > 0 nessas condicoes. Note que diam Qn < n . Ent
ao, para todo n
suficientemente grande, qualquer elemento hn (P ) de Qn que intersecta F est
a
contido em A. Suponha que (12.1.29) fosse falsa para todo hn (P ). Ent
ao,
somando sobre todos hn (P ) que intersectam F ,
(F )

P,hn

(F hn (P ))

(1 )

P,hn

P,hn

(B hn (P ))

(h (P )) (1 )(A).

Esta contradicao prova que (12.1.29) e valida para algum hn (P ) Qn .


Considere qualquer hn (P ) Qn satisfazendo (12.1.29). Como B = f n (Bn )
e f hn = id no seu domnio, temos que f n hn (P ) \ B) = P \ Bn . Ent
ao,
aplicando o Corol
ario 12.1.17 `a medida = ,
Z
J f n d K7 (hn (P ) \ B)J f n (x)
(P \ Bn ) =
hn (P )\B
Z
(12.1.30)
J f n d K71 (hn (P ))J f n (x)
e (P ) =
n

hn (P )

para qualquer x hn (P ). Combinando (12.1.29) e (12.1.30),


(P \ Bn )
hn (P ) \ B
K72
K72 .
(P )
hn (P )
Resumindo, mostramos que, dado qualquer > 0 e qualquer n 1 suficientemente grande existe algum P P tal que (P \ Bn ) K72 (P ).

391

12.1. TEOREMA DE RUELLE

Como a particao P e finita, segue que existe algum P P e alguma sequencia


(nj )j tal que
(P \ Bnj ) 0

quando j .

(12.1.31)

Fixemos P a partir daqui. Como P tem interior n


ao vazio e f e topologicamente
exata, por hip
otese, existe N 1 tal que f N (P ) = M . Seja P = P1 Ps uma
particao finita de P em domnios de invertibilidade de f N . Os Corolarios 12.1.9
e 12.1.16 d
ao que J f N = N eSN (h f N )/f e uma funcao limitada de zero
e infinito. Note tambem que f N (Pi \ Bnj ) = f N (Pi ) \ Bnj +N , uma vez que
f n (Bn ) = B para todo n. Combinando estas duas observacoes com (12.1.31),
obtemos que, dado qualquer i = 1, . . . , s,
Z
N
N
(f (Pi ) \ Bnj +N ) = (f (Pi \ Bnj )) =
log J f N d
Pi \Bnj

converge para zero quando j . Agora, {f N (Pi ) : i = 1, . . . , s} e uma cobertura finita de M por conjuntos mensuraveis. Portanto, esta u
ltima conclusao
implica que (M \ Bnj +N ) converge para zero, ou seja, que (B) = (Bnj +N )
converge para 1 quando j . Isto significa que (B) = 1, claro.
A demonstracao do Teorema 12.1 est
a completa.

12.1.8

Medidas absolutamente contnuas

Nesta u
ltima secao sobre o teorema de Ruelle vamos discutir brevemente o
caso particular em que f : M M e um difeomorfismo local numa variedade
compacta e = log | det Df |. Suporemos sempre que f e tal que o potencial
e H
older. O primeiro objetivo e comparar as conclusoes do teorema de Ruelle
neste caso com os resultados da Secao 11.1:
Proposi
c
ao 12.1.20. A probabilidade absolutamente contnua invariante de f
coincide com o estado de equilbrio do potencial = log | det Df |. Consequentemente, ela e equivalente `
a medida de Lebesgue m, com densidade d/dm
H
older e limitada de zero e infinito, e ela e exata.
Demonstrac
ao. Vimos no Exemplo 12.1.2 que a medida de Lebesgue m e autovetor do dual L do operador de transferencia correspondente ao potencial
= log | det Df |: mais precisamente,
L m = m.
Aplicando a teoria anterior (do Lema 12.1.3 em diante) com = 1 e = m,
encontramos uma funcao H
older h : M R, limitada de zero e infinito, tal que
Lh = h e a medida = hm e o estado de equilbrio do potencial . Lembrando
do Corol
ario 11.1.15, segue que tambem e a u
nica probabilidade invariante de
f absolutamente contnua com relacao a m. O fato de que h e positiva implica
que e m sao equivalentes. A exatidao foi provada na Secao 12.1.7.


CAPITULO 12. FORMALISMO TERMODINAMICO

392

Tambem segue da demonstracao do Teorema 12.1 que


Z
h (f ) log | det Df | d = P (f, log | det Df |) = log = 0.

(12.1.32)

Seja a media temporal da funcao , dada pelo teorema erg


odico de Birkhoff.
Ent
ao,
Z
Z
Z
log | det Df | d = d = d.
(12.1.33)
Alem disso,

(x)

= lim
n

n1
1
1X
log | det Df (f j (x))| = lim log | det Df n (x)|
n n
n j=0

(12.1.34)

em -quase todo ponto. No contexto dos nossos coment


arios sobre o teorema
de Oseledets (veja a relacao (c1) na Secao 3.3.5) mencionanos que
lim
n

k(x)
X
1
di (x)i (x),
log | det Df n (x)| =
n
i=1

(12.1.35)

onde 1 (x), . . . , k(x) (x) sao os expoentes de Lyapunov da transformacao f no


ponto x e d1 (x), . . . , dk(x) (x) sao as respectivas multiplicidades. Combinando
as relacoes (12.1.32)-(12.1.35), obtemos que
h (f ) =

k(x)

X
i=1


di (x)i (x) d(x).

(12.1.36)

Como estas funcoes sao invariantes (veja a relacao (a1) na Secao 3.3.5) e a
medida e erg
odica, temos que k(x), i (x) e di (x) sao constantes em -quase
todo ponto. Representaremos por k, i e di os seus valores. Ent
ao, (12.1.36) se
traduz no seguinte teorema:
Teorema 12.1.21. Seja f : M M uma transformac
ao expansora numa
variedade Riemanniana compacta, tal que a derivada Df e H
older. Seja a
u
nica probabilidade invariante absolutamente contnua com relac
ao `
a medida de
Lebesgue em M . Ent
ao
k
X
di i ,
(12.1.37)
h (f ) =
i=1

onde i , i = 1, . . . , k s
ao os expoentes de Lyapunov de f em -quase todo ponto
e di , i = 1, . . . , k s
ao as respectivas multiplicidades.

Este resultado e um caso particular de um teorema bem mais geral, conhecido como f
ormula da entropia de Pesin (veja Pesin [Pes77], Ma
ne [Ma
n81]),
segundo o qual
h (f ) =

k(x)

X
i=1


di (x)+
i (x) d(x),

+
i = max{0, i },

(12.1.38)


12.2. TEOREMA DE LIVSIC

393

sempre que f e uma transformacao (nao necessariamente expansora) diferenciavel com derivada H
older e e uma probabilidade invariante absolutamente
contnua com relacao `
a medida de Lebesgue. No caso de transformacoes expansoras todos os expoentes de Lyapunov sao positivos e, portanto, +
i = i para
todo i.
De fato, para que valha a f
ormula da entropia de Pesin (12.1.38) e suficiente
que a medida seja absolutamente contnua ao longo das variedades instaveis.
Mais ainda, esta condicao suficiente tambem e necessaria. Veja Ledrappier,
Young [Led84, LY85].

12.1.9

Exerccios

12.1.1. Mostre que se e uma medida boreliana num espaco metrico compacto
ent
ao para todo > 0 existe b > 0 tal que (B(y, )) > b para todo y supp .
12.1.2. Seja f : M M uma transformacao expansora. Considere o operador
n
ao linear G : M1 (M ) M1 (M ) definido no espaco M1 (M ) das probabilidades borelianas em M por
L ()
,
G() = R
L1 d

Use o teorema de Tychonoff-Schauder (Teorema 2.2.3) para concluir que G


admite algum ponto fixo. Deduza o Lema 12.1.1.
12.1.3. Seja : A A o deslocamento unilateral de tipo finito associado a
uma dada matriz de transicoes A (lembre da Secao 10.2.2). Seja P uma matriz
estoc
astica tal que Pi,j = 0 sempre que Ai,j = 0. Considere o operador de
transferencia L associado ao potencial localmente constante
pi1
.
(i0 , i1 , . . . , in , . . . ) = log
pi0 Pi0 ,i1
Mostre que L = , onde e a medida de Markov associada `a matriz P .

12.1.4. Seja um n
umero positivo qualquer e seja uma probabilidade boreliana satisfazendo L = . Mostre que, dada qualquer u L1 () e qualquer
funcao contnua v : M R,
Z
Z
(u f )v d = u(1 Lv) d.

12.2

Teorema de Livsi
c

Nesta secao vamos discutir a seguinte quest


ao: quando e que os estados de
equilbrio e de dois potenciais H
older e sao iguais? Observe que,
como se trata de medidas erg
odicas, e ou sao iguais ou sao mutuamente
singulares (Lema 4.3.3).
Lembre que dois potenciais dizem-se cohom
ologos relativamente a f se a
sua diferenca pode ser escrita na forma u f u para alguma funcao contnua
u : M R.


CAPITULO 12. FORMALISMO TERMODINAMICO

394

Proposi
c
ao 12.2.1. Um potencial : M R e cohom
ologo a zero se, e
somente se, Sn (x) = 0 para todo x Fix(f n ) e todo n 1.
claro que se = u f u para algum u ent
Demonstrac
ao. E
ao
Sn (x) =

n
X
j=1

u(f j (x))

n1
X

u(f j (x)) = 0

j=0

para todo x M tal que f n (x) = x. A recproca e muito mais interessante.


Suponha que Sn (x) = 0 para todo x Fix(f n ) e todo n 1. Considere
qualquer ponto z M cuja orbita e densa em M ; tal ponto existe porque f
e topologicamente misturadora e, consequentemente, transitiva. Defina u na
orbita de z por meio da relacao

u(f n (z)) = u(z) + Sn (z),

(12.2.1)

onde u(z) e arbitrario. Observe que


u(f n+1 (z)) u(f n (z)) = Sn+1 (z) Sn (z) = (f n (z))

(12.2.2)

para todo n 0. Em outras palavras, vale a condicao de cohomologia


=uf u

(12.2.3)

sobre a
orbita de z. Para estender esta relacao a M , usaremos o seguinte fato:
Lema 12.2.2. A func
ao u e uniformemente contnua na
orbita de z.
Demonstrac
ao. Dado qualquer (0, ), tome > 0 dado pelo lema de sombreamento (Proposicao 11.2.9). Suponha que k 0 e l 1 sao tais que
d(f k (z), f k+l (z)) < . Ent
ao a sequencia periodica (xn )n de perodo l dada
por
x0 = f k (z), x1 = f k+1 (z), . . . , xl1 = f k+l1 (z), xl = f k (z)
e uma -pseudo-
orbita. Logo, pela Proposicao 11.2.9, existe algum x Fix(f l )
j
tal que d(f (x), f k+j (z)) < para todo j 0. Como tomamos < , isto
tambem implica que x = hl (f l (x)), onde hl : B(f k+l (z), ) M representa o
ramo inverso de f l que envia f k+l (z) em f k (z). Por (11.2.6), segue que
d(f j (x), f k+j (z)) jl d(f l (x), f k+l (z))

para todo 0 j l.

(12.2.4)

Pela definicao (12.2.1),


u(f k+l (z)) u(f k (z)) = Sk+l (z) Sk (z) = Sl (f k (z)).

(12.2.5)

Fixe constantes C > 0 e > 0 tais que |(x) (y)| Cd(x, y) para quaisquer
x, y M . Ent
ao,
j1

X

X
(f k+j (z)) (f j (x))
Sl (f k (z)) Sl (x)
Cd(f j (x), f k+j (z)) .
j=0

j=0


12.2. TEOREMA DE LIVSIC

395

Usando (12.2.4), segue que


|Sl (f k (z)) Sl (x)|

X
j=0

C (jl) d(x, f k+l (z)) C1

(12.2.6)

P
onde C1 = C i=0 i . Lembre tambem que, por hipotese, Sl (x) = 0. Logo,
combinando (12.2.5) e (12.2.6), obtemos que |u(f k+l (z)) u(f k (z))| C1 .
Isto conclui a prova do lema.
Segue do Lema 12.2.2 que u admite uma u
nica extensao ao fecho da orbita de
z, ou seja, ao espaco ambiente M . Ent
ao, pela continuidade de e u, a relacao de
cohomologia (12.2.3) se estende a todo o M . Isto prova a Proposicao 12.2.1.
Teorema 12.2.3 (Livsic). Seja f : M M uma transformac
ao expansora
topologicamente misturadora num espaco metrico compacto e sejam e dois
potenciais em M . As seguintes condic
oes s
ao equivalentes:
(a) = ;
(b) existe c R e uma func
ao qualquer u : M R tal que = c+uf u;
(c) e cohom
ologo a alguma constante c R;
(d) existe c R e uma func
ao H
older u : M R tal que = c + u f u;
(e) existe c R tal que Sn (x) Sn (x) = cn para todo x Fix(f n ) e n 1.
Alem disso, as constantes c em (b), (c), (d) e (e) coincidem.
claro que (d) implica (c) e (c) implica (b).
Demonstrac
ao. E
Se = c + u f u para alguma funcao u ent
ao, dado x Fix(f n )
qualquer,
Sn (x) Sn (x) =

n1
X
j=0

n1
X


c + u(f j+1 (x)) u(f j (x)) .
(f j (x)) =
j=0

Como f n (x) = x, a soma dos dois u


ltimos termos sobre todo j = 0, . . . , n 1 e
nula. Portanto, Sn (x) Sn (x) = cn. Isto prova que (b) implica (e).
Suponha que Sn (x)Sn (x) = cn para todo x Fix(f n ) e todo n 0. Isto
significa que a funcao = c satisfaz Sn (x) = 0 para todo x Fix(f n ) e
todo n 0. Note tambem que e H
older. Logo, pela Proposicao 12.2.1, existe
uma funcao contnua u : M R tal que = u f u. Em outras palavras,
e cohom
ologo a c. Isto mostra que (e) implica (c).
Segue de (10.3.5) e da Proposicao 10.3.12 que se e cohom
ologa a + c
ent
ao
P (f, ) = P (f, + c) = P (f, ) + c.
Por outro lado, dada qualquer probabilidade invariante ,
Z
Z
Z
h (f ) + d = h (f ) + ( + c) d = h (f ) + d + c.


CAPITULO 12. FORMALISMO TERMODINAMICO

396

Portanto, e estado de equilbrio para se, e somente se, e estado de equilbrio


para . Isto mostra que (c) implica (a).
Se e coincidem ent
ao, evidentemente, elas tem o mesmo jacobiano.
Pelo Lema 12.1.12, isto quer dizer que
e

h f
h f
= e
.
h
h

(12.2.7)

Seja c = log log e seja u = log h log h . Estes objetos est


ao bem
definidos, uma vez que , , h e h sao positivos. Alem disso, como as
funcoes h e h sao H
older e limitadas de zero e de infinito (Corol
ario 12.1.9),
a funcao u e H
older. Finalmente, (12.2.7) pode ser reescrita na seguinte forma:
= c + log u f u.
Isto mostra que (a) implica (d). A prova do teorema est
a completa.
Temos a seguinte consequencia no contexto diferenci
avel. Seja M uma variedade compacta e seja f : M M uma transformacao diferenci
avel expansora
cujo jacobiano det Df e H
older.
Corol
ario 12.2.4. A medida invariante absolutamente contnua coincide com
a medida de m
axima entropia se, e somente se, existe c R tal que
| det Df n (x)| = ecn

para todo x Fix(f n ) e todo n 1.

Demonstrac
ao. Como vimos na Proposicao 12.1.20, e o estado de equilbrio
claro que a medida de maxima entropia 0
do potencial = log | det Df |. E
e o estado de equilbrio da funcao nula. Observe que
Sn (x) =

n1
X
j=0

log | det Df (f j (x))| = log | det Df n (x)|.

Portanto, o Teorema 12.2.3 d


a que = 0 se, e somente se, existe c R tal que
log | det Df n (x)| = 0 + cn para todo x Fix(f n ) e todo n 1.

12.2.1

Exerccios

12.2.1. Considere o deslocamento bilateral : em = {1, . . . , d}Z


Mostre que para toda funcao H
older : R, existe uma funcao H
older
+ : R, cohom
ologa a e tal que + (x) = + (y) sempre que x = (xi )iZ
e y = (yi )iZ sao tais que xi = yi para i 0.

12.2.2. Prove que se , : M R sao funcoes tais que existem constantes


C, L tais que |Sn (x) Sn (x) nC| L para todo x M , ent
ao P (f, ) =
P (f, ) + C e e cohom
ologo a + C.
12.2.3. Dado k 2, seja f : S 1 S 1 a transformacao dada por f (x) = kx
mod Z. Seja g : S 1 S 1 uma transformacao expansora diferenci
avel de grau
k. Mostre que f e g sao topologicamente conjugadas.


12.3. DECAIMENTO DE CORRELAC
OES

397

12.2.4. Dado k 2, seja f : S 1 S 1 a transformacao dada por f (x) = kx


mod Z. Seja g : S 1 S 1 uma transformacao expansora diferenci
avel de grau
k, com derivada H
older. Mostre que as seguintes condicoes sao equivalentes
(a) f e g sao conjugadas por algum difeomorfismo;
(b) f e g sao conjugadas por algum homeomorfismo absolutamente contnuo
com inverso absolutamente contnuo;
(c) (g n ) (p) = k n para todo p Fix(f n )

12.3

Decaimento de correlac
oes

Seja f : M M uma transformacao expansora topologicamente exata e seja


: M R um potencial H
older. Continuaremos representando por a medida
de referencia (Secao 12.1.1) e por o estado de equilbrio (Secao 12.1.4) do
potencial . Lembre que = h, onde a funcao h e limitada de zero e infinito
(Corol
ario 12.1.9). Em particular, L1 () = L1 ().
Dados b > 0 e > 0, diremos que uma funcao g : M R e (b, )-H
older se
|g(x) g(y)| bd(x, y)

para quaisquer x, y M.

(12.3.1)

Diremos que g e -H
older se ela e (b, )-H
older para algum b > 0. Nesse caso,
representaremos por H (g) a menor de tais constantes b. Alem disso, fixando
> 0 como em (11.2.1), representaremos por H, (g) a menor constante b tal
que a desigualdade em (12.3.1) vale para quaisquer x, y M com d(x, y) < .
A sequencia de correlacoes, relativamente `a medida invariante , de duas
funcoes g1 e g2 foi definida em (7.1.1):
Z
Z
Z


Cn (g1 , g2 ) = (g1 f n )g2 d g1 d g2 d ,
Tambem consideraremos uma nocao semelhante para a medida de referencia :
Z
Z
Z


Bn (g1 , g2 ) = (g1 f n )g2 d g1 d g2 d .

Nesta secao vamos provar que estas sequencias decaem exponencialmente:

Teorema 12.3.1 (Convergencia exponencial para equilbrio). Dado (0, ]


existe < 1 e para toda func
ao -H
older g2 : M C existe K1 (g2 ) > 0 tal que
Z
Bn (g1 , g2 ) K1 (g2 )n |g1 | d para toda g1 L1 () e todo n 1.
A prova deste resultado sera apresentada nas Secoes 12.3.1 a 12.3.3. A
demonstracao fornecer
a uma expressao explcita para o fator K1 (g2 ). Observe
tambem que
Z
Z
Z



n

Bn (g1 , g2 ) =
g1 d f (g2 ) g1 d g2 d .

398

CAPITULO 12. FORMALISMO TERMODINAMICO

Ent
ao, a conclusao do Teorema 12.3.1 pode ser interpretada do seguinte modo:
os iterados de qualquerR medida da forma g2 convergem exponencialmente para
a medida invariante g2 d.
Teorema 12.3.2 (Decaimento exponencial de correlacoes). Para todo (0, ]
existe < 1 e para toda func
ao -H
older g2 : M C existe K2 (g2 ) > 0 tal que
Z
Cn (g1 , g2 ) K2 (g2 )n |g1 | d para toda g1 L1 () e todo n 1.

Em particular, para todo par de func


oes -H
older g1 e g2 , existe K(g1 , g2 ) > 0
tal que Cn (g1 , g2 ) K(g1 , g2 )n para todo n 1.
Demonstrac
ao. Lembre que = h e que, de acordo com o Corolario 12.1.9, a
funcao h e -H
older e satisfaz K11 h K5 para algum K5 > 0. Logo, g2 e
-H
older se, e somente se, g2 h e -Holder (veja o Exerccio 12.3.5). Alem disso,
Z
Z
Z
Cn (g1 , g2 ) = (g1 f n )g2 d g1 d g2 d
Z
Z
Z
n
= (g1 f )(g2 h) d g1 d (g2 h) d = Bn (g1 , g2 h).
Portanto, segue do Teorema 12.3.1 que
Z
Z
Cn (g1 , g2 ) K1 (g2 h)n |g1 | d K1 (g2 h)/K5 n |g1 | d.
Isto prova a primeira parte do teorema, com K2 (g2 ) = K1 (g2 h)/K5 . A segunda
parte e uma consequencia imediata:
se g1 e -Holder ent
ao g1 L1 () e ent
ao
R
basta tomar K(g1 , g2 ) = K2 (g2 ) |g1 | d.

Antes de passarmos `a prova do Teorema 12.3.1, queremos fazer alguns coment


arios breves. A quest
ao do decaimento de correlacoes ja foi discutida na
Secao 7.4, sob a
otica da propriedade de lacuna espectral. Aqui usaremos uma
abordagem diferente. A demonstracao do teorema estar
a baseada na nocao
de distancia projetiva associada a um cone, a qual foi introduzida por Garret
Birkhoff [Bir67]. Esta nocao nos permitira obter a convergencia exponencial
para o equilbrio, (da qual segue o decaimento exponencial de correlacoes, como
acabamos de demonstrar) sem que tenhamos que analisar o espectro do operador de transferencia. Mas a propriedade da lacuna espectral vale tambem
no presente contexto e, de fato, e possvel deduzi-la a partir da abordagem
que apresentaremos a seguir. Voltaremos brevemente a este tema ao final da
Secao 12.3.

12.3.1

Dist
ancias projetivas

Seja E um espaco de Banach. Chamaremos cone a qualquer subconjunto convexo C de E satisfazendo:


tC C para todo t > 0 e

= {0},
C (C)

(12.3.2)


12.3. DECAIMENTO DE CORRELAC
OES

399

onde C representa o fecho de C (anteriormente consideramos apenas cones fechados mas agora e conveniente remover essa exigencia). Dados v1 , v2 C,
defina
(v1 , v2 ) = sup{t > 0 : v2 tv1 C} e (v1 , v2 ) = inf{s > 0 : sv1 v2 C}.
A Figura 12.1 ajuda a compreender o significado geometrico destes n
umeros.
Por convencao, (v1 , v2 ) = 0 se v2 tv1
/ C para todo t > 0 e (v1 , v2 ) = +
se sv1 v2
/ C para todo s > 0.
v2
v2 (v1 , v2 )v1

C
v1

v1 (v1 , v2 )1 v2

Figura 12.1: Definicao da distancia projetiva num cone C


Note que (v1 , v2 ) e sempre finito. De fato, (v1 , v2 ) = + significaria que
existe uma sequencia (tn )n + com v2 tn v1 C para todo n. Ent
ao,
sn = 1/tn seria uma sequencia de n
umeros positivos convergindo para zero, tais
contradizendo a
que sn v2 v1 C para todo n. Isso implicaria que v1 C,
segunda condicao em (12.3.2). Um argumento analogo mostra que (v1 , v2 ) e

sempre positivo: (v1 , v2 ) = 0 implicaria v2 C.


Dado qualquer cone C E e quaisquer v1 , v2 C \ {0}, definimos
(v1 , v2 ) = log

(v1 , v2 )
,
(v1 , v2 )

(12.3.3)

com (v1 , v2 ) = + sempre que (v1 , v2 ) = 0 ou (v1 , v2 ) = +. As observacoes no par


agrafo anterior asseguram que (v1 , v2 ) est
a sempre bem definido. Chamamos de dist
ancia projetiva associada ao cone C. Esta terminologia
e justificada pela proxima proposicao, a qual mostra que define uma distancia
no quociente projetivo de C\{0}, ou seja, no conjunto das classes de equivalencia
da relacao definida por v1 v2 v1 = tv2 para algum t > 0.
Proposi
c
ao 12.3.3. Se C e um cone ent
ao
(a) (v1 , v2 ) = (v2 , v1 ) para quaisquer v1 , v2 C;
(b) (v1 , v2 ) + (v2 , v3 ) (v1 , v3 ) para quaisquer v1 , v2 , v3 C;
(c) (v1 , v2 ) 0 para quaisquer v1 , v2 C;


CAPITULO 12. FORMALISMO TERMODINAMICO

400

(d) (v1 , v2 ) = 0 se, e somente se, existe t > 0 tal que v1 = tv2 ;
(e) (t1 v2 , t2 v2 ) = (v1 , v2 ) para quaisquer v1 , v2 C e t1 , t2 > 0.
Demonstrac
ao. Se (v2 , v1 ) > 0 ent
ao

1
(v2 , v1 ) = sup{t > 0 : v1 tv2 C} = sup{t > 0 : v1 v2 C
t
1
= inf{s > 0 : sv1 v2 C}
= (v1 , v2 )1 .

Alem disso,

(v2 , v1 ) = 0

v1 tv2
/ C para todo t > 0
sv1 v2
/ C para todo s > 0

(v1 , v2 ) = +.

Portanto, (v2 , v1 ) = (v1 , v2 )1 em todos os casos. Permutando os papeis de


v1 e v2 , tambem temos que (v2 , v1 ) = (v1 , v2 )1 para quaisquer v1 , v2 C.
A parte (a) da proposicao e uma consequencia imediata destas observacoes.
Em seguida, afirmamos que (v1 , v2 )(v2 , v3 ) (v1 , v3 ) para quaisquer
v1 , v2 , v3 C. Isto e
obvio se (v1 , v2 ) = 0 ou (v2 , v3 ) = 0; portanto, podemos
supor que (v1 , v2 ) > 0 e (v2 , v3 ) > 0. Ent
ao, por definicao, existem sequencias
crescentes de n
umeros positivos (rn )n (v1 , v2 ) e (sn )n (v2 , v3 ) tais que
v2 rn v1 C

v3 sn v2 C

para todo n 1.

Como C e convexo, segue que v3 sn rn v1 C e, portanto, sn rn (v1 , v3 ),


para todo n 1. Passando ao limite quando n +, obtemos a afirmacao.
Um argumento analogo mostra que (v1 , v2 )(v2 , v3 ) (v1 , v3 ) para quaisquer v1 , v2 , v3 C. A parte (b) da proposicao segue imediatamente destas
desigualdades.
A parte (c) significa, simplesmente, que (v1 , v2 ) (v1 , v2 ) para quaisquer
v1 , v2 C. Para provar isto, considere t > 0 e s > 0 tais que v2 tv1 C e
sv1 v2 C. Ent
ao, por convexidade, (s t)v1 C. Se s t fosse negativo,
teramos que v1 C, o que estaria em contradicao com a u
ltima parte de
(12.3.2). Portanto, s t para quaisquer t e s nas condicoes acima. Isto implica
que (v1 , v2 ) (v1 , v2 ).
Sejam v1 , v2 C tais que (v1 , v2 ) = 0. Ent
ao (v1 , v2 ) = (v1 , v2 ) =
para algum (0, +). Logo, existe uma sequencia crescente (tn )n e
uma sequencia decrescente (sn )n com
v2 tn v1 C

sn v1 v2 C

para todo n 1.

Escrevendo v2 tn v1 = (v2 v1 ) + ( tn )v1 , conclumos que v2 v1 est


a
Pela segunda parte de (12.3.2),
no fecho C de C. Analogamente, v1 v2 C.
segue que v2 v1 = 0. Isto prova a parte (d) da proposicao.
Finalmente, considere quaisquer t1 , t2 > 0 e v1 , v2 C. Por definicao,
(t1 v1 , t2 v2 ) =

t2
(v1 , v2 ) e
t1

(t1 v1 , t2 v2 ) =

t2
(v1 , v2 ).
t1

Logo, (t1 v1 , t2 v2 ) = (v1 , v2 ), como afirmado na parte (e) da proposicao.


12.3. DECAIMENTO DE CORRELAC
OES

401

Exemplo 12.3.4. Considere o cone C = {(x, y) E : y > |x|} em E = R2 .


O quociente projetivo de C pode ser identificado com o intervalo (1, 1), por
meio de (x, 1) 7 x. Dados 1 < x1 x2 < 1, temos que
((x1 , 1), (x2 , 1)) = sup{t > 0 : (x2 , 1) t(x1 , 1) C}
1 x2
= sup{t > 0 : 1 t |x2 tx1 |} =
1 x1
x2 + 1
e ((x1 , 1), (x2 , 1)) =
.
x1 + 1
Portanto,
((x1 , 1), (x2 , 1)) = log R(1, x1 , x2 , 1),
onde
R(a, b, c, d) =

(12.3.4)

(c a)(d b)
(b a)(d c)

representa a raz
ao cruzada de quatro n
umeros reais a < b c < d.
No Exerccio 12.3.2 propomos ao leitor verificar um fato semelhante onde o
intervalo e substitudo pelo disco unit
ario D = {z C : |z| < 1}.
Exemplo 12.3.5. Seja E = C 0 (M ) o espaco das funcoes contnuas num espaco
metrico compacto M . Considere o cone C+ = {g E : g(x) > 0 para x M }.
Para quaisquer g1 , g2 C+ ,


(g1 , g2 ) = sup t > 0 : (g2 tg1 )(x) > 0 para todo x M

 g2
(x) : x M
= inf
g1
 g2

e (g1 , g2 ) = sup
(x) : x M .
g1

Portanto,

(g1 , g2 ) = log

 g2 (x)g1 (y)

sup(g2 /g1 )
= log sup
: x, y M
inf(g2 /g1 )
g1 (x)g2 (y)

(12.3.5)

Esta distancia projetiva e completa (Exerccio 12.3.3) mas existem cones cujas
distancias projetivas n
ao sao completas (Exerccio 12.3.4).
Agora, vamos observar que a distancia projetiva varia de forma mon
otona
com o cone. De fato, sejam C1 e C2 dois cones com C1 C2 e sejam i (, ),
i (, ), i (, ), i = 1, 2 as respectivas funcoes, tal como definidas anteriormente.
claro das definicoes que, dados quaisquer v1 , v2 C2 ,
E
1 (v1 , v2 ) 2 (v1 , v2 ) e

1 (v1 , v2 ) 2 (v1 , v2 )

e, consequentemente, 1 (v1 , v2 ) 2 (v1 , v2 ).

402

CAPITULO 12. FORMALISMO TERMODINAMICO

Mais geralmente, sejam C1 e C2 cones em espacos de Banacah E1 e E2 ,


respectivamente, e seja L : E1 E2 um operador linear tal que L(C1 ) C2 .
Ent
ao
1 (v1 , v2 ) = sup{t > 0 : v2 tv1 C1 }
sup{t > 0 : L(v2 tv1 ) C2 }

= sup{t > 0 : L(v2 ) tL(v1 ) C2 } = 2 (L(v1 ), L(v2 ))

e, analogamente, 1 (v1 , v2 ) 2 (L(v1 ), L(v2 )). Consequentemente,


2 (L(v1 ), L(v2 )) 1 (v1 , v2 ) para quaisquer v1 , v2 C1 .

(12.3.6)

Em geral, a desigualdade (12.3.6) n


ao e estrita. No entanto, de acordo com
a proxima proposicao, isso acontece sempre que L(C1 ) tem diametro finito em
C2 , relativamente `
a distancia projetiva; de fato, nesse caso L e uma contracao
relativamente `
as distancias projetivas 1 e 2 . Lembre que a funcao tangente
hiperb
olica tanh e definida por
tanh x =

1 e2x
1 + e2x

para todo x R.

Note que a funcao tanh toma valores no intervalo (0, 1).


Proposi
c
ao 12.3.6. Sejam C1 e C2 cones em espacos de Banach E1 e E2 ,
respectivamente, e seja L : E1 E2 um operador linear tal que L(C1 ) C2 .
Suponha que D = sup{2 (L(v1 ), L(v2 )) : v1 , v2 C1 } e finito. Ent
ao,
2 (L(v1 ), L(v2 )) tanh

D
1 (v1 , v2 )
4

para quaisquer v1 , v2 C.

Demonstrac
ao. Sejam v1 , v2 C1 . N
ao e restricao supor que 1 (v1 , v2 ) > 0 e
1 (v1 , v2 ) < + pois, caso contrario, 1 (v1 , v2 ) = + e n
ao h
a nada a provar. Ent
ao existem ua sequencia crescente (tn )n 1 (v1 , v2 ) e uma sequencia
decrescente (sn )n 1 (v1 , v2 ), tais que
v2 tn v1 C1

sn v1 v2 C1 .

Em particular, 2 (L(v2 tn v1 ), L(sn v1 v2 )) D para todo n 1. Fixe


qualquer D0 > D. Ent
ao podemos escolher n
umeros positivos Tn e Sn tais que
L(sn v1 v2 ) Tn L(v2 tn v1 ) C2 ,

Sn L(v2 tn v1 ) L(sn v1 v2 ) C2 ,

(12.3.7)

e log(Sn /Tn ) D0 para todo n 1. A primeira parte de (12.3.7) d


a que
(sn + tn Tn )L(v1 ) (1 + Tn )L(v2 ) C2
e, por definicao de 2 (, ), isto implica
2 (L(v1 ), L(v2 ))

s n + tn T n
.
1 + Tn


12.3. DECAIMENTO DE CORRELAC
OES

403

Analogamente, a segunda parte de (12.3.7) implica que


2 (L(v1 ), L(v2 ))

s n + tn S n
.
1 + Sn

Portanto, 2 (L(v1 ), L(v2 )) n


ao pode exceder
log

s n + tn T n
1 + Sn

1 + Tn
s n + tn S n

= log

1 + Sn
sn /tn + Tn

1 + Tn
sn /tn + Sn

Ou
ltimo termo pode ser reescrito como




sn
sn
+ Tn log(1 + Tn ) log
+ Sn + log(1 + Sn ) =
log
tn
tn

Z log(sn /tn )  x
ex dx
e dx
,

=
ex + Tn
e x + Sn
0
e esta expressao e menor ou igual que
ex (Sn Tn )
sup x
log
x
x>0 (e + Tn )(e + Sn )

sn
tn

Agora usaremos os seguintes fatos elementares:


sup
y>0

p
1 Tn /Sn
y(Sn Tn )
1 eD0 /2
D0
p
=
.

= tanh
(y + Tn )(y + Sn )
4
1 + eD0 /2
1 + Tn /Sn

De fato, o supremo e atingido quando y = Sn Tn e a desigualdade e consequencia de que log(Sn /Tn ) D0 . Isto prova que
2 (L(v1 ), L(v2 )) tanh

D0
4

log

sn
tn

Note tambem que (v1 , v2 ) = limn log(sn /tn ), devido `a nossa escolha de sn e tn .
Logo, passando ao limite quando n e depois fazendo D0 D, obtemos a
conclusao da proposicao.
Exemplo 12.3.7. Seja C+ o cone das funcoes contnuas positivas em M . Para
cada L > 1, seja C(L) = {g C+ : sup |g| L inf |g|}. Ent
ao C(L) tem
diametro finito em C+ , para todo L > 1. De fato, vimos no Exemplo 12.3.5 que
a distancia projetiva associada a C+ e dada por
(g1 , g2 ) = log sup

 g2 (x)g1 (y)

: x, y M .
g1 (x)g2 (y)

Em particular, (g1 , g2 ) 2 log L para quaisquer g1 , g2 C(L).


CAPITULO 12. FORMALISMO TERMODINAMICO

404

12.3.2

Cones de fun
c
oes H
older

Seja f : M M uma transformacao expansora topologicamente exata e sejam


> 0 e > 1 as constantes na definicao (11.2.1). Seja L : C 0 (M ) C 0 (M ) o
operador de transferencia associado a um potencial H
older : M M . Fixe
constantes K0 > 0 e > 0 tais que
|(x) (y)| K0 d(x, y)

para quaisquer x, y M.

Dados b > 0 e > 0, vamos representar por C(b, ) o conjunto das funcoes
positivas g C 0 (M ) cujo logaritmo e (b, )-H
older em bolas de raio , ou seja,
tais que
| log g(x) log g(y)| bd(x, y)

sempre que d(x, y) < .

(12.3.8)

Lema 12.3.8. Para quaisquer b > 0 e > 0, o conjunto C(b, ) e um cone em


E = C 0 (M ) e a respectiva dist
ancia projetiva e dada por
(g1 , g2 ) = log

(g1 , g2 )
(g1 , g2 )

onde (g1 , g2 ) e o nfimo e (g1 , g2 ) e o supremo do conjunto


 g2

exp(bd(x, y) )g2 (x) g2 (y)
(x),
: x 6= y e d(x, y) < .
g1
exp(bd(x, y) )g1 (x) g1 (y)

claro que g C implica tg C para todo t > 0. Alem disso,


Demonstrac
ao. E
o fecho de C est
a contido no conjunto das funcoes n
ao negativas e, portanto,
C C so contem a funcao nula. Para concluir que C e um cone resta verificar
que ele e convexo. Considere quaisquer g1 , g2 C(b, ). A definicao (12.3.8)
quer dizer que
exp(bd(x, y) )

gi (x)
exp(bd(x, y) )
gi (y)

para i = 1, 2 e quaisquer x, y M com d(x, y) < . Ent


ao, dados t1 , t2 > 0,
exp(bd(x, y) )

t1 g1 (x) + t2 g2 (x)
exp(bd(x, y) )
t1 g1 (y) + t2 g2 (y)

para quaisquer x, y M com d(x, y) < . Logo, t1 g1 + t2 g2 is in C(b, ),


Passamos agora a calcular a distancia projetiva. Por definicao, (g1 , g2 ) e o
supremo dos n
umeros t > 0 satisfazendo as seguintes tres condicoes:
g2
(x)
g1
(g2 tg1 )(x)
exp(bd(x, y) )g2 (y) g2 (x)
exp(bd(x, y) ) t
(g2 tg1 )(y)
exp(bd(x, y) )g1 (y) g1 (x)
exp(bd(x, y) )g2 (x) g2 (y)
(g2 tg1 )(x)
exp(bd(x, y) ) t
(g2 tg1 )(y)
exp(bd(x, y) )g1 (x) g1 (y)
(g2 tg1 )(x) > 0 t <


12.3. DECAIMENTO DE CORRELAC
OES

405

para quaisquer x, y M com x 6= y e d(x, y) < . Logo, (g1 , g2 ) e igual a


inf


 g2 (x) exp(bd(x, y) )g2 (x) g2 (y)
,
: x 6= y e d(x, y) < .

g1 (x) exp(bd(x, y) )g1 (x) g1 (y)

Analogamente, (g1 , g2 ) e o supremo deste mesmo conjunto.

O fato crucial que faz a demonstracao do Teorema 12.3.1 funcionar e que


o operador de transferencia tende a melhorar a regularidade das funcoes, mais
precisamente, as suas constantes de H
older. A proxima proposicao e uma manifestacao concreta desse fato:
Lema 12.3.9. Para cada (0, ] existe uma constante 0 (0, 1) tal que
L(C(b, )) C(0 b, ) para todo b suficientemente grande (dependendo de ).
Demonstrac
ao. Segue diretamente da expressao (12.1.2) do operador de transferencia que Lg e positiva sempre que g e positiva. Portanto, so temos que
verificar a segunda condicao na definicao de C(0 b, ). Considere y1 , y2 M
com d(y1 , y2 ) < . A expressao (12.1.3) d
a que
Lg(yi ) =

k
X

e(xi,j ) g(xi,j )

j=1

para i = 1, 2, onde os pontos xi,j f 1 (yi ) satisfazem d(x1i , x2i ) 1 d(y1 , y2 )


para todo 1 j k. Por hip
otese, e (K0 , )-H
older. Como supomos que
, segue que e (K, )-H
older, com K = K0 (diam M ) . Portanto, para
todo g C(b, ),
(Lg)(y1 ) =

k
X
i=1

k
X

e(x1,i ) g(x1,i ) =

k
X

e(x2,i ) g(x2,i )

i=1

g(x1,i )e(x1,i )
g(x2,i )e(x2,i )

e(x2,i ) g(x2,i ) exp bd(x1,i , x2,i ) + Kd(x1,i , x2,i )

i=1


(Lg)(y2 ) exp (b + K) d(y1 , y2 ) .

Fixe 0 ( , 1). Para todo b suficientemente grande, (b + K) b0 .


Ent
ao, a relacao anterior d
a que
(Lg)(y1 ) (Lg)(y2 ) exp(0 bd(y1 , y2 ) ),
para quaisquer y1 , y2 M com d(y1 , y2 ) < . Permutando os papeis de y1 e y2
obtemos a outra desigualdade.
A seguir usaremos a famlia de cones C(L) introduzida no Exemplo 12.3.7:
Lema 12.3.10. Existe N 1 e para todo > 0 e todo b > 0 existe L > 1
satisfazendo LN (C(b, )) C(L).


CAPITULO 12. FORMALISMO TERMODINAMICO

406

Demonstrac
ao. Por hipotese, f e topologicamente exata. Logo, existe N 1 tal
que f N (B(z, )) = M para todo z M . Fixe N de uma vez por todas. Dada
g C(b, ), considere qualquer ponto z M tal que g(z) = sup g. Considere
y1 , y2 M . Por um lado,
X
LN g(y1 ) =
eSN (x) g(x) grau(f N )eN sup || g(z).
xf N (y1 )

Por outro lado, pela escolha de N , existe algum x B(z, ) tal que f N (x) = y2 .
Ent
ao,

LN g(y2 ) eSN (x) g(x) eN sup || ebd(x,z) g(z) eN sup ||b g(z).
Como y1 , y2 sao arbitrarios, isto prova que

sup LN g
grau(f N )e2N sup ||+b .
N
inf L g

Agora basta tomar L igual `a expressao do lado direito desta desigualdade.


Combinando os Lemas 12.3.9 e 12.3.10 obtemos que existe N 1 e, dado
(0, ] existe 0 (0, 1) tal que, para todo b > 0 suficientemente grande
(dependendo de N e ) existe L > 1, satisfazendo
LN (C(b, )) C(N
0 b, ) C(L).

(12.3.9)

No que segue, escreveremos C(c, , R) = C(c, ) C(R) para quaisquer c > 0,


> 0 e R > 1.
Lema 12.3.11. Para todo c (0, b) e R > 1, o conjunto C(c, , R) C(b, )
tem di
ametro finito relativamente `
a dist
ancia projetiva do cone C(b, ).
Demonstrac
ao. Usaremos a expressao de dada pelo Lema 12.3.8. Por um lado,
a hip
otese de que g1 , g2 C(c, ) garante que



exp bd(x, y) g2 (x) g2 (y)
g2 (x) 1 exp bd(x, y) g2 (y)/g2 (x)



=
g1 (x) 1 exp bd(x, y) g1 (y)/g1 (x)
exp bd(x, y) g1 (x) g1 (y)

g2 (x) 1 exp (b c))d(x, y) )



g1 (x) 1 exp (b + c)d(x, y)
g2 (x) 1 exp (b c) )

g1 (x) 1 exp (b + c)

para quaisquer x, y M com d(x, y) < . Representemos por r o valor da


u
ltima fracao do lado direito. Ent
ao, observando que r (0, 1),
(g1 , g2 ) inf

 g2 (x) g2 (x)

 g2 (x)

inf g2
.
,r
: x M = r inf
:xM r
g1 (x) g1 (x)
g1 (x)
sup g1


12.3. DECAIMENTO DE CORRELAC
OES

407

Analogamente,
(g1 , g2 ) sup

1
 g2 (x)
1 sup g2
 g2 (x) 1 g2 (x)
.
,
: x M = sup
:xM
g1 (x) r g1 (x)
r
g1 (x)
r inf g1

Por outro lado, a hip


otese de que g1 , g2 C(R) d
a que
sup g2
inf g2
R2
.
inf g1
sup g1

Combinando estas tres desigualdades, conclumos que (g1 , g2 ) log(R2 /r2 )


para quaisquer g1 , g2 C(c, , R).
Corol
ario 12.3.12. Existe N 1 tal que para todo (0, ] e todo b > 0
suficientemente grande existe 0 < 1 tal que
(LN g1 , LN g2 ) 0 (g1 , g2 )

para quaisquer g1 , g2 C(b, ).

Demonstrac
ao. Tome N 1, 0 (0, 1) e L > 1 como em (12.3.9) e considere
c = N
0 b

R = L.

(12.3.10)

Ent
ao LN (C(b, )) C(c, , R) e segue do Lema 12.3.11 que o diametro D
da imagem LN (C(b, )) relativamente `a distancia projetiva e finito. Tome
0 = tanh(D/4). Agora a conclusao do corol
ario e uma aplicacao imediata da
Proposicao 12.3.6.

12.3.3

Converg
encia exponencial

Fixe N 1 e (0, ] e b > 0 e L > 1, nas condicoes do Corolario 12.3.12, e


considere c > 0 e R > 1 dados por (12.3.10). Continuamos representando por h
a autofuncao positiva (Lema 12.1.11) e por o raio espectral (Corol
ario 12.1.15)
do operador de transferencia L. Lembre que h e -Holder e limitada de zero
e infinito. Portanto, a menos de aumentar as constantes b e L se necessario,
podemos considerar h C(c, , R).
O proximo lema segue diretamente das consideracoes anteriores e nos permitir
a obter a estimativa no Teorema 12.3.1. Continuamos representando por
k k a norma definida em C 0 (M ) por kk = sup{|(x)| : x M }.
Lema 12.3.13. Existe C > 0 e (0, 1) tal que
Z
Z
kn Ln g h g dk Cn g d para g C(c, , R) e n 1.

R
Demonstrac
ao. Seja g C(c, , R). Em particular, g > 0 e portanto g d > 0.
A conclusao do lema n
ao e afetada quando Rmultiplicamos g por qualquer n
umero
positivo. Logo, n
ao e restricao supor que g d = 1. Ent
ao,
Z
Z
Z
Z
n n
n
n
L g d = g d(L ) = g d = 1 = h d


CAPITULO 12. FORMALISMO TERMODINAMICO

408

e, portanto, inf(n Ln g/h) 1 sup(n Ln g/h) para todo n 1. Agora


segue das expressoes no Lema 12.3.8 que
jN LjN g
1
h
jN LjN g
(jN LjN g, h) sup
1.
h

(jN LjN g, h) inf

Consequentemente,
jN LjN g
h
jN jN

L g
(jN LjN g, h) log (jN LjN g, h) log inf
h

(jN LjN g, h) log (jN LjN g, h) log sup

para todo j 0. Agora seja D o diametro de C(c, , R) relativamente `a distancia projetiva (Lema 12.3.11). Pela Proposicao 12.3.3 e pelo Corolario 12.3.12,
(jN LjN g, h) = (LjN g, LjN h) j0 (g, h) j0 D
para todo j 0. Combinando isto com as duas desigualdades anteriores,
exp(j0 D) inf

jN LjN g
jN LjN g
sup
exp(j0 D)
h
h

para todo j 0. Fixe C1 > 0 tal que |ex 1| C1 |x| sempre que |x| D.
Ent
ao a relacao anterior implica que
jN jN


L g(x) h(x) h(x)C1 j0 D para todo x M e j 0. (12.3.11)
1/N

Tome C2 = C1 D sup h e = 0

. A desigualdade (12.3.11) significa que

kjN LjN g hk C2 jN

para todo j 1.

Dado qualquer n 1, escreva n = jN + r com j 0 e 0 r < N . Como o


operador L : C 0 (M ) C 0 (M ) e contnuo e Lh = h,
kn Ln g hk = kr Lr (jN LjN g h)k (kLk/)r kjN LjN g hk.
Combinando as duas u
ltimas desigualdades,
kn Ln g hk (kLk/)r C2 nr .
Isto prova a conclusao do lema, desde que tomemos C C2 (kLk/())r para
todo 0 r < N .
Agora estamos prontos para provar o Teorema 12.3.1:


12.3. DECAIMENTO DE CORRELAC
OES

409

Demonstrac
ao. Comece por considerar g2 C(c, , R). Usando a igualdade no
Exerccio 12.1.4 e lembrando que = h,


Z
Z


Bn (g1 , g2 ) = g1 n Ln g2 h g2 d d
Z
Z


n Ln g2 h g2 d |g1 | d.
Portanto, usando o Lema 12.3.13,

Bn (g1 , g2 ) Cn

|g1 | d

g2 d.

(12.3.12)

Agora seja g2 : M R uma funcao -Holder qualquer e seja H = H (g2 ).


Escrevemos g1 = g2+ g2 , onde
g2+ =

1
(|g2 | + g2 ) + B
2

g2 =

1
(|g2 | g2 ) + B
2

e a constante positiva B e definida por B = max{H/c, sup |g2 |/(R 1)}. E


claro que as funcoes g2 sao positivas: g2 B > 0. Alem disso, elas sao
(H, )-H
older:
|g2 (x) g2 (y)| |g2 (x) g2 (y)| Hd(x, y) ,
para x, y M . Logo, usando o teorema da media e o fato de que B H/c,



log g (x) log g (y) |g2 (x) g2 (y)| Hd(x, y) cd(x, y) .
2
2
B
B

Alem disso, como B sup |g2 |/(R 1),

sup g2 sup |g2 | + B RB R inf g2


Juntamente com a relacao anterior, isto significa que g2 C(c, , R), tal como
afirmamos. Ent
ao podemos aplicar (12.3.12) `as duas funcoes:
Z
Z
Bn (g1 , g2 ) Cn |g1 | d g2 d
e, consequentemente,
Bn (g1 , g2 ) Bn (g1 , g2+ ) + Bn (g1 , g2 )
Z
Z
Cn |g1 | d (g2+ + g2 ) d.
Alem disso, pela definicao de g2 ,
Z
Z
Z
2 sup |g2 |
2H
+
(g2+ + g2 ) d = |g2 | d + 2B |g2 | d +
c
R1
2
R+1
H (g2 ) +
sup |g2 |.
c
R1

(12.3.13)

(12.3.14)

410

CAPITULO 12. FORMALISMO TERMODINAMICO

Tome C1 = C max{2/c, (R + 1)/(R 1)} e defina


K1 (g2 ) = 2C1 sup |g2 | + H (g2 ) .

As relacoes (12.3.13) e (12.3.14) d


ao que
Z
Z
 1
Bn (g1 , g2 ) C1 n |g1 | d H (g2 ) + sup |g2 | K1 (g2 )n |g1 | d.
2

Isto termina a prova do teorema no caso em que g2 e uma funcao real.


O caso geral (complexo) segue facilmente. Note que K1 (g2 ) K1 (g2 ), pois
sup |g2 | sup |g2 | e H (g2 ) H (g2 ). Analogamente, K1 (g2 ) K1 (g2 ).
Portanto, os argumentos anteriores d
ao que
Z

1
Bn (g1 , g2 ) Bn (g1 , g2 ) + Bn (g1 , g2 ) K1 (g2 ) + K1 (g2 ) n |g1 | d
2
Z
n
K1 (g2 )
|g1 | d

Isto completa a prova do teorema de convergencia para o equilbrio.


Vamos encerrar esta secao com alguns coment
arios sobre a propriedade da
lacuna espectral. Seja C (M ) o espaco vetorial das funcoes -Holder g : M C.
Deixamos ao cuidado do leitor provar os seguintes fatos (Exerccio 12.3.6):
(i) A funcao kgk, = sup |g| + H, (g) e uma norma completa em C (M ).
(ii) C (M ) e invariante pelo operador de transferencia: L(C (M )) C (M ).
(iii) A restricao L : C (M ) C (M ) e contnua relativamente `a norma kk, .
R
Note que h C (M ), ja que . Defina V = {g C (M ) : g d = 0}.
Ent
ao C (M ) = V Ch, pois toda funcao g C (M ) pode ser decomposta,
de maneira u
nica,
Z
Z
g = g h g d) + h g d
como soma de uma funcao em V com um m
ultiplo de h. Alem disso, a soma
direta C (M ) = V Ch e invariante pelo operador de transferencia. De fato,
se g V ent
ao
Z
Z
Z
gV

Lg d = gdL = g d = 0 Lg V.

Segue que o espectro de L no espaco de Banach C (M ) e a uniao de {} com


o espectro da restricao L ao hiperplano V . No Exerccio 12.3.8 propomos ao
leitor mostrar que o raio espectral de L | V e estritamente menor que . Consequentemente, L : C (M ) C (M ) tem a propriedade da lacuna espectral.
No livro de Viviane Baladi [Bal00] o leitor encontrara uma apresentacao
aprofundada da teoria espectral dos operadores de transferencia e suas conex
oes
com o decaimento de correlacoes, para transformacoes expansoras diferenci
aveis
ou diferenci
aveis por pedacos e tambem para difeomorfismos uniformemente
hiperb
olicos.


12.3. DECAIMENTO DE CORRELAC
OES

12.3.4

411

Exerccios

12.3.1. Mostre que a raz


ao cruzada R(a, x, y, b) e invariante por todo automorfismo de M
obius da reta, ou seja, R((a), (b), (c), (d)) = R(a, b, c, d) para
quaisquer a < b c < d e toda transformacao da forma (x) = (x+)/(x+)
com 6= 0.
12.3.2. Considere o cone C = {(z, s) C R : s > |z|}. O seu quociente
projetivo pode ser identificado com o disco unit
ario D = {z C : |z| < 1}, por
meio de (z, 1) 7 z. Seja d a distancia induzida em D, mediante esta identificacao, pela distancia projetiva de C. Mostre que d coincide com a dist
ancia
de Cayley-Klein , definida por
(p, q) = log

|aq| |pb|
,
|ap| |bq|

para p, q D,

onde a e b sao os pontos onde a reta que passa por p e q intersecta o bordo
do disco, designados de tal modo que p esteja entre a e q e q esteja entre p e
b. [Observacao: A distancia de Cayley-Klein relaciona-se com a distancia de
Poincare do disco mediante a aplicacao z 7 (2z)/1 + |z|2 .]
12.3.3. Mostre que a distancia projetiva associada ao cone C+ apresentado no
Exemplo 12.3.7 e completa, no seguinte sentido: relativamente `a distancia projetiva, toda sequencia de Cauchy (gn )n converge para algum elemento de C+ .
Alem disso, se normalizarmos as funcoes
R (por exemplo,
R fixando uma probablilidade qualquer em M e exigindo que gn d = 1 = g d para todo n, ent
ao
(gn )n converge uniformemente para g.
12.3.4. Seja M uma variedade compacta e seja C1 o cone das funcoes positivas
diferenci
aveis em M . Mostre que a respectiva distancia projetiva 1 n
ao e
completa.
12.3.5. Verifique que se g1 e g2 sao funcoes -Holder, : M M e transformacao L-Lipschitz e e uma probabilidade em M ent
ao
(a) H (g1 g2 ) sup |g1 |H (g2 ) + sup |g2 |H (g1 );
R
R
(b) |g1 | d sup |g1 | |g1 | d + H (g1 )(diam M ) ;
(c) H (g ) L H (g).

O item (a) permanece verdadeiro se substituirmos H por H, . O mesmo vale


para o item (c), se suposermos L 1.

12.3.6. Seja C (M ) o espaco vetorial das funcoes -Holder num espaco metrico
compacto M . Prove as propriedades (i), (ii), (iii) que foram enunciadas ao final
da Secao 12.3.

12.3.7. Considere C (M ) munido da norma k k, . Seja L : C (M ) C (M )


o operador de transferencia associado a um potencial -Holder, com .
Sejam o raio espectral, a medida de referencia, h a auto-funcao e = h
o estado de equilbrio do potencial . Considere o operador de transferencia
P : C (M ) C (M ) associado ao potencial = + log h log h f log .

412

CAPITULO 12. FORMALISMO TERMODINAMICO

(a) Mostre que L e linearmente conjugado a P, logo esp(L) = esp(P).


Alem disso, P1 = 1 e P = .
R
R
(b) Mostre que |P n g| d |g| d e sup |P n g| sup |g| e existem constantes C > 0 e < 1 tais que H, (P n g) n H, (g) + C sup |g| para todo
g C (M ) e todo n 1.
12.3.8. Mantemos as notacoes do Exerccio 12.3.7. O objetivo e mostrar
que o
R
raio espectral da restricao de L ao hiperplano V = {g C (M ) : g d = 0} e
estritamente menor que . Pela parte (a) do exerccio anterior, basta considerar
o caso L = P (com = 1, = e h = 1). Fixe b, , R como no Corolario 12.3.12.
(a) Mostre que existem K > 1 e r > 0 tais que, para todo v V com
kvk, r, a funcao g = 1 + v est
a no cone C(b, , R) e satisfaz
K 1 kvk, (1, g) Kkvk, .

(b) Use o Corol


ario 12.3.12 e o item anterior para encontrar C > 0 e < 1
tais que kP n vk, C n kvk, para todo v V .

12.4

Dimens
ao de repulsores conformes

Nesta secao apresentaremos uma aplicacao da teoria desenvolvida anteriormente


ao c
alculo da dimensao de Hausdorff de certos conjuntos invariantes por transformacoes expansoras, que chamamos repulsores conformes. O principal resultado (Teorema 12.4.3) contem uma formula para o valor da dimensao de
Hausdorff do repulsor em termos da press
ao de certos potenciais.
O leitor interessado em aprofundar o estudo da dimensao de Hausdorff e
suas diversas aplicacoes encontrara apresentacoes detalhadas nos livros de Falconer [Fal90], Palis, Takens [PT93, Captulo 4], Pesin [Pes97] e Bonatti, Daz,
Viana [BDV05, Captulo 3].

12.4.1

Dimens
ao de Hausdorff

Seja M um espaco metrico. Nesta secao entenderemos por cobertura de M


qualquer famlia finita ou enumeravel de subconjuntos de M cuja uniao e M .
O di
ametro de uma cobertura U e o supremo dos diametros dos seus elementos.
Para cada d > 0 e > 0, definimos
X

md (M, ) = inf
diam(U )d : U cobertura com diam U < .
(12.4.1)
UU

Ou seja, consideramos todas as possveis coberturas de M por subconjuntos com


diametro menor que e procuramos minimizar a soma dos diametros elevada
a d. Este n
umero varia com de maneira mon
otona: quando diminui, a
classe de coberturas adminssveis diminui e portanto o nfimo so pode aumentar.
Chamamos medida de Hausdorff de M em dimens
ao d ao limite
md (M ) = lim md (M, ).
0

(12.4.2)

DE REPULSORES CONFORMES
12.4. DIMENSAO

413

Note que md (M ) [0, ]. Alem disso, segue diretamente da definicao que


md1 (M, ) d1 d2 md2 (M, )

para todo > 0 e quaisquer d1 > d2 > 0.

Fazendo 0 segue que md1 (M ) = 0 ou md2 (M ) = ou ambos. Portanto,


existe um u
nico valor d(M ) [0, ] tal que md (M ) = para todo d < d(M ) e
md (M ) = 0 para todo d > d(M ). Chamamos d(M ) de dimens
ao de Hausdorff
do espaco metrico M .
A medida de Hausdorff de M na dimensao d(M ) pode tomar qualquer valor.
Em muitos exemplos interessantes, tal como aquele que vamos apresentar a
seguir, ela e positiva e finita. Mas existem muitos outros casos em que ela e zero
ou infinito.
Exemplo 12.4.1. Consideremos o conjunto de Cantor usual K na reta. Isto e,
K=

Kn

n=0

onde K 0 = [0, 1] e todo K n , n 1 e obtido retirando de cada componente


conexa de K n o subintervalo aberto central de comprimento relativo 1/3. Seja
d0 = log 2/ log 3. Vamos mostrar que md0 (M ) = 1. Isso implica d(M ) = d0 .
Para provar a estimativa superior considere, para cada n 0, a cobertura V n
de K cujos elementos sao as intersecoes de K com cada uma das componentes
claro que a sequencia (V n )n e crescente: V n1 V n para
conexas de K n . E
todo n 1. Note que V n tem exatamente 2n elementos, todos com diametro
igual a 3n . Portanto,
X
(12.4.3)
(diam V )d0 = 2n 3nd0 = 1
V V n

para todo n. Como diam V n 0 quando n , segue que md0 (M ) 1.


A estimativa inferior para a medida e a dimensao de Hausdorff e um pouco
mais difcil, porque e necessario lidar com coberturas arbitrarias. Vamos mostrar
que, dada qualquer cobertura U de M ,
X
(12.4.4)
(diam U )d0 1.
UU

Chamamos intervalo aberto de K a qualquer intersecao de K com um inter claro que todo subconjunto de K est
valo aberto da reta. E
a contido num
intervalo aberto com diametro t
ao proximo quanto se queira. Logo, sempre
podemos
formar coberturas U cujos elementos
sao intervalos abertos e tais que
P
P
d0
est
a t
ao perto de UU (diam U )d0 quanto se queira. Logo,
U U (diam U )
n
ao e restricao supor que os elementos de U sao intervalos abertos. Ent
ao, pela
compacidade de K, tambem n
ao e restricao supor que U e finita. Considere
qualquer U U. Como U e aberto e diam V n 0, existe m 1 tal que para
todo n m todo elemento de V n que intersecta U est
a contido em U . Alem


CAPITULO 12. FORMALISMO TERMODINAMICO

414

disso, como U e finita, podemos fixar o mesmo m para todos os seus elementos.
Afirmamos que
X
X
(diam U )d0
(12.4.5)
(diam V )d0 .
V V m

UU

A estrategia da prova e modificar a cobertura U sucessivamente de tal forma que


em cada passo a expressao no lado esquerdo de (12.4.5) n
ao aumenta e apos um
n
umero finito de passos se obtem a cobertura V m . Para cada U U, considere
k 0 mnimo tal que U intersecta um u
nico elemento V de V k . A escolha
de m implica que k m: para k > m, se U intersecta um elemento de V k
ent
ao ele contem todos os elementos de V k dentro do mesmo elemento de V m .
Suponha que k < m. Pela escolha de k, o conjunto U intersecta exatamente
dois elementos V1 e V2 de V k+1 . Sejam U1 e U2 as intersecoes. Ent
ao,
diam Ui diam Vi = 3n1

diam U = diam U1 + 1/3 + diam U2 .

Logo (Exerccio 12.4.1),


(diam U )d0 (diam U1 )d0 + (diam U2 )d0
Isto quer dizer que o valor do lado esquerdo de (12.4.5) n
ao aumenta quando
substitumos U por U1 e U2 na cobertura U. Por um lado, a nova cobertura
satisfaz as mesmas condicoes que a original: U1 e U2 sao intervalos abertos
(porque V1 , V2 e U sao intervalos abertos) e eles contem todo elemento de V m que
eles intersectam. Por outro lado, por construcao, cada um deles intersecta um
u
nico elemento de V k+1 . Portanto, ao cabo de um n
umero finito de repeticoes
deste procedimento reduzimos a situacao inicial ao caso em que k = m para
todo U U. Ora, a escolha de m implica que nesse caso cada U U contem o
respectivo V V m . Alias, como U n
ao intersecta nenhum outro elemento de V m ,
segue que U = V . Em particular, quaisquer elementos de U que correspondam
a um mesmo V V m devem coincidir. Eliminando tais repeticoes obtemos a
cobertura V m . Isto completa a prova da afirmacao (12.4.5) a qual, juntamente
com (12.4.3), implica (12.4.4).

12.4.2

Repulsores conformes

Sejam D, D1 , . . . , DN compactos convexos num espaco euclideano R tais que


Di D para todo i e Di Dj = sempre que i 6= j. Denote D = D1 DN
e suponha que
vol(D \ D ) > 0
(12.4.6)

onde vol denota a medida de volume em R . Suponha tambem que existe uma
aplicacao f : D D tal que a restricao a cada Di e um homeomorfismo sobre
D. Veja a Figura 12.2. Note que que a sequencia das pre-imagens f n (D) e
n
ao crescente. Chamamos repulsor de f `a sua intersecao:
=

n=0

f n (D).

(12.4.7)

DE REPULSORES CONFORMES
12.4. DIMENSAO

415

Em outras palavras, e o conjunto dos pontos x cujos iterados f n (x) est


ao
claro que e compacto e que f 1 () = .
definidos para todo n 1. E
D

hj
Dj
f

Di
hi

Figura 12.2: Repulsor


Exemplo 12.4.2. O conjunto de Cantor K no Exemplo 12.4.1 e o repulsor da
transformacao f : [0, 1/3] [2/3, 1] [0, 1] dada por f (x) = 3x se x [0, 1/3] e
f (x) = 3x 2 se x [2/3, 1]. Uma classe mais geral de exemplos em dimensao
1 foi introduzida no Exemplo 11.2.3.
No que segue suporemos que a aplicacao f : D D e de classe C 1 ; para
pontos no bordo do domnio isto quer dizer que f se estende a uma aplicacao
C 1 numa vizinhanca. Tambem fazemos as seguintes hipoteses adicionais.
A primeira hip
otese e que a aplicacao f e expansora: existe > 1 tal que
kDf (x)vk

para todo x D e todo v R .

(12.4.8)

N
ao e difcil deduzir que a restricao f : da aplicacao ao repulsor e uma
transformacao expansora no sentido da Secao 11.2.
A segunda hip
otese e que o logaritmo do jacobiano de f e H
older: existem
C > 0 e > 0 tais que
log

| det Df (x)|
Ckx yk
| det Df (y)|

para todo x, y D .

(12.4.9)

A menos de escolher C suficientemente grande, a desigualdade e automaticamente satisfeita quando x e y pertencem a subdomnios Di e Dj distintos, uma
vez que d(Di , Dj ) > 0.
A terceira e u
ltima hip
otese e que a aplicacao f e conforme:
kDf (x)k kDf (x)1 k = 1

para todo x D .

(12.4.10)

importante notar que esta condicao e autom


E
atica quando = 1. Quando
= 2 ela vale se, e somente se, a transformacao f e analtica.
Todas estas condicoes sao satisfeitas no caso do conjunto de Cantor (lembre
os Exemplos 12.4.1 e 12.4.2). Elas tambem sao satisfeitas no Exemplo 11.2.3,
desde que suponhamos que a derivada da respectiva aplicacao f e H
older.


CAPITULO 12. FORMALISMO TERMODINAMICO

416

Teorema 12.4.3 (F
ormula de Bowen-Manning). Suponha que f : D D
satisfaz as condic
oes (12.4.8), (12.4.9) e (12.4.10). Ent
ao a dimens
ao de Hausdorff do repulsor e dada por
d() = d0 ,
onde d0 (0, 1) e o u
nico n
umero tal que P (f, d0 log | det Df |) = 0.
Alertamos o leitor para um pequeno abuso de linguagem que cometeremos
ao longo desta sec
ao, para n
ao sobrecarregar demasiado as notacoes: P (f, )
sempre representar
a a press
ao de um potencial : R relativamente `
a
restric
ao f : ao repulsor, embora em outros pontos dos argumentos
consideremos a aplicacao f definida em todo o domnio D .
Antes de passarmos `a demonstracao do teorema, mencionemos o seguinte
caso particular interessante:
Exemplo 12.4.4. Seja f : J [0, 1] uma aplicacao como no Exemplo 11.2.3 e
suponha que a restricao de f a cada componente conexa Ji de J e afim: o valor
absoluto da derivada e constante, igual ao inverso do comprimento |Ji |. Ent
ao
a dimensao de Hausdorff do repulsor K da aplicacao f coincide com o u
nico
n
umero tal que
X
|Ji | = 1.
(12.4.11)
i

Para obter esta conclusao a partir do Teorema 12.4.3 basta observar que
X
P (f, t log |f |) = log
|Ji |t para todo t.
(12.4.12)
i

Deixamos ao cuidado do leitor verificar esta igualdade (Exerccio 12.4.6).

12.4.3

Distorc
ao e conformalidade

Chamamos ramo inverso de f `a inversa hi : D Di da restricao de f a cada um


dos domnios Di . Mais geralmente, chamamos ramo inverso de f n a qualquer
composicao
(12.4.13)
hn = hi0 hin1
com i0 , . . . , in1 {1, . . . , N }. Para cada n 1, denotamos por I n a famlia
dos ramos inversos hn de f n . Por construcao, as imagens hn (D), hn I n sao
disjuntas dois-a-dois e a sua uniao contem .
O principal objetivo desta secao e provar a seguinte estimativa geometrica,
que est
a base da demonstracao do Teorema 12.4.3:
Proposi
c
ao 12.4.5. Existe C0 > 1 tal que para todo n 1, todo hn I n , todo
n
E h (D) e todo x hn (D), tem-se:
1
[diam f n (E)] [diam E] | det Df n (x)| C0 [diam f n (E)] .
C0

(12.4.14)

DE REPULSORES CONFORMES
12.4. DIMENSAO

417

Iniciando a demonstracao desta proposicao, observe que as nossas hipoteses


implicam que todo ramo inverso hi de f e um difeomorfismo com kDhi k 1 .
Ent
ao, como D e convexo, podemos usar o teorema da media para concluir que
khi (z) hi (w)k 1 kz wk

para todo z, w D.

(12.4.15)

Para cada ramo inverso hn como em (12.4.13), consideraremos a sequencia de


ramos inversos
hnk = hik hin1 ,

k = 0, . . . , n 1.

(12.4.16)

Note que hnk (D) Dik para cada k. Segue de (12.4.15) que cada hnk e uma
kn -contracao. Em particular,
diam hnk (D) kn diam D

para todo k = 0, . . . , n 1.

(12.4.17)

No proximo resultado consideraremos as envolventes convexas dos conjuntos


hnk (D). Lembre que a envolvente convexa de um subconjunto de R e a uniao
claro que a
de todos os segmentos de reta cujos extremos est
ao no conjunto. E
envolvente convexa tem o mesmo diametro que o proprio conjunto. Como Di
e convexo para todo i, a envolvente convexa de cada hnk (D) est
a contida em
Dik . Em particular, a derivada Df est
a definida em todo ponto da envolvente
convexa.
Lema 12.4.6. Existe C1 > 1 tal que, para todo n 1 e todo ramo inverso hn
de f n , vale
n1
Y | det Df (zk )|
C1
log
| det Df (wk )|
k=0

para quaisquer zk , wk na envolvente convexa de hnk (D) para k = 0, . . . , n 1.

Demonstrac
ao. A condicao (12.4.9) d
a que
log

| det Df (zk )|
Ckzk wk k C[diam hnk (D)]
| det Df (wk )|

para cada k = 0, . . . , n 1. Ent


ao, usando (12.4.17),
log

n1
Y
k=0

n1
n1
X
X
| det Df (zk )|
nk

C[diam h
(D)] C[diam D]
(kn)
| det Df (wk )|
k=0

Portanto, basta tomar C1 = C[diam D]

k=0

j=1

j .

Chegou a hora de explorarmos a hipotese de conformalidade (12.4.10). Dado


qualquer isomorfismo linear L : R R, e imediato que | det L| kLk e
analogamente para a inversa. Portanto,

1 = | det L| | det L1 | kLk kL1k .


CAPITULO 12. FORMALISMO TERMODINAMICO

418

Logo, kLk kL1k = 1 implica que | det L| = kLk e analogamente para a inversa.
Portanto, (12.4.10) implica que
| det Df (y)| = kDf (y)k

para todo y D .

(12.4.18)

Agora estamos prontos para demonstrar a Proposicao 12.4.5:


Demonstrac
ao da Proposic
ao 12.4.5. Sejam n, hn , E e x como no enunciado.
Seja w um ponto de maximo para a norma de Dhn no domnio D. Ent
ao, pelo
teorema da media,
kx1 x2 k kDhn (w)k kf n (x1 ) f n (x2 )k
n

(12.4.19)
n

para quaisquer x1 , x2 em E. Note que Dh (w) e a inversa de Df (z), onde


z = hn (w). Logo, por conformalidade, kDhn (w)k = kDf n (z)k1 . Alem disso,
usando o Lema 12.4.6 e a igualdade (12.4.18),
| det Df n (x)| C1 | det Df n (z)| = C1 kDf n (z)k .

(12.4.20)

Combinando (12.4.19) and (12.4.20), obtemos


kx1 x2 k C1 | det Df n (x)|1 kf n (x1 ) f n (x2 )k .
Fazendo variar x1 , x2 E, vem que

[diam E] C1 | det Df n (x)|1 [diam f n (E)] .

Isto prova a segunda desigualdade em (12.4.14), desde que tomemos C0 C1 .


A prova da outra desigualdade e semelhante. Para cada k = 0, . . . , n 1,
seja zk um ponto de maximo para a norma de Df restrita `a envolvente convexa
de hnk (D). Ent
ao,
kf k+1 (x1 ) f k+1 (x2 )k kDf (zk )kkf k (x1 ) f k (x2 )k

= | det Df (zk )|1/ kf k (x1 ) f k (x2 )k

para todo k e quaisquer x1 , x2 E. Logo,


kf n (x1 ) f n (x2 )k
Pelo Lema 12.4.6,
n1
Y
k=0

n1
Y
k=0

| det Df (zk )| kx1 x2 k .

| det Df (zk )| C1 | det Df n (x)|.

(12.4.21)

(12.4.22)

Combinando (12.4.21) e (12.4.22), obtemo


ky1 y2 k C1 | det Df n (x)| kx1 x2 k .
Fazendo variar y1 , y2 , conclumos que
[diam f n (E)] C1 | det Df n (x)|[diam E] .
Isto prova a primeira desigualdade em (12.4.14), para qualquer C0 C1 .

DE REPULSORES CONFORMES
12.4. DIMENSAO

12.4.4

419

Exist
encia e unicidade de d0

Nesta secao provamos a existencia e unicidade do n


umero d0 no enunciado do
Teorema 12.4.3. Denote = log | det Df | e considere a funcao
: R R,

(t) = P (f, t).

Queremos mostrar que existe um u


nico d0 tal que (d0 ) = 0.
A unicidade e f
acil de obter. De fato, as hipoteses (12.4.8) e (12.4.10) implicam que
= log | det Df 1 f | = log kDf 1 f k log
Ent
ao, dados quaisquer s < t, tem-se t s (t s) log . Usando (10.3.5)
e (10.3.6), segue que
P (f, t) P (f, s) (t s) log < P (f, s).
Isto prova que e estritamente decrescente e, portanto, existe um u
nico d0 R
tal que (d0 ) = 0.
Por outro lado, segue da Proposicao 10.3.10 que e contnua. Logo, para
provar a existencia de d0 basta mostrar que (0) < 0 < (1). Isso pode ser
feito do seguinte modo.
Seja L a cobertura aberta de cujos elementos sao as imagens h() pelos
ramos inversos de f . Para cada n 1, a cobertura Ln est
a formada pelas
imagens hn () do repulsor pelos ramos inversos de f n . Segue de (12.4.17)
que diam Ln n diam D para todo n e, portanto, diam Ln 0. Ent
ao a
Proposicao 10.3.5 d
a que
P (f, ) = P (f, , L)

para todo potencial .

(12.4.23)

Em particular, (0) = P (f, 0, L) = h(f, L). Note que cada Ln e uma cobertura
minimal de , isto e, nenhuma subfamlia propria cobre . Portanto, H(Ln ) =
log #Ln = n log N e, consequentemente, h(f, L) = log N . Isto prova que (0)
e positivo.

Proposi
c
ao 12.4.7. (1) = limn n1 log vol f n (D) < 0.

Demonstrac
ao. Por (12.4.23), temos que (1) = P (f, , L). Em outras palavras
X
n
1
1
(1) = lim log Pn (f, , L) = lim log
eSn (h ()) .
n n
n n
n
n
h I

Como = log | det Df |, isto quer dizer que


X
1
1
.
sup
(1) = lim log
n n
| det Df n |
n
n
n h (D)

(12.4.24)

h I

Por outro lado, pela f


ormula de mudanca de variaveis em integrais m
ultiplas,
Z
X
X

1
hn .
vol f n (D) =
vol(hn (D)) =
n|
|
det
Df
D
n
n
n
n
h I

h I


CAPITULO 12. FORMALISMO TERMODINAMICO

420

Segue do Lema 12.4.6 que


inf | det Df n | | det Df n |(hn (z)) C1 ninf | det Df n |

hn (D)

h (D)

para todo z hn (D) e todo hn I n . Consequentemente,


X


1
C1 vol f n (D) .
vol f n (D)
sup
n
| det Df |
n
n
n h (D)
h I

Combinando estas desigualdades com (12.4.24), conclumos que


lim sup
n



1
1
log vol f n (D) (1) lim inf log vol f n (D) .
n
n
n

Isto prova a igualdade no enunciado da proposicao.


Resta provar que o volume das pre-imagens f n (D) decai exponencialmente.
Par isso, observe que f (n+1) (D) = f n (D ) e a uniao disjunta das imagens
hn (D ), com hn I n . Portanto,



P
n
vol hn (D)
vol f (n+1) (D)
n
n vol h (D )
 = Ph I
 . (12.4.25)
 max
n
hn I n vol hn (D)
vol f (n+1) (D)
hn I n vol h (D)
Pela f
ormula de mudanca de variavel,
Z
Z
1
1
n
n
n
h
e vol h (D \D )) =
hn .
vol h (D)) =
n|
|
det
Df
|
det
Df n |
D\D
D

Logo, usando o Lema 12.4.6,




vol hn (D \ D )
1 vol D



C1 vol D
vol hn (D)

(12.4.26)

para todo hn I n . Pela hipotese (12.4.6), a expressao no lado direito de


(12.4.26) e positiva. Fixe > 0 suficientemente proximo de zero para que
1 e seja menor que essa expressao. Ent
ao temos

vol hn (D) \ hn (D )

1 e
vol hn (D)

para todo hn I n . Combinando esta desigualdade com (12.4.25), obtemos que



vol f (n+1) (D)
 e para todo n 0
vol f (n+1) (D)
(o caso n = 0 segue diretamente da hipotese (12.4.6)). Logo,
lim
n


1
log vol f n (D) < 0.
n

Isto conclui a prova da proposicao.

A Figura 12.3 resume as conclusoes desta secao. Lembre que a funcao definida por (t) = P (f, t log | det Df |) e convexa, pela Proposicao 10.3.9.

DE REPULSORES CONFORMES
12.4. DIMENSAO

421

t 7 (t)
h(f )
d0

Figura 12.3: Pressao e dimensao de Hausdorff

12.4.5

Cota superior

Vamos mostrar que d() b para todo b tal que P (f, b) < 0. Em vista das
observacoes na secao precedente, isto prova que d() d0 .
Seja L a cobertura aberta de cujos elementos sao as imagens h() pelos
ramos inversos de f . Para cada n 1, a cobertura Ln est
a formada pelas
imagens hn () do repulsor pelos ramos inversos de f n . Segue de (12.4.17)
que diam Ln n diam D para todo n e, portanto, diam Ln 0. Pela Proposicao 10.3.5, segue que P (f, ) = P (f, , L) para todo potencial . Em
particular,
P (f, b, L) = P (f, b) <
para algum > 0. Pela definicao (10.3.3), isto implica que
Pn (f, b, L) en

para todo n suficientemente grande.

(12.4.27)

Claro que Ln e cobertura minimal de : nenhuma subfamlia propria cobre .


Logo, lembrando a definicao (10.3.2), a desigualdade (12.4.27) implica que
X
ebSn (L) en para todo n suficientemente grande.
(12.4.28)
LLn

claro que todo L Ln e compacto. Logo, por continuidade do jacobiano,


E
eSn (L) = sup | det Df n |1 = | det Df n (x)|1
L

para algum x L. Tambem e claro que f n (L) = para todo L Ln . Ent


ao,
tomando E = L na Proposicao 12.4.5, obtemos
[diam L] eSn (L) C0 [diam ] .
Combinando esta desigualdade com (12.4.28), obtemos que
X
X
[diam L]b C0b [diam ]b
ebSn (L) C0b [diam ]b en
LLn

LLn


CAPITULO 12. FORMALISMO TERMODINAMICO

422

para todo n suficientemente grande. Como a expressao do lado direito converge


para zero, e o diametro das coberturas Ln tambem converge para zero, segue
que mb (M ) = 0. Portanto, d(M ) b.

12.4.6

Cota inferior

Agora vamos mostrar que d() a para todo a tal que P (f, a) > 0. Isso
implica que d() d0 , o que completa a demonstracao do Teorema 12.4.3.
Como observamos na secao anterior, a cobertura L realiza a press
ao e todos
os seus iterados Ln sao coberturas minimais de . Logo, a escolha de a implica
que existe > 0 tal que
X
Pn (f, a, ) =
eaSn (L) en para todo n suficientemente grande.
LLn

(12.4.29)
Fixe n nessas condicoes. Seja > 0 um minorante para a distancia entre dois
elementos quaisquer de Ln : tal minorante existe porque os elementos de Ln
sao compactos e disjuntos dois-a-dois. Fixe (0, a ). A raz
ao de ser desta
escolha ficara clara num instante. Afirmamos que
X
[diam U ]al 2al
(12.4.30)
UU

para toda cobertura U de . Por definicao, isto implica que ma () 2al > 0
e, consequentemente, d() a. Portanto, para terminar a prova do Teorema 12.4.3 basta provar esta afirmacao.
Suponhamos que existe alguma cobertura de que n
ao satisfaz (12.4.30).
Ent
ao, usando o Exerccio 12.4.3, existe alguma cobertura aberta U de com
X
[diam U ]al < < al .
(12.4.31)
UU

Por compacidade, podemos supor que esta cobertura U aberta e finita. A relacao
(12.4.31) que todo U U tem diametro menor que . Logo, cada U U
intersecta no maximo um L Ln . Como Ln cobre e U e subconjunto n
ao
vazio de , tambem temos que U intersecta algum L Ln . Isto quer dizer que
U e a uni
ao disjunta das famlias
UL = {U U : U L 6= },

L Ln .

Se U UL ent
ao U L. Consideremos as famlias f n (UL ) = {f n (U ) : U UL }.
Observe que cada uma delas e uma cobertura de . Alem disso, usando a
Proposicao 12.4.5,
X
X
X
[diam V ]a =
[diam f n (U )]a C0 eaSn (L)
[diam U ]a .
V f n (UL )

UUL

UUL

(12.4.32)

DE REPULSORES CONFORMES
12.4. DIMENSAO
Portanto,
X
X X
X
[diam U ]a =
[diam U ]a
C01 eaSn (L)
LLn UUL

UU

Suponhamos que
X

V f n (UL )

[diam V ]a

LLn

[diam U ]a

UU

423

[diam V ]a .

V f n (UL )

para todo L Ln .

Ent
ao a desigualdade anterior implica
X
X
X
X
[diam U ]a
C01 eaSn (L)
[diam U ]a C01 en
[diam U ]a .
UU

LLn

UU

UU

Isto e uma contradicao, uma vez que e > C0 . Logo, existe algum L Ln tal
que
X
X
[diam V ]a
[diam U ]a < .
V f n (UL )

UU

Portanto, podemos repetir o procedimento anterior com f n (UL ) no lugar de


U. Observe, no entanto, que #f n (UL ) = #UL e estritamente menor que #U.
Portanto, este processo precisa parar apos um n
umero finito de etapas. Esta
contradicao prova a afirmacao 12.4.30.
A demonstracao do Teorema 12.4.3 est
a completa. No entanto, e possvel
provar um resultado mais forte: nas condicoes do teorema, a medida de Hausdorff de na dimensao d(M ) e positiva e finita. Deixamos este enunciado como
um desafio especial (Exerccio 12.4.7) para o leitor que nos acompanhou ate o
final deste livro!

12.4.7

Exerccios

12.4.1. Seja d = log 2/ log 3. Mostre que (x1 + 1 + x2 )d xd1 + xd2 para todo
x1 , x2 [0, 1]. Alem disso, vale a igualdade se, e somente se, x1 = x2 = 1.
12.4.2. Seja f : M N uma aplicacao Lipschitz, com constante de Lischitz
L. Mostre que
md (f (A)) Ld md (A).

para qualquer d (0, ) e qualquer A M . Use esse fato para mostrar que
A Rn e t R, ent
ao md (tA) = td md (A), onde tA = {tx : x A}.

12.4.3. Represente por mad (M ) e mfd (M ) os n


umeros definidos do mesmo modo
que a medida de Hausdorff md (M ) mas considerando apenas coberturas por
subconjuntos abertos e por subconjuntos fechados, respectivamente. Mostre
que md (M ) = mad (M ) e mfd (M ) = md (M ).

12.4.4. (Princpio da distribuicao de massa) Seja uma medida finita em um


espaco metrico compacto M e suponha que existem n
umeros d, K, > 0 tais
que (B) K(diam U )d para todo conjunto com diametro menor que . Mostre
que se A M e tal que (A) > 0 ent
ao md (A) > 0 e, portanto, d(A) d.

424

CAPITULO 12. FORMALISMO TERMODINAMICO

12.4.5. Use o princpio da distribuicao de massa para mostrar que a dimensao


de Hausdorff do tri
angulo de Sierpisnki (Figura 12.4) e igual a d0 = log 3/ log 2
e que a medida de Hausdorff em dimensao d0 e positiva e finita.

Figura 12.4: Tri


angulo de Sierpinski

12.4.6. Verifique a f
ormula (12.4.12) para a press
ao.
12.4.7. Adaptando argumentos do Exerccio 12.4.5, mostre que nas condicoes
do Teorema 12.4.3 vale que 0 < md() () < .

Ap
endice A

Elementos de Medida,
Topologia e An
alise
Nesta serie de apendices vamos recordar algumas nocoes e resultados b
asicos da
Teoria da Medida, da Topologia e da Analise Funcional que serao u
teis ao longo
de todo o livro. Nossa intencao e proporcionar ao leitor uma fonte de referencia
rapida sobre medida e integracao, topologia geral e diferencial e teoria espectral,
para uma leitura autocontida do livro.
De modo geral, omitiremos as demonstracoes dos resultados apresentados.
No que se refere aos Apendices A.1, A.2 e A.5, o leitor poder
a consultar os
livros de Castro [Cas04], Fernandez [Fer02], Halmos [Hal50], Royden [Roy63] ou
Rudin [Rud87]. A apresentacao no Apendice A.3 sera mais completa, incluindo
as demonstracoes da maioria dos resultados, mas o leitor podera encontrar informacao adicional relevante nos livros de Billingsley [Bil68, Bil71]. Ao leitor
interessado em aprofundar os temas do Apendice A.4 recomendamos os livros
de Hirsch [Hir94] e do Carmo [dC79]. Para informacoes mais detalhadas sobre o
material dos Apendices A.6 e A.7, incluindo demonstracoes, consulte o o livro de
Halmos [Hal51] e o tratado de Dunford, Schwarz [DS57, DS63], particularmente,
a Secao IV.4 do primeiro volume e as secoes iniciais do segundo volume.

A.1

Espa
cos de medida

Os espacos de medida constituem o ambiente natural para a definicao da integral


de Lebesgue, que sera o tema principal da proxima secao. Aqui apresentaremos,
de modo sucinto, os fundamentos da teoria desses espacos.
Comecaremos por introduzir e estudar as nocoes de
algebra e -
algebra de
conjuntos, as quais conduzem ao conceito de espaco mensuravel. A seguir, apresentaremos o conceito de medida e analisaremos algumas de suas propriedades.
Em particular, mencionaremos alguns resultados sobre construcao de medidas,
incluindo as medidas de Lebesgue em espacos euclideanos. A u
ltima subsecao
425

426 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
e dedicada `
as aplicacoes mensuraveis, ou seja, as aplicacoes entre espacos mensur
aveis preservando a estrutura desses espacos.

A.1.1

Espacos mensur
aveis

Dado um subconjunto A X denotaremos por Ac o complementar X \ A do


conjunto A em relacao a X.
Defini
c
ao A.1.1. Uma
algebra de X e uma famlia B de subconjuntos de X
que e fechada para as operacoes elementares de conjuntos e contem o conjunto
vazio, isto e, tal que
B
A B implica Ac B
A B e B B implica A B B.
Observe que A B = (Ac B c )c e A \ B = A B c tambem est
ao em B,
quaisquer que sejam A, B B. Alem disso, por associatividade, a uniao e a
intersecao de qualquer n
umero finito de elementos de B tambem est
ao em B.
Defini
c
ao A.1.2. Uma algebra diz-se uma -
algebra de subconjuntos de X se
tambem for fechada para as unioes enumeraveis:
Aj B para j = 1, . . . , n, . . . implica

j=1

Aj B.

Observe que uma -algebra B tambem e fechada para as interse


 coes enu
c c
tambem
meraveis: se Aj B para j = 1, . . . , n, . . . ent
ao
A
=

A
j
j=1
j=1 j
est
a em B.
Defini
c
ao A.1.3. Um espaco mensur
avel e uma dupla (X, B) onde X e um
conjunto e B e uma -algebra de subconjuntos de X. Os elementos de B sao
chamados conjuntos mensur
aveis do espaco.
Em seguida apresentaremos algumas construcoes de -algebras.
Exemplo A.1.4. Seja X um conjunto qualquer.
1. Denotemos por 2X a famlia de todos os subconjuntos de X. Ent
ao B = 2X
e claramente uma -algebra.
2. B = {, X} e tambem uma -algebra.
Note que se B e uma
algebra de X ent
ao {, X} B 2X . Portanto {, X} e
X
a menor e 2 e a maior de todas as algebras de subconjuntos de X.
No enunciado a seguir, I e um conjunto qualquer; ele serve apenas para
indexar os elementos da famlia.

427

A.1. ESPAC
OS DE MEDIDA

Proposi
c
ao A.1.5. Considere uma famlia n
ao vazia qualquer {Bi : i I} de
-
algebras. Ent
ao a intersec
ao B = iI Bi e tambem uma -
algebra.
Agora, dado um conjunto qualquer E de subconjuntos de X, podemos aplicar
a Proposicao A.1.5 `
a famlia de todas as -algebras que contem E. Note que esta
famlia e n
ao vazia, uma vez que contem a -algebra 2X , pelo menos. De acordo
com a observacao anterior, a intersecao de todas estas -algebras e tambem uma
-algebra, e e claro que contem E. Alem disso, do modo como e construda, ela
est
a contida em todas as -algebras que contem E. Portanto e a menor -algebra
que contem E. Isto conduz `
a seguinte definicao:
Defini
c
ao A.1.6. A -
algebra gerada por uma famlia E de subconjuntos de
X e a menor -algebra (E) que contem a famlia E, ou seja, e a intersecao de
todas as -algebras que contem E.
Lembremos que um espaco topol
ogico e uma dupla (X, ) em que X e um
conjunto e e uma famlia de subconjuntos de X, contendo {, X} e fechada por
intersecoes finitas e por uni
oes quaisquer. Essa famlia e chamada topologia
e os seus elementos sao chamados abertos de X. Neste livro consideraremos
apenas espacos topol
ogicos de Hausdorff, ou seja, tais que, para qualquer par de
pontos distintos existe algum par de abertos disjuntos, cada um deles contendo
exatamente um dos pontos.
No contexto dos espacos topol
ogicos e natural considerar a construcao que
acabamos de descrever tomando E = . Isto nos conduz `a seguinte nocao:
Defini
c
ao A.1.7. A -
algebra de Borel (ou -
algebra boreliana) de um espaco
topol
ogico e a -algebra ( ) gerada pela topologia , isto e, a menor -algebra
que contem todos os subconjuntos abertos. Neste caso, os conjuntos mensuraveis
recebem o nome de borelianos.
Observe que os subconjuntos fechados de X, ou seja, os complementares dos
subconjuntos abertos, tambem pertencem `a -algebra de Borel.
Exemplo A.1.8. Seja (X, B) um espaco mensuravel. O limite superior de
uma sequencia de conjuntos En B e o conjunto lim supn En formado pelos
pontos x X tais que x En para infinitos valores de n. Analogamente, o
limite inferior da sequencia e o conjunto lim inf n En dos pontos x X tais que
x En para todo valor de n suficientemente grande. Em outras palavras,
[ \
\ [
lim inf En =
En e lim sup En =
En
n

n1 mn

n1 mn

Observe que lim inf n En lim supn En e que ambos est


ao em B.
= [, ] e a uniao de R = (, +)
Exemplo A.1.9. A reta estendida R
com os pontos no infinito e +. Este espaco possui uma topologia natural,
facil ver que, munida
gerada pelos intervalos [, b) e (a, +], com a, b R. E
desta topologia, a reta estendida e homeomorfa a um intervalo compacto da reta:
por exemplo, a funcao arctan : R (/2, /2) se estende imediatamente a um

428 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
homeomorfismo (ou seja, uma bijecao contnua cuja inversa tambem e contnua)
e [/2, /2]. Sempre consideramos na reta estendida a -algebra de
entre R
Borel associada a essa topologia.
Claro que a reta R e um subespaco (tanto topologico quanto mensuravel) da
reta estendida. Os borelianos da reta formam uma grande gama de subconjuntos
e poderia ate pensar-se que todo subconjunto de R fosse boreliano. No entanto,
isso n
ao e verdade: um contraexemplo sera construdo no Exerccio A.1.4.

A.1.2

Espacos de medida

Seja (X, B) um espaco mensuravel. As seguintes nocoes tem um papel central


neste livro:
Defini
c
ao A.1.10. Uma medida em (X, B) e uma funcao : B [0, +] tal
que () = 0 e
(

j=1

Aj ) =

X
j=1

(Aj ) para quaisquer Aj B disjuntos dois-a-dois.

Esta u
ltima propriedade e chamada -aditividade. A tripla (X, B, ) e chamada
espaco de medida. Quando vale (X) < dizemos que e uma medida finita
e se (X) = 1 dizemos que e uma probabilidade. Neste u
ltimo caso, (X, B, )
e um espaco de probabilidade.
Exemplo A.1.11. Seja X um conjunto e consideremos a -algebra B = 2X .
Dado qualquer p X, consideremos a funcao p : 2X [0, +] definida por:
(
1 se p A
p (A) =
0 se p
/ A.
Esta medida p e usualmente designada medida de Dirac no ponto p.
Defini
c
ao A.1.12. Dizemos que uma medida e -finita se existe uma sequencia
de subconjuntos A1 , . . . , An , . . . de X tal que (Ai ) < para todo i N e
X=

Ai .

i=1

A segunda propriedade na definicao de medida (Definicao A.1.10) e chamada


-aditividade. Dizemos que uma funcao : B [0, +] e finitamente aditiva
se
N
N
X
[
(Aj )
Aj ) =
(
j=1

j=1

para qualquer famlia finita A1 , . . . , AN B de subconjuntos disjuntos dois-adois. Note que se e -aditiva ent
ao ela tambem e finitamente aditiva e que se
e finitamente aditiva e n
ao e constante igual a + ent
ao () = 0.
A principal ferramenta para construir medidas e o seguinte teorema:

429

A.1. ESPAC
OS DE MEDIDA

Teorema A.1.13 (Extens


ao). Seja A uma
algebra de subconjuntos de X e seja
0 : A [0, +] uma func
ao -aditiva com 0 (X) < . Ent
ao existe uma
u
nica medida definida na -
algebra B gerada por A que e uma extens
ao de
0 , ou seja, tal que (A) = 0 (A) para todo A A.
O Teorema A.1.13 ainda vale para medidas -finitas. Alem disso, existe uma
versao dele para funcoes finitamente aditivas: se 0 e finitamente aditiva ent
ao
ela admite extensao finitamente aditiva `a -algebra B. Porem, neste caso tal
extensao pode n
ao ser u
nica.
Em geral, ao tentarmos mostrar que uma funcao definida numa -algebra
e uma medida, o mais difcil e verificar a -aditividade. O criterio mais usado
para esse efeito e o seguinte:
Teorema A.1.14 (Continuidade no vazio). Seja A uma
algebra de subconjuntos
de X e seja : A [0, +) uma func
ao finitamente aditiva com (X) < .
Ent
ao e -aditiva se, e somente se,

(A.1.1)
lim An = 0
n

para toda sequencia A1 Aj de elementos de A com


j=1 Aj = .

A prova deste teorema e proposta no Exerccio A.1.7. No Exerccio A.1.9


propomos algumas variacoes do enunciado.
Defini
c
ao A.1.15. Dizemos que uma algebra A e compacta se qualquer sequencia decrescente A1 An de elementos n
ao vazios de A tem
intersecao n
ao vazia.
Lembre que um espaco topol
ogico K e compacto se toda cobertura aberta,
ou seja, toda famlia de abertos cuja uniao e todo o K, admite alguma subcobertura finita, ou seja, alguma subfamlia finita cuja uniao ainda e todo o K.
Dizemos que subconjunto K de um espaco topologico X e compacto se a topologia de X restrita a K torna este u
ltimo um espaco topologico compacto. Todo
subconjunto fechado de um espaco compacto e compacto. Na direcao oposta,
se o espaco X e de Hausdorff ent
ao todo subconjunto compacto e fechado. Outro fato importante e que a intersecao n Kn de qualquer sequencia decrescente
K1 Kn de subconjuntos compactos e n
ao vazia.
Exemplo A.1.16. Suponha que X e um espaco topologico de Hausdorff e todo
elemento de A e compacto. Segue imediatamente do que acabamos de dizer que
a algebra A e compaccta.
Segue do Teorema A.1.14 que se A e algebra compacta ent
ao toda funcao
finitamente aditiva : A [0, +) satisfazendo (X) < e -aditiva.
Outro resultado relacionado, que sera u
til para o nosso estudo, e o teorema
das classes mon
otonas, que enunciaremos a seguir.
Defini
c
ao A.1.17. Dizemos que uma famlia n
ao vazia C de subconjuntos de X
e uma classe mon
otona, se C contem X e e fechada para as unioes e intersecoes
enumer
aveis mon
otonas, ou seja:

430 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
dados subconjuntos A1 A2 em C, ent
ao n1 An C e
dados subconjuntos A1 A2 em C, ent
ao n1 An C.
Claramente, as famlias {, X} e 2X sao classes mon
otonas. Alem disso, se
{Ci : i I} e uma famlia qualquer de classes mon
otonas, ent
ao iI Ci e uma
classe mon
otona. Portanto, dado um subconjunto A de 2X , podemos sempre
considerar a menor classe mon
otona que contem A.
Teorema A.1.18 (Classes mon
otonas). A menor classe mon
otona que contem
uma
algebra A coincide com a -
algebra (A) gerada por A.
Outro resultado importante sobre -algebras, que nos sera u
til mais tarde,
afirma que todo elemento B da -algebra gerada por uma algebra e aproximado
por algum elemento A da algebra, no sentido de que a medida da diferenca
simetrica
AB = (A \ B) (B \ A) = (A B) \ (A B)
pode ser t
ao pequena quanto se queira:
Teorema A.1.19 (Aproximacao). Seja (X, B, ) um espaco de probabilidade e
seja A uma
algebra que gera a -
algebra B. Ent
ao para todo > 0 e todo B B
existe A A tal que (AB) < .
Defini
c
ao A.1.20. Um espaco de medida diz-se completo se todo subconjunto
de um conjunto mensuravel com medida nula tambem e mensuravel.
possvel transformar qualquer espaco de medida (X, B, ) num espaco
E
completo, do seguinte modo. A famlia B de todos os conjuntos A X tais
que existem B1 , B2 B com B1 A B2 e (B2 \ B1 ) = 0 e uma -algebra
que contem B. Considere
: B [0, +] dada por
(A) = (B1 ) = (B2 ),
para quaisquer B1 , B2 B nessas condicoes. Esta funcao est
a bem definida e e
cuja restricao a B coincide com . Por construcao, (X, B,

uma medida em B,
)

e um espaco de medida completo. E frequente na literatura (embora seja um


abuso de linguagem) chamar uma funcao em (X, B, ) de mensuravel se ela for

mensuravel para a -algebra completada B.


Dados subconjuntos U1 e U2 da -algebra B, dizemos que U1 U2 a menos
de medida nula se para todo B1 U1 existe B2 U2 tal que (B1 B2 ) = 0.
Dizemos que U1 = U2 a menos de medida nula se U1 U2 a menos de medida
nula e U2 U1 a menos de medida nula. Dizemos que um conjunto U B gera
a -algebra B a menos de medida nula se a -algebra gerada por U e igual a B
a menos de medida nula. Equivalentemente, U gera B a menos de medida nula
se o completamento (no sentido do par
agrafo anterior) da -algebra gerada por
U coincide com o completamento de B.
Por definicao, uma medida toma valores em [0, ]; sempre que for necessario
enfatizar esse fato falaremos de medida positiva. Mas tambem e possvel enfraquecer essa exigencia e, de fato, tais generalizacoes serao u
teis no que segue.
Chamaremos medida com sinal num espaco mensuravel (X, B) a toda funcao
-aditiva : B [, ] tal que () = 0. Mais precisamente, pode tomar

431

A.1. ESPAC
OS DE MEDIDA

o valor ou o valor +, mas n


ao ambos; esta u
ltima restricao e para evitar
a indeterminacao na condicao de aditividade.
Teorema A.1.21 (Decomposicao de Hahn). Se e medida com sinal ent
ao
existem conjuntos mensur
aveis P, N X tais que P N = X e P N = e
(E) 0 para todo E P

(E) 0 para todo E N .

Isto quer dizer que podemos escrever = + onde + e sao as


medidas (positivas) definidas por
+ (E) = (E P )

e (E) = (E N ).

Em particular, a soma || = + + tambem e uma medida; ela e chamada de


variac
ao total da medida com sinal . Se uma funcao e integravel para + e
para , dizemos que ela e integravel para e definimos:
Z
Z
Z
+
d = d d .
Se so toma valores em (, ) ent
ao dizemos que ela e uma medida com
sinal finita. Neste caso as medidas + e sao finitas. O conjunto M(X) das
medidas com sinal finitas e um espaco vetorial real e a funcao kk = ||(X) e
uma norma completa neste espaco (veja o Exerccio A.1.10). Em outras palavras, (M(X), k ||) e um espaco de Banach. Quando X e um espaco metrico
compacto, este espaco de Banach e isomorfo ao dual do espaco C 0 (X) das
funcoes reais contnuas em X (teorema de Riesz-Markov).
Mais geralmente, chamaremos medida complexa num espaco mensuravel
(X, B) a qualquer funcao -aditiva : B C. Observe que () e necessa claro que podemos escrever = + i, onde a parte real
riamente zero. E
e a parte imagin
aria sao medidas com sinal finitas. A variac
ao total de
e a medida finita definida por
X
|(P )|,
||(E) = sup
P P P

onde o supremo e tomado sobre todas as particoes finitas ou enumeraveis do


conjunto mensuravel E em subconjuntos mensuraveis (esta definicao coincide
com aquela que demos acima no caso particular em que e real). A funcao
kk = ||(X) define uma norma no espaco vetorial das medidas complexas em
X, que ainda denotaremos por M(X), e esta norma e completa. Quando X
e um espaco metrico compacto, o espaco de Banach (M(X), k k) e isomorfo
ao dual do espaco C 0 (X) das funcoes complexas contnuas em X (teorema de
Riesz-Markov)

A.1.3

Medida de Lebesgue

A medida de Lebesgue formaliza a nocao de volume de subconjuntos do espaco


euclideano Rd . Ela e definida do seguinte modo.

432 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Consideremos X = [0, 1] e seja A a famlia de todos os subconjuntos da

forma A = I1 IN onde I1 , . . . , IN sao intervalos disjuntos dois-a-dois. E


f
acil ver que A e uma algebra de subconjuntos de X. Alem disso, temos uma
funcao m0 : A [0, 1] definida nesta algebra por

m0 I1 IN = |I1 | + + |IN |,

onde |Ij | representa o comprimento de cada intervalo Ij . Note que m0 (X) = 1.


No Exerccio A.1.8 propomos ao leitor mostrar que m0 e -aditiva.
Note que a -algebra B gerada por A coincide com a -algebra de Borel
de X, j
a que todo conjunto aberto pode ser escrito como uniao enumeravel de
intervalos abertos disjuntos dois-a-dois. Ent
ao, pelo Teorema A.1.13, existe uma
u
nica probabilidade m definida em B que e uma extensao de m0 . Chamamos m
de medida de Lebesgue em [0, 1].
Mais geralmente, definimos medida de Lebesgue m no cubo X = [0, 1]d
de qualquer dimensao d 1 da seguinte maneira. Primeiramente, chamamos
ret
angulo em X qualquer subconjunto da forma R = I1 Id onde os Ij
sao intervalos, e definimos
m0 (R) = |I1 | |Id |.
Em seguida, consideramos a algebra A dos subconjuntos de [0, 1]d da forma
A = R1 RN , onde R1 , . . . , RN sao ret
angulos disjuntos dois-a-dois, e
definimos
m0 (A) = m0 (R1 ) + + m0 (RN )
para todo B nessa
algebra. A -algebra gerada por A coincide com a -algebra
de Borel de X. A medida de Lebesgue em X = [0, 1]d e a extensao de m0 a essa
-algebra.
Para definir a medida de Lebesgue em todo o espaco euclidiano Rd , decompomos esse espaco em cubos de lado unit
ario
[
[
Rd =

[k1 , k1 + 1) [kd , kd + 1).


k1 Z

kd Z

Cada cubo [k1 , k1 +1) [kd , kd +1) pode ser identificado com [0, 1)d por meio
da translacao Tk1 ,...,kd (x) = x (k1 , . . . , kd ) que envia o ponto (k1 , k2 , . . . , kd )
na origem. Isso nos permite definir uma medida mk1 ,k2 ,...,kd em C, dada por

mk1 ,k2 ,...,kd (B) = m0 Tk1 ,...,kd (B)

para todo o conjunto mensuravel B C. Finalmente, dado qualquer conjunto


mensuravel B Rd , definimos
X
X

m(B) =

mk1 ,...,kd B [k1 , k1 + 1) [kd , kd + 1) .


k1 Z

kd Z

Note que m n
ao e uma medida finita, mas e uma medida -finita.

433

A.1. ESPAC
OS DE MEDIDA

Exemplo A.1.22. Lembremos uma construcao alternativa classica da medida


de Lebesgue. Para mais detalhes, veja o Captulo 2 do livro de Royden [Roy63].
Chamamos medida exterior de Lebesgue de um conjunto E R ao n
umero
X
m (E) = inf
m0 (Rk ) :
k


(Rk )k e cobertura enumeravel de E por ret
angulos abertos .

Esta funcao est


a definida para todo E R, mas n
ao e aditiva (embora seja enumeravelmente subaditiva). Dizemos que E e conjunto mensur
avel de Lebesgue
se
m (A) = m (A E) + m (A E c ) para todo A Rd .
Todo ret
angulo R e conjunto mensuravel de Lebesgue e satisfaz m (R) = m0 (R).
A famlia M de todos os conjuntos mensuraveis de Lebesgue e uma -algebra e
a restricao de m a M e uma medida (-aditiva). Pela observacao anterior, M
contem todo conjunto de Borel de Rd . A restricao de m `a -algebra de Borel
B de Rd coincide com a medida de Lebesgue em Rd .
De fato, M e o completamento da -algebra de Borel relativamente `a medida
de Lebesgue. Esta e outras propriedades est
ao contidas no Exerccio A.1.13.
Exemplo A.1.23. Seja : [0, 1] R uma funcao contnua e positiva. Dado
qualquer intervalo I, com extremos 0 a < b 1, defina
(I) =

(x) dx

(integral de Riemann).

Em seguida, estenda a definicao de para a algebra A das unioes finitas


A = I1 Ik de intervalos disjuntos dois-a-dois, por meio da relacao
(A) =

k
X

(Ij ).

j=1

As propriedades b
asicas da integral de Riemann nos dizem que e finitamente
aditiva. Deixamos para o leitor a tarefa de mostrar que a medida e -aditiva
na algebra formada pelas uni
oes finitas de intervalos (veja o Exerccio A.1.7).
Alem disso, () = 0 e ([0, 1]) < ja que e contnua e, portanto limitada.
Com o auxlio do Teorema A.1.13 podemos estender para toda -algebra dos
borelianos de [0, 1].
Observe que a medida que acabamos de construir tem a seguinte propriedade especial: se um conjunto A [0, 1] tem medida de Lebesgue zero ent
ao
(A) = 0. Essa propriedade chama-se continuidade absoluta (com respeito `a
medida de Lebesgue) e sera estudada com mais detalhe na Secao A.2.4.
Vamos agora exibir uma medida que, apesar de ser positiva em qualquer
aberto, n
ao e absolutamente contnua com respeito `a medida de Lebesgue:

434 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Exemplo A.1.24. Considere uma enumeracao {r1 , r2 , . . . } do conjunto Q dos
n
umeros racionais. Defina por:
X 1
.
(A) =
2i
ri A

Observe que a medida de qualquer aberto da reta e positiva, pois necessariamente A contem algum ri . Apesar disso, a medida de Q e
X 1
(Q) =
= 1.
2i
ri Q

Como Q tem medida de Lebesgue nula (por ser um conjunto enumeravel), isto
mostra que n
ao e absolutamente contnua com respeito `a medida de Lebesgue.
Este exemplo nos motiva a introduzir a definicao de suporte de uma medida
em um espaco topol
ogico (X, ). Para isso, precisamos recordar alguns conceitos
b
asicos de Topologia.
Um subconjunto da topologia e chamado base de abertos, ou base da
topologia, se para todo x X e todo aberto U contendo x existe U tal
que x U U . Dizemos que o espaco topologico admite base enumer
avel
de abertos se tal subconjunto pode ser escolhido enumeravel. Um conjunto
V X e uma vizinhanca de um ponto x X se existe algum aberto U tal que
x U V . Reciprocamente, um subconjunto de X e aberto se, e somente se,
ele e vizinhanca de cada um dos seus pontos. Uma famlia de subconjuntos
de X e uma base de vizinhancas de um ponto x X se para toda vizinhanca
V existe algum V tal que x V V . Dizemos que x admite base
enumer
avel de vizinhancas se pode ser escolhida enumeravel. Se o espaco
topol
ogico admite base enumeravel de abertos ent
ao todo x X admite alguma
base enumer
avel de vizinhancas de x, a saber, a famlia dos elementos da base
enumer
avel de abertos que contem x.
Defini
c
ao A.1.25. Seja (X, ) um espaco topologico e seja uma medida na
-algebra de Borel de X. O suporte supp da medida e o conjunto formado
pelos pontos x X tais que (V ) > 0 para qualquer vizinhanca V de x.
Segue imediatamente da definicao que o suporte de uma medida e um conjunto fechado. No Exemplo A.1.24 acima, o suporte da medida e a reta inteira,
apesar de que (Q) = 1.
Proposi
c
ao A.1.26. Sejam X um espaco topol
ogico com base enumer
avel de
abertos e uma medida n
ao nula em X. Ent
ao, o suporte supp e n
ao vazio.
Demonstrac
ao. Se supp e vazio, ent
ao para cada ponto x X podemos encontrar uma vizinhanca aberta Vx tal que (Vx ) = 0. Seja {Aj : j = 1, 2, . . . }
uma base enumer
avel da topologia de X. Ent
ao para cada x podemos escolher
i(x) N tal que x Ai(x) Vx . Logo,
[
[
X=
Vx =
Ai(x)
xX

xX

435

A.1. ESPAC
OS DE MEDIDA
e portanto
(X) =

xX

 X
(Ai ) = 0.
Ai(x)
i=1

Isto e uma contradicao e, portanto, supp n


ao pode ser vazio.

A.1.4

Aplicac
oes mensur
aveis

Aplicacoes mensuraveis tem um papel em Teoria da Medida analogo ao das


aplicacoes contnuas em Topologia: mensurabilidade corresponde `a ideia de que
a aplicacao preserva a famlia dos conjuntos mensuraveis, do mesmo modo que
continuidade significa que a famlia dos subconjuntos abertos e preservada pela
aplicacao.
Defini
c
ao A.1.27. Dados espacos mensuraveis (X, B) e (Y, C), dizemos que
uma aplicacao f : X Y e mensur
avel se f 1 (C) B para todo C C.
Em geral, o conjunto dos C C tais que f 1 (C) B e uma -algebra. Logo,
para provar que f e mensuravel basta mostrar que f 1 (C0 ) B para todo C0
em algum famlia de conjuntos C0 C que gera a -algebra C. Veja tambem o
Exerccio A.1.1.
Exemplo A.1.28. Uma funcao f : X [, ] e mensuravel se, e somente
se, f 1 ((c, +]) pertence a B para todo c R. Isto segue da observacao
anterior, uma vez que os intervalos (c, +] geram a -algebra de Borel da reta
estendida (lembre do Exemplo A.1.9). Em particular, se a funcao f toma valores
em (, +) ent
ao ela e mensuravel se, e somente se, f 1 ((c, +)) pertence
a B para todo c R.
Exemplo A.1.29. Se X e um espaco topologico e B e a sua -algebra de Borel,
ent
ao toda funcao contnua f : X R e mensuravel. De fato, continuidade significa que a pre-imagem de qualquer aberto de R e um aberto de X e, portanto,
est
a em B. Como os abertos geram a -algebra de Borel de R, segue que a
pre-imagem de qualquer boreliano da reta tambem est
a em B.
Exemplo A.1.30. Dado um conjunto B X definimos a func
ao caracterstica
XB : X R de B por:

1, se x B;
XB (x) =
0, caso contrario.
Observe que a funcao XB e mensuravel se, e somente se, B e um subconjunto
mensuravel: de fato, XB1 (A) {, B, X \ B, X} para qualquer A R.
Entre as propriedades b
asicas das funcoes mensuraveis temos:
Proposi
c
ao A.1.31. Sejam f, g : X [, +] func
oes mensur
aveis e sejam a, b R. Ent
ao tambem s
ao mensur
aveis as seguintes func
oes:
(af + bg)(x) = af (x) + bg(x)

(f g)(x) = f (x) g(x).

436 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Alem disso, se fn : X [, +] e uma sequencia de func
oes mensur
aveis,
tambem s
ao mensur
aveis as seguintes func
oes:
s(x) = sup{fn (x) : n 1}

i(x) = inf{fn (x) : n 1},

f (x) = lim sup fn (x)

f (x) = lim inf fn (x).

Em particular, se f (x) = lim f (x) existe ent


ao f e mensur
avel.
As combinacoes lineares de funcoes caractersticas formam uma classe importante de funcoes mensuraveis:
Defini
c
ao A.1.32. Dizemos que uma funcao s : X R e simples se existem
constantes 1 , . . . , k R e conjuntos mensuraveis A1 , . . . , Ak B disjuntos
dois-a-dois tais que
k
X
k XAk ,
(A.1.2)
s=
j=1

onde XA e a funcao caracterstica do conjunto A.

Note que toda funcao simples e mensuravel. Na direcao recproca, o proximo


resultado afirma que toda funcao mensuravel e limite de alguma sequencia de
funcoes simples. Este fato sera muito u
til na proxima secao, quando definirmos
a integral de Lebesgue.
Proposi
c
ao A.1.33. Seja f : X [, +] uma func
ao mensur
avel. Ent
ao
existe uma sequencia (sn )n de func
oes simples tal que |sn (x)| |f (x)| para todo
ne
lim sn (x) = f (x) para todo x X.
n

Se f toma valores em R, podemos tomar sn com valores em R. Se f e limitada,


a sequencia pode ser escolhida tal que a convergencia seja uniforme. Se f e n
ao
negativa, podemos tomar 0 s1 s2 f .
A demonstracao desta proposicao est
a proposta ao leitor no Exerccio A.1.16.

A.1.5

Exerccios

A.1.1. Seja X um conjunto e (Y, C) um espaco mensuravel. Mostre que, dada


qualquer transformacao f : X Y , existe alguma -algebra B em X tal que a
transformacao e mensuravel relativamente `as -algebras B e C.
A.1.2. Seja X um conjunto e considere a famlia de subconjuntos
B0 = {A X : A e finito ou Ac e finito}.
Mostre que B0 e uma algebra e que B0 e uma -algebra se, e somente se, o
conjunto X e finito. Mostre tambem que, em geral,
B1 = {A X : A e finito ou enumeravel ou Ac e finito ou enumeravel}
e a -algebra gerada pela algebra B0 .

437

A.1. ESPAC
OS DE MEDIDA
A.1.3. Prove a Proposicao A.1.5.

A.1.4. O objetivo deste exerccio e exibir um subconjunto da reta que nao


e boreliano. Seja um n
umero irracional qualquer. Defina em R a seguinte
relacao: x y existem m, n Z tais que x y = m + n. Verifique que
e uma relacao de equivalencia e toda classe de equivalencia intersecta [0, 1).
Seja E0 um subconjunto de [0, 1) contendo exatamente um elemento de cada
classe de equivalencia (a existencia de tal conjunto e consequencia do axioma
da escolha). Mostre que E0 n
ao e boreliano.
A.1.5. Seja (X, B, ) um espaco de medida. Mostre que se A1 ,A2 , . . . est
ao em
B ent
ao

X
[
(Aj ).
Aj )
(
j=1

j=1

A.1.6 (Lema de Borel-Cantelli). Seja (En )n uma famlia enumeravel de conjuntos mensuraveis. Seja F o conjunto dos pontos que pertencem a En para

infinitos
valores de n, ou seja, F = lim supn En =
k=1 n=k En . Mostre que se
P
ao (F ) = 0.
n (En ) < ent
A.1.7. Demonstre o Teorema A.1.14.

A.1.8. Seja A a colecao dos subconjuntos de X = [0, 1] que se escrevem como


uniao finita de intervalos disjuntos. Verifique que A e uma algebra de subconjuntos de X. Seja m0 : A [0, 1] a funcao definida nesta algebra por

m0 I1 IN = |I1 | + + |IN |,
onde |Ij | representa o comprimento de Ij . Mostre que m0 e -aditiva.

A.1.9. Seja B uma


algebra de subconjuntos de X e seja : B [0, +) uma
funcao finitamente aditiva com (X) < . Mostre que e -aditiva se, e
somente se, vale qualquer uma das condicoes abaixo:
1. limn (An ) = (
encia A1 Aj de
j=1 Aj ) para toda sequ
elementos de B;
encia A1 Aj de
2. limn (An ) = (
j=1 Aj ) para toda sequ
elementos de B.
A.1.10. Mostre que kk = ||(X) define uma norma completa no espaco vetorial das medidas com sinal finitas num espaco mensuravel (X, B).
A.1.11. Seja X = {1, . . . , d} um conjunto finito, munido da topologia discreta,
e seja M = X I onde I = N ou I = Z.
(a) Verifique que a igualdade (A.2.7) define uma distancia em M e que a
topologia que ela define coincide com a topologia produto em M . Descreva
as bolas abertas e as bolas fechadas em um ponto x X I .

438 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
(b) Mostre, sem usar o teorema de Tychonoff, que (M, d) e um espaco compacto.
(c) Seja A a
algebra gerada pelos cilindros elementares de M . Mostre que
toda funcao aditiva : A [0, 1] com (M ) = 1 se estende a uma
medida (-aditiva) de probabilidade na -algebra boreliana de M .
A.1.12. Seja K [0, 1] o conjunto de Cantor, isto e, K =
n=0 Kn onde
K0 = [0, 1] e cada Kn e o conjunto obtido quando retiramos de cada componente conexa C de Kn1 o intervalo aberto cujo comprimento e um terco do
comprimento de C e cujo centro coincide com o centro de C. Mostre que K tem
medida de Lebesgue igual a zero.
A.1.13. Dado um conjunto E Rd , mostre que as seguintes condicoes sao
equivalentes:
(a) E e um subconjunto mensuravel de Lebesgue.
(b) E est
a no completamento da -algebra de Borel relativamente `a medida
de Lebesgue, ou seja, existem conjuntos borelianos B1 , B2 Rd tais que
B1 E B2 e m(B2 \ B1 ) = 0.
(c) (Aproximacao por cima por abertos) Para todo > 0 podemos encontrar
um aberto A com E A e m (A \ E) < .
(d) (Aproximacao por baixo por fechados) Para todo > 0 podemos encontrar
um fechado F com F E e m (E \ F ) < .
A.1.14. Prove a Proposicao A.1.31.
A.1.15. Seja
Pgn : M R, n 1 uma sequencia de funcoes mensuraveis tais
que f (x) = n=1 gn (x) converge em todo ponto. Mostre que a soma f e uma
funcao mensuravel.
A.1.16. Prove a Proposicao A.1.33.
A.1.17. Seja f : X X uma transformacao mensuravel e seja uma medida
em X. Defina (f )(A) = (f 1 (A)). Mostre que f e uma medida e note que
ela e finita se, e somente se, e finita.
A.1.18. Seja 5 : [0, 1] [0, 1] a funcao que associa a cada n
umero x [0, 1]
a frequencia superior de dgitos iguais 5 na expansao de x na base 10. Isto e,
escrevendo x = 0, a0 a1 a2 . . . ... com ai 6= 9 para infinitos valores de i,
5 (x) = lim sup
n

1
#{0 j n 1 : aj = 5}.
n

Prove que a funcao 5 e mensuravel.

EM ESPAC
A.2. INTEGRAC
AO
OS DE MEDIDA

A.2

439

Integra
c
ao em espacos de medida

Nesta secao definiremos a integral de Lebesgue de uma funcao em relacao a


uma medida. Ela generaliza a nocao de integral de Riemann que e normalmente
apresentada nos cursos de C
alculo ou em cursos introdutorios de Analise.
A motivacao para fazermos esta generalizacao e que a integral de Riemann
n
ao est
a definida para muitas funcoes u
teis, por exemplo, para funcoes caractersticas de conjuntos mensuraveis em geral (veja o Exemplo A.2.5 abaixo). Ja
a integral de Lebesgue faz sentido em toda a classe das funcoes mensuraveis, a
qual, como vimos na Proposicao A.1.31, e fechada para as principais operacoes
da Analise.
Ainda nesta secao, enunciaremos alguns resultados importantes sobre o comportamento da integral relativamente `a passagem ao limite de sequencias. Tambem descreveremos a construcao de medidas produto, tanto para famlias finitas
quanto para famlias enumer
aveis de medidas. Ao final, discutiremos os conceitos correlatos de continuidade absoluta e de derivacao de Lebesgue.

A.2.1

Integral de Lebesgue

Ao longo desta secao (X, B, ) sera sempre um espaco de medida. Vamos definir
a nocao de integral de Lebesgue por etapas. O primeiro passo trata da integral
de uma funcao simples:
P
Defini
c
ao A.2.1. Seja s = kj=1 k XAk uma funcao simples. Ent
ao a integral
de s em relacao `
a medida e dada por:
Z

s d =

k
X

k (Ak ).

j=1

f
E
acil verificar que esta definicao e coerente: se duas combinacoes lineares de
funcoes caractersticas definem uma mesma funcao ent
ao os valores das integrais
obtidos a partir das duas combinacoes coincidem (Exerccio A.2.1).
O proximo passo e definir integral de uma funcao mensuravel n
ao negativa.
A ideia e definir a integral da funcao como sendo o limite das integrais de funcoes
simples que a aproximam, utilizando a Proposicao A.1.33:
Defini
c
ao A.2.2. Seja f : X [0, ] uma funcao mensuravel n
ao negativa.
Ent
ao
Z
Z
f d = lim sn d,
n

onde s1 s2 . . . e uma sequencia n


ao decrescente de funcoes simples tal que
limn sn (x) = f (x) para todo x X.

N
ao e difcil verificar (Exerccio A.2.2) que esta definicao e coerente: o valor
da integral n
ao depende da escolha da sequencia de funcoes simples crescendo
para f .

440 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Agora, para estender a definicao de integral a qualquer funcao mensuravel,
observemos que dada uma funcao f : X [, +] sempre podemos escrever
f = f + f com
f + (x) = max{f (x), 0} e

f (x) = max{f (x), 0}.

claro que as funcoes f + e f sao n


E
ao negativas. Alem disso, pela Proposicao A.1.31, elas sao mensuraveis se f e mensuravel.
Defini
c
ao A.2.3. Seja f : X [, +] uma funcao mensuravel. Ent
ao,
Z
Z
Z
f d = f + d f d,
desde que pelo menos uma das integrais do lado direito seja finita (valem as
convencoes usuais (+) a = + e a (+) = para todo a R).
Defini
c
ao A.2.4. Dizemos que uma funcao f : X [, +] e integr
avel se
for mensuravel e a sua integral for um n
umero real. Denotamos o conjunto das
funcoes integraveis por L1 (X, B, ) ou, mais simplesmente, por L1 ().
Dada uma funcao mensuravel f : X [, ] e um conjunto mensuravel
E definimos a integral de f sobre E por
Z
Z
f d = f XE d,
E

onde XE e a funcao caracterstica do conjunto E.


Exemplo A.2.5. Considere X = [0, 1] munido da medida de Lebesgue m. Seja
f = XB , onde B e o subconjunto dos n
umeros racionais. Ent
ao m(B) = 0 e
portanto, usando a Definicao A.2.2, a integral de Lebesgue de f e igual a zero.
Por outro lado, um c
alculo direto mostra que toda soma de Riemann inferior de
f e igual a 0 mas toda soma de Riemann superior de f e igual a 1. Portanto,
a integral de Riemann de f n
ao est
a definida. Outra forma de chegar a esta
mesma conclusao e utilizando o fato conhecido de que a integral de Riemann da
funcao caracterstica de um conjunto mensuravel est
a definida se, e somente se,
a sua fronteira tem medida nula. Note que no caso presente a fronteira de B e
todo o [0, 1] e, portanto, tem medida positiva.
Exemplo A.2.6. Sejam x1 , . . . , xm X e p1 , . . . , pm > 0 com p1 + +pm = 1.
Consideremos a medida de probabilidade definida em 2X por
=

m
X

p i x i

onde xi e a medida delta de Dirac em xi .

i=1

P
ao,
Em outras palavras (A) = xi A pi para todo subconjunto A de X. Ent
para qualquer funcao f : X [, +],
Z
m
X
pi f (xi ).
f d =
i=1

EM ESPAC
A.2. INTEGRAC
AO
OS DE MEDIDA

441

Proposi
c
ao A.2.7. O conjunto L1 () das func
oes reais integr
aveis e umR espaco
vetorial real. Alem disso, a aplicac
ao I : L1 () R dada por I(f ) = f d e
um funcional linear positivo, ou seja:
R
R
R
(1) af + bg d = a f d + b g d e
R
R
(2) f d g d se f (x) g(x) para todo x.
R
R
Em particular, | f d| |f | d se |f | L1 (). Alem disso, |f | L1 () se, e
somente se, f L1 ().
Vamos encerrar esta secao observando que a nocao de integral pode ser estendida a uma classe ainda mais ampla de funcoes, de duas maneiras diferentes.
Por um lado, podemos considerar funcoes mensuraveis complexas f : X C.
Nesse caso, dizemos que f e integravel se, e somente se, a parte real f e a
parte imagin
aria f forem integraveis. Nesse caso, por definicao,
Z
Z
Z
f d = f d + i f d.
Por outro lado, podemos considerar funcoes que n
ao sao necessariamente mensur
aveis mas que coincidem com alguma funcao mensuravel num subconjunto
do domnio com medida total. Para explicar isto precisamos da seguinte nocao,
que sera utilizada frequentemente ao longo do texto:
Defini
c
ao A.2.8. Dizemos que uma propriedade e valida em -quase todo
ponto se e valida em todo o X exceto, possivelmente, num conjunto de medida
nula.
Por exemplo, dizemos que uma sequencia de funcoes (fn )n converge para
uma funcao em -quase todo ponto se existe um conjunto mensuravel N com
(N ) = 0 tal que f (x) = limn fn (x) para todo x X \ N . Analogamente,
dizemos que duas funcoes f e g sao iguais em -quase todo ponto se existe um
conjunto mensuravel N com (N ) = 0 tal que f (x) = g(x) para todo x X \ N .
Neste caso, supondo que as funcoes sejam integraveis, as suas integrais coincidem
Z
Z
f d = g d se f = g em -quase todo ponto.
Esta observacao permite definir integral para qualquer funcao f , possivelmente
n
ao mensuravel,R que e igual
R em -quase todo ponto a uma funcao mensuravel
g: basta tomar f d = g d.

A.2.2

Teoremas de converg
encia

Nesta secao mencionamos tres resultados muito importantes para o estudo da


convergencia de funcoes sob o sinal de integral. O primeiro deles lida com
sequencias mon
otonas de funcoes:

442 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Teorema A.2.9 (Convergencia mon
otona). Seja fn : X [, +] uma
sequencia mon
otona de func
oes mensur
aveis n
ao negativas e seja f a func
ao
definida por f (x) = limn fn (x). Ent
ao
Z
Z
lim fn d = f (x) d.
n

O proximo resultado vale para sequencias mais gerais, n


ao necessariamente
mon
otonas:
Teorema A.2.10 (Lema de Fatou). Seja fn : X [0, +] uma sequencia
de func
oes mensur
aveis n
ao negativas. Ent
ao, a funca
o f : X [, +]
definida por f (x) = lim inf n fn (x) e integr
avel e vale
Z
Z
lim inf fn (x) d lim inf fn d.
n

O mais poderoso dos resultados nesta secao e o teorema da convergencia


dominada, que garante que podemos tomar o limite sob o sinal da integral
sempre que a sequencia de funcoes e majorada por alguma funcao integravel:
Teorema A.2.11 (Convergencia dominada). Seja fn : X R uma sequencia
de func
oes mensur
aveis e suponha que existe uma func
ao integr
avel g tal que
|fn (x)| |g(x)| para -quase todo x em X. Suponha tambem que a sequencia
(fn )n converge em -quase todo ponto para uma func
ao f . Ent
ao f e integr
avel
e vale:
Z
Z
lim fn d = f d.
n

A.2.3

Produto de medidas

Sejam (Xj , Aj , j ), j = 1, . . . , n espacos de medida finita, isto e, tais que


possvel tornar o produto cartesiano X1 Xn um espaco
j (Xj ) < . E
de medida, da seguinte forma. Considere em X1 Xn a -algebra gerada
pela famlia de todos os conjuntos da forma A1 An com Aj Aj . Ela e
chamada -
algebra produto e e representada por A1 An .
Teorema A.2.12. Existe uma u
nica medida em (X1 Xn , A1 An )
tal que (A1 An ) = 1 (A1 ) n (An ) para todo A1 A1 , . . . , An An .
Em particular, e uma medida finita.
A demonstracao deste resultado (veja o Teorema 35.B do livro de Halmos [Hal50]) combina o teorema da extensao (Teorema A.1.13) com o teorema
da convergencia mon
otona (Teorema A.2.9). A medida no enunciado e representada por 1 n e e chamada produto das medidas 1 , . . . , n . Desta
forma, fica definido o espaco de medida produto
(X1 Xn , A1 An , 1 n ).

EM ESPAC
A.2. INTEGRAC
AO
OS DE MEDIDA

443

O Teorema A.2.12 permanece valido quando as medidas j sao apenas -finitas,


exceto que neste caso a medida produto e apenas -finita.
Agora vamos descrever a construcao do produto de uma famlia enumer
avel
de espacos de medida. Na verdade, para isso nos restringiremos ao caso de
probabilidades. Sejam (Xj , Bj , j ), j I espacos de medida com j (Xj ) = 1
para todo j I. O conjunto de ndices tanto pode ser I = N como I = Z.
Consideremos o produto cartesiano
Y
=
Xj = {(xj )jI : xj Xj }.
(A.2.1)
jI

Chamamos cilindros de os subconjuntos da forma


[m; Am , . . . , An ] = {(xj )jI : xj Aj para m j n}

(A.2.2)

onde m I e n m e Aj Bj para m j n. Note que o proprio X e um


cilindro, por exemplo, X = [1; X1 ]. Por definicao, a -
algebra produto em e
a -algebra B gerada pela famlia de todos os cilindros. A famlia A das unioes
finitas de cilindros disjuntos dois-a-dois e uma algebra e ela gera a -algebra B.

Teorema A.2.13. Existe uma u


nica medida em (, B) tal que
([m : Am , . . . , An ]) = m (Am ) n (An )

(A.2.3)

para qualquer cilindro [m : Am , . . . , An ]. Em particular, e uma probabilidade.


A prova deste teorema (veja o Teorema 38.B do livro de Halmos [Hal50])
usa o teorema de extensao (Teorema A.1.13) e o teorema da continuidade no
vazio (Teorema A.1.14).
A probabilidade e chamada medida produto e e
Q
representada por jI j . O espaco de probabilidade (, B, ) construdo desta
forma e denominado espaco produto dos espacos (Xj , Bj , j ), j I.
Um caso particular importante da construcao anterior ocorre quando os
espacos (Xi , Bi , i ) sao todos iguais a um dado (X, C, ). Estes espacos podem ser usados para modelar sequencias de experimentos aleat
orios identicos
em que o resultado de cada experimento e independente dos demais. Supoe-se
que cada experimento toma valores no conjunto X, com distribuicao de probabilidade igual a . Neste contexto, a medida = I costuma ser chamada medida
de Bernoulli definida por . A propriedade (A.2.3) corresponde `a igualdade
([m; Am , . . . , An ]) =

n
Y

(Aj ),

(A.2.4)

j=m

a qual pode ser lida nos seguintes termos: a probabilidade de todo evento composto {xm Am , . . . , xn An } e igual ao produto das probabilidades dos
eventos individuais xi Ai . Portanto, (A.2.4) traduz realmente a ideia de que
os sucessivos experimentos sao independentes.
Temos interesse especial no caso em que X e um conjunto finito e um conjunto finito, munido da -algebra C = 2X , formada por todos os subconjuntos
de X. Neste caso, e u
til considerar os cilindros elementares
[m; am , . . . , an ] = {(xj )jI X : xm = am , . . . , xn = an },

(A.2.5)

444 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
correspondentes a conjuntos Aj formados por um u
nico ponto aj . Observe
que todo cilindro e uma uniao finita de cilindros elementares disjuntos dois-adois. Portanto, a -algebra gerada pelos cilindros elementares coincide com a
-algebra gerada por todos os cilindros, e o mesmo vale para a algebra gerada.
Alem disso, a relacao (A.2.4) pode ser escrita
([m; am , . . . , an ]) = pam pan

onde pa = ({a}) para a X.

(A.2.6)

Considere o conjunto finito X munido da topologia discreta. A topologia


produto em = X I coincide com a topologia gerada pelos cilindros elementares.
Alem disso (veja o Exerccio A.1.11), ela coincide com a topologia associada `a
distancia definida por

(A.2.7)
d (xi )iI , (yi )iI = N ,

onde (0, 1) est


a fixado e N = N ((xi )iI , (yi )iI ) 0 e o maior n
umero
inteiro tal que xi = yi para todo i I com |i| < N .

A.2.4

Derivac
ao de medidas

Seja m a medida de Lebesgue em Rd . Dado um subconjunto mensuravel A de


Rd , dizemos que um ponto a A e um ponto de densidade de A se este conjunto
preenche a maior parte de qualquer pequena vizinhanca de a, isto e,
lim

m(B(a, ) A)
= 1.
m(B(a, ))

(A.2.8)

Teorema A.2.14. Seja A um subconjunto mensur


avel de Rd com medida de
Lebesgue m(A) maior que zero. Ent
ao m-quase todo ponto a A e ponto de
densidade de A.
No Exerccio A.2.11 sugerimos uma demonstracao deste resultado. Ele pode
tambem ser obtido como consequencia direta do teorema que vamos enunciar
a seguir. Dizemos que uma funcao f : Rd R e localmente integr
avel se o
produto f XK e integravel para todo compacto K Rd .
Teorema A.2.15 (Derivacao de Lebesgue). Seja X = Rd , B a -
algebra de
Borel e m a medida de Lebesgue em Rd . Seja f : X R uma func
ao localmente
integr
avel. Ent
ao
Z
1
|f (y) f (x)|dm = 0 em m-quase todo ponto.
lim
r0 m(B(x, r)) B(x,r)
Em particular,
1
r0 m(B(x, r))
lim

f (y)dm = f (x)

em m-quase todo o ponto.

B(x,r)

O ingrediente fundamental na demonstracao destes resultados e o seguinte


fato geometrico:

EM ESPAC
A.2. INTEGRAC
AO
OS DE MEDIDA

445

Teorema A.2.16 (Lema de Vitali). Seja m a medida de Lebesgue em Rd e


suponha que para cada x R e dada uma sequencia (Bn (x))n de bolas centradas
em x com raio convergindo para zero. Seja A Rd um conjunto mensur
avel
com m(A) > 0. Ent
ao, para cada > 0 existem sequencias (xj )j em R e (nj )j
em N tais que
1. as bolas B(xj , nj ) s
ao disjuntas duas-a-duas;


2. m j Bnj (xj ) \ A < e m A \ j Bnj (xj ) = 0.

O teorema ainda e valido se, no lugar de bolas, tomarmos para (Bn (x))n
qualquer sequencia de conjuntos satisfazendo n Bn (x) = {x} e
sup
x,n

sup{d(x, y) : y Bn (x)}
< .
inf{d(x, z) : z
/ Bn (x)}

O conjunto das medidas definidas num mesmo espaco mensuravel possui a


seguinte relacao de ordem natural:
Defini
c
ao A.2.17. Sejam e duas medidas num espaco mensuravel (X, B).
Dizemos que e absolutamente contnua em relacao a se todo conjunto
mensuravel E que satisfaz (E) = 0 tambem satisfaz (E) = 0. Nesse caso
escrevemos .
Dizemos que e sao equivalentes, e escrevemos , se cada uma delas for
absolutamente contnua em relacao `a outra. Em outras palavras, duas medidas
sao equivalentes se elas tem os mesmos conjuntos com medida nula.
Outro resultado importante, conhecido por teorema de Radon-Nikodym,
afirma que se ent
ao a medida pode ser vista como a integral com
respeito a de uma certa funcao mensuravel :
Teorema A.2.18 (Rad
on-Nikodym). Se e s
ao medidas finitas tais que
ent
ao existe uma func
ao mensur
avel : X [0, +] tal que = , ou
seja, tal que
Z
Z
d = d para toda func
ao mensur
avel limitada : X R.

(A.2.9)
R
avel E X. Alem
Em particular, (E) = E d para todo conjunto mensur
disso, e essencialmente u
nica: duas quaisquer func
oes que satisfazem (A.2.9)
s
ao iguais em -quase todo ponto.
Chamamos de densidade, ou derivada de Rad
on-Nikodym, de relativamente a e escrevemos
d
.
=
d
Defini
c
ao A.2.19. Sejam e duas medidas num espaco mensuravel (X, B).
Dizemos que e sao mutuamente singulares se existem conjuntos mensuraveis
disjuntos A e B tais que A B = X e (A) = 0 e (B) = 0. Nesse caso
escrevemos .

446 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
O teorema de decomposicao de Lebesgue afirma que, dadas duas medidas
finitas e , podemos escrever = a + s onde a e s sao medidas finitas
tais que a e s . Combinando este resultado com o teorema de
Radon-Nikodym, obtemos:
Teorema A.2.20 (Decomposicao de Lebesgue). Dadas medidas finitas e ,
existe uma func
ao mensur
avel : X [0, +] e existe uma medida finita
satisfazendo = + e .

A.2.5

Exerccios

A.2.1. Prove que a integral de uma funcao simples est


a bem definida: se duas
combinacoes lineares de funcoes caractersticas definem uma mesma funcao,
ent
ao os valores das integrais obtidos a partir das duas combinacoes coincidem.
A.2.2. Mostre que se (rn )n e (sn )n sao sequencias n
ao decrescentes de funcoes
simples n
ao negativas convergindo Rem -quase todo
R ponto para uma mesma
funcao f : M [0, +) ent
ao limn rn d = limn sn d.
A.2.3. Prove a Proposicao A.2.7.

A.2.4. (Desigualdade de Tchebysheff-Markov) Seja f : M R uma funcao


positiva integravel com respeito a uma medida finita . Ent
ao, dado qualquer
n
umero real a > 0,
Z
 1
f d.
{x M : f (x) a}
a X

R
Em particular, se |f | d = 0, ent
ao {x X : f (x) 6= 0)} = 0.

A.2.5. Seja
R f uma funcao integravel. Mostre que para todo > 0 existe > 0
tal que | E f d| < para todo conjunto mensuravel E com (E) < .
A.2.6. Sejam 1 , . . . , N : M R funcoes mensuraveis limitadas num espaco
de probabilidade (M, B, ). Mostre que para
Ps todo > 0 existem x1 , . . . , xs M
e n
umeros positivos 1 , . . . , s tais que j=1 j = 1 e
|

s
X

j i (xj )| < para todo i = 1, . . . , N .

j=1

A.2.7. Prove o teorema da convergencia dominada (Teorema A.2.11) a partir


do lema de Fatou (Teorema A.2.10).
A.2.8. Um conjunto F de funcoes mensuraveis M R diz-se uniformemente
integr
avel
R com respeito a uma probabilidade se para todo > 0 existe C > 0
tal que {|f |>C} |f | d < para todo f F . Mostre que
(a) F e uniformemente integravel com respeito aR se, e somente
R se, existe
L > 0 e para todo > 0 existe > 0 tal que |f | d < L e A |f | d <
para todo f F e todo conjunto mensuravel A com (A) < .

EM ESPAC
A.2. INTEGRAC
AO
OS DE MEDIDA

447

(b) Se existe alguma funcao g integravel com respeito a tal que |f | |g| para
todo f F (dizemos que F e dominado por g) ent
ao F e uniformemente
integravel com respeito a .
R
(c) RSe F e uniformemente integravel com respeito a ent
ao limn fn d =
lim fn d para qualquer sequencia (fn )n em F convergindo em -quase
todo ponto.
A.2.9. Mostre que a e um ponto de densidade de um conjunto A Rd se, e
somente se,


m(B A)
: B bola contida em B(a, ) e contendo a = 1 (A.2.10)
lim inf
0
m(B)
A.2.10. Seja Pn , n 1 uma sequencia de particoes enumeraveis de Rd em
subconjuntos mensuraveis. Suponha que o diametro diam Pn = sup{diam P :
P Pn } converge para zero quando n . Mostre que, dado qualquer conjunto mensuravel A Rd com medida de Lebesgue positiva, e possvel escolher
conjuntos Pn Pn , n 1 de tal forma que m(A Pn )/m(Pn ) 1 quando
n .
A.2.11. Prove o Teorema A.2.14.
A.2.12. Seja x1 , x2 M e p1 , p2 , q1 , q2 > 0 com p1 + p2 = q1 + q2 = 1.
Considere as medidas de probabilidade e dadas por
X
X
(A) =
pi ,
(A) =
qi ,
xi A

xi A

ou seja, = p1 x1 + p2 x2 e = q1 x1 + q2 x2 . Mostre que e e


calcule as respectivas derivadas de Radon-Nikodym.
A.2.13. Construa uma probabilidade absolutamente contnua com respeito `a
medida de Lebesgue m em [0, 1] tal que existe um conjunto mensuravel K [0, 1]
com medida (K) = 0 mas m(K) = 1/2. Em particular, m n
ao e absolutamente
contnua com respeito a . Poderamos pedir que m(K) = 1?
A.2.14. Suponha que f : X X e tal que existe uma cobertura enumeravel
de M por conjuntos mensuraveis Bn , 1, tais que a restricao de f a cada Bn e
invertvel (ou seja, uma bijecao sobre a imagem, com inversa mensuravel). Seja
uma probabilidade em M tal que A Bn e (A) = 0 implica (f (A)) = 0.
Mostre que existe uma funcao J : X [0, +] tal que
Z
Z
( f )J d
d =
f (Bn )

Bn

para toda funcao mensuravel limitada : X R e todo n. Alem disso, J e


essencialmente u
nica.

448 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
A.2.15. Seja = + a decomposicao de Hahn de uma medida finita com
sinal . Mostre que existem funcoes e tais que + = + || = + e
= || = . Que funcoes sao estas?
P
A.2.16.
tais que
= n n e
P
P Seja (n )n e (n )n duas sequencias dePmedidas
n
n
n = i=1 i e n = i=1 i . Mostre
= n n sao medidas finitas. Escreva
que se
n n para todo n ent
ao e
d
n
d
= lim
n d
d
n

A.3

em -quase todo ponto.

Medidas em espacos m
etricos

Ao longo desta secao, a menos de indicacao em contrario, suporemos que e


uma medida de probabilidade boreliana (ou seja, definida na -algebra de Borel)
de um espaco metrico M .
Lembre que um espaco metrico e uma dupla (M, d) em que M e um conjunto
e d e uma dist
ancia em M , ou seja, uma funcao d : M M R satisfazendo
1. d(x, y) 0 para quaisquer x, y e vale a igualdade se, e somente se, x = y;
2. d(x, y) = d(y, x) para quaisquer x, y;
3. d(x, y) d(x, z) + d(z, y) para quaisquer x, y, z.
Representamos por B(x, r) a bola de centro x M e raio r > 0. Todo espaco
metrico possui uma estrutura natural de espaco topologico, em que as bolas sao
bases de vizinhancas ou, equivalentemente, os abertos sao os subconjuntos que
contem alguma bola centrada em qualquer dos seus pontos. Na direcao oposta,
diremos que um espaco topologico e metriz
avel se a sua topologia puder ser
definida dessa forma, a partir de alguma funcao distancia.

A.3.1

Medidas regulares

Um primeiro fato interessante e que qualquer probabilidade boreliana em um


espaco metrico fica completamente determinada pelos valores que ela toma nos
subconjuntos abertos (ou nos subconjuntos fechados) do espaco.
Defini
c
ao A.3.1. Uma medida boreliana num espaco topologico e regular se
para todo subconjunto mensuravel B e todo > 0 existe um conjunto fechado
F e um conjunto aberto A tais que F B A e (F \ A) < .
Proposi
c
ao A.3.2. Toda medida de probabilidade num espaco metrico e regular.
Demonstrac
ao. Seja B0 a famlia dos subconjuntos borelianos B tais que para
todo > 0 existe um fechado F e um aberto A satisfazendo F B A e
(F \ A) < . Note que B0 contem todos os fechados de M . De fato, seja B um
fechado qualquer e seja B o conjunto (aberto) dos pontos cuja distancia a B e


A.3. MEDIDAS EM ESPAC
OS METRICOS

449

menor que . Pelo Teorema A.1.14, temos que (B \ B) 0 quando 0 e,


portanto, podemos tomar F = B e A = B para algum > 0 pequeno.
imediato que a famlia B0 e fechada para a passagem ao complementar, isto
E
e, B c B0 sempre que B c B0 . Alem disso, considere uma famlia enumeravel
Bn , n = 1, 2, . . . qualquer de elementos de B0 e denote B =
n=1 Bn . Por
hipotese, para todo n N e > 0, existe um fechado Fn e um aberto An
satisfazendo Fn Bn An e (An \ Fn ) < /2n+1 . A uniao A =
e um
n=1 An
aberto e qualquer uni
ao finita F = m
F

e
um
fechado.
Fixemos
o
inteiro
m
n
n=1
suficientemente grande para que

n=1


Fn \ F < /2

(lembre o Teorema A.1.14). Ent


ao F B A e

[
 X

 X
A\F
An \ Fn +
Fn \ F <
n=1

n=1

n=1

2n+1

= .
2

Isto mostra que B B0 . Deste jeito mostramos que B0 e uma -algebra. Logo
B0 contem todos os subconjuntos borelianos de M .
Uma consequencia do resultado acima e que os valores que uma probabilidade toma nos fechados de M determinam completamente: se e outra
probabilidade tal que (F ) = (F ) para todo fechado F ent
ao = , isto e,
(B) = (B) para todo boreliano B. Passando ao complementar, obtemos que
o mesmo vale para os conjuntos abertos.
A proposicao que provaremos a seguir implica que os valores das integrais
das funcoes contnuas limitadas tambem determinam a probabilidade completamente. De fato, isso vale mesmo para o conjunto (menor) das funcoes Lipschitz
limitadas.
Lembre que uma aplicacao h : M N e Lipschitz se existe alguma constante
C > 0 tal que d(h(x), h(y)) Cd(x, y) para todo x, y N . Se for necessario
especificar a constante diremos que h e funcao C-Lipschitz. Mais geralmente,
dizemos que h e H
older se existem C, > 0 tais que d(h(x), h(y)) Cd(x, y)
para todo x, y N . Nesse caso, tambem dizemos que h e funcao -Holder ou
mesmo (C, )-H
older.
R
R
Proposi
c
ao A.3.3. Se e s
ao probabilidades em M tais que d = d
para toda func
ao : M R Lipschitz limitada, ent
ao = .
Demonstrac
ao. Usaremos o seguinte fato simples de topologia:
Lema A.3.4. Dado qualquer subconjunto fechado F de M e dado > 0, existe
uma func
ao Lipschitz g : M [0, 1] tal que g (x) = 1 para todo x F e
g (x) = 0 para todo x M tal que d(x, F ) .

450 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Demonstrac
ao. Considere a funcao h : R [0, 1] dada da seguinte forma:
h(s) = 1 se s 0, h(s) = 0 se s 1 e h(s) = 1 s se 0 s 1. Defina
g : M [0, 1],

g(x) = h


1
d(x, F ) .

Note que g e Lipschitz, por ser composicao de funcoes Lipschitz. As demais


propriedades no lema sao imediatas.
Agora podemos terminar a prova da Proposicao A.3.3. Seja F um subconjunto fechado qualquer de M e, para cada > 0, seja g : M [0, 1] uma
funcao como no lema acima. Por hipotese,
Z
Z
g d = g d para todo > 0.
Alem disso, pelo teorema da convergencia dominada (Teorema A.2.11),
Z
Z
lim g d = (F ) e lim g d = (F ).
0

Isto mostra que (F ) = (F ) para todo fechado F , donde resulta que = .


Como observamos no Exemplo A.1.29, funcoes contnuas sao automaticamente mensuraveis, relativamente `a -algebra de Borel. O resultado que vamos provar a seguir afirma que, mediante uma hipotese simples sobre o espaco
metrico, vale uma especie de recproca: funcoes mensuraveis sao contnuas se
restringirmos a certos subconjuntos com medida quase total.
Um subconjunto de um espaco metrico (ou topologico) M e denso se ele
intersecta todo aberto de M . Dizemos que o espaco e separ
avel, se ele admite
algum subconjunto enumeravel denso. Para espacos metricos isso equivale a
dizer que a topologia admite uma base enumeravel de abertos (Exerccio A.3.1).
Teorema A.3.5 (Lusin). Seja : M N uma aplicac
ao mensur
avel com valores num espaco metrico separ
avel N . Dado qualquer > 0 existe um conjunto
fechado F M tal que (M \ F ) < e a restric
ao de a F e contnua.
Demonstrac
ao. Seja {xn : n N} um subconjunto enumeravel denso de N
e, para cada k 1, seja Bn,k a bola de centro xn e raio 1/k. Fixe > 0.
Pela Proposicao A.3.2, para cada (n, k) podemos encontrar um conjunto aberto
An,k M contendo 1 (Bn,k ) e satisfazendo (An,k \ 1 (Bn,k )) < /2n+k+1 .
Defina

\

E=
1 (Bn,k ) Acn,k .
n,k=1

Por um lado,

(M \ E)

n,k=1

(An,k \ 1 (Bn,k )) <

n,k=1

2n+k+1

.
2


A.3. MEDIDAS EM ESPAC
OS METRICOS

451

Por outro lado, todo 1 (Bn,k ) e subconjunto aberto de 1 (Bn,k ) Acn,k , ja


que o complementar e o conjunto fechado Acn,k . Consequentemente, 1 (Bn,k )
e aberto em E para todo (n, k). Isto mostra que a restricao de ao conjunto E
e contnua. Para terminar a demonstracao basta usar a Proposicao A.3.2 mais
uma vez para encontrar um conjunto fechado F E tal que (E \F ) < /2.

A.3.2

Espacos m
etricos separ
aveis completos

Vamos agora discutir outra propriedade importante de medidas em espacos


metricos que sao ao mesmo tempo separ
aveis e completos. Lembre que esta
u
ltima condicao significa que toda sequencia de Cauchy e convergente.
Defini
c
ao A.3.6. Uma medida num espaco topologico e justa se para todo
> 0 existe um subconjunto compacto K tal que (K c ) < .
Como todo subconjunto fechado de um espaco metrico compacto tambem e
compacto, segue imediatamente da Proposicao A.3.2 que toda medida de probabilidade num espaco metrico compacto e justa. Mas, esta conclusao e ainda
mais geral:
Proposi
c
ao A.3.7. Toda medida de probabilidade num espaco metrico separ
avel completo e justa.
Demonstrac
ao. Seja {pk : k N} um subconjunto enumeravel denso de M .
k , 1/n), k N formam uma
Ent
ao, para cada n 1, as bolas fechadas B(p
cobertura enumer
avel de M . Dado > 0 e n 1, fixemos k(n) 1 de tal forma
que o conjunto (fechado)
k(n)

Ln =

k , 1/n)
B(p

k=1

e fechado e
satisfaca (Ln ) > 1 /2n . Tomemos K =
n=1 Ln . Note que K
(K c )

 X

Lcn <
= .
2n
n=1
n=1

Resta verificar que K e compacto. Para isso basta mostrar que toda sequencia
(xi )i em K admite alguma subsequencia de Cauchy (uma vez que M e completo, segue que esta subsequencia e convergente). Tal subsequencia pode ser
construda da seguinte forma. Como xi L1 para todo i, existe l(1) k(1) tal
que o conjunto de ndices
I1 = {i N : xi B(pl(1) , 1)}
e infinito. Seja i(1) o menor elemento de I1 . Em seguida, como xi L2 para
todo i, existe l(2) k(2) tal que
I2 = {i I1 : xi B(pl(2) , 1/2)}

452 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
e infinito. Seja i(2) o menor elemento de I2 \ {i(1)}. Repetindo este procedimento, construmos uma sequencia decrescente In de subconjuntos infinitos de
N, e uma sequencia crescente i(1) < i(2) < < i(n) < de n
umeros tais
que i(n) In e todos os xi , i In est
ao contidos numa mesma bola fechada de
raio 1/n. Em particular,
d(xi(a) , xi(b) ) 2/n para todo a, b n.
Isto mostra que a subsequencia (xi(n) )n e realmente de Cauchy.
Corol
ario A.3.8. Suponha que M e um espaco metrico separ
avel completo e
e uma medida de probabilidade em M . Para todo > 0 e todo conjunto
boreliano B M existe um compacto L B tal que (B \ L) < .
Demonstrac
ao. Pela Proposicao A.3.2 podemos encontrar um conjunto fechado
F B tal que (B \ F ) < /2. Pelo Teorema A.3.5, existe um subconjunto
compacto K M tal que (M \ K) < /2. Tome L = F K. Ent
ao L e
compacto e (B \ L) < .
Analogamente, quando o espaco metrico M e separ
avel completo podemos
melhorar o enunciado do teorema de Lusin, substituindo fechado por compacto na conclusao:
Teorema A.3.9 (Lusin). Suponha que M e um espaco metrico separ
avel completo e que e uma medida de probabilidade em M . Seja : M N uma
transformac
ao mensur
avel com valores num espaco metrico separ
avel N . Ent
ao
dado qualquer > 0 existe um conjunto compacto K M tal que (M \ K) <
e a restric
ao de a K e contnua.
Conclumos com outro fato importante sobre medidas em espacos metricos
separ
aveis completos. Uma medida diz-se at
omica se existe algum ponto x
tal que ({x}) > 0. Tais pontos sao chamados de
atomos. Caso contrario,
diz-se n
ao atomica.
O proximo teorema afirma que toda medida n
ao atomica de probabilidade
num espaco metrico separ
avel completo e equivalente `a medida de Lebesgue no
intervalo. Ele sera demonstrado na Secao 8.5.
Teorema A.3.10. Seja M um espaco metrico separ
avel completo e seja
uma medida n
ao at
omica de probabilidade em M . Ent
ao existe uma aplicac
ao
mensur
avel : M [0, 1] tal que e uma bijec
ao com inversa mensur
avel,
restrita a um subconjunto com medida total, e e a medida de Lebesgue em
[0, 1].

A.3.3

Espaco das fun


c
oes contnuas

No que resta desta secao descreveremos algumas propriedades importantes do


espaco vetorial C 0 (M ) das funcoes contnuas (reais ou complexas), quando M e
um espaco metrico compacto. As conclusoes das secoes anteriores permanecem


A.3. MEDIDAS EM ESPAC
OS METRICOS

453

validas, uma vez que todo espaco metrico compacto e separ


avel e completo.
Outro fato u
til sobre espacos metricos compactos e que toda cobertura aberta
admite algum n
umero de Lebesgue, ou seja, algum n
umero > 0 tal que para
todo x M existe algum elemento da cobertura que contem a bola B(x, ).
Consideremos o espaco C 0 (M ) munido da norma da convergencia uniforme:
kk = sup{|(x)| : x M }.
Esta norma e completa e, portanto, define em C 0 (M ) uma estrutura de espaco
de Banach. Um funcional linear : C 0 (M ) C diz-se positivo se () 0
para toda funcao C 0 (M ) tal que (x) 0 para todo x. O teorema de
Riez-Markov mostra que os u
nicos funcionais lineares positivos em C 0 (M ) sao
as integrais:
Teorema A.3.11 (Riesz-Markov). Seja M um espaco metrico compacto. Seja
: C 0 (M ) C um funcional linear positivo. Ent
ao existe uma u
nica medida
boreliana finita em M tal que
Z
() = d para toda C 0 (M ).
Alem disso, e uma probabilidade se e somente se (1) = 1.
O proximo resultado, que tambem e conhecido como teorema de RieszMarkov, d
a uma representacao analoga para funcionais lineares contnuos em
C 0 (M ). Lembre que a norma de um funcional linear : C 0 (M ) C e definida
por

 |()|
: 6= 0
(A.3.1)
kk = sup
kk
e que e contnuo se, e somente se, a sua norma e finita.
Teorema A.3.12 (Riesz-Markov). Seja M um espaco metrico compacto. Seja
: C 0 (M ) R um funcional linear contnuo. Ent
ao existe uma u
nica medida
boreliana complexa em M tal que
Z
() = d para toda C 0 (M ).
A norma kk = ||(X) da medida coincide com a norma kk do funcional .
Alem disso, toma valores em [0, ) se, e somente se, o operador e positivo
e toma valores em R se, e somente se, () R para toda func
ao real .

Em outras palavras, este resultado afirma que o dual de C 0 (M ) e isometricamente isomorfo a M(M ). Os Teoremas A.3.11 e A.3.12 se estendem para
espacos topol
ogicos localmente compactos, com hipoteses adequadas sobre o
comportamento das funcoes no infinito. Nesse contexto a medida (ainda) e
regular mas n
ao necessariamente finita.
Tambem usaremos o fato de que C 0 (M ) contem subconjuntos enumeraveis
densos (o Exerccio A.3.6 e um caso particular):
Teorema A.3.13. Se M e espaco metrico compacto ent
ao C 0 (M ) e separ
avel.

454 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE

A.3.4

Exerccios

A.3.1. Seja M um espaco topologico metriz


avel. Mostre que todo ponto de
M admite base enumeravel de vizinhancas. Mostre que M e separ
avel se, e
somente se, ele admite base enumeravel de abertos. De exemplos de espacos
metricos separ
aveis e n
ao separ
aveis.
A.3.2. Seja uma medida finita num espaco metrico M . Mostre que para todo
fechado F M existe um conjunto finito ou enumeravel E (0, ) tal que
({x M : d(x, F ) = r}) = 0 para todo r (0, ) \ E.
A.3.3. Seja uma medida finita num espaco metrico separ
avel M . Conclua
que para todo > 0 e possvel encontrar uma particao enumeravel de M em
conjuntos mensuraveis com diametro menor que e cujo bordo tem medida
nula.
A.3.4. Seja uma probabilidade em [0, 1] e seja : [0, 1] [0, 1] a funcao
dada por (x) = ([0, x]). Verifique que e contnua se, e somente se, e n
ao
atomica e que e absolutamente contnua se, e somente se, e absolutamente
contnua com relacao a` medida de Lebesgue.
A.3.5. Seja M um espaco metrico. Mostre que para toda funcao mensuravel
: M R existe uma sequencia n : M R, n 1 de funcoes uniformemente
contnuas convergindo para em todo ponto. Alem disso, se e limitada
podemos escolher a sequencia de tal forma que sup |n | sup || para todo n.
A.3.6. Mostre que o espaco C 0 ([0, 1]d ) das funcoes contnuas, reais ou complexas, no cubo unit
ario compacto e separ
avel, para todo d 1.

A.4

Variedades diferenci
aveis

Aqui vamos rever algumas nocoes e fatos b


asicos de topologia diferenci
avel e
geometria riemanianna.

A.4.1

Variedades e aplicac
oes diferenci
aveis

Um variedade diferenci
avel de dimensao d e um espaco topologico M munido de
um atlas diferenci
avel de dimensao d, ou seja, uma famlia de homeomorfismos
: U X tais que
1. cada U e aberto de M e cada X e aberto de Rd e M = U ;
2. a aplicacao 1
e diferenci
avel, para
: (U U ) (U U )
quaisquer e tais que U U 6= .
Mais geralmente, no lugar de Rd podemos considerar qualquer espaco de Banach
E. Ent
ao dizemos que M e uma variedade diferenci
avel modelada no espaco E.


A.4. VARIEDADES DIFERENCIAVEIS

455

A menos de mencao em contrario, consideraremos apenas variedades em


que o espaco M admite base enumeravel de abertos e e conexo. Esta u
ltima
propriedade significa que n
ao existem subconjuntos simultaneamente abertos e
fechados, `
a parte M e o conjunto vazio.
Os homeomorfismos sao chamados cartas locais, ou coordenadas locais,
e as transformacoes 1
ao chamadas mudancas de coordenadas. Permu s
1
tando os papeis de e , vemos que a inversa ( 1
= 1
em
)
tamb
e diferenci
avel. Portanto, a definicao de variedade requer que as mudancas de
coordenadas sejam difeomorfismos entre abertos do espaco euclideano.
Seja r N {}. Se toda mudanca de coordenadas e de classe C r (isto
e, se todas as suas derivadas parciais ate a ordem r existem e sao contnuas),
diremos que a variedade M (e o atlas { : U X }) e de classe C r . Claro
que toda variedade de classe C r tambem e de classe C s para qualquer s r.
Exemplo A.4.1. Os seguintes espacos sao variedades C de dimensao d:
Espaco euclideano Rd : considere o atlas formado por uma u
nica aplicacao,
a aplicacao identidade Rd Rd ;
Esfera S d = {(x0 , x1 , . . . , xd ) Rd+1 : x20 + x21 + + x2d = 1}: considere o
atlas formado pelas duas projec
oes estereogr
aficas:
S d \ {(1, 0, . . . , 0)} Rd ,

S \ {(1, 0, . . . , 0)} R ,

(x0 , x1 , . . . , xd ) 7 (x1 , . . . , xd )/(1 x0 )

(x0 , x1 , . . . , xd ) 7 (x1 , . . . , xd )/(1 + x0 ).

Toro Td = Rd /Zd : considere o atlas formado pelas inversas das aplicacoes


gz : (0, 1)d Td , definidas por gz (x) = z + x mod Zd para cada z Rd .
Seja M uma variedade de dimensao d e seja A = { : U X } o respectivo atlas. Seja S um subconjunto de M . Dizemos que S e uma subvariedade
de dimensao k < d se existir algum atlas B = { : V Y } de M tal que
1
(a) A e B sao compatveis: as mudancas de coordenadas 1
e
sao diferenci
aveis nos seus domnios, para todo e todo ;

(b) para todo , a carta local envia V = V S sobre um aberto Y de


Rk {0dk }.
Identificando Rk {0dk } Rk , vem que a famlia das restricoes : V Y
constitui um atlas para S; portanto, S e uma variedade de dimensao k. Se M
e variedade de classe C r e os atlas A e B sao C r -compatveis, ou seja, se todas
as mudancas de coordenadas em (a) sao de classe C r , ent
ao S e (sub)variedade
de classe C r .
Diremos que uma aplicacao f : M N entre duas variedades e diferenci
avel
se
1
f 1
(V )) (V f (U ))
(A.4.1)
: (U f
e aplicacao diferenci
avel para toda carta local : U X de M e toda carta
local : V Y de N com f (U ) V 6= . Alem disso, diremos que f e de
classe C r se M e N sao variedades de classe C r e toda aplicacao f 1

456 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
em (A.4.1) e de classe C r . Chamamos difeomorfismo a toda bijecao f : M N
tal que tanto f quanto f 1 sao diferenci
aveis; se as duas aplicacoes forem de
classe C r , diremos que o difeomorfismo e de classe C r .
Seja C r (M, N ) o espaco das aplicacoes de classe C r entre duas variedades
M e N . Vamos introduzir neste espaco uma certa topologia, chamada topologia
C r , que expressa a ideia de que duas aplicacoes est
ao proximas se elas est
ao
uniformemente proximas e o mesmo vale para as suas derivadas ate a ordem
r. A definicao pode ser dada num contexto muito amplo (veja a Secao 2.1
de Hirsch [Hir94]), mas n
os nos restringiremos ao caso em que M e N sao
compactas. Ent
ao a topologia C r pode ser definida da seguinte forma.
Fixe famlias finitas de cartas locais i : Ui Xi de M e j : Vj Yj
de N , tais que i Ui = M e j Vj = N . Seja > 0 um n
umero de Lebesgue
para a cobertura aberta {Ui f 1 (Vj )} de M . Para cada par (i, j) tal que
Ui f 1 (Vj ) 6= , seja Ki,j o conjunto dos pontos cuja distancia ao complementar
de Ui f 1 (Vj ) e maior ou igual que . Ent
ao Ki,j e um compacto contido em
Ui f 1 (Vj ) e a uni
ao i,j Ki,j e todo o M . Considere
U(f ) = {g C r (M, N ) : g(Ki,j ) Vj para quaisquer i, j}.
Claro que f U(f ). Para cada g U(f ) e cada par (i, j) tal que Ki,j e n
ao
vazio, represente por gi,j a restricao de j g 1 ao conjunto i (Ki,j ). Para
cada r N e > 0, defina
U r (f, ) = {g U(f ) : sup kDs fi,j (x) Ds gi,j (x)k < },

(A.4.2)

s,x,i,j

onde o supremo e sobre todo s {1, . . . , r}, todo x i (Ki,j ) e todo par (i, j)
tal que Ki,j 6= . Por definicao, a famlia {U r (f, ) : > 0} e uma base de
vizinhancas de cada f C r (M, N ) relativamente `a topologia C r . Tambem por
definicao, a famlia {U r (f, ) : > 0 e r N} e uma base de vizinhancas de
f C (M, N ) relativamente `a topologia C .
A topologia C r tem muito boas propriedades: em particular, ela admite base
enumer
avel de abertos e e completamente metriz
avel, ou seja, ela e gerada por
alguma distancia completa. Uma consequencia interessante e que C r (M, N ) e
um espaco de Baire: toda intersecao de uma famlia enumeravel de subconjuntos
abertos densos e densa no espaco. O conjunto Difeor (M ) dos difeomorfismos
de classe C r em M e um subconjunto aberto de C r (M, M ) relativamente `a
topologia C r .

A.4.2

Espaco tangente e aplicac


ao derivada

Seja M uma variedade. Para cada p M , considere o conjunto C(p) de todas


as curvas c : I M , onde I e um intervalo aberto contendo 0 R, tais que
c(0) = p e c e diferenci
avel no ponto 0, ou seja, a aplicacao c e diferenci
avel
no ponto 0, para toda carta local : U X com p U . Dizemos que
duas curvas c1 , c2 C(p) sao equivalentes se ( c1 ) (0) = ( c2 ) (0) para
toda carta local : U X com p U . De fato, se a igualdade vale para


A.4. VARIEDADES DIFERENCIAVEIS

457

uma carta local ent


ao ela vale para qualquer outra. Representaremos por [c] a
classe de equivalencia de qualquer curva c C(p).
O espaco tangente `
a variedade M no ponto p e o conjunto, que representaremos por Tp M , de tais classes de equivalencia. Dada qualquer carta local
: U X com p U , a aplicacao
D (p) : Tp M Rd ,

[c] 7 ( c) (0)

est
a bem definida e e um bijecao. Podemos usar esta bijecao para identificar
Tp M com Rd . Desta forma, o espaco tangente adquire uma estrutura de espaco
vetorial, transportada de Rd por D (p). Embora a identificacao D (p) depende da escolha da carta local, a estrutura de espaco vetorial em Tp M n
ao
depende. De fato, dada qualquer outra carta local : U X com p U ,
a respectiva aplicacao D (p) est
a dada por

D (p) = D 1
( (p)) D (p).

e um isomorfismo linear, segue que as estruturas de
Como D 1
( (p))
espaco vetorial transportadas por D (p) e D (p) do espaco euclideano para
Tp M coincidem, tal como afirmamos.
Se f : M N e uma aplicacao diferenci
avel, a sua derivada num ponto
p M e a aplicacao linear Df (p) : Tp M Tf (p) N definida por

Df (p) = D (f (p))1 D f 1
( (p)) D (p),

onde : U X e carta local de M com p U e : V Y e carta local


de N com f (p) V . A definicao n
ao depende da escolha destas cartas locais.
O fibrado tangente a M e a uniao T M = pM Tp M de todos os espacos
tangentes a M . Observe que esta uniao e disjunta. Para cada carta local
: U X , considere TU M = pU Tp M e a aplicacao
D : TU M X Rd
que associa a cada [c] TU M o par (( c)(0), ( c) (0)) X Rd . Consideramos em T M a (
unica) topologia que torna cada D um homeomorfismo.
Supondo que o atlas { : U X } de M e de classe C r ent
ao, a mudanca
de coordenadas
d
d
D D1
: (U U ) R (U U ) R

e aplicacao de classe C r1 para quaisquer e tais que U U 6= . Portanto,


o fibrado tangente T M est
a munido com a estrutura de variedade de classe C r1
e dimensao 2d.
A derivada de uma transformacao diferenci
avel f : M N e a aplicacao
Df : T M T N cuja restricao a cada espaco tangente Tp M est
a dada por
Df (p). Se f e de classe C r ent
ao Df e de classe C r1 , relativamente `a estrutura de variedade nos fibrados tangentes T M e T N introduzida no par
agrafo
anterior. Por exemplo, a projecao canonica : T M M que associa a cada

458 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
v TM o u
nico ponto p M tal que v Tp M e uma aplicacao de classe C r1
(Exerccio A.4.8).
Um campo de vetores numa variedade M e uma aplicacao que associa a
cada ponto p M um elemento X(p) do espaco tangente Tp M , ou seja, uma
aplicacao X : M T M tal que X = id . Dizemos que o campo de vetores
e de classe C k , com k r 1, se essa aplicacao for de classe C k .
Suponhamos que k 1. Ent
ao o teorema de existencia e unicidade de
solucoes de equacoes diferenciais garante que, para todo ponto p M , existe
uma u
nica curva cp : Ip M tal que cp (0) = p e cp (t) = X(c(t)) para todo t Ip
e Ip e intervalo aberto maximal com esta propriedade. Se M e compacta, temse Ip = R para qualquer p M . Alem disso, as transformacoes f t : M M
definidas por f t (p) = cp (t) sao difeomorfismos de classe C k , com f 0 = id e
f s f t = f s+t para quaisquer s, t R. A famlia {f t : t R} e chamada fluxo
do campo de vetores X.

A.4.3

Transversalidade

O resultado que vamos enunciar a seguir e uma das principais ferramentas para
construir novas variedades. Dizemos que y N e valor regular de uma transformacao diferenci
avel f : M N se a derivada Df (x) : Tx M Ty N e
sobrejetiva para todo x f 1 (y). Note que esta condicao e satisfeita, automaticamente, se y n
ao est
a na imagem de f . Por outro lado, para que algum ponto
y f (M ) seja um valor regular de f e necessario que dim M dim N .
Teorema A.4.2. Seja f : M N uma aplicac
ao de classe C r e seja y f (M )
1
um valor regular de f . Ent
ao f (y) e uma subvariedade (n
ao necessariamente
conexa) de classe C r de M , com dimens
ao igual a dim M dim N .
Exemplo A.4.3. Para qualquer d 1, o espaco da matrizes quadradas de
2
dimensao d com coeficientes reais e isomorfo ao espaco euclideano R(d ) e, por2

tanto, e uma variedade de dimensao d e classe C . O chamado grupo linear


GL(d, R) das matrizes invertveis e um aberto desse espaco e, portanto, tambem
e uma uma variedade de dimensao d2 e classe C . A funcao det : GL(d, R) R
que associa a cada matriz o seu determinante e de classe C e y = 1 e um valor
regular (veja o Exerccio A.4.5). Usando o Teorema A.4.2, segue que o grupo
linear especial SL(d, R), formado pelas matrizes com determinante igual a 1, e
uma subvariedade C de GL(d, R), com dimensao igual a d2 1.
possvel generalizar bastante o Teorema A.4.2, usando a nocao de transE
versalidade. Dizemos que uma subvariedade S de N e transversal a f se

Df (x) Tx M + Tf (x) S = Tf (x) N para todo x f 1 (S).
(A.4.3)

Por exemplo, se S e uma subvariedade de dimensao zero, ou seja, se ela est


a
formada por um u
nico ponto, ent
ao S e transversal a f se, e somente se, esse
ponto e um valor regular de f . Portanto, o seguinte resultado generaliza o
Teorema A.4.2:


A.4. VARIEDADES DIFERENCIAVEIS

459

Teorema A.4.4. Seja f : M N uma aplicac


ao de classe C r e seja S uma
r
subvariedade de classe C de N transversal a f . Ent
ao f 1 (S) e uma subvarir
edade (n
ao necessariamente conexa) de classe C de M , com dimens
ao igual a
dim M dim N + dim S.
O proximo teorema afirma que, para toda aplicacao diferenci
avel f : M N
de classe suficientemente elevada, quase todosos pontos y N sao valores
regulares. Dizemos que um conjunto X N e residual se ele contem alguma
intersecao enumer
avel de subconjuntos abertos e densos. Todo conjunto residual
uma variedade e denso na variedade (porque variedades sao espacos de Baire).
Dizemos que um conjunto Z N tem volume zero se para toda carta local
: V Y a imagem (Z V ) e um subconjunto do espaco euclideano
com volume zero, ou seja, ele admite coberturas por bolas tais que a soma dos
volumes dessas bolas e arbitrariamente pequena.
Teorema A.4.5 (Sard). Suponha que f : M N e aplicac
ao de classe C r
com r > max{0, dim M dim N }. Ent
ao o conjunto dos pontos regulares e um
subconjunto residual e o seu complementar tem volume zero.

A.4.4

Variedades riemannianas

Uma metrica riemanniana numa variedade M e uma aplicacao que associa a


cada ponto p M um produto interno no espaco tangente Tp M , ou seja, uma
aplicacao bilinear simetrica
p : T p M T p M R
tal que v p v > 0 para todo vetor n
ao nulo v Tp M . Como parte da definicao,
tambem pedimos que este produto interno varia diferenciavelmente com o ponto
p, no seguinte sentido. Considere qualquer carta local : U X de M .
Conforme explicado anteriormente, para cada p U podemos identificar Tp M
com Rd , via D (p), e ent
ao podemos considerar p como sendo um produto
interno no espaco euclideano. Seja e1 , . . . , ed uma base de Rd . Ent
ao, pedimos
que as funcoes g,i,j (p) = ei p ej sejam diferenci
aveis para todo par (i, j) e para
qualquer escolha da carta local e da base.
Chamamos variedade riemanniana a qualquer variedade munida de uma
metrica riemanniana. Toda subvariedade S de uma variedade riemanniana M
herda uma estrutura de variedade riemanniana, dada pela restricao do produto
interno p de M ao subespaco tangente Tp S de cada ponto p S. Toda variedade
compacta admite (infinitas) metricas riemannianas. Isso segue do teorema de
Whitney (veja a Secao 1.3 de Hirsch [Hir94]), o qual afirma que toda variedade
compacta pode ser realizada como subvariedade de algum espaco euclideano.
Na verdade, isso permanece valido na classe bem mais ampla das variedades
paracompactas (que n
ao definiremos aqui): toda variedade paracompacta de
dimensao d pode ser realizada como subvariedade de R2d . Em particular, tais
variedades sao sempre metriz
aveis.

460 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
A partir da metrica riemanniana, podemos definir o comprimento de qualquer curva diferenci
avel : [a, b] M , mediante
comp() =

k (t)k(t) dt,

onde kvkp = (v p v)1/2 .

Por sua vez, isso nos permite definir na variedade M a seguinte dist
ancia associada `
a metrica riemanniana: a distancia d(p, q) entre dois pontos p, q M
e o nfimo dos comprimentos de todas as curvas diferenci
aveis ligando os dois
pontos. Dizemos que uma curva diferenci
avel : [a, b] M e minimizante se
ela realiza a distancia entre os seus pontos extremos, isto e,
comp() = d((a), (b)).
Quaisquer dois pontos p, q M est
ao ligados por alguma curva minimizante;
em outras palavras, o nfimo na definicao de d(p, q) sempre e realizado.
Uma curva diferenci
avel : I M , definida em um intervalo aberto I, e
chamada geodesica se ela e localmente minimizante, no seguinte sentido: para
todo c I existe > 0 tal que a restricao de ao intervalo [c , c + ]
e minimizante. Toda curva minimizante e geodesica, mas a recproca n
ao e
verdadeira: por exemplo, as geodesicas da esfera S 2 sao os crculos maximos,
mas curvas fechadas nunca sao minimizantes. Um fato importante e que se
e geodesica ent
ao a norma k (t)k(t) e constante em I. A teoria das equacoes
diferenciais permite mostrar que para todo p M e todo v Tp M existe uma

u
nica geodesica p,v : Ip,v M tal que p,v (0) = p e p,v
(0) = v e Ip,v e
intervalo maximal tal que p,v e localmente minimizante.
Se a variedade M e compacta ent
ao Ip,v = R para todo p M e todo
v Tp M . Ent
ao, definimos a aplicac
ao exponencial em cada ponto p M :
expp : Tp M M,

v 7 p,v (1).

Esta e uma aplicacao diferenci


avel e a sua derivada em v = 0 e a aplicacao
identidade no espaco tangente Tp M . Tambem definimos o fluxo geodesico no
fibrado tangente
f t : T M T M,

(p, v) 7 (p,v (t), p,v


(t)).

Frequentemente, considera-se a restricao do fluxo geodesico ao fibrado tangente


unit
ario T 1 M = {(p, v) T M : kvkp = 1}. Isto est
a bem definido pois,
conforme mencionamos anteriormente, a norma do vetor velocidade de toda
geodesica e constante.

A.4.5

Exerccios

A.4.1. Verifique que todo conjunto X com cardinalidade de R pode ser munido
com uma estrutura de variedade diferenci
avel de classe C e dimensao d, para
qualquer d 1.

A.5. ESPAC
OS LP ()

461

A.4.2. Considere as variedades diferenci


aveis M = (R, A) e N = (R, B), onde
A e o atlas formado pela aplicacao (x) = x e B e o atlas formado pela aplicacao
(x) = x3 . A aplicacao f : M N definida por f (x) = x e um difeomorfismo
entre estas variedades?
A.4.3. Um espaco topol
ogico e conexo por caminhos se quaisquer dois pontos
sao ligados por alguma curva contnua. Mostre que toda variedade (conexa) e
conexa por caminhos.
A.4.4. Para cada d 2, chamamos espaco projetivo de dimens
ao d ao conjunto
Pd dos subespacos de dimensao 1 de Rd+1 . Equivalentemente, Pd e o espaco
quociente de Rd+1 \ {0} relativamente `a relacao de equivalencia definida por:
(x0 , . . . , xd ) (y0 , . . . , yd ) existe c 6= 0 tal que xi = cyi para todo i.
Mostre que a famlia das transformacoes i : Ui Rd , i = 0, . . . , d dadas por
Ui = {[x0 : : xd ] Pd : xi 6= 0} (onde [x0 : : xd ] representa a classe de
equivalencia de (x0 , . . . , xd )) e
i ([x0 : : xd ]) =

x0
xi1 xi+1
xd 
,...,
,
,...,
,
xi
xi
xi
xi

constitui um atlas de classe C e dimensao d para Pd .


A.4.5. Verifique as afirmacoes do Exemplo A.4.3.

A.4.6. Considere em R+ = {x R : x > 0} a metrica riemanniana definida


por u x v = uv/x2 . Calcule a distancia d(a, b) entre dois pontos a, b R+
A.4.7. Sejam M e N subvariedades de Rm+n , com dim M = m e dim N = n.
Mostre que existe um conjunto Z Rm+n com volume zero tal que, para todo
v no complementar de Z, o transladado M + v e transversal a N :
Tx (M + v) + Tx N = Rd

para todo x (M + v) N.

A.4.8. Mostre que se M e variedade de classe C r ent


ao a projecao canonica
: T M M e uma aplicacao de classe C r1 .

A.5

Espa
cos Lp()

Nesta secao vamos definir espacos formados por funcoes que possuem propriedades de integrabilidade especiais. Trata-se de espacos de Banach, ou seja, espacos
vetoriais normados que sao completos com respeito a essa norma. Tambem enunciaremos algumas propriedades das normas destes espacos. Ao longo da secao
(X, B, ) sera sempre um espaco de medida.

462 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE

A.5.1

Espacos Lp () com 1 p <

Dado qualquer p [1, ), dizemos que f : X C e uma func


ao p-integr
avel
com relacao a se a funcao |f |p e integravel com relacao a .

Defini
c
ao A.5.1. Denotamos por Lp () o conjunto das funcoes complexas pintegraveis com relacao a , modulo a relacao de equivalencia que identifica
quaisquer funcoes que sao iguais em -quase todo ponto.
Note que se e finita, o que ocorrera frequentemente nos nossos exemplos,
todas as funcoes mensuraveis limitadas est
ao em Lp (), uma vez que
Z
|f |p d (sup |f |)p m(X).

Em particular, se X e espaco topologico compacto ent


ao toda funcao contnua
est
a em Lp (). Em outras palavras, o espaco C 0 (X) das funcoes contnuas est
a
contido em Lp () para todo p.
Para cada funcao f Lp (), definimos a norma Lp de f :
Z
 p1
p
.
kf kp =
|f | d
O proximo teorema mostra que Lp () fica munido da estrutura de um espaco
de Banach:

Teorema A.5.2. O conjunto Lp () e um espaco vetorial complexo. Alem disso,


kf kp e uma norma em Lp () e essa norma e completa.
A parte mais interessante da demonstracao deste teorema e provar a desigualdade triangular que, neste caso, e conhecida como desigualdade de Minkowski:
Teorema A.5.3 (Desigualdade de Minkowski). Sejam f, g Lp (). Ent
ao:
Z
Z
 p1
 p1 Z
 p1

+
.
|f + g|p d
|f |p d
|g|p d
Nos Exercicios A.5.2 e A.5.5 propomos que o leitor prove a desigualdade de
Minkowski e, a partir da, complete a prova do Teorema A.5.2.

A.5.2

Produto interno em L2 ()

O caso p = 2 merece atencao especial da nossa parte. A raz


ao e que neste caso
a norma k k2 definida anteriormente vem de um produto interno (hermitiano),
a saber:
Z
f g = f g d.
(A.5.1)

Segue das propriedades da integral que esta expressao realmente define um produto interno em L2 (). Este produto se relaciona com a norma k k2 por:
kf k2 = (f f )1/2 .

Em particular, vale a desigualdade de Cauchy-Schwarz::

A.5. ESPAC
OS LP ()

463

Teorema A.5.4 (Desigualdade de Cauchy-Schwarz). Dadas f, g L2 (), ent


ao
f g L1 () e vale a desigualdade:
Z
Z
Z


1/2
1/2
f g d
|f |2 d
|g|2 d
.
Esta desigualdade tem a seguinte consequencia interessante. Suponha que a
medida e finita e seja f L2 () qualquer. Ent
ao, tomando g 1,
Z
Z
Z
Z
1/2
1/2
|f | d = |f g| d
|f |2 d
1 d
< .
(A.5.2)

Isto mostra que toda funcao em L2 () est


a em L1 (). De fato, quando a medida
p
q
e finita tem-se L () L () sempre que p q (Exerccio A.5.3).
Para valores de p quaisquer, vale a seguinte generalizacao da desigualdade
de Cauchy-Schwarz:
Teorema A.5.5 (Desigualdade de H
older). Dado 1 < p < considere q
ao, para toda f Lp () e g Lq () temos
definido pela relac
ao 1p + q1 = 1. Ent
que f g L1 () e vale a desigualdade:
Z

A.5.3

|f g| d

Z

|f | d

 p1 Z

|g| d

 q1

Func
oes essencialmente limitadas

Em seguida vamos estender a definicao dos espacos Lp () para o caso p = .


Para isso precisamos da seguinte nocao. Dizemos que uma funcao f : X C e
essencialmente limitada com relacao a se existe uma constante K > 0 tal que
|f (x)| K em -quase todo ponto. Nesse caso, chamamos supremo essencial
de f , e denotamos por supess (f ), o nfimo dos valores de K satisfazendo essa
condicao.
Defini
c
ao A.5.6. Denotamos por L () o conjunto das funcoes complexas
essencialmente limitadas com relacao a , modulo a relacao de equivalencia que
identifica quaisquer funcoes que sao iguais em -quase todo ponto.
Podemos definir uma norma em L () por
kf k = supess (f ).
Deixamos como exerccio para o leitor (veja o Exerccio A.5.5) verificar que a
conclusao da Proposicao A.5.2 permanece valida no caso p = . Mais precisamente, L () munido da norma k k e um espaco de Banach. Observe que se
e uma medida finita, ent
ao L () Lp () para qualquer p 1.
O dual de um espaco de Banach complexo E e o espaco E dos funcionais
lineares contnuos : E C, munido da norma
kk = sup


 |(v)|
: v E \ {0} .
kvk

(A.5.3)

464 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
A desigualdade de H
older (Teorema A.5.5) permite obter a seguinte caracterizacao explcita dos duais dos espacos Lp ():
Teorema A.5.7. Para cada p [1, ) considere q (1, ] caracterizado
por

R

1/p + 1/q = 1. A aplicac
ao Lq () Lp () definida por g 7 f 7 f g d e
um isomorfismo isometrico entre Lq () e o dual de Lp ().
Este enunciado e falso para p = : em geral, o dual do espaco L n
ao e
isomorfo a L1 ().

A.5.4

Convexidade

Dizemos que uma funcao : I R definida num intervalo I da reta e convexa


se para cada x, y I e t [0, 1] vale
(tx + (1 t)y) t(x) + (1 t)(y).
Alem disso, dizemos que e c
oncava se for convexa. Para funcoes duas vezes
diferenci
aveis temos o seguinte criterio pratico (Exerccio A.5.1): e convexa
se (x) 0 para todo x I e e c
oncava se (x) 0 para todo x I.
Teorema A.5.8 (Desigualdade de Jensen). Seja : I RR uma func
ao convexa. Se e uma probabilidade em X e f L1 () e tal que f d I, ent
ao:

Z

f d

f d.

Exemplo A.5.9. Para toda probabilidade e toda funcao positiva integravel


f temos
Z
Z
log f d log f d.

De fato, isto corresponde `a desigualdade de Jensen para a funcao : (0, ) R


dada por (x) = log x. Observe que e convexa: (x) = 1/x2 > 0 para
todo x.
Exemplo A.5.10. Seja : R R uma funcao convexa,
seja (i )i uma
P
sequencia de n
umeros reais n
ao negativos satisfazendo

1 e seja (ai )i
i
i=1
uma sequencia limitada de n
umeros reais. Ent
ao,
!

X
X
i (ai ).
(A.5.4)
i ai

i=1

i=1

Isto pode ser visto da seguinte forma. Considere X = [0, 1] munidoP


da medida
de Lebesgue . Seja f : [0, 1] R uma funcao da forma f (x) =
i=1 ai XEi
onde os Ei sao conjuntos mensuraveis disjuntos dois-a-dois tais que (Ei ) = i .
A desigualdade de Jensen aplicada `a funcao f d
a precisamente a relacao (A.5.4).

465

A.6. ESPAC
OS DE HILBERT

A.5.5

Exerccios

A.5.1. Considere uma funcao : (a, b) R. Mostre que se e duas vezes

diferenci
avel e > 0, ent
ao e convexa. Mostre que se e convexa ent
ao ela
e contnua.
A.5.2. Considere p, q > 1 tais que 1/p + 1/q = 1. Prove
(a) A desigualdade de Young: ab ap /p + aq /q para todo a, b > 0.
(b) A desigualdade de H
older (Teorema A.5.5).
(c) A desigualdade de Minkowski (Teorema A.5.3).
A.5.3. Mostre que se e medida finita, Lq () Lp () para 1 p < q .
A.5.4. Seja uma medida finita e seja f L () diferente de zero. Mostre
que
R
|f |n+1 d
kf k = lim R
.
n
|f |n d

A.5.5. Mostre
Pque um espaco vetorial normado (V, kk) e completo
P se, e somente
se, toda serie k vk absolutamente somavel (ou seja, tal que k kvk k converge)
e convergente. Use este fato para mostrar se e uma probabilidade, k kp e
uma norma completa em Lp () para todo 1 p .
A.5.6. Mostre que se e uma medida finitaRe 1/p + 1/q = 1 com 1 p < ,
a aplicacao : Lq () Lp () , (g)f = f g d e um isomorfismo e uma
isometria. [Observacao: Isto n
ao e verdade para p = : em geral, o dual de
L () n
ao e isomorfo a L1 ().]
A.5.7. Mostre que se X e um espaco metrico ent
ao, dada qualquer probabilidade boreliana , o conjunto C 0 (X) das funcoes contnuas e denso em Lp ()
para todo 1 p . De fato, o mesmo vale para o subconjunto das funcoes
uniformemente contnuas limitadas.
A.5.8. Sejam f, g : X RR funcoRes mensuraveis positivas tais que f (x)g(x) 1
para todo x. Mostre que f d g d 1 para toda probabilidade .

A.6

Espa
cos de Hilbert

Seja H um espaco vetorial, real ou complexo. Um produto interno em H e uma


aplicacao (u, v) 7 u v de H H no corpo dos escalares (R ou C, respectivamente) satisfazendo: para quaisquer u, v, w H e qualquer escalar ,
1. (u + w) v = u v + w v
2. (u) v = (u v)
3. u v = v u;

u (v + w) = u v + u w;

v);
u (v) = (u

466 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
4. u u 0

u u = 0 se, e somente se, u = 0.

Ent
ao, definimos a norma de um vetor u H como sendo kuk = (u u)1/2 .
Um espaco de Hilbert e um espaco vetorial munido de um produto interno
cuja norma kk e completa: relativamente a kk toda sequencia de Cauchy e convergente. Em outras palavras, H munido dessa norma e um espaco de Banach.
Um exemplo padr
ao e o espaco L2 () das funcoes com quadrado integravel num
espaco de probabilidade (M, B, ), munido do produto interno:
Z
= d.
Dado
P v H e uma famlia qualquer (v ) de vetores de H, dizemos que
v = v se para todo > 0 existe um conjunto finito I tal que
kv

v k

para todo conjunto finito J I.

Dada qualquer
P famlia (H ) de subespacos de H, o conjunto dos vetores da
forma v =
e um subespaco de H (veja o
v com v H para todo
Exerc
cio
A.6.2).
Ele

e
chamado
soma
da
fam
lia
(H ) e e representado por
P
H
.

A.6.1

Ortogonalidade

Seja H um espaco de Hilbert. Dois vetores u, v H dizem-se ortogonais se


u v = 0. Um subconjunto de H diz-se ortonormado se os seus elementos tem
norma 1 e sao ortogonais dois-a-dois.
Uma base de Hilbert de H e um subconjunto ortonormado B = {v } tal que
o conjunto das combinacoes lineares (finitas) dos elementos de B e denso em H.
Por exemplo, a base de Fourier
{x 7 e2ikx : k Z}

(A.6.1)

e uma base de Hilbert do espaco L2 (m) das funcoes mensuraveis no crculo


unit
ario C cujo quadrado e integravel para a medida de Lebesgue. Um base de

Hilbert n
ao precisa ser uma base do espaco vetorial no sentido usual da Algebra
Linear (base de Hammel). Por outro lado, se B = {v } e base de Hilbert ent
ao
todo vetor v H pode ser escrito como combinacao linear infinita dos elementos
de B:
X
X
v=
(v v )v e, alem disso, kvk2 =
|v v |2 .

Em particular, v v = 0 exceto, possivelmente, para um conjunto enumeravel


de valores de .
Todo subconjunto ortonormado de H pode ser estendido a uma base de
Hilbert. Em particular, bases de Hilbert sempre existem. Alem disso, duas
bases de Hilbert quaisquer tem o mesmo cardinal, que e chamado dimens
ao de

467

A.6. ESPAC
OS DE HILBERT

Hilbert de H. A dimensao depende monotonamente do espaco: se H1 e subespaco de H2 ent


ao dim H1 dim H2 . Dizemos que dois espacos de Hilbert sao
isometricamente isomorfos se existe algum isomorfismo entre eles preservando
o produto interno. Isso acontece se, e somente se, os dois espacos tem a mesma
dimensao de Hilbert.
Um espaco de Hilbert diz-se separ
avel se existe algum subconjunto enumeravel denso (para a topologia definida pela norma). Isto acontece se, e somente se, a dimensao e enumer
avel ou finita. Em particular, todos os espacos de
Hilbert separ
aveis de dimensao infinita sao isometricamente isomorfos. Por essa
raz
ao, e usual encontrar na literatura (sobretudo na area de Fsica Matem
atica)
mencoes ao espaco de Hilbert, no singular.
Dada uma famlia qualquer (H ) de espacos de Hilbert, denotamos
Q por
H a sua
soma
direta
ortogonal,
ou
seja
o
espa
c
o
vetorial
dos
(v
)

H
P
tais que kv k2 < (isto implica que v = 0 exceto, possivelmente, para
um conjunto enumer
avel de valores de ), munido do produto interno
X
(v ) (w ) =
v w
.

O complemento ortogonal de um subconjunto S de um espaco de Hilbert


e o conjunto S de todos os vetores de H que sao ortogonais a todo vetor de
f
S. E
acil ver que S e um subespaco fechado de H (Exerccio A.6.7). Se S
e um subespaco fechado de H ent
ao S = (S ) e todo vetor v H pode ser
decomposto, de forma u
nica, como soma v = s + s de algum s S e algum

s S . Alem disso, essa decomposicao e u


nica e os vetores s e s sao os
elementos dos respectivos subespacos mais proximos de v.

A.6.2

Dualidade

Um funcional linear num espaco de Hilbert H (ou, mais geralmente, num espaco
de Banach) e uma aplicacao linear de H no corpo dos escalares (R ou C). O
funcional linear e limitado se
kk = sup


 |(v)|
: v 6= 0 <
kvk

(isto e equivalente a dizer que o funcional e contnuo relativamente `a topologia


definida pela norma de H; veja o Exerccio A.6.3). O dual de um espaco de
Hilbert H e o espaco vetorial H dos funcionais lineares contnuos. A funcao
7 kk e uma norma completa em H e, portanto, mune o dual de uma
estrutura de espaco de Banach. A aplicacao


h : H H , w 7 v 7 v w
(A.6.2)

e uma bijecao entre os dois espacos e preserva as normas. Alem disso, ela satisfaz

h(w1 + w2 ) = h(w1 ) + h(w2 ) e h(w) = h(w).


A topologia fraca em H e a topologia menos fina relativamente `a qual todos
os funcionais lineares v 7 v w sao contnuos. Em termos de sequencias, ela

468 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
tem a propriedade de que
(wn )n w fracamente

(v wn )n v w para todo v H.

A topologia fraca no dual H e a topologia menos fina relativamente `a qual


7 (v) e contnua para todo v H.
sabido da teoria de espacos de Banach (teorema de Banach-Alaoglu) que
E
todo subconjunto fechado limitado (para a norma) do dual e compacto para a
topologia fraca . No caso dos espacos de Hilbert, a topologia fraca no espaco
H e homeomorfa `
a topologia fraca no dual H . Mais ainda, conforme mostra
(A.6.2), o homeomorfismo pode ser tomado preservando a classe dos conjuntos
limitados. Segue, portanto, que a topologia fraca no proprio espaco H disfruta
da propriedade no teorema de Banach-Alaoglu:
Teorema A.6.1 (Banach-Alaoglu). Todo subconjunto fechado limitado de um
espaco de Hilbert H e compacto para a topologia fraca em H.
Um operador linear L : H1 H2 entre dois espacos de Hilbert e contnuo
(ou limitado) se

 |L(v)|
: v 6= 0 < .
kLk = sup
kvk

O adjunto de um operador linear contnuo e o operador linear L : H2 H1


definido por
v Lw = L v w para todo v, w H.

O operador adjunto e contnuo, com kL k = kLk e kL Lk = kLL k = kLk2 .


(propomos, no
Alem disso, (L ) = L e (L1 + L2 ) = L1 + L2 e (L) = L
Exerccio A.6.5, que o leitor prove estes fatos).
Um operador linear contnuo L : H H e autoadjunto se L = L . Mais
geralmente, um operador linear contnuo e normal se ele satisfaz L L = LL .
Ao longo do texto, estaremos especialmente interessados no caso em que L e
unit
ario, isto e, L L = id = LL . Chamamos isometria a todo operador
linear L : H H tal que L L = id . Portanto, os operadores unit
arios sao as
isometrias lineares que tambem sao operadores normais.

A.6.3

Exerccios

A.6.1. Seja H um espaco de Hilbert. Prove que:


1. Toda bola (fechada ou aberta) num espaco de Hilbert e um conjunto convexo.
2. A identidade do paralelogramo: kv + wk2 + kv wk2 = kvk2 + kwk2 para
quaisquer v, w H.
3. A identidade de polarizac
ao: 4(v w) = kv + wk2 kv wk2 (caso real)
2
ou 4(v w) = (kv + wk kv wk2 ) + i(kv + iwk2 kv iwk2 ) (caso
complexo).

A.7. TEOREMAS ESPECTRAIS

469

A.6.2. Mostre que, dada uma


P famlia (H ) de subespacos de H, o conjunto
dos vetores da forma v = v com v H para todo e um subespaco
vetorial de H.
A.6.3. Mostre que um operador linear L : E1 E2 entre dois espacos de
Banach e contnuo se, e somente se, existe C > 0 tal que kL(v)k2 Ckvk1 para
todo v E1 , onde k ki representa a norma no espaco Ei (dizemos que L e um
operador limitado).
A.6.4. Considere o espaco de Hilbert L2 (). Seja V o subespaco das funcoes
constantes. Quando uma funcao f L2 () pertence ao complemento ortogonal
de V ? Determine a projecao em V de uma funcao g L2 ().
A.6.5. Prove que se L : H H e um operador limitado em um espaco de
Hilbert H ent
ao o operador adjunto L tambem e limitado e kL k = kLk e

kL Lk = kLL k = kLk2 e (L ) = L.
A.6.6. Mostre que se K e um subconjunto fechado e convexo de um espaco de
Hilbert, para todo z H existe um u
nico v K tal que kz vk = d(z, K).
A.6.7. Seja S um subespaco de um espaco de Hilbert H. Prove que
1. O complementar ortogonal S de S e um subespaco fechado de H e coin Alem disso, (S ) = S.

cide com o complementar ortogonal do fecho S.


2. Todo v H pode ser escrito, de forma u
nica, como soma v = s + s de

algum s S e algum s S . Os vetores s e s sao os elementos dos


respectivos subespacos mais proximos de v.
A.6.8. Seja E um subespaco fechado de um espaco de Hilbert H. Mostre que
E tambem e fechado na topologia fraca. Alem disso, U (E) e um subespaco
fechado de H, para toda isometria U : H H.
A.6.9. Mostre que um operador linear L : H H num espaco de Hilbert H e
uma isometria se, e somente se, kL(v)k = kvk para todo v H. Alem disso, L
e um operador unit
ario se, e somente se, ele e uma isometria e e invertvel.

A.7

Teoremas espectrais

Seja H um espaco de Hilbert complexo. O espectro de um operador linear


contnuo L : H H e o conjunto esp(L) dos n
umeros C tais que L id
n
ao e um isomorfismo. O espectro e fechado e est
a contido no disco fechado
com centro em zero e raio igual a kLk. Em particular, esp(L) e um subconjunto
compacto do plano complexo. Quando H tem dimensao finita, esp(L) est
a
formado pelos lores de L, ou seja, os n
umeros complexos tais que L id
n
ao e injetivo. Em geral, o espectro e estritamente maior que o conjunto dos
autovalores (veja o Exerccio A.7.2).

470 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE

A.7.1

Medidas espectrais

Por definicao, uma projec


ao em H e um operador linear contnuo P : H H
que e idempotente (P 2 = P ) e autoadjunto (P = P ). A imagem e o n
ucleo de
P sao subespacos fechados de H e sao complementares ortogonais um do outro.
De fato, a imagem coincide com o conjunto dos pontos fixos de P .
Considere uma aplicacao E associando a cada subconjunto mensuravel do
plano C uma projecao em H. Essa aplicacao e chamada de medida espectral se
ela satisfaz E(C) = id e e -aditiva:
[
 X
E
Bn =
E(Bn )
nN

nN

sempre que os Bn sao disjuntos dois-a-dois. Ent


ao, dados quaisquer v, w H,
a funcao
Ev w : B 7 E(B)v w
(A.7.1)

e uma medida complexa em C. Claramente, ela depende de modo bilinear da


dupla (v, w).
Chamamos suporte de uma medida espectral E o conjunto supp E dos pontos
z C tal que E(V ) 6= 0 para toda vizinhanca V de z. Observe que o suporte e
sempre um conjunto fechado. Alem disso, o suporte da medida complexa Ev w
est
a contido em supp E para todo v, w.
Exemplo A.7.1. Considere {1 , . . . , s } C e seja V1 , . . . , Vs uma famlia
finita de subespacos de Cd , ortogonais dois-a-dois e tais que Cd = V1 Vs .
Para cada conjunto J {1, . . . , s}, denote por PJ a projecao em Cd cuja imagem
e jJ Vj . Para cada conjunto mensuravel B C defina
E(B) : Cd Cd ,

E(B) = PJ(B)

onde J(B) e o conjunto dos j {1, . . . , s} tais que j B. A funcao E e uma


medida espectral.
Exemplo A.7.2. Seja uma probabilidade em C e seja H = L2 () o espaco
das funcoes complexas com quadrado integravel para . Para cada conjunto
mensuravel B C defina
E(B) : L2 () L2 (),

7 XB .

Cada E(B) e uma projecao e a funcao E e uma medida espectral.


O lema a seguir reune algumas propriedades simples das medidas espectrais:
Lema A.7.3. Seja E uma medida espectral e sejam A, B subconjuntos mensur
aveis de C. Ent
ao:
1. E() = 0 e E(supp E) = id ;
2. se A B ent
ao E(A) E(B) e E(B \ A) = E(B) E(A);

471

A.7. TEOREMAS ESPECTRAIS


3. E(A B) + E(A B) = E(A) + E(B);
4. E(A)E(B) = E(A B) = E(B)E(A).

No que segue suporemos que E e uma medida espectral com suporte compacto. Ent
ao o suporte de toda
R medida complexa Ev w tambem e compacto.
Consequentemente, a integral z d(E(z)v w) est
a bem definida e e uma funcao
bilinear de (v, w). Ent
ao existe um operador linear limitado L : H H tal que
Z
Lv w = z d(E(z)v w) para todo v, w H.
(A.7.2)
Escrevemos, numa forma mais sucinta:
Z
L = z dE(z).

(A.7.3)

Mais geralmente, dada qualquer funcao mensuravel limitada no suporte da


medida espectral E, existe um operador linear limitado (L) : H H caracterizado por
Z
(L)v w = (z) d(E(z)v w) para todo v, w H.
(A.7.4)
Escrevemos
(L) =

(z) dE(z).

(A.7.5)

Lema A.7.4. Seja E uma medida espectral. Dadas func


oes mensur
aveis limitadas , e n
umeros , C,
R
R
R
(1) ( + )(z) dE(z) = dE(z) + dE(z);

R
R
(z) dE(z) ;
(2) (z)
dE(z) =
R
R
 R

(3) ()(z) dE(z) =
(z) dE(z)
(z) dE(z)
Em particular, pelo item (3) do lema,
Z
Z
j
Lj =
z dE(z) = z j dE(z)

para todo j N.

Analogamente, usando tambem o item (2),


Z
Z
Z


LL =
z dE(z)
z dE(z) = |z|2 dE(z)
Z
Z


=
z dE(z)
z dE(z) = L L.

(A.7.6)

(A.7.7)

Consequentemente, o operador linear definido por (A.7.3) e normal. O teorema


espectral, que enunciamos a seguir, afirma que todo operador normal pode ser
escrito desta forma:

472 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE
Teorema A.7.5 (Espectral). Para todo
R operador normal L : H H existe
uma medida espectral E tal que L = z dE(z). Essa medida e u
nica e o seu
suporte coincide com o espectro de L. Em particular, L e unit
ario se, e somente
se, supp E est
a contido no crculo unit
ario {z C : |z| = 1}.
Exemplo A.7.6 (Teorema espectral em dimensao finita). O teorema espectral
em dimensao finita afirma que para todo operador normal complexo L existe
uma base de Hilbert formada por autovetores de L. Sejam 1 , . . . , s os autovalores de L. Os autoespacos Vj = ker(L j id ) sao ortogonais dois-a-dois,
porque L e normal. Alem disso, pelo Teorema A.7.5, a soma direta sj=1 Vj e
todo o Cd . Ent
ao
s
X
j j
L=
j=1

onde j representa a projecao sobre Vj . Em outras palavras, a medida espectral


E do operador L e dada por E({j }) = j para cada j = 1, . . . , s e E(B) = 0
se B n
ao contem nenhum autovalor de L.
Exemplo A.7.7. Seja ( )A uma famlia qualquer de medidas finitas no
crculo unit
ario {z C : |z| = 1}. Considere H = A L2 ( ) e o operador
linear
L : H H, ( ) 7 (z 7 z (z)) .
Considere a medida espectral dada por
E(B) : H H,

( )
7 (XB )
R
(compare com o Exemplo
A.7.2). Ent
ao L = z dE(z). De fato, a definicao de
P
E d
a que E = para todo = ( ) e = ( ) no espaco
H. Ent
ao,
Z
XZ

L =
z (z) (z) d (z) = z d(E(z) )
(A.7.8)

para todo , .
Dizemos que e um
atomo da medida espectral se E({}) 6= 0 ou, equivalentemente, se existe algum vetor n
ao nulo H tal que E({}) 6= 0. A
demonstracao da proposicao a seguir est
a delineada no Exerccio A.7.4.
Proposi
c
ao A.7.8. Todo autovalor de L e
atomo da medida espectral E. Reciprocamente, se e
atomo de E ent
ao ele e autovalor do operador L, tendo
qualquer vetor n
ao nulo da forma v = E({}) como autovetor.

A.7.2

Representac
ao espectral

O Teorema A.7.5 mostra que os operadores lineares normais num espaco de Hilbert sao essencialmente a mesma coisa que as medidas espectrais nesse espaco.
Resultados deste tipo, que estabelecem um dicionario entre duas classes de

473

A.7. TEOREMAS ESPECTRAIS

objetos que a priori n


ao est
ao relacionadas, est
ao entre os mais fascinantes da
Matem
atica. Claro que a sua utilidade para o estudo de uma dessas classes (os
operadores lineares normais, digamos) depende de ate que ponto somos capazes
de compreender a outra classe (neste caso, as medidas espectrais). Na presente
situacao isso e atendido, de modo inteiramente satisfat
orio, pelo proximo resultado, que exibe uma forma can
onica (inspirada no Exemplo A.7.2) na qual todo
operador normal pode ser escrito.
Como antes, usamos para representar a soma direta ortogonal de espacos
de Hilbert. Dado um cardinal , finito ou infinito, e um espaco de Hilbert V ,
representamos por V a soma direta ortogonal de c
opias de V .
Teorema A.7.9 (Representacao espectral). Seja L : H H um operador
linear normal. Ent
ao existem medidas finitas mutuamente singulares (j )j com
suporte no espetro de L, existem cardinais (j )j e existe um operador unit
ario
U : H j L2 (j )j , tal que o operador conjugado U LU 1 = T e dado por:
T :

M
j

L2 (j )j

L2 (j )j ,


(j,l )j,l 7 z 7 zj,l (z) j,l .

(A.7.9)

Chamaremos (A.7.9) de representac


ao espectral do operador normal L. Deve
ser observado que as medidas j no Teorema A.7.9 n
ao sao unicamente determinadas. Mas a representacao espectral e u
nica, no seguinte sentido.
Chamamos func
ao de multiplicidades do operador L `a funcao que a cada
medida finita em C associa o menor cardinal j tal que as medidas e j
n
ao sao mutuamente singulares. Mostra-se que esta funcao est
a unicamente
determinada pelo operador L, ou seja, ela n
ao depende da escolha das medidas
j no enunciado. Alem disso, dois operadores normais sao conjugados por um
operador unit
ario se, e somente se, eles tem a mesma funcao de multiplicidades.
Exemplo A.7.10 (Representacao espectral em dimensao finita). Voltamos ao
contexto do Exemplo A.7.6. Para cada j = 1, . . . , s, seja j a medida de Dirac
no autovalor j e seja j a dimensao do autoespaco Vj . Note que o espaco
L2 (j ) tem dimensao 1. Portanto, podemos escolher um operador unitario
Uj : Vj L2 (j ), para cada j = 1, . . . , s. Como L = j id restrito a Vj , temos
que Tj = Uj LUj1 = j id , ou seja,



Tj : ( )
7
z 7 j (z) = z 7 z (z) .

Desta forma fica definido um operador unit


ario
U : Cd

s
M

L2 (j )j .

j=1

tal que T = U LU 1 e a representacao espectral de L.

474 APENDICE
A. ELEMENTOS DE MEDIDA, TOPOLOGIA E ANALISE

A.7.3

Exerccios

A.7.1. Seja T : E E um isomorfismo de espaco de Banach, ou seja, uma


bijecao linear contnua com inversa contnua. Moste que T +H e um isomorfismo
de espaco de Banach para toda aplicacao linear tal que kHk kT 1k < 1. Use
este fato para provar que o espectro de todo operador linear limitado L : E E
e fechado e est
a contido no disco fechado de raio igual a kLk.
A.7.2. Mostre que se L : H H e um operador linear num espaco de Hilbert
de dimensao finita ent
ao esp(L) est
a formado pelos autovalores de L, ou seja,
pelos n
umeros complexos para os quais Lid n
ao e injetivo. De um exemplo,
em dimensao infinita, tal que o espectro e estritamente maior que o conjunto
dos autovalores.
A.7.3. Prove o Lema A.7.3.
A.7.4. Prove a Proposicao A.7.8, usando o seguinte roteiro:
1. Suponha que Lv = v para algum v 6= 0. Considere as funcoes

(z )1 se |z | > 1/n
n (z) =
0
caso contrario.
Mostre que n (L)(Lid ) = E({z : |z | > 1/n}) para todo n. Conclua
que E({})v = v e, portanto, e atomo de E.
2. Suponha que existe w H tal que v = E({})w e n
ao nulo. Mostre que,
dado qualquer conjunto mensuravel B C,

v se B
E(B)v =
0 se
/ B.
Conclua que Lv = v e, portanto, e autovalor de L.
A.7.5. Seja (j ) a famlia de medidas dada no Teorema A.7.9. Dado um conjunto mensuravel B C, verifique que E(B) = 0 se, e somente se, j (B) = 0
para todo j. Portanto, dada qualquer medida em C, temos que E se, e
somente se, j para todo j.

Dicas e solu
c
oes dos
exerccios
1.1.1. Seja P = {p, . . . , f k+1 (p)}. A medida p,k
e invariante se, e somente se, #A P =
#f 1 (A) P qualquer que seja o conjunto mensur
avel A M . Considerando A = P , mostre
que isso acontece se, e somente se, f k (p) = p.
1.1.2. Use o Exerccio A.3.5 para aproximar funco
es caractersticas por funco
es contnuas.
1.1.3. Argumente, por induca
o em k, que se (f 1 (A)) = (A) para todo conjunto mensur
avel A M ent
ao (f k (A)) = (A) para todo conjunto mensur
avel A M .
1.1.4. Como (B) = (f 1 (B)), as condico
es (1) e (2) s
ao equivalentes. Segue que qualquer
uma delas
e equivalente a (3). Al
em disso,
e imediato que (4) implica (1). Supondo que vale
j (B).

(1), tome C =
k=1 j=k f

1.1.5. Use a f
ormula de mudanca de vari
aveis em integrais.
1.2.1. Para cada k 1, seja Ek o conjunto dos pontos x E que regressam a E, pela primeira
vez, em exatamente k iterados. O teorema de Poincar
e afirma que (k Ek ) = (E) > 0. Logo
(EN ) > 0 para algum N . Reciprocamente, se o teorema de Poincar
e fosse falso, existiriam
E F tais que (E) > 0 e nenhum ponto de E regressa a F . Tomando D = E, isso
contradiria a hip
otese.
1.2.2. Seja F o conjunto dos pontos x E com n
umero finito de iterados em B e seja E0
o conjunto dos pontos x E \ F que nunca regressam
a E. Mostre que os iterados f n (E0 ),
P
n (B)) (B) < . Por outro
n 1P
s
ao disjuntos dois-a-dois e conclua que
n (E0 f
lado,
X
(x)
=

para
todo
x

E
.
Deduza
que
(E0 ) = 0. Para cada k 1,
n
0
(B)
n f
seja Ek o conjunto dos pontos x E \ F que regressam a E exatamente k vezes. Mostre, por
induca
o, que (Ek ) = 0 para todo k.
1.2.3. Utilize o exerccio anterior com B = Mk e, em seguida, tome a interseca
o sobre todos
os valores de k.
1.2.4. Seja D0 o conjunto dos x D onde o limite
e zero. Ent
ao limn (1/n)#{0 j n 1 :
f j (x) D0 } tamb
em
e zero,
todo x D0 . Deduza que o mesmo vale em todo ponto, ou
Ppara
j
seja, que a sequ
encia (1/n) n1
j=0 XD0 (f (x)) converge para zero para todo x M . Conclua,
usando o teorema da converg
encia dominada, que (D0 ) = 0.
1.2.5. Mostre que se N > 1/(A), ent
ao existe j VA com 0 j N . Adaptando a
prova da afirmaca
o anterior, conclua que se K
e um conjunto de inteiros n
ao-negativos com
#K > 1/(A), ent
ao podemos achar k1 , k2 K e n VA tais que n = k1 k2 . Ou seja, o
conjunto K K = {k1 k2 ; k1 , k2 K} intersecta VA . Para concluir que S
e sind
etico assuma,
por absurdo, que para cada n N existe uma n
umero ln tal que {ln , ln +1, . . . , ln +n}VA = .
Considere um elemento k1
/ VA e construa recursivamente a sequ
encia kj+1 = lj + kj . Prove
que o conjunto K = {k1 , . . . , kN }
e tal que (K K) VA = .

1.2.6. Se a conclus
ao n
ao
e verdadeira, existe k 1 e b > 1 tal que o conjunto B = {x
[0, 1] : n|f n (x) x| > b para todo n k} tem medida positiva. Tome a B um ponto de
densidade de B. Considere E = B B(a, r), para r pequeno. Obtenha uma estimativa inferior

475


DICAS E SOLUC
OES
DOS EXERCICIOS

476

para o tempo de retorno a E de qualquer ponto x E e use o teorema de Ka


c para chegar a
uma contradica
o.
1.2.7. Dado >
0, temos | qn | < para todo n suficientemente grande. Conclua
que
|R(qn )| | qn |( 5+). Justifique que n2 |R(qn )| 1 e conclua que n2 | qn | 1/( 5+)
para todo n suficientemente grande.
1.3.1. Particione o intervalo em Ii = [i/10, (i + 1)/10) com i = 0, . . . , 9 e tome 1.
1.3.2. Observe que E = [0, 617, 0, 618) tem medida positiva e aplique o teorema de recorr
encia
de Poincar
e. Note que todo intervalo J = [j/10k , (j + 1)/10k ) cont
em subintervalo J tal que
m(J )/m(J) = 103 e f k (x) E para todo x J . Usando o Teorema A.2.14, conclua quase
todo x [0, 1] tem pelo menos um iterado em E. Agora a segunda afirmaca
o no exerccio
e
uma consequ
encia da primeira.
1.3.3. Observe que E = (1/618, 1/617) tem medida positiva, para a medida invariante da
transformaca
o de Gauss e aplique o teorema de recorr
encia de Poincar
e. Lembre que a medida

e equivalente `
a medida de Lebesgue.
1.3.4. Verifique que se x = p/q com 0 < p < q ent
ao G(x) = q /p com 0 q < p. Deduza
que Gn (x) = 0 para algum n. Reciprocamente, se xn = Gn (x) = 0 para algum n ent
ao a
express
ao (1.3.3) mostra que x
e um n
umero racional.
1.3.5. Considere a sequ
encia log10 an onde log10 representa o logaritmo na base 10 e observe
que log10 2
e um n
umero irracional.
1.3.6. Seja d 1 o grau de f , ou seja, d = #f 1 (y) para todo y. Para cada y M e toda
vizinhanca suficientemente pequena V , a pr
e-imagem f 1 (V ) tem d componentes conexas,
V1 , . . . , Vd , tais que cada restrica
o fj = f | Vj
e um difeomorfismo sobre V . Suponha que f
preserva a medida = vol. Ent
ao, por mudanca de vari
aveis,
Z
Z
Z
d
d
X
X
d vol =
d vol =
( fj1 )| det Dfj1 | d vol .
V

j=1

Vj

j=1

P
Fazendo o raio de V ir para zero, deduza que (y) = dj=1 (fj1 (y))| det Dfj1 (y)|. Reciprocamente, se esta igualdade vale em todo ponto ent
ao (V ) = (f 1 (V )) para todo conjunto
V com di
ametro suficientemente pequeno. Deduza que f preserva .
1
1.3.7. Verifique que #fA
(y) = | det A| para todo y e utilize o Exerccio 1.3.6 com 1.

1.3.8. Considere os intervalos da forma Ik,j = [(j 1)2k , j2k ) com k 1 e 1 j 2k .


Usando que
e invariante pela rotaca
o R2k , mostre que (Ik,j ) = 2k = m(Ik,j ) para todo
j e todo k. Conclua que = m.
1.3.9. Seja k = (k1 , . . . , kd ) Zd \ {0} tal que k Z. Defina ([x]) = e2ikx e verifique
que
e invariante. Como
e n
ao constante, podemos encontrar conjuntos abertos disjuntos
A, B C tais que U = 1 (A) e V = 1 (B) s
ao n
ao vazios. Toda
orbita que intersecta U
n
ao intersecta V , logo n
ao existe nenhuma
orbita densa.
P
1.3.10. (Katok, Hasselblatt [KH95]) Considere a s
erie de Fourier XV = kZd ak e2ikx da
funca
o caracterstica de V . Usando a invari
ancia de V e a hip
otese de que
e racionalmente
independente, conclua que ak = 0 para todo k 6= 0. Deduza que V tem medida de Lebesgue
e invaritotal e, portanto,
e denso em Td . Dado qualquer aberto U , observe que nZ Rn
(U )
ante pela rotaca
o e aplique a conclus
ao anterior. Seja {Uk : k 1} uma base enumer
avel de
abertos de Td . Mostre que X = k n Rn
(U
)

e
n
a
o
vazio
e
todo
[x]

X
tem
o

rbita
densa.
k

Fixe qualquer [x] X. Dado qualquer [y] Td , considere h = Ryx . Note que h([x]) = [y] e
h R h1 = R . Conclua que O([y])
e densa.
1.3.11. Calcule o divergente do campo de vetores hamiltoniano e use o Teorema 1.3.7.
1.3.12. Considere bases ortonormadas {v1 , v2 , . . . , vd }, em x, e {w1 , w2 , . . . , wd }, em f (x),
tais que v1 e w1 s
ao ortogonais a Hc . Verifique que grad H(f (x)) Df (x)v = grad H(x) v
para todo v. Deduza que a matriz de Df (x) relativamente a essas bases tem a forma

0
2 2,2 2,d

Df (x) =


d d,2 d,d

477
com k grad H(f (x))k || = k grad H(x)k. Note que = (i,j )i,j
e a matriz de D(f | Hc )
e observe que | det | = k grad H(x)k/k grad H(f (x))k. Usando a f
ormula de mudanca de
vari
aveis, conclua que f | Hc preserva a medida ds/k grad Hk.
1.4.1. Considere os intervalos Ik = (1/2k+1 , 1/2k ) e observe que f (Ik ) = Ik1 para todo
k 1 e, portanto, (x) = k para x Ik . Observe que f (1) = 1 e f (1/2k ) = 1/2k1 . Mostre
que se g est
a C 1 pr
oxima de f , existe z0 pr
oximo de 1 tal que g(z0 ) = z0 e existem zk , k 1
tais que g(zk ) = zk1 e para todo k 1 e |zk1 z k| decresce exponencialmente.
1.4.2. Verifique que existem 1 , 2 , 3 > 0 tais que 1 xd Df (x) 1 2 xd e |D 2 f (x)|
3 xd1 para x > 0 perto de zero. Seja h a inversa de f | (0, a). Deduza que Dh(y) 1 y d
para y perto de zero e, portanto, existem 2 > 1 > 0 tais que y 1 y d+1 h(y) y 2 y d+1
para y numa vizinhanca de zero. Fixe k 1 tal que aj est
a nessa vizinhanca para todo j k.
Fixe K2 > 1 > K1 > 0 tais que 1 + K1 x (1 + x)1/d 1 + K2 x para 0 x 1. Escolha
c2 > c1 > 0 tais que c1 aj j 1/d c2 para todo 1 j k. Conclua, por induca
o, que







c1
c1
1
c1 d+1
d1
1

aj+1 = h(aj )

1
+
K
2
2
1
1
j
j
j 1/d
j 1/d
(j + 1)1/d
Tome c1 tal que 22 cd1 < K1 e conclua que aj+1 c1 /(j + 1)1/d . A cota superior
e an
aloga,
tomando 1 cd2 > K2 . Deduza a segunda P
parte do exerccio, com c3 = 1 cd+1
e c4 = 2 cd+1
.
1
2
Finalmente, (1.4.5) d
a que ((0, 1)) =
n=0 ((0, an )). Usando o fato de que a densidade
de
e limitada, conclua que ((0, 1)) < se, e somente se, d < 1.
1.4.3. g(x) = f k (x) para todo x Bk = {(xn )n : x0 = xk = 1 e xi 6= 1 para 0 < i < k}.
1.4.4. Escolha um conjunto E com medida menor que /n e, para cada k 1, seja Ek dos
pontos x E que retornam a E em exatamente k iterados. Tome para B a uni
ao dos conjuntos
Ek com k n, dos n-
esimos iterados dos conjuntos Ek com k 2n, e assim sucessivamente.
Para a segunda parte, observe que se (f, )
e aperi
odico ent
ao n
ao pode ter
atomos.
1.4.5. Pela hip
otese, f (y) Hn (y) sempre que y Hn com n > (y). Portanto T (y) H
Pl
i
se y H. Considere An = {1 j n : x Hj } e Bn = {l 1 :
i=0 (T (x)) n}.
Mostre, por induca
o, que #An #Bn e deduza que lim supn #Bn /n . Agora suponha
P
i
que lim inf k (1/k) k1
i=0 (T (x)) > (1/). Mostre que existe 0 < tal que #Bn < 0 n, para
todo n suficientemente grande. Esta conclus
ao contradiz a anterior.
1.4.6. Como n+1 (x) n (x) = (f n (x)), temos que n+1 (x)/n (x) 1 se, e somente se,
ltima relaca
o
e v
alida em quase todo ponto,
(f n (x))/n (x) 0. Para provar que esta u
seja D o conjunto dos pontos x tais que lim supn (f n (x) (x))/n (x) > 0. P
Verifique que, para
cada fixado, os conjuntos L (n) = {x M : (x) > n} satisfazem
n (L (n)) < .
Mostre que D Q m1 nm f n (L (n)). Em seguida, use o lema de Borel-Cantelli
para concluir que (D) = 0.
1.5.1. Considere f1 (x) = x/2 e f2 (x) = (x + 1)/2.
1.5.2. Aplique o Lema de Zorn no conjunto G dos subconjuntos fechados de M , munido da
relaca
o de ordem dada pelo inverso da inclus
ao.
1.5.3. Considere qualquer sequ
encia (pn )n em M tal que ((pn ))n converge para sup . Seja
p um ponto de acumulaca
o.
1.5.4. Suponha que
e semicontnua superiormente. Para cada k 1, seja Fk o conjunto dos
pontos x X tais que toda vizinhanca cont
em algum y tal que (y) (x) (1/k). Verifique
que Fk
e fechado e tem interior vazio. Al
em disso, o conjunto dos pontos de continuidade de
etrico compacto
e um

e k Fkc . Para a parte final do exerccio, lembre que todo espaco m


espaco de Baire.
1.5.5. Observe que as aplicaco
es f, f 2 , . . . , f k comutam e, em seguida, use o teorema de
recorr
encia m
ultipla de Poincar
e.
1.5.6. Por definica
o, o complementar de (f1 , . . . , fq )c
e um aberto. O teorema de recorr
encia
m
ultipla de Birkhoff garante que o conjunto n
ao errante
e n
ao vazio.
2.1.1. As condico
es (1), (2), (3), (4) e (5) significam que a sequ
encia (n )n converge nas
topologias (2.1.1), (2.1.3), (2.1.4), (2.1.5) e (2.1.2), respectivamente. Como estas topologias
coincidem (Teorema 2.1.2), elas t
em as mesmas sequ
encias convergentes.


DICAS E SOLUC
OES
DOS EXERCICIOS

478

R
R
2.1.2. Suponha que dn d para todo F . Dada qualquer funca
o contnua
limitada
> R0, tome F com k k .
R : M R com kk
R 1 e dado qualquer
R
Ent
ao d
e arbitr
ario, isto
R lim inf n R dn lim supn dn d + Como
implica que limn dn = d. Se kk > 1, aplique o argumento anterior a /kk.
2.1.3.
Tome Z subconjunto enumer
Ps avel denso de M . O conjunto das medidas da forma
Ps
e denso em M1 (M ). Para ver isso, considere > 0
i=1 qi
i=1 qi zi com qi Q, zi Z e
e funco
es contnuas limitadas 1 , . . . , k . Seja K > 0 um majorante para todo |i | e seja Ij ,
j = 1, . . . , m uma partica
o de [K, K] em intervalos com comprimento menor que . Seja Al ,
l = 1, . . . , m uma partica
o de M em conjuntos mensur
aRveis tais que
a contido
P cada i (Al ) est
em algum Ij . Escolha algum xl em cada Al . Ent
ao | i d m
l=1 (Al )(xl )| < . Esta
desigualdade n
ao
e afetada se substituirmos cada (Al ) por um n
umero racional ql e cada xl
por um ponto zl Z, suficientemente pr
oximos.
2.1.4. Vu (, ) Vp (, B, ) para todo B = {B1 , . . . , BN }, logo a topologia uniforme
e mais
forte que a topologia pontual. Vp (, B, ) = Vc (, B, ) se os Bj s
ao conjuntos de continuidade
de , logo a topologia pontual
e mais forte que a topologia (2.1.5). Seja : R [0, 1] com
R1
(x) dx = 1. Considere a sequ
encia de probabilidades n = n (nx) dx.
supp [1, 1] e 1
Ent
ao (n )n converge para 0 na topologia fraca mas n
ao converge pontualmente: n ({0}) =
0 para todo n, enquanto que 0 ({0}) = 1. Considere : R R dada por (x) = 0 para
x [k, k + 1/2) e (x) = 2 para k [k + 1/2, k + 1), com k Z. Seja a medida de Lebesgue
em [0, 1] e seja n = (2n x) para cada n. Verifique que para todo n existe um conjunto
mensur
avel Bn tal que n (Bn ) = 0 e (Bn ) = 1/2. Seja A a famlia dos subconjuntos
mensur
aveis E [0, 1] tais que (n (E))n converge para (E). Mostre que A cont
em todo
intervalo,
e uma
algebra e uma classe mon
otona. Logo, (n )n converge pontualmente para .
2.1.5. Segue diretamente da definica
o que D 0 e D(, ) = D(, ) para quaisquer e .
Para mostrar que D(, ) D(, ) + D(, ), note que se
(B) < (B 1 ) + 1 , (B) < (B 1 ) + 1

(B) < (B 2 ) + 2 , (B) < (B 2 ) + 2

para todo conjunto mensur


avel B, ent
ao tamb
em temos
(B) < (B 1 +2 ) + 1 + 2

(B) < (B 1 +2 ) + 1 + 2 .

Logo D(, ) 1 + 2 e agora basta passar ao nfimo em 1 e 2 .


2.1.6. Considere a imagem V da medida pela funca
o V . Verifique que V ((a, b]) =
F (b) F (a) para todo a < b. Consequentemente, V ({b}) = F (b) limab F (a). Portanto,
(, b]
e conjunto de continuidade para V se, e somente se, b
e ponto de continuidade para
F . Usando o Teorema 2.1.2, segue que se (Vk )k converge para V na topologia fraca ent
ao
(Vk )k converge para V em distribuica
o. Reciprocamente, se (Vk )k converge em distribuica
o
para V ent
ao Vk ((a, b]) = Fk (b) Fk (a) converge para F (b) F (a) = V ((a, b]), quaisquer
que sejam os pontos de continuidade a < b de F . Observando que tais intervalos (a, b] geram
a -
algebra de Borel da reta, conclua que (Vk )k converge para V na topologia fraca .
2.1.7. Pelo Exerccio 2.1.1, (B) = limn n (B) e portanto n (B) > 0 para todo n suficientemente grande. Seja B B qualquer conjunto de continuidade para ( | B)/(B). Ent
ao
(B B) = 0 e, como B (B B) B, segue que B
e conjunto de continuidade para
. Segue que n (B )/n (B) (B )/(B). Como B
e arbitr
ario, o Exerccio 2.1.1 d
a que
(n | B)/n (B) converge para ( | B)/(B) na topologia fraca . Este argumento se estende
aos casos em que B
e um subconjunto fechado ou aberto, lembrando que se B
e subconjunto
fechado (aberto) de B ent
ao tamb
em
e um subconjunto fechado (aberto) do ambiente M . No
entanto, nestes casos precisamos supor que (B) = limn n (B); sem a hip
otese adicional, o
enunciado
e falso em geral. [Observaca
o: D
e exemplos!]
2.1.8. (Billingsley [Bil68]) Use a hip
otese para mostrar que se (Un )n
e uma sequ
encia crescente
de abertos de M tais que n Un = M ent
ao para todo > 0 existe n tal que (Un ) 1
para todo K. Em seguida, imite a demonstraca
o da Proposica
o A.3.7.
2.2.1. Por compacidade, passando a uma subsequ
encia se necess
ario, podemos supor que
(n )n converge para algum M1 (M ). Como f : M1 (M ) M1 (M )
e contnua, (f n )n
converge para f . Ent
ao, dado qualquer > 0 e qualquer funca
o contnuas limitada ,
Z
Z
Z
Z

1 X

1 X

f j d d < e
f j+1 d ( f ) d <
#In jI
#In jI
n

479
para todo n suficientemente grande. Por outro lado,
Z
Z

1 X
1 X
2

sup || <
f j+1 d
f j d
#In jI
#In jI
#In
n

para todo n suficientemente grande. Logo, | ( f ) d


Agora faca 0.

d| < 3 para todo e todo .

2.2.2. Para a primeira parte do enunciado use induca


o em q. O caso q = 1 corresponde ao
Teorema 2.1. Considere transformaco
es contnuas fi : M M , 1 i q + 1 que comutam
entre si. PorPhip
otese de induca
o, existe probabilidade invariante por fi , 1 i q. Defina
j
n = (1/n) n1
j=0 (fq+1 ) (). Note que (fi ) n = n para todo 1 i q e todo n. Logo,
todo ponto de acumulac ao de (n )n
e invariante por todo fi , 1 i q. Por compacidade,
existe algum ponto de acumulaca
o M1 (M ). Verifique que
e invariante por fq+1 . Para
a segunda parte, represente por Mq M1 (M ) o conjunto das probabilidades invariantes por
fi , 1 i q. Ent
ao (Mq )q
e uma sequ
encia n
ao crescente de subconjuntos fechados n
ao
vazios de M1 (M ). Por compacidade, a interseca
o q Mq
e n
ao vazia.

2.2.3. Para cada k 1 tome ak = 1/(10k 1). Note que f k (ak ) = ak e portanto
Pa probabilik ,
e invariante. (a) Considere =
dade k = (1/k) ak + f (ak ) + + f k1 (ak )
k
k=1 2
onde k
e a probabilidade suportada na
orbita do ponto peri
odico pk introduzida anteriorj
mente. Verifique que o fecho de A = {f (ak ) : 0 j < k e k 1}
e enumer
avel. (b) Considere
o conjunto de Cantor K =
e
n=0 Kn definido da seguinte maneira: K0 = [0, 1] e cada Kn+1
obtido removendo de cada componente conexa C de Kn o subintervalo aberto com o mesmo
centro que C e com comprimento igual a 8m(C)/10. Tome a probabilidade suportada em K
tal que (K C) = 2n para toda componente conexas C de Kn . (c) Seja B o conjunto dos
pontos x [0, 1] cuja expans
ao decimal
e peri
odica. Ent
ao B
e subconjunto enumer
avel denso
de [0, 1]. Al
em disso, todo x B
e peri
odico para f . Seja {bk : k 1} um conjunto
P formado
por exatamente um ponto em cada uma destas
orbitas peri
odicas. Considere = k=1 2k k
onde k
e a probabilidade invariante suportada na
orbita de bk . Verifique que (B) = 1 e,
portanto, supp = [0, 1]. No entanto, m(B) = 0.
2.2.4. Pelo Exerccio 2.2.2, existe alguma probabilidade invariante por f 1/q , para todo
q 1. Observe que
e invariante por f t para todo t Q. Deduza que o mesmo vale para
todo t R.

P
2.2.5. Mostre que (x) = 1/ 1 x2 satisfaz (y) = xf 1 (y) (x)/|f (x)| para todo y.

2.2.6. Defina em cada iterado f j (W ), j Z colocando (A) = m(f j (A)) para cada
conjunto mensur
avel A f j (W ).

2.2.7. Seja W o conjunto dos x X tais que f n (x)


/ X para todo n 1 e seja Y =
k (W ). Os pontos de Y regressam infinitas vezes a X. Note que f i (W )f j (W ) =
X \
k=0 f
para todo i < j.
2.2.8. Por hip
otese, f
e invertvel. Seja medida invariante por f absolutamente contnua
com relaca
o a m. Se
e -finita ent
ao existem X1 Xn com (Xn ) < . A
restrica
o n de a cda Xn
e invariante e absolutamente contnua relativamente `
a restrica
o
de m a Xn (Seca
o 1.4.1). Reciprocamente, dados Xn e n como no enunciado, considere
Y1 = X1 e Yn = Xn \ (X1 Xn1 ), para n > 1, e seja n a restrica
o e n a Yn . Use
a construca
o na Seca
o 1.4.2 para obter, a patir de cada n , uma medida n invariante por f
e tal que o complementar de Zn = j f j (Yn ) P
tem medida nula. Observando que os Zn s
ao
disjuntos dois-a-dois, considere a medida = n n .
2.2.9. Considere a transformaca
o f : [0, 1] [0, 1] dada no Exemplo 1.4.5, com 1.
Usando o Exerccio 1.4.2, mostre que f n
ao admite medida invariante finita absolutamente
contnua com relaca
o `
a medida de Lebesgue m no intervalo [0, 1].

2.3.1. (a) Seja (ak )k uma sequ


encia de Cauchy em 1 . Escreva ak = (akn )n . Verifique que
(akn )k
e sequ
encia de Cauchy em C para todo n. Seja bn o seu limite e b = (bn )n . Mostre
que (kb ak k1 )k 0. Isto implica que b 1 e que (ak )k b em 1 . Seja (ak )k uma
sequ
encia de Cauchy em . Como no caso anterior, cada (akn )k
e sequ
encia de Cauchy
em C. Seja bn o seu limite e seja b = (bn )n . Mostre que (kb ak k )k 0. Isto implica
que b e que (ak )k b em . No caso particular em que (ak )k
e sequ
encia em c0 ,


DICAS E SOLUC
OES
DOS EXERCICIOS

480

ou seja, quando limn akn = 0 para todo k, a relaca


o kb ak k < para k grande implica
|bn akn | < para k grande e todo n e isso implica |bn | < 2 para n grande. Portanto,
(bn )n 0 nesse caso e, ent
ao, o argumento
e completo. (b) Verifique
P anterior mostra que c0
que se (an )n ent
ao : (bn )n 7
e um funcional linear contnuo em 1 , com
n an bn
kk k(an )n k . Reciprocamente, dado um funcional linear contnuo : 1 C, considere
(an )n definida por an = (0, . . . , 0, 1, 0, . . . ), onde a coordenada
igual a 1 est
a na n
esima
P
1
posica
o. Mostre que k(an )n k kk e que ((b
n )n ) =
n an bn para todo (bn )n .
P
1
Verifique que se (an )n ent
ao : (bn )n 7 n an bn
e um funcional linear contnuo em
c0 , com kk k(an )n k1 . Reciprocamente, dado um funcional linear contnuo : c0 C,
considere (aP
n )n definida por an = (0, . . . , 0, 1, 0, . . . ). Mostre que k(an )n k1 kk e que
1
((bn )n ) =
ca
o: N
ao
e verdade que o dual ( )
n an bn para todo (bn )n . [Observa
seja isomorfo a 1 . Por que o argumento que acabamos de dar n
ao
e v
alido nesse contexto?]
2.3.2. Claro que converg
encia em norma implica converg
encia fraca. Para provar a recproca,
suponha que (xk )k converge para zero na topologia fraca mas n
ao na topologia da norma.
PN
k
A primeira condica
o implica que, para todo N fixo,
n=0 |xn | converge para zero quando
k . A segunda condica
o significa que, a menos de restringir a uma subsequ
encia, existe
> 0 tal que kxk k > para todo k. Ent
ao, existe alguma sequ
encia crescente (lk )k , tal que
lk1

n=0

|xkn |

1
k

lk
X

mas

n=0

|xkn | kxk k

1
1

k
k

para todo k.

Tome an = xkn /|xkn | para cada lk1 < n lk . Ent


ao, para todo k,

X


an xkn
n=0

lk1 <nlk

|xkn |

nlk1

|xkn |

n>lk

|xkn | kxk k

4
4
.
k
k

k
k
Isto contradiz as hip
oteses. Agora
ario. Dada
P tome xn = 1 se k = n e xn = 0 caso contr
qualquer (an )n c0 , temos que n an xkn = ak converge para zero quando k . Portanto,
(xk )k converge para zero na topologia fraca . Mas kxk k = 1 para todo k, logo (xk )k n
ao
converge para zero na topologia da norma.
claro que vale C + C + para todo 0 e C + (C + ) = 0. Al
2.3.3. E
em disso, dados
0

, C0+ com kk = kk = 1, podemos tomar x, y M tal que (x) = (y) = 1. Ent


ao
k + k (x) + (x) 1. Assim, inf{k + k : , C0+ , kk = kk = 1} 1.

2.3.4. Use a base de Fourier (A.6.1) de L2 (m) para calcular autovalores e autovetores do
operador de Koopman.
2.3.5. Considere a transformaca
o expans
ao decimal f : [0, 1] [0, 1] e seja m a medida de
Lebesgue. Como f (x + 1/10) = f (x) para todo x [0, 1], temos que toda L1 (m) na
imagem do operador de Koopman satisfaz (x + 1/10) = (x) para m-quase todo x. Conclua
que Uf n
ao
e sobrejetiva.
L
n

2.3.6. Tome W = U (H) e V = (


n=0 U (W )) .

2.3.7. Suponha que existem funcionais tangentes T1 e T2 com T1 (v) > T2 (v) para algum
v E. Mostre que (u + tv) + (u tv) 2(u) t(T1 (u) T2 (u)) para todo t e deduza que
n
ao
e diferenci
avel na direca
o de v.

2.4.1. Considere o conjunto P das probabilidades em X M da forma Z . Note que P

e compacto na topologia fraca e


e invariante pelo operador F .
2.4.2. A condica
o p g = f p acarreta fn p = p g n para todo n Z. Usando p = p,
segue que fn p = p g n para todo n 0. Portanto, p(y) = p(g n (y)) n0 . Isto prova a
exist
encia e unicidade de p. Agora suponha que p
e sobrejetiva. As hip
oteses de compacidade
e continuidade garantem que g n (p1 ({xn })) n0
e uma sequ
encia encaixada de compactos,
para todo (xn )n0 M . Tome y na interseca
o e note que p(y) = (xn )n0 .
2.4.3. Por definica
o, dado qualquer y Mg e qualquer n 0, existe zn M tal que
g n (zn ) = y. Em outras palavras, g n1 (zn ) g 1 (y) para todo n. No caso (a), seja z um
ponto de acumulaca
o da sequ
encia (g n1 (zn ))n . Mostre que z Mg e z g 1 (y). No caso

481
(b) observe que, como g 1 (y)
e um conjunto finito, existe z g 1 (y) tal que g n1 (zn ) = z
para infinitos valores de n. Verifique que z Mg . Se
e probabilidade g-invariante ent
ao
(f n1 (M ) \ f n (M )) = 0 para todo n 1 e, portanto, (Mg ) = 1. Logo
e probabilidade
f -invariante. Se x
/ Mg , existe n 1 tal que x
/ f n (M ). Usando que f n (M )
e fechado,
conclua que x n
ao pode ser recorrente.
2.4.4. Suponha que M
e separ
avel e seja {xk : k 1} um subconjunto enumer
avel denso.
tal que (
Para cada k 1, escolha x
k M
xk ) = xk ; isto
e possvel porque f
e sobrejetiva.
verifique que o
Usando a hip
otese de que f
e contnua, e a definica
o (2.4.7) da dist
ancia d,
n

conjunto {f (
xk ) : n 0, k 1}
e denso em M . Logo M
e separ
avel. Agora suponha que
. Escrevendo, x
M
e completo. Seja (
xk )n uma sequ
encia de Cauchy em M
k = (xk,n )n0 ,
verifique que (xk,n )k
e uma sequ
encia de Cauchy em M e, portanto, existe yn = limk xk,n ,
para cada n 0. Lembrando que f
e contnua, mostre que f (yn ) = yn+1 para todo n < 0.
. Mostre que d(
xk , y) vai para zero
Em outras palavras, a sequ
encia y = (yn )n0 est
a em M

quando k . Isto prova que M
e completo.
q

Z


2.4.5. (a) Observe que M
e um subconjunto fechado de M e conclua que M
e compacto.
Al
em disso, se d
e uma dist
ancia em M ent
ao a seguinte funca
o (escrevemos n
= (n1 , . . . , nq ))

e dist
ancia em M:
X

2n1 ++nq min{d(xn
d (xn
, yn
), 1}.
)n
, (yn
)n
=
n1 ,...,nq 0

(b) A inversa de fi envia (xn1 ,...,ni ,...nq )n


em (xn1 ,...,ni 1,...nq )n
. Tanto fi quanto a inversa
s
ao contnuas porque cada coordenada da imagem
e funca
o contnua de um n
umero finito de
coordenadas da vari
avel. Por definica
o,


fi (xn1 ,...,ni ,...,nq )n
= x0,...,1,...,0 = fi (xn1 ,...,ni ,...,nq )n

claro que
em todo ponto. De modo semelhante, fi fj = fj fi . (c) E
e contnua para a topologia herdada do espaco produto. Para mostrar que ela
e sobrejetiva, considere x M . Como
supomos que f1 , , fq s
ao sobrejetivas, podemos encontrar uma sequ
encia (xn )n0 em M tal
n n

que x0 = 0 e f1 fn (xn ) = xn+1 para cada n < 0. Defina xn1 ,...,nq = f1n1 n fq q (xn )
para qualquer n min{n1 , . . . , nq }; verifique que a definica
o n
ao depende da escolha de n.
e a sua imagem por
Justifique que a sequ
encia (xn1 ,...,nq )n
a em M
definida deste modo est

e o ponto x.
2.4.6. (a) A inclus
ao
e trivial. Para provar , verifique que se n = max{n1 , . . . , nq } ent
ao
n
a contido em g1n1 gq q (M ). (b) A inclus
g1n gqn (M ) est
ao gi (Mg ) Mg segue diretamente
do item (a). Para provar a inclus
ao reversa, considere y Mg . Usando o item (a), para cada
n 1 existe zn M tal que gi g1n gqn (zn ) = y. Seja z um ponto de acumulaca
o da sequ
encia
(g1n gqn (zn ))n . Verifique que z Mg e z gi1 (y).

2.4.7. Pelo Exerccio 2.4.6, n


ao
e restrica
o supor que as transformaco
es f1 , . . . , f2 s
ao sobre M
as extens
jetivas. Sejam f1 , . . . , fq : M
oes naturais, no sentido do Exerccio 2.4.5. Pelo
que
caso invertvel do Teorema 1.5.1, existe algum x
M
e simultaneamente recorrente para
f1 , . . . , fq . Verifique que x = (
x)
e simultaneamente recorrente para f1 , . . . , fq .
2.5.1. Basta notar que lim inf n xn = 1 lim supn (1 xn ) e lim inf n (xn ) + lim inf n (yn )
lim inf n (xn + yn ) e lim supn (xn + yn ) lim supn (xn ) + lim supn (yn ).
2.5.2. Fixe q e l. Suponha que para todo n 1 existe uma partica
o {S1n , . . . , Sln } do
conjunto {1, . . . , n} tal que nenhum dos subconjuntos Sjn cont
em uma progress
ao aritm
etica
com comprimento q. Considere a funca
o n : N {1, . . . , l} dada por n (i) = j se i Sj e
n (i) = l se i > n. Tome (nk )k tal que a subsequ
encia (nk )k converge em todo ponto
para alguma funca
o : N {1, . . . , l}. Considere Sj = 1 (j) para j = 1, . . . , l. Algum Sj
n
cont
em alguma progress
ao aritm
etica de comprimento q. Ent
ao Sj k cont
em essa progress
ao
aritm
etica para todo k suficientemente grande.
2.5.3. Tome uma sequ
encia de partico
es P = {P1 , . . . , Pk } de M com diam P 0 e

seja x M um ponto arbitr


ario. Para cada , associe a x a sequ
encia (ai )iZ de elementos


DICAS E SOLUC
OES
DOS EXERCICIOS

482

de {1, 2, . . . , k } dada por f i (x) Pj . Isso determina uma partica


o {S1 , . . . , Sk } de Z,

definida por i Sj ai = j. Pelo Teorema de van der Waerden, existe m {1, 2, . . . , k }

de comprimento
cont
em progress
oes aritm
eticas ck , ck + n, . . . , ck + kn Sm
tal que Sm

k
jn

c
k
(Pm ). Escolha qualquer ponto
k + 1 arbitrariamente grande. Note que f (x) j=0 f
. Por compacidade, podemos supor que (y ) converge para y M . Afirmamos
y P m

que tal y
e super n
ao errante. De fato, dado qualquer vizinhanca U de y, seja r > 0 tal que

Br/2 (y ) Br (y) U .
B(y, r) U . Considere
e suficientemente grande para que Pm

) 6= , tal como
Tome k e n como anteriormente. Ent
ao kj=0 f jn (U ) kj=0 f jn (Pm

queramos demonstrar. Em seguida explicaremos como obter o teorema de van der Warden
a partir da propriedade no enunciado. Seja {S1 , . . . , S } uma partica
o de Z. Considere
orbita de a pelo
a = (aj )jZ com aj {1, . . . , } definido por j Saj . Seja M o fecho da
deslocamento bilateral . Por hip
otese, possui algum ponto super n
ao errante y = (yj )jZ .
Seja U = [0; y0 ] o cilindro de comprimento 1 que cont
em y. Dado qualquer k 1, existe n 1
e existe z = (zj )jZ tal que z kj=0 jn (U ). Isso significa que zjn = y0 para j = 0, . . . , k.
Como z
e acumulado por iterados de a, conclumos que existe m Z tal que m + jn Sy0
para j = 0, . . . , k (tal como afirma o teorema de van der Waerden). [Observaca
o: O mesmo
argumento mostra que toda aplicaca
o invertvel, n
ao necessariamente contnua, num espaco
compacto possui algum ponto n
ao errante.]
k

2.5.4. Considere = {1, ..., l}N , munido da dist


ancia d(, ) = 2N onde N 0
e m
aximo
tal que (i1 , ..., ik ) = (i1 , ..., ik ) para todo i1 , . . . , ik < N . Note que
e um espaco m
etrico
compacto. Dado q 1, seja Fq = {(a1 , . . . , ak ) : 1 ai q e 1 i k}. Seja e1 , . . . , em
uma enumeraca
o dos elementos de Fq . Para cada j = 1, . . . , m, considere o deslocamento
j : dado por (j )(n) = (n + ej ) para n Nk . Considere o ponto definido
lm
por (n) = i n Si . Seja Z o fecho de {1l1 m
() : l1 , ..., lm N}. Note que Z
e
invariante pelos deslocamentos j . Pelo teorema de recorr
encia m
ultipla de Birkhoff, existem
Z e s 1 tais que d(js (), ) < 1 para todo j = 1, . . . , m. Seja e = (1, . . . , 1) Nk . Ent
ao
lm
(e) = (e + se1 ) = = (e + sem ). Considere 1l1 m
() suficientemente pr
oximo de
para que (b) = (b + se1 ) = = (b + sem ), onde b = e + l1 e1 + + lm em . Segue que se
i = (b), ent
ao b + sFq Si . Dado que temos apenas uma quantidade finita de conjuntos Si ,
algum deles deve conter infinitos conjuntos do tipo b + sFq , com q arbitrariamente grande, e
isto termina a prova.

3.1.1. Imite a prova do Teorema 3.1.5.


3.1.2. Suponha que o contr
ario, ou seja, que para todo k N existe nk N tal que (A
f j (A)) = 0 para todo nk + 1 j nk + k. N
ao
e restrica
o supor que (nk )k . Tome
Pnk +k
= XA . Pelo Exerccio 3.1.1, temos que (1/k) j=n
f j . Mas o lado
+1
k
esquerdo
e identicamente nulo e o lado dirieto
e igual a (A)2 .
3.1.3. Claro que F
e um subespaco. Suponha que (n )n com n f = n em -quase
todo ponto. Ent
ao f = em -quase todo ponto:
Z
Z
Z
| f | d = lim |n f | d = lim |n | d = 0.
n

RT

3.1.4. O teorema afirma que (1/T ) 0 (f t (x)) dt converge para P () em L2 () quando


T , onde P ()
e a projeca
o no espaco das func
oes invariantes. Para provar, seja (x) =
1/2
R1
R1
. Usando a desigualdade de Cauchy-Schwarz,
||2 (f t (x)) dt
(f t (x)) dt e (x) =
0
0
R
||2 2 . Usando o teorema de Fubini e o fato de que a medida
e invariante, 2 d =
R
2
2
|| d. Logo, , L (). Escreva
1
T

(f t (x)) dt =

Z T
[T ]
1 X
1
(f j (x)) dt.
(f j (x)) +
T j=0
T [T ]

Pelo Teorema 3.1.5 aplicado a , o primeiro termo do lado direito converge para P () em
R
e funca
o invariante.
L2 (). Observe que P () = 01 P () f t dt = P (), uma vez que P ()
Ou
ltimo termo
e limitado por (1/T )(f [T ] (x)) e, portanto, converge para zero em L2 ().

483
3.1.5. Basta mostrar que ker A = tR ker(Ut id ). Se A = 0 ent
ao e2itA = para todo
t R. Reciprocamente, suponha que e2itA = para todo t R. Derivando em relaca
o a
t, obtemos que e2itA (2iA) = 0. Como Ut
e isomorfismo, isso implica que A = 0.
3.2.1. Verificaca
o direta a partir das definico
es.
3.2.2. Observe que a funca
o = f
e integr
avel e satisfaz
teorema de Birkhoff a .

d = 0. Aplique o

3.2.3. (a) Considere = 1 e seja C = sup{|(l)| : |l| L(1)}. Dado n Z, fixe s Z tal
que sL(1) < n (s + 1)L(1). Por hip
otese, existe {sL(1) + 1, . . . , (s + 1)L(1)} tal que
|(k + ) (k)| < 1 para todo k Z. Tome k = n e observe que |k| L(1). Segue que
|(n)| < 1 + C. (b) Tome > 2L() sup ||. Para todo n Z existe algum -quase perodo
= n + r com 1 r L(). Ent
ao,
(n+1)

j=n+1

(j)

r
X

j=1r


(j) <

X
X
r


(j)
(j) 2r sup || < .

k=1r

j=1

(c) Dado > 0, tome como no item (b). Para cada n 1, escreva n = s+r, com 1 r .
Ent
ao,
s+r
s1
n
X 1 (i+1)
X

1 X
1 X
(j) =
(l) +
(l).
n j=1
s + r i=0 l=i+1
n l=s+1
P
Para s grande, o primeiro termo do lado direito est
a pr
oximo de (1/) 1
j=0 (j) (item (b))
eou
ltimo termo est
a pr
oximo de zero (item (a)). Conclua que o lado esquerdo da igualdade
constitui uma sequ
encia de Cauchy. (d) Observe que
|

n
n
1 X
2|x|
1 X
(x + k)
(j)|
sup ||
n j=1
n j=1
n

e use os itens (a) e (c).


P
e integr
avel com
3.2.4. Observe que a funca
o =
k=1 log kXIk , onde Ik = (1/(k + 1), 1/k],
relaca
o `
a medida de Gauss . Aplique o teorema de Birkhoff a .
3.2.5. O caso p = 2 foi feito na Seca
o 3.2.3.
R
R
3.2.6. Dado L1 (), defina (x) = 01 (f t (x)) dt e (x) = 01 ||(f t (x)) dt. Ent
ao
R
R
R
1
|| d d || d, logo , L (). Al
em disso
1
T

(f t (x)) dt =

Z T
[T ]1
1 X
1
(f t (x)) dt.
(f j (x)) +
T j=0
T [T ]

Pelo teorema de Birkhoff aplicado a (f 1 , ) e `


a funca
o , o primeiro termo do lado direito converge em quase todo ponto quando T . O u
ltimo termo
e limitado por (1/T )(f [T ] (x)).
Usando o Lema 3.2.5, segue que ele converge para zero quando T .

3.2.7. O exerccio est


a resolvido na Proposica
o 6.2.1.

3.3.1. Como n+1 R n f + 1 para todo n, temos que f . Logo, a primeira


afirmaca
o segue de M ( f ) d = 0. A segunda
e an
aloga.
3.3.2. Seja uma probabilidade invariante por um fluxo f t : M M , t R e seja (s )s>0
uma famlia de funco
es, indexada pelos reais positivos, tal que s+t t + s f t e a funca
o
= sup0<s<1 +
a em L1 ().
Ent
ao (1/T )T converge
em -quase todo ponto para uma
s est
R
R
funca
o tal que + L1 () e d = limT (1/T ) T d. Para provar este enunciado,
tome = limn (1/n)n (Teorema 3.3.3). Para T > 0 n
ao inteiro, escreva T = n + s com
N N e s (0, 1). Ent
ao
T n + s f n n + f n

T n+1 1s f T n f T .

Usando o Lema 3.2.5, a primeira desigualdade mostra que lim supT (1/T )T . Analogamente, a segunda desigualdade, usando a vers
ao do Lema 3.2.5 para tempo contnuo,


DICAS E SOLUC
OES
DOS EXERCICIOS

484

R
d
a que limRinf T (1/T )T . Tamb
em segue que limT (1/T
R ) T d coincide com
limn (1/n) n d. Pelo Teorema 3.3.3, este u
ltimo limite
e igual a d.
3.3.3. Combine o Lema 1.3.5 com a propriedade (c2) na Seca
o 3.3.5.

3.3.4. Defina n = n e n = n n , onde


e a constante temporal.

3.3.5.
Como log+ kk L1 (), para todo P> 0 existe > 0 tal que (B) < implica
R
+
+
j
log
kk d < . Usando que log+ kn k n1
j=0 log kk f , vem que
B

(E) <

1
n

log+ kn k d

n1 Z
1 X
log+ kk d .
n j=0 f j (E)

3.3.6. Fixe k 1. Por subaditividade,


max (x) = lim
n

n1
1
1 X 1
log knk (x)k lim
log kk (f jk (x))k = k (x).
n
nk
n j=0 k

Dados > 0 e k 1, defina k = {x : k (x) > max (x) + /2}. Represente por Xk a funca
o
caracterstica de k . Ent
ao,
k (x) max (x) +

n1

1 X +
+ lim
(k Xk )(f jk (x)).
n n
2
j=0

Seja k o conjunto dos pontos x onde este u


ltimo termo
e maior que /2. Se x
/ k ent
ao
k (x) max (x) + . Portanto, basta mostrar que -quase todo x pertence a ck para algum
k. Usando o lema de Fatou, vemos que

(k )
2

lim
n

Z
Z
n1
n1
1 X +
1 X +
k+ d.
(k Xk ) f jk d lim
(k Xk ) f jk d =
n
n j=0
n j=0
k

Como max
R = limk k , temos que (k ) converge para zero. Por integrabilidade uniforme,
segue que k d converge para zero. Logo (k ) 0 e isso implica o que dissemos.
k

3.4.1. Se A, B s
ao disjuntos ent
ao A e B tamb
em s
ao, para < . Segue que (3.4.6)

e -aditiva. Quanto a (3.4.7): se An s


ao disjuntos dois-a-dois,
X
X
X
(An ) =
sup (An ) = sup
(An ) = sup (n An ) = (n An ).
n

3.4.2. (a) Suponha que f nj (x) x. Ent


ao (f nj (x), s) (x, s) para todo s. Pela condica
o
(3.4.1), existe (tj )j tal que (f nj (x), 0) = (x, tj ) para cada j. Logo, g tj ((x, s)) =
(x, s + tj ) = (f nj (x), s) para todo s. Em outras palavras, g tj ((x, s)) (x, s). (b)
Suponha que g tj ((x, s)) (x, s) com tj . Fixe qualquer 0 < < (x). Como g s
e
contnuo, temos que g tj ((x, )) (x, ). Para cada j, tome nj inteiro e 0 j < (f nj (x))
tais que g tj ((x, )) = (f nj (x), j ). Ent
ao (f nj (x), j ) (x, ) e, pela escolha de e
j , isso implica que f nj (x) x e j . (c) A primeira afirmaca
o
e consequ
encia direta dos
itens (a) e (b) e da definica
o da medida . A segunda segue usando o teorema de recorr
encia
de Poincar
e.
3.4.3. Considere coordenadas locais x = (x1 , x2 , . . . , xd ) tais que {x1 = 0}. Escreva
= (x) dx1 dx2 . . . dxd . Ent
ao = (y) dx2 . . . dxd com y = (0, x2 , . . . , xd ). Dados A
e > 0, Ra aplicaca
o : (t, y) 7 g t (y)
e um difeomorfismo de [0, ] A em A . Portanto,
(A ) = [0,]A ( )| det D| dtdx2 . . . dxd e, consequentemente,
lim

(A )
=

(y)| det D|(y) dx2 . . . dxd .

Em seguida, note | det D|(y) = |X(y)(/t)| = (y) para todo y . Segue que o transporte
de coincide com a medida = . Em particular,
e invariante pela transformaca
o de
Poincar
e.

485
3.4.4. (a) As afirmaco
es a
F a
e Gt F = F Gt e a
Gt a
seguem diretamente
das definico
es. As duas primeiras garantem a exist
encia de a e de (g t )t e a terceira implica
que o funcional
e invariante pelo fluxo. Tamb
em temos que det DF 1 e det DGt 1,
logo
e invariante por F e por Gt para todo t. Note que grad a
6= 0 em todo ponto. Logo,
podemos usar o Exerccio 1.3.12 para concluir que c
e invariante por F e por Gt para todo t
n
n
n
n
e todo c. (b) Dado (1 , 2 , h1 , h2 ), escreva (n
1 , 2 , h1 , h2 ) = F (1 , 2 , h1 , h2 ) para n Z.
n1
n1
n
n
n
Por definica
o, 1 + 2 = max{1 , 2 } para todo n. Verifique que (n
ao
1 )n e (2 )n s
n
ao crescentes e convergem para zero quando n + e para infinito quando n .
n
n
n
Conclua que existe um u
nico n tal que n
e um
1 + 2 1 > max{1 , 2 }. Isto mostra que D
domnio fundamental para . A medida
e infinita porque (D) = . Dado outro domnio
fundamental D , podemos escrever D e D como uni
oes enumer
aveis disjuntas D = Dk
(Dk ) para todo k. Como

e invariante por F ,
que Dk = F kP
e D = Dk de tal modo
P
| D). Para verificar que
e
| Dk ) = (
segue que (
| D ) =
| Dk ) =
k (
k (
invariante por (g t )t imite a Proposica
o 3.4.1. (c) O campo de vetores X = (Gt /t) |t=0
claro que ele
est
a dado por X(1 , 2 , h1 , h2 ) = (1 , 2 , h1 , h2 ). E
e transversal `
a seca
o
= {1 + 2 = 1}. O tempo de primeiro retorno a
e a soluca
o de max{e 1 , e 2 } = 1,
ou seja, = min{ log 1 , log 2 }. Isto d
a:

(1 2 /1 , 2 /1 , 1 h1 , 1 h2 ) se 1 > 2
f (1 , 2 , h1 , h2 ) =
(1 /2 , 1 1 /2 , 2 h1 , 2 h2 ) se 1 < 2 .
Seja ds o comprimento de arco no segmento {(1 , 2 ) R2+ : 1 + 2 = 1}. A medida de
volume induzida pela m
a dada por dsdh1 dh2 . O campo de
etricaRiemanianna em est
vetores
n(1 , 2 , h1 , h2 ) = (1/ 2, 1/ 2, 0, 0)
e unit
ario e ortogonal a . Note queX n 1/ 2 em .
Pelo Exerccio 3.4.3, segue que a medida transporte est
a dada por = (1/ 2) dsdh1 dh2 . Note
que () = . (d) O item (a) implica que Nc
e invariante e, imitando a Proposica
o 3.4.1,
que c
e invariante. Para cada (1 , 2 ), o segmento {(h1 , h2 ) : a(1 , 2 , h1 , h2 ) = c} pode ser
parametrizado por h= cs/1 e h2 = c(1 s)/2 , com s (0, 1). Como grad a
(1 , 2 , h1 , h2 ) =
(h1 , h2 , 1 , 2 ), segue que
p
Z 1
Z Z
(c/1 )2 + (c/2 )2 ds
q
d1 d2
c (Nc ) =
.
0
D
(cs/1 )2 + (c(1 s)/2 )2 + 21 + 22
1
A funca
o integranda
e menor do que 2 max{1
1 , 2 }. Portanto,
Z Z
1
2 max{1
c (Nc )
1 , 2 } d1 d2 < .
D

Segue do Teorema 1.2.4 que c -quase todo ponto


e recorrente para (g t )t . Como c
e equivalente
a c = (
c D), segue que c -quase todo ponto
e recorrente para (g t )t , para todo c. Logo,
-quase todo ponto
e recorrente.
4.1.1. Se A
e um conjunto invariante ent
ao a
orbita de p est
a contida ou em A ou no seu
complementar.
4.1.2. Use o teorema de Birkhoff e o teorema da converg
encia dominada.
4.1.3. (a) : Se A
e invariante ent
ao n f n (A) = A. (a) : B = n f n (A) satisfaz
f 1 (B) B. (b) : Se A
e invariante ent
ao (f n (A) Ac ) = 0, logo (A)(Ac ) = 0.
(b) : Se
e erg
odica, n f n (A) tem medida 1, logo intersecta todo conjunto com medida
positiva. (c) : Para cada Lp () os dois lados de (4.1.2) s
ao func
oes lineares contnuas
de Lq (). Logo, o conjunto onde vale a igualdade
e fechado. Esta observaca
o permanece
v
alida se permutarmos os pap
eis de e . (c): Est
a contido na Proposica
o 4.1.4. (d) :
Funco
es caractersticas est
ao em Lp (). (d): Use (4.1.2) com 1.R (e) : As fun
es
R co
caractersticas de conjuntos invariantes satisfazem a hip
otese. (e):
f d = d,
logo a hip
otese implica que
e funca
o invariante.
4.1.4. Seja A um conjunto invariante. Pelo Exerccio A.5.7, existem funco
es uniformemente
contnuas limitadas (k )k convergindo para XA em -quase todo ponto e em L2 (). Use
o teorema de von Neumann para verificar que as m
edias temporais (
k )k convergem para

486

DICAS E SOLUC
OES
DOS EXERCICIOS

XA = XA . Ent
ao a hip
otese implica que XA
e constante em -quase todo ponto, ou seja,
(A) = 0 ou (Ac ) = 0.
4.1.5. Pelo teorema de Birkhoff, a m
edia temporal
e uma funca
o invariante. Isso d
a a primeira
afirmaca
o. A segunda est
a contida na Proposica
o 4.1.3.
4.1.6. Use o Exerccio 4.1.5.
4.1.7. Este exerccio est
a resolvido no Exemplo 7.1.10.
4.1.8. Suponha que Uf = . Como Uf
e isometria, || = 1. Se n = 1 para algum n ent
ao
f n = e, por ergodicidade,
e constante em quase todo ponto. Caso contr
ario, dado
qualquer c 6= 0, os conjuntos 1 (k c), k 0 s
ao disjuntos dois-a-dois. Como a sua medida

e independente de k, ela precisa ser nula. Finalmente, 1 (c)


e um conjunto invariante por f
e, consequentemente, a sua medida
e zero ou total.
P
4.2.1. Escreva (x) = kZd ak e2ikx . Verifique que R se, e somente se, ak e2ik = ak
d
para todo k Z . para racionalmente independente, isto implica que ak = 0 para todo
k 6= 0.

4.2.2. Considere = X N ; o outro caso


e an
alogo. Para ver que
e contnua, observe
que 1 ([m; Am , , An ]) = [m + 1; Am , . . . , An ]. Escrevendo X = {1, . . . , d}, considere o
ponto x = (1, 2, . . . , d, 1, 1, 1, 2, . . . , d, d, 1, 1, 1, 1, 1, 2, . . . ) e verifique que {n (x) : n 1}
intersecta todo cilindro de . Dado qualquer cilindro [m; Am , . . . , Am+p1 ], considere a
sequ
encia x = (xk )n tal que xk Ak para m k < m + p e xk = xk+p para todo k 0.
Verifique que x
e ponto peri
odico de .
4.2.3. Adaptando a demonstraca
o da Proposica
o 4.2.4, mostre que se A
e subconjunto invariante com medida positiva ent
ao A [(i 1)/3, i/3] tem medida total em (i 1)/3, i/3] para
algum i {1, 2, 3}. Deduza que A tem medida total em [0, 1].

4.2.4. Podemos supor que X cont


em uma sequ
encia infinita de
orbitas peri
odicas (On )n com
perodo indo para infinito. Seja Y X o conjunto de pontos de acumulaca
o dessa sequ
encia.
Mostre que Y n
ao pode consistir de um u
nico ponto. Sejam p 6= q pontos peri
odicos em Y
e seja z um ponto heteroclnico, ou seja, tal que f n (z) converge para a
orbita de p quando
n e para a
orbita de q quando n +. Mostre que z Y e deduza a conclus
ao do
exerccio.
4.2.5. Comece por verificar que se {Un, : }
e base de uma topologia Tn (respectivamente,
gerador de uma -
algebra Bn ), para cada
ao os cilindros [1; U1,1 , . . . , Un,n ]
Q n 1, ent
formam uma
base
da
topologia
produto
T
(respectivamente,
um gerador da -
algebra
n
n
Q
produto n Bn ). Mostre tamb
em que se (Uk )k
e base enumer
avel de abertos de um espaco
topol
ogico ent
ao ela gera a -
algebra de Borel do espaco. Combinando estas observaco
es
mostre que se (Vk )k
e base enumer
avel de abertos de X ent
ao os cilindros [1; Vk1 , . . . , Vkn ]
geram tanto a -
algebra de Borel X N quanto o produto BN da -
algebra de Borel B de X.
Logo, estas -
algebras coincidem.
4.2.6. Considere um ponto de densidade a de A e use o fato de que a
orbita de a
e densa
(Exerccio 1.3.10) para concluir que o complementar n
ao tem pontos de densidade.
4.2.7. Para a primeira parte, verifique que a sequ
encia do lado direito de (4.2.19)
e equicontnua e use o teorema de Ascoli-Arzel
a. Na segunda parte, use o fato de que

e constante
em cada
orbita de R e as
orbita s
ao densas em S 1 . Represente por c() o valor de (x)

para
qualquer x. Dada qualquer
probabilidade
invariante e qualquer funca
o contnua, o teorema
R
de Birkhoff d
a que d = c(). Pela Proposica
o A.3.3, isto mostra que est
a unicamente
determinada.
4.2.8. A relaca
o Ax = x corresponde a um sistema homog
eneo de d equaco
es lineares com
coeficientes racionais e, portanto, admite alguma soluca
o racional x 6= 0. Por homogeneidade,
podemos multiplicar as entradas de x por uma mesma constante, de modo torn
a-las inteiras.
4.2.9. Seja Jk = (0, 1/k), para cada k 1. Verifique que x tem expans
ao de tipo limitado
se, e somente se, existe k 1 tal que Gn (x)
/ Jk para todo n. Observe que (Jk ) > 0 para
todo k. Deduza que para todo k e -quase todo x existe n 1 tal que Gn (x) Jk . Conclua
que L tem medida de Lebesgue nula.

487
4.2.10. Para cada RL N, considere L (x) = min{(x), L}. Ent
ao L L1 () e, por
ergodicidade, R
L = L d em -quase todo ponto. Para concluir, observe que L para
todo L e que L d +.
4.2.11. A primeira parte segue do fato de
e erg
o 4.2.10). Para a seR odica (Proposica
P que (G, )
d = + e use o Exerccio 4.2.10.
gunda parte, observe que a funca
o =
k=1 kXIk tem
4.3.1. Seja (Uk )k uma base enumer
avel de abertos. Por ergodicidade, se Uk tem medida positiva ent
ao ele intersecta (f n (x))n para todo x num conjunto Mk com medida total. Intersecte
os conjuntos Mk obtidos deste modo.
R
4.3.2. Observe que a funca
o d
e contnua e que M1 (f )
e compacto (Teorema 2.1.5),

relativamente `
a topologia fraca

4.3.3. Observe que se A E


e invariante por g e tem medida positiva ent
ao o conjunto
B = k n<k f n (A) Ek = n k>n f n (A) Ek
e invariante por f e tem medida
positiva. Supondo que (f, )
e erg
odica, segue que B tem medida total, o qual implica que
(A) = 1. Portanto, (g, )
e erg
odica. Para provar a recproca, observe que se B
e invariante
por f e tem medida positiva ent
ao A = B E
e invariante por g e tem medida positiva.
Supondo que (g, )
e erg
odica, segue que (A) = 1. Ent
ao B tem medida total, ou seja,
(B) = 1. Isto mostra que (f, )
e erg
odica.
4.3.4. Observe que se A M
e invariante por f e tem medida positiva ent
ao 1 (A)

e invariante por f e tem medida


positiva. Isto mostra que (f, )
e erg
odico se (f,
)
e
erg
odico. Para provar a recproca, considere qualquer funca
o uniformemente contnua limitada
R e seja
a dist
:M
a sua m
edia temporal. Note que consideramos em M
ancia d definida
por (2.4.7). Verifique que se x
, y s
ao tais que (
x) = (
y ) ent
ao d(fn (
x), fn (
y )) 0 quando
n . Usando a continuidade uniforme, conclua que (
x) = (
y ). Isto mostra que
=
para alguma funca
o : M R. Esta funca
o
e mensur
avel a menos de medida nula. Isso
pode ser mostrado da seguinte forma. Pelo Exerccio 2.4.4, dado qualquer > 0 podemos
M
tal que a restrica
aplicar o teorema de Lusin para encontrar um compacto K
o de
a
> 1 . Ent

> 1 .
K
e continua e
(K)
ao, K = (K)
e um compacto com (K)
(K)
Mostre que a restrica
o de a K
e contnua. Fazendo 0, segue que
e mensur
avel a
menos de medida nula, conforme afirmamos. Note tamb
em que
e f -invariante, porque

e
f-invariante. Ent
ao, pela hip
otese de que (f, )
e erg
odico,
e constante em -quase todo
ponto. Isto significa que

e constante em
-quase todo ponto. Pelo Exerccio 4.1.4, segue
que (f,
)
e erg
odico.
4.3.5. Observe que se A M
e invariante por f e tem medida positiva ent
ao (A R)
e
invariante pelo fluxo e tem medida positiva. Para a recproca, observe que se B
e invariante
pelo fluxo e tem medida positiva ent
ao 1 (B) tem a forma A R, onde A
e invariante por
f e tem medida positiva.
4.3.6. Fixe j 6= k em I. Usando o Lema 4.3.1, mostre que existe conjunto mensur
avel
j (A
Aj,k tal que j (Aj,k ) > 0 mas k (Aj,k ) = 0. Seja Bj,k =
j,k ). Verifique que
j=0 f
n (B
j (Bj,k ) > 0 e k (Bj,k ) = 0 e f 1 (Bj,k ) Bj,k . Defina Cj,k =
j,k ) e verifique
n=0 f
que f 1 (Cj,k ) = Cj,k . Mostre que j (Cj,k )
e positiva e, portanto, j (Cj,k
S ) = 1. Por outro
lado, mostre que k (Cj,k ) = 0. Agora defina Dj = k6=j Cj,k e Pj = Dj \ k6=j Dk . Verifique
que f 1 (Dj ) = Dj e j (Dj ) = 1 e k (Dj ) = 0 para todo k 6= j. Logo, f 1 (Pj ) = Pj para
todo j e j (Pj ) = 1 e k (Pj ) = 0 para todo k 6= j. Al
em disso, os Pj s
ao disjuntos dois-a-dois.
4.3.7. Seja M = {0, 1}N e, para cada n, seja n a medida invariante at
omica suportada na
n
odo 2n, definida por n
orbita peri

odica n = (n
k = 0, se 0 k < n e k = 1 se
k )k , de per
n k < 2n. Mostre que (n )n converge para (0 + 1 )/2, onde 0 e 1 s
ao os pontos fixos do
deslocamento.
4.3.8.PConsidere uma funca
o contnua
limitada qualquer : M R. Por ergodicidade,
R
j
d em -quase todo ponto e, consequentemente, em
(1/n) n1
j=0 (f (x)) converge para
-quase todo ponto Aplique o teorema da converg
encia dominada.
4.3.9. (1) Tome k 1 tal que todo cilindro de comprimento k tem di
ametro menor que .
Tome y = (yj ) definido por yj+ni = xij para cada 0 j < mi + k. (2) Tome > 0 tal
que d(z, w) < implica |(z) (w)| < e considere k 1 dado pelo item 1. Escolha mi ,
i = 1, . . . , s tais que mi /ns i para todo i. Ent
ao, tome y como no item 1. (3) Pelo teorema

488

DICAS E SOLUC
OES
DOS EXERCICIOS

R
R
R
P
erg
odico, d =
d. Tome x1 , . . . , xs e 1 , . . . , s tais que
d i i (x
i ).
R
Note que (y)

= dy , onde y
e a medida (at
omica) invariante suportada na
orbita de y.
Lembre do Exerccio 4.1.1.
4.4.1. (a) Discutimos apenas o caso d = 2. Se o vetor = (1 , 2 )
e (c, )-diofantino ent
ao o
n
umero = 1 /2
e tal que | (p/q)| c/q +1 , para quaisquer p, q Z com q 6= 0. Usando
o princpio da casa dos pombos, prove que dado qualquer irracional existem inteiros k, l com
l 6= 0 tais que | k/l| < 1/l2 (este resultado
e chamado teorema de Dirichlet). Conclua
que + 1 2. (b) Podemos supor que o vetor est
a no cubo unit
ario. Seja Vc, o conjunto
dos vetores (c, )-diofantinos. Verifique que o complemento de Vc,
e uma uni
ao de placas
com espessura 2c/kkk +1 em torno do hiperplano ortogonal a cada vetor k Zd . Mostre que
quando + 1 > d a medida do complementar de Vc, no cubo unit
ario vai para zero quando
c 0.
4.4.2. Seja B = [0, a] [0, b] a mesa do bilhar. Considere a aplicacao : T2 B dada por

B([x, y]) = B([1 x, y]) = B([x, 1 y]) = B([1 x, 1 y]) = (2ax, 2by) para (x, y) [0, 1/2]2 .
Verifique que toda
orbita do bilhar
e imagem por de uma reta no toro T2 . Logo a
orbita
e
peri
odica ou densa dependendo da inclinaca
o da reta ser racional ou irracional.
4.4.3. Considere em cada lado do tri
angulo o p
e da respectiva altura (ou seja, o ponto
onde esse lado intersecta a reta ortogonal a ele que passa pelo v
ertice oposto). Mostre que o
tri
angulo definido por esses tr
es pontos
e uma
orbita peri
odica do bilhar.
4.4.4. Mostre que o vetor pi pj
e ortogonal `
a hipersuperfcie {p : kpi pj k = 2}
no ponto p = (p1 , , pd ). Deduza que as condico
es no Exemplo 4.4.4 implicam que (i) as
componentes de vi vj e vi vj na direca
o ortogonal `
a hipersuperfcie s
ao sim
etricas e (ii)
as componentes desses vetores na direca
o tangente ao bordo s
ao iguais. Verifique que isto
significa que a reflex
ao no bordo do bilhar
e el
astica.
4.4.5. Usando a Equaca
o (4.4.8) e a condica
o de torca
o temos que para cada R existe
exatamente um n
umero (a, b) tal que (, ) = . A funca
o 7
e contnua e
peri
odica, com perodo 1. Considere o seu gr
afico = {(, ) : S 1 }. Qualquer ponto
em

f ()
e ponto fixo para f , uma vez que se (, ) = f (, ) = (, ), R(, ) , como
(, ) = , temos = e, portanto, = .
Como f preserva
area, nenhuma das componentes conexas de A \ pode ser enviada
dentro de si mesma. Isso implica que f () intersecta em, pelo menos, dois pontos.
4.4.6. Defina G(, ) = F q (, ) (p, 0). Como F
e levantamento de f , temos que G
e um
levantamento de f q , j
a que se : R [a, b] S 1 [a, b]
e a projeca
o (, ) = ( mod Z, )
ent
ao G = F q = f q . Al
em disso, G satisfaz (4.4.8). Logo, segue do Teorema 4.4.7 que f q
tem pelo menos dois pontos fixos no interior de A.
4.4.7. Inspirando-se no Exemplo 4.4.10, mostre que a transformaca
o do bilhar em
e (ou,
mais precisamente, se estende a) um transformac
ao de Dehn no anel A = S 1 [/2, /2], ou
seja, um homeomorfismo f : A A que coincide com a identidade em ambas as componentes
conexas do bordo mas
e homotopicamente n
ao trivial: na verdade, f admite um levantamento
F : R [/2, /2] R [/2, /2] tal que F (s, /2) = (s 2, /2) e F (s, /2) =
(s, /2) para todo s. Considere n
umeros racionais pn /qn (2, 0) com qn . Use o
Exerccio 4.4.6 para mostrar que g tem pontos peri
odicos de perodo qn . Observe que, se
tomarmos os qn primos entre si, estes pontos peri
odicos s
ao todos distintos.
W
W
W
5.1.1. Se P = n {En , M \En }, tome Pn = n
j=1 {Ej , M \Ej } e observe que P =
n Pn . ReW
ciprocamente, se P = n Pn W
com Pn finita ou enumer
avel, seja {Ek : k N} uma enumeraca
o
de n Pn ; verifique que P = n {En , M \ En }.

5.1.2. Seja o nfimo das medidas dos conjuntos f k -invariantes com medida positiva. Mostre
que = 1/l para algum inteiro l 1 que divide k. Al
em disso, existe conjunto f l -invariante
A tal que (A) = 1/l. Seja a restrica
o normalizada de a tal conjunto A. Verifique que a
P
j
decomposica
o erg
odica de para f k
e (1/l) l1
j=0 f .
R
5.1.3. (a) (b) Note que a aplicaca
o M1 (M ) real, 7 d
e contnua, logo mensur
avel. (b) (a): Dados M1 (M ), > 0 e funco
es contnuas limitadas 1 , . . . , N ,

489
R
R
escreva aj = j d. Por (a), cada {x : j dx (aj , aj + )}
e um conjunto mensur
avel. Intersectando em j, obtemos que {x : x V (, {1 , . . . , N }, )}
e mensur
avel.
(b) (c) Use o Exerccio A.3.5 para aproximar por funco
es contnuas, e use o teorema
da converg
encia dominada. (c) (d)
e trivial. (d) (b) Aproxime , uniformemente, por
funco
es simples.
5.1.4. Seja R(k )k uma sequ
encia de funco
es simples, convergindo
uniformemente para .
R
Ent
ao P 7 k dP converge uniformemente para x 7 dP . A conclus
ao do exerccio
segue facilmente.
5.1.5. Lembre (Exerccio 4.3.4) que um sistema
e erg
odico se, e somente se, a sua extens
ao
natural
e erg
odica. Conclua que, em geral, a decomposica
o erg
odica da extens
ao natural
e
dada pelo levantamento da decomposica
o erg
odica do sistema.
5.1.6. O Teorema 3.2.6 garante que M0 tem medida W
total. Para mostrar
e partica
o
que P
c
mensur
avel, considere a sequ
encia de partico
es Pn = n
i,j=1 Ei,j , Ei,j , com Ei,j = {i <
qj }, onde {i : i 1}
e um subconjunto enumer
avel denso da bola unit
aria de C 0 (M, R)
(Teorema A.3.13) e {qj : j 1}
e uma enumeraca
o dos n
umeros racionais. Considere uma
desintegraca
o {P : P P} da medida relativamente a P. Para ver que as medidas P s
ao
erg
odicas use o Exerccio 4.1.4.
5.1.7. O enunciado n
ao depende da escolha da decomposica
o erg
odica, uma vez que ela
e
essencialmente u
nica. Considere a construca
o no Exerccio 5.1.6. O conjunto M0
e saturado
pela partica
o W s , ou seja, se x M0 ent
ao W s (x) M0 . Al
em disso, a aplicaca
o y 7 y
e
s
constante em cada W (x). Como a partica
o P
e caracterizada por P(x) = P(y) x = y ,
segue que W s P restrito a M0 .
5.2.1. Considere as projeco
es can
onicas P : M PR e Q : M Q, asR medidas quociente

P = (P ) e
Q = (Q ) e as desintegraco
es = P d
P (P ) e = RQ d
Q (Q). Al
em
disso, para cada
P,Q = (Q ) P e a desintegraca
o P = P,Q d
P,Q (Q).
R P P, considere
Observe que
P,Q d
P (P ) =
Q : dado qualquer B Q,
Z
Z
1
1

P,Q (B) d
P (P ) =
P (Q
(B)) d
P (P ) = (Q
(B)) =
Q (B).

Para verificar que (Q),Q


e desintegraca
o de relativamente a Q: (a) P,Q (Q) = 1 para

P,Q -quase todo Q e


P -quase todo P . Al
em disso, P,Q = (Q),Q para para
P,Q -quase
todo Q e
P -quase todo P , porque P (P ) = 1 para
P -quase todo P . Pela observaca
o anterior, segue que (Q),Q (Q) = 1 para
Q -quase todo Q. (b) P 7 P (E)
e mensur
avel, a menos
de medida nula, para todo conjunto boreliano E M . Por construca
o (Seca
o 5.2.3), existe
uma a
lgebra enumer
avel geradora A tal que P,Q (E) = limn P (E Qn )/P (Qn ) para todo
E A (onde Qn
e o elemento de Qn que cont
em Q). Deduza que P 7 (Q),Q (E)
e mensur
avel, a menos de medida nula, para todo E A. Estenda esta conclus
ao paraR todo boreliano
E,R usando o argumento de classes
otonas na Seca
o 5.2.3. (c)
P (P ) =
R
R R mon
R Temos = P d
P,Q d
P,Q (Q)d
P (P ) =
(Q),Q d
P,Q (Q)d
P (P ) = (Q),Q d
Q (Q).

5.2.2. Argumente que a partica


o Q do espaco M1 (M ) em pontos
e mensur
avel. Dada uma
desintegraca
o {P : P P}, considere a aplicaca
o mensur
avel M 7 M1 (M ), x 7 P (x) .
A pr
e-imagem de Q por esta aplicaca
o
e uma partica
o mensur
avel. Verifique que essa pr
eimagem coincide com P num subconjunto com medida total.
R
R
5.2.3. Observe que a famlia dos conjuntos B B tais que B e() d = B d
e uma
-
algebra completa e cont
em n Pn , logo cont
em B. Deduza que e() = em -quase todo
ponto, tal como afirmado.

5.2.4. As hip
oteses sobre M implicam que M
e espaco m
etrico e admite base enumer
avel de
abertos
formada por cilindros (lembre da Seca
o 2.4.2). Usando (2.4.7) e a hip
otese de que f
tamb

e contnua, verifique que M


em
e completo. Inicialmente, defina
no conjunto dos cilindros, por meio de (2.4.8). Mostre que
est
a bem definida: se [Ak , . . . , A0 ] = [Bl , . . . , B0 ] com
k l 0, ent
ao Ak f k (A0 ) = f kl (Bl f l (B0 )) e, portanto,
([Ak , . . . , A0 ]) =

([Bl , . . . , B0 ]). Al
em disso, se [Ak , . . . , A0 ] coincide com uma uni
ao disjunta de cilindros
ao Ak f k (A0 ) coincide com a uni
ao disjunta dos con[Aik , . . . , Ai0 ], i = 1, . . . , N ent
P
i , . . . , Ai ]). Conclua que
([Ak , . . . , A0 ]) =

([A
juntos Aik f k (Ai0 ) e, portanto,
0
i
k
podemos estender a uma funca
o aditiva na
algebra gerada pelos cilindros, a qual coincide

490

DICAS E SOLUC
OES
DOS EXERCICIOS

com a famlia das uni


oes finitas disjuntas de cilindros. Seja A a
algebra gerada pela base
enumer
avel de abertos U . Claro que A est
a contida na
algebra gerada por todos os cilindros.
.
Pela Proposica
o 2.4.4, a restrica
o de
a A se estende a uma medida de probabilidade em M
Conclua que esta probabilidade
e um levantamento de .
6.1.1. Considere f sendo uma rotaca
o racional em S1 .
6.1.2. Observe que se f
e transitiva e
e uma funca
o contnua satisfazendo f = ent
ao

e constante.
6.1.3. A funca
o
e invariante.
6.2.1. A transformaca
o h
e invertvel e preserva a medida m. A relaca
o de conjugaca
o
h f0 = f h
e equivalente `
a equaca
o cohomol
ogica.
6.2.2. A transformaca
o h
e um homeomorfismo e a relaca
o de conjugaca
o h f0 = f h
e
equivalente `
a equaca
o cohomol
ogica.
P
P
2inx e u(x) =
2inx na equa
6.2.3. Substitua (x) =
ca
o cohomol
ogica e
n an e
n bn e

resolva em ordemPa bn para obter (6.2.9).


Observe
que
b
0 = 0 e que bn = bn para todo
P

n 1. Portanto, n=1 |bn |2 < nZ |bn |2 u L2 (m).

6.2.4. Se
e diofantino ent
ao existe C > 1 tal que |e2iq 1| C 1 |q| para todo q 1.
Ent
ao |bn | Cn |n| para todo n suficientemente grande.
6.2.5. Represente por X o fecho da
orbita do ponto x. Se X
e minimal, para cada y X existe
n(y) 1 tal que d(f n(y) (y), x) < . Ent
ao, por continuidade, y admite uma vizinhanca aberta
V (y) tal que d(f n(y) (z), x) < para todo z V (y). Tome y1 , ..., ys tais que X i V (yi )
e tome m = maxi n(yi ). Dado qualquer k 1, tome i tal que f k (x) V (yi ). Ent
ao
d(f k+ni (x), x) < , ou seja, k + ni R . Isto prova que, dados quaisquer m + 1 inteiros
consecutivos, pelo menos um deles est
a em R . Logo R
e sind
etico. Agora suponha que X n
ao

e minimal. Ent
ao existe um conjunto invariante, fechado e n
ao vazio F contido propriamente
em X. Note que x
/ F e, portanto, para todo suficientemente pequeno, existe um aberto
U que cont
em F e n
ao intersecta B(x, ). Por outro lado, como R
e sind
etico, existe m 1
tal que, para qualquer k 1 existe n {k, . . . , k + m} tal que f n (x) B(x, ). Tome k tal
f k (x) U1 , onde U1 = U f 1 (U ) f m (U ), e encontre uma contradica
o.
6.2.6. Pelo Exerccio 6.2.5, o conjunto R = {n N : d(x, f n (x)) < }
e sind
etico para todo
> 0. Se y est
a pr
oximo de x ent
ao {n N : d(f n (x), f n (y)) < } cont
em blocos de inteiros
consecutivos com comprimento arbitr
ario, qualquer que seja > 0. Seja U1 uma vizinhanca
qualquer de x. Segue das observaco
es anteriores que existem infinitos valores de n N
tais que f n (x), f n (y) est
ao em U1 . Fixe n1 com essa propriedade. Em seguida, considere
U2 = U1 f n1 (U1 ). Pelo passo anterior, existe n2 > n1 tal que f n2 (x), f n2 (y) U2 .
Continuando deste modo, construa uma sequ
encia n
ao crescente de abertos Uk e uma sequ
encia
crescente de n
umeros naturais nk tais que f nk (Uk+1 ) Uk e f nk (x), f nk (y) Uk . Verifique
ao em U1 para quaisquer i1 < < ik , k 1.
que f ni1 ++nik (x) e f ni1 ++nik (y) est
6.2.7. Considere o deslocamento : em = {1, 2, ..., q}N . A partica
o N = S1 Sq
define um certo elemento = (n ) , dado por n = i se e somente n Si . Considere
no fecho da
orbita de tal que e est
ao pr
oximos e o fecho da
orbita de
e um conjunto
minimal. Aplique o Exerccio 6.2.6 com x = , y = e U = [0; 0 ] para obter o resultado.

6.3.1. Escreva (g, h) = g h e sejam 1 e 2 as suas derivadas parciais. Verifique que


2 (g0 , h0 )
e um isomorfismo, para quaisquer g0 , h0 G. Tome h0 = g0 1 e use o teorema
da funca
o implcita.
6.3.2. Dado g0 G e dada qualquer sequ
encia (gn )n g0 , seja h0 qualquer ponto de
1
acumulaca
o da sequ
encia (gn
)n . Por continuidade, g0 h0 = e, ou seja, h0 = g01 . Conclua
usando a hip
otese de compacidade.
6.3.3. Verifique que d(, ) 6= d(, ), onde






1 1
1 1
1 0
=
, =
, =
.
0 1
0
1
1 1
6.3.4. Como G
e localmente compacto, existe algum compacto K G com medida positiva.
Supondo que G n
ao
e compacto, construa uma sequ
encia (gn )n em G tal que os conjuntos

491
gn K = {gn g : g K} s
ao disjuntos dois-a-dois. Conclua que a medida de Haar
e infinita. Para
a recproca, tome um aberto U G com medida finita e considere a cobertura {g 1 U : g U }
de G. Por compacidade, existe subcobertura finita.
6.3.5. Dado qualquer g R \ {0},
Z
Z
Z
Z
Z
(gs)
(gs)
(x)
( Eg ) d.
dx =
|g|ds =
ds =
d =
|x|
|gs|
|s|
GL(1,R)
GL(1,R)
Para a segunda parte do enunciado, identifique GL(1, C) com C \ {0} e considere a medida
definida por
Z
Z
(x + yi)
d =
dxdy.
2
C\{0} |x + yi|
GL(1,C)

Use a f
ormula de mudanca de var
avel como no caso anterior, observando que se g = a + bi
ent
ao Eg (x + yi) = (ax by) + (ay + bx)i e o jacobiano de Eg
e constante igual a |a + bi|2 .
6.3.6. Escreva g = (a11 , a12 , a2 , a22 ). Ent
ao,

Eg (x11 , x12 , x21 , x22 ) = (a11 x11 + a12 x21 , a11 x12 + a12 x22 , a21 x11 + a22 x21 , a21 x12 + a22 x22 ).
Escreva o lado direito como (y11 , y12 , y21 , y22 ). Use a f
ormula de mudanca de vari
aveis na
integral, observando que det(y11 , y12 , y21 , y22 ) = (det g) det(x11 , x12 , x21 , x22 ) e
dy11 dy12 dy21 dy22 = (det g)2 dx11 dx12 dx21 dx22 .
No caso complexo, tome
Z
Z
d =
GL(2,R)

(z11 , z12 , z21 , z22 )


dx11 dy11 dx12 dy12 dx21 dy21 dx22 dy22 ,
| det(z11 , z12 , z21 , z22 )|4

onde zjk = xjk + yjk i. [Observaca


o: Generalize estas construco
es para dimens
ao qualquer!]
6.3.7. (3) (2)
e trivial. Para (2) (3) use a dist
ancia invariante dada pelo Lema 6.3.6.
(3) (1) segue do Teorema 6.3.8. (1) (3) segue da Proposica
o 6.2.1.

6.3.8. Dados = (n )n e = (n )n e N 1, as primeiras N coordenadas de + dependem


apenas das primeiras N coordenadas de e de . Analogamente, as N primeiras coordenadas
de s
o dependem das primeiras N coordenadas de . Isto garante que + e x 7 x s
ao
contnuas. A mesma observaca
o mostra que as translaco
es preservam a dist
ancia (6.3.5).

6.3.9. Dado x M , existe um u


nico 0 r < 10k tal que f r (x) [b0 , ..., bk1 ]. Al
em disso,
f n (x) [b0 , . . . , bk1 ] se, e somente se, n r
e m
ultiplo de 10k . Use esta observaca
o para
concluir que ([b0 , . . . , bk1 ], x) = 10k para todo x M . Conclua que se f admite uma probabilidade invariante erg
odica ent
ao ([b0 , . . . , bk1 ]) = 10k para todo b0 , . . . , bk1 . Isto
determina de maneira u
nica. Para terminar mostre que est
a bem definida e
e invariante.
6.3.10. Note que fn+1 (x) = fn (x) exceto se x est
a no topo de Sn . Os topos formam uma
sequ
encia decrescente cuja interseca
o
e vazia (porque os intervalos s
ao abertos `
a direita).
Logo, f (x) = fn (x) para todo x e todo n suficientemente grande. Segue que f 1 (A) =
1
k n>k fn (A) para todo A e, portanto, f preserva a medida de Lebesgue. Para mostrar a
unicidade erg
odica, relacione f com o od
ometro.
6.3.11. Considere a sequ
encia de palavras wn definida indutivamente por w1 = e s(wn+1 ) =
wn , para n 1. Decomponha a palavra s() = w2 = r1 e prove, por induca
o, que wn+1
pode ser decomposto como wn+1 = wn rn , para alguma palavra rn com comprimento maior ou
igual a n, tal que s(rn ) = rn+1 . Defina w = r1 r2 e note que s(w) = s()s(r1 )s(r2 ) =
r1 r2 r3 = w. Isto prova a exist
encia. Para obter a unicidade, seja uma sequ
encia
comecando por tal que S() = . Decomponha como = 1 2 3 , de tal modo que i
e ri tenham o mesmo comprimento. Note que S() = 1 = r1 , pelo que 1 = r1 . Conclua
a prova por induca
o.
P
6.4.1. Suponha que (zj )j
e equidistribuda. Se lim supn (1/n) n
ao
j=1 I (zj ) > m(I) ent
Pn
existem > 0 e infinitos valores de n para os quais (1/n) j=1 I (zj ) m(I) + . Fixe um
o contnua : S 1 [0, 1]
intervalo aberto U com I U e m(U/I) < /2. Considere uma funca
tal que XI XU , para chegar a uma contradica
o. Logo, o limite superior
e maior ou


DICAS E SOLUC
OES
DOS EXERCICIOS

492

igual que m(I). Analogamente, o limite inferior


e menor ou igual a m(I). Para a recproca,
dada uma fun
o contnua : SR1 R e dado > 0, considere funco
es simples g e h tais que
R ca
g h e ( g) dm < e (h ) dm < .

6.4.2. Dados quaisquer 0 < 1, temos que n (, ) no crculo se, e somente


se, existe algum inteiro k 1 tal que k 2 + 2k + 2 < n < k 2 + 2k + 2 . Para cada k o
n
umero de valores de valores de n que satisfazem esta desigualdade
e igual `
a parte inteira de
2k( ) + ( 2 2 ). Portanto,
#{1 n < N 2 :

N1
X

2k( ) + ( 2 2 )
n (, )}
k=1

e a diferenca entre o termo da direita e o da esquerda


e menor que N . Logo
lim

1
#{1 n < N 2 : n (, )} = .
N2

Um c
alculo semelhante mostra que a sequ
encia (log n mod Z)n n
ao
e equidistribuda no
crculo. [Observaca
o: Mas ela admite uma densidade limite contnua (n
ao-constante). Calcule
essa densidade!]
6.4.3. Defina n = an + (1/a)n . Verifique que (n )n
e a sequ
encia de Fibonacci e, em
particular, n N para todo n 1. Agora observe que (1/a)n converge para zero. Logo,
{n 1 : an mod Z I}
e finito, para qualquer intervalo I S 1 cujo fecho n
ao cont
em zero.
claro que a condica
7.1.1. E
o
e necess
aria. Para ver que
e suficiente: Dado A, considere o
subespaco fechado V de L2 () gerado pelas funco
es 1 e Xf k (A) , k N. A hip
otese garante
que limn Ufn (XA )Xf k (A) = (XA 1)(Xf k (A) 1) para todo k. Conclua que limn Ufn (XA ) =

(XA 1)( 1) para todo V. Dado um conjunto mensur


avel B, escreva XB = + com
V e V para concluir que limn Ufn (XA ) XB = (XA 1)(XB 1)
P
7.1.2. Supondo que E existe, decomponha (1/n) n1
j=0 |aj | em duas parcelas, uma com j E
e a outra com j
/ E. As hip
oteses sobre P
E implicam que as duas parcelas convergem para
zero. Reciprocamente, suponha que (1/n) n1
j=0 |aj | converge para zero. Defina Em = {j
0 : |aj | (1/m)} para cada m 1. A sequ
encia (Em )m
e crescente e cada
 Em tem densidade
zero; em particular, existe m 1 tal que (1/n)# Em {0, . . . , n 1} < (1/m) para todo
n m . Escolha (m )m crescente e defina E = m (Em {m , . . . , m+1 1}). Para a segunda
parte do exerccio, aplique a primeira parte `
as duas sequ
encias, (an )n e (a2n )n .
P
7.1.3. Segue do crit
erio que foi apresentado no Exerccio 7.1.2 que a sequ
encia (1/n) n1
j=0 |aj |
Pn1
converge para zero se, e somente se, (1/n) j=0 |akj | converge para zero para qualquer k 1.
[Observaca
o: Alternativamente, podemos usar o Teorema 8.2.1.]
7.1.4. Seja m a medida de Haar. Considere a base de Fourier k (x) = e2ikx , k Z do
espaco L2 (m). Note que k fA = A(k) . A hip
otese implica que a sequ
encia dos iterados
An (k), n Z
e injetiva, para todo k 6= 0. Em particular, para quaisquer k, l Zd (considere
n = ( 1)( 1) para todo n suficientemente
os casos k 6= 0 e k = 0 separadamente) k fA
l
k
l
grande. Por linearidade, vale propriedade an
aloga para qualquer par de combinaco
es finitas
de elementos da base de Fourier. Conclua o argumento usando a Proposica
o 7.1.12.
7.1.5. Seja uma probabilidade
e
R
Rabsolutamente cont
R nua e = d/d. Suponha que (f, )
misturador.
Ent
ao d(fn ) = ( f n ) d d para toda funca
o contnua (note
R
que d = 1 porque
e probabilidade). Isto mostra que fn . Para a recproca,
considere C 0 (M ) e L1 (). Escreva = + com > 0: ent
ao =
s
ao medidas
absolutamente
cont
nuas
relativamente
a
.
Aplicando
a
hip
o
tese
as suas
`
R
R
R
R
R
normalizaco
es, ( f n ) d = ( f n ) d (M ) d = d d. Agora
use a Proposica
o 7.1.12 e o fato de que C 0 (M )
e denso em L () (Exerccio A.5.7).
R
7.1.6. (Pollicott, Yuri [PY98]) Basta tratar o caso em que j d = 0 para todo j. Use
induca
o no n
umero k de funco
es. O caso k = 1 est
a contido no Teorema 3.1.5. Use as

493
desigualdades
n
1
1 X
an
N n=1
N

Nm+1
X 
n=1

m1
 m
1 X
an+j +
m j=0
N

max |ai | +

1im

max

NmiN

|ai |

N
N
2
1 X
X
(1/N )
bn
|bn |2
N n=1
n=1

para concluir que


R
(1/N ) PN1 (1 f n ) (k f kn ) 2 d
e majorado por
j=0

Z
m1
N
2
 2m

 2
1 X
1 X
m2 
|
1 f n+j k f k(n+j) d +
max supess |i | .
+ 2
1ik
N n=1
m j=0
N
N
A integral
e igual
m1
X m1
X Z
i=0 j=0

k 
Y

l=1

l l f l(ji)



f l(n+i) d.

Pela hip
otese de induca
o,
N
k
k Z
Y


1 X Y
l l f l(ji) d
l l f l(ji) f l(n+i)
N n=1 l=2
l=2

em L2 (), quando N . Portanto,


N Z Y
k 
k Z
Y


1 X
l l f l(ji) f l(n+i) d
l l f l(ji) d
N n=1 l=1
l=1

em L2 (), quando N . Juntando estas estimativas,


lim sup
N

m1 m1 k Z
N
1 X


 2
1 X X Y

l (l f l(ji) d.
1 f n k f kn d 2
N n=1
m i=0 j=0 l=1

R

Como (f, )
e fracamente misturadora, l (l f lr d converge para 0 quando r ,
restrito a um conjunto de valores com densidade 1 no infinito (lembre do Exerccio 7.1.2).
Portanto, a express
ao no lado direito est
a pr
oxima de zero quando m
e grande.
7.2.1. Estenda
a
algebra A das uni
oes finitas disjuntas de cilindros, por aditividade. Isso
e
P`
possvel porque j Pi,j = 1 para todo i e, portanto, a definica
o da medida de cada cilindro
e
[m; am , . . . , an ]
e compatvel
es das medidas dos seus subcilindros, no sentido de
P com as definico
que ([m; am , . . . , an ]) = b ([m; am , . . . , an , b]). Em seguida, use o fato de que a
algebra A

e compacta (porque todos os elementos s


ao compactos), para concluir que satisfaz a hip
otese
do Teorema A.1.14.
7.2.2. [Pet83] Suporemos X finito. Sejam P k = (pki,j )i,j k 1 os iterados da matriz de
P
k
transica
o. Mostre que se o deslocamento
e fracamente misturador ent
ao (1/n) n1
k=0 |Pi,j
pj | 0. Conclua (usando o Exerccio 7.1.2) que para cada i, j existe um conjunto K = K(i, j)
k
de densidade 0 tal que limkK
e aperi
odica.
/ pi,j = pj . Deduza que a matriz P
7.2.3. Sim. Defina (qi )i e (Qi,j )i,j por qi = ([0; i]) e qi Qi,j = ([0; j, i]).
7.2.4. A definica
o de mem
oria zero significa que
([m l; aml , . . . , am1 , am ])
= ([m; am ]) = ([0; am ])
([m l; aml , . . . , am1 ])
para todo l 0, todo m e todo (an )n . Escreva pi = ([0; i]) para concluir que
e medida
de Bernoulli. A definica
o de mem
oria um significa que
([m 1; am1 , am ])
([m l; aml , . . . , am1 , am ])
=
([m l; aml , . . . , am1 ])
([m 1; am1 ])


DICAS E SOLUC
OES
DOS EXERCICIOS

494

para todo l 0, todo m e todo (an )n . Escreva pi = ([0; i]) e Pi,j = ([0; i, j])/([0; i])
dada
para concluir que
e medida de Markov. Para k 2, considere a aplicaca
o h :
por h((xn )n ) = (
xn )n onde x
n = (xn , . . . , xn+k1 ). Verifique que h
e medida de Markov
e que a restrica
para o deslocamento em
o de h ao suporte de
e um homeomorfismo sobre
o suporte de
. Para exemplificar, esbocamos o caso k = 2 e = X N . Dados a
= (a1 , a2 ) e
b = (b1 , b2 ) em X,
defina
([1; a1 , a2 , b2 ])
se a2 = b1
Pa,b =
([1; a1 , a2 ])

(diremos que a dupla (


a,
b)
e compatvel)

P
= 1 para todo a

e Pa,b = 0 caso contr


ario. Verifique que Pa,b 0 e que
X.

Pa
bX
,b
P
Logo, Pa,b
e matriz estoc
astica. Defina pa = ([0; a1 , a2 ]). Mostre que
p
P
=
p

a
X
a
,b
b
Considere a medida de Markov definida por P e p. Verifique que
para todo
b X.
pam Pam ,am+1 Pan1 ,an = pam Pam ,am+1 Pan ,an+1

se as duplas (
aj , a
j+1 ) s
ao todas compatveis e
e igual a zero caso contr
ario. Verifique que
h1 ([m; a
m , . . . , a
n ]) = [m; am , . . . , an+1 ] se se as duplas (
aj , a
j+1 ) s
ao todas compatveis e

e o conjunto vazio caso contr


ario. Conclua que = h .
7.2.5. O primeiro enunciado
e an
alogo ao Exerccio 7.2.1. A definica
o garante que k tem
mem
oria Rk. Dado > 0 e qualquer funca
o (uniformemente) contnua : R, existe 1
tal que | C d (x)(C)| (C) para todo x C, todo cilindro C de comprimento
l R e toda
R probabilidade . Como = k para cilindros de comprimento k, segue que
| dk d| para todo k . Isto prova que (k )k converge para na topologia
fraca .
P n1 n2
n1 +n2
7.2.6. (1) Use que Pi,i
= j Pi,j
Pj,i . Todos os termos nesta express
ao s
ao n
ao negativos
e o termo correspondente a j = i
e positivo. (2) A menos de substituir R por R/, podemos
supor = 1. Comece por mostrar que se S Z
e fechado por adica
o e subtraca
o ent
ao
S = aZ, onde a
e o menor elemento positivo de S. Use esse fato para mostrar que se a1 , ..., as
s
ao inteiros positivos com m
aximo divisor comum igual a 1 ent
ao existem inteiros b1 , ..., bs
tais que b1 a1 + ... + bs as = 1. Agora tome a1 , ..., as R tais que o seu m
aximo divisor comum
seja igual a 1. Usando a observaca
o anterior, e a hip
otese de que R
e fechado por adica
o,
concluimos que existe p, q R tais que p q = 1. Para terminar, mostre que R cont
em todo
inteiro n pq. (3) Considere i, j X quaisquer e sejam i , j os m
aximos divisores comuns de
k > 0 e P l > 0.
R(i), R(j), respectivamente. Por irredutibilidade, existem k, l 1 tais que Pi,j
j,i
Deduza que se n R(i) ent
ao n + k + l R(j). Em vista de (2), isso s
o
e possvel se i j .
Por simetria dos papeis de i e j, segue que tamb
em temos i j . Se 2 ent
ao, para
n = 0 para valores de n arbitrariamente grandes e, consequentemente, P
qualquer i, temos Pi,i
n
ao pode ser aperi
odica. Agora suponha = 1. Ent
ao, usando (2) e a hip
otese de que X
e
n > 0 para todo i X e todo n m. Usando a irredutibilidade
finito, existe m 1 tal que Pi,i
l > 0.
de P e a finitude de X, existe k 1 tal que para quaisquer i, j existe l k tal que Pi,j
m+k
Deduza que Pi,j
> 0 para todo i, j e, portanto, P
e aperi
odica. (4) Fixe qualquer i X e,
n > 0}.
para cada r {0, . . . , 1}, defina Xr = {j X : existe n r mod tal que Pi,j
Verifique que estes conjuntos Xr cobrem X e s
ao disjuntos dois-a-dois. Mostre que a restrica
o
de P a cada um deles
e aperi
odica.

7.3.1. Pelo teorema de Darboux, existem coordenadas (x1 , x2 ) na vizinhanca de qualquer


ponto de S tais que = dx1 dx2 . Considere a express
ao do campo de vetores nessas
coordenadas: X = X1 (/x1 ) + X2 (/x2 ). Mostre que = X1 dx 2 X2 dx1 e, portanto,
d = (div X) dx1 dx2 . Logo,
e fechada se, e somente se, o divergente de X
e nulo.
7.3.2. (1) Suponha que
e redutvel. Ent
ao existe uma posica
o k tal que os r
otulos nas
posico
es 1 a k 1 nas duas linhas de s
ao os mesmos. Sejam e os r
otulos na posica
o
k na primeira linha e na segunda linha, respectivamente. Verifique que I = f (I ) e
deduza que (, ) n
ao satisfaz a condica
o de Keane. (2) Suponha que (, ) n
ao satisfaz a
condica
o de Keane: existem m 1, e tais que f m (I ) = I 6= 0. Ent
ao I =
I + w(1) + + w(m) , onde os w(j) s
ao componentes do vetor de translaco
es w. Deduza
que o vetor de comprimentos
e racionalmente dependente, usando que tanto I e I
quanto as componentes de w s
ao combinaco
es lineares inteiras das componentes de .

495
7.3.3. Suponha que f m (x) = x para algum m 1 e algum x I. Considere o conjunto J dos
pontos y tais que f j (x) e f j (y) pertencem a um mesmo intervalo Ij para j = 0, . . . , m 1.
Note que J
e um intervalo e que f m restrita a J
e uma translaca
o. Deduza que f m | J = id
e, em particular, f m (J) = J. A definica
o de J implica que existem 1 k m e A tais
que f k (J) = I . Conclua que f m (I ) = I e que isto contradiz a condica
o de Keane, a
menos que I = 0, ou seja, a menos que ocupe a primeira posica
o na linha de cima de .
Para obter uma contradica
o tamb
em neste segundo caso, argumente que existe A tal que
f (I ) = 0 = I . Mostre que f m (I ) = I e que I 6= 0, uma vez que
e irredutvel.


A1 Ad
e = ( )A . Note que Ad 6= Bd , por irreducibili7.3.4. Escreva =
B1 Bd
a tr
es casos
dade, e que a = max{Ad , Bd }. Considere k e l tais que Ak = Bd e Bl = Ad . H
a considerar, dependendo do tamanho relativo dos intervalos IAd e IBd : (i) |IAd | < |IBd |:
otulos Ak e Ad , de tal modo
Ent
ao a = IAd . Decomponha IAd em dois subintervalos, com r
que |IA | = |IAd |. Em outras palavras, IA = IAk f 1 (IAd ). Mostre que g(x) = f 2 (x)
d
d
a descrita por
se x IA e g(x) = f (x) em todos os demais pontos. Conclua que R(f ) est
d
( , ), com (lembre que Ak = Bd e Bl = Ad )


A1 Ak Ad Ad1
=
Bd
B1
Bl
e = (Ak Ad )/a se = Ak e = Ad /a se = Ad e = /a em todos os
demais casos. (ii) |IAd | > |IBd |: Este caso pode ser reduzido ao anterior, substituindo f pela
sua inversa (as duas linhas de s
ao permutadas) e observando que R(f 1 ) = R(f )1 . (iii)
|IAd | = |IBd |: Neste caso f (IAk ) = IAd e g(x) = f 2 (x) se x Ak e g(x) = f (x) em todos os
outros casos. A transformaca
o pode ser descrita usando o alfabeto A = A \ {Ad }: elimina o
r
otulo Ad na linha de cima de e substitua Bl = Ad por Ak = Bd na linha de baixo.
7.3.5. Observe que f
e invertvel e que se A
e um intervalo d-
adico A de nvel r 1, (ou seja,
um intervalo da forma A = [idr , (i + 1)dr ]), existe s r tal que f (A) est
a formado por
dsr intervalos d-
adicos de nvel s. Deduza que f preserva a medida de Lebesgue. Mostre
tamb
em que se A e B s
ao intervalos d-
adicos ent
ao, como n
ao tem pontos peri
odicos,
m(f k (A) B) = m(A)m(B) para todo k suficientemente grande.

7.4.1. Se (n )n
e sequ
encia de Cauchy relativamente `
a norma, dado > 0 temos |m (x)
n (x)| e |(m n )(x) (m n )(y)| d(x, y) para quaisquer x, y e quaisquer m, n
suficientemente grandes. A primeira condica
o implica que (n )n converge uniformemente
para alguma funca
o contnua . Mostre que k n k para todo n suficientemente grande
e, em particular, E.
7.4.2. (1) Dados y 1 , y 2 M , escreva f 1 (y i ) = {xi1 , . . . , xid } com d(x1j , x2j ) 1 d(y 1 , y 2 ).
Ent
ao
d
1X
|L(y 1 ) L(y 2 )| =
|(x1j ) (x2j )| K () d(y 1 , y 2 ) .
d j=1

(2) Segue que kLk sup || + K () kk para todo E, valendo a igualdade se,
e somente se,
e constante. Logo kLk = 1. (3) Seja Jn = [inf Ln , sup Ln ]. Pelo primeiro
item, a sequ
encia (Jn )n
e descrescente e o di
ametro de Jn converge exponencialmente para
zero. Tome para o ponto na interseca
o e note que kLn k = sup |Ln |+K (Ln ).
(4) As funco
es constantes s
ao autovetores de L, associados ao autovalor = 1. Segue que
+c = + c para todo E e todo c R. Ent
ao H = { : = 0}
e um hiperplano
de E transversal `
a reta das funco
es constantes. Este hiperplano
e invariante por L e, pelo
terceiro item, o raio espectral de L | H
e menor ou igual que < 1. (5) Pelo segundo
item kLn Ln k kLk Lk k para todo n k 1. Fazendo n , vem que
| | kLk Lk k para todo k 1. Usando o primeiro item e fazendo k , vem
que | | sup | |. Portanto, o operador linear 7
e contnuo relativamente `
a
norma do espaco C 0 (M ).
8.1.1.
= 3x [3x] e = h , onde h
e definido da seguinte forma. Escreva
P Tome g(x)
n com a {0, 1} e a 6= 1 para infinitos valores de n. Ent
x=
ao tome h(x) =
n
n
n=1 an 2


DICAS E SOLUC
OES
DOS EXERCICIOS

496
P

n , onde b = 0 se a = 0 e b = 2 se a = 1. O suporte de
e o conjunto de
n
n
n
n
n=1 bn 3
Cantor usual.
8.1.2. Denote Xi = X [0; i] e pi = ([0;P
i]), para i = 1, . . . , k. ComoP

e uma medida
de Bernoulli, (Xi ) = pi (f (Xi )). Logo,
i pi (f (Xi )) = 1. Como
i pi = 1, segue
que (f (Xi )) = 1 para todo i. Consequentemente, i f (Xi ) tem medida total. Tome x
nessa interseca
o. Se (f, ) e (g, ) s
ao ergodicamente equivalentes ent
ao existe uma bijeca
o
: X Y entre subconjuntos invariantes com medida total tal que f = g . Tome
x X com k pr
e-imagens x1 , . . . , xk em X. Os pontos (xi ) s
ao pr
e-imagens de (x) para a
transformaca
o g. Logo k l; por simetria, tamb
em temos que l k.
8.1.3. Considere todos os cilindros da forma

C(m, a1 , . . . , am1 ) = [0; c0 , . . . , cl , a1 , . . . , am1 , am , . . . , am+l ]


com m > 0 e (am , . . . , am+l ) = (c0 , . . . , cl ) 6= (aj , . . . , aj+l ) para m > j > 0. Mostre que
C
e a uni
ao disjunta destes cilindros, a menos de medida nula. Defina C = l+m restrito
a cada cilindro C(m, a1 , . . . , am1 ). Seja {Ck : k N} uma enumeraca
o destes cilindros.
Observe que C envia cada Ck bijetivamente em C. A cada x em C associe (ki )i NN
i (x) C . Mostre que a aplica
ca
o h : C NN assim definida
e mensur
avel
dada por C
ki
invertvel e conjuga C ao deslocamento N em NN . Supondo que
e uma medida de Markov,
observe que C (E) = C (C (E))C (Ck ) para todo E Ck e utilize este fato para mostrar
que C preserva C . Mostre que = h C
e a medida de Bernoulli associada ao vetor de
probabilidade (pk )k com pk = C (Ck ).
8.2.1. Pelo lema de Kakutani-Rokhlin (Exerccio 1.4.4), dado n existe B tal que os iterados
f i (B), i = 0, . . . , n 1 s
ao disjuntos dois a dois e a sua uni
ao tem medida maior que 1 1/n.
P
i

Tome n = n /kn k, onde n = n1


i=0 Xf i (B) . Verifique que kUf n n k 0. E claro
que todo autovalor aproximado est
a no espectro de Uf : a definica
o significa que a inversa
de (Uf id ), caso exista, n
ao
e um operador limitado.
8.2.2. Usando expans
ao em s
erie de Fourier, os autovalores de U s
ao as pot
encias e2in ,
n Z e o autoespaco associado a cada um deles
e a reta gerada por n (x) = e2inx . Para que
U e U tenham os mesmos autovalores
e necess
ario que = . Por outro lado, se =
ent
ao x 7 x define uma equival
encia erg
odica entre (R , m) e (R , m).
8.2.3. A primeira parteP
e an
aloga ao Exerc
o em soma
P cio 8.1.2. Para provar a decomposica
direta, observe que Uk ( n an e2inx ) = n an e2iknx . Logo, basta escrever
X

nZ

an e2inx = a0 +

X
X

an e2inx

j=0

onde a u
ltima soma
e sobre os valores de n tais que k j divide n mas k j+1 n
ao divide n.
Como ambos os subespacos Hp e Hp t
em dimens
ao de Hilbert enumer
avel, existe isomorfismo
isom
etrico h : Hp Hq . Defina h Upj = Upj h para cada j 0 e h = id restrito ao
subespaco das funco
es constantes. Em seguida, estenda h a todo o L2 (m), por linearidade.
Essa extens
ao
e uma equival
encia espectral.
8.2.4. Use o crit
erio do Teorema 8.2.1. Use expans
ao em s
erie de Fourier para encontrar as
soluco
es de Uf = .
8.2.5. Suponha que (f, ) n
ao
e fracamente mixing. Pelo Teorema 8.2.1, existe uma funca
o
n
ao constante tal que Uf = para algum = e2i . Por ergodicidade, o valor absoluto de

e constante em -quase todo ponto. Usando que f n


e
erg
odica para todo n (Exerccio 4.1.8),

e irracional e qualquer conjunto onde
e constante tem medida nula. Dados < em
[0, 2], considere A = {x C : arg((x)) }. Mostre que para todo > 0 existe n
tal que (f n (A) \ A) < . Mostre que, escolhendo | | pequeno,
e possvel contradizer a
desigualdade no enunciado.
8.2.6. Temos |z j 1| 1 sempre que z j 0. Supondo que z 6= 1, isso acontece para
metade dos valores de j, pelo menos. Portanto, nesse caso o primeiro limite
e maior ou igual
que 1/2. Quanto ao segundo limite, note que se z 6= w ent
ao

1 n1
1 (z w)
n 1
2
1

X
(z w)
j =
.


n j=0
n zw
1
n |z w
1|

497
8.2.7. Temos fn+1 (x) = fn (x) para todo x Jn que n
ao est
a no topo de Sn . Logo (pelo
argumento usado no Exerccio 6.1), f (x) = fn (x) para todo x [0, 1) e todo n suficientemente
grande; al
em disso, f preserva a medida de Lebesgue. Seja an = #Sn a altura de cada pilha
Sn . Representamos por {I e , I c , I d } a partica
o de cada I Sn em subintervalos de igual
comprimento, ordenados da esquerda para a direita. (a) Se A
e conjunto com m(A) > 0,
entao para todo > 0 existe n 1 e algum intervalo I Sn tal que m(A I) (1 )m(I).
Se A for invariante, segue que m(A J) (1 )m(J) para todo J Sn . (b) Suponha
que Uf = . Como Uf
e isometria, || = 1. Por ergodicidade, ||
e constante em quase
todo ponto; podemos supor || 1. Inicialmente, suponha que existe n e algum intervalo
I Sn tal que a restrica
o de a I
e constante. Tome x I e e y I c e z I d . Ent
ao
(x) = (y) = (z) e (y) = an (x) e (z) = an +1 (y). Logo = 1 e, por ergodicidade,

e constante. No caso geral, use o teorema de Lusin (Teoremas A.3.5-A.3.9) para chegar `
a
mesma conclus
ao. (c) A
e uma uni
ao de intervalos Ij na pilha Sn para cada n 2. Ent
ao,
f an (Ije ) = Ijc para todo j. Logo, m(f an (A) A) m(A)/3 = 2/27.
8.3.1. Seja {vj : j I} uma base de H formada por autovetores com norma 1 e seja j o
autovalor associado a cada autovetor vj . A hip
otese garante que podemos considerar I = N.
Mostre que para todo > 0 e todo k 1 existe n 1 tal que |n
j 1| para todo
j {1,
.
.
.
,
k}
(isto
pode
ser
feito
usando
o
princ
pio
das
casas
dos
pombos).
Decomponha
P
P
= j cj vj , com cj C. Observe que Ufn = jN cj n
j vj e, portanto,
kUfn k22

k
X

j=1

2
|cj (n
j 1)| +

j=k+1

2|cj |2 2 kk22 +

j=k+1

2|cj |2 .

Dado > 0, podemos escolher e k de tal modo que cada uma das parcelas do lado direito
seja menor que /2.
8.3.2. J
a sabemos que (a) implica (b). Para mostrar que (b) implica (c): pela Proposica
o 8.3.4
e por (8.3.4), temos que {e2ik : k Zd } = {e2il : l Zd }. Em particular, cada grupo
de autovalores cont
em os geradores do outro grupo: e2ij G para todo j = 1, . . . , d e
e2ij G para todo j = 1, . . . , d. A primeira condica
o quer dizer que para cada j existe
Lj = (Lj,1 , . . . , Lj,d ) Zd e existe lj Z tais que j = Lj + lj . Seja L a matriz (Lj,k )j,k
e seja l o vetor (lj )j . Ent
ao = L + l. Analogamente, a segunda condica
o significa que
existem M GL(d, Z) e m Zd tais que = M + m. Ent
ao, = LM + (Lm + l) e
= M L + (M l + m). Como e s
ao racionalmente independentes, segue que LM =
id = M L e Lm + l = 0 = M l + m. Segue que det L = det M = 1, ou seja, as duas
: Rd Rd
matrizes est
ao em SL(d, Z). Para mostrar que (c) implica (a): represente por R

a translaca
o x 7 x + e analogamente para R . A hip
otese de que = L m
odulo Zd d
a
L1 (x) = L(L1 (x) + ) = x + = R
(x) m
que L R
odulo Zd . Seja hL : Td Td o
automorfismo linear induzido por L. Projetando a relaca
o anterior para o toro, obtemos que
hL R h1
co
es
L = R . Como hL preserva a medida de Lebesgue m, temos que as duas rota
s
ao ergodicamente equivalentes.
e equivalente a Rs , ou seja, Rps/q
e equivalente
8.3.3. Se R
e equivalente a R ent
ao Rs
` identidade. Deduza que s q; por simetria, q s. Se q = s, defina h = id no intervalo
a
[0, 1/q) e estenda h a S 1 de tal modo que h R = R h. Verifique que h fica bem definida
e
e uma equival
encia erg
odica.
8.4.1. Adapte os argumentos usados no caso dos deslocamentos de Bernoulli (Exemplos 8.4.2
e 8.4.3), da seguinte forma. No caso unilateral, as condico
es (a) e (c) na definica
o s
ao evidentes. Para provar (b), observe que Ac pertence `
a -
algebra gerada pelos cilindros da forma
[n; cn , , cm ] para quaisquer m n. Ent
ao, dado qualquer C = [0; c0 , . . . , ck ] com k < n,
(Ac C) =

X
i

(Ac [n; i] C) =

X
i

(A [n; i])

Pcnk
,i
k

pi

(C).

Por hip
otese, Pcnk
pi 1 quando n . Segue que (Ac C) = (Ac )(C) e agora o
k ,i
argumento
e an
alogo ao caso Bernoulli. No caso bilateral, a condica
o (a)
e imediata, (b) segue
dos argumentos que acabamos de usar e (c)
e an
aloga ao caso Bernoulli.


DICAS E SOLUC
OES
DOS EXERCICIOS

498

8.4.2. Se a
orbita de algum v 6= 0
e finita, existem m < n tais que (At )m v = (At )n v.
Mostre que algum autovalor de At
e raiz da unidade e, portanto, o mesmo vale para A. Seja
k (x) = e2ikx , k Zd a base de Fourier de L2 (). Observe que Uf (k ) = At (k) . Tome
S Zd \ {0} contendo exatamente um ponto em cada
orbita de At . Tome F = subespaco
gerado por {k : k S} para mostrar que (f, ) tem espectro de Lebesgue. Reciprocamente,
se (f, ) tem espectro de Lebesgue ent
ao (f n , )
e erg
odico para todo n. Pelo Exerccio 4.1.8,
segue que nenhum autovalor de Uf
e raiz da unidade.
8.4.3. Seja U : H H uma isometria n
ao invertvel. Lembrando do Exerccio 2.3.6: Mostre
que existem subespacos fechados V e W de H tais que U : H H
e conjugado, por um
operador unit
ario, ao operador U1 : V W N V W N dado por U1 | V = U | V e
U1 | W N = id . Seja U2 : V W Z V W Z o operador linear definido por U1 | V = U | V
e U1 | W Z = id . Verifique que U2
e um operador unit
ario tal que U2 = U1 , onde
: V WN V WZ
e a inclus
ao natural. Mostre que se E V W N satisfaz as condico
es
da definica
o de espectro de Lebesgue para U1 ent
ao j(E) satisfaz essas mesmas condico
es para
U2 . Conclua que o posto de U1 est
a bem definido.
8.4.4. Por um lado, pelo teorema de Fubini,
Z
Z + Z +
2
2
e(x +y )/2 dxdy =

ex

/2

dx

Por outro lado, usando coordenadas polares,


Z + Z +
Z 2 Z
2
2
e(x +y )/2 dxdy =

/2

dd = 2

2

es ds = 2.

Para a segunda parte do enunciado, tome B tal que BB = A e em seguida faca a mudanca
de vari
avel z = B(w).
8.4.5. Use a Proposica
o 8.4.10.
8.4.6. O lema de Riemann-Lebesgue garante que F toma valores em c0 . O operador F
e
1
cont
em disso,
e injetivo: se F () = 0 ent
ao
R nuo: kF ()k kk para todo L (). Al
P F
(z)(z) d(z) = 0 para toda combinaca
o linear (z) = |j|l aj z j , aj C. Dado qualquer
R
P
1
intervalo I S , a sequ
encia N = |n|N cn z n , cn = I z n d(z) das somas parciais da
s
erie de Fourier da funca
o caracterstica XI
e limitada (veja [Zyg68,
p
agina 90]). Usando o
R
teorema da converg
encia dominada, segue que F () = 0 implica I (z) d(z) = 0, qualquer
que seja o intervalo I. Logo = 0. Se F fosse bijetivo ent
ao, pelo teorema da aplicaca
o aberta,
o seu inverso seria um operador linear contnuo. Ent
ao existiria
c > 0 tal que kF ()k ckk
P
para todo L1 (). Mas isso
e falso: considere DN (z) = |n|N z n para N 0. Verifique
N
N
que F (DN ) = (an )n com an = 1 se |n| N e aN
ario. Logo kF (DN )k = 1
n = 0 caso contr
para todo N . REscrevendo z = e2it , verifique que DN (z) = sen((2N +1)t)/ sen(t). Conclua
que kDN k = |DN (z)| d(z) converge para infinito quando N . [Observaca
o: Tamb
em

e possvel darPexemplos explcitos. Por exemplo, se (an )n


e uma sequ
encia convergindo para

ao a sequ
encia (n )n dada por n = aRn /(2i) para n 1
zero tal que
n=1 an /n = ent
e n + n = 0 para todo n 0 n
ao pode ser escrita na forma n = z n d(z). Veja a
Seca
o 7.3.4 do livro de Edwards [Edw79].]
8.5.1.
ao partico
es. Mostre
P Inicialmente,
P suponha que {Bi : 1 i l} e {Cj : 1 j k} s
que
que Bi intersecta Cj . Isso
i bi XBi =
j cj XCj se, e somente se, bi = cj sempre
P
P
acontece sempre que H(Bi ) intersecta H(Cj ). Conclua que
i bi XH(Bi ) =
j cj XH(Cj ) .
Reduza o caso geral ao caso de partico
es, substituindo {Bi : 1 i l} e {Cj : 1 j k} por
{Bi : 0 i l} e {Cj : 0 j k} definidos por Bi = Bi \ (B1 Bi1 ) para i = 1, . . . , s
e B0 = (B1 Bs )c e b0 = 0 e analogamente para Cj .

8.5.2. Para mostrar que g


e injetivo, note que (g 1 (A)g 1 (B)) = (AB). Se g = h
em quase todo ponto,
e claro que g =
h. Para a recproca, comece por supor que N n
ao tem
atomos. Ent

ao (Proposica
o 8.5.5), podemos considerar N = [0, 1]. Se {x : g(x) 6= h(x)} tem
medida positiva, existe r Q tal que {x : g(x) < r < h(x)} {x : g(x) > r > h(x)} tem
medida positiva. Seja I = [0, r]. Conclua que g 1 (I)h1 (I) tem medida positiva, ou seja,
g(I) 6=
h(I). Estenda este argumento para o caso em que N tem
atomos.

499
8.5.3. Pelo Exerccio 8.5.2, f
e sempre injetivo. Conclua que se f
e sobrejetivo ent
ao ele
e
invertvel: existe homomorfismo de
algebras de medida h : B B tal que h f = f h = id .
Use a Proposica
o 8.5.6 para encontrar g : M M tal que g f = f g em -quase todo
ponto. A recproca
e f
acil: se (f, )
e invertvel em quase todo ponto ent
ao o homomorfismo
de
algebras de medida g associado a g = f 1 satisfaz g f = f g = id ; em particular, f
e
sobrejetivo.
8.5.4. Se Uf
e sobrejetivo, para todo conjunto mensur
avel B existe funca
o mensur
avel tal
que XB = f em quase todo ponto. Mostre que
e funca
o caracterstica de algum conjunto
mensur
avel, a menos de medida nula. Deduza que f
e sobrejetivo. Se f
e sobrejetivo ent
ao
todo conjunto mensur
avel
e da forma f 1 (B) para algum B B. Conclua que a imagem de
Uf cont
em a funca
o caracterstica de todo conjunto mensur
avel. Deduza que Uf
e sobrejetivo.
Au
ltima parte do enunciado segue do Exerccio 8.5.3.
8.5.5. Verifique que se (f, ) tem espectro discreto ent
ao Uf
e invertvel. Use o Exerccio 8.5.4
para concluir.
8.5.6. Verifique que as uni
oes de elementos de n Pn s
ao pr
e-imagens, pela inclus
ao , de
abertos de K. Use esse fato para mostrar que se as cadeias t
em medida nula ent
ao para cada
> 0 existe um aberto A K tal que m(A) < e todo ponto fora de A est
a na imagem da
inclus
ao: em outras palavras, K \ (MP ) A. Conclua que (MP )
e conjunto mensur
avel de
Lebesgue e o seu complementar em K tem medida nula. Para a recproca, use o fato de que
(a) implica (c) no Exerccio A.1.13.
8.5.7. Inicialmente, suponha que M n
ao tem
atomos. Pela Proposica
o 8.5.5, podemos supor
que M = [0, 1]. Ent
ao, basta usar o Exerccio 5.2.4. O caso geral, com a
tomos,
e an
alogo.
8.5.8. Seja B a -
algebra dos subconjuntos mensur
aveis de Lebesgue [0, 1]. Para mostrar que
est
a bem definida, considere A, B B tais que M A = M B. Verifique que m(AB) = 0
e, portanto, m(A) = m(B). Para provar aditividade, considere A, B B tais que M A e
M B s
ao disjuntos. Verifique que m(A B) = 0 e deduza que m(A B) = m(A) + m(B).
Adapte este argumento, para provar que
e -aditiva. Note que (M ) = 1. Logo
e uma
probabilidade em (M, M). Em seguida, verifique que a aplicaca
o H : B M definida por
H(B) = M B
e um isomorfismo de
algebras de medida. Mostre que este isomorfismo n
ao

e induzido por nenhuma aplicaca


o mensur
avel h : M [0, 1]: a aplicaca
o h teria que ser
a identidade em quase todo ponto de M . Conclua que (M, M, ) n
ao pode ser espaco de
Lebesgue.
9.1.1. Dada qualquer partica
o infinita enumer
avel P = {Pk : k 1} com entropia finita, considere a sequ
encia de partico
es finitas Pk = {P1 , . . . , Pk , Qk = j>k Pj }. Ent
ao
h (f, Pk ) h (f, P) h (f, Pk ) + H (P/Pk ) para todo k. Usando que H (P) < ,
verfique que
X
(Pn )
(Pn ) log
H (P/Pk ) =
0 quando k .
(Q
k)
n>k
Portanto, h (f, P) = supk h (f, Pk ).

j (P)) = H (P k /
i (P k )). Pelo
i (P)/ n
9.1.2. Seja g = f k . Ent
ao, H (k1

i=1 g
i=0 f
j=k f
Lema 9.1.12, esta express
ao converge para h (g, Pk ). Agora basta usar o Lema 9.1.13.

9.1.3. (a) Dadas partico


es P e Q de A e B, respectivamente, considere a partica
o R = P Q
de M . Note que Rn = P n Qn para todo n e deduza que
h (f, R) = (A)hA (f, P) + (B)hB (f, Q).
Variando P e Q, conclua que h (f ) (A)hA (f ) + (B)hB (f ). Reciprocamente, dada
uma partica
o R de M , observe que R = R {A, B} pode ser escrita R = P Q, onde
P e Q s
ao partico
es de A e B. Logo, h (f, R) h (f, R ) (A)hA (f ) + (B)hB (f ).
(b) Pelo Lema 4.3.3, existem conjuntos invariantes A1 , . . . , An disjuntos dois-a-dois tais que
i (Ai ) = 1 para todo i. Agora prove o enunciado por induca
o em n, usando o item (a).
9.1.4. O conjunto A das uni
oes finitas disjuntas de ret
angulos Ai Bi , com Ai M e
Bi N
e uma
algebra; por definica
o, ela gera a -
algebra de M N . Verifique que f g


DICAS E SOLUC
OES
DOS EXERCICIOS

500

preserva a restrica
o de a esta
algebra e use o Lema 1.3.1 para concluir que

e invariante por f g. Dadas partico


es finitas P e Q de M e N , respectivamente, seja
P Q = {P Q : P P e Q Q}. Verifique que h (f g, P Q) = h (f, P) + h (g, Q).
Isto implica que h (f g) h (f ) + h (g). Para provar a desigualdade recproca, observe
que dada qualquer partica
o finita R de M N existem P e Q tais que R P Q.

9.1.5. Dada qualquer partica


o finita Q de N , considere P = {1 (Q) : Q Q}. Verifique
que h (f, P) = h (g, Q) e deduza que h (f ) h (g).

9.2.1. Tome = 1/20. Considere x 6= y e considere as respectivas expans


oes decimais
x = 0, x1 xn e y = 0, y1 yn . Se existe k 1 tal que |xk yk | 2 ent
ao
|f k (x) f k (y) 1/10 > . Suponha que |xn yn | 1 para todo n. Tome k 1 mnimo tal
que xk 6= yk . Como |xk+1 yk+1 | 1, temos que |f k (x) f k (y)| > .
Pd
9.2.2. A entropia de uma medida de Bernoulli em {1, . . . , d}Z
e dada por
i=1 pi log pi .
Variando os pesos pi esta express
ao toma qualquer valor entre 0 e log d. O n
umero d de
smbolos pode ser tomado arbitrariamente grande.
9.2.3. (a) Para todo k 1, as
orbitas de 0 e de xk = (1/k, . . . , 1/k, . . . ) permanecem a
dist
anica 1/k para todos os iterados. (b) O sistema (, k )
e ergodicamente equivalente ao
deslocamento de Bernoulli em {1, 2}N com pesos p1 = p2 = 1/2. Logo hk () = log 2. O
suporte de k est
a contido na bola fechada de raio 1/k em torno de 0 = (0, . . . , 0, . . . ). Logo
k 0 na topologia fraca . Claro que h0 () = 0. (c) Para cada k, seja Pk a partica
o (finita)
de cujos elementos s
ao os cilindros [0; i] com i = 1, . . . , k e [0; X \ {1, . . . , k}]. Mostre que
Pk
h (, Pk ) i=1 p1/i log p1/i e conclua que h () = .

9.2.4. Seja P uma partica


o finita de S 1 em intervalos. Para cada j 1 e P P, a pr
eimagem f j (P ) est
a formada por dj intervalos, cujos extremos s
ao as pr
e-imagens dos pontos
extremos de P . Deduza que #P n dn #P para todo n e conclua que h (f, P) log d.
Termine usando o Corol
ario 9.2.6.
j (Q) para cada n e seja A a -
9.2.5. Escreva Qn = n1
algebra gerada por n Qn .
j=0 f
Verifique que f
e mensur
avel relativamente `
a -
algebra A. Mostre que a hip
otese implica
que P A. Pelo Lema 9.2.2, segue que H (P/Qn ) converge para zero. Pelos Lemas 9.1.11
e 9.1.13, temos h (f, P) h (f, Q) + H (P/Qn ) para todo n.

9.3.1. Para cada n 1, defina n : M [0, ) e n : (0, ) [0, 1] por

1. n (x) = (i 1)/n se (x) ((i 1)/n, i/n] com 1 i n2 e n (x) = n se (x) > n;

2. n (s) = ({ > i/n}) se s ((i 1)/n, i/n] com 1 i n2 e (s) = 0 se s > n.

Verifique que, para todo n,


Z

n d =

Z
n
X
i 
1
n (s) ds.
{ > } =
n
n
0
i=1

Use o teorema da converg


encia dominada para concluir o enunciado do exerccio.
9.3.2. Seja a medida de Bernoulli associada a um vetor de probabilidade (p1 , . . . , pd ).
Defina i (x, n) = #{0 j n 1 : xj = i}. Seja P a partica
o (geradora) de em cilindros
[0; i]. Note que
d
Y
(x,n)
(P n (x)) =
pi i
.
i=1

Por ergodicidade, i (x, n)/n pi em -quase todo x. Logo, (1/n) log (P n (x)) converge
P
para di=1 pi log pi em -quase todo ponto.
claro que B(x, n, ) B(f (x), n 1, ). Logo, h (f, x) h (f, f (x)) para -quase
9.3.3. E
R
R
todo x. Por outro lado, h (f, x) d(x) = h (f, f (x)) d(x) pois a medida
e invariante
por f .
9.3.4. Pelo Teorema 9.3.1 e por ergodicidade, (1/n) log (P n (x)) h (f, P) para -quase
todo x. Logo, dado > 0,


1
x M : h (f, P) < log (P n (x)) < h (f, P) +
n

501
tem medida maior que 1 para todo n suficientemente grande. Este conjunto
e uma uni
ao
de
atomos de P n (x).

e uma rotaca
o
9.4.1. Escrevendo = (1 , . . . , d ), vemos que R = R1 Rd onde Ri
em S 1 . Al
em disso, a medida de Haar em Td
e o produto das medidas de Haar em d c
opias
de S 1 . Logo, pelo Exerccio 9.1.4, basta tratar o caso d = 1. Use um argumento semelhante
ao do Exerccio 9.2.4: para toda partica
o finita P temos que #P n n#P para todo n e,
portanto, h (f, P) = 0 para toda probabilidade invariante .

9.4.2. Use o seguinte fato, que


e a seguinte consequ
encia da forma can
onica de Jordan:
existem n
umeros 1 , . . . , l > 0, existe uma decomposica
o A-invariante Rd = E1
El e, dado > 0, existe um produto interno em Rd relativamente ao qual os subespacos
Ej s
ao ortogonais e satisfazem e j kvk kAvk e j kvk para todo v Ej . Al
em
Pd
+
disso, os i s
ao os valores absolutos dos autovalores de A e eles satisfazem
log
|
|
=
i
i=1
Pl
+
j=1 dim Ej log j .

9.4.3. Considere qualquer partica


o finita ou enumer
avel P com {B, B c } P. Seja Q a
n1 j
j (Q). Verifique
n
restrica
o de P ao conjunto B. Escreva P = j=0 f (P) e Qk = k1
j=0 g
k
n
k
em disso, por
que, para todo x B e k 1 existe nk 1 tal que Q (x) = P (x). Al
ergodicidade limk k/nk = (B, x) = (B) para quase todo x. Pelo teorema de ShannonMcMillan-Breiman,
h (g, Q, x) = lim
k

1
log (Qk (x))
k

h (f, P, x) = lim
k

1
log (P nk (x)).
nk

Conclua que h (f, Q, x) = (B)h (g, Q, x) para quase todo x B. Variando P, deduza que
h (f ) = (B)h (g).
= 1 (P), ou seja P
= { 1 (P ) : P P}.
9.4.4. Dada uma partica
o P de M , considere P

. Mostre que P
n = 1 (P n ) e, logo, H (P n ) = H (P
n)
Claro que P
e uma partica
o de M

para todo n. Portanto, h (f, P) = h (f , P) para toda partica


o P de M . Suponha que existe

gerador unilateral P para (f, ). Mostre que P
e gerador bilateral para (f,
) e conclua que
h (f ) = h (f). Em geral, como (M, )
e espaco de Lebesgue, sempre existem partico
es
k gera
finitas P1 Pk tais que k Pk gera a -
algebra de M . Verifique que k P
k
Use o Lema 9.1.13 e o teorema de Kolmogorov-Sinai para concluir que
a -
algebra de M.
k ) = h (f).
h (f ) = limk h (f, Pk ) = limk h (f, P

9.5.1. Como h (f ) = h (f 1 ), segue do teorema de Ornstein (Teorema 9.5.2) que (f, )


e (f 1 , ) s
ao ergodicamente equivalentes. Dado qualquer k 1, o Exerccio 9.2.2 garante
que existe algum automorfismo de Bernoulli (g, ) tal que h (g) = h (f )/k. Ent
ao, pela
Proposica
o 9.1.14, h (g k ) = h (f ) e segue do teorema de Ornstein que (f, ) e (g k , ) s
ao
ergodicamente equivalentes.
9.5.2. Considere A n f n (B) com m(A) > 0. Ent
ao, para cada
 n existe An B tal que
A = f n (An ). Considere os intervalos Ij,n = (j 1)/10n , j/10n . Ent
ao
m(A Ij,n )
m(An )
=
= m(A)
m(Ij,n )
m((0, 1))

para todo 1 j 10n .

Fazendo n , conclumos que Ac n


ao tem pontos de densidade. Logo m(Ac ) = 0.

9.5.3. An
alogo ao Exerccio 9.5.2, usando a propriedade de distorca
o limitada dada pela
Proposica
o 4.2.11.
claro que A
9.5.4. Seja A a -
algebra gerada pelos cilindros [0; b0 , . . . , bn1 ] com n 1. E
satisfaz as condico
es (a) e (c) na Definica
o 9.5.8. Para provar a condica
o (b), ou seja, que todo
elemento de Z = k k (A) tem medida zero ou um, imite a demonstraca
o do Teorema 7.2.11,
da seguinte forma. Dados cilindros A = [p; a0 , . . . , am1 ] e B = [0; b0 , . . . , bn1 ],
min
i,j

s
Pi,j

pj

s
Pi,j
(A k (B))
max
,
i,j
(A)(B)
pj

s p quando s ,
para todo k p+m, onde s = k pm+1. A hip
otese implica que Pi,j
j
para todo i, j. Conclua que, dados > 0 e A = [p; a0 , . . . , am1 ], existe k0 1 tal que a


DICAS E SOLUC
OES
DOS EXERCICIOS

502

famlia C(, A) dos conjuntos B A que satisfazem |(Ak (B))(A)(B)| (A)(B)


para todo k k0
e uma classe mon
otona e cont
em toda uni
ao finita disjunta de cilindros da
forma [0; b0 , . . . , bn1 ]. Logo, C(, A) = A. Conclua que |(A Z) (A)(Z)| (A)(Z)
para todo Z Z e todo cilindro A = [p; a0 , . . . , am1 ]. Verifique que a famlia D dos
conjuntos A B tais que |(A Z) (A)(Z)| (A)(Z) para todo Z Z
e uma classe
mon
otona e cont
em toda uni
ao finita disjunta de cilindros. Logo, D = B. Em particular,
|(Z) (z)2 | (Z)2 para todo z Z e todo > 0. Deduza que a -
algebra Z
e trivial.
claro que A
9.5.5. Seja A a -
algebra gerada pelos cilindros [0; b0 , . . . , bn1 ] com n 1. E
satisfaz as condico
es (a) e (c) na Definica
o 9.5.8. Para provar a condica
o (b), use o argumento
do Exerccio 9.5.4.
W
jk (P)
9.5.6. Suponha que h (f, P) = 0. Use o Lema 9.5.4 para mostrar que P
j=1 f
k
para todo k 1. Deduza que, a menos de medida nula, P est
a contida em f (B) para todo
k 1. Conclua que a partica
o P
e trivial.

9.6.1. ARunicidade
e imediata. Para provar a exist
encia, considere o funcional definido por
R

() =
d dW () no espaco das funco
es mensur
aveis limitadas : M R. Note
que
e linear e n
ao negativo e satisfaz (1) = 1. Use o teorema da converg
encia mon
otona
para mostrar que seP
Bn , n 1 s
ao subconjuntos mensur
aveis de M disjuntos dois-a-dois
ent
ao (Xn Bn ) =
B ) define uma probabilidade na
n (XBn ). Conclua que (B) = (XR
-
algebra dos subconjuntos mensur
aveis de M . Mostre que d = () para toda funca
o
mensur
avel limitada. Tome bar(W ) = .
P
9.6.2. Escreva W =
ca
o,
i=1 ti Wi . Por defini
Z

d bar(W ) =

X
i=1

ti

X

d dW () =
ti
i=1

d bar(Wi ) =

X
i=1


d dWi ()

ti bar(Wi )

P
para toda funca
o mensur
avel limitada : M R. Logo, bar(W ) =
i=1 ti bar(Wi ).
P
Pn
Pn
9.6.3. PSeja =
i=1 ti i . Para cada n, defina sn =
i=1 ti e n =
i=1 ti /sn i e
Rn =
ao, = sn n + (1 sn )Rn . Como M
e convexo, n est
a
i>n ti /(1 sn )i . Ent
em M para todo n. Mostre que (n )n converge para na topologia fraca , para obter o
primeiro enunciado. Em seguida, dado qualquer = {1 , . . . , N } e > 0, considere uma
particao finita ou enumer
avel P de M tal que cada Pn P est
a contido na vizinhanca
V (n ,P
, ) de algum n M. Seja
o normalizada de W a cada Pn . Entao,
P Wn a restrica
W = n W (Pn )Wn e bar(W ) = n W (P
Pn ) bar(Wn ) (pelo Exerccio 9.6.2). Pelo Lema 9.6.7,
bar(Wn ) V (n , , ). Mostre que = n W (Pn )n est
a em M e que bar(W ) V (, , ).
Para concluir o segundo enunciado, faca 0.
9.6.4. Use a desigualdade de Jensen no item (1), o lema de Fatou no item (2) e o teorema de
Kolmogorov-Sinai no item (3).

9.6.5. Para a pen


ultima igualdade seria necess
ario saber que a sequ
encia n1 log P (Qn (x))

e dominada, por exemplo.


9.7.1. Sejam {Uk : k 1} e {Vl : l 1} duas coberturas. Todo subconjunto mensur
avel B
de algum Vl pode ser escrito como
ao disjunta de conjuntos mensur
aveisRAk Uk , k 1.
R uni
Por -aditividade, (f (Ak )) = A d para todo k 1 implica (f (B)) = B d.
k

9.7.2. Seja (p1 , . . . , pd )


e o vetor de probabilidades associado a P . Para cada x [0; a0 , a1 ]
ao dos demais cilindros tem medida
com Pa0 ,a1 > 0, tome J (x) = pa1 /(pa0 Pa0 ,a1 ). A uni
nula.
9.7.3. (a) A definica
o (9.7.2) d
a que a f
ormula vale para toda funca
o caracterstica = Xf (A) ,
onde A
e um domnio de invertibilidade de f . Por linearidade, a igualdade se estende para
funco
es simples. Use o teorema da conver
encia mon
otona para estend
e-la para qualquer funca
o
mensur
avel n
ao negativa. Use linearidade uma vez mais, para obter o caso geral. (b) Aplique
o item (a) `
a funca
o = (/J f ) (f | A)1 .

503
9.7.4. Seja P uma partica
o enumer
avel em domnios de invertibilidade. Imitando a prova de
(9.7.8), mostre que
Z
Z
X

(z)
d para todo P P, onde (x)
=
d =
J
f
f 1 (P )
P
1
zf

(x)

Some sobre todo P P, para obter a igualdade no enunciado.

9.7.5. Pelo Exerccio 9.7.4, dada qualquer funca


o mensur
avel limitada ,
Z
Z
 X

1
( f ) d =
(x)
(z) d(x).
J f
1
zf

(x)

Deduza a primeira parte do enunciado. Para a segunda parte, note que se


e invariante ent
ao
(f (A)) = (f 1 (f (A))) (A) para todo domnio de invertibilidade A.

9.7.6. Verifique que se f


e localmente invertvel ent
ao f k tamb
em
e. Se A
e domnio de
invertibilidade de f k e : f k (A) R
e mensur
avel e limitada,
Z
Z
(J f k1 f )J f d.
J f k1 d =
m(f k (A)) =
f (A)

fk

f k1

Portanto, J
= (J
f )J f para todo k. A primeira parte do enunciado segue por
induca
o. Quanto `
a segunda parte, se f
e invertvel e
e singular tamb
em em relaca
o a f 1 ,
ent
ao J f 1 = (1/J f ) f 1 em -quase todo ponto.

9.7.7. Verifique que se A


e domnio de invertibilidade paraR f ent
ao B =
e domnio de
R (A)
invertibillidade para g. Al
em disso, (f (A)) = (g(B)) = B J g d = A J g d. Use o
fato de que o jacobiano
e essencialmente u
nico.

9.7.8. A parte se do enunciado


e f
acil: podemos exibir a equival
encia erg
odica explicitamente. Suponha que os dois sistemas s
ao ergodicamente equivalentes. O fato de que k = l
segue do Exerccio 8.1.2. Para provar que p e q s
ao permutaco
es um do outro, use o fato de
que o jacobiano
e invariante por equival
encia erg
odica (Exerccio 9.7.7), juntamente com as
express
oes dos jacobianos dadas pelo Exemplo 9.7.1.
10.1.1. Note que N () N (), uma vez que todo elemento de est
a contido em algum
elemento de .
10.1.2. H(f 1 ()) H(). Se f
e sobrejetiva, vale a igualdade H(f 1 ()) = H(). Observe
que se A = {A1 , . . . , Ar }
e uma subcobertura aberta finita de e B = {B1 , . . . , Bs }
e
subcobertura aberta finita de , ent
ao U = {An Bm : 1 n r e 1 m s}
e subcobertura
aberta finita de , com no m
aximo nm elementos. Isso garante N ( ) N ()N ().
Para provar que H(f 1 ()) H(), observe que como f
e contnua, dada B subcobertura
aberta finita de , o conjunto f 1 (B)
e uma cobertura aberta com no m
aximo #B elementos.
Assim, N (f 1 ()) N (). Para a desigualdade reversa, basta observar que f 1 (B) 6= ,
para cada B .

10.1.3. Para mostrar que a entropia topol


ogica de f com respeito `
a dist
ancia usual
e log 2,
dado > 0 tome k N tal que (1/2)k < . Verifique que o conjunto E = {m/2n+k : m Z}
e
um conjunto (n, )-separado. Considerando agora a dist
ancia d(x, y) = | log x log y|, mostre
que f
e uma isometria. Use o Exemplo 10.1.7 para concluir que a entropia de f
e zero.
10.1.4. Para i = 1, 2 considere a bola din
amica B i (a, n, ) = {x M : di (f i (x), f i (a)) <
para i = 0, . . . , n 1}. Da hip
otese de que d1 e d2 s
ao uniformemente equivalentes, conclua
que para todo > 0 existe > 0 tal que B 2 (a, n, ) B 1 (a, n, ). Observe que isto garante
que g 1 (f, , K) g 2 (f, , K) para qualquer compacto K. Obtenha a desigualdade an
aloga
g 2 (f, , K) g 1 (f, , K) e conclua o exerccio.

10.1.5. Seja K N um compacto e seja K = (K). Observe que K


e compacto e a
restrica
o : K K
e um homeomorfismo. Em particular, a sua inversa
e uniformemente
contnua. Use esse fato para mostrar que dado > 0, existe > 0 tal que dado qualquer
conjunto E M que seja (n, )-gerador de K , o conjunto E = 1 (E ) N
e (n, )-gerador
de K. Conclua que g(g, , K) g(f, , (K)) e que h(g) h(f ). Para a segunda parte,

504

DICAS E SOLUC
OES
DOS EXERCICIOS

considere um conjunto discreto A [0, 1] com n elementos. Prove que a dist


ancia de [0, 1]Z
restrita a AZ
e uniformemente equivalente `
a dist
ancia definida em (9.2.13). Conclua, usando
o Exemplo 10.1.2, que a entropia de
e pelo menos log n, para qualquer n.
10.1.6. Mimetize as provas do Lema 10.3.6 e do Lema 10.3.7.
10.1.7. Fixados n N e > 0, tome
para cada i = 1, 2, . . . , l um conjunto Ei que seja (n, )S
gerador de Ki . Prove que E = 1il Ei
e (n, )-gerador de K. Conclua que gn (f, , K)
P
1il gn (f, , Ki ). Deduza que g(f, , K) max1il g(f, , Ki ). Conclua fazendo 0.

10.1.8. Considere h(x) = sen(x/2). Verifique que h


e um homeomorfismo de [1, 1]. Prove
que h(f (x)) = g(h(x)), isto
e, sen(/2(1 2x2 )) = 1 2| sen(x/2)|. Conclua que a entropia
de f
e log 2.

10.1.9. Observe que cada palavra w de comprimento n + m pode ser decomposta de modo
u
nico como w = uv, onde u
e uma palavra de comprimento m e v
e uma palavra de comprimento n. Isto define uma funca
o injetiva do conjunto das palavras de comprimento n + m no
produto cartesiano do conjunto das palavras de comprimento m pelo conjunto das palavras
de comprimento n. Segue que cn+m (x) cn (x)cm (x) ou, em outras palavras, a sequ
encia
log cn (x)
e subaditiva. Conclua que c(x) est
a bem-definido. Para mostrar que c(x) coincide com a entropia topol
ogica de restrita ao fecho de X , mostre que cn+k (x)
e igual
a gn (f, (1/2)k , X ), observando que cada palavra de comprimento n + k que aparece em x
comecando na posica
o i corresponde a uma bola din
amica de comprimento n e raio (1/2)k
centrada em i (x).
10.1.10. (Carlos Gustavo Moreira) Seja 1 =0, 2 = 01 e, para n 2, n+1 = n n1 .
Vamos mostrar que, para todo n 1, existe uma palavra n tal que n n+1 = n n e
n+1 n = n n , onde n = 10 e n = 01 se n
e par e n = 01 e n = 10 se n
e mpar. De
fato, isso vale para n = 1 com 1 = 0 e para n = 2 com 2 = 010. Se vale para n, temos
n+1 n+2 = n+1 n+1 n = n+1 n n e tamb
em n+2 n+1 = n+1 n n+1 = n+1 n n ,
desde que tomemos n+1 = n+1 n . Isto prova a nossa afirmaca
o. Segue que as u
ltimas
letras de n e de n+1 s
ao distintas. Vamos deduzir que = lim n n
ao
e pr
e-peri
odica. De
fato, suponha que fosse peri
odica e seja m o tamanho de seu perodo. Como o tamanho
de n
e Fn+1 (onde Fk
e o k-
esimo n
umero de Fibonacci), podemos tomar n inteiro positivo
tal que m|Fn+1 e tal que n
e grande o suficiente para que o tamanho da eventual parte n
aoperi
odica de seja menor que Fn+2 . Ent
ao comeca com n+3 = n+2 n+1 = n+1 n n+1 .
Mas, como o tamanho Fn+1 de n
e m
ultiplo do perodo m, a Fm+2 -
esima letra de , que

e a u
ltima letra de n+1 , deveria coincidir com a (Fm+2 + Fn+1 )-
esima letra de , que
e a
u
ltima letra de n . Isto contradiria a conclus
ao do par
agrafo anterior. Em seguida, afirmamos
que ck+1 () > ck () para todo k. De fato, suponha que ck+1 () = ck () para algum k.
Ent
ao cada subpalavra de tamanho k s
o pode ter uma continuaca
o de tamanho k + 1. Logo,
temos uma din
amica no conjunto finito das subpalavras de tamanho k (que a cada subpalavra
associa sua u
nica continuaca
o sem a primeira letra), cujas
orbitas s
ao todas pr
e-peri
odicas.
Em particular, tamb
em
e pr
e-peri
odica, o que contradiz a conclus
ao no par
agrafo anterior.
Isto prova a nossa afirmaca
o. Como c1 () = 2, segue que ck () k + 1 para todo k. Agora
afirmamos que cFn+1 () Fn+1 + 1 para todo n > 1. Para provar esse fato, note que pode
ser escrito como uma concatenaca
o de palavras pertencentes a {n , n+1 }, pois (por induca
o),
para todo r n, r pode ser escrito como uma concatenaca
o de palavras pertencentes a
{n , n+1 }. Assim, qualquer subpalavra de de tamanho Fn+1 (que
e o tamanho de n )
e
uma subpalavra de n n+1 ou de n+1 n . Como nn+1 = n n n1
e uma subpalavra de
n n n1 n2 = n n n , h
a no m
aximo |n | = Fn+1 subpalavras de tamanho |n | = Fn+1
de n n n e, logo, de n n+1 . Como n n+1 = n n e n+1 n = n n e n+1 n termina
com n e |n | = 2, a u
nica subpalavra de n+1 n de tamanho |n | = Fn+1 que pode n
ao
ser subpalavra de n n+1
e a subpalavra que termina com a primeira letra de n (ou seja,
uma posica
o antes do fim de n+1 n ). Logo, cFn+1 () Fn+1 + 1 tal como foi afirmado.
Estamos prontos para obter o enunciado do exerccio. Suponha que ck () > k + 1 para algum
k. Tomando n tal que Fn+1 > k, teramos cFn+1 () ck () < Fn+1 + 1 (k + 1) = Fn+1 k,
donde, para algum m com k m < Fn+1 , deveramos ter cm+1 () cm (). Isto contradiria
fato provado anteriormente.
10.2.1. Considere as projeco
es can
onicas 1 : M1 M2 M1 e 2 : M1 M2 M2 . Dado
qualquer compacto K M , considere Ki = i (K) para i = 1, 2. Note que K K1 K2 .

505
Mostre que se Ei
e conjunto (n, )-gerador para fi em Ki , com i = 1, 2, ent
ao E = E1 E2
e
conjunto (n, )-gerador para f em K. Logo, gn (f, , K) gn (f1 , , K1 )gn (f2 , , K2 ). Deduza
que g(f, , K) g(f1 , , K1 ) + g(f2 , , K2 ) para todo e conclua que h(f ) h(f1 ) + h(f2 ). De
modo semelhante, mostre que se Ki Mi
e compacto e Ei Ki
e conjunto (n, )-separado
para fi , com i = 1, 2, ent
ao E1 E2 K1 K2
e conjunto (n, )-separado para f . Logo,
sn (f, , K1 K2 ) sn (f1 , , K1 )sn (f2 , , K2 ) para todo . Supondo que M2
e compacto,
1
sn (f2 , , M2 ). Usando
tome K2 = M2 . Deduza que s(f, , K1 K2 ) s(f1 , , K1 ) + lim inf n n
o Corol
ario 10.1.8, deduza que h(f ) h(f1 ) + h(f2 ).

10.2.2. (a) Por hip


otese, dada qualquer palavra finita A-admissvel (x0 , . . . , xk ), existe
n = n(x0 , xk ) tal que An
e A-admissvel para alxk ,x0 > 0, ou seja, (xk , y1 , . . . , yn1 , x0 )
guma escolha de y1 , . . . , yn1 . Logo, a sequ
encia peri
odica (x0 , . . . , xk , y1 , . . . , yn1 , x0 , . . . )

e admissvel. Para os itens (b) e (c), use que [0; i] k ([0; j]) 6= se, e somente se, Aki,j 1.
10.2.3. Pela Proposica
o 10.2.1, h(f ) = g(f, , M ) sempre que f
e -expansiva e < /2.
Mostre que se d(f, h) < /3 ent
ao g(h, /3, M ) g(f, , M ). Deduza que se (fk )k converge
para f ent
ao lim supk h(fk ) = lim supk g(fk , /3, M ) g(f, , M ) = h(f ).
10.2.4. Seja Si = Ai,1 + Ai,2 + + Ai,n a soma das entradas da linha i da matriz A. Por
hip
otese Si > 0 para todo i. Defina Pi,j = Ai,j /Si . Note que P
e uma matriz estoc
astica e
Pd
n = 0 se, e somente se, An = 0. Pelo Lema 7.2.7, temos que
n
que Pi,j
j=1 Pi,j = 1 para todo
i,j
todo i e todo n. Conclua que a linha i de An
e n
ao nula, para todo i.

10.2.5. (a) Por hip


otese, existe > 0 tal que a restrica
o de f a toda bola de raio
e injetiva.
Mostre que f n (y)
e (n, )-separado para todo y, todo n e todo < . A hip
otese tamb
em
garante que #f n (y) dn . (b) N
ao
e restrica
o supor que d = | deg f | 2. Mostre que
existem intervalos Ij , j = 1, . . . , d disjuntos dois-a-dois, ordenados ciclicamente e tais que
f (Ij ) = S 1 para todo j. Considere < minj |Ij |. Para cada y S 1 e n 1, seja fn (y)
o conjunto dos x f n (y) tais que f i (x) J2 J2[d/2] para i = 0, . . . , n 1. Mostre
que fn (y)
e conjunto (n, )-separado e cont
em [d/2]n pontos. Deduza que h(f ) log[d/2].
Usando a Proposica
o 10.1.11, conclua que kh(f ) log[dk /2] para todo k. Fazendo k ,
obtenha que h(f ) log d.

10.2.6. Note que |f (z)| = |z|/2 e, portanto, (f n (z))n 0 para todo z 6= . Logo, 0 e
s
ao os u
nicos pontos recorrentes. Deduza que toda probabilidade invariante tem entropia
nula e conclua que h(f ) = 0. N
ao h
a contradica
o, pois f n
ao
e homeomorfismo local (nem
e
diferenci
avel) na vizinhanca de zero ou infinito.
10.2.7.(Bowen [Bow72]) Escreva a = g (f, ). Observe que se E
e conjunto (n, )-gerador de
M , com < , ent
ao M = xE B(x, n, ). Combinando este fato com o resultado de Bowen,
mostre que gn (f, , M ) #Eec+(a+b)n . Conclua a desigualdade, tomando b 0.
10.3.1. Dada uma subcobertura finita de n+m , observe que
X
X
X
n
en+m (U )
en (U ) em (f (U ))
en (U )
U

em (V ) .

V f m ()

Conclua que Pn+m (f, , ) Pn (f, , )Pm (f, , ).

10.3.2. Reflexiva: tome u 0. Simetria: troque u por u. Transitividade: se = +uf u


e = + v f v ent
ao = + (u + v) f (u + v).

10.3.3. Estenda o argumento do Exerccio 10.2.1 do seguinte modo. Seja f = f1 f2


e = 1 2 . Lembrando a definica
o (10.3.9), comece por mostrar que Gn (f, , )
Gn (f1 , 1 , )Gn (f2 , 2 , ). Deduza que G(f1 f2 , 1 2 , ) G(f1 , 1 , )+ G(f2 , 2 , ) para
todo e conclua que P (f, ) P (f1 , 1 )+ P (f2 , 2 ). Analogamente, mostre que Sn (f, , )
Sn (f1 , 1 , )Sn (f2 , 2 , ) para todo . Deduza que
S(f, , ) S(f1 , 1 , ) + lim inf
n

1
Sn (f2 , 2 , ).
n

Usando (10.3.16), deduza que P (f, ) P (f1 , 1 ) + P (f2 , 2 ).

10.3.4. Se f : M M
e 0 -expansiva, P (f, ) = P (f, , ) = G(f, , ) = S(f, , ) para
toda cobertura aberta com di
ametro menor que 0 e para todo < 0 /2. Em particular,


DICAS E SOLUC
OES
DOS EXERCICIOS

506

P (f, ) < . Para a demontraca


o, siga os passos da Proposica
o 10.2.1, substituindo a
Proposica
o 10.1.9 pelo Lema 10.3.1 na prova da primeira igualdade. Ainda usando o roteiro
da Proposica
o 10.1.9, mostre que Pn (f, , ) Gn (f, , ) Sn (f, , ) para todo n e todo
> 0, onde
e a cobertura de M pelas bolas de raio ; a partir deste fato, deduza as demais
igualdades no enunciado.
10.3.5. Fixe uma cobertura aberta finita com di
ametro menor que 0 . Usando as definico
es
(10.3.3) e (10.3.2) e os Exerccios 10.3.4 e 10.3.1,
P (f, ) = P (f, , ) = inf
n

X
1
1
log Pn (f, , ) = inf inf log
en (U )
n n
n
U

(o segundo nfimo
e sobre todas as subcoberturas de n ). Isto permanece v
alido para toda
transformaca
o 0 -expansiva g pr
oxima de f , m
odulo substituirmos n e n pelos objetos
correspondentes, n
g e g,n , relativos a g. Mostre que dados n, e > 0, existe uma
vizinhanca V de f tal que para cada g V existe uma subcobertura g de n
g e existe
uma bijeca
o : g tal que g,n ((U )) n (U ) + n para todo U . Deduza que
P (g, ) P (f, ) + 2 para todo g V que seja 0 -expansivo.
10.3.6. Mostre que dado > 0 existe 1 tal que toda bola din
amica B(x, n, ) tem
di
ametro igual a 2n e cont
em algum ponto peri
odico pn
odo n + . Mostre que
x de per
dados C, > 0 existe K > 0 tal que |n (y) n (pn
x )| K para todo y B(x, n, ), todo
n 1 e toda funca
o (C, )-H
older : S 1 R. Use este fato para substituir conjuntos
geradores (ou separados) por conjuntos de pontos peri
odicos na definica
o da press
ao.
10.4.1. Consequ
encia direta do Princpio Variacional.
10.4.2. Use o Princpio Variacional e o fato que toda medida invariante de f | X
e tamb
em
medida invariante de f .
R
R
10.4.3. Observe que d = d para qualquer medida invariante . Em seguida, aplique
o Princpio Variacional.
10.4.4. Considere o deslocamento no espaco = {0, 1}N . Considere a funca
o : R
definida por (x) = 0 se x0 = 0 e (x) = 1 se x0 = 1. Seja N o conjunto dos pontos x
tais que a m
edia temporal na
orbita de x n
ao converge. Verifique que N
e invariante por e
e
n
ao vazio: para cada sequ
encia finita (z0 , . . . , zk )
e possvel encontrar x N com xi = zi para
i = 0, . . . , k. Deduza que a entropia topol
ogica da restrica
o f | N
e igual a log 2. Justifique
que N n
ao suporta nenhuma medida invariante por f .
10.4.5. Considere a cobertura aberta de K cujos elementos s
ao K [0, ] e K [1 , 1].
Verifique que P (f, ) = P (f, , ) para todo potencial . Al
em disso,
X
Pn (f, t log g , ) =
[(g n ) ]t (U ) = (t + t )n .
U n

Conclua que (t) = log(t + t ). Verifique que < 0 e > 0 (convexidade tamb
em segue
da Proposica
o 10.3.11). Al
em disso, (0) >
0
>
(1).
Pelo
Princ
pio
Variacional,
a u
ltima
R
desigualdade tamb
em implica que h (f ) log g d < 0.
P
10.5.1. Como vimos no Exemplo 9.1.10, h (f ) = i=1 d pi log pi . Use o Lema 10.4.4 com
a1 = = ad = 0 para mostrar que a entropia
e m
axima quando pi = 1/d para todo i.

10.5.2. Seja a cobertura de pelos cilindros [0; i]) e seja ai o valor de em cada cilindro.
Justifique que P (f, ) = P (f, , ) e verifique que
X
X
n
a ++ain1
Pn (f, , ) =
=
e i0
ea i .
i0 ,...,in1

P
nico vetor
Conclua que P (f, ) = log( i eai ). Use o Lema 10.4.4 para mostrar que existe
R um u
de probabilidade p = (p1 , . . . , pd ) cuja medida de Bernoulli satisfaz h ()+ d = P (f, ).

10.5.3. A propriedade de Gibbs d


a que limn (1/n) log (C n (x)) = (x)

P , onde C n (x)

e o cilindro de comprimento n que cont


em x. Combine esta igualdade com o teorema de
Brin-Katok (Teorema 9.3.3) e o teorema de Birkhoff para obter a primeira afirmaca
o. Agora
suponha que 1 e 2 sejam dois estados de Gibbs erg
odicos com a mesma constante P . Observe

507
que existe C tal que C 1 1 (A) 2 (A) C1 (A) para todo A na
algebra das uni
oes finitas
disjuntas de cilindros. Deduza, usando o teorema das classes mon
otonas (Teorema A.1.18),
deduza que C 1 1 (A) 2 (A) C1 (A) para qualquer conjunto mensur
avel A. Isto implica
que 1 e 2 s
ao equivalentes. Usando o Lema 4.3.1, segue que 1 = 2 .
10.5.4. Pelo princpio variacional e a hip
otese de que
e um estado de equilbrio para ,
Z
Z
Z
F () =
d = h (f ) + ( + ) d (h (f ) + d) P (f, + ) P (f, ).
Isto mostra que F
e funcional linear tangente a . Logo, a segunda parte do enunciado segue
da primeira e do Exerccio 2.3.7.
10.5.5. Pela Proposica
o 10.3.11, a funca
o press
ao
e convexa (pelo Exerccio A.5.1, segue que
ela tamb
em
e contnua). Pelo teorema de suavidade de Mazur (lembre do Exerccio 2.3.7),
existe um subconjunto residual R C 0 (M ) tal que a funca
o press
ao
e deriv
avel em cada
R. Aplique o Exerccio 10.5.4.
10.5.6. Chamamos cilindro em H a todo [p; xp , . . . , xq ]H = [p; xp , . . . , xq ] H que seja n
ao
vazio. (a) Dados A = [p; xp , . . . , xp+q ]H e B = [r; yr , . . . , yr+s ]H considere
C = [p; xp , . . . , xp+q , 0, . . . , 0, yr , . . . , yr+s ]H ,
onde inserimos n > max{q, s} zeros. Observe que C
e n
ao vazio e C A f rpqn1 (B).
Isto mostra que o deslocamento
e topologicamente misturador em H. (b) Seja a cobertura
aberta de H por cilindros [0; x]H . Ent
ao N (n )
e igual ao n
umero de cilindros de comprimento n em H. Estes s
ao de 3 tipos: (i) Cilindros monocrom
aticos contidos em V Z ou
AZ . Em cada um dos dois casos, s
ao 2n cilindros. (ii) Cilindros monocrom
aticos da forma
[0; 0, . . . , 0, x0 , . . . , xk1 ] ou [0; x0 , . . . , xk1 , 0, . . . , 0] com {x0 , . . . , xk1 } contido em V ou
em A. Verifique que existem menos de 2n+1 cilindros deste tipo. (iii) Cilindros bicrom
aticos
[0; x0 , . . . , xn1 ], envolvendo smbolos tanto verdes quanto amarelos. Usando que o n
umero s
de ndices j tais que xj 6= 0 n
ao ultrapassa n/2, e que estes smbolos se agrupam em 2 k s
blocos monocrom
aticos de cores alternadas, mostre que o n
umero total de cilindros deste tipo
n
ao ultrapassa
n/2 s
n/2
XX  s1 
X
2s
2
2
2s (2s1 1) 2n+1 .
k1
s=1 k=2

s=1

Isto prova que 2n+1 N (n ) 3 2n+1 para todo n. Logo h() = h(, ) = log 2.
11.1.1. Seja {Ai : i} uma cobertura finita de M por bolas de raio > 0 (Lema 11.1.3). Sejam
hi,j : Ai M os ramos inversos de f e denote Vi,j = hi,j (Ai ). (1) Escreva B como uni
ao
de conjuntos mensur
aveis Bi Ai . Ent
ao f 1 (B) = i f 1 (Bi ) = i,j hi,j (Bi ). Al
em disso,
R
m(hi,j (Bi )) = B | det Dhi,j (x)| dm(x) = 0 para todo i e j. Logo m(f 1 (B)) = 0. (2) e (3)
i
Escreva B como uni
ao de conjuntos mensur
aveis Bi,j Vi,j . Ent
ao f (B) = i,j f (Bi,j ) =
1
i,j hi,k (Bi,j )
e mensur
avel. Tal como no item (1), o teorema de mudanca de vari
aveis implica
consequ
que m(f (B)) = 0. (4) E
encia simples de (1) e (3). (5) Se f 1 (A) = A a menos de
medida nula ent
ao, por (4), f (A) = f (f 1 (A)) a menos de medida nula. Todo difeomorfismo
local numa variedade compacta (conexa)
e sobrejetivo; logo, f (f 1 (A)) = A.
P
k1
11.1.2. Considere = 1/k e hvi2 = j=0 2j kDf j (x)vk2 . A norma hi prov
em de uma
m
etrica Riemanniana (produto interno) e
e equivalente `
a norma dada k k. Ela tamb
em
satisfaz a conclus
ao do exerccio.
11.1.3. Adapte os argumentos que usamos para a transformaca
o de Gauss nas Seca
o 9.4.2,
do seguinte modo. Comece por verificar que os iterados de f t
em distorca
o limitada: existe
K > 1 tal que
|Df n (x)|
1

K,
K
|Df n (y)|
n
para todo n 1 e quaisquer pontos x, y com P (x) = P n (y). Considere a sequ
encia das
P
j
m
edias dos iterados da medida de Lebesgue m, isto
e, n = (1/n) n1
j=0 f m. Mostre que
as derivadas de Radon-Nikodym dn /dm s
ao uniformemente limitadas e s
ao H
older, com


DICAS E SOLUC
OES
DOS EXERCICIOS

508

constantes de H
older uniformes. Deduza que todo ponto de acumulaca
o desta sequ
encia

e uma probabilidade invariante absolutamente contnua com relaca


o `
a medida de Lebesgue.
Mostre que a derivada de Radon-Nikodym = d/dm
e limitada de zero e de infinito (em
outras palavras, log
e limitado). Mostre que e log s
ao H
older.
11.1.4. Seja B um conjunto com (B) > 0 tal que, para cada n 1, existe B algum conjunto
mensur
avel Bn satisfazendo B = f n (Bn ). Note que (Bn ) = (B) para todo n. Para cada
n, considere a partica
o P n formada pelas imagens hn (P ) dos conjuntos P P pelos ramos
inversos hn do iterado f n . Mostre que para todo > 0 e todo n 1 suficientemente grande
existe algum hn (Pn ) P n tal que (hn (Pn ) \ B) (hn (Pn )). Usando que a distorca
o
e
limitada e f (Pn ) = (0, 1), deduza que 1 (B) = ((0, 1) \ Bn+1 ) const . Fazendo 0,
conclua que
e exata. Se
e probabilidade invariante absolutamente contnua ent
ao
Lebesgue e, como
e erg
odica, isso implica = .
11.1.5. Verifique que J f = ( f )|f |/ e use a f
ormula de Rokhlin (Teorema 9.7.3).

11.1.6. Os argumentos do Exerccio 11.1.3 para provar distorca


o limitada e exist
encia de
probabilidades invariantes absolutamente contnuas permanecem v
alidos: a hip
otese implica
que todo f n (P n (x)) tem medida de Lebesgue maior que e isto basta para concluir que as
densidades dn /dm s
ao uniformemente limitadas. Os argumentos do Exerccio 11.1.4 mostram
que se B
e um conjunto mensur
avel invariante com m(B) > 0 ent
ao m(B) . Deduza que
existem n
ao mais que 1/ conjuntos invariantes com medida positiva minimais (isto
e, que n
ao
podem ser decompostos em subconjuntos invariantes com medida de Lebesgue positiva) e eles
s
ao disjuntos dois-a-dois. Conclua que toda probabilidade invariante absolutamente contnua

e combinaca
o linear convexa de suas restrico
es normalizadas a esses conjuntos invariantes
minimais, as quais s
ao erg
odicas. A prova de que (B) d
a um pouco mais: existe algum
interval aberto I com comprimento tal que I \ B tem medida de Lebesgue nula. Suponha
que f
e transitivo. Dados dois conjuntos invariantes minimais com medida positiva, B1 e B2 ,
considere intervalos abertos I1 e I2 nessas condico
es. Por transitividade, f n (I1 ) intersecta I2
para algum n. Deduza que m(B1 B2 ) > 0 e, portanto, B1 = B2 . Usando as observaco
es
anteriores, conclua que a medida invariante absolutamente contnua
eu
nica.
11.2.1. Id
entico ao Lema 11.1.3.
11.2.2. Use o lema de combreamento (Proposica
o 11.2.9) para mostrar que se f : M M

e topologicamente misturadora ent


ao o conjunto dos pontos peri
odicos
e denso. Isso permite
usar o Teorema 11.2.15. Como f
e topologicamente misturadora e M1
e aberto invariante,
temos que M1 = M , ou seja k = 1. De modo semelhante, mostre que para que f seja
topologicamente misturadora
e necess
ario que m(1) = 1. Ent
ao, pelo Teorema 11.2.15, a
transformaca
o f : M M
e topologicamente exata.
11.2.3. Por hip
otese, para cada x M existe N (x) tal que f N(x) (B(x, r/3)) = M . Considere uma cobertura finita B(xi , r/3), i = 1, . . . , n de M por bolas de raio r/3 e tome
N = maxi N (xi ). Basta observar que toda bola B(x, r) cont
em alguma B(xi , r/3).

11.2.4. Tome = {2n : n 0} mod Z. Para ver que a restrica


o f : n
ao
pode ser uma transformaca
o expansora, basta observar que 1/2
e ponto isolado em mas
n (I), onde I = (1/2, 1) mod Z.
1 = f (1/2) n
ao
e. [Observaca
o: Note que = S 1 \
n=0 f
Modificando adequdamente a escolha de I obtemos muitos outros exemplos, inclusive com
n
ao enumer
avel.]
k () = (f k () \ f k+1 ()), pelo Teorema 11.2.14.
11.2.5. Note que M =
k=1
k=0 f
Para qualquer X (f k () \ f k+1 ()), as pr
e-imagens f n (X), n 1 s
ao disjuntas duasa-duas. Deduza que () = 1 para toda probabilidade invariante e use o princpio variacional
(Teorema 10.1) para concluir.

11.2.6. Toda probabilidade invariante erg


odica satisfaz (Mi ) = 1 para algum i. Use esse
fato e o princpio variacional (Corol
ario 10.4.2) para concluir que h(f ) = maxi h(f | Mi ).
Se
e uma probabilidade em Mi invariante por f | Mi , a sua restrica
o normalizada j
ao subconjunto Mi,j
e invariante por f m(i) . De fato, 7 j
e uma bijeca
o do espaco das
probabilidades em Mi invariantes por f | Mi no espaco das probabilidades em Mi,j invariantes
por f m(i) | Mi,j . Usando a Proposica
o 10.1.11, mostre que
hj (f m(i) | Mi,j ) = h (f m(i) | Mi ) = m(i)h (f | Mi ).

509
Use o princpio variacional (Teorema 10.1) para obter h(f m(i) | Mi,j ) = m(i)h(f | Mi ).

11.2.7. Lembre do Exerccio 10.2.2. Dados i, j no espaco dos smbolos X = {1, . . . , d}, defina
i j existe n tal que An
ca
o M1 , . . . , Mk em conjuntos invariantes transitivos
i,j > 0. A parti
(Teorema 11.2.15) corresponde `
a decomposica
o de X nas classes de equival
encia X1 , . . . , Xk
da relaca
o : a restrica
o da matriz A a cada Xi
e irredutvel. Em seguida, a partica
o de
cada Mi em subconjuntos Mi,j (Teorema 11.2.15) corresponde `
a decomposica
o de Xi dada
no Exerccio 7.2.6: existe = (i) tal que a restrica
o de A a cada um desses subconjuntos
de Xi
e aperi
odica.
11.3.1. Como f
e uniformemente contnua, dado > 0 existe > 0 tal que d(x, y) <
implica d(f i (x), f i (y)) < para todo i = 0, . . . , l 1.

11.3.2. Sejam U1 e U2 abertos n


ao-vazios de M . Considere x1 U1 e x2 U2 . Seja > 0 de
modo que B(xi , ) Ui para i = 1, 2. Pela propriedade de especificaca
o, existe 1 tal que
para todo n > existe p tal que d(p, x1 ) < e d(f n (p), x2 ) < . Logo, f n (U2 ) U1 6= .
R
R
11.3.3. Sejam a = d1 e b = d2 . Suponha que a < b e escreva r = (b a)/5. Pelo
teorema de decomposica
o erg
odica, podemos supor que 1 e 2 s
ao erg
odicas. Ent
ao existem
x1 e x2 tais que (x
1 ) = a e (x
2 ) = b. Usando a hip
otese de que f
e topologicamente exata,
construa uma pseudo-
orbita (zn )n0 alternando segmentos (longos) das
orbitas de x1 e x2 ,
de tal modo que a sequ
encia das m
edias temporais de ao longo da pseudo-
orbita (zn )n
oscile de a + r a b r (isto
e, lim inf a + r e lim sup b r). Em seguida, use o lema de
sombreamento para encontrar x M cuja
orbita sombreia essa pseudo-
orbita. Usando que

e uniformemente contnua, conclua que a sequ


encia das m
edias temporais de ao longo da
orbita de x oscila de a + 2r a b 2r.

11.3.4. Use a propriedade de contraca


o uniforme nos ramos inversos para mostrar que, dado
> 0 existe K 1 tal que en (y1 ) Ken (y2 ) para quaisquer y1 , y2 B(x, n, ), todo x M
e todo n 1.
o com os argumentos na prova da Proposica
o 10.2.2,
P Combinando esta observaca
mostre que pFix(f k ) ek (p) KPk (f, , ) para toda cobertura com di
ametro menor que
P
a constante de expansividade. Deduza que lim supk (1/k) log pFix(f k ) ek (p) P (f, ). De
modo semelhante, combinando a observaca
o acima com os argumentos na prova da Proposica
o 11.3.2, mostre que
X
X
Sn (f, , )
Ken (p) Ke sup ||
en+ (p) .
pFix(f n+ )

Usando (10.3.16), conclua que P (f, ) lim inf k (1/k)

pFix(f n+ )

pFix(f k )

ek (p) .

11.3.5. (a) Fixe > 0 tal que 2 seja uma constante de expansividade para f e ent
ao tome
> 0 dado pelo lema de sombreamento (Proposica
o 11.2.9). Tome para U0 a -vizinhanca de
f . Seja xn = g n (x), n Z a
orbita por g U0 de um ponto x M . Ent
ao d(f (xn ), xn+1 ) =
d(f (xn ), g(xn )) < para todo n, ou seja, (xn )nZ
e uma -pseudo-
orbita para f . Seja y o
u
nico ponto que -sombreia esta pseudo-
orbita. Defina (x) = y. Usando a unicidade do ponto
sombreado, mostre que (g(x)) = f ((x)) para todo x M . Para verificar que
e contnua,
lembre (Proposica
o 11.2.9) que o ponto sombreador foi obtido como y = lim hn (xn ), para uma
claro da construca
escolha conveniente de ramos inversos hn . E
o que cada x 7 hn (xn ) =
hn (g n (x))
e contnua e tamb
em que a converg
encia
e uniforme: d(hn (xn ), y) n para
todo x e todo n. Portanto,
e realmente contnua. Al
em disso, est
a uniformemente pr
oxima
da identidade: d((x), x) < para todo x. Estes fatos implicam que
e sobrejetiva (a prova
usa m
etodos de topologia alg
ebrica e depende do fato de que M
e uma variedade compacta)
e, portanto, f
e um fator topol
ogico de g. Pela Proposica
o 10.1.3, segue que h(f ) h(g).
(b) Tome U1 U0 suficientemente pequena para garantir que toda g U1
e expansora, com
constante de expans
ao uniforme em U1 . Ent
ao, invertendo os pap
eis de f e g na construca
o
do item (a), obtemos uma aplicaca
o contnua : M M tal que a g-
orbita de (x) sombreia
a f -
orbita de x e (f (x)) = g((x)) para todo x. Usando mais uma vez a unicidade do ponto
sombreador, conclua que = = id , logo h
e um homeomorfismo.
12.1.1. Suponha que existe uma sequ
encia (yn )n no suporte de tal que (B(yn , )) 0.
Por compacidade, podemos supor que (yn )n convergindo para algum y. Como B(y, /2)


DICAS E SOLUC
OES
DOS EXERCICIOS

510

B(yn , ) para todo n suficientemente grande, segue que (B(y, /2)) = 0, contradizendo o fato
que y supp .
imediato da definica
12.1.2. E
o que M1 (M )
e convexo e o Teorema 2.1.5 d
a que M1 (M )
e
compacto, para a topologia fraca . Verifique que o operador L : C 0 (M ) C 0 (M )
e contnuo e

deduza que o seu


em
e contnuo. Se (n )n na topologia
R dual L : M(M
R ) M(M ) tamb
fraca ent
ao ( L1 dn )n L1 d. Conclua que o operador G : M1 (M ) M1 (M )
e
contnuo. Logo, pelo teorema de Tychonoff-Schauder,
G
possui
algum
ponto
fixo
.
Isto
quer
R
dizer que L = , onde = L1 d. Como > 0, isto prova que
e uma medida de
p
e
refer
encia. Usando o Corol
ario 12.1.9, verifique que = lim supn n kLn 1k e deduza que
o raio espectral de L.
12.1.3. Verifique que ((C)) = (C)pi1 /(pi0 Pi0 ,i1 ) para todo cilindro C [0; i0 , i1 ]. Logo,
J = pi1 /(pi0 Pi0 ,i1 ) (isto corresponde ao Exerccio 9.7.2). Represente por i1 o ramo
inverso de com valores em [0; i]. Ent
ao,
Z
Z
Z
Z X
XZ

i1 d =
d =
d
dL =
L d =
J
[0;i]
i
i
para toda funca
o contnua (a pen
ultima igualdade usa o Exerccio 9.7.3).
12.1.4. Dada uma funca
o contnuaR v : M R qualquer, considere
os funcionais lineares Tv
R
e Lv definidos em L1 por Tv (u) = u(1 Lv) d e Lv (u) = (u f )v d. Verifique que Tv e
Lv s
ao contnuos. Observe que se u C 0 (M ) ent
ao L((u f )v) = uLv e, portanto,
Z
Z
Z
Z
Tv (u) =
uLv d =
L((u f )v) d = (u f )v dL = (u f )v d = Lv (u).
Use a continuidade de Tv e Lv para concluir que a igualdade Tv (u) = Lv (u) se estende para
todo u L1 ().

12.2.1. Fixe uma sequ


encia (ai )i<0 . Para cada x = (xi )iZ defina r(x) = (ri )iZ por ri = ai
se i < 0 e ri = xi se i 0. Dada uma funca
o H
older , considere u : R dada por
u(x) =

X
i=0

(i (x)) (i (r(x))).

Note que |(i (x)) (i (r(x)))| Cd(i (x), i (r(x))) C(1/2)i , uma vez que i (x) e
i (r(x)) coincidem em cada posica
o n i. Deduza que u est
a bem definida e
e H
older. Seja
+ = + u u. Como e u s
ao H
older, segue que +
e H
older. Verifique que + satisfaz
a condica
o no enunciado do exerccio.
12.2.2. Segue da hip
otese e da definica
o (10.3.9) que |Gn (f, , ) Gn (f, , ) C| < L para
todo n e todo . Logo, G(f, , ) = G(f, , ) + C para todo e P (f, ) = P (f, ) + C. A

hip
otese tamb
em implica que (x)
R= (x)
para
e qualquer probabilidade
R -quase
R todo ponto R
invariante . Consequentemente, d =
d = d + C = d + C. Sejam e
os estados de equilbrio para e , respectivamente. Deduza das observaco
es anteriores
que tamb
em
e estado de equilbrio para . Ent
ao, por unicidade, = . Use o
Teorema 12.2.3 para obter que
e cohomologo a + c para algum c R e mostre que c = C.

12.2.3. Fixe em S 1 a orientaca


o induzida por R. Considere o ponto fixo p0 = 0 de f e sejam
p1 , . . . , pd as suas pr
e-imagens, ordenadas ciclicamente, com pd = p0 . Analogamente, seja
q0 um ponto fixo de g e sejam q1 , . . . , qd as suas pr
e-imagens, ordenadas ciclicamente, com
qd = q0 . Note que f envia cada [pi1 , pi ] e g envia cada [qi1 , qi ] sobre S 1 . Ent
ao, para
cada sequ
encia (in )n {1, . . . , d}N existe exatamente um ponto x S 1 e um ponto y S 1
tais que f n (x) [p, p] e g n (y) [q, q] para todo n. Claro que as aplicaco
es (in )n 7 x e
(in )n 7 y s
ao sobrejetivas. Considere que duas sequ
encias (in )n e (jn )n s
ao equivalentes
se existe N N {} tal que (1) in = jn para n N e (2a) in = 1 e jn = d para todo
n > N ou (2b) in = d e jn = 1 para todo n > N . Mostre que os pontos x correspondentes
a (in )n e (jn)n coincidem se, e somente se, as duas sequ
encias s
ao equivalentes e que vale
fato an
alogo para os pontos y correspondentes `
as duas sequ
encias. Conclua que a aplicaca
o
: x 7 y est
a bem definida e
e uma bjieca
o em S 1 tal que (f (x)) = g((x)) para todo x.
Observe que
e mon
otona crescente (isto
e, ela preserva a orientaca
o de S 1 ) e, portanto,
e
um homeomorfismo.

511
12.2.4. (a) (b): Trivial. (b) (c): Seja a a medida invariante absolutamente contnua e
m a medida invariante de m
axima entropia de f ; sejam a e m as medidas correspondentes
para g. Mostre que a = m . Seja : S 1 S 1 uma conjugaca
o topol
ogica. Mostre que
m = m e que se
e absolutamente contnua ent
ao a = a . Use o Corol
ario 12.2.4
para concluir que nesse caso |(g n ) (x)| = k n para todo x Fix(f n ). (c) (a): A hip
otese
implica que a = m e, portanto, a = a . Lembre (Proposica
o 12.1.20) que as densidades
da /dm e da /dm s
ao contnuas e limitadas de zero e infinito. Conclua que
e diferenci
avel,
com = (d/dm) (d/dm) .

12.3.1. A afirmaca
o pode ser provada diretamente, substituindo a express
ao de na definica
o
imediato
da raz
ao cruzada. Segue outra demonstraca
o, baseada nas ideias da Seca
o 12.3.1. E
que a raz
ao cruzada
e invariante por translaco
es e por homotetias. Logo, n
ao
e restrica
o supor
que a = 1 = (a) e d = 1 = (d). Em outras palavras (lembre do Exemplo 12.3.4), basta
provar que se preserva o intervalo I ent
ao ele tamb
em preserva a dist
ancia induzida em
I pela dist
ancia projetiva do cone C. Verifique que todo automorfismo de M
obius (x) =
(x + )/(x + )
e induzido por algum isomorfismo linear L : R2 R2 , a saber



L=
,

no sentido de que o vetor ((x), 1)
e colinear a L(x, 1) para todo x. Al
em disso, se preserva
o intervalo I ent
ao L preserva o cone C. Ent
ao, pela Proposica
o 12.3.6 aplicada a L e `
a
sua inversa, L preserva a dist
ancia projetiva de C. Isto significa que preserva a dist
ancia
induzida d.
12.3.2. Considere A = (a, 1), P = (p, 1), Q = (q, 1), B = (b, 1), O = (0, 0) C R.
Seja A (respectivamente, B ) o ponto onde a reta paralela a OQ (respectivamente, OP ) que
passa por P (respectivamente, Q) intersecta o bordo de C. Note que todos estes pontos
pertencem ao plano determinado por P , Q e O, e que A OA e B OB. Por definica
o,
(P, Q) = |B Q|/|OP | e (P, Q) = |OQ|/|AP |. Mostre, usando semelhanca de tri
angulos,
que |AP |/|AQ| = |A P |/|OQ| e |BQ|/|BP | = |B Q|/|OP |. Logo,
(P, Q) = log

|OQ| |OP |
|AQ| |BP |
(P, Q)
= log
= log
.
(P, Q)
|A P | |B Q|
|AP | |BQ|

Em outras palavras, d(p, q) = log(|aq| |bp|)/(|ap| |bq|) = (p, q), para quaisquer p, q D.

12.3.3. Seja (gn )n uma sequ


encia de Cauchy com respeito `
a dist
ancia :

(A) dado qualquer > 0, existe N 1 tal que (gn , gm ) = log sup(gn /gm )/ inf(gn /gm )
para todo m, n N .

Desprezando uma quantidade finita de termos, se necess


ario, podemos supor que (gn , gm ) 1
para todo m, n 1. Em particular, 1/e (gn (x)g1 (y))/(gn (y)g1 (x)) e para todo x, y X
and n 1. Consequentemente,
(B) 1/R gn (x)/gn (y) R para todo x, y X e n 1,

onde R = e sup{g1 (s)/g1 (t) : s, t X}. Seja uma probabilidade em X. Substituindo


cada
R
gn por um m
ultiplo tn gn com tn > 0, se necess
ario, podemos supor que gn d = 1 para
todo n 1. Isto implica que
(C) inf gn 1 sup gn e inf gn /gm 1 sup gn /gm para todo n, m 1.

Ent
ao, por um lado, (B) implica que 1/R gn (x) R para todo x X e n 1. Por outro
lado, (A) e a segunda parte de (C) nos d
ao que
(D) e inf gn /gm 1 sup gn /gm e para todo m, n N .

Assim, sup |gm gn | sup gm sup |gn /gm 1| R(e 1). Isto mostra que (gn )n
e uma
sequ
encia de Cauchy com respeito `
a norma do supremo e, portanto,
e uniformemente convergente. Seja g0 o limite. Ent
ao R1 g0 (x) R para todo x X; logo, g0 C. Passando
o limite quando m em (D), obtemos que e inf gn /g0 1 sup gn /g0 e para
todo n N . Isto prova que tanto sup(gn /g0 ) quanto inf(gn /g0 ) convergem para 1. Segue
que (gn , g0 ) converge para zero quando n . Em outras palavras, (gn )n converge para
g0 com respeito `
a dist
ancia .


DICAS E SOLUC
OES
DOS EXERCICIOS

512

12.3.4. Considere o cone C0 das funco


es contnuas positivas em M . A respectiva dist
ancia
projetiva 0 est
a dada no Exemplo 12.3.5. Verifique que 1
e a restrica
o de 0 ao cone
C1 . Considere uma sequ
encia de funco
es positivas diferenci
aveis convergindo uniformemente
para uma funca
o g0 (contnua mas) n
ao diferenci
avel. Mostre que (gn )n converge para g0
relativamente `
a dist
ancia 0 e, portanto,
e sequ
encia de Cauchy para 0 e 1 . Argumente que
(gn )n n
ao pode ser convergente para 1 .
12.3.5. (a) Fixe H1 > H (g1 ) e H2 > H (g2 ). Dados quaisquer x, y M ,
|g1 g2 (x) g1 g2 (y)| |g1 (x) g1 (y)||g2 (x)| + |g1 (y)||g2 (x) g2 (y)|
H1 d(x, y) sup |g2 | + sup |g1 |H2 d(x, y) .

Agora faca Hi HR (gi ), para cada i = 1, 2. (b) Como


e uma probabilidade, existe x M
tal que |g1 (x )| |g1 | d. Note tamb
em que H1 > H (g1 ) H (|g1 |). Ent
ao, para todo
x M,
Z

|g1 (x)| |g1 (x )| + H1 d(x, x )


|g1 | d + H1 (diam M ) .
R
Isto mostra que sup |g1 |
e menor ou igual que |g1 | d+H1 (diam M ) . Faca H1 H (g1 ). (c)
Se H > H (g) ent
ao |g((x)) g((y))| Hd((x), (y)) HL d(x, y) . Faca H H (g)
para concluir. As afirmaco
es sobre H, () s
ao an
alogas.
12.3.6. (i) A u
nica parte interessante para provar que k k,
e uma norma
e a desigualdade
triangular. Observe que se Hi > H, (gi ) para i = 1, 2 ent
ao, sempre que d(x, y) < ,
|g1 (x) + g2 (x) g1 (y) g2 (y)| |g1 (x) g1 (y)| + |g2 (x) g2 (y)| (H1 + H2 )d(x, y) .
Fazendo Hi H, (gi ), obtemos que H, (g1 + g2 ) H, (g1 ) + H, (g2 ). Como vale
uma desigualdade an
aloga para o supremo, segue que kg1 + g2 k, kg1 k, + kg2 k, .
Agora considere uma sequ
encia (gn )n de Cauchy relativamente `
a norma k k, . Ent
ao (gn )n
tamb
em
e sequ
encia de Cauchy relativamente `
a norma do supremo. Como esta u
ltima norma

e completa, segue que existe alguma funca


o contnua g tal que supxM |gn (x) g(x)| converge
para zero. Note que, sempre que d(x, y) < ,
|gn (x) gn (y)|
|g(x) g(y)|
= lim
sup H, (gn ) <
n
d(x, y)
d(x, y)
n
(porque toda sequ
encia de Cauchy
e limitada). Logo, g C (M ). Al
em disso,
|(g gn )(x) (g gn )(y)|
|(gm gn )(x) (gm gn )(y)|
= lim
lim H, (gm gn ).
m
m
d(x, y)
d(x, y)
Como H, (gm gn ) kgm gn k, se m e n s
ao grandes, segue que H, (g gn ) 0
e, portanto, kg gn k, 0 quando n . (ii) Seja g C (M ). Tal como em (12.1.4),
(1) sup |Lg| grau(f ) esup sup |g| < (lembre que grau(f ) = maxy #f 1 (y)).

Dado y M , sejam
P hj: B(y, ) M , j = 1, . . . , d os ramos inversos de f na bola B(y, ).
Ent
ao, Lg(z) =
ao
j (e g)(hj (z)) para todo z B(y, ). Como estes ramos inversos s
1 -Lipschitz, usando os itens (a) e (c) do Exerccio 12.3.5) obtemos que
X
 X

H, (Lg)
H, (e g) hj
H, (e ) sup |g| + esup H, (g)
j

e, portanto,
(2) H, (Lg) grau(f )H, (e ) sup |g| + grau(f ) esup H, (g) < .


(iii) As desigualdades (1) e (2) acima d
ao que kLk, grau(f ) esup + H, (e ) .

12.3.7. (a) Tome H : C (M ) C (M ), g 7 gh. Verifique que P = H 1 L H. Em


particular, P(1) = Lh/(h) = 1. Al
em disso, dada qualquer funca
o mensur
avel limitada ,
Z
Z
Z
Z
Z
Z
h
h
dP =
P() d =
L(h)
d =
dL =
h d =
d
h

513
Isto mostra que L = . (b) Use o fatoR de que P
eR n
ao negativo,R juntamente com
a propriedade P =
, para verificar
que |Pg| d P(|g|) d = |g| d para todo
R
R
g C (M ). Logo, |P n g| d |g| d para todo n e todo g. Analogamente, usando a
propriedade P1 = 1, verifique que sup |Pg| P(sup |g|) = sup |g| para todo g C (M ).
Logo, sup |P n g| sup |g| para todo n e todo g. Para quaisquer y, z M com d(y, z) < ,
X (ge )(hj (y)) (ge )(hj (z))
|Pg(y) Pg(z)|

d(y, z)
d(y, z)
j

X
j

e(hj (y))

g(hj (y)) g(hj (z)) X


e(hj (y)) e(hj (z))
+
g(hj (y))

d(y, z)
d(y, z)
j


Verifique que a primeira parcela
e limitada por P H, (g) = H, (g) e a segunda

e limitada por grau(f ) sup |g| H, (e ) . Conclua que H, (Pg) H, (g) + C0 sup |g|
para todo g, com = e C0 = grau(f )H, (e ) . Ent
ao, para cada n,
H, (P n g) H, (P n1 g) + C0 sup |P n1 g| H, (P n1 g) + C0 sup |g|.
P
i
Deduza que H, (P n g) n H, (g) + C sup |g|, com C = C0
i=0 .

claro que log g


12.3.8. (a) E
e (b, )-H
older e sup g/ inf g est
a pr
oximo de 1 se a norma kvk,

e pequena (isto estar


a impcito em tudo que segue). Ent
ao g C(b, , R). Para estimar (1, g),
usaremos a express
ao dada pelo Lema 12.3.8. Observe que


exp(b)g(x) g(y)
(1, g) = sup g(x),
: x 6= y, d(x, y) <
exp(b) 1

onde = d(x, y) .

Claro que g(x) 1 + sup |v|. Al


em disso,
exp(b)g(y) + exp(b)H, (v) g(y)
exp(b)
exp(b)g(x) g(y)

= g(y) +
H, (v).
exp(b) 1
exp(b) 1
exp(b) 1
Tome K1 > K2 > 0, dependendo apenas de b, , , tais que K1 exp(bs)s/(exp(bs)1) K2
para todo s [0, ]. Ent
ao o termo do lado direito da desigualdade anterior
e limitado por
1 + sup |v| + K1 H, (v). Logo, log (1, g) log(1 + sup |v| + K1 H, (v)) K1 kvk, , onde
K1 = max{K1 , 1}. Os argumentos anteriores, fazendo variar x e y, tamb
em mostram que
(1, g) 1 + sup |v| e (1, g) 1 sup |v| + K2 H, (v). Deduza que


log (1, g) max log(1 + sup |v|), log(1 sup |v| + K2 H, (v)) K2 kvk, ,

onde a constante K2 s
o depende K2 , e . Analogamente, existem constantes K3 > K4 > 0
tais que K3 kvk, log (1, g) K4 kvk, . Fixando K max{(K1 +K3 ), 1/(K2 +K4 )},
segue que K 1 kvk, (1, g) K kvk, . (b) N
ao
e restrica
o supor kvk, < r. Note que
P n g = 1 + P n v para todo n. O Corol
ario 12.3.12 d
a que
(P kN g, 1) k0 (1, g)

com 0 < 1. Pelo item (a), segue que


com =

1/k
0

eC=

K 2 kPkN 1
0 .

kP kN vk

para todo k,

K 2 k0 para todo k. Isto d


a o enunciado,

12.4.1. Considere f (x1 , x2 ) = (x1 + 1 + x2 )d (xd1 + xd2 ). Observe que, como d < 1, as
derivadas parciais 1 f (x1 , x2 ) e 2 f (x1 , x2 ) s
ao negativas em [0, 1]2 . Logo, o mnimo da
funca
o f
e atingido no ponto (1, 1). A escolha de d d
a que f (1, 1) = 0.
12.4.2. Dado > 0, seja U uma cobertura de A com di
ametro P
menor que . Ent
ao
f (U )
e cobertura de f (A) com di
ametro menor que L. Al
em disso,
diam(f (U ))d
U
U
P
d
d
mos que md (f (A), L) Ld md (A, ). A priU U L diam(U ) . Fazendo variar U , conclu
meira parte do enunciado segue, fazendo 0. A segunda parte
e trivial no caso t = 0.
Para t 6= 0 basta aplicar a primeira parte `
a homotetia f (x) = tx e `
a sua inversa (com L = t e
L = t1 , respectivamente).
claro que md (M ) ma (M ) e md (M ) mf (M ). Para provar a recproca da
12.4.3. E
d
d
primeira desigualdade, note que dado > 0 e dado um conjunto U com di
ametro positivo


DICAS E SOLUC
OES
DOS EXERCICIOS

514

podemos encontrar um aberto A U tal que diam A diam U (1 + 2): basta tomar A =
uni
ao das bolas de raio diam U centradas em pontos de U . Em particular, dado > 0 e dada
qualquer cobertura U com di
ametro menor que
cobertura aberta
P, podemos encontrar uma P
A com di
ametro menor que (1 + 2) e tal que AA (diam A)d (1 + 2)d U U (diam U )d .
d
Isto mostra que ma
d (M, (1 + 2)) (1 + 2) md (M, ). Fazendo 0 e depois 0,
obtemos a desigualdade pretendida. A recproca da segunda desigualdade
e an
aloga e um
pouco mais simples, porque o fecho F de qualquer conjunto U tem o mesmo di
ametro que U .
12.4.4.PConsidere 0 <
toda cobertura U de A com di
ametro menor que ,
P . Para
d
1 (U ) K 1 (A). Tomando o
temos
nfimo sobre U , vem
U U (diam U )
U U K
que md (A, ) K 1 (A). Fazendo 0, obtemos que md (A) > K 1 (A); logo, d(A) d.

12.4.5. O tri
angulo de Sierpinski T pode ser escrito como interseca
o de uma sequ
encia
descrescente de compactos Tn , cada um deles formado por 3n tri
angulos equil
ateros com
di
ametro igual a 2n . Deduza que md (T ) limn 3n 2nd para todo d > 0. Em particular,
md0 (T ) 1. Considere a probabilidade definida em T pela condica
o de que cada um dos
tri
angulos que formam Tn tem peso 3n (justifique que esta regra define realmente uma u
nica
probabilidade na -
algebra de T ). Verifique que qualquer conjunto com di
ametro menor que
2n intersecta, no m
aximo, 2 dos tri
angulos de lado 2n+1 que formam Tn1 ; logo, a sua
medida
e menor ou igual que 2 3n+1 . Deduza que (U ) 18 (diam U )d0 para todo U
com di
ametro menor que 1/2. Pelo Exerccio 12.4.4, segue que md0 (T ) 1/18. As duas
desigualdades obtidas para md0 (T ) implicam que d(T ) = d0 .
12.4.6. Seja = {1, . . . , d}N e h : K a aplicaca
o que associa a cada sequ
encia (in )n0
ao h
e um homeomrofismo e
o u
nico ponto x K tal que f n (x) Jin para todo n. Ent
conjuga f : K K ao deslocamento : . Seja : K R a funca
o definida por
(x) = t log |f (x)| e seja = f . Pela Proposica
o 10.3.2, P (f, ) = P (, ). Como |f |

e constante em cada intervalo Ji , a funca


o
e constante em cada cilindro [0; i]. Portanto o
c
alculo de P (, )
e um caso particular do Exerccio 10.5.2.
12.4.7. Considere = 1. Ent
ao D, D1 , . . . , DN (Seca
o 12.4.3) s
ao intervalos compactos.
N
ao
e restrica
o supor que D = [0, 1]. Escreveremos Din = hi0 hin1 (D) para cada
in = (i0 , . . . , in1 ) em {1, . . . , N }n . A partir da propriedade de distorca
o limitada (Proposica
o 12.4.5), prove que existe c > 0 tal que, para todo in e todo n,
(a) c |(f n ) (x)| diam Din c1 para todo x Din ;

(b) d(Din , Dj n ) c diam Din para todo j n 6= in ;

(c) diam Din+1 c diam Din para todo in , onde in+1 = (i0 , . . . , in1 , in ).

Seja a medida de refer


encia do potencial = d0 log |f |. Como P (f, ) = 0, o Lema 12.1.3
e o Corol
ario 12.1.15 d
ao que J f = |f |d0 . Deduza que c |(f n ) (x)|d0 (Din ) c1 para
qualquer x Din e, usando (a) uma vez mais, conclua que

diam(Din )d0
c2 para todo in e todo n.
(Din )
P
P
2 . Como o di
n
n d0 c2
ametro dos Din conSegue que
in (Di ) = c
in diam(Di )
verge uniformemente para zero quando n , isto implica que md0 () c2 . Para a
estimativa inferior, vamos provar que satisfaz a hip
otese do princpio da distribuica
o de
massa (Exerccio 12.4.4). Dado qualquer U com diam U < c min{diam D1 , . . . , diam DN },
existem n 1 e in tais que Din intersecta U e c diam Din > diam U . Por (b), temos
aximo. Ent
ao, usando (c), diam U
que (U ) (Din ) c2 diam Didn0 . Tome n m
c diam Din+1 c2 diam Din para alguma escolha de in . Combinando as duas desigualdades, (U ) c22d0 (diam U )d0 . Pelo princpio da distribuica
o de massa, segue que
md0 () c2+2d0 . Finalmente, estenda estes argumentos para qualquer dimens
ao 1.
c2

A.1.1. Tome B = {f 1 (C) : C C}. Para ver que B


e -
algebra, note que a pr
e-imagem
preserva interseco
es e a passagem ao complementar. Al
em disso, a pr
e-imagem do conjunto
vazio
e o conjunto vazio.
A.1.2. B0
e fechada por uni
oes finitas: a uni
ao de dois conjuntos finitos
e um conjunto
finito; se Ac
e finito ent
ao (A B)c
e finito, qualquer que seja B. Se X
e finito, B0 cont
em

515
todos os subconjuntos, logo
e -
algebra. Caso contr
ario, X admite algum subconjunto infinito
enumer
avel Y tal que Y c
e infinito. Ent
ao Y est
a na -
algebra gerada por B0 mas n
ao est
a
em B0 . B1
e fechada por uni
oes enumer
aveis: a uni
ao enumer
avel de conjuntos numer
aveis

e um conjunto enumer
avel; se Ac1
e enumer
avel ent
ao (n An )c
e enumer
avel. Todo conjunto
enumer
avel pode ser escrito como uni
ao enumer
avel de conjuntos finitos; logo, a -
algebra
gerada por B0 cont
em (e, portanto, coincide com) B1 .
A.1.3. B
e fechada por passagem ao complementar: se A Bi para todo i ent
ao Ac Bi
para todo i. B
e fechada por uni
oes enumer
aveis: se An Bi para todo i e todo n N ent
ao
n An Bi para todo i.

A.1.4. Toda classe de equival


encia de
e invariante pela translaca
o x 7 x + 1 e, portanto,
intersecta [0, 1). Para cada x [0, 1), denote Ex = {(e + x) [e + x] : e E0 }. Verifique que se
E0
e mensur
avel ent
ao Ex
e mensur
avel e m(Ex ) = m(E0 ). Mostre que nZ En = [0, 1) e os
conjuntos En , n Z s
ao disjuntos dois-a-dois. Usando o fato de que a medida de Lebesgue

e -aditiva, conclua que E0 n


ao pode ser mensur
avel.
A.1.5. Defina B1 = A1 e Bk = Ak \ (A1 A2 ... Ak1 ) para k 2. Observe que

k=1 Ak = k=1 Bk e (Bk ) (Ak ).


P
A.1.6. Dado > 0, temos (F ) nk (En ) < para todo k suficientemente grande.

A.1.7. Dados quaisquer B1 , . . . , Bn , . . . em A, disjuntos dois-a-dois e tais que B = n Bn


tamb
em est
a em A, defina Cn = B1 Bn . Verifique que os conjuntos An = B \ Cn
satisfazem a condica
o (A.1.1) no Teorema A.1.14. Logo (B)
P (Cn ) = (An ) converge
para zero. Como
e aditiva, segue que (B) = limn (Cn ) =
j=1 (Bj ). Reciprocamente,
suponha que
e -aditiva. Dados A1 An em A tais que j P
Aj = , defina

Bj = Aj \ Aj+1 . Como A1
e a uni
ao disjunta dos Bn , temos (A1 ) =
j=1 (Bj ) =
Pn
limn j=1 (Aj ) (Aj+1 ) = (A1 ) limn (An ). Portanto, (An ) 0.

A.1.8. B0
e fechada por uni
oes finitas e por passagem ao complementar e R B. Verifique que
m0 est
a bem definida: m0 (B) n
ao depende da escolha da representaca
o de B B0 como uni
ao
disjunta de intervalos. Note que m0
e aditiva. Seja (An )n sequ
encia decrescente de elementos
de B0 tal que n An = . Dado qualquer > 0, construa uma sequ
encia decrescente (Kn )n
de compactos com Kn An e m0 (An \ Kn ) < para todo n. Ent
ao Kn = e, portanto,
m0 (An ) < , para todo n suficientemente grande. Isto mostra que m0
e contnua no vazio
(Teorema A.1.14).

A.1.9. Dados A1 Ai tome A =


i=1 Ai . Para j 1, considere Aj = Aj \ A.
Pelo Teorema A.1.14, temos que (Aj ) 0 e, portanto, (Aj ) (A). Dados A1

Ai tome A =
i=1 Ai . Para cada j, considere Aj = A \ Aj . Pelo Teorema A.1.14, temos

que (Aj ) 0, ou seja, (Aj ) (A).

A.1.10. A parte mais sutil


e mostrar que a norma k k
e completa. Seja (n )n uma sequ
encia
de Cauchy. Dado > 0, temos |m (A) n (A)| km n k para todo conjunto
mensur
avel A X e quaisquer m, n suficientemente grandes. Segue que n (A) converge
(uniformemente)
para algum (A) C. Mais geralmente, se m, n s
ao suficientemente grandes
P
ent
ao
lia enumer
avel {Ak : k}
k |m (Ak ) n (Ak )| km n k para qualquer fam
de conjuntos mensur
aveis, disjuntos dois-a-dois.
Tomando o limite quando m , obtemos
P
que se n
e suficientemente grande ent
ao k=1 |(Ak ) n (Ak )| para quaisquer conjuntos
mensur
aveis Ak disjuntos dois-a-dois. Combinando este fato com |(k Ak )n (k Ak )| e
o fato de que cada n
e -aditiva, conclua que
e -aditiva. Portanto, M(X). Al
em disso,
tomando o supremo sobre todas as escolhas da famlia {Ak : k}, obtemos que k n k
para todo n suficientemente grande.
A.1.11. Para fixar ideias, considere I = N (o outro caso
e an
alogo). (a) Note que d(x, y) =
d(y, x) e que d(x, y) > 0 se, e somente se, existe algum ndice i para o qual xi 6= yi . Conclua
que d(x, y) = 0 se, e somente se x = y. Observe que N (x, z) min{N (x, y), N (x, z)} e,
portanto, d(x, z) max{d(x, y), d(y, z)} d(x, y) + d(y, z). Se m+1 < m , a bola
aberta de centro x e raio
e o cilindro [0; a0 , . . . , am ]. Este cilindro tamb
em coincide com
a bola fechada, se m+1 < m . Para concluir que as duas topologias coincidem basta
notar que todo cilindro
e uni
ao finita deste tipo de cilindros. (b) Como M = X I
e um
espaco m
etrico, basta mostrar que toda sequ
encia (xk )k em M admite alguma subsequ
encia


DICAS E SOLUC
OES
DOS EXERCICIOS

516

convergente. Escreva xk = (xk,i )i . Use um argumento diagonal para encontrar (kj )j


e convergente. (c) Vimos
tal que xkj ,i = xki ,i para todo j i. Logo, a subsequ
encia (xkj )j
no item (a) que todo cilindro [0; a0 , . . . , am ]
e fechado em M . Como M
e compacto, segue
que todo elemento de A
e compacto; em particular, a
algebra A
e compacta.
A.1.12. Por construca
o, m(Kn ) = (2/3)m(Kn1 ) para todo n. Logo, m(K) = limn m(Kn ) =
0.

A.1.13. (Royden [Roy63]) (b) (a) Suponha que existem conjuntos borelianos B1 , B2 tais
que B1 E B2 e m(B2 \ B1 ) = 0. Deduza que m (E \ B1 ) = 0, logo E \ B1
e conjunto
mensur
avel de Lebesgue. Conclua que E
e conjunto mensur
avel de Lebesgue. (a) (c)
Seja E um conjunto mensur
avel de Lebesgue talP
que m (E) < . Dado > 0, existe uma
cobertura por ret
angulos abertos (Rk )k tais que k m (Rk ) < m (E) + . Ent
ao A = k Rk

e aberto contendo E e tal que m (A) m (E) < . Usando que E


e conjunto mensur
avel de
Lebesgue, deduza que m (A \ E) < . Para tratar o caso geral, escreva E como uni
ao disjunta
claro que E
de conjuntos mensur
aveis de Lebesgue com medida exterior finita. (c) (d) E
e
conjunto mensur
avel de Lebesgue se, e somente se, o seu complementar
e conjunto mensur
avel
de Lebesgue. (c) e (d) (b) Para cada k 1, considere fechado Fk E e aberto Ak E
tais que m (E \ Fk ) e m (Ak \ E) sejam menores que 1/k. Ent
ao B1 = Fk e B2 = k Ak
s
ao borelianos tais que B1 E B2 e que m (E \ B1 ) = m (B2 \ E) = 0. Conclua que
m(B2 \ B1 ) = m (B2 \ B1 ) = 0.
A.1.14. Note que {x : (f + g)(x) < c} = qQ {x : f (x) < q e g(x) < c q}. Logo f + g
e
mensur
avel se f e g s
ao. Use um argumento an
alogo para f g, considerando separadamente os
domnios onde f e g t
em sinais constantes. Em seguida, {x : i(x) < c} = n {x : fn (x) < c}.
Portanto, o nfimo de funco
es mensur
aveis
e mensur
avel. Para o supremo, use o fato de que
supn fn = inf n (fn ). Como consequ
encia, f = supk inf n>k fn e f = inf k supn>k fn s
ao
funco
es mensur
aveis.
P
Pk
A.1.15. Segue do Exerccio A.1.14, uma vez que
n=1 gn = limk
n=1 gn .

1 ([k/n, (k + 1)/n)). Defina tamb


em
A.1.16. Para cada n 1 e k Z, defina An
k := f
1 ([, n)) e An = f 1 ([n, +]). Mostre que a seguinte sequ
An
encia de funco
es
= f
+
simples tem as propriedades desejadas (se f toma valores em R, substitua por n no primeiro
e no u
ltimo termo do lado direito da igualdade):

sn = XA +

2
nX
1

k=n2

k
n
XAk + XA
+
2n

A.1.17. Note que f 1 () = e que se Ak , k 1 s


ao disjuntos dois-a-dois ent
ao o mesmo vale
f 1 (Ak ), k 1. Al
em disso, f 1 (k Ak ) = k f 1 (Ak ). Segue que f
e -aditiva. Note que
f (X) = (X).
1
A.1.18. Mostre que x 7 n
#{0 j n 1 : aj = 5}
e uma funca
o simples para cada n 1.
Pela Proposica
o A.1.31, segue que 5
e mensur
avel.

A.2.1. Sejam A1 , . . . , AP
conjuntos mensur
aveis e sejam a1 , . . . , am e b1 , . . . , bn
m e B1 , . . . , Bn P
m
n
n
umeros reais tais que
i=1 ai XAi =
j=1 bj XBj em -quase todo ponto. Considere conjuntos mensur
aveis C1 , . . . , Cp disjuntos
e uma uni
ao de Ck s e o
Pm dois-a-dois
Pptais que cada Ai
onde
cada
c

e
a soma dos ai
c
X
mesmo vale para cada Bj . Ent
ao
C
k
k
i=1 ai XAi =
k
k=1
tais que Ai cont
em Ck . Logo,
m
X

ai (Ai ) =

i=1

Analogamente,

m
X

ai

i=1

Pn

j=1 bj (Bj )

Pp(n)

p
X

(Ck ) =

Ck Ai

Pp

ai )(Ck ) =

k=1 Ck Ai

k=1 ck (Ck )

n
n
i=1 ai XAi

Pq(n)

ck (Ck ).

k=1

Pm

ai (Ai ).

sn d = sup

i=1

p
X

A.2.2. Escreva rn =
e sn =
com An
i , i = 1, . . . , p(n) disjuntos
dois-a-dois e Bjn , j = 1, . . . , q(n) disjuntos dois-a-dois. Note que
lim
n

n
n
j=1 bj XBi ,

p(n)

rn d = sup
n

X
i=1

n
an
i (Ai )

lim
n

q(n)
n

j=1

n
bn
j (Bj ).

517
Fixe n 1. As hip
oteses implicam que dado > 0 existe X X com (X ) < e existe
m 1 tal que rm (x) sn (x) para todo x
/ X e todo m m . Fixe m = m . Seja
n ao vazias. Defina a = am se C Am
{Ck : k = 1, . . . , p} a famlia das interseco
es Am
k
k
i Bj n
i
i
n . Ent
e bk = bn
se
C

B
a
o
a

a
menos
que Ck esteja contido em X . Portanto,
k
k
k
j
j
X
X
X
X
m
bk (Ck )
ak (Ck )
ak (Ck )
am
i (Ai ) =
i

k:Ck 6X

k:Ck 6X

bk (Ck ) (1 + max bk ) =
k

X
j

n
n
bn
j (Bj ) (1 + max bj ).

m
m
i ai (Ai )

n
n
j bj (Bj )

para todo n e,
Fazendo 0 e m , obtemos que limm
P n
P
n ). A desigualdade rec
m ) lim
b
(B
proca

e
an
aloga.
(A
portanto, limm i am
n
j j
j
i
i

A.2.3. A Definica
o A.2.1 d
a a linearidade para funco
es simples. O caso
R geral de (1) segue,
usando as Definico
es A.2.2 e A.2.3. As Definico
es A.2.1 e A.2.2 d
ao que f d 0 sempre que
f 0. Combinado
comRa linearidade, isto implica o enunciado em (2). Como |f | f |f |,
R
segue que | f d| |f | d. Em particular, f
e integr
avel se |f |
e integr
avel. Para a
recproca, use |f | = f + + f .
A.2.4. Considere
A = {x : f (x) a} e s : X R dada por s(x) = aXA . Argumente que
R
R
f d R s d. Em seguida, aplicando a desigualdade a |f |, obtemos que ({x : |f (x)|
1/k}) k |f | d = 0 para todo k 1. Conclua que {x : f (x) 6= 0} tem medida nula.
R
A.2.5. Considere a medida definida por (E) = E |f | d. Suponha que a conclus
ao do
enunciado fosse falsa. Ent
ao existiriam > 0 e conjuntos mensur
aveis En , n 1 tais que
(En ) para todo n mas (En ) 0. A menos de restringir a uma subsequ
encia, podemos
supor (En ) 2n . Seja E = lim supn En = k nk En . Conclua que (E) mas
(E) = 0, contradizendo o fato de que
e absolutamente contnua relativamente a .
P
A.2.6. Considere funco
es simples i =
i | < /2 para todo i.
l ai,l XAi,l com sup |i P
R
R
Ent
ao | i d i d| < /2. Mostre que podemos reescrever i = sj=1 bi,j XBj onde os
R
P
conjuntos mensur
aveis B1 , . . . , Bs n
ao dependem de i. Ent
ao i d = sj=1 bi,j (Bj ). Tome
Ps
Ps
xj Bj e j = (Bj ) para j = 1, . . . , s. Ent
ao | j=1 bi,j (Bj ) j=1 j i (xj )| < /2
para todo i. O enunciado segue das duas desigualdades.
A.2.7. RAplicando Ro lema de FatouR `
as duas sequ
encias |g| fn e |g| + fn , conclua que
lim supn fn d f d lim inf n fn d.
A.2.8. (a) Suponha que F
e uniformementeR integr
avel. Considere C > 0 correspondente
a = 1 e tome L = C + 1. Verifique que |f | d < L para todo f F . RDado > 0,
considere C > 0 correspondente a = /2 e tome = /(2C). Verifique que A |f | d <
para todo f F e todo conjunto com (A) < . Reciprocamente,
dado > 0, tome > 0
R
correspondente a = e tome C = L/. Mostre que |f |>C |f | d < . (b) Aplicando
o Exerccio A.2.5 `
a funca
o |g|, mostre que F satisfaz o crit
erio em (a). (c) Vamos provar
tr
es fatos sobre f = limn fn . (i) f
e finita em quase todo ponto: Considere L como em
(a). Note que ({x : |fn (x)| k}) L/k para todo n, k 1 (Exerccio A.2.4) e deduza
que ({x : |f (x)| k}) L/k para todo k 1. (ii) f
e integr
avel : Fixe K > 0. Dado
qualquer > 0, tome como em (a). Considere n suficientemente grande para que ({x :
|fn (x) f (x)| > }) < . Por um lado,
Z
Z
Z
|f | d (L + ) + K.
|f | d +
|f | d
|f |K

|fn f |

|f |K,|fn f |>

|f |K

|f |K |f | d L para todo K e

|f | d L. (iii) (fn )n converge para f em


R
R
L1 (): Mostre que, dado > 0 existe K > 0 tal que |f |>K |f | d < e |f |>K |fn | d <
para todo n. Tome como no item (a) e n grande tal que ({x : |fn (x) f (x)| > }) < .
Ent
ao,
Z
Z
Z
Z
|f | d.
|fn | d +
|fn f | d +
|fn f | d
Deduza que

|fn f |

|fn f |>

|fn |K,|fn f |>

O lado direito
e majorado por 2 + K. Juntando estas desigualdades,
para todo n suficientemente grande.

|fn f | d < 4 + K


DICAS E SOLUC
OES
DOS EXERCICIOS

518

A.2.9. A condica
o (A.2.10) implica que lim m(B(a, ) A)/m(B(a, )) = 1, ou seja, a
e
ponto de densidade de A. Para a recproca, suponha que a
e ponto de densidade. Ent
ao,
dado > 0 existe > 0 tal que m(B(a, r) \ Ac )/m(B(A, r)) < para todo 0 < r . Mostre
que se B
e uma bola contida em B(a, ) e contendo a, existe r tal que B B(a, r) mas
m(B) 2d m(B(a, r)). Logo m(B Ac )/m(B) < 2d . Isto prova (A.2.10).
A.2.10. Se a conclus
ao do exerccio fosse falsa, existiriam < 1 e nj tais que m(AP )
m(P ) para todo P Pnj . Considere qualquer fechado K A com volume positivo e finito
e denote K = {x : d(x, K) < }. Ent
ao,
X
X
m(K) =
m(K P )
m(P ) m(K )
P

oe-se que diam Pnj < .


onde as somas s
ao sobre todos os P Pnj que intersectam K e sup
Faca 0 para chegar a uma contradica
o.

A.2.11. Suponha que existe < 1 e existe A0 A com medida positiva tal que todo ponto
a A0 admite bolas B(a, ra ) com raio arbitrariamente pequeno, satisfazendo m(B(a, ra ) \
A0 ) (1 )m(B(a, ra )). Use o lema de Vitali para concluir que m(A0 \ A0 ) (1 )m(A0 ).
Fazendo 0, chegamos a uma contradica
o.

A.2.12. Note que (A) = 0 A {x1 , x2 } = (A). Portanto . Mostre que


d/d = (p1 /q1 )X{x1 } + (p2 /q2 )X{x2 } e d/d tem uma express
ao an
aloga, permutando os
pap
eis de pi e qi .

A.2.13. Seja U [0, 1] uma uni


ao disjunta de intervalos abertos, exatamente 2k1 intervalos
de comprimento 2k1 , para cada k 1. Tome K = [0, 1]\U e defina = 2(m | U ). Note que
m e que m(K) = m(U ) = 1/2. N
ao
e possvel pedir m(K) = 1 pois ent
ao m(K c ) = 0,
c
logo (K ) = 0 e, portanto, seria identicamente nula.
A.2.14. N
ao
e restrica
o supor que os Bn s
ao disjuntos dois-a-dois. Para cada n considere
a medida n definida em Bn por n (A) = (f (A)). Ent
Rao n ( |R Bn ) e, pelo teorema
de Rad
on-Nikodym, existe n : Bn [0, +] tal que Bn dn = Bn n d para toda
: Bn R mensur
avel limitada. Defina J | Bn = n . A unicidade essencial de J
e
consequ
encia da unicidade essencial da derivada de Rad
on-Nikodym.
A.2.15. Usando a notaca
o do Teorema A.1.21: + (A) = (A) = ||(A) e (A) = 0
para todo A P e (B) = (B) = ||(B) e + (B) = 0 para todo B N . Logo
+ = XP = XP || e = XN = XN ||.

A.2.16. Por definica


o, (A) = limn
n (A) = supn
n (A) e valem relaco
es an
alogas para
(A). Logo (A) = 0 n (A) = 0 para todo n
n (A) = 0 para todo n (A) = 0.
Portanto, e
n para todo n. Observe que (d
n /d) (d
n /d
n ) em -quase
todo ponto e a sequ
encia no lado esquerdo desta desigualdade
e n
ao decrescente. Logo, basta
mostrar que supn (d
n /d) = (d/d) em -quase todo ponto. Para isso, suponha que existem
> 0 e um conjunto E com medida positiva tal que (d
n /d)(x) (d/d)(x) para todo
x E e todo n. Mostre que
n (E) (E) (E) para todo n, contradizendo a hip
otese.

A.3.1. As bolas B(x, r) com r Q formam uma base enumer


avel de vizinhancas de cada ponto
x. Se que M admite algum subconjunto X enumer
avel e denso ent
ao a famlia B das bolas
B(x, r) com x X e r Q
e uma base enumer
avel de abertos: observe que todo subconjunto
aberto U coincide com a uni
ao dos elementos de B que ele cont
em. Recprocamente, se B
e
uma base enumer
avel de abertos ent
ao tomando um ponto em cada elemento de B obtemos
um subconjunto enumer
avel denso de M (isto vale mesmo que M seja apenas um espaco
topol
ogico). Todo espaco euclideano Rd , munido da topologia usual,
e separ
avel. Qualquer
espaco M munido com a dist
ancia discreta (definida por d(x, y) = 0 se x = y e d(x, y) = 1 se
x 6= y)
e n
ao separ
avel se M n
ao for enumer
avel.
A.3.2. As esferas {x M : d(x, F ) = r}, r > 0 s
ao disjuntas duas-a-duas.

A.3.3. Seja {xk : k N} um subconjunto enumer


avel denso. Para cada k, considere rk
(/4, /2) tal que o bordo de Bk = {x M : d(x, xk ) < rk } tem medida nula (Exerccio A.3.2).
Defina P1 = B1 e Pk+1 = Bk+1 \(P1 Pk ) para k 1. Observe que {Bk }
e uma cobertura
e, portanto, {Pk }
e uma partica
o de M . Al
em disso, Pk B1 Bk tem medida nula,
para todo k.

519
A.3.4. Verifique que
e n
ao decrescente e limxa+ (x) limxa (x) = ({a}).
Suponha
P
que
e absolutamente contnua, ou seja, para todo > 0 existe > 0 tal que j |aj bj | <
P
implica
lia {(aj , bj ) : j} de intervalos disjuntos
j |(aj ) (bj )| < , para qualquer fam
dois-a-dois. Observando que |(aj ) (bj )| = ((aj , bj ]), mostre que se m(E) = 0 ent
ao
(E) = 0. Reciprocamente, suponha que m. Pelo Exerccio A.2.5, dado > 0 existe
> 0 tal que m(E) < implica (E) < . Deduza que
e absolutamente contnua.
A.3.5. Seja A a famlia dos borelianos cuja funca
o caracterstica
e limite de funco
es uniformemente contnuas n : M [0, 1]. Use o Lema A.3.4 para mostrar que A cont
em todos
os subconjuntos fechados de M . Note que A
e uma
algebra. Observando que a funca
o caracterstica de n
ca
o caracterstica de
j=1 Aj converge em todo ponto para a fun
j=1 Aj , use
um argumento diagonal para mostrar que A
e uma -
algebra e, portanto, cont
em todos os
borelianos. Conclua que a afirmaca
o no exerccio vale para toda funca
o simples. Dada uma
funca
o mensur
avel qualquer, use a Proposica
o A.1.33 para obter uma sequ
encia de funco
es
simples (sn )n tal que |sn (x)| |(x)| e sn (x) (x) em todo ponto. Use, mais uma vez,
um argumento diagonal para concluir que a afirmaca
o no exerccio vale para .
A.3.6. Basta tratar o caso real. Para cada n 1, considere o reticulado regular Fn de
lado n1 no cubo unit
ario, isto
e, Fn = {(i1 /n, . . . , id /n) : 0 i1 , . . . , id n}. Observe
que o conjunto Fn das funco
es : Fn Q
e enumer
avel. Para cada n 1 e Fn ,
represente por n, a funca
o que coincide com nos pontos de Fn e
e afim em cada subcubo
[i1 /n, (i1 + 1)/n] [id /n, (id + 1)/n]. Verifique que n, est
a bem definida e
e contnua.
Mostre que para toda funca
o contnua f : [0, 1]d R e todo > 0 existe (n, ) tal que
kf n, k < . Portanto, o espaco C 0 ([0, 1]d , R)
e separ
avel.

A.4.1. Como o cardinal de X


e igual ao cardinal de R, o qual
e igual ao cardinal de Rd , existe
alguma bijeca
o : X Rd . Defina a topologia em X de modo que seja um homeomorfismo.
A aplicaca
o constitui um atlas de classe C e dimens
ao d.
A.4.2. N
ao. Caso f fosse um difeomorfismo, a aplicaca
o f 1 (x) = x3 seria um
difeomorfismo do espaco euclideano R, o que n
ao
e verdade.

A.4.3. Considere a relaca


o de equival
encia x y existe alguma curva contnua ligando
x a y. Usando cartas lcocais, observe que as classes de equival
encia s
ao conjuntos abertos.
Conclua que existe uma u
nica classe de equival
encia
A.4.4. Comece por observar que as aplicaco
es i s
ao bijeco
es, com inversas 1
: Rd U i
i
1
dadas por i (y1 , . . . , yd ) = [y1 : : yi1 : 1 : yi+1 : : yd ]. Defina a topologia de Pd
de modo que cada i seja um homeomorfismo. Observe que as mudancas de coordenadas
i 1
: j (Ui Uj ) j (Ui Uj ) s
ao C :
j

i 1
(y1 , . . . , yd ) = i ([y1 : : yj1 : 1 : yj+1 : : yd ])
j
=(

yi1 yi+1
yj1 1 yj+1
yd
y1
,...,
,
,...,
, ,
,...,
).
yi
yi
yi
yi yi yi
yi

A.4.5. Defina f : GL(d) R por f (A) = det A. Como o determinante


e uma funca
o
polinomial dos coeficientes da matriz, a aplicaca
o f
e C . Escreva A = (Ai,j )i,j e, para cada
par (i, j), represente por Ai,j a matriz (d 1) (d 1) obtida quando removemos a i-
esima
linha e a j-
esima coluna da matriz A. Observe que f (A) = (1)i+j ai,j det A11 + Ri,j onde
Ri,j n
ao depende do coeficiente ai,j . Desta forma, (f /xi,j ) = (1)i+j det Aij . Se det A
e
n
ao nulo, existe algum (i, j) tal que det Ai,j 6= 0 e portanto Df (A)
e sobrejetiva. Isto mostra
que todo y 6= 0
e valor regular de f .
A.4.6. Dados pontos b > a em R++ , considere uma curva diferenci
avel : [0, 1] R+ que
realiza a dist
ancia entre os dois pontos, ou seja, tal que (0) = a e (1) = b e

Z 1
Z 1
d
1 d
(t)
d(a, b) = comp() =
(t) dt.
dt =
dt
0
0 (t) dt
(t)

claro que
E
e mon
otona crescente: caso contr
ario, existiria alguma restrica
o ligando a a b,
contradizendo a hip
otese de que a curva
e minimizante. Ent
ao podemos fazer a mudanca
R
de vari
avel s = (t) na u
ltima integral. Desta forma obtemos d(a, b) = ab ds/s = log b log a.

520

DICAS E SOLUC
OES
DOS EXERCICIOS

A.4.7. Considere h : M N Rm+n definida por h(x, y) = x y. Esta aplicaca


o
e C.
Pelo teorema de Sard (Teorema A.4.5), o complementar do conjunto dos valores n
ao regulares
tem volume zero em Rm+n . Agora basta observar que se v Rm+n
e valor regular ent
ao
M +v
e transversal a N .
A.4.8. Considere cartas locais : U X , x 7 (x) de M e : TU M X Rd ,
(x, v) 7 ( , D (x)v) de T M . Note que D1
e a projeca
o can
onica X Rd X ,

a qual
e infinitamente diferenci
avel. Como M
e de classe C r e T M
e de classe C r1 , segue
que
e de classe C r1 .
A.5.1. Dados quaisquer x, y (a, b), considere a funca
o : [0, 1] R dada por (t) = (tx +
(1 t)y) t(x) + (1 t)(y). Verifique que (0) = (1) = 0 e 0. Conclua que (t) 0
para todo t. Para provar a segunda parte, fixe a < < x < < b. Seja f (t) = (x) + m(t x)
a funca
o afim cujo gr
afico passa por (s, (s)) e (x, (x)) e seja g(t) = (x) + n(x t) a funca
o
afim cujo gr
afico passa por (x, (x)) e (t, (t)). Por convexidade, f (t) (t) g(t) para
t > x e g(t) (t) f (t) para t < x. Logo
e contnua no ponto x.

A.5.2. (a) Use o fato de


o exponencial
e convexa. (b) A partir da desigualdade
R que a funca
de Young, mostre que |f g| d 1 sempre que kf kp = kgkq = 1. Deduza o caso geral da
desigualdade de H
older. (c) Comece por notar que |f + g|p |f ||f + g|p1 + |g||f + g|p1 .
Aplique a desigualdade de H
older a cada uma das parcelas do lado direito desta desigualdade
para obter a desigualdade Minkowski.
A.5.3. Usando a desigualdade de H
older mostre que kf kp (X)(1/p)(1/q) kf kq sempre
que 1 p < q < . Mostre que esta desigualdade ainda vale quando q = : kf kp
(X)(1/p) kf k . Portanto Lp () Lq () para todo 1 p < q .

A.5.4. A menos
de substituir f por f /kf k , podemos supor que kf k R = 1. Ent
ao
R
R
|f |n+1 d |f |n d para todo n. Considere < < 1 e n 1. Escrevendo |f n | d como
soma das integrais
sobreR os domnios X = {|f | }, Y, = { |f | < } e Z = {|f | < },
R
mostre que |f n | d/ X |f |n d 1 + (Y, )/(X ) + (/)n (Z )/(X ). Tome

pr
oximo de e em seguida tome n grande, de tal forma que a express
ao do lado direito da
desigualdade seja menor que 1 + (1 ). Deste modo,
R
R n+1
n+1 | d
|f
| d
X |f

R
1 R n
n | d 1 + (1 )
2

|f | d
|f
X

para todo < 1 e todo n suficientemente grande.

A.5.5. (i) k kp
e uma norma. A u
nica parte interessante
e a desigualdade triangular:
para 1 p < ela
e dada pelo Teorema A.5.3; para p = ela segue imediatamente
P de
|f + g| |f | + |g|. (ii) Crit
erio de complitude.
Suponha que o espaco
e completo. Se
k vk
Pn

e absolutamente som
avel ent
ao sn = k=1 vk
e sequ
encia de Cauchy e, portanto, converge.
Reciprocamente, se (sn )n
e sequ
encia de Cauchy, existe (nk )kP tal que ksm sn k 2k
erie k vk
e absolutamente som
avel,
para quaisquer m, n nk . Defina vk = snk+1 snk . A s
logo convergente. Isto quer dizer que a subsequ
encia (snk )k converge. Conclua, usando o
fato de que toda sequ
encia de Cauchy que admite
encia convergente

e convergente.
P subsequ
P
(iii) P
Lp ()
e completo.P
Considere qualquer s
erie k fk tal que A = k kfk kp
e finito. Seja
n
g=
k=1 |fk | e gn =
k=1 |fk |, para cada n 1. Pela desigualdade triangular, kgn kp A
para todo n. Ent
ao kgkp A: para p < use o teorema da converg
encia mon
otona;
P o caso
p =
e imediato. Em particular, g(x)
e finito e, portanto, a s
erie complexa
k=1 fk (x)

e absolutamente
som
avel, para -quase todo x. Seja f (x) o limite.PResta mostrar
que f
P
P
n
m
n
p
p
L
k=1 fk congerve para f em L (). Dado > 0, temos k
k=1 fk
k=1 fk kp
P () e
k>n kfk kp para
P m > n e todo n suficientemente. Passando ao limite quando m ,
obtemos que kf n
encia; o caso p =
k=1 fk kp : para p < use o teorema da converg

e, mais uma vez, imediato. Em particular, kf kp < .


A.5.6. (Rudin [Rud87, Teorema 6.16]) Note que (g) Lp () e k(g)k kgkq : para
claro que
q < isso segue da desigualdade de H
older; o caso q =
e imediato. E

e linear. Para ver que


e injetivo, dada g tal que (g) = 0,R considere uma funca
o com
valores no crculo unit
ario tal que g = |g|. Ent
ao (g) = |g| d = 0, logo g = 0. Resta
mostrar que para todo Lp () existe g Lq () tal que = (g) e kgkq = kk. Para

521
cada conjunto mensur
avel B M , defina (B) = (XB ). Verifique que
e uma medida
complexa (para provar -aditividade precisar
a usar p < ) Re observe que . Considere a
B; conclua que
derivadaR de Rad
on-Nikodym g = (d/d). Ent
ao (XB ) = B g d para todo
R
(f ) = f g d para toda f L (). No caso p = 1 esta construca
o d
a | B g d| kk(B)
para todo conjunto mensur
avel. Deduza que kgk kk. Agora suponha 1 < p < . Tome
fn = XBn |g|q1 , onde Bn = {x : |g(x)| n}. Observe que fn L () e |fn |p = |g|q no
conjunto Bn e
Z
Z
Z
Z
1/p
1/p
|g|q d
.
|g|q d =
fn g d = (fn ) kk
|fn |p d
kk
Bn

Bn

|g|q

kkq

R
d
para todo n e, portanto, kgkq kk. Finalmente, (f ) = f g d
Isto d
a Bn
para todo f Lp (), pois os dois lados da igualdade s
ao funcionais contnuos que coincidem
no subconjunto denso L .
R

A.5.7. Use o Exerccio A.3.5 e o teorema da converg


encia dominada.
A.5.8. Lembre do Exemplo A.5.9.
A.6.1. (1) Verifique que ktx + (1 t)yk2 max{kxk2 , kyk2 } para quaisquer x, y H e
t [0, 1]. Deduza que toda bola, fechada ou aberta
e convexa. (2) Por definica
o, kv wk2 =
kvk2 (v w + w v) + 2kwk2 . (3) An
alogo a (2).
P
P
A.6.2. Suponha que v = v e v = v , ou seja, para todo > 0 existem conjuntos
P
P
finitos I e I tais que kv J v k < para todo conjunto finito J I e kv J v k <
P
para todo conjunto finito J I . Ent
ao k(v + v ) J (v + v )k < 2 para todo conjunto
finito J I I .

A.6.3. Se L
e contnuo na origem, dado > 0 existe > 0 tal que kvk implica kL(v)k .
Segue que kL(v)k (/)kvk para todo v. Portanto, L
e limitado. Reciprocamente,
e claro
que se L
e limitado ent
ao L
e contnuo na origem. Deduza que
e contnuo em todo ponto.
R
A.6.4. Observe que V
e o Respaco das funco
es f tais que f d = 0. Conclua que PH :
2
L H
e dada por PH (g) = g d.
A.6.5. Por definica
o, u Lv = L u v e u L v = (L ) u v para quaisquer u e v. Logo
v (L ) u = L v u para quaisquer u e v. Invertendo os pap
eis de u e v, vemos que L = (L ) .
Note que kL u vk kLk kuk kvk para todo u e v. Tomando v = L u, segue que kL uk
kLk kuk para todo u, logo kL k kLk. Como L = (L ) , segue que kLk kL , logo as
duas normas coincidem. Como a norma de operador
e submultiplicativa, kL Lk kLk2 . Por
outro lado, u L Lu = kLuk2 e, portanto, kL Lk kuk2 kLuk2 , para todo u. Deduza que
kL Lk kLk2 e, portanto, as duas express
oes coincidem. Analogamente, kLL k = kLk2 .

A.6.6. Podemos supor z = 0. Deduza da igualdade do paralelogramo (Exerccio A.6.1) que


2(kxk2 + kyk2 ) = kx + yk2 + kx yk2 4d(z, K)2 + kx yk2 , para quaisquer x, y K.
Considere (vn )n em K tal que d(z, vn ) d(z, K). Conclua da desigualdade anterior que
(vn )n
e sequ
encia de Cauchy. Tome v = limn vn . Para provar a unicidade: se v
e outro
ponto minimizador, 4d(z, K)2 = 2(kvk2 + kv k2 ) 4d(z, K)2 + kv v k2 e, portanto, v = v .
A.6.7. A continuidade do produto interno d
a que S = S e este subespaco
e fechado. Dado
v H, seja s o elemento de S mais pr
oximo de v (Exerccio A.6.6) e seja s = v s. Verifique
imediato da
que s S . A unicidade da decomposica
o
e consequ
encia de S S = {0}. E
definica
o e das observaco
es anteriores que S (S ) = (S ) . Para a recproca, considere
qualquer v (S ) e analise a respectiva decomposica
o v = s + s .

A.6.8. Suponha que v H e (un )n


e uma sequ
encia em E tal que un v u v para todo
v H. Considerando v E , conclua que v (E ) . Pelo Exerccio A.6.7, segue que
u E. Portanto E
e fechado na topologia fraca. Agora considere qualquer sequ
encia (vn )n
em U (E) convergindo para algum v H. Para cada n, tome un = h1 (vn ) E. Como
h
e uma isometria, kum un k = kvm vn k para quaisquer m, n. Segue que (un )n
e uma
sequ
encia de Cauchy em E e, portanto, admite limite u E. Logo, v = h(u) est
a em U (E).

A.6.9. Observe que L


e isometria se, e somente se, preserva o produto interno: L L = id
L Lu v = u v u, v Lu Lv = u v u, v. Ent
ao L preserva a norma. Reciprocamente,
a identidade de polarizaca
o (Exerccio A.6.1) implica que se L preserva a norma ent
ao L

522

DICAS E SOLUC
OES
DOS EXERCICIOS

claro da definica
preserva o produto interno. E
o que se L
e unit
ario ent
ao L
e isometria e
L1 = L . Reciprocamente, suponha que L L = id e L
e invertvel. Ent
ao LL L(u) = L(u)
para todo u e, como L
e sobrejetivo, isto implica que LL = id .
A.7.1. A inversa de T + H est
a dada pela equaca
o (T + H)(T 1 + J) = id , a qual pode
ser reescrita como uma equaca
o de ponto fixo J = L1 HL1 + L1 HJ. Use a hip
otese
para mostrar que esta equaca
o admite uma (
unica) soluca
o. Logo T + H
e um isomorfismo.
Deduza que L id sempre que > kLk. Portanto, o espectro de L est
a contido no disco
de raio kLk. Tamb
em segue da observaca
o anterior que se L id
e um isomorfismo ent
ao o
mesmo vale para L id se est
a suficientemente pr
oximo de .

A.7.2. Como dim ker L + dim L(H) = dim H, o operador L


e injetivo se, e somente se,
e
2
sobretivo e, nesse caso. Al
em disso, L
e necessariamente contnuo.
P Seja 2 o espaco das
sequ
encias x = (xn )nN de n
umeros complexos tais que kxk =
e finita e seja
n |xn |
L : 2 2 o deslocamento L((xn )n ) = (xn+1 )n . Verifique que L
e um operador unit
ario, o
conjunto dos autovalores
e o disco aberto e o espectro de L
e o disco fechado.
A.7.3. (1) Aditividade implica E() = 0. O complementar de supp E est
a coberto por uma
famlia enumer
avel de conjuntos com medida nula. Logo E((supp E)c ) = 0 e, por aditividade, E(supp E) = id . (2) Se A B ent
ao E(B \ A) = E(B) E(A), por aditividade.
Consequentemente,
E(B \ A) = E(B) E(B)E(A) E(A)E(B) + E(A)

2E(A) = E(A)E(B)E(A) + E(A)E(B)
2E(A) = E(B)E(A) + E(A)E(B))
2E(A) = E(B)E(A) + E(A)E(B)E(A).
Segue que E(A)E(B) = E(B)E(A). Substituindo esta conclus
ao com a igualdade no meio,
vem que E(A) = E(A)E(B),
ou seja, E(A)
ao disjunta

 E(B). (3) Decomponha A como uni
A B = A \ (A B) B \ (A B) A B e use a aditividade. (4) Multiplique a
identidade em (3) por (A) e use (2) para concluir que E(A)E(B) = E(A B) e, analogamente,
E(B)E(A) = E(A B).
R
A.7.4. (1) Observe que L id = (z ) dE(z) e use o Lema A.7.4. Pela propriedade
de continuidade inferior (Exerccio A.1.9), E({}) = limn E({z : |z | 1/n}). Segue
que E({})v = v. (2) Segue do Exerccio A.7.3 que
E(B)E({}) = E({}) se B e
R
E(B)E({}) = E() = 0 caso contr
ario. Como L = z dE(z), vem que Lv = E({})v = v.

A.7.5. Lembre do Exemplo A.7.7. A medida espectral de T est


a dada por ET (B)(j,l )j,l =
(XB j,l )j,l . Logo ET (B) = 0 se, e somente se, j (B) = 0 para todo j. Ent
ao o mesmo vale
para a medida espectral de L, dada por E(B) = U 1 ET (B)U .

Bibliografia
[Aar97]

J. Aaronson. An introduction to infinite ergodic theory, volume 50 of Mathematical


Surveys and Monographs. American Mathematical Society, 1997.

[AB]

A. Avila and J. Bochi. Proof of the subadditive ergodic theorem.


www.mat.puc-rio.br/jairo/.

[AF07]

A. Avila and G. Forni. Weak mixing for interval exchange transformations and
translation flows. Ann. of Math., 165:637664, 2007.

Preprint

[AKM65] R. Adler, A. Konheim, and M. McAndrew. Topological entropy. Trans. Amer.


Math. Soc., 114:309319, 1965.
[AKN06] V. Arnold, V. Kozlov, and A. Neishtadt. Mathematical aspects of classical and
celestial mechanics, volume 3 of Encyclopaedia of Mathematical Sciences. SpringerVerlag, third edition, 2006. [Dynamical systems. III], Translated from the Russian
original by E. Khukhro.
[Ano67]

D. V. Anosov. Geodesic flows on closed Riemannian manifolds of negative curvature. Proc. Steklov Math. Inst., 90:1235, 1967.

[Arn78]

V. I. Arnold. Mathematical methods of classical mechanics. Springer Verlag, 1978.

[AS67]

D. V. Anosov and Ya. G. Sinai. Certain smooth ergodic systems. Russian Math.
Surveys, 22:103167, 1967.

[Bal00]

V. Baladi. Positive transfer operators and decay of correlations. World Scientific


Publishing Co. Inc., 2000.

[BDV05] C. Bonatti, L. J. Daz, and M. Viana. Dynamics beyond uniform hyperbolicity,


volume 102 of Encyclopaedia of Mathematical Sciences. Springer-Verlag, 2005.
[Bil68]

P. Billingsley. Convergence of probability measures. John Wiley & Sons Inc., New
York, 1968.

[Bil71]

P. Billingsley. Weak convergence of measures: Applications in probability. Society


for Industrial and Applied Mathematics, 1971. Conference Board of the Mathematical Sciences Regional Conference Series in Applied Mathematics, No. 5.

[Bir13]

G. D. Birkhoff. Proof of Poincar


es last Geometric Theorem. Trans. Amer. Math.
Soc., 14:1422, 1913.

[Bir67]

G. Birkhoff. Lattice theory, volume 25. A.M.S. Colloq. Publ., 1967.

[BK83]

M. Brin and A. Katok. On local entropy. In Geometric dynamics (Rio de Janeiro,


1981), volume 1007 of Lecture Notes in Math., pages 3038. Springer, 1983.

[Bos86]

J.-B. Bost. Tores invariants des syst`


emes hamiltoniens. Ast
erisque, 133134:113
157, 1986.

[Bos93]

M. Boshernitzan. Quantitative recurrence results. Invent. Math., 113(3):617631,


1993.

[Bow71]

R. Bowen. Entropy for group endomorphisms and homogeneous spaces. Trans.


Amer. Math. Soc., 153:401414, 1971.

523

524
[Bow72]

BIBLIOGRAFIA
R. Bowen. Entropy expansive maps. Trans. Am. Math. Soc., 164:323331, 1972.

[Bow75a] R. Bowen. Equilibrium states and the ergodic theory of Anosov diffeomorphisms,
volume 470 of Lect. Notes in Math. Springer Verlag, 1975.
[Bow75b] R. Bowen. A horseshoe with positive measure. Invent. Math., 29:203204, 1975.
[Bow78]

R. Bowen. Entropy and the fundamental group. In The Structure of Attractors in


Dynamical Systems, volume 668 of Lecture Notes in Math., pages 2129. SpringerVerlag, 1978.

[BS00]

L. Barreira and J. Schmeling. Sets of non-typical points have full topological


entropy and full Hausdorff dimension. Israel J. Math., 116:2970, 2000.

[Cas04]

A. A. Castro. Teoria da medida. Projeto Euclides. IMPA, 2004.

[Cla72]

J. Clark. A Kolmogorov shift with no roots. ProQuest LLC, Ann Arbor, MI, 1972.
Thesis (Ph.D.)Stanford University.

[dC79]

M. do Carmo. Geometria riemanniana, volume 10 of Projeto Euclides. Instituto


de Matem
atica Pura e Aplicada, 1979.

[Dei85]

K. Deimling. Nonlinear functional analysis. Springer Verlag, 1985.

[Din70]

E. Dinaburg. A correlation between topological entropy and metric entropy. Dokl.


Akad. Nauk SSSR, 190:1922, 1970.

[Din71]

E. Dinaburg. A connection between various entropy characterizations of dynamical


systems. Izv. Akad. Nauk SSSR Ser. Mat., 35:324366, 1971.

[dlL93]

R. de la Llave. Introduction to K.A.M. theory. In Computational physics


(Almu
n
ecar, 1992), pages 73105. World Sci. Publ., 1993.

[DS57]

N. Dunford and J. Schwarz. Linear operators I: General theory. Wiley & Sons,
1957.

[DS63]

N. Dunford and J. Schwarz. Linear operators II: Spectral theory. Wiley & Sons,
1963.

[Dug66]

J. Dugundji. Topology. Allyn and Bacon Inc., 1966.

[Edw79]

R. E. Edwards. Fourier series. A modern introduction. Vol. 1, volume 64 of Graduate Texts in Mathematics. Springer-Verlag, second edition, 1979.

[ET36]

P. Erd
os and P. Tur
an. On some sequences of integers. J. London. Math. Soc.,
11:261264, 1936.

[Fal90]

K. Falconer. Fractal geometry. John Wiley & Sons Ltd., 1990. Mathematical
foundations and applications.

[Fer02]

R. Fernandez. Introduc
ao `
a teoria da medida. Projeto Euclides. IMPA, 2002.

[FFT09]

S. Ferenczi, A. Fisher, and M. Talet. Minimality and unique ergodicity for adic
transformations. J. Anal. Math., 109:131, 2009.

[FO70]

N. Friedman and D. Ornstein. On isomorphism of weak Bernoulli transformations.


Advances in Math., 5:365394, 1970.

[Fri69]

N. Friedman. Introduction to ergodic theory. Van Nostrand, 1969.

[Fur61]

H. Furstenberg. Strict ergodicity and transformation of the torus. Amer. J. Math.,


83:573601, 1961.

[Fur77]

H. Furstenberg. Ergodic behavior and a theorem of Szemer


edi on arithmetic progressions. J. dAnalyse Math., 31:204256, 1977.

[Fur81]

H. Furstenberg. Recurrence in ergodic theory and combinatorial number theory.


Princeton Univertsity Press, 1981.

[Goo71a] T. Goodman. Relating topological entropy and measure entropy. Bull. London
Math. Soc., 3:176180, 1971.
[Goo71b] G. Goodwin. Optimal input signals for nonlinear-system identification. Proc. Inst.
Elec. Engrs., 118:922926, 1971.

BIBLIOGRAFIA

525

[GT08]

B. Green and T. Tao. The primes contain arbitrarily long arithmetic progressions.
Ann. of Math., 167:481547, 2008.

[Gur61]

B. M. Gurevi
c. The entropy of horocycle flows. Dokl. Akad. Nauk SSSR, 136:768
770, 1961.

[Hal50]

P. Halmos. Measure Theory. D. Van Nostrand Company, 1950.

[Hal51]

P. Halmos. Introduction to Hilbert Space and the theory of Spectral Multiplicity.


Chelsea Publishing Company, New York, 1951.

[Hay]

N. Haydn. Multiple measures of maximal entropy and equilibrium states for onesimensional subshifts. Preprint Penn State University.

[Hir94]

M. Hirsch. Differential topology, volume 33 of Graduate Texts in Mathematics.


Springer-Verlag, 1994. Corrected reprint of the 1976 original.

[Hof77]

F. Hofbauer. Examples for the nonuniqueness of the equilibrium state. Trans.


Amer. Math. Soc., 228:223241, 1977.

[Hop39]

E. Hopf.
Statistik der geod
atischen Linien in Mannigfaltigkeiten negativer
Kr
ummung. Ber. Verh. S
achs. Akad. Wiss. Leipzig, 91:261304, 1939.

[HvN42]

P. Halmos and J. von Neumann. Operator methods in classical mechanics. II. Ann.
of Math., 43:332350, 1942.

[Jac60]

K. Jacobs. Neuere Methoden und Ergebnisse der Ergodentheorie. Ergebnisse der


Mathematik und ihrer Grenzgebiete. N. F., Heft 29. Springer-Verlag, 1960.

[Jac63]

K. Jacobs. Lecture notes on ergodic theory, 1962/63. Parts I, II. Matematisk


Institut, Aarhus Universitet, Aarhus, 1963.

[Kal82]

S. Kalikow. T, T 1 transformation is not loosely Bernoulli. Ann. of Math., 115:393


409, 1982.

[Kat71]

Yi. Katznelson. Ergodic automorphisms of T n are Bernoulli shifts. Israel J. Math.,


10:186195, 1971.

[Kat80]

A. Katok. Lyapunov exponents, entropy and periodic points of diffeomorphisms.


Publ. Math. IHES, 51:137173, 1980.

[Kea75]

M. Keane. Interval exchange transformations. Math. Zeit., 141:2531, 1975.

[KH95]

A. Katok and B. Hasselblatt. Introduction to the modern theory of dynamical systems, volume 54 of Encyclopedia of Mathematics and its Applications. Cambridge
University Press, 1995. With a supplementary chapter by Katok and Leonardo
Mendoza.

[KM10]

S. Kalikow and R. McCutcheon. An outline of ergodic theory, volume 122 of Cambridge Studies in Advanced Mathematics. Cambridge University Press, 2010.

[Kok35]

J. F. Koksma. Ein mengentheoretischer Satz u


ber die Gleichverteilung modulo
Eins. Compositio Math., 2:250258, 1935.

[KR80]

M. Keane and G. Rauzy. Stricte ergodicit


e des
echanges dintervalles. Math. Zeit.,
174:203212, 1980.

[Kri70]

W. Krieger. On entropy and generators of measure-preserving transformations.


Trans. Amer. Math. Soc., 149:453464, 1970.

[Kri75]

W. Krieger. On the uniqueness of the equilibrium state. Math. Systems Theory,


8:97104, 1974/75.

[KSS91]

A. Kr
amli, N. Sim
anyi, and D. Sz
asz. The K-property of three billiard balls. Ann.
of Math., 133:3772, 1991.

[KSS92]

A. Kr
amli, N. Sim
anyi, and D. Sz
asz. The K-property of four billiard balls. Comm.
Math. Phys., 144:107148, 1992.

[KW82]

Y. Katznelson and B. Weiss. A simple proof of some ergodic theorems. Israel J.


Math., 42:291296, 1982.

526

BIBLIOGRAFIA

[Led84]

F. Ledrappier. Propri
et
es ergodiques des mesures de Sina. Publ. Math. I.H.E.S.,
59:163188, 1984.

[Lin77]

D. Lind. The structure of skew products with ergodic group actions. Israel J.
Math., 28:205248, 1977.

[LVY]

G. Liao, M. Viana, and J. Yang. Entropy conjecture for diffeomorphisms away from
tangencies. J. European Math. Soc.

[LY85]

F. Ledrappier and L.-S. Young. The metric entropy of diffeomorphisms. I. Characterization of measures satisfying Pesins entropy formula. Ann. of Math., 122:509539,
1985.

[Man75]

A. Manning. Topological entropy and the first homology group. In Dynamical


Systems, Warwick, 1974, volume 468 of Lecture Notes in Math., pages 185190.
Springer-Verlag, 1975.

[Ma
n81]

R. Ma
n
e. A proof of Pesins formula. Ergod. Th. & Dynam. Sys., 1:95101, 1981.

[Ma
n85]

R. Ma
n
e. Hyperbolicity, sinks and measure in one-dimensional dynamics. Comm.
Math. Phys., 100:495524, 1985.

[Ma
n87]

R. Ma
n
e. Ergodic theory and differentiable dynamics. Springer Verlag, 1987.

[Mas82]

H. Masur. Interval exchange transformations and measured foliations. Ann. of


Math, 115:169200, 1982.

[Mey00]

C. Meyer. Matrix analysis and applied linear algebra. Society for Industrial and
Applied Mathematics (SIAM), 2000.

[Mis76]

N action on a
M. Misiurewicz. A short proof of the variational principle for a Z+
compact space. Asterisque, 40:147187, 1976.

[MP77a]

M. Misiurewicz and F. Przytycki. Entropy conjecture for tori. Bull. Pol. Acad. Sci.
Math., 25:575578, 1977.

[MP77b] M. Misiurewicz and F. Przytycki. Topological entropy and degree of smooth mappings. Bull. Pol. Acad. Sci. Math., 25:573574, 1977.
[MP08]

W. Marzantowicz and F. Przytycki. Estimates of the topological entropy from


below for continuous self-maps on some compact manifolds. Discrete Contin. Dyn.
Syst. Ser., 21:501512, 2008.

[MT78]

G. Miles and R. Thomas. Generalized torus automorphisms are Bernoullian. Advances in Math. Supplementary Studies, 2:231249, 1978.

[New88]

S. Newhouse. Entropy and volume. Ergodic Theory Dynam. Systems, 8 (Charles


Conley Memorial Issue):283299, 1988.

[NP66]

D. Newton and W. Parry. On a factor automorphism of a normal dynamical system.


Ann. Math. Statist, 37:15281533, 1966.

[NR97]

A. Nogueira and D. Rudolph. Topological weak-mixing of interval exchange maps.


Ergod. Th. & Dynam. Sys., 17:11831209, 1997.

[Orn60]

D. Ornstein. On invariant measures. Bull. Amer. Math. Soc., 66:297300, 1960.

[Orn70]

D. Ornstein. Bernoulli shifts with the same entropy are isomorphic. Advances in
Math., 4:337352 (1970), 1970.

[Orn72]

Donald S. Ornstein. On the root problem in ergodic theory. In Proceedings of


the Sixth Berkeley Symposium on Mathematical Statistics and Probability (Univ.
California, Berkeley, Calif., 1970/1971), Vol. II: Probability theory, pages 347
356. Univ. California Press, 1972.

[Orn74]

D. Ornstein. Ergodic theory, randomness, and dynamical systems. Yale University Press, 1974. James K. Whittemore Lectures in Mathematics given at Yale
University, Yale Mathematical Monographs, No. 5.

[OS73]

D. Ornstein and P. Shields. An uncountable family of K-automorphisms. Advances


in Math., 10:6388, 1973.

BIBLIOGRAFIA

527

[OU41]

J. C. Oxtoby and S. M. Ulam. Measure-preserving homeomorphisms and metrical


transitivity. Ann. of Math., 42:874920, 1941.

[Par53]

O. S. Parasyuk. Flows of horocycles on surfaces of constant negative curvature.


Uspehi Matem. Nauk (N.S.), 8:125126, 1953.

[Pes77]

Ya. B. Pesin. Characteristic Lyapunov exponents and smooth ergodic theory. Russian Math. Surveys, 324:55114, 1977.

[Pes97]

Ya. Pesin. Dimension theory in dynamical systems. University of Chicago Press,


1997. Contemporary views and applications.

[Pet83]

K. Petersen. Ergodic theory. Cambridge Univ. Press, 1983.

[Phe93]

R. Phelps. Convex functions, monotone operators and differentiability, volume


1364 of Lecture Notes in Mathematics. Springer-Verlag, second edition, 1993.

[Pin60]

M. S. Pinsker. Informatsiya i informatsionnaya ustoichivostsluchainykh velichin i


protsessov. Problemy Pereda
ci Informacii, Vyp. 7. Izdat. Akad. Nauk SSSR, 1960.

[PT93]

J. Palis and F. Takens. Hyperbolicity and sensitive-chaotic dynamics at homoclinic


bifurcations. Cambridge University Press, 1993.

[PU10]

F. Przytycki and M. Urba


nski. Conformal fractals: ergodic theory methods, volume
371 of London Mathematical Society Lecture Note Series. Cambridge University
Press, 2010.

[PW72a] W. Parry and P. Walters. Errata: Endomorphisms of a Lebesgue space. Bull.


Amer. Math. Soc., 78:628, 1972.
[PW72b] W. Parry and P. Waltersr. Endomorphisms of a Lebesgue space. Bull. Amer. Math.
Soc., 78:272276, 1972.
[PY98]

M. Pollicott and M. Yuri. Dynamical systems and ergodic theory, volume 40 of


London Mathematical Society Student Texts. Cambridge University Press, 1998.

[Que87]

M. Queff
elec. Substitution dynamical systemsspectral analysis, volume 1294 of
Lecture Notes in Mathematics. Springer-Verlag, 1987.

[Rok61]

V. A. Rokhlin. Exact endomorphisms of a Lebesgue space. Izv. Akad. Nauk SSSR


Ser. Mat., 25:499530, 1961.

[Rok62]

V. A. Rokhlin. On the fundamental ideas of measure theory. A. M. S. Transl.,


10:154, 1962. Transl. from Mat. Sbornik 25 (1949), 107150. First published by
the A. M. S. in 1952 as Translation Number 71.

[Rok67a] V. A. Rokhlin. Lectures on the entropy theory of measure-preserving transformations. Russ. Math. Surveys, 22 -5:152, 1967. Transl. from Uspekhi Mat. Nauk. 22
- 5 (1967), 356.
[Rok67b] V. A. Rokhlin. Metric properties of endomorphisms of compact commuitative
groups. Amer. Math. Soc. Transl., 64:244252, 1967.
[Roy63]

H. L. Royden. Real analysis. The Macmillan Co., 1963.

[RS61]

V. A. Rokhlin and Ja. G. Sina. The structure and properties of invariant measurable partitions. Dokl. Akad. Nauk SSSR, 141:10381041, 1961.

[Rud87]

W. Rudin. Real and complex analysis. McGraw-Hill, 3 edition, 1987.

[Rue73]

D. Ruelle. Statistical Mechanics on a compact set with Z action satisfying expansiveness and specification. Trans. Amer. Math. Soc., 186:237251, 1973.

[Rue04]

D. Ruelle. Thermodynamic formalism. Cambridge Mathematical Library. Cambridge University Press, second edition, 2004. The mathematical structures of
equilibrium statistical mechanics.

[RY80]

C. Robinson and L. S. Young. Nonabsolutely continuous foliations for an Anosov


diffeomorphism. Invent. Math., 61:159176, 1980.

528

BIBLIOGRAFIA

[SC87]

Ya. Sina and Nikolay Chernov. Ergodic properties of some systems of twodimensional disks and three-dimensional balls. Uspekhi Mat. Nauk, 42:153174,
256, 1987.

[Shu69]

M. Shub. Endomorphisms of compact differentiable manifolds. Amer. Journal of


Math., 91:129155, 1969.

[Shu74]

M. Shub. Dynamical systems, filtrations and entropy. Bull. Amer. Math. Soc.,
80:2741, 1974.

[Sim02]

N. Sim
anyi. The complete hyperbolicity of cylindric billiards. Ergodic Theory
Dynam. Systems, 22:281302, 2002.

[Sin63]

Ya. Sina. On the foundations of the ergodic hypothesis for a dynamical system of
Statistical Mechanics. Soviet. Math. Dokl., 4:18181822, 1963.

[Sin70]

Ya. Sina. Dynamical systems with elastic reflections. Ergodic properties of dispersing billiards. Uspehi Mat. Nauk, 25:141192, 1970.

[Ste58]

E. Sternberg. On the structure of local homeomorphisms of Euclidean n-space - II.


Amer. J. Math., 80:623631, 1958.

[SW75]

M. Shub and R. Williams. Entropy and stability. Topology, 14:329338, 1975.

[SX10]

R. Saghin and Z. Xia. The entropy conjecture for partially hyperbolic diffeomorphisms with 1-D center. Topology Appl., 157:2934, 2010.

[Sze75]

S. Szemer
edi. On sets of integers containing no k elements in arithmetic progression.
Acta Arith., 27:199245, 1975.

[vdW27]

B. van der Waerden. Beweis eibe Baudetschen Vermutung. Nieuw Arch. Wisk.,
15:212216, 1927.

[Vee82]

W. Veech. Gauss measures for transformations on the space of interval exchange


maps. Ann. of Math., 115:201242, 1982.

[Ver99]

Alberto Verjovsky. Sistemas de Anosov, volume 9 of Monographs of the Institute


of Mathematics and Related Sciences. Instituto de Matem
atica y Ciencias Afines,
IMCA, Lima, 1999.

[Wal73]

P. Walters. Some results on the classification of non-invertible measure preserving


transformations. In Recent advances in topological dynamics (Proc. Conf. Topological Dynamics, Yale Univ., New Haven, Conn., 1972; in honor of Gustav Arnold
Hedlund), pages 266276. Lecture Notes in Math., Vol. 318. Springer, 1973.

[Wal75]

P. Walters. A variational principle for the pressure of continuous transformations.


Amer. J. Math., 97:937971, 1975.

[Wal82]

P. Walters. An introduction to ergodic theory. Springer Verlag, 1982.

[Wey16]

H. Weyl. Uber die Gleichverteilungen von Zahlen mod Eins. Math. Ann., 77:313
352, 1916.

[Yoc92]

J.-C. Yoccoz. Travaux de Herman sur les tores invariants. Ast


erisque, 206:Exp.
No. 754, 4, 311344, 1992. S
eminaire Bourbaki, Vol. 1991/92.

[Yom87]

Y. Yomdin. Volume growth and entropy. Israel J. Math., 57:285300, 1987.

[Yos68]

K. Yosida. Functional analysis. Second edition. Die Grundlehren der mathematischen Wissenschaften, Band 123. Springer-Verlag, 1968.

[Yuz68]

S. A. Yuzvinskii. Metric properties of endomorphisms of compact groups. Amer.


Math. Soc. Transl., 66:6398, 1968.

[Zyg68]

A. Zygmund. Trigonometric series: Vols. I, II. Second edition, reprinted with


corrections and some additions. Cambridge University Press, 1968.

Indice
2X
famlia de todos os subconjuntos, 426
AB
diferenca sim
etrica de conjuntos, 430
B(x, T, )
bola din
amica de um fluxo, 317
B(x, , )
bola din
amica infinita, 324
B(x, n, )
bola din
amica, 266
B(x, r)
bola de centro x e raio r, 448
B
-vizinhanca de um conjunto, 36, 518
C
cone dual, 51
C 0 (M )
espaco das funco
es contnuas, 50, 431,
452
0 (M )
C+
cone das funco
es positivas, 51
C (M )
espaco de funco
es H
older, 410
C r (M, N )
espaco das aplicaco
es C r , 456
Cn (, )
sequ
encia de correlaco
es, 184
Di
densidade inferior, 58
Ds
densidade superior, 58
Df
aplicaca
o derivada, 457
E(A, P )
esperanca condicional, 153
E
dual de um espaco de Banach, 49
G(f, )
press
ao via conjuntos geradores, 327
H()
entropia de uma cobertura, 302
H (g)
constante de H
older, 397
H (P)
entropia de uma partica
o, 250

H (P/Q)
entropia condicional, 252
H, (g)
constante de H
older local, 397
I(U )
conjunto dos vetores invariantes, 67
I(A)
informaca
o m
edia de um alfabeto, 249
I(a)
quantidade de informaca
o de um caracter, 249
IP
funca
o de informaca
o de uma partica
o,
250
L ()
espaco das funco
es essencialmente limitadas, 463
Lp ()
espaco das funco
es p-integr
aveis, 462
P (f, )
press
ao, 325
P (f, , )
press
ao com respeito a uma cobertura,
324
P (x, )
probabilidade de transica
o, 193
Pi,j
probabilidade de transica
o, 193
R
rotaca
o no crculo ou no toro, 16
S(f, )
press
ao via conjuntos separados, 327
S1
crculo, 16
S
complemento ortogonal, 467
Sd
esfera de dimens
ao d, 455
Sn
soma orbital de uma funca
o, 376
TM
fibrado tangente, 457
T 1M
fibrado tangente unit
ario, 460
Tp M

529

INDICE

530
espaco tangente a uma variedade, 457
Uf
operador de Koopman, 50, 51
Uf
dual do operador de Koopman, 51
V (, , )
base de vizinhancas da topologia fraca ,
36
V (v, {g1 , . . . , gN }, )
base de vizinhancas da topologia fraca,
49
V (g, {v1 , . . . , vN }, )
base de vizinhancas da topologia fraca ,
49
Va (, A, )
base de vizinhancas da topologia fraca ,
37
Vc (, B, )
base de vizinhancas da topologia fraca ,
37
Vf (, F , )
base de vizinhancas da topologia fraca ,
37
Vp (, B, )
base de vizinhancas da topologia pontual, 44
Vu (, )
base de vizinhancas da topologia uniforme, 44
XB
funca
o caracterstica de conjunto, 435
Difeor (M )
espaco dos difeomorfismos C r , 456
Fix(f )
conjunto dos pontos fixos, 313
GL(d, R)
grupo linear, 166, 458
O(d, R)
grupo ortogonal, 166
SL(d, R)
grupo linear especial, 166, 458
A
deslocamento de tipo finito, 314
P
deslocamento de tipo finito, 195

soma de coberturas, 302

cobertura menos fina, 302


n
iterado unilateral de uma cobertura, 309
n
iterado bilateral de uma cobertura, 309
L1 ()
espaco das funco
es integr
aveis, 440
M(X)
espaco das medidas, 50, 431

M1 (M )
espaco das medidas de probabilidade, 36
M1 (f )
espaco das medidas invariantes de probabilidade, 118
Me (f )
espaco das medidas erg
odicas de probabilidade, 118
PQ
partica
o menos fina, 252
PQ
soma de partico
es, 250
Pn
iterado de uma partica
o, 254
P n
iterado bilateral de uma partica
o, 257
U r (f, )
vizinhanca C r , 456
p
medida de Dirac, 47
div F
divergente de um campo de vetores, 20
= ( )
vetor de translaco
es, 204
max
expoente de Lyapunov m
aximo, 85
min
expoente de Lyapunov mnimo, 85

medidas mutuamente singulares, 445

relaca
o de continuidade absoluta, 445
GL(d)
grupo das matrizes invertveis de dimens
ao d, 79
I
extremo inferior de intervalo, 205
P
bordo de uma partica
o, 263
Pd
espaco projetivo, 461
(B)
raio espectral, 316
esp(L)
espectro de um operador linear, 469
supess
supremo essencial, 463
supp
suporte de uma medida, 434, 470
tanh
tangente hiperb
olica, 402
(E, x)
tempo m
edio de visita, 65
(g1 , g2 )
dist
ancia projetiva, 399

m
edia temporal de uma funca
o, 72

INDICE
Td
toro de dimens
ao d, 18, 455
+
parte positiva de uma funca
o, 440

parte negativa de uma funca


o, 440
U
-
algebra gerada, 281
d(M )
dimens
ao de Hausdorff, 413
e(, x)
esperanca condicional, 151
f
imagem de uma medida, 44, 50
fA
endomorfismo linear, 112
g()
entropia topol
ogica de fluxos via conjuntos geradores, 318
g(f )
entropia topol
ogica via conjuntos geradores, 305
h(f )
entropia topol
ogica, 303
h(f, )
entropia com respeito a uma cobertura,
303
h (f, , x)
entropia local, 266
h (f )
entropia de um sistema din
amico, 255
h (f, P)
entropia com respeito a uma partica
o,
255
h (f, P, x)
entropia local, 266
md (M )
medida de Hausdorff d-dimensional, 412
s()
entropia topol
ogica de fluxos via conjuntos separados, 318
s(f )
entropia topol
ogica via conjuntos separados, 305
w = (w )
vetor de comprimentos, 204
a menos de medida nula, 430
alfabeto, 204
algebra, 426

compacta, 429
de medida, 237
-
algebra, 426
boreliana, 427
de Borel, 427
gerada, 281, 427
gerada a menos de medida nula, 430

531
produto, 105, 442, 443
aplicaca
o
conforme, 415
contnua, 435
de classe C r , 455
de primeiro retorno, 5
derivada, 457
diferenci
avel, 455
exponencial, 460
H
older, 449
Lipschitz, 449
mensur
avel, 435
atlas
de classe C r , 455
diferenci
avel, 454
atlas compatveis, 455
atomo, 452, 472

automorfismo
de Bernoulli, 277
de grupo, 166
de Kolmogorov, 281, 284
de M
obius, 411
autovalor, 221
aproximado, 225
bacia de uma medida, 101, 348
baricentro
de uma medida, 289
base
da topologia, 434
de abertos, 434
de Fourier, 466
de Hammel, 466
de Hilbert, 466
de vizinhancas, 36, 37, 434
enumer
avel de abertos, 434
enumer
avel de vizinhancas, 434
base de uma pilha, 172
bilhar, 135
canto, 135
dispersivo, 139
mesa, 135
semidispersivo, 140
bola din
amica, 266, 305
de um fluxos, 317
bordo de uma partica
o, 263
crculo, 16
unit
ario, 16
cadeia, 245
campo de vetores, 458
carta local, 455
cilindro, 443
aberto, 55
elementar, 443
mensur
avel, 54
classe mon
otona, 429

INDICE

532
cobertura, 412
aberta, 302, 429
menos fina, 302
cociclo, 85
cogumelo de Bunimovich, 140
complementar ortogonal, 67, 467
completamento de espaco de medida, 430
comprimento
de progress
ao aritm
etica, 58
de uma curva, 460
condica
o
de Keane, 205
de torca
o, 126128, 131
cone, 51, 398
dual, 51, 378
normal, 51
conjectura da entropia, 320
conjugaca
o
topol
ogica, 219, 304
conjunto
de continuidade de uma medida, 37
boreliano, 427
com volume zero, 459
convexo, 45
de Aubry -Mather, 129
de Cantor, 413
dos vetores invariantes, 67
fortemente convexo, 289
gerador, 305
gerador para fluxos, 317
invariante, 55, 96, 353
justo de medidas, 42
mensur
avel, 426
mensur
avel de Lebesgue, 241, 433, 438
minimal, 161
n
ao errante, 34
ortonormado, 466
residual, 122, 456, 459
separado, 305
separado para fluxos, 318
sind
etico, 9, 164
transitivo, 120
constante
de Avogadro, 332
de Boltzmann, 333
de expansividade, 264, 312
temporal, 87
continuidade absoluta, 116, 433, 445
contraca
o, 308
converg
encia
em L2 (), 69
em distribuica
o, 44
em quase todo ponto, 441
para equilbrio, 397
convexidade, 119, 287
coordenada local, 454
coordenadas aca
o-
angulo, 125

correlaca
o, 183
cristal reticulado, 332
curva minimizante, 460
curvatura negativa, 132
decaimento de correlaco
es, 210
decomposica
o
de Hahn, 431
de Lebesgue, 446
de Oseledets, 86
densidade
de uma medida, 349, 445
superior, 58, 61
zero no infinito, 192
derivada de Rad
on-Nikodym, 445
desigualdade
de Cauchy-Schwartz, 462
de H
older, 463, 465
de Jensen, 464
de Minkowski, 462, 465
de Tchebysheff-Markov, 446
de Young, 465
desintegraca
o de uma medida, 145
deslocamento, 60
de Bernoulli, 105, 106
de Markov, 193
de Markov erg
odico, 196
de Markov finito, 194
de Markov misturador, 199
de tipo enumer
avel, 232
de tipo finito, 195, 314
gaussiano, 235, 284
di
ametro
de uma cobertura, 309, 412
diagonal, 30
difeomorfismo, 455, 456
de class C r , 456
diferenca
ortogonal, 231
sim
etrica, 430
dimens
ao
de Hausdorff, 413
de Hilbert, 467
diofantino
n
umero, 164
vetor, 126
dist
ancia, 448
associada uma m
etrica riemanniana, 460
de Cayley-Klein, 411
de Poincar
e, 411
hiperb
olica, 411
invariante, 170
projetiva, 399
distorca
o limitada, 104, 105, 109, 110
distribuica
o de Gibbs, 333
divergente de um campo de vetores, 20
domnio

INDICE
de invertibilidade, 296
fundamental, 88
dual de um espaco de Banach, 49, 463
dualidade, 50, 211, 376, 463
endomorfismo
de grupo, 166
linear, 112
energia livre de Gibbs, 333
entropia, 332
com respeito a uma cobertura, 303
com respeito a uma partica
o, 255
condicional, 252
da transformaca
o de Gauss, 273
de um canal de comunicaca
o, 249
de um sistema din
amico, 255
de uma cobertura, 302
de uma partica
o, 250
dos deslocamentos de Markov, 272
dos endomorfismos lineares do toro, 275
local, 266
entropia topol
ogica, 301, 303, 307
de um fluxo, 318
envolvente convexa, 417
equaca
o cohomol
ogica, 162
equaco
es de Hamilton-Jacobi, 123
equival
encia
erg
odica, 186, 217, 218, 238
espectral, 217, 220, 238
ergodicidade
da expans
ao decimal, 103
da rotaca
o irracional, 102, 103
dos deslocamentos de Markov, 196
esfera de dimens
ao d, 455
espaco
compacto, 429
completamente metriz
avel, 456
conexo, 455
conexo por caminhos, 461
de Baire, 120, 122, 456, 459
de Banach, 49, 461, 466
de configuraco
es, 332
de Hausdorff, 427
de Hilbert, 466
de Hilbert separ
avel, 467
de Lebesgue, 237, 241, 243
de medida, 428
de medida completo, 430
de probabilidade, 428
n
ao trivial, 281
padr
ao, 237
dual, 467
euclideano, 455
m
etrico, 448
completo, 451
mensur
avel, 426
metriz
avel, 39, 448

533
produto, 442, 443
projetivo, 461
separ
avel, 39, 450, 453
tangente a uma variedade, 457
topol
ogico, 427
vetorial topol
ogico, 45
espacos
isometricamente isomorfos, 453, 467
especificaca
o, 369
espectro
de Lebesgue, 217, 229
de um operador linear, 469
de uma rotaca
o, 228
de uma transformaca
o, 221
discreto, 217, 227
esperanca condicional, 151, 153, 268
est
adio de Bunimovich, 140
estado
de equilbrio, 302, 332, 341
de Gibbs, 332, 346, 375
exemplo
de Chacon, 224
de Furstenberg, 162
expans
ao
de Fourier, 102, 113
em fraca
o contnua, 12
expansividade, 264
expoentes de Lyapunov, 86
extens
ao
de uma transformaca
o, 54
natural, 54, 57
natural m
ultipla, 57
f
ormula
da entropia de Pesin, 392
de Bowen-Manning, 376, 416
de Liouville, 20
de mudanca de vari
aveis, 300
de Rokhlin, 295, 297, 355
fator, 259
topol
ogico, 304, 373
fibrado tangente, 132, 457
unit
ario, 132, 460
filtraca
o de Oseledets, 85
fluxo, 2, 458
conservativo, 19
de Anosov, 133
geod
esico, 132, 460
hamiltoniano, 123
horocclico, 284
suspens
ao, 87
teorema de exist
encia de medidas invariantes, 48
teorema de recorr
encia, 5
teorema erg
odico de Birkhoff, 78
teorema erg
odico subaditivo, 86
uniformemente contnuo, 318

INDICE

534
uniformemente hiperb
olico, 132
folhas
est
aveis, 114
inst
aveis, 114
folheaca
o
est
avel, 114
inst
avel, 114
forma
de
area, 203
de volume, 20, 126
simpl
etica, 126
fraca
o contnua, 12
de tipo limitado, 118
funca
o
-aditiva, 428
p-integr
avel, 462
afim, 287
c
oncava, 464
caracterstica, 435
contnua, 435
convexa, 464
de distribuica
o, 44
de H
older, 213
de informaca
o de uma partica
o, 250
de multiplicidades, 473
entropia, 262
essencialmente limitada, 463
finitamente aditiva, 428
fortemente afim, 294
H
older, 397
integr
avel, 440
invariante, 69, 96
localmente constante, 211
localmente integr
avel, 444
quase peri
odica, 125
semicontnua, 33
simples, 436
funcional linear
contnuo, 453, 467
limitado, 467
norma, 453
positivo, 441, 453
positivo sobre um cone, 51
tangente, 53, 346
g
as
ideal, 137
reticulado, 332
gerador
bilateral, 261
unilateral, 261
grau de uma aplicaca
o, 350, 360
grupo
compacto, 169
de Lie, 165
linear, 166, 458
linear especial, 166, 458

localmente compacto, 166


metriz
avel, 169
ortogonal, 166
topol
ogico, 165
hamiltoniano, 123
n
ao degenerado, 125
hip
otese erg
odica
de Boltzmann, 65, 122
de Boltzmann-Sinai, 135
hipersuperfcie de energia, 123
homeomorfismo, 428
de tors
ao, 129
homomorfismo
de
algebras de medida, 238
identidade do paralelogramo, 468
imagem de uma medida, 44, 50
informaca
o m
edia de um alafabeto, 249
integrabilidade
uniforme, 446
integral
de Lebesgue, 440
de uma funca
o simples, 439
primeira, 22, 123
interc
ambio de intervalos, 202
redutvel, 205
intervalo
d-
adico, 495
em Z, 58
invariante de equival
encia
erg
odica, 219
espectral, 221
isometria, 308
linear, 50, 468, 469
isomorfismo
de
algebras de medida, 238
erg
odico, 218, 237, 238
iterado
de uma medida, 44, 50
de uma partica
o, 254, 257
jacobiano, 296
lacuna espectral, 211, 410
laminaca
o, 133
lema
de Borel-Cantelli, 437
de distorca
o, 350, 351
de Fatou, 442
de Kakutani-Rokhlin, 28
de Riemann-Lebesgue, 236
de Vitali, 445, 518
de Zorn, 31
do sombreamento, 361
levantamento
de um conjunto invariante, 55

INDICE
de uma medida invariante, 56
limite
inferior, 427
superior, 427
m
aquina de somar, 171
m
edia
orbital, 72
temporal, 72
m
etodo de empilhamento, 172
m
etrica
de Levy-Prohorov, 39
riemanniana, 459
matriz
de covari
ancias, 236
de transica
o, 314
estoc
astica, 194
aperi
odica, 199
irredutvel, 196
hiperb
olica, 114
positiva definida, 235
sim
etrica, 235
medida, 428
-finita, 8, 74, 428
absolutamente contnua, 118
at
omica, 452
boreliana, 448
com mem
oria finita, 201
com sinal, 50, 430
com sinal finita, 431
completa, 430
complexa, 431, 470
de Bernoulli, 193, 443
de Dirac, 47, 428
de Haar, 168
de Hausdorff, 412
de Lebesgue, 432
de Lebesgue no crculo, 16
de Liouville, 123
de m
axima entropia, 341
de Markov, 193
de probabilidade, 428
de refer
encia, 377, 378
erg
odica, 74
espectral, 470
estacion
aria, 57, 193
exterior de Lebesgue, 433
fsica, 355
finita, 428
gaussiana, 235
infinita, 7
invariante, 2, 44
justa, 451
n
ao at
omica, 452
n
ao singular, 296, 447
positiva, 430
produto, 106, 442, 443

535
quociente, 144
regular, 448
suspens
ao, 92
transporte, 91, 92
medidas
equivalentes, 14, 445
mutuamente singulares, 119, 445
mem
oria finita, 192, 201
minimalidade, 18, 159, 206
mistura fraca, 222
mudanca de coordenadas, 455
multiplicidade
de um autovalor, 221
de um expoente de Lyapunov, 86
n
umero
balanceado, 105
de Lebesgue, 453
diofantino, 164
normal, 11, 105
n
umero de rotaca
o, 128
norma, 462, 466
L , 463
Lp , 462
da converg
encia uniforme, 453
de funcional linear, 49
de operador, 316, 319
de um funcional linear, 453
de uma matriz, 78
de uma medida, 431
od
ometro, 171
operador
de Koopman, 50, 51
de Ruelle-Perron-Frobenius, 376
de transfer
encia, 211, 376
linear
adjunto, 468
autoadjunto, 468, 470
contnuo, 468
dual, 51, 376
idempotente, 470
limitado, 468, 469
normal, 468, 472, 473
positivo, 41, 50, 376
positivo sobre um cone, 51
unit
ario, 468, 472
paradoxo do macaco, 108
partica
o, 249, 447
de Z, 58
geradora, 260, 262
menos fina, 147, 252
mensur
avel, 147
trivial, 284
partico
es
independentes, 250

INDICE

536
pilha simples, 172
ponto
de densidade, 444
fixo
eltico, 128131
eltico gen
erico, 128
hiperb
olico, 129
n
ao degenerado, 128, 130
heteroclnico, 486
homoclnico transversal, 129
recorrente, 7
super n
ao errante, 63
posto, 232, 234
potenciais cohom
ologos, 331, 393
potencial, 302
pr
e-
orbita, 54, 362
press
ao, 301, 324, 325
primeiro retorno, 22
princpio
da distribuica
o de massa, 423
variacional, 332, 334
probabilidade, 428
condicional, 145
de transica
o, 192
produto
de medidas, 442, 443
enumer
avel, 443
finito, 442
interno, 462, 465
semi-direto, 53
progress
ao aritm
etica, 58
projeca
o, 470
estereogr
afica, 455
ortogonal, 67
propriedade da lacuna espectral, 211, 410
pseudo-
orbita, 361
peri
odica, 361
quantidade de informaca
o de um caracter, 249
quase todo ponto, 441
quociente projetivo, 399
raio espectral, 51, 316
raiz de um sistema, 287
ramo
contrativo, 360
inverso, 350, 360, 416
raz
ao
aurea, 9, 181

cruzada, 401
relaca
o de cohomologia, 331
renormalizaca
o de Rauzy-Veech, 210
representaca
o espectral, 473
repulsor, 414
conforme, 375, 415
restrica
o normalizada, 159
ret
angulo, 432

reta estendida, 427, 435


retorno
primeiro, 22
simult
aneo, 29
rotaca
o, 16
irracional, 17
no crculo, 16
no toro, 18
racional, 17
s
erie
absolutamente som
avel, 465
de Fourier, 113
seca
o transversal, 90
semicontinuidade da entropia, 262
sequ
encia
aditiva, 78
admissvel, 314
de correlaco
es, 184
equidistribuda, 175
n
ao lacunar, 29
separadora, 239
subaditiva, 78, 79
uniformemente integr
avel, 87
sistema
aperi
odico, 28, 262
com espectro de Lebesgue, 229, 284
com espectro discreto, 227
conservativo, 48, 122
de Kolmogorov, 281, 284
de spin, 332
enumeravelmente gerado, 232
erg
odico, 95, 96
fracamente misturador, 187, 222
hamiltoniano, 123
integr
avel, 124
invertvel em quase todo ponto, 244
minimal, 159, 161, 206
misturador, 184
totalmente dissipativo, 48
unicamente erg
odico, 159
soma
de coberturas, 302
de partico
es, 250
de Riemann, 440
de uma famlia de subsepacos, 466
de uma famlia de vetores, 466
direta ortogonal, 467
orbital, 376
sombreamento, 361
subcobertura, 302, 429
substituica
o, 173, 175, 312
de Cantor, 173
de Chacon, 173
de Feigenbaum, 173
de Fibonacci, 173, 312
de Thue-Morse, 173

INDICE
primitiva, 173
subvariedade, 455
riemanniana, 459
suporte
de medida espectral, 470
de uma medida, 434
supremo essencial, 463
suspens
ao
de uma medida, 89
de uma transformaca
o, 87
tempo
de primeiro retorno, 5, 22, 90
de retorno, 87, 89
m
edio de retorno, 6
m
edio de visita, 65, 71
teorema
da continuidade
inferior, 437
no vazio, 429
superior, 437
da converg
encia
dominada, 442
mon
otona, 442
da decomposica
o
de Hahn, 431
de Lebesgue, 446
din
amica, 365
erg
odica, 144
da desintegraca
o, 148
da forma normal de Birkhoff, 128, 130
da representaca
o espectral, 473
das classes mon
otonas, 430
de Anosov, 132
de aproximaca
o, 430
de Banach-Alaoglu, 50, 468
de Banach-Mazur, 52
de Brin-Katok, 267
de continuidade absoluta, 134
de derivaca
o de Lebesgue, 444
de Dirichlet, 488
de ergodicidade de Sinai, 140
de exist
encia de medidas invariantes, 35
para fluxos, 48
de extens
ao de medidas, 429
de Friedman-Ornstein, 285
de Furstenberg, 162
de Furstenberg-Kesten, 85
de Gottschalk, 164
de Gr
unwald, 63
de Green-Tao, 60
de Haar, 166
de Halmos-von Neumann, 239
de Hindman, 164
de Jacobs, 288, 289
de Ka
c, 5
de Kakutani-Rokhlin, 28

537
de
de
de
de
de
de
de
de
de
de
de
de
de
de
de

Keane, 206
Kingman, 66, 79
Kolmogorov-Arnold-Moser, 126, 127
Kolmogorov-Sinai, 259
Liouville, 20
Livsi
c, 375, 395
Lusin, 450, 452
Masur-Veech, 207
Mazur, 53
Oseledets, 85
Oxtoby-Ulam, 122
Perron-Fr
obenius, 194
Prohorov, 42
Rad
on-Nikodym, 445
recorr
encia
de Birkhoff, 7, 8, 47
de Poincar
e, 4, 7
para fluxos, 5
de recorr
encia m
ultipla
de Birkhoff, 29
de Poincar
e, 29
de Riesz-Markov, 431, 453
de Rokhlin, 148, 157
de Ruelle, 375
de Sard, 459
de Schauder-Tychonoff, 45
de Shannon-McMillan-Breiman, 266
de Stone, 68
de Szemer
edi, 59, 61
de van der Waerden, 58, 60
de Vitali, 445
de Weyl, 175
de Whitney, 459
do espectro discreto, 239
do ponto fixo de Poincar
e-Birkhoff, 129
erg
odico
de Birkhoff, 66, 71, 72, 75
de Birkhoff para fluxos, 78
de von Neumann, 66, 68, 75
multiplicativo, 85
subaditivo, 66, 79
subaditivo para fluxos, 86
espectral, 472
normal de Borel, 105
Portmanteau, 37
topo de uma pilha, 172
topologia, 427
C r , 456
definida por
bases de vizinhancas, 36
uma dist
ancia, 448
discreta, 108
fraca, 49, 467
fraca , 36, 49, 468
mais forte, 37
mais fraca, 37
pontual, 44

INDICE

538
produto, 108, 444
uniforme, 44
topologias
equivalentes, 37
toro de dimens
ao d, 18, 455
torre, 27
de Kakutani-Rokhlin, 28
transformaca
o
h-expansiva, 324
conservativa, 19
de Dehn, 488
de Gauss, 13, 23
de Manneville-Pomeau, 26
de Poincar
e, 88, 90
de primeiro retorno, 22, 88, 90
expans
ao decimal, 10
expansiva, 264, 312, 350, 361
expansora, 26, 357
do intervalo, 356
numa variedade, 348
induzida, 24
integr
avel, 127
intrinsecamente erg
odica, 346
localmente invertvel, 295
logstica, 312
minimal, 18, 103
n
ao degenerada, 127
simpl
etica, 126
tempo 1, 5
topologicamente
exata, 354
fracamente misturadora, 224
misturadora, 186
transitiva, 108
transformaco
es
que comutam entre si, 29
topologicamente conjugadas, 304
topologicamente equivalentes, 304
transica
o de fase, 332
transitividade, 120
translaca
o
a direita, 166
`
a esquerda, 166
`
num grupo compacto, 308
transporte de uma medida, 91
transversalidade, 458, 461
tri
angulo de Sierpinski, 424
u
ltimo teorema de Poincar
e, 129
unicidade erg
odica, 159
valor regular de uma aplicaca
o, 458
vari
avel aleat
oria, 44
variaca
o total, 431
variedade
de classe C r , 455
diferenci
avel, 454

modelada em espaco de Banach, 454


riemanniana, 459
vetor
de comprimentos, 204
de translaco
es, 204
diofantino, 126
frequ
encias, 125
racionalmente independente, 18, 205
vetores ortogonais, 466
vizinhanca
de um conjunto, 36
de um ponto, 434
volume associado a m
etrica riemanniana, 167
volume zero, 459

Anda mungkin juga menyukai